DE202017102729U1 - Signal processing systems for reproducing audio data on virtual speaker arrays - Google Patents

Signal processing systems for reproducing audio data on virtual speaker arrays Download PDF

Info

Publication number
DE202017102729U1
DE202017102729U1 DE202017102729.5U DE202017102729U DE202017102729U1 DE 202017102729 U1 DE202017102729 U1 DE 202017102729U1 DE 202017102729 U DE202017102729 U DE 202017102729U DE 202017102729 U1 DE202017102729 U1 DE 202017102729U1
Authority
DE
Germany
Prior art keywords
matrix
state space
space representation
hrir
hrirs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202017102729.5U
Other languages
German (de)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of DE202017102729U1 publication Critical patent/DE202017102729U1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones

Abstract

Elektronische Vorrichtung, die dafür konfiguriert ist, Klangfelder in einem linken und einem rechten Ohr eines menschlichen Hörers wiederzugeben, wobei die Klangfelder von einer Vielzahl von virtuellen Lautsprechern erzeugt werden, wobei die elektronische Vorrichtung Folgendes umfasst: Speicher; und mit dem Speicher verbundene Steuerschaltungen, wobei die Steuerschaltungen für Folgendes konfiguriert sind: Erhalten, durch Prozessorschaltungen eines Klangwiedergabe-Computers, der dafür konfiguriert ist, die Klangfelder im linken und im rechten Ohr des Kopfes des menschlichen Hörers wiederzugeben, einer Vielzahl von Außenohr-Impulsantworten (HRIRs), wobei jede aus der Vielzahl von HRIRs mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern und einem Ohr des menschlichen Hörers assoziiert ist, wobei jede aus der Vielzahl von HRIRs Samples eines Klangfelds beinhaltet, die bei einer spezifischen Samplingrate in einem linken oder rechten Ohr erzeugt werden, die in Reaktion auf einen Audioimpuls erzeugt wird, der von diesem virtuellen Lautsprecher erzeugt wird; Erstellen einer ersten Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs, wobei die erste Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der ersten Zustandsraumdarstellung eine erste Größe aufweisen; Durchführen eines Zustandsraum-Reduktionsvorgangs, um eine zweite Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs zu erzeugen, wobei die zweite Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der zweiten Zustandsraumdarstellung eine zweite Größe aufweisen, die geringer als eine erste Größe ist; und Erzeugen einer Vielzahl von Außenohrübertragungsfunktionen (HRTFs), basierend auf der zweiten Zustandsraumdarstellung, wobei jede aus der Vielzahl von HRTFs einer jeweiligen HRIR aus der Vielzahl von HRIRs entspricht, wobei eine HRTF einer jeweiligen HRIR entspricht, die, sobald sie mit einem Frequenzbereich-Klangfeld multipliziert wird, das durch den virtuellen Lautsprecher erzeugt wird, mit dem die entsprechende HRIR assoziiert ist, eine Komponente eines Klangfelds erzeugt, das in einem Ohr des menschlichen Hörers wiedergegeben wird.An electronic device configured to reproduce sound fields in a left and a right ear of a human listener, the sound fields being generated by a plurality of virtual speakers, the electronic device comprising: memory; and control circuits connected to the memory, wherein the control circuits are configured to: receive, by processor circuits of a sound reproduction computer configured to play the sound fields in the left and right ears of the head of the human listener, a plurality of outer ear impulse responses (HRIRs), wherein each of the plurality of HRIRs is associated with a virtual speaker of the plurality of virtual speakers and an ear of the human listener, each of the plurality of HRIRs including samples of a sound field that at a specific sampling rate in a left or right ear generated in response to an audio pulse generated by this virtual speaker; Creating a first state space representation of each of the plurality of HRIRs, wherein the first state space representation includes a matrix, a column vector, and a row vector, wherein both the matrix and the column vector and the row vector of the first state space representation have a first size; Performing a state space reduction operation to generate a second state space representation of each of the plurality of HRIRs, the second state space representation including a matrix, a column vector, and a row vector, wherein both the matrix and the column vector and the row vector of the second state space representation are a second one Having a size smaller than a first size; and generating a plurality of outer ear transfer functions (HRTFs) based on the second state space representation, wherein each of the plurality of HRTFs corresponds to a respective HRIR of the plurality of HRIRs, where an HRTF corresponds to a respective HRIR that, when combined with a frequency domain sound field multiplied generated by the virtual speaker to which the corresponding HRIR is associated generates a component of a sound field reproduced in an ear of the human listener.

Description

Unter Schutz gestellt werden und Gegenstand des Gebrauchsmusters sind, entsprechend den Vorschriften des Gebrauchsmustergesetzes, lediglich Vorrichtungen wie in den beigefügten Schutzansprüchen definiert, jedoch keine Verfahren. Soweit nachfolgend in der Beschreibung gegebenenfalls auf Verfahren Bezug genommen wird, dienen diese Bezugnahmen lediglich der beispielhaften Erläuterung der in den beigefügten Schutzansprüchen unter Schutz gestellten Vorrichtung oder VorrichtungenUnder protection and subject to the utility model are, according to the provisions of the utility model law, only devices as defined in the appended claims, but no method. Wherever in the description, if appropriate, reference is made to methods, these references are merely illustrative of the device or devices set forth in the appended claims

HINTERGRUNDBACKGROUND

Ein virtuelles Lautsprecher-Array, das einen Hörer umgibt, wird im Allgemeinen zur Erzeugung einer virtuellen, räumlichen akustischen Umgebung genutzt, um Audiodaten über Kopfhörer wiederzugeben. Das von diesem Lautsprecher-Array erzeugte Klangfeld kann verändert werden, um den Effekt von beweglichen Audioquellen zu liefern, die sich relativ zum Benutzer bewegen, oder um die Quelle an einem festgelegten räumlichen Standort zu stabilisieren, wenn der Benutzer seinen Kopf bewegt. Diese Vorgänge sind sehr wichtig für die Wiedergabe von Audiodaten über Kopfhörer in Virtual-Reality(VR)-Systemen.A virtual speaker array surrounding a listener is generally used to create a virtual spatial acoustic environment to play audio data over headphones. The sound field generated by this speaker array can be altered to provide the effect of moving audio sources that move relative to the user or to stabilize the source in a fixed spatial location as the user moves his head. These operations are very important for the playback of audio data via headphones in virtual reality (VR) systems.

Die zur Wiedergabe über die virtuellen Lautsprecher verarbeiteten Mehrkanal-Audiodaten werden kombiniert, um ein Signal-Paar am linken und rechten Kopfhörer-Lautsprecher bereitzustellen. Dieser Kombinationsprozess von Mehrkanal-Audiodaten ist als binaurale Wiedergabe bekannt. Die im Allgemeinen als am effektivsten betrachtete Art, diese Wiedergabe zu implementieren, ist die Nutzung eines Mehrkanal-Filtersystems, das Außenohrübertragungsfunktionen („Head Related Transfer Functions – HRTFs”) implementiert. In einem System, das beispielsweise auf einer Anzahl M (wobei M einer beliebigen Zahl entspricht) von virtuellen Lautsprechern basiert, muss der binaurale Renderer 2M HRTF-Filter besitzen, da pro Lautsprecher ein Paar genutzt wird, um die Übertragungsfunktion zwischen dem Lautsprecher und dem linken und rechten Ohr des Benutzers zu modellieren.The multi-channel audio data processed for playback via the virtual speakers are combined to provide a pair of signals to the left and right headphone speakers. This combination process of multi-channel audio data is known as binaural playback. The most generally considered way to implement this rendition is to use a multi-channel filtering system that implements Head Related Transfer Functions (HRTFs). For example, in a system based on a number M (where M is an arbitrary number) of virtual speakers, the binaural renderer must have 2M HRTF filters, as one pair is used per speaker to control the transfer function between the speaker and the left and model the right ear of the user.

ZUSAMMENFASSUNGSUMMARY

Konventionelle Ansätze zur Durchführung einer binauralen Wiedergabe erfordern große Mengen an Rechenressourcen. In diesem Sinne benötigt jede binaurale Ausgabe, wenn eine HRTF als Filter mit endlicher Impulsantwort (FIR) der Ordnung n dargestellt wird, 2M n Multiplikations- und Additionsvorgänge pro Kanal. Solche Vorgänge können die limitierten für die binaurale Wiedergabe zugeteilten Ressourcen, beispielsweise in VR-Anwendungen, belasten.Conventional approaches to performing binaural playback require large amounts of computational resources. In this sense, when an HRTF is represented as a finite impulse response (FIR) order of n order, each binaural output requires 2M n multiplication and addition operations per channel. Such operations may burden the limited resources allocated for binaural rendering, for example in VR applications.

Im Gegensatz zu den konventionellen Ansätzen zur Durchführung der binauralen Wiedergabe, die große Mengen von Rechenressourcen erfordert, umfassen verbesserte Techniken die Anwendung eines Zustandsraummodells mit ausgeglichener Realisierung auf jede HRTF, um die Ordnung eines effektiven FIR oder sogar eines Filters mit unendlicher Impulsantwort („Infinite Impulse Response – IIR”) zu verringern. In diesem Sinne wird jede HRTF G(z) von einem Außenohr-Impulsantwortfilter („Head-Related Impulse Response Filter – HRIR”) mittels beispielsweise einer Z-Transformation abgeleitet. Die Daten des HRIR können genutzt werden, um eine erste Zustandsraumdarstellung [A, B, C, D] des HRTF mittels der Beziehung G(z) = C(zI – A)–1B + D zu konstruieren. Diese erste Zustandsraumdarstellung ist nicht eindeutig und somit können für einen FIR-Filter A und B auf einfache Arrays mit Binärwerten eingestellt werden, während C und D die HRIR-Daten enthalten. Diese Darstellung führt zu einer einfachen Form einer Gram'schen Matrix Q, deren Eigenvektoren Systemzustände bereitstellen, die die Systemverstärkung, welche durch eine Hankel-Norm gemessen wird, maximieren. Des Weiteren bietet eine Faktorisierung von Q eine Transformation zu einem ausgeglichenen Zustandsraum, in dem die Gram'sche Matrix einer diagonalen Matrix der Eigenwerte von Q entspricht. Indem nur die Zustände in Betracht gezogen werden, die mit einem Eigenwert assoziiert sind, der über einem Schwellenwert liegt, kann die ausgeglichene Zustandsraumdarstellung der HRTF verkürzt werden, um eine angenäherte HRTF bereitzustellen, die sich der ursprünglichen HRTF sehr gut annähert, während sie die erforderliche Menge an Berechnungen um bis zu 90% verringert.In contrast to the conventional approaches to performing binaural rendering requiring large amounts of computational resources, improved techniques involve applying a state space model with balanced implementation to each HRTF to determine the order of an effective FIR or even infinite impulse response ("Infinite Impulse Response - IIR "). In this sense, each HRTF G (z) is derived from an outer-ear impulse-response filter (HRIR) by, for example, a Z-transform. The data of the HRIR can be used to construct a first state space representation [A, B, C, D] of the HRTF by the relation G (z) = C (zI-A) -1 B + D. This first state space representation is ambiguous and thus for a FIR filter A and B simple arrays of binary values can be set while C and D contain the HRIR data. This representation leads to a simple form of Gram matrix Q whose eigenvectors provide system states that maximize the system gain measured by a Hankel standard. Furthermore, a factorization of Q offers a transformation to a balanced state space in which the Gram matrix corresponds to a diagonal matrix of the eigenvalues of Q. By taking into account only the states associated with an eigenvalue that is above a threshold, the balanced state space representation of the HRTF can be shortened to provide an approximate HRTF that closely approximates the original HRTF while satisfying the required Quantity of calculations reduced by up to 90%.

Ein allgemeiner Aspekt der verbesserten Techniken beinhaltet ein Verfahren zum Rendering von Klangfeldern in einem linken und einem rechten Ohr eines menschlichen Hörers, wobei die Klangfelder durch eine Vielzahl von virtuellen Lautsprechern erzeugt werden. Das Verfahren kann das Erhalten einer Vielzahl von Außenohr-Impulsantworten (HRIRs), durch Prozessorschaltungen eines Klangwiedergabe-Computers beinhalten, der dafür konfiguriert ist, die Klangfelder im linken und im rechten Ohr des Kopfes des menschlichen Zuhörers wiederzugeben, wobei jede Vielzahl von HRIRs mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern und einem Ohr des menschlichen Hörers assoziiert ist, wobei jede Vielzahl von HRIRs in einer spezifischen Samplingrate in einem linken oder rechten Ohr erzeugte Samplings eines Klangfelds beinhaltet, das in Reaktion auf einen Audioimpuls erzeugt wird, der von dem virtuellen Lautsprecher erzeugt wird. Das Verfahren kann zudem ein Erstellen einer ersten Zustandsraumdarstellung von jeder Vielzahl von HRIRs beinhalten, wobei die erste Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spalten- und der Zeilenvektor der ersten Zustandsraumdarstellung jeweils eine erste Größe aufweisen. Das Verfahren kann des Weiteren das Durchführen eines Zustandsraum-Reduktionsvorgangs beinhalten, um eine zweite Zustandsraumdarstellung aus jeder Vielzahl von HRIRs zu erzeugen, wobei die zweite Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spalten- und der Zeilenvektor der zweiten Zustandsraumdarstellung jeweils eine zweite Größe aufweisen, die geringer als die erste Größe ist. Das Verfahren kann des Weiteren das Erzeugen einer Vielzahl von Außenohrübertragungsfunktionen (HRTFs) beinhalten, die auf der zweiten Zustandsdarstellung basieren, wobei jede Vielzahl von HRTFs einer jeweiligen HRIR aus der Vielzahl von HRIRs entspricht, wobei eine HRTF, die einer jeweiligen HRIR entspricht, sobald sie mit einem Frequenzbereich-Klangfeld multipliziert wird, das durch den virtuellen Lautsprecher erzeugt wird, mit dem die entsprechende HRIR assoziiert ist, eine Komponente eines Klangfelds erzeugt, das in einem Ohr des menschlichen Hörers wiedergegeben wird.A general aspect of the improved techniques involves a method of rendering sound fields in a left and a right ear of a human listener, wherein the sound fields are generated by a plurality of virtual speakers. The method may include obtaining a plurality of outer ear impulse responses (HRIRs) by processor circuits of a sound reproduction computer configured to render the sound fields in the left and right ears of the human listener's head, each having a plurality of HRIRs virtual speaker is associated from the multitude of virtual speakers and one ear of the human listener, with each variety of HRIRs generated at a specific sampling rate in a left or right ear generates samples of a sound field generated in response to an audio pulse generated by the virtual speaker. The method may further include creating a first state space representation of each plurality of HRIRs, wherein the first state space representation includes a matrix, a column vector, and a row vector, wherein each of the matrix, column, and row vectors of the first state space representation has a first size , The method may further include performing a state space reduction operation to generate a second state space representation from each plurality of HRIRs, the second state space representation including a matrix, a column vector, and a row vector, wherein both the matrix and column and Line vector of the second state space representation each have a second size that is smaller than the first size. The method may further include generating a plurality of outer ear transfer functions (HRTFs) based on the second state representation, wherein each plurality of HRTFs corresponds to a respective HRIR of the plurality of HRIRs, an HRTF corresponding to a respective HRIR as they become is multiplied by a frequency domain sound field generated by the virtual speaker to which the corresponding HRIR is associated, generates a component of a sound field reproduced in an ear of the human listener.

Das Durchführen des Zustandsraum-Reduktionsvorgangs kann für jede HRIR aus der Vielzahl von HRIRs das Erstellen einer entsprechenden Gram'schen Matrix basierend auf der ersten Zustandsraumdarstellung dieser HRIR beinhalten, wobei die Gram'sche Matrix eine Vielzahl von Eigenwerten aufweist, die in absteigender Reihenfolge ihrer Größe angeordnet sind, und kann das Erstellen der zweiten Zustandsraumdarstellung dieser HRIR basierend auf der Gram'schen Matrix und der Vielzahl von Eigenwerten beinhalten, wobei die zweite Größe einer Anzahl von Eigenwerten aus der Vielzahl von Eigenwerten entspricht, die größer als ein angegebener Schwellenwert sind.Performing the state space reduction process may include, for each HRIR of the plurality of HRIRs, constructing a corresponding Gram matrix based on the first state space representation of that HRIR, the Gram matrix having a plurality of eigenvalues, in descending order of size and may include constructing the second state space representation of that HRIR based on the Gram matrix and the plurality of eigenvalues, the second size corresponding to a number of eigenvalues of the plurality of eigenvalues greater than a specified threshold.

Das Erstellen der zweiten Zustandsraumdarstellung jeder HRIR aus der Vielzahl von HRIRs kann das Bilden einer Transformationsmatrix beinhalten, die, wenn sie auf die Gram'sche Matrix angewendet wird, die auf der ersten Zustandsraumdarstellung dieser HRIR basiert, eine diagonale Matrix erzeugt, wobei jedes diagonale Element der diagonalen Matrix gleich einem entsprechenden Eigenwert aus der Vielzahl von Eigenwerten ist.Creating the second state space representation of each HRIR of the plurality of HRIRs may include forming a transformation matrix that, when applied to the Gram matrix based on the first state space representation of that HRIR, generates a diagonal matrix, each diagonal element the diagonal matrix is equal to a corresponding eigenvalue of the plurality of eigenvalues.

Das Verfahren kann des Weiteren beinhalten, für jede Vielzahl von HRIRs ein Cepstrum dieser HRIR zu erstellen, wobei das Cepstrum kausale Samples, die zu positiven Zeiten genommen werden, und nicht kausale Samples, die zu negativen Zeiten genommen werden, aufweist, wobei für jedes der nicht kausalen Samples des Cepstrums ein Phasenminimierungsvorgang durchgeführt wird, indem dieses nicht kausale Sample, das zu einer negativen Zeit genommen wurde, zu einem kausalen Sample des Cepstrums addiert wird, das am gegenüberliegenden Punkt dieses negativen Zeitpunkts genommen wurde, und eine minimalphasische HRIR erzeugt wird, indem jedes der nicht kausalen Sample des Cepstrums auf null gesetzt wird, nachdem der Phasenminimierungsvorgang für jedes der nicht kausalen Samples des Cepstrums durchgeführt wurde.The method may further include creating a cepstrum of each HRIR for each plurality of HRIRs, the cepstrum having causal samples taken at positive times and non-causal samples taken at negative times, wherein for each of the plurality of HRIRs noncausal samples of the cepstrum, a phase minimization process is performed by adding this noncausal sample, taken at a negative time, to a causal sample of the cepstrum taken at the opposite point of that negative time, and generating a minimum phasic HRIR; setting each of the non-causal samples of the cepstrum to zero after performing the phase minimization procedure for each of the non-causal samples of the cepstrum.

Das Verfahren kann des Weiteren beinhalten, eine Mehrfacheingang-/Mehrfachausgang-(Multiple Input, Multiple Output – MIMO)-Zustandsraumdarstellung zu erstellen, wobei die MIMO-Zustandsraumdarstellung eine zusammengesetzte Matrix, eine Spaltenvektor-Matrix und eine Zeilenvektor-Matrix beinhaltet, wobei die zusammengesetzte Matrix der MIMO-Zustandsraumdarstellung die Matrix der ersten Darstellung jeder Vielzahl von HRIRs, die Spaltenvektor-Matrix der MIMO-Zustandsraumdarstellung mitsamt des Spaltenvektors der ersten Darstellung jeder Vielzahl von HRIRs, sowie die Zeilenvektor-Matrix der MIMO-Zustandsraumdarstellung mitsamt des Zeilenvektors der ersten Darstellung jeder Vielzahl von HRIRs, beinhaltet. In diesem Fall, der Vektormatrix und Zeilenvektor-Matrix beinhaltet das Durchführen des Zustandsraum-Reduktionsvorgangs das Erstellen einer reduzierten zusammengesetzten Matrix, einer reduzierten Spaltenvektor-Matrix und einer reduzierten Zeilenvektor-Matrix, wobei sowohl die reduzierte zusammengesetzte Matrix als auch die reduzierte Spaltenvektor-Matrix und reduzierte Zeilenvektor-Matrix eine Größe aufweisen, die jeweils geringer ist als die Größe der zusammengesetzten Matrix, die SpalteThe method may further include creating a multiple input / multiple output (MIMO) state space representation, wherein the MIMO state space representation includes a composite matrix, a column vector matrix, and a row vector matrix, wherein the composite The matrix of the MIMO state space representation is the matrix of the first representation of each plurality of HRIRs, the column vector matrix of the MIMO state space representation, including the column vector of the first representation of each plurality of HRIRs, and the row vector matrix of the MIMO state space representation, including the row vector of the first representation, each Variety of HRIRs, includes. In this case, the vector matrix and row vector matrix, performing the state space reduction process involves creating a reduced composite matrix, a reduced column vector matrix, and a reduced row vector matrix, wherein both the reduced composite matrix and the reduced column vector matrix and reduced row vector matrix have a size that is smaller than the size of the composite matrix, the column

Das Erstellen der MIMO-Zustandsraumdarstellung kann das Bilden einer ersten Blockmatrix als zusammengesetzte Matrix der MIMO-Zustandsraumdarstellung beinhalten, wobei die erste Blockmatrix eine Matrix der ersten Zustandsraumdarstellung einer HRIR aufweist, die als diagonales Element der ersten Blockmatrix mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern assoziiert ist, wobei die Matrizen der ersten Zustandsraumdarstellung der HRIRs, die mit demselben virtuellen Lautsprecher assoziiert sind, in angrenzenden diagonalen Elementen der ersten Blockmatrix liegen. Das Erstellen der MIMO-Zustandsraumdarstellung kann zudem die Bildung einer zweiten Blockmatrix als Spaltenvektor-Matrix der MIMO-Zustandsraumdarstellung beinhalten, die als diagonales Element der zweiten Blockmatrix einen Spaltenvektor der ersten Zustandsraumdarstellung einer HRIR aufweist, die mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern assoziiert ist, wobei Spaltenvektoren der ersten Zustandsraumdarstellung der HRIRs, die mit demselben virtuellen Lautsprecher assoziiert sind, in angrenzenden diagonalen Elementen der zweiten Blockmatrix liegen. Das Erstellen der MIMO-Zustandsraumdarstellung kann zudem die Bildung einer dritten Blockmatrix als Zeilenvektor-Matrix der MIMO-Zustandsraumdarstellung beinhalten, die als Element der dritten Blockmatrix einen Zeilenvektor der ersten Zustandsraumdarstellung einer HRIR aufweist, die mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern assoziiert ist, wobei Zeilenvektoren der ersten Zustandsraumdarstellung der HRIRs, die Klänge im linken Ohr wiedergeben, in ungeradzahligen Elementen der ersten Zeile der dritten Blockmatrix liegen und Zeilenvektoren der ersten Zustandsraumdarstellung der HRIRs, die Klänge im rechten Ohr wiedergeben, in geradzahligen Elementen der zweiten Zeile der dritten Blockmatrix liegen.Creating the MIMO state space representation may include forming a first block matrix as a composite matrix of the MIMO state space representation, wherein the first block matrix comprises a matrix of the first state space representation of HRIR that is a diagonal of the first block matrix with a virtual speaker of the plurality of virtual Loudspeakers, the matrices of the first state space representation of the HRIRs associated with the same virtual loudspeaker being in adjacent diagonal elements of the first block matrix. The creation of the MIMO state space representation may also involve the formation of a second block matrix as the column vector matrix of MIMO state space representation comprising, as a diagonal element of the second block matrix, a column vector of the first state space representation of an HRIR associated with a virtual speaker of the plurality of virtual speakers, column vectors of the first state space representation of the HRIRs associated with the same virtual speaker , lie in adjacent diagonal elements of the second block matrix. The creation of the MIMO state space representation may also include forming a third block matrix as a row vector matrix of the MIMO state space representation comprising as an element of the third block matrix a row vector of the first state space representation of an HRIR associated with a virtual speaker of the plurality of virtual speakers where row vectors of the first state space representation of the HRIRs representing sounds in the left ear are in odd-numbered elements of the first row of the third block matrix and row vectors of the first state space representation of the HRIRs representing sounds in the right ear are in even-numbered elements of the second row of the third Block matrix lie.

Das Verfahren kann des Weiteren vor dem Erstellen der MIMO-Zustandsraumdarstellung für jede HRIR aus der Vielzahl von HRIRs die Durchführung eines Einzeleingabe-Einzelausgabe(SISO)-Zustandsraum-Reduktionsvorgangs beinhalten, um eine SISO-Zustandsraumdarstellung dieser HRIR als erste Zustandsraumdarstellung dieser HRIR zu erzeugen.The method may further include, prior to creating the MIMO state space representation for each HRIR of the plurality of HRIRs, performing a single input single issue (SISO) state space reduction operation to generate a SISO state space representation of that HRIR as the first state space representation of that HRIR.

Im Hinblick auf das Verfahren gibt es für jeden aus der Vielzahl von virtuellen Lautsprechern eine linke und ein rechte HRIR aus der Vielzahl von HRIRs, die mit diesem virtuellen Lautsprecher assoziiert ist, wobei die linke HRIR, sobald sie mit dem Frequenzbereich-Klangfeld multipliziert wird, das von diesem virtuellen Lautsprecher erzeugt wird, die Komponente des Klangfelds erzeugt, die im linken Ohr des menschlichen Hörers wiedergegeben wird, und die rechte HRIR, sobald sie mit dem Frequenzbereich-Klangfeld multipliziert wird, das von diesem virtuellen Lautsprecher erzeugt wird, die Komponente des Klangfelds erzeugt, die im rechten Ohr des menschlichen Hörers wiedergegeben wird. Des Weiteren gibt es für jeden aus der Vielzahl von virtuellen Lautsprechern eine interaurale Zeitverzögerung („Interaural Time Delay – ITD”) zwischen der linken HRIR, die mit diesem virtuellen Lautsprecher assoziiert ist, und der rechten HRIR, die mit diesem virtuellen Lautsprecher assoziiert ist, wobei sich die ITD in der linken HRIR und in der rechten HRIR durch eine Differenz zwischen einer Anzahl von ursprünglichen Samples des Klangfelds der linken HRIR, die Nullwerte aufweisen, und einer Anzahl von ursprünglichen Samples des Klangfelds der rechten HRIR, die Nullwerte aufweisen, manifestiert. In diesem Fall kann das Verfahren des Weiteren das Erstellen einer ITD-Einheits-Subsystem-Matrix, die auf der ITD zwischen der linken HRIR und der rechten HRIR basiert, die mit jedem aus der Vielzahl von virtuellen Lautsprechern assoziiert ist, und das Multiplizieren der Vielzahl von HRTFs mit der ITD-Einheits-Subsystem-Matrix beinhalten, um eine Vielzahl von verzögerten HRTFs zu erzeugen.With regard to the method, for each of the plurality of virtual speakers, there are left and right HRIRs of the plurality of HRIRs associated with that virtual speaker, the left HRIR, once multiplied by the frequency domain sound field, generated by this virtual speaker, which generates the component of the sound field reproduced in the left ear of the human listener, and the right HRIR, as multiplied by the frequency domain sound field generated by this virtual speaker, the component of the Sound field generated, which is reproduced in the right ear of the human listener. Further, for each of the plurality of virtual speakers, there is an Interaural Time Delay (ITD) between the left HRIR associated with this virtual speaker and the right HRIR associated with that virtual speaker. wherein the ITD in the left HRIR and in the right HRIR is manifested by a difference between a number of original samples of the sound field of the left HRIR having zero values and a number of original samples of the sound field of the right HRIR having zero values. In this case, the method may further include creating an ITD unit subsystem matrix based on the ITD between the left HRIR and the right HRIR associated with each of the plurality of virtual speakers, and multiplying the plurality of HRTFs with the ITD Unit Subsystem Matrix to generate a variety of delayed HRTFs.

Im Hinblick auf das Verfahren kann jede aus der Vielzahl von HRTFs durch Filter mit endlicher Impulsantwort (FIRs) dargestellt werden. In diesem Fall kann das Verfahren des Weiteren die Durchführung eines Umwandlungsvorgangs mit jeder aus der Vielzahl von HRTFs beinhalten, um eine weitere Vielzahl von HRTFs zu erzeugen, die jeweils durch Filter mit unendlicher Impulsantwort (IIRs) dargestellt werden.With regard to the method, each of the plurality of HRTFs may be represented by Finite Impulse Response (FIR) filters. In this case, the method may further include performing a conversion operation on each of the plurality of HRTFs to generate a further plurality of HRTFs, each represented by Infinite Impulse Response (IIRs) filters.

Im Hinblick auf das Verfahren gibt es für jeden aus der Vielzahl von virtuellen Lautsprechern eine HRIR, die mit diesem virtuellen Lautsprecher assoziiert ist, die dem Ohr an der Seite des Kopfes entspricht, die dem Lautsprecher am nächsten ist, dies wird als ipsilaterale HRIR bezeichnet. Die andere mit diesem virtuellen Lautsprecher assoziierte HRIR wird als kontralaterale HRIR bezeichnet. Die Vielzahl von HRTFs kann in zwei Gruppen aufgeteilt werden. Eine Gruppe enthält alle ipsilateralen HRTFs und die andere Gruppe enthält alle kontralateralen HRTFs. In diesem Fall kann das Verfahren unabhängig auf jede Gruppe angewandt werden und dadurch einen für diese Gruppe angemessenen Näherungsgrad erzeugen.With regard to the method, for each of the plurality of virtual speakers, there is an HRIR associated with this virtual speaker that corresponds to the ear on the side of the head closest to the speaker, this is referred to as ipsilateral HRIR. The other HRIR associated with this virtual speaker is referred to as contralateral HRIR. The multitude of HRTFs can be divided into two groups. One group contains all ipsilateral HRTFs and the other group contains all contralateral HRTFs. In this case, the method can be applied independently to each group, thereby producing a reasonable approximation for that group.

KURZBESCHREIBUNG DER ZEICHNUNGENBRIEF DESCRIPTION OF THE DRAWINGS

1 zeigt ein Blockdiagramm, das ein exemplarisches System für kopfverfolgende, Ambisonic-kodierte, auf virtuellen Lautsprechern basierende binaurale Audiodaten, gemäß einer oder mehreren hierin beschriebenen Ausführungsformen, veranschaulicht. 1 FIG. 12 is a block diagram illustrating an exemplary system for head-tracking, ambisonic-coded, virtual-speaker-based binaural audio data, according to one or more embodiments described herein.

2 zeigt eine grafische Darstellung eines exemplarischen Zustandsraumsystems, das gemäß einer oder mehreren hierin beschriebenen Ausführungsformen Hankel-Singulärwerte aufweist. 2 FIG. 12 is a graphical representation of an exemplary state space system having Hankel singular values according to one or more embodiments described herein.

3 zeigt eine grafische Darstellung, die Impulsantworten einer endlichen Impulsantwort-Annäherung der 25. Ordnung und einer unendlichen Impulsantwort-Annäherung der 6. Ordnung für ein exemplarisches Zustandsraumsystem gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 3 FIG. 10 is a graph illustrating impulse responses of a 25th order finite impulse response approximation and a 6th order infinite impulse response approximation for an exemplary state space system according to one or more embodiments described herein. FIG.

4 zeigt eine grafische Darstellung, die Impulsantworten einer endlichen Impulsantwort-Annäherung der 25. Ordnung und einer unendlichen Impulsantwort-Annäherung der 3. Ordnung für ein exemplarisches Zustandsraumsystem gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 4 FIG. 12 is a graph illustrating impulse responses of a 25th order finite impulse response approximation and a 3rd order infinite impulse response approximation for an exemplary state space system according to one or more embodiments described herein. FIG.

5 zeigt ein Blockdiagramm, das eine exemplarische Anordnung von Lautsprechern im Verhältnis zu einem Benutzer veranschaulicht. 5 FIG. 12 is a block diagram illustrating an exemplary arrangement of speakers relative to a user. FIG.

6 zeigt ein Blockdiagramm, das ein exemplarisches binaurales Wiedergabesystem veranschaulicht. 6 Figure 12 is a block diagram illustrating an exemplary binaural display system.

7 zeigt ein Blockdiagramm, das ein exemplarisches MIMO-binaurales Wiedergabesystem gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 7 FIG. 12 is a block diagram illustrating an exemplary MIMO binaural display system according to one or more embodiments described herein.

8 zeigt ein Blockdiagramm, das ein exemplarisches binaurales Wiedergabesystem gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 8th FIG. 12 is a block diagram illustrating an exemplary binaural display system in accordance with one or more embodiments described herein.

9 zeigt ein Blockdiagramm, das ein exemplarisches Computergerät veranschaulicht, das, gemäß einer oder mehreren hierin beschriebenen Ausführungsformen zur binauralen Wiedergabe vorgesehen ist. 9 FIG. 12 is a block diagram illustrating an exemplary computing device provided in accordance with one or more binaural rendering embodiments described herein.

10 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen ersten linken Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 10 FIG. 10 is a graphical representation illustrating exemplary results of a single input single output (SISO) IIR approach using balanced implementation for a first left node according to one or more embodiments described herein. FIG.

11 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen ersten rechten Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 11 FIG. 12 is a graphical representation illustrating exemplary results of a single input single output (SISO) IIR approach using balanced implementation for a first right node according to one or more embodiments described herein. FIG.

12 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen zweiten linken Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 12 FIG. 10 is a graphical representation illustrating exemplary results of a single input single output (SISO) IIR approach using balanced implementation for a second left node according to one or more embodiments described herein. FIG.

13 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen zweiten rechten Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 13 FIG. 12 is a graphical representation illustrating exemplary results of a single input single output (SISO) IIR approach using balanced implementation for a second right node according to one or more embodiments described herein. FIG.

14 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen dritten linken Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 14 FIG. 12 is a graphical representation illustrating exemplary results of a single-input single-issue (SISO) IIR approximation using balanced implementation for a third left node in accordance with one or more embodiments described herein. FIG.

15 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen dritten rechten Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 15 FIG. 12 is a graphical representation illustrating exemplary results of a single-input single-issue (SISO) IIR approximation using balanced realization for a third right node according to one or more embodiments described herein. FIG.

16 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen vierten linken Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 16 FIG. 12 is a graphical representation illustrating exemplary results of a single input single output (SISO) IIR approach using balanced implementation for a fourth left node according to one or more embodiments described herein. FIG.

17 zeigt eine grafische Darstellung, die exemplarische Ergebnisse einer Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung von ausgeglichener Realisierung für einen vierten rechten Knoten gemäß einer oder mehreren hierin beschriebenen Ausführungsformen veranschaulicht. 17 FIG. 12 is a graphical representation illustrating exemplary results of a single input single output (SISO) IIR approximation using balanced implementation for a fourth right node according to one or more embodiments described herein. FIG.

18 zeigt ein Ablaufdiagramm, das ein exemplarisches Verfahren zur Durchführung der hierin beschriebenen verbesserten Techniken veranschaulicht. 18 FIG. 12 is a flow chart illustrating an exemplary method of performing the improved techniques described herein. FIG.

Die hier aufgeführten Überschriften dienen lediglich der Vereinfachung und haben nicht unbedingt eine Auswirkung auf das Ausmaß oder die Bedeutung der Informationen, die in dieser vorliegenden Offenbarung beansprucht werden.The headings herein are for convenience only and do not necessarily affect the extent or meaning of the information claimed in this present disclosure.

In den Zeichnungen identifizieren die gleichen Bezugszeichen und jegliche Akronyme Elemente oder Aufgaben, die eine ähnliche oder gleiche Struktur oder Funktionalität aufweisen, um das Verständnis zu erleichtern und den Zusammenhang zu verdeutlichen. Die Zeichnungen werden im Verlauf der folgenden ausführlichen Beschreibung im Detail beschrieben.In the drawings, the same reference numerals and any acronyms identify elements or tasks having similar or similar structure or functionality to facilitate understanding facilitate and clarify the context. The drawings will be described in detail in the course of the following detailed description.

AUSFÜHRLICHE BESCHREIBUNGDETAILED DESCRIPTION

Im Folgenden werden nun diverse Beispiele und Ausführungsformen der Verfahren und Systeme der vorliegenden Offenbarung beschrieben. Die folgende Beschreibung bietet spezifische Details für ein gründliches Verständnis und ermöglicht die Beschreibung der genannten Beispiele. Fachleute auf dem Gebiet werden jedoch verstehen, dass ein oder mehrere hierin beschriebene Ausführungsformen ohne viele dieser Details angewandt werden können. Gleichermaßen werden Fachleute auf dem Gebiet auch verstehen, dass ein oder mehrere Ausführungsformen der vorliegenden Offenbarung andere Eigenschaften beinhalten können, die nicht im Detail hierin beschrieben werden. Zudem können einige wohlbekannte Strukturen oder Funktionen nachfolgend nicht im Detail dargestellt oder beschrieben werden, um einer unnötigen Verwirrung in der entsprechenden Beschreibung vorzubeugen.Various examples and embodiments of the methods and systems of the present disclosure will now be described. The following description provides specific details for a thorough understanding and allows the description of the examples given. However, it will be understood by those skilled in the art that one or more embodiments described herein may be practiced without many of these details. Likewise, it will be understood by those skilled in the art that one or more embodiments of the present disclosure may include other features that are not described in detail herein. In addition, some well-known structures or functions may not be illustrated or described in detail below to avoid unnecessary confusion in the description.

Die Verfahren und Systeme der vorliegenden Offenbarung befassen sich mit den rechnerischen Komplexitäten des oben erwähnten binauralen Wiedergabeprozesses. Eine oder mehrere Ausführungsformen der vorliegenden Offenbarung betreffen beispielsweise ein Verfahren und System zur Reduktion der Zahl von arithmetischen Vorgängen, die erforderlich sind, um die 2M Filterfunktionen zu implementieren.The methods and systems of the present disclosure address the computational complexities of the binaural rendering process mentioned above. For example, one or more embodiments of the present disclosure relate to a method and system for reducing the number of arithmetic operations required to implement the 2M filtering functions.

Einführungintroduction

1 zeigt ein exemplarisches System 100, das darstellt, wie die letzte Stufe eines räumlichen Audio-Players (für die Zwecke des vorliegenden Beispiels ohne Berücksichtigung jeglicher Verarbeitung von Umgebungseffekten) Mehrkanal-Einspeisungen an ein virtuelles Lautsprecher-Array leitet und sie zu einem Signalpaar zum Abspielen über Kopfhörer kodiert. Wie dargestellt, wird die abschließende Umwandlung vom M-Kanal zum 2-Kanal unter Verwendung von M individuellen 1-to-2-Encodern vorgenommen, wobei jeder Encoder einem Paar von Außenohrübertragungsfunktionen (HRTFs) für das linke/rechte Ohr entspricht. Somit entspricht in der Systembeschreibung der Operator G(z) einer Matrix

Figure DE202017102729U1_0002
1 shows an exemplary system 100 depicting how the final stage of a spatial audio player (for the purposes of the present example without regard to any processing of environmental effects) channels multichannel feeds to a virtual speaker array and encodes them into a headphone pair of signals. As illustrated, the final M-channel to 2-channel conversion is done using M individual 1-to-2 encoders, each encoder corresponding to a pair of left / right ear outer ear transmission functions (HRTFs). Thus, in the system description, the operator G (z) corresponds to a matrix
Figure DE202017102729U1_0002

Jedes Subsystem ist gewöhnlich die Übertragungsfunktion, die mit der Impulsantwort assoziiert ist, die von einem Lautsprecherstandort zum linken/rechten Ohr gemessen wird. Wie nachstehend detaillierter beschrieben, bieten die Verfahren und Systeme der vorliegenden Offenbarung eine Möglichkeit, die Ordnung jedes Subsystems durch die Verwendung eines Prozesses zur Umwandlung einer endlichen Impulsantwort (FIR) in eine unendliche Impulsantwort (IIR) zu reduzieren. Ein konventioneller Ansatz für diese Herausforderung ist es, jedes Subsystem als Einzeleingabe-Einzelausgabe(SISO)-System für sich genommen zu betrachten und dessen Struktur zu vereinfachen. Der folgende Abschnitt untersucht diesen konventionellen Ansatz und prüft darüber hinaus, wie größere Effizienz erreicht werden kann, indem auf das gesamte System als ein M-Eingaben- und 2-Ausgaben-Mehrfacheingaben-Mehrfachausgaben(MIMO)-System eingewirkt werden kann.Each subsystem is usually the transfer function associated with the impulse response measured from a speaker location to the left / right ear. As described in more detail below, the methods and systems of the present disclosure provide a way to reduce the order of each subsystem through the use of a finite impulse response (FIR) to infinite impulse response (IIR) process. A conventional approach to this challenge is to consider each subsystem as a single-input single-issue (SISO) system in isolation and to simplify its structure. The following section examines this conventional approach and further examines how greater efficiency can be achieved by acting on the entire system as an M-input and 2-output multiple-input multiple output (MIMO) system.

Während einige bestehende Techniken sich mit MIMO-Modellen von HRTF-Systemen beschäftigen, befasst sich keine mit deren Verwendung in Ambisonic-basierten virtuellen Lautsprechersystemen, wie z. B. in der vorliegenden Offenbarung. Die Grundlage der in der vorliegenden Offenbarung beschriebenen Systemordnungsreduktion basiert auf einer Metrik, die als die Hankel-Norm bekannt ist. Da diese Metrik nicht allgemein bekannt oder gut verstanden wird, versucht der folgende Abschnitt zu erklären, was die Metrik misst und warum sie praktische Bedeutung für akustische Systemantworten hat.While some existing techniques deal with MIMO models of HRTF systems, none is concerned with their use in Ambisonic-based virtual speaker systems, such as: In the present disclosure. The basis of the system order reduction described in the present disclosure is based on a metric known as the Hankel standard. Since this metric is not widely known or well understood, the following section tries to explain what the metric measures and why it has practical significance for acoustic system responses.

HRIR/HRTF-StrukturHRIR / HRTF structure

Die Impulsantworten zwischen einer Klangquelle und dem linken und rechten Ohr eines Hörers werden als Außenohr-Impulsantworten (HRIRs) und sobald sie auf die Frequenzebene transformiert sind als HRTFs bezeichnet. Diese Antwortfunktionen enthalten die grundlegenden Richtungshinweise dafür, wie der Hörer den Standort der Klangquelle wahrnimmt. Die Signalverarbeitung zur Erschaffung von virtuellen auditiven Darstellungen nutzt diese Funktionen als Filter bei der Synthese von räumlich genauen Klangquellen. In VR-Anwendungen erfordert die Benutzer-Blickverfolgung, dass die Audiosynthese so effizient wie möglich durchgeführt wird, da beispielsweise (i) Verarbeitungsressourcen begrenzt sind und (ii) oft eine geringe Latenz erforderlich ist.The impulse responses between a sound source and the left and right ears of a listener are referred to as outer ear impulse responses (HRIRs) and, once transformed to the frequency plane, as HRTFs. These answering features provide basic directional guidance on how the listener perceives the location of the sound source. Signal processing for the creation of virtual auditory representations uses these functions as filters in the synthesis of spatially accurate sound sources. In VR applications, user gaze tracking requires that audio synthesis be done as efficiently as possible For example, because (i) processing resources are limited and (ii) low latency is often required.

Die Signalübermittlung durch die HRIR/HRTF, g, kann für Eingabe x[k] und Ausgabe y[k] wie folgt geschrieben werden: (der Einfachheit halber werden im Folgenden Ausgaben für k > N behandelt)
mit g = [g0, g1, g2, ..., gN–1],

Figure DE202017102729U1_0003
Z-Transformation befolgend Y(z) = G(z)X(z) (2) G(z) = [g0 + g1z–1 + g2z–2 + ... + gN–1zN–1] (3) The signal transmission by the HRIR / HRTF, g, can be written for input x [k] and output y [k] as follows: (for simplicity, editions for k> N will be discussed below)
with g = [g 0 , g 1 , g 2 , ..., g N-1 ],
Figure DE202017102729U1_0003
Following Z transformation Y (z) = G (z) X (z) (2) G (z) = [g 0 + g 1 z -1 + g 2 z -2 + ... + g N-1 z N-1 ] (3)

Hier wird eine N-Punkt-HRIR für das linke (L) oder rechte (R) Ohr als Übertragungsfunktion einer Z-Domäne dargestellt. Die ersten nL/R-Samplewerte einer HRIR betragen annähernd null wegen der Transportverzögerung vom Standort der Quelle zum L/R-Ohr. Die Differenz nL – nR trägt zur interauralen Zeitverzögerung (ITD) bei, was einen signifikanten binauralen Hinweis auf die Richtung der Quelle gibt. Ab hier bezieht sich G(z) auf jedwede der HRTFs und die Subskripte L und R werden nur dann genutzt, wenn Differenzialeigenschaften beschrieben werden.Here, an N-point HRIR for the left (L) or right (R) ear is represented as a transfer function of a Z domain. The first n L / R sample values of HRIR are approximately zero due to the transport delay from the source location to the L / R ear. The difference n L - n R contributes to the interaural time delay (ITD), giving a significant binaural indication of the direction of the source. From here G (z) refers to any of the HRTFs and the subscripts L and R are only used when differential properties are described.

Annäherung an einen FIR durch eine IIR-Struktur niederer OrdnungApproaching an FIR through a low-order IIR structure

Einführung in die Hankel-NormIntroduction to the Hankel standard

Die folgende Beschreibung versucht G(z) durch ein alternatives System G ^(z) zu ersetzen, das einen Vorteil, wie zum Beispiel eine geringere Rechenlast, sowie eine „gute” Annäherung an G(z) bietet, wie durch eine Metrik ||G(z) – G ^(z)|| gemessen, bei der y = Gx und y ^ = G ^x eine nützliche Metrik der Differenz der H-Norm des Fehlersystems das sich aus ergibt, entspricht

Figure DE202017102729U1_0004
The following description tries G (z) through an alternative system G ^ (z) which offers an advantage, such as lower computational load, as well as a "good" approximation to G (z), such as through a metric || G (z) - G ^ (z) || measured, where y = Gx and y ^ = G ^ x a useful metric of the difference of the H norm of the error system resulting from corresponding
Figure DE202017102729U1_0004

Dieses Energieverhältnis ergibt als Norm die maximale Energie in der Differenz für die minimale Energie im Signal, das die Systeme antreibt. Daher liegt es nahe, damit der Annäherungsfehler geringfügig ausfällt, jene Modi zu löschen, die am wenigsten Energie von der Eingabe x zur Ausgabe y übertragen. Es ist hilfreich zu sehen, dass die H-Norm des Fehlers die praktische Relevanz besitzt, zu entsprechen

Figure DE202017102729U1_0005
This energy ratio as a norm gives the maximum energy in the difference for the minimum energy in the signal driving the systems. Therefore, in order for the approximation error to be slight, it is obvious to delete those modes that transfer the least energy from the input x to the output y. It is helpful to see that the H norm of the error has the practical relevance to match
Figure DE202017102729U1_0005

Dies zeigt, dass die H-Norm dem Höhepunkt des Bode-Magnituden-Diagramms des Fehlers entspricht.This shows that the H norm corresponds to the peak of the Bode Magnitude Diagram of the error.

Die Herausforderung und Schwierigkeit besteht jedoch darin, das Verhältnis zwischen dieser Norm und den System-Modi zu charakterisieren. Stattdessen wird der folgende Abschnitt die Anwendung der Hankel-Norm des Fehlers untersuchen, da dadurch vorteilhafte Verhältnisse zu den Systemeigenschaften verdeutlicht werden und leicht gezeigt werden kann, dass dadurch eine Obergrenze für die H-Norm bereitgestellt wird.The challenge and difficulty, however, is to characterize the relationship between this standard and the system modes. Instead, the following section will examine the use of Hankel-norm of the error, as this advantageous conditions into system characteristics will become apparent and can be easily shown that by doing an upper limit for the H norm is provided.

Die Hankel-Norm eines Systems ist die induzierte Verstärkung eines Systems für einen Operator, den Hankel-Operator ϕG, der durch das konvolutionsähnliche Verhältnis definiert ist

Figure DE202017102729U1_0006
The Hankel norm of a system is the induced gain of a system for an operator, the Hankel operator φ G , which is defined by the convolution-like ratio
Figure DE202017102729U1_0006

Es sollte beachtet werden, dass durch die Annahme von k = 0 als „momentane” Zeit, dieser Operator ϕG bestimmt, wie eine Eingabe-Sequenz x[k], die von –∞ bis k = –1 angewendet wird, im Folgenden bei der Ausgabe des Systems erscheint.It should be noted that by assuming k = 0 as the "current" time, this operator determines φ G , such as an input sequence x [k] applied from -∞ to k = -1, below the output of the system appears.

Die durch ϕG induzierte Hankel-Norm wird als definiert

Figure DE202017102729U1_0007
The Hankel norm induced by φ G is defined as
Figure DE202017102729U1_0007

Es sollte zudem ersichtlich sein, dass die Hankel-Norm ein Maximieren der zukünftigen Energie darstellt, die an dem Systemausgang wiedererlangt werden kann, während die historische Eingabe-Energie ins System minimiert wird. Oder, mit anderen Worten, die zukünftige Ausgabe-Energie, die aus jedweder Eingabe resultiert entspricht höchstens der Hankel-Norm mal der Eingabe-Energie, vorausgesetzt, die zukünftige Eingabe ist gleich null.It should also be apparent that the Hankel standard represents maximizing the future energy that can be recovered at the system output while minimizing the historical input energy into the system. Or, in other words, the future output energy resulting from any input is at most Hankel's norm times the input energy, assuming the future input is zero.

Zustandsraum-Systemdarstellung und die Hankel-NormState space system representation and the Hankel standard

Aus der obigen Beschreibung ist ersichtlich, dass die Hankel-Norm ein nützliches Maß an Energieübertragung durch ein System bereitstellt. Um jedoch zu verstehen, inwiefern die Norm mit der Systemordnung und ihrer Reduktion zusammenhängt, ist es nötig, die internen Dynamiken des Systems, wie durch dessen Zustandsraumdarstellung modelliert, zu charakterisieren. Die darstellende Verbindung zwischen dem Zustandsraummodell eines Systems mit linear verschiebender Invariante (LSI) und dessen Übertragungsfunktion ist hinreichend bekannt. Mit einem Einzeleingabe-Einzelausgabe(SISO)-System der n Ordnung, das durch die Übertragungsfunktion beschrieben wird,

Figure DE202017102729U1_0008
kann somit für w[k]εRn–1 und mit AεR(n–1)x(n–1), BεR(n–1)x1, CεR1x(n–1), und DεR, dieses System durch das Zustandsraum-Modell S: [A, B, C, D] beschrieben werden: w[k + 1] = Aw[k] + Bx[k] y[k] = Cw[k] + Dx[k] (9) From the above description, it can be seen that the Hankel standard provides a useful level of energy transfer through a system. However, to understand how the norm relates to the system order and its reduction, it is necessary to characterize the internal dynamics of the system as modeled by its state space representation. The representative connection between the state space model of a linearly shifting invariant (LSI) system and its transfer function is well known. With a single-input single-output (SISO) system of n order, which is described by the transfer function,
Figure DE202017102729U1_0008
Thus, for w [k] εR n-1 and with AεR (n-1) x (n-1) , BεR (n-1) x1 , CεR 1x (n-1) , and DεR, this system can pass through the state space Model S: [A, B, C, D] are described: w [k + 1] = Aw [k] + Bx [k] y [k] = Cw [k] + Dx [k] (9)

Die Z-Transformation dieses Systems entspricht zW(z) = AW(z) + BX(z) Y(z) = CW(z) + DX(z) ergebend Y(z) = [C(zI – A)–1B + D]X(z) = G(z)X(z) (10) The Z transformation of this system corresponds zW (z) = AW (z) + BX (z) Y (z) = CW (z) + DX (z) yielding Y (z) = [C (zI-A) -1 B + D] X (z) = G (z) X (z) (10)

Es sollte beachtet werden, dass die Systemmatrizen [A, B, C, D] nicht eindeutig sind, und ein alternatives Zustandsraummodell erhalten werden kann, und zwar beispielsweise v[k] durch die folgende Ähnlichkeitstransformation für eine invertible Matrix TεR(n–1)x(n–1), Tv = w, ergebend A ^ = T–1AT, B ^ = T–1B, C ^ = CT, und D ^ = D. Das Zustandsraum-Modell S: [A ^, B ^C ^D ^] weist dieselbe Übertragungsfunktion G(z) auf.It should be noted that the system matrices [A, B, C, D] are not unique, and an alternative state space model can be obtained, for example v [k] by the following similarity transformation for an invertible matrix TεR (n-1) x (n-1) , Tv = w A ^ = T- 1 AT, B ^ = T- 1 B, C ^ = CT, and D ^ = D. The state space model S: [A ^, B ^ C ^ D ^] has the same transfer function G (z).

Es sollte ersichtlich sein, dass für die Zwecke des vorliegenden Beispiels davon ausgegangen wird, dass es sich bei G(z) um ein stabiles System handelt, das dementsprechend S stabil ist, was bedeutet, dass die Eigenwerte von A = λ. (A) sämtlich auf der Platteneinheit [λ] < 1 liegen. It should be understood that, for purposes of the present example, it is assumed that G (z) is a stable system which, accordingly, is S stable, which means that the eigenvalues of A = λ. (A) all lie on the disk unit [λ] <1.

Die Henkel-Norm von G(z) kann nun hinsichtlich der in w[0] gespeicherten Energie als Ergebnis einer Eingabesequenz x[k] für –∞ < k ≤ –1, und anschließend damit beschrieben werden, wie viel dieser Energie an die Ausgabe y[k] für k ≥ 0 geliefert wird.The Henkel norm of G (z) can now be described in terms of the energy stored in w [0] as a result of an input sequence x [k] for -∞ <k ≤ -1, and then how much of that energy to the output y [k] is supplied for k ≥ 0.

Um die interne Energie von S zu beschreiben, ist es nötig, zwei Systemeigenschaften einzuführen:

  • (i) Die Gram'sche Zugänglichkeits-(Steuerbarkeits)Matrix
    Figure DE202017102729U1_0009
    und
  • (ii) Die Gram'sche Beobachtbarkeits-Matrix
    Figure DE202017102729U1_0010
To describe the internal energy of S, it is necessary to introduce two system properties:
  • (i) The Gram Accessibility (controllability) matrix
    Figure DE202017102729U1_0009
    and
  • (ii) Gram's observability matrix
    Figure DE202017102729U1_0010

Da A stabil ist, fallen die beiden obigen Additionen zusammen, und es lässt sich leicht zeigen, dass P symmetrisch und positiv definit ist, wenn, und nur wenn, das Paar (A, B) steuerbar ist (was bedeutet, dass, beginnend bei w[0], von einer Sequenz x[k], k > 0 festgestellt werden kann, dass diese das System in jeden beliebigen Zustand w* führen kann). Q ist ebenfalls symmetrisch und positiv definit, wenn, und nur wenn, das Paar (A, C) beobachtbar ist (was bedeutet, dass der Zustand des Systems zu jedem Zeitpunkt j aus den Systemausgaben y[k] für k > j feststellbar ist).Since A is stable, the two above additions coincide, and it is easy to show that P is symmetric and positive definite if, and only if, pair (A, B) is controllable (meaning that starting at w [0], from a sequence x [k], k> 0 can be determined that this can lead the system into any state w *). Q is also symmetric and positive definite if, and only if, the pair (A, C) is observable (meaning that the state of the system at each instant j is determinable from the system outputs y [k] for k> j) ,

Es lässt sich leicht zeigen, dass P und Q als Lösungen der Lyapunov-Gleichungen erhalten werden können, APAT + BBT – P = 0 und dass ATQA + CTC – Q = 0 die beobachtete Energie des Zustands der Energie im Verlauf y[k] für k ≥ 0 mit w[0] = w0 und x[k] = 0 für k ≥ 0 entspricht. Es lässt sich leicht zeigen, dass

Figure DE202017102729U1_0011
It can easily be shown that P and Q can be obtained as solutions of the Lyapunov equations, APA T + BB T - P = 0 and that A T QA + C T C - Q = 0 the observed energy of the state of energy in the course y [k] for k ≥ 0 with w [0] = w0 and x [k] = 0 for k ≥ 0. It's easy to show that
Figure DE202017102729U1_0011

Das minimale Steuerenergie-Problem als das definiert ist, was der minimalen Energie entspricht:

Figure DE202017102729U1_0012
The minimum control energy problem is defined as what corresponds to the minimum energy:
Figure DE202017102729U1_0012

Hierbei handelt es sich um ein Standardproblem der optimalen Steuerung, das wie folgt gelöst werden kann xopt[k] = BT(AT)–(1+k)P–1w0 f or k < 0 ergebend J(xopt) = w T / 0P–1w0 This is a standard problem of optimal control, which can be solved as follows x opt [k] = B T (A T ) - (1 + k) P -1 w 0 f or k <0 yielding J (x opt ) = w T / 0P -1 w 0

Angesichts der obigen Sachverhalte ist es nun möglich, die Hankel-Norm eines Systems G(z), oder äquivalent S: [A, B, C, D], mit Q und P Gram'schen Matrizen in Verbindung zu setzen als

Figure DE202017102729U1_0013
In view of the above, it is now possible to associate the Hankel norm of a system G (z), or equivalently S: [A, B, C, D], with Q and P Gram matrices as
Figure DE202017102729U1_0013

Ausgeglichene Zustandsraum-SystemdarstellungenBalanced state space system representations

Es sollte nun ersichtlich sein, dass es für HRTF-Systeme möglich ist, eine geeignete Ähnlichkeitstransformation, T, zu berechnen, um eine System-Realisierung S: [A ^, B ^, C ^, D ^] zu erhalten, die gleiche Gram'sche Zugänglichkeits- und Beobachtbarkeits-Matrizen ergibt, die der Form einer diagonalen Matrix Σ entsprechen Q = P = Σ = diag'(σ1, ..., σn–1) mit σ1 ≥ σ2 ≥ ... ≥ σn–1 > 0 It should now be apparent that it is possible for HRTF systems to compute an appropriate similarity transformation, T, to system implementation S: [A ^, B ^, C ^, D ^] to obtain the same Gram accessibility and observability matrices corresponding to the shape of a diagonal matrix Σ Q = P = Σ = diag '(σ 1 , ..., σ n-1 ) with σ 1 ≥ σ 2 ≥ ... ≥ σ n-1 > 0

Gemäß zumindest einer Ausführungsform der vorliegenden Offenbarung kann das Erhalten einer ausgeglichenen Zustandsraum-Systemdarstellung Folgendes beinhalten:

  • (i) Beginnend mit G(z) wird diese als Zustandsraumsystem S: [A, B, C, D] bestimmt (z. B. erkannt).
  • (ii) Für S werden die Gram'schen Matrizen gelöst, um P und Q zu erhalten.
  • (iii) Dabei wird Lineare Algebra verwendet, um Folgendes zu ergeben Σ = diag(σ1, ..., σn–1) = √λ(PQ)
  • (iv) Faktorisierung P = MT M und MQMT = WTΣ2W, wobei W einheitlich ist, ergibt M und W, sodass T = MTWΣ – ½ wofür P ^ = TTPT = Σ = Q ^ = T–1Q(T–1)T
  • (v) Das T aus (iv) kann verwendet werden, um eine neue Darstellung des Systems zu erhalten als A ^ = T–1AT, B ^ = T–1B, C ^ = CT, und D ^ = D
  • (vi) In der Darstellung, die in (v) erhalten wird, gibt es ausgeglichene Zustände. Mit anderen Worten beträgt die minimale Energie, um das System in den Zustand (0.0....1.0...0)T mit a 1 in Position i zu versetzend σ –1 / i, während, wenn das System in diesem Zustand freigegeben wird, die an dem Ausgang wiedererlangte Energie σi beträgt.
  • (vii) In diesem ausgeglichenen Modell werden die Zustände hinsichtlich ihrer Bedeutung für die Übertragung von Energie vom Signaleingang zum -ausgang geordnet. Somit führen ein Kürzen der Zustände in dieser Struktur und gleichermaßen eine Reduktion der Ordnung von G(z) dazu, dass die Zustände hinsichtlich ihrer Bedeutung für die Energieübertragung entfallen.
According to at least one embodiment of the present disclosure, obtaining a balanced state space system representation may include:
  • (i) Starting with G (z), it is determined (eg recognized) as state space system S: [A, B, C, D].
  • (ii) For S, the Gramian matrices are solved to obtain P and Q.
  • (iii) Linear algebra is used to give the following Σ = diag (σ 1 , ..., σ n-1 ) = √ λ (PQ)
  • (iv) Factorization P = M T M and MQM T = W T Σ 2 W, where W is uniform, yields M and W, so T = M T WΣ - ½ for which P ^ = T T PT = Σ = Q ^ = T -1 Q (T -1 ) T
  • (v) The T of (iv) can be used to obtain a new representation of the system as A ^ = T -1 AT, B ^ = T -1 B, C ^ = CT, and D ^ = D
  • (vi) In the representation obtained in (v), there are balanced states. In other words, the minimum energy is to put the system in the state (0.0 .... 1.0 ... 0) T with a 1 in position i σ -1 / i, while, when the system is released in this state, the energy recovered at the output is σ i .
  • (vii) In this balanced model, the states are ordered in terms of their importance for the transmission of energy from the signal input to the output. Thus, truncating the states in this structure, as well as reducing the order of G (z), eliminates the states of importance for energy transfer.

Beispiel einer Ordnungsreduktion auf Grundlage eines ausgeglichenen ZustandsraumsystemsExample of an order reduction based on a balanced state space system

Der folgende Abschnitt untersucht das Erstellen eines Zustandsraummodells einer FIR-Struktur und deren Ordnungsreduktion unter Verwendung der oben beschriebenen ausgeglichenen Systemdarstellung.The following section examines creating a state space model of an FIR structure and its order reduction using the balanced system representation described above.

Das vorliegende Beispiel verfahrt durch eine Untersuchung eines 26-Punkt-FIR-Filters g[k]

Figure DE202017102729U1_0014
mit Übertragungsfunktion G(z) = [g0 + g1z–1 + ... g25z–25] The present example proceeds by examining a 26-point FIR filter g [k]
Figure DE202017102729U1_0014
with transfer function G (z) = [g 0 + g 1 z -1 + ... g 25 z -25 ]

Ein Zustandsraummodell der 25. Ordnung wird erstellt mit

Figure DE202017102729U1_0015
A state space model of the 25th order is created with
Figure DE202017102729U1_0015

Wie in 2 dargestellt, weist das System S: [A, B, C, D] Hankel-Singulärwerte (SVs) auf. As in 2 The system S has: [A, B, C, D] Hankel singular values (SVs).

S wird zu S: [A ^ = T–1AT umgewandelt. B ^ = T–1B, C ^ = CT, und D ^ = D]. Aus dem Profil von Hankel-SVs (z. B. wie in 2 veranschaulicht) kann eine Annäherung der 6. Ordnung erhalten werden. Das System ist somit wie folgt partitioniert:

Figure DE202017102729U1_0016
S becomes too S: [A ^ = T -1 AT converted. B ^ = T -1 B, C ^ = CT, and D ^ = D]. From the profile of Hankel SVs (eg as in 2 illustrated), a 6th order approximation can be obtained. The system is thus partitioned as follows:
Figure DE202017102729U1_0016

Das ordnungsreduzierte System entspricht S6: [A ^6×6, B ^6×1, C ^1×6, D ^], woraus sich die ordnungsreduzierte Transferfunktion ergibt

Figure DE202017102729U1_0017
The order-reduced system corresponds S 6 : [A ^ 6 × 6 , B ^ 6 × 1 , C ^ 1 × 6 , D ^], resulting in the order-reduced transfer function
Figure DE202017102729U1_0017

Zum Vergleich sind in 3 die Impulsantworten des ursprünglichen FIR G(z) und die IIR-Annäherung der 6. Ordnung veranschaulicht. Das in 3 dargestellte Diagramm offenbart eine fast verlustfreie Übereinstimmung.For comparison are in 3 illustrates the impulse responses of the original FIR G (z) and the 6th order IIR approximation. This in 3 The diagram shown discloses an almost lossless match.

Darüber hinaus werden in 4 zum Vergleich die Impulsantworten des ursprünglichen FIR G(z) und die IIR-Annäherung der 3. Ordnung veranschaulicht.In addition, in 4 For comparison, the impulse responses of the original FIR G (z) and the 3rd order IIR approximation are illustrated.

Ausgeglichene Annäherung an HRIRsBalanced approach to HRIRs

Virtuelles Lautsprecher-Array und HRIR-SatzVirtual speaker array and HRIR set

Der folgende Abschnitt beschreibt ein exemplarisches Szenario auf Grundlage einer einfachen quadratischen Anordnung von Lautsprechern, wie in 5 veranschaulicht, bei dem die Ausgaben unter Verwendung der HRIRs von Subjekt 15 des CIPIC-Satzes auf binaural heruntergemischt werden. Bei diesen handelt es sich um 200-Punkt HRIRs, die bei 44,1 kHz gesampelt werden und der Satz enthält eine Reihe von assoziierten Daten, die Messungen der interauralen Zeitdifferenz (ITD) zwischen jedem Paar von HRIRs beinhalten. Die Übertragungsfunktion G(z) einer HRIR (z. B. Gleichung (3) oben) verfügt über eine Anzahl von führenden Koeffizienten [g0, ..., gm], die null betragen und bei jeder Antwort eine Einsatzverzögerung begründen und, wie nachstehend in Gleichung (12) dargestellt, G(z) ergeben. Die Differenz zwischen den Einsatzzeitpunkten des linken und rechten Paars von HRIRs bestimmt weitestgehend deren Beitrag zur ITD. Die Form einer typischen linken HRTF wird in Gleichung (12) angegeben, während die rechte HRTF eine ähnliche Form aufweist:

Figure DE202017102729U1_0018
The following section describes an exemplary scenario based on a simple square array of speakers, as in 5 illustrated in which the outputs are down-converted to binaural using the HRIRs of subject 15 of the CIPIC set. These are 200-point HRIRs that are sampled at 44.1kHz and the set contains a set of associated data that includes interaural time difference (ITD) measurements between each pair of HRIRs. The transfer function G (z) of an HRIR (eg, equation (3) above) has a number of leading coefficients [g 0 , ..., g m ] that are zero, and give a response delay for each response, and as shown in equation (12) below, give G (z). The difference between the deployment times of the left and right pair of HRIRs largely determines their contribution to the ITD. The shape of a typical left HRTF is given in equation (12), while the right HRTF has a similar form:
Figure DE202017102729U1_0018

Die ITD ergibt sich aus ITD = |mL = mR|, was für jedes HRIR-Paar in der CIPIC-Datenbank vorgesehen ist. Die mit der Einsatzverzögerung assoziierte Exzessphase bedeutet, dass jedes G(z) nicht minimalphasisch ist, zudem ist auch dargelegt worden, dass der Hauptteil der HRTF G `(z) ebenfalls nicht minimalphasisch ist. Es ist jedoch auch dargelegt worden, dass Hörer nicht zwischen dem Filtereffekt von G `(z) und dessen minimalphasischen Version unterscheiden können, die als H(z) angegeben ist. Somit setzen im vorliegenden Beispiel der FIR-IIR-Annäherung die ursprünglichen FIRs G(z) durch ihre minimalphasischen H(z) einer Aktion gleich, die die Einsatzverzögerung aus jeder HRIR entfernt.The ITD results from ITD = | m L = m R |, which is provided for each HRIR pair in the CIPIC database. The excess phase associated with the insertion delay means that each G (z) is not minimally phasic, and it has also been demonstrated that the bulk of the HRTF G `(z) also is not minimal phasic. However, it has also been demonstrated that listeners do not distinguish between the filter effect of G `(z) and distinguish its minimal phasic version, which is indicated as H (z). Thus, in the present example, the FIR-IIR approximation equates the original FIRs G (z) by their minimum phasic H (z) to an action that removes the insertion delay from each HRIR.

Einzeleingabe-Einzelausgabe-IIR-Annäherung unter Verwendung ausgeglichener RealisierungSingle Input Single Output IIR Approach Using Balanced Realization

Gemäß mindestens einer Ausführungsform entspricht die Einzeleingabe-Einzelausgabe(SISO)-IIR-Annäherung unter Verwendung ausgeglichener Realisierung einem einfachen Prozess, der beispielsweise Folgendes beinhaltet:

  • (i) Auslesen der HRIR(1/r, 1:200) für jeden Knoten.
  • (ii) Erhalten des minimalphasischen Äquivalents unter Verwendung eines Cepstrum, wodurch sich HHRIR(1/r, 1:200) ergibt.
  • (iii) Erstellen einer SISO-Zustandsraumdarstellung von HHRIR(1/x, 1:200) als S: [A, B, C, D]. Dabei handelt es sich um einen 199-dimensionalen Zustandsraum.
  • (iv) Verwenden des oben beschriebenen ausgeglichenen Reduktionsverfahrens, um eine ordnungsreduzierte Version von S in Dimension rr zu erhalten. Zum Beispiel, Srr: [Arr, Brr, Crr, Drr].
In accordance with at least one embodiment, single-input single-issue (SISO) IIR approximation using balanced implementation is a simple process that includes, for example:
  • (i) read the HRIR (1 / r, 1: 200) for each node.
  • (ii) obtaining the minimum phase equivalent using a cepstrum to give HHRIR (1 / r, 1: 200).
  • (iii) Creating a SISO state space representation of HHRIR (1 / x, 1: 200) as S: [A, B, C, D]. This is a 199-dimensional state space.
  • (iv) using the balanced reduction method described above to obtain a reduced order version of S in dimension rr. For example, S rr : [A rr , B rr , C rr , D rr ].

Das Cepstrum dieser HRIR kann kausale Samples, die zu positiven Zeitpunkten genommen wurden, und nicht kausale Samples, die zu negativen Zeitpunkten genommen wurden, aufweisen. Somit kann für jedes der nicht kausalen Samples des Cepstrums ein Phasenminimierungsvorgang durchgeführt werden, indem dieses nicht kausale Sample, das zu einem negativen Zeitpunkt genommen wurde, zu einem kausalen Sample des Cepstrums hinzugefügt wird, das am gegenüberliegenden Punkt dieses negativen Zeitpunkts genommen wurde. Eine minimalphasische HRIR kann erstellt werden, indem jedes der nicht kausalen Samples des Cepstrums auf null gesetzt wird, nachdem der Phasenminimierungsvorgang für jedes der nicht kausalen Samples des Cepstrums durchgeführt wurde.The cepstrum of this HRIR may include causal samples taken at positive times rather than causal samples taken at negative times. Thus, for each of the non-causal samples of the cepstrum, a phase minimization process can be performed by adding that non-causal sample taken at a negative time to a causal sample of the cepstrum taken at the opposite point of that negative time. A minimum phase HRIR may be established by setting each of the non-causal samples of the cepstrum to zero after performing the phase minimization procedure for each of the non-causal samples of the cepstrum.

Exemplarische Ergebnisse der Annäherung der linken und rechten HRIRs für jeden Knoten um die 12. Ordnung (z. B. für rr = 12) werden in den Diagrammen dargestellt, die in den 1017 gezeigt werden.Exemplary results of the approximation of the left and right HRIRs for each 12th-order node (eg, for rr = 12) are shown in the diagrams appearing in the 10 - 17 to be shown.

1017 zeigen grafische Darstellungen, die Frequenzantworten von Subjekt 15 CIPIC [+/–45 Grad, +/–135 Grad], Fs = 44100 Hz, ursprüngliches FIR 200-Punkt, IIR-Annäherung 12. Ordnung, veranschaulichen. 10 - 17 Figure 15 shows plots illustrating frequency responses of subject 15 CIPIC [+/- 45 degrees, +/- 135 degrees], Fs = 44100 Hz, original FIR 200 point, IIR 12th order approximation.

Die in 1017 grafisch dargestellten Ergebnisse zeigen, dass die IIR-Annäherungen der 12. Ordnung sehr nahe Übereinstimmungen, sowohl in Magnitude als auch in Phase, mit den Frequenzantworten der ursprünglichen HRTFs ergeben. Dies bedeutet, dass, anstatt 8 × 200Pkt-FIRs zu implementieren, die HRIR-Berechnung als 8 × [{6 biquad}IIR-Sektionen + ITD-Verzögerungsstrecke] implementiert werden kann.In the 10 - 17 Graphically presented results show that the 12th order IIR approximations yield very close matches, both in magnitude and in phase, with the frequency responses of the original HRTFs. This means that instead of implementing 8x200 Pkt FIRs, the HRIR calculation can be implemented as 8x [{6 biquad} IIR sections + ITD delay line].

Mehrfacheingabe-Mehrfachausgabe-IIR-Annäherung unter Verwendung ausgeglichener RealisierungMultiple Input Multiple Output IIR Approach Using Balanced Realization

Gemäß mindestens einer Ausführungsform entspricht eine Mehrfacheingabe-Mehrfachausgabe(MIMO)-IIR-Annäherung unter Verwendung ausgeglichener Realisierung einem Prozess, der auf die gleiche Weise, wie die oben beschriebene SISO, eingeleitet werden kann. Der Prozess kann beispielsweise Folgendes beinhalten:

  • (i) Auslesen der HRIR(1/r, 1:200) für jeden Knoten.
  • (ii) Erhalten des minimalphasischen Äquivalents unter Verwendung eines Cepstrum, wie oben beschrieben, wodurch sich für jeden Knoten HHRIR(1/r, 1:200) ergibt.
  • (iii) Erstellen einer SISO-Zustandsraumdarstellung von jedem HHRIR(1/r, 1:200) als Sij: [Aij, Bij, Cij, Dij] für i = 1, 2 = links/rechts und j = 1, 2, 3, 4 = Knoten 1, 2, 3, 4. Jedes Sij entspricht einem 199-dimensionalen Zustandsraumsystem. Hier Aij ∈ R199×199, Bij ∈ R199×1, Cij ∈ R1×199, and Dij ∈ R1×1.
  • (iv) Erstellen ein zusammengesetztes MIMO-System mit einem internen Zustandsraum mit Abmessungen von beispielsweise 4 × 199 = 796 und mit 4 Eingängen und 2 Ausgängen. Dieses System S: [A, B, C, D], wobei A, B, C, D strukturiert ist als:
    Figure DE202017102729U1_0019
In accordance with at least one embodiment, multiple input multiple output (MIMO) IIR approximation using balanced implementation corresponds to a process that may be initiated in the same manner as the SISO described above. The process may include, for example:
  • (i) read the HRIR (1 / r, 1: 200) for each node.
  • (ii) Obtaining the minimum phase equivalent using a cepstrum as described above, resulting in HHRIR (1 / r, 1: 200) for each node.
  • (iii) constructing a SISO state space representation of each HHRIR (1 / r, 1: 200) as S ij : [A ij , B ij , C ij , D ij ] for i = 1, 2 = left / right and j = 1, 2, 3, 4 = nodes 1, 2, 3, 4. Each S ij corresponds to a 199-dimensional state space system. Here A ij ∈ R 199 × 199 , B ij ∈ R 199 × 1 , C ij ∈ R 1 × 199 , and D ij ∈ R 1 × 1 .
  • (iv) Create a composite MIMO system with an internal state space having dimensions of, for example, 4 x 199 = 796 and 4 inputs and 2 outputs. This system S: [A, B, C, D] where A, B, C, D is structured as:
    Figure DE202017102729U1_0019

Dieses 796-dimensionale System kann unter Verwendung des beschriebenen ausgeglichenen Reduktionsverfahrens gemäß einer oder mehreren Ausführungsformen der vorliegenden Offenbarung reduziert werden.This 796-dimensional system may be reduced using the described balanced reduction method according to one or more embodiments of the present disclosure.

Zumindest in der oben beschriebenen exemplarischen Ausführungsform wird jedes der Subsysteme Sij vor dem Erstellen von S auf ein SISO-System der 30. Ordnung reduziert. Dieser Schritt macht S zu einem System mit Abmessungen von 4 × 30 = 120. Dieses kann dann auf beispielsweise ein System mit n = 12, Eingängen 4. Ordnung und 2 Ausgängen, ähnlich dem in 6 veranschaulichten System, reduziert werden.At least in the exemplary embodiment described above, each of the subsystems S ij is reduced to a 30th order SISO system prior to creating S. This step makes S a system with dimensions of 4 x 30 = 120. This can then be applied to, for example, a system with n = 12, 4th order inputs and 2 outputs similar to those in 6 illustrated system to be reduced.

Wie nachstehend näher beschrieben, beschäftigen sich die Verfahren und Systeme der vorliegenden Offenbarung mit den rechnerischen Komplexitäten des binauralen Wiedergabeprozesses. Zum Beispiel beziehen sich eine oder mehrere Ausführungsformen der vorliegenden Offenbarung auf ein Verfahren und System zur Reduktion der Anzahl von arithmetischen Vorgängen, die nötig sind, um die 2M Filterfunktionen zu implementieren.As described in more detail below, the methods and systems of the present disclosure address the computational complexities of the binaural rendering process. For example, one or more embodiments of the present disclosure relate to a method and system for reducing the number of arithmetic operations needed to implement the 2M filtering functions.

Existierende binaurale Wiedergabesysteme beziehen HRTF-Filterfunktionen ein. Diese werden gewöhnlich unter Verwendung der endlichen Impulsantwort(FIR)-Filterstruktur implementiert, wobei einige Implementierungen die unendliche Impulsantwort(IIR)-Filterstruktur verwenden. Der FIR-Ansatz nutzt einen Filter der Länge n und benötigt n Multiplikations- und Additions-(MA)-Vorgänge für jede HRTF (z. B. 400), um ein Ausgabesample an jedes Ohr zu liefern. Das bedeutet, dass jede binaurale Ausgabe n × 2M MA-Vorgänge benötigt. Zum Beispiel kann in einem typischen binauralen Wiedergabesystem n = 400 verwendet werden. Der in der vorliegenden Offenbarung beschriebene IIR-Ansatz verwendet eine rekursive Struktur der Ordnung m, wobei m typischerweise in der Größenordnung von beispielsweise 12–25 (z. B. 15) liegt.Existing binaural rendering systems incorporate HRTF filter functions. These are usually implemented using the finite impulse response (FIR) filter structure, with some implementations using the infinite impulse response (IIR) filter structure. The FIR approach uses a filter of length n and requires n multiply and add (MA) operations for each HRTF (eg, 400) to provide an output sample to each ear. This means that every binaural output needs n × 2M MA operations. For example, in a typical binaural display system n = 400 may be used. The IIR approach described in the present disclosure uses a recursive structure of order m, where m is typically on the order of, for example, 12-25 (e.g., 15).

Es sollte beachtet werden, dass man, um die Rechenlast des IIR mit der des FIR zu vergleichen, Zähler und Nenner berücksichtigen müsste. Für 2M-SISO-IIR hätte jede Ordnung m fast 2m × 2M MA (d. h. es gäbe 1 Multiplikation weniger). Für eine MIMO-Struktur hätte man [(m – 1) × 2M + 2m]MA, wobei das {+2m} für die gemeinsamen rekursiven Sektionen steht. Natürlich ist m in MIMO größer als m in SISO.It should be noted that in order to compare the computational load of the IIR with that of the FIR, one would need to consider numerator and denominator. For 2M-SISO-IIR, every order m would be almost 2m × 2M MA (that is, there would be 1 multiplication less). For a MIMO structure one would have [(m - 1) × 2M + 2m] MA, where {+ 2m} stands for the common recursive sections. Of course, m in MIMO is greater than m in SISO.

Anders als bei bestehenden Ansätzen gibt es in den Verfahren und Systemen der vorliegenden Offenbarung rekursive Teile, die beispielsweise allen HRTFs des linken (beziehungsweise rechten) Ohrs oder anderen architektonischen Anordnungen, wie etwa allen HRTFs des ipsilateralen (beziehungsweise kontralateralen) Ohrs, gemeinsam sind.Unlike existing approaches, the methods and systems of the present disclosure have recursive parts that are common to, for example, all HRTFs of the left (or right) ear or other architectural devices, such as all HRTFs of the ipsilateral (or contralateral) ear.

Die Verfahren und Systeme der vorliegenden Offenbarung können von besonderer Bedeutung für die Wiedergabe von binauralen Audiodaten in Ambisonic-Audiosystemen sein. Das liegt daran, dass Ambisonic räumlichen Klang auf eine Weise liefert, die alle Lautsprecher im virtuellen Array aktiviert. Somit wächst die Bedeutung der Ersparnis von Rechenschritten durch die Anwendung der vorliegenden Techniken, solange M wachst.The methods and systems of the present disclosure may be of particular importance for the reproduction of binaural audio data in Ambisonic audio systems. That's because Ambisonic delivers spatial sound in a way that activates all speakers in the virtual array. Thus, the growing Importance of saving computational steps by applying the present techniques as long as M is growing.

Die abschließende binaurale M-Kanal-2-Kanal-Wiedergabe wird gewöhnlich unter Verwendung von m individuellen 1-to-2-Encodern vorgenommen, wobei jeder Encoder einem Paar von Außenohrübertragungsfunktionen (HRTFs) für das linke/rechte Ohr entspricht. Also entspricht die Systembeschreibung dem HRTF-Operator Y(z) = G(z)X(z) G(z) sich hier aus der Matrix ergebend

Figure DE202017102729U1_0020
The final M-channel 2-channel binaural playback is usually done using m individual 1-to-2 encoders, with each encoder corresponding to a pair of left / right ear external ear transmission functions (HRTFs). So the system description corresponds to the HRTF operator Y (z) = G (z) X (z) G (z) resulting from the matrix here
Figure DE202017102729U1_0020

Mit FIR-Filtern hat jedes Subsystem die folgende Form (mit den führenden kij-Koeffizienten gleich null im nicht minimalphasischen Fall {z. B. g ij / 0:g ij / k–1 = 0}): Gij(Z) = [g ij / 0 + g ij / 1z–1 + g ij / 2z–2 + ... + g ij / N–1zN–1] With FIR filters, each subsystem has the following form (with the leading k ij coefficients equal to zero in the non-minimal phasic case {Z. G ij / 0: g ij / k-1 = 0}): G ij (Z) = [g ij / 0 + g ij / 1 z-1 + g ij / 2 z-2 + ... + g ij / N-1z N-1 ]

Gemäß einer oder mehreren Ausführungsformen der vorliegenden Offenbarung kann eine Annäherung an G(z) erfolgen, durch ein MIMO-Zustandsraumsystem der n Ordnung S: [A ^, B ^, C ^, D ^]. Dadurch ergibt sich das exemplarische binaurale MIMO-Wiedergabe-(z. B. Mixer)-System, das in 7 veranschaulicht wird (welches gemäß zumindest einer Ausführungsform für 3D-Audio genutzt werden kann).In accordance with one or more embodiments of the present disclosure, an approximation to G (z) may be made by an n order MIMO state space system S: [A ^, B ^, C ^, D ^]. This results in the exemplary binaural MIMO rendering (eg mixer) system that is described in US Pat 7 (which may be used for 3D audio according to at least one embodiment).

In 7 entspricht das ITD-Subsystem einem Satz von Paaren von Verzögerungsstrecken, wobei, pro Eingabekanal, nur eines der Paare einer Verzögerung und das andere einer Einheit entspricht. Deshalb gibt es in der Z-Domäne eine Eingabe-/Ausgabe-Darstellung, wie etwa

Figure DE202017102729U1_0021
In 7 For example, the ITD subsystem corresponds to a set of pairs of delay lines, where, per input channel, only one of the pairs corresponds to one delay and the other corresponds to one unit. Therefore, there is an input / output representation in the Z domain, such as
Figure DE202017102729U1_0021

Jedes Paar (δ1k, δ2k) hat die Form (α, β) wobei α = 0, wenn das linke Ohr ipsilateral zur Quelle ist, und umgekehrt β > 0 der ITD-Verzögerung entspricht, wenn das rechte Ohr ipsilateral ist.Each pair (δ 1k , δ 2k ) has the form (α, β) where α = 0, when the left ear is ipsilateral to the source, and conversely, β> 0 corresponds to the ITD delay when the right ear is ipsilateral.

Das M-Eingaben-2-Ausgaben-MIMO-System S: [A ^, B ^, C ^, D ^], das unter Verwendung des ausgeglichenen Reduktionsverfahrens auf Ordnung n reduziert wurde, kann verwendet werden, um einen HRTF-Satz zu erhalten, der geschrieben werden kann als G ^(z) = {C ^[zI – A ^]–1B ^ + D ^}·Δ(z) The M Input 2 Output MIMO System S: [A ^, B ^, C ^, D ^], which has been reduced to order n using the balanced reduction method can be used to obtain a HRTF set that can be written as G ^ (z) = {C ^ [zI - A ^] -1 B ^ + D ^} · Δ (z)

Hier bezeichnet das '.' das Hadamard-Produkt. Diese Übertragungsfunktionen-Matrix unterscheidet sich vom oben genannten G(z), weil nun jedes Subsystem den gleichen Nenner hat. Die Subsysteme sind die IIR-Form der HRTF zum linken/rechten Ohr [i = 1 ≡ links i = 2 ≡ rechts] vom virtuellen Lautsprecher j und haben die Form

Figure DE202017102729U1_0022
Here the '.' the Hadamard product. This transfer function matrix is different from the above G (z) because each subsystem now has the same denominator. The subsystems are the IIR form of the HRTF to the left / right ear [i = 1 ≡ left i = 2 ≡ right] from the virtual speaker j and have the shape
Figure DE202017102729U1_0022

Deswegen kann, wenn der Ansatz der ausgeglichenen Reduktion zu MIMO (wie oben beschrieben) verwendet wird, um die ursprünglichen N-Punkt-FIR-HRFTs einer n-Ordnung {e. g., n = N/10} anzunähern, die binaurale Wiedergabe als das in 8 veranschaulichte System implementiert werden.Therefore, if the balanced reduction approach to MIMO (as described above) is used to approximate the original n-point FIR HRFTs of an n-order {eg, n = N / 10}, the binaural rendering may be the one in 8th illustrated system can be implemented.

Es ist zu beachten, dass gemäß mindestens einer Ausführungsform die abschließende IIR-Sektion, wie in 8 dargestellt, mit Raum-Effekt-Filterung kombiniert werden kann.It should be noted that according to at least one embodiment, the final IIR section, as in FIG 8th shown, can be combined with space effect filtering.

Zusätzlich ist zu beachten, dass diese Faktorisierung in individuelle winkelabhängige FIR-Sektionen in Kaskade mit einer geteilten IIR-Sektion mit experimentellen Forschungsergebnissen im Einklang steht. Diese Experimente haben gezeigt, wie HRIRs für angenäherte Faktorisierung empfänglich sind. In addition, it should be noted that this factorization into individual angle-dependent FIR sections in cascade is consistent with a shared IIR section with experimental research results. These experiments have shown how HRIRs are susceptible to approximate factorization.

9 zeigt ein High-Level-Blockdiagramm eines exemplarischen Computergeräts (900), das für binaurale Wiedergabe ausgelegt ist, indem die Anzahl arithmetischer Vorgänge, die nötig sind, um die (z. B. 2M) Filterfunktionen gemäß einer oder mehreren hierin beschriebenen Ausführungsformen zu implementieren, reduziert wird. In einer sehr grundlegenden Konfiguration (901) beinhaltet das Computergerät (900) in der Regel einen oder mehrere Prozessoren (910) und Systemspeicher (920). Ein Speicherbus (930) kann für die Datenübertragung zwischen dem Prozessor (910) und dem Systemspeicher (920) verwendet werden. 9 shows a high level block diagram of an exemplary computing device ( 900 ), which is designed for binaural reproduction, by reducing the number of arithmetic operations necessary to implement the (eg 2M) filtering functions according to one or more embodiments described herein. In a very basic configuration ( 901 ) contains the computer device ( 900 ) usually one or more processors ( 910 ) and system memory ( 920 ). A memory bus ( 930 ) can be used for data transfer between the processor ( 910 ) and the system memory ( 920 ) be used.

Je nach gewünschter Konfiguration kann jede Art von Prozessor (910) verwendet werden, darunter auch ein Mikroprozessor (μP), ein Mikrocontroller (μC), ein digitaler Signalprozessor (DSP) oder Ähnliches oder eine Kombination derselben. Der Prozessor (910) kann ein- oder mehrstufiges Zwischenspeichern, zum Beispiel einen Zwischenspeicher der Stufe eins (911) und einen der Stufe zwei (912), einen Prozessorkern (913), sowie Register (914) beinhalten. Der Prozessorkern (913) kann eine arithmetisch-logische Einheit („Arithmetic Logic Unit – ALU”), einen Gleitkommaprozessor („Floating Point Unit – FPU”), einen digitalen Signalverarbeitungskern („Digital Signal Processing Core – DSP Core”) oder Ähnliches oder eine beliebige Kombination derselben beinhalten. Ein Speichercontroller (915) kann ebenfalls mit dem Prozessor (910) verwendet werden bzw. kann in einigen Implementierungen der Speichercontroller (915) einen integralen Teil des Prozessors (910) bilden.Depending on the desired configuration, any type of processor ( 910 ), including a microprocessor (μP), a microcontroller (μC), a digital signal processor (DSP) or the like or a combination thereof. The processor ( 910 ) can be single or multi-level caching, for example, a level one cache ( 911 ) and one of the stage two ( 912 ), a processor core ( 913 ), as well as registers ( 914 ). The processor core ( 913 ) may include an arithmetic logic unit (ALU), a floating point unit (FPU), a digital signal processing core (DSP Core), or the like, or any combination thereof include. A memory controller ( 915 ) can also be used with the processor ( 910 ) may be used in some implementations of the memory controller ( 915 ) an integral part of the processor ( 910 ) form.

Je nach gewünschter Konfiguration kann es sich bei dem Systemspeicher (920) um jegliche Art handeln, darunter auch um flüchtigen Speicher (wie z. B. RAM), nicht flüchtigen Speicher (wie z. B. ROM, Flash-Speicher usw.) oder eine Kombination derselben. Ein Systemspeicher (920) beinhaltet typischerweise ein Betriebssystem (921), eine oder mehrere Anwendungen (922) und Programmdaten (924). Die Anwendung (922) kann ein System zur binauralen Wiedergabe (923) beinhalten. Gemäß zumindest einer Ausführungsform der vorliegenden Offenbarung ist das System zur binauralen Wiedergabe (923) dafür entworfen, die rechnerischen Komplexitäten des binauralen Wiedergabeprozesses zu reduzieren. Zum Beispiel ist das System zur binauralen Wiedergabe (923) dazu in der Lage, die Anzahl von arithmetischen Vorgängen zu reduzieren, die nötig sind, um die oben beschriebenen 2M Filterfunktionen zu implementieren.Depending on the desired configuration, the system memory ( 920 ) may be of any kind, including volatile memory (such as RAM), nonvolatile memory (such as ROM, flash memory, etc.) or a combination thereof. A system memory ( 920 ) typically includes an operating system ( 921 ), one or more applications ( 922 ) and program data ( 924 ). The application ( 922 ), a system for binaural reproduction ( 923 ). According to at least one embodiment of the present disclosure, the system for binaural reproduction ( 923 ) designed to reduce the computational complexity of the binaural rendering process. For example, the system for binaural playback ( 923 ) are able to reduce the number of arithmetic operations needed to implement the 2M filtering functions described above.

Programmdaten (924) können gespeicherte Anweisungen beinhalten, die, wenn sie von der einen oder mehreren Verarbeitungsgeräten ausgeführt werden, ein System (923) und Verfahren zur binauralen Wiedergabe implementieren. Zusätzlich und gemäß mindestens einer Ausführungsform können Programmdaten (924) Audiodaten (925) beinhalten, die beispielsweise Mehrkanal-Audiosignaldaten von einem oder mehreren virtuellen Lautsprechern betreffen können. Gemäß zumindest einigen Ausführungsformen kann die Anwendung (922) dazu ausgelegt sein, mit Programmdaten (924) auf einem Betriebssystem (921) zu arbeiten.Program data ( 924 ) may contain stored instructions which, when executed by the one or more processing devices, comprise a system ( 923 ) and methods for binaural reproduction. Additionally and in accordance with at least one embodiment, program data ( 924 ) Audio data ( 925 ), which may, for example, relate to multi-channel audio signal data from one or more virtual speakers. According to at least some embodiments, the application ( 922 ) be designed with program data ( 924 ) on an operating system ( 921 ) to work.

Das Rechengerät (900) kann über zusätzliche Eigenschaften oder Funktionalitäten, sowie zusätzliche Schnittstellen verfügen, um Kommunikationen zwischen der Grundkonfiguration (901) und allen erforderlichen Geräten und Schnittstellen zu erleichtern.The computing device ( 900 ) may have additional features or functionalities, as well as additional interfaces to facilitate communications between the basic configuration ( 901 ) and all necessary equipment and interfaces.

Ein Systemspeicher (920) ist ein Beispiel für Computer-Speichermedien. Computerspeichermedien beinhalten, sind jedoch nicht beschränkt auf, RAM, ROM, EEPROM, Flash-Speicher oder andere Speichertechnologie, CD-ROM, Digital Versatile Discs (DVD) oder andere optische Speicher, Magnetkassetten und Magnetbänder, Magnetplattenspeicher oder andere magnetische Speichergeräte oder ein beliebiges anderes Medium, das dazu verwendet werden kann, die gewünschte Information zu speichern, und auf die von dem Rechengerät 900 zugegriffen werden kann. Jedes dieser Computer-Speichermedien kann ein Teil des Geräts (900) bilden.A system memory ( 920 ) is an example of computer storage media. Computer storage media includes, but is not limited to, RAM, ROM, EEPROM, flash memory or other storage technology, CD-ROM, Digital Versatile Discs (DVD) or other optical storage, magnetic cassettes and tapes, magnetic disk storage or other magnetic storage devices or any other Medium which can be used to store the desired information and that of the computing device 900 can be accessed. Each of these computer storage media may be part of the device ( 900 ) form.

Computergerät (900) kann als kleinformatiges, tragbares (oder mobiles) elektronisches Gerät, wie etwa ein Mobiltelefon, ein Smartphone, ein Personal Data Assistant (PDA), ein Personal-Media-Player-Gerät, ein Tablet-Computer (Tablet), ein drahtloses Web-Watch-Gerät, ein Personal-Headset-Device, ein anwendungsspezifisches Gerät oder ein Hybridgerät, das eine der oben erwähnten Funktionen beinhaltet, implementiert werden. Zusätzlich kann das Computergerät (900) auch als Personal-Computer, darunter auch sowohl als Laptop-Computer- und Nicht-Laptop-Computer-Konfiguration, als ein oder mehrere Server, Internet-of-Things-Systeme und dergleichen, implementiert sein.Computer device ( 900 ) can be used as a small, portable (or mobile) electronic device such as a mobile phone, a smartphone, a personal data assistant (PDA), a personal media player device, a tablet computer (tablet), a wireless web Watch device, a personal headset device, an application-specific device or a hybrid device, which includes one of the above-mentioned functions to be implemented. In addition, the computer device ( 900 ) may also be implemented as a personal computer, including as both a laptop computer and non-laptop computer configuration, as one or more servers, Internet of Things systems, and the like.

18 veranschaulicht ein exemplarisches Verfahren 1800 zur Durchführung der binauralen Wiedergabe. Verfahren 1800 kann von Software-Konstrukten durchgeführt werden, die in Verbindung mit 9 beschrieben werden, die im Speicher 920 des Computergeräts 900 residieren und von Prozessor 910 ausgeführt werden. 18 illustrates an exemplary method 1800 to carry out the binaural reproduction. method 1800 can be done by software constructs that are related to 9 be described in the memory 920 of the computer device 900 reside and processor 910 be executed.

Bei 1802 erhält das Computergerät 900 jede aus der Vielzahl von HRIRs, die mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern und einem Ohr des menschlichen Hörers assoziiert ist. Jede aus der Vielzahl von HRIRs beinhaltet Samples eines Klangfelds, die bei einer spezifischen Samplingrate in einem linken oder rechten Ohr erzeugt werden, die in Reaktion auf einen Audioimpuls erzeugt wird, der von diesem virtuellen Lautsprecher erzeugt wird.at 1802 receives the computer device 900 each of the plurality of HRIRs associated with a virtual speaker of the plurality of virtual speakers and an ear of the human listener. Each of the plurality of HRIRs includes samples of a sound field generated at a specific sampling rate in a left or right ear generated in response to an audio pulse generated by this virtual speaker.

Bei 1804 erstellt das Computergerät 900 eine erste Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs. Die erste Zustandsraumdarstellung beinhaltet eine Matrix, einen Spaltenvektor und einen Zeilenvektor. Sowohl die Matrix als auch der Spaltenvektor und der Zeilenvektor der ersten Zustandsraumdarstellung weisen eine erste Größe auf.at 1804 creates the computer device 900 a first state space representation of each of the plurality of HRIRs. The first state space representation includes a matrix, a column vector, and a row vector. Both the matrix and the column vector and the row vector of the first state space representation have a first size.

Bei 1806 führt das Computergerät 900 einen Zustandsraum-Reduktionsvorgang durch, um eine zweite Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs zu erzeugen. Die zweite Zustandsraumdarstellung beinhaltet eine Matrix, einen Spaltenvektor und einen Zeilenvektor. Sowohl die Matrix als auch der Spaltenvektor und der Zeilenvektor der zweiten Zustandsraumdarstellung weisen eine zweite Größe auf, die geringer als die erste Größe ist.at 1806 leads the computer device 900 a state space reduction process to generate a second state space representation of each of the plurality of HRIRs. The second state space representation includes a matrix, a column vector, and a row vector. Both the matrix and the column vector and the row vector of the second state space representation have a second size less than the first size.

Bei 1808 erzeugt das Computergerät 900 eine Vielzahl von Außenohrübertragungsfunktionen (HRTFs), basierend auf der zweiten Zustandsraumdarstellung. Jede aus der Vielzahl von HRTFs entspricht einer jeweiligen HRIR aus der Vielzahl von HRIRs. Eine HRTF, die einer jeweiligen HRIR entspricht, erzeugt, sobald sie mit einem Frequenzbereich-Klangfeld multipliziert wird, das durch den virtuellen Lautsprecher erzeugt wird, mit dem die entsprechende HRIR assoziiert ist, eine Komponente eines Klangfelds, das in einem Ohr des menschlichen Hörers wiedergegeben wird.at 1808 creates the computer device 900 a plurality of outer ear transfer functions (HRTFs) based on the second state space representation. Each of the plurality of HRTFs corresponds to a respective HRIR of the plurality of HRIRs. An HRTF corresponding to a respective HRIR, when multiplied by a frequency domain sound field generated by the virtual speaker to which the corresponding HRIR is associated, generates a component of a sound field reproduced in an ear of the human listener becomes.

Die vorangegangene ausführliche Beschreibung legt verschiedene Ausführungsformen der Geräte und/oder Prozesse über die Verwendung von Blockdiagrammen, Ablaufdiagrammen und/oder Beispielen dar. Sofern diese Blockdiagramme, Ablaufdiagramme und/oder Beispiele eine oder mehrere Funktionen und/oder Vorgänge enthalten, ist es für Fachleute auf dem Gebiet ersichtlich, dass jede Funktion und/oder jeder Vorgang innerhalb derselben Blockdiagramme, Ablaufdiagramme oder Beispiele, einzeln und/oder zusammen, durch eine breite Palette an Hardware, Software, Firmware oder praktisch jeder möglicher Kombination derselben, implementiert werden kann. Gemäß mindestens einer Ausführungsform können mehrere Teile des betreffenden Gegenstands, der hierin beschrieben wird, über anwendungsspezifische integrierte Schaltkreise („Application Specific Integrated Circuits – ASICs”), feldprogrammierbare integrierte Schaltkreise („Field Programmable Gate Array – FPGAs”), digitale Signalprozessoren („Digital Signal Processors – DSPs”) oder andere integrierte Formate implementiert werden. Dennoch werden Fachleute auf dem Gebiet feststellen, dass einige Aspekte der hier dargelegten Ausführungen, teilweise oder gänzlich, ebenso in integrierten Schaltkreisen, als ein oder mehrere Computerprogramme implementiert werden können, die auf einem oder mehreren Computer als ein oder mehrere Programme ausgeführt werden, die auf einem oder mehreren Prozessoren als Firmware oder irgend eine Kombination derselben ausgeführt werden; und dass ein Entwurf der Schaltkreise und/oder das Schreiben des Codes für die Software und/oder Firmware hinsichtlich der vorliegenden Offenbarung für Fachleute auf dem Gebiet durchaus im Bereich des Möglichen ist.The foregoing detailed description sets forth various embodiments of the devices and / or processes through the use of block diagrams, flowcharts, and / or examples. If these block diagrams, flowcharts, and / or examples include one or more functions and / or operations, those skilled in the art will appreciate It will be appreciated by those in the art that any function and / or operation within the same block diagrams, flowcharts, or examples, individually and / or collectively, may be implemented by a wide range of hardware, software, firmware, or virtually any combination thereof. In accordance with at least one embodiment, several portions of the subject matter described herein may be implemented via application specific integrated circuits (ASICs), field programmable gate arrays (FPGAs), digital signal processors (Digital Signal Processors - DSPs ") or other integrated formats. Nevertheless, those skilled in the art will recognize that some aspects of the embodiments set forth herein may be implemented, in whole or in part, also in integrated circuits, as one or more computer programs executing on one or more computers as one or more programs one or more processors are executed as firmware or any combination thereof; and that designing the circuitry and / or writing the code for the software and / or firmware with respect to the present disclosure is well within the purview of those skilled in the art.

Darüber hinaus werden Fachleute erkennen, dass die Mechanismen des hierin beschriebenen Gegenstands in der Lage sind, als ein Programmprodukt in einer Vielzahl von Formen verbreitet zu werden, und dass eine anschauliche Ausführungsform des hierin beschriebenen Gegenstands, unabhängig von dem speziellen Typ des nicht transitorischen signaltragenden Mediums, das verwendet wird, um die Verbreitung durchzuführen, anwendbar ist. Beispiele für nicht transitorische Signal-tragende Medien beinhalten unter anderem: einen beschreibbaren Medientyp, wie z. B. eine Diskette, eine Festplatte, eine CD, eine DVD, ein digitales Tonband, einen Computerspeicher usw. und einen transitorischen Medientyp, wie z. B. digitale und/oder analoge Kommunikationsmedien (wie z. B. ein Glasfaserkabel, einen Wellenleiter, eine drahtgebundene Kommunikations-Kabelverbindung, eine drahtlose Kommunikationsverbindung usw.).Moreover, those skilled in the art will recognize that the mechanisms of the subject matter described herein are capable of being propagated as a program product in a variety of forms, and that an illustrative embodiment of the subject matter described herein, independent of the particular type of non-transitory signal bearing medium used to perform the dissemination is applicable. Examples of non-transitory signal carrying media include, but are not limited to, a writable type of media, such as: As a floppy disk, a hard disk, a CD, a DVD, a digital tape, a computer memory, etc., and a transitory type of media such. Digital and / or analog communication media (such as a fiber optic cable, a waveguide, a wired communication cable connection, a wireless communication connection, etc.).

Was die Verwendung von im Wesentlichen allen Mehrzahl- und/oder Einzahlbegriffen hierin betrifft, können die Fachleute auf dem Gebiet je nach Kontext und/oder Anwendung die Mehrzahlform in die Einzahlform und umgekehrt abändern. Die verschiedenen Einzahl-/Mehrzahl-Permutationen können zur Verdeutlichung ausdrücklich hierin dargelegt sein.As for the use of substantially all plural and / or singular terms herein, those skilled in the art may change the plural form to the singular form and vice versa, depending on the context and / or application. The various singular / plural permutations may be expressly set forth herein for clarity.

Dementsprechend wurden bestimmte Ausführungsformen des Gegenstands beschrieben. Weitere Ausführungsformen liegen innerhalb des Schutzumfangs der folgenden Patentansprüche. So können in einigen Fällen die in den Ansprüchen angegebenen Aktionen in einer anderen Reihenfolge durchgeführt werden und dennoch erwünschte Ergebnisse erzielen. Darüber hinaus erfordern beispielsweise die in den beigefügten Figuren dargestellten Prozesse nicht unbedingt die dargestellte spezielle Reihenfolge oder fortlaufende Reihenfolge, um erwünschte Ergebnisse zu erzielen. Unter bestimmten Umständen können Multitasking und Parallelverarbeitung von Vorteil sein.Accordingly, certain embodiments of the subject matter have been described. Other embodiments are within the scope of the following claims. Thus, in some cases, the actions indicated in the claims may be performed in a different order and still achieve desirable results. Moreover, for example, the processes illustrated in the attached figures do not necessarily require the particular order or sequence shown to achieve desired results. Under certain circumstances, multitasking and parallel processing can be beneficial.

Claims (20)

Elektronische Vorrichtung, die dafür konfiguriert ist, Klangfelder in einem linken und einem rechten Ohr eines menschlichen Hörers wiederzugeben, wobei die Klangfelder von einer Vielzahl von virtuellen Lautsprechern erzeugt werden, wobei die elektronische Vorrichtung Folgendes umfasst: Speicher; und mit dem Speicher verbundene Steuerschaltungen, wobei die Steuerschaltungen für Folgendes konfiguriert sind: Erhalten, durch Prozessorschaltungen eines Klangwiedergabe-Computers, der dafür konfiguriert ist, die Klangfelder im linken und im rechten Ohr des Kopfes des menschlichen Hörers wiederzugeben, einer Vielzahl von Außenohr-Impulsantworten (HRIRs), wobei jede aus der Vielzahl von HRIRs mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern und einem Ohr des menschlichen Hörers assoziiert ist, wobei jede aus der Vielzahl von HRIRs Samples eines Klangfelds beinhaltet, die bei einer spezifischen Samplingrate in einem linken oder rechten Ohr erzeugt werden, die in Reaktion auf einen Audioimpuls erzeugt wird, der von diesem virtuellen Lautsprecher erzeugt wird; Erstellen einer ersten Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs, wobei die erste Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der ersten Zustandsraumdarstellung eine erste Größe aufweisen; Durchführen eines Zustandsraum-Reduktionsvorgangs, um eine zweite Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs zu erzeugen, wobei die zweite Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der zweiten Zustandsraumdarstellung eine zweite Größe aufweisen, die geringer als eine erste Größe ist; und Erzeugen einer Vielzahl von Außenohrübertragungsfunktionen (HRTFs), basierend auf der zweiten Zustandsraumdarstellung, wobei jede aus der Vielzahl von HRTFs einer jeweiligen HRIR aus der Vielzahl von HRIRs entspricht, wobei eine HRTF einer jeweiligen HRIR entspricht, die, sobald sie mit einem Frequenzbereich-Klangfeld multipliziert wird, das durch den virtuellen Lautsprecher erzeugt wird, mit dem die entsprechende HRIR assoziiert ist, eine Komponente eines Klangfelds erzeugt, das in einem Ohr des menschlichen Hörers wiedergegeben wird.An electronic device configured to reproduce sound fields in a left and a right ear of a human listener, the sound fields being generated by a plurality of virtual speakers, the electronic device comprising: Storage; and control circuits connected to the memory, wherein the control circuits are configured for: Obtained by processor circuits of a sound reproduction computer configured to reproduce the sound fields in the left and right ears of the head of the human listener, a plurality of outer ear impulse responses (HRIRs), each of the plurality of HRIRs having a virtual speaker is associated with the plurality of virtual speakers and an ear of the human listener, each of the plurality of HRIRs including samples of a sound field generated at a specific sampling rate in a left or right ear generated in response to an audio pulse; which is generated by this virtual speaker; Creating a first state space representation of each of the plurality of HRIRs, wherein the first state space representation includes a matrix, a column vector, and a row vector, wherein both the matrix and the column vector and the row vector of the first state space representation have a first size; Performing a state space reduction operation to generate a second state space representation of each of the plurality of HRIRs, the second state space representation including a matrix, a column vector, and a row vector, wherein both the matrix and the column vector and the row vector of the second state space representation are a second one Having a size smaller than a first size; and Generating a plurality of outer ear transmission functions (HRTFs) based on the second state space representation, wherein each of the plurality of HRTFs corresponds to a respective HRIR of the plurality of HRIRs, where HRTF corresponds to a respective HRIR that multiplies as multiplied by a frequency domain sound field generated by the virtual speaker to which the corresponding HRIR is associated generates a component of a sound field that is reproduced in an ear of the human listener. Elektronische Vorrichtung nach Anspruch 1, wobei das Durchführen des Zustandsraum-Reduktionsvorgangs für jede HRIR aus der Vielzahl von HRIRs Folgendes beinhaltet: Erstellen einer jeweiligen Gram'schen Matrix basierend auf der ersten Zustandsraumdarstellung dieser HRIR, wobei die Gram'sche Matrix eine Vielzahl von Eigenwerten aufweist, die in absteigender Reihenfolge angeordnet sind; und Erstellen der zweiten Zustandsraumdarstellung dieser HRIR basierend auf der Gram'schen Matrix und der Vielzahl von Eigenwerten, wobei die zweite Größe gleich einer Anzahl von Eigenwerten aus der Vielzahl von Eigenwerten ist, die größer als ein spezifischer Schwellenwert sind.The electronic device of claim 1, wherein performing the state space reduction operation for each HRIR of the plurality of HRIRs includes: Constructing a respective Gram matrix based on the first state space representation of this HRIR, the Gram matrix having a plurality of eigenvalues arranged in descending order; and Creating the second state space representation of this HRIR based on the Gram matrix and the plurality of eigenvalues, the second size being equal to a number of eigenvalues of the plurality of eigenvalues greater than a specific threshold. Elektronische Vorrichtung nach Anspruch 2, wobei das Erstellen der zweiten Zustandsraumdarstellung jeder HRIR aus der Vielzahl von HRIRs das Bilden einer Transformations-Matrix beinhaltet, die, wenn sie auf die Gram'sche Matrix angewendet wird, die auf der ersten Zustandsraumdarstellung dieser HRIR basiert, eine diagonale Matrix erzeugt, wobei jedes diagonale Element gleich einem jeweiligen Eigenwert aus der Vielzahl von Eigenwerten ist.The electronic device of claim 2, wherein constructing the second state space representation of each HRIR of the plurality of HRIRs includes forming a transformation matrix that, when applied to the Gram matrix based on the first state space representation of that HRIR generates diagonal matrix, each diagonal element being equal to a respective eigenvalue of the plurality of eigenvalues. Elektronische Vorrichtung nach Anspruch 1, wobei die Steuerschaltungen für jede aus der Vielzahl von HRIRs des Weiteren für Folgendeskonfiguriert sind: Erstellen eines Cepstrums dieser HRIR, wobei das Cepstrum kausale Samples, die zu positiven Zeitpunkten genommen wurden, und nicht kausale Samples, die zu negativen Zeitpunkten genommen wurden, aufweist; Durchführen eines Phasenminimierungsvorgangs für jedes der nicht kausalen Samples des Cepstrums, indem dieses nicht kausale Sample, das zu einem negativen Zeitpunkt genommen wurde, zu einem kausalen Sample des Cepstrums, das am gegenüberliegenden Punkt dieses negativen Zeitpunkts genommen wurde, addiert wird; und Erzeugen einer minimalphasischen HRIR durch das Setzen jedes der nicht kausalen Samples des Cepstrums auf null nach der Durchführung des Phasenminimierungsvorgangs für jedes der nicht kausalen Samples des Cepstrums.The electronic device of claim 1, wherein the control circuits for each of the plurality of HRIRs are further configured for: Creating a cepstrum of this HRIR, the cepstrum having causal samples taken at positive times and non-causal samples taken at negative times; Performing a phase minimization process for each of the non-causal samples of the cepstrum by adding that non-causal sample taken at a negative time to a causal sample of the cepstrum taken at the opposite point of that negative time; and generating a minimum phase HRIR by setting each of the non-causal samples of the cepstrum to zero after performing the phase minimization process for each of the non-causal samples of the cepstrum. Elektronische Vorrichtung nach Anspruch 1, wobei des Weiteren das Erstellen einer Mehrfacheingang/Mehrfachausgang(MIMO)-Zustandsraumdarstellung umfasst, wobei die MIMO-Zustandsraumdarstellung eine zusammengesetzte Matrix, eine Spaltenvektor-Matrix und eine Zeilenvektor-Matrix beinhaltet, wobei die zusammengesetzte Matrix der MIMO-Zustandsraumdarstellung die Matrix der ersten Darstellung jeder aus der Vielzahl von HRIRs beinhaltet, die Spaltenvektor-Matrix der MIMO-Zustandsraumdarstellung den Spaltenvektor der ersten Darstellung jeder aus der Vielzahl von HRIRs beinhaltet und die Zeilenvektor-Matrix der MIMO-Zustandsraumdarstellung den Zeilenvektor der ersten Darstellung jeder aus der Vielzahl von HRIRs beinhaltet; und wobei das Durchführen des Zustandsraum-Reduktionsvorgangs das Erstellen einer reduzierten zusammengesetzten Matrix, einer reduzierten Spaltenvektor-Matrix und einer reduzierten Zeilenvektor-Matrix beinhaltet, wobei sowohl die reduzierte zusammengesetzte Matrix als auch die reduzierte Spaltenvektor-Matrix und die reduzierte Zeilenvektor-Matrix eine Größe aufweisen, die jeweils geringer als eine Größe der zusammengesetzten Matrix, der Spaltenvektor-Matrix und der Zeilenvektor-Matrix ist.The electronic device of claim 1, further comprising establishing a multiple input / multiple output (MIMO) state space representation, wherein the MIMO state space representation includes a composite matrix, a column vector matrix, and a row vector matrix, wherein the composite matrix is the MIMO state space representation the matrix of the first representation of each of the plurality of HRIRs, the column vector matrix of the MIMO state space representation includes the column vector of the first representation of each of the plurality of HRIRs, and the row vector matrix of the MIMO state space representation the row vector of the first representation of each of Variety of HRIRs; and wherein performing the state space reduction operation includes creating a reduced composite matrix, a reduced column vector matrix, and a reduced row vector matrix, wherein both the reduced composite matrix and the reduced column vector matrix and the reduced row vector matrix have a size, each less than a size of the composite matrix, the column vector matrix and the row vector matrix. Elektronische Vorrichtung nach Anspruch 5, wobei das Erstellen der MIMO-Zustandsraumdarstellung Folgendes beinhaltet: Bilden einer ersten Blockmatrix als zusammengesetzte Matrix der MIMO-Zustandsraumdarstellung, die eine Matrix der ersten Zustandsraumdarstellung einer mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern assoziierten HRIR als diagonales Element der ersten Blockmatrix aufweist, wobei Matrizen der ersten Zustandsraumdarstellung von HRIRs, die mit demselben virtuellen Lautsprecher assoziiert sind in angrenzenden diagonalen Elementen der ersten Blockmatrix liegen; Bilden einer zweiten Blockmatrix als Spaltenvektor-Matrix der MIMO-Zustandsraumdarstellung, die einen Spaltenvektor der ersten Zustandsraumdarstellung einer mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern assoziierten HRIR als diagonales Element der zweiten Blockmatrix aufweist, wobei Spaltenvektoren der ersten Zustandsraumdarstellung von HRIRs, die mit demselben virtuellen Lautsprecher assoziiert sind, in angrenzenden diagonalen Elementen der zweiten Blockmatrix liegen; und Bilden einer dritten Blockmatrix als Zeilenvektor-Matrix der MIMO-Zustandsraumdarstellung, die einen Zeilenvektor der ersten Zustandsraumdarstellung einer mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern assoziierten HRIR als Element der dritten Blockmatrix aufweist, wobei Zeilenvektoren der ersten Zustandsraumdarstellung von HRIRs die Klänge im linken Ohr wiedergeben, in ungeraden Elementen der ersten Zeile der dritten Blockmatrix liegen und Zeilenvektoren der ersten Zustandsraumdarstellung von HRIRs, die Klänge im rechten Ohr wiedergeben, in geraden Elementen der zweiten Zeile der dritten Blockmatrix liegen.The electronic device of claim 5, wherein creating the MIMO state space representation includes: Forming a first block matrix as a composite matrix of the MIMO state space representation comprising a matrix of the first state space representation of an HRIR associated with a virtual speaker of the plurality of virtual speakers as a diagonal element of the first block matrix, matrices of the first state space representation of HRIRs associated therewith virtual speakers are located in adjacent diagonal elements of the first block matrix; Forming a second block matrix as a column vector matrix of the MIMO state space representation comprising a column vector of the first state space representation of an HRIR associated with a virtual loudspeaker of the plurality of virtual loudspeakers as a diagonal element of the second block matrix, wherein column vectors of the first state space representation of HRIRs associated with the same virtual speaker are in adjacent diagonal elements of the second block matrix; and Forming a third block matrix as a row vector matrix of the MIMO state space representation comprising a row vector of the first state space representation of an HRIR associated with a virtual speaker of the plurality of virtual speakers as an element of the third block matrix, wherein row vectors of the first state space representation of HRIRs represent the sounds in the left Ear, are in odd elements of the first row of the third block matrix, and row vectors of the first state space representation of HRIRs representing sounds in the right ear are in even elements of the second row of the third block matrix. Elektronische Vorrichtung nach Anspruch 5, wobei des Weiteren die Durchführung vor dem Erstellen der MIMO-Zustandsraumdarstellung, eines Einzeleingabe-Einzelausgabe(SISO)-Zustandsraum-Reduktionsvorgangs für jede HRIR aus der Vielzahl von HRIRs umfasst, um eine SISO-Zustandsraumdarstellung dieser HRIR als die erste Zustandsraumdarstellung dieser HRIR zu erzeugen.The electronic device of claim 5, further comprising performing, prior to creating the MIMO state space representation, a single input single issue (SISO) state space reduction process for each HRIR of the plurality of HRIRs, a SISO state space representation of that HRIR as the first one State space representation of this HRIR. Elektronische Vorrichtung nach Anspruch 1, wobei es für jeden aus der Vielzahl von virtuellen Lautsprechern eine linke HRIR und eine rechte HRIR aus der Vielzahl von HRIRs gibt, die mit diesem virtuellen Lautsprecher assoziiert sind, wobei die linke HRIR, wenn sie mit dem von diesem virtuellen Lautsprecher erzeugten Frequenzbereich-Klangfeld multipliziert wird, die Komponente des Klangfelds erzeugt, die im linken Ohr des menschlichen Hörers wiedergegeben wird, und die rechte HRIR, wenn sie mit dem von diesem virtuellen Lautsprecher erzeugten Frequenzbereich-Klangfeld multipliziert wird, die Komponente des Klangfelds erzeugt, die im rechten Ohr des menschlichen Hörers wiedergegeben wird; und wobei es für jeden aus der Vielzahl von virtuellen Lautsprechern eine interaurale Zeitverzögerung (ITD) zwischen der linken HRIR, die mit diesem virtuellen Lautsprecher assoziiert ist, und der rechten HRIR, die mit diesem virtuellen Lautsprecher assoziiert ist gibt, wobei die ITD sich in der linken und der rechten HRIR durch eine Differenz zwischen einer Anzahl von ursprünglichen Samples des Klangfelds der linken HRIR, die Nullwerte aufweisen, und einer Anzahl von ursprünglichen Samples des Klangfelds der rechten HRIR, die Nullwerte aufweisen, manifestiert.The electronic device of claim 1, wherein for each of the plurality of virtual speakers there is a left HRIR and a right HRIR of the plurality of HRIRs associated with that virtual speaker, the left HRIR being equal to that of the virtual one Multiplied loudspeaker generated frequency domain sound field, which generates component of the sound field reproduced in the left ear of the human listener, and the right HRIR, when multiplied by the frequency domain sound field generated by this virtual speaker, generates the component of the sound field, which is reproduced in the right ear of the human listener; and wherein there is an interaural time delay (ITD) between the left HRIR associated with this virtual speaker and the right HRIR associated with that virtual speaker for each of the plurality of virtual speakers, the ITD being in the left and right HRIR by a difference between a number of original samples of the sound field of the left HRIR having zero values and a number of original samples of the sound field of the right HRIR having zero values. Elektronische Vorrichtung nach Anspruch 8, wobei die Steuerschaltungen des Weiteren für Folgendes konfiguriert sind: Erstellen einer ITD-Einheit-Subsystem-Matrix basierend auf der ITD zwischen der linken HRIR und der rechten HRIR, die mit jedem aus der Vielzahl von virtuellen Lautsprechern assoziiert sind; und Multiplizieren der Vielzahl von HRTFs mit der ITD-Einheit-Subsystem-Matrix, um eine Vielzahl von verzögerten HRTFs zu erzeugen.The electronic device of claim 8, wherein the control circuits are further configured to: Creating an ITD unit subsystem matrix based on the ITD between the left HRIR and the right HRIR associated with each of the plurality of virtual speakers; and Multiplying the plurality of HRTFs by the ITD unit subsystem matrix to generate a plurality of delayed HRTFs. Elektronische Vorrichtung nach Anspruch 1, wobei jede aus der Vielzahl von HRTFs durch Filter mit endlicher Impulsantwort (FIRs) dargestellt wird; und wobei die Steuerschaltungen des des Weiteren für die Durchführung eines Umwandlungsvorgangs auf jeder aus der Vielzahl von HRTFs konfiguriert sind, um eine weitere Vielzahl von HRTFs zu erzeugen. die jeweils durch Filter mit unendlicher Impulsantwort (IIRs) dargestellt werden.An electronic device according to claim 1, wherein each of said plurality of HRTFs is represented by Finite Impulse Response (FIR) filters; and wherein the control circuits are further configured to perform a conversion operation on each of the plurality of HRTFs to generate a further plurality of HRTFs. each represented by Infinite Impulse Response (IIRs) filters. Ein Computerprogrammprodukt, das ein nicht flüchtiges Speichermedium umfasst, wobei das Computerprogrammprodukt Code beinhaltet, der, wenn er von einer Prozessorschaltung eines Klangwiedergabe-Computers ausgeführt wird, der dafür konfiguriert ist, Klangfelder in einem linken und einem rechten Ohr eines menschlichen Hörers wiederzugeben, die Prozessorschaltung dazu veranlasst, ein Verfahren durchzuführen, wobei das Verfahren Folgendes umfasst: Erhalten einer Vielzahl von Außenohr-Impulsantworten (HRIRs), wobei jede aus der Vielzahl von HRIRs mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern und einem Ohr des menschlichen Hörers assoziiert ist, wobei jede aus der Vielzahl von HRIRs Samples eines Klangfelds beinhaltet, die bei einer spezifischen Samplingrate in einem linken oder rechten Ohr erzeugt werden, die in Reaktion auf einen Audioimpuls erzeugt wird, der von diesem virtuellen Lautsprecher erzeugt wird; Erstellen einer ersten Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs, wobei die erste Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der ersten Zustandsraumdarstellung eine erste Größe aufweisen; Durchführen eines Zustandsraum-Reduktionsvorgangs, um eine zweite Zustandsraumdarstellung jeder aus der Vielzahl von HRIRs zu erzeugen, wobei die zweite Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der zweiten Zustandsraumdarstellung eine zweite Größe aufweisen, die geringer ist als die erste Größe; und Erzeugen einer Vielzahl von Außenohrübertragungsfunktionen (HRTFs) basierend auf der zweiten Zustandsraumdarstellung, wobei jede aus der Vielzahl von HRTFs einer jeweiligen HRIR aus der Vielzahl von HRIRs entspricht, wobei eine HRTF, die einer jeweiligen HRIR entspricht, sobald sie mit einem Frequenzbereich-Klangfeld multipliziert wird, das durch den virtuellen Lautsprecher erzeugt wird, mit dem die entsprechende HRIR assoziiert ist, eine Komponente eines Klangfelds erzeugt, das in einem Ohr des menschlichen Hörers wiedergegeben wird.A computer program product comprising a non-transitory storage medium, the computer program product including code that, when executed by a processor circuit of a sound reproduction computer configured to reproduce sound fields in a left and a right ear of a human listener, the processor circuit caused to perform a method, the method comprising: Obtaining a plurality of outer ear impulse responses (HRIRs), wherein each of the plurality of HRIRs is associated with a virtual speaker of the plurality of virtual speakers and an ear of the human listener, each of the plurality of HRIRs including samples of a sound field at a specific sampling rate in a left or right ear generated in response to an audio pulse generated by this virtual speaker; Creating a first state space representation of each of the plurality of HRIRs, wherein the first state space representation includes a matrix, a column vector, and a row vector, wherein both the matrix and the column vector and the row vector of the first state space representation have a first size; Performing a state space reduction operation to generate a second state space representation of each of the plurality of HRIRs, the second state space representation including a matrix, a column vector, and a row vector, wherein both the matrix and the column vector and the row vector of the second state space representation are a second one Having a size less than the first size; and Generating a plurality of outer ear transfer functions (HRTFs) based on the second state space representation, wherein each of the plurality of HRTFs corresponds to a respective HRIR of the plurality of HRIRs, wherein an HRTF corresponding to a respective HRIR as multiplied by a frequency domain sound field generated by the virtual speaker to which the corresponding HRIR is associated generates a component of a sound field reproduced in an ear of the human listener. Computerprogrammprodukt nach Anspruch 11, wobei das Durchführen des Zustandsraum-Reduktionsvorgangs für jede HRIR aus der Vielzahl von HRIRs Folgendes beinhaltet: Erstellen einer jeweiligen Gram'schen Matrix basierend auf der ersten Zustandsraumdarstellung dieser HRIR, wobei die Gram'sche Matrix eine Vielzahl von Eigenwerten aufweist, die in absteigender Größenordnung angeordnet sind; und Erstellen der zweiten Zustandsraumdarstellung dieser HRIR basierend auf der Gram'sche Matrix und der Vielzahl von Eigenwerten, wobei die zweite Größe gleich einer Anzahl von Eigenwerten aus der Vielzahl von Eigenwerten ist, die größer als ein spezifischer Schwellenwert sind.The computer program product of claim 11, wherein performing the state space reduction operation for each HRIR of the plurality of HRIRs includes: Constructing a respective Gram matrix based on the first state space representation of said HRIR, said Gram matrix having a plurality of eigenvalues arranged in descending order; and Creating the second state space representation of this HRIR based on the Gram matrix and the plurality of eigenvalues, the second size being equal to a number of eigenvalues of the plurality of eigenvalues greater than a specific threshold. Computerprogrammprodukt nach Anspruch 12, wobei das Erstellen der zweiten Zustandsraumdarstellung jeder HRIR aus der Vielzahl von HRIRs die Bildung einer Transformationsmatrix beinhaltet, die, wenn sie auf die Gram'sche Matrix angewendet wird, die auf der ersten Zustandsraumdarstellung dieser HRIR basiert, eine diagonale Matrix erzeugt, wobei jedes diagonale Element der diagonalen Matrix einem jeweiligen Eigenwert aus der Vielzahl von Eigenwerten entspricht.The computer program product of claim 12, wherein constructing the second state space representation of each HRIR of the plurality of HRIRs includes forming a transformation matrix that, when applied to the Gram matrix based on the first state space representation of that HRIR, generates a diagonal matrix wherein each diagonal element of the diagonal matrix corresponds to a respective eigenvalue of the plurality of eigenvalues. Computerprogrammprodukt nach Anspruch 11, wobei das Verfahren des Weiteren für jede aus der Vielzahl von HRIRs Folgendes umfasst: Erstellen eines Cepstrums für diese HRIR, wobei das Cepstrum kausale Samples, die zu positiven Zeitpunkten genommen wurden, und nicht kausale Samples, die zu negativen Zeitpunkten genommen wurden, aufweist; Durchführung eines Phasenminimierungsvorgangs für jedes der nicht kausalen Samples des Cepstrums, indem dieses nicht kausale Sample, das zu einem negativen Zeitpunkt genommen wurde, zu einem kausalen Sample des Cepstrums addiert wird, das am gegenüberliegenden Punkt dieses negativen Zeitpunkts genommen wurde; und Erzeugen einer minimalphasischen HRIR, indem jedes der nicht kausalen Samples des Cepstrums nach dem Durchführen des Phasenminimierungsvorgangs für jedes der nicht kausalen Samples des Cepstrums auf null gesetzt wird.The computer program product of claim 11, wherein the method further comprises for each of the plurality of HRIRs: Creating a cepstrum for this HRIR, the cepstrum having causal samples taken at positive times and non-causal samples taken at negative times; Performing a phase minimization procedure for each of the non-causal samples of the cepstrum by adding that non-causal sample taken at a negative time to a causal sample of the cepstrum taken at the opposite point of that negative time; and generating a minimum phase HRIR by zeroing each of the non-causal samples of the cepstrum after performing the phase minimization operation for each of the non-causal samples of the cepstrum. Computerprogramm nach Anspruch 1, wobei das Verfahren des Weiteren das Erstellen einer Mehrfacheingang/Mehrfachausgang(MIMO)-Zustandsraumdarstellung umfasst, wobei die MIMO-Zustandsraumdarstellung eine zusammengesetzte Matrix, eine Spaltenvektor-Matrix und eine Zeilenvektor-Matrix beinhaltet, wobei die zusammengesetzte Matrix der MIMO-Zustandsraumdarstellung die Matrix der ersten Darstellung jeder der vielen HRIRs beinhaltet, die Spaltenvektor Matrix der MIMO-Zustandsraumdarstellung den Spaltenvektor der ersten Darstellung jeder der vielen HRIRs beinhaltet, und die Zeilenvektor-Matrix der MIMO-Zustandsraumdarstellung den Zeilenvektor der ersten Darstellung jeder der vielen HRIRs beinhaltet; und wobei das Durchfahren des Zustandsraum-Reduktionsvorgangs das Erstellen einer reduzierten zusammengesetzten Matrix, einer reduzierten Spaltenvektor-Matrix und einer reduzierten Zeilenvektor-Matrix beinhaltet, wobei sowohl die reduzierte zusammengesetzte Matrix als auch die reduzierte Spaltenvektor-Matrix, sowie die reduzierte Zeilenvektor-Matrix eine Größe aufweisen, die jeweils geringer als eine Größe der zusammengesetzten Matrix, der Spaltenvektor-Matrix und der Zeilenvektor-Matrix ist.The computer program of claim 1, wherein the method further comprises constructing a multiple input / multiple output (MIMO) state space representation, wherein the MIMO state space representation includes a composite matrix, a column vector matrix, and a row vector matrix, wherein the composite matrix is the MIMO state space representation. State space representation includes the matrix of the first representation of each of the many HRIRs, the column vector matrix of the MIMO state space representation includes the column vector of the first representation of each of the many HRIRs, and the row vector matrix of the MIMO state space representation includes the row vector of the first representation of each of the many HRIRs; and wherein traversing the state space reduction process includes creating a reduced composite matrix, a reduced column vector matrix and a reduced row vector matrix, wherein both the reduced composite matrix and the reduced column vector matrix and the reduced row vector matrix size each smaller than a size of the composite matrix, the column vector matrix and the row vector matrix. Computerprogrammprodukt nach Anspruch 15, wobei das Erstellen der MIMO-Zustandsraumdarstellung Folgendes beinhaltet: Bilden einer ersten Blockmatrix als zusammengesetzte Matrix der MIMO-Zustandsraumdarstellung, die eine Matrix der ersten Zustandsraumdarstellung einer HRIR aufweist, die mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern als diagonales Element der ersten Blockmatrix assoziiert ist, wobei Matrizen der ersten Zustandsraumdarstellung von HRIRs, die mit demselben virtuellen Lautsprecher assoziiert sind, in angrenzenden diagonalen Elementen der ersten Blockmatrix liegen. Bilden einer zweiten Blockmatrix als Spaltenvektor-Matrix der MIMO-Zustandsraumdarstellung, die einen Spaltenvektor der ersten Zustandsraumdarstellung einer HRIR aufweist, die mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern als diagonales Element der zweiten Blockmatrix assoziiert ist, wobei Spaltenvektoren der ersten Zustandsraumdarstellung von HRIRs, die mit demselben virtuellen Lautsprecher assoziiert sind, in angrenzenden diagonalen Elementen der zweiten Blockmatrix liegen; und Bilden einer dritten Blockmatrix als Zeilenvektoren-Matrix der MIMO-Zustandsraumdarstellung, die einen Zeilenvektor der ersten Zustandsraumdarstellung einer HRIR aufweist, die mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern als Element der dritten Blockmatrix assoziiert ist, wobei Zeilenvektoren der ersten Zustandsraumdarstellung von HRIRs, die Klänge im linken Ohr wiedergeben, in ungeraden Elementen der ersten Zeile der dritten Blockmatrix liegen und Zeilenvektoren der ersten Zustandsraumdarstellung von HRIRs, die Klänge im rechten Ohr wiedergeben, in geraden Elementen der zweiten Zeile der dritten Blockmatrix liegen.The computer program product of claim 15, wherein creating the MIMO state space representation includes: Forming a first block matrix as a composite matrix of the MIMO state space representation comprising a matrix of the first state space representation of an HRIR associated with a virtual speaker of the plurality of virtual speakers as a diagonal element of the first block matrix, wherein matrices of the first state space representation of HRIRs, which are associated with the same virtual speaker, are located in adjacent diagonal elements of the first block matrix. Forming a second block matrix as a column vector matrix of the MIMO state space representation having a column vector of the first state space representation of an HRIR associated with a virtual speaker of the plurality of virtual speakers as a diagonal element of the second block matrix, where column vectors are the first state space representation of HRIRs that are associated with the same virtual speaker, are in adjacent diagonal elements of the second block matrix; and Forming a third block matrix as a row vector matrix of the MIMO state space representation comprising a row vector of the first state space representation of an HRIR associated with a virtual speaker of the plurality of virtual speakers as an element of the third block matrix, wherein row vectors of the first state space representation of HRIRs, represent the sounds in the left ear, are in odd elements of the first row of the third block matrix, and row vectors of the first state space representation of HRIRs that represent sounds in the right ear are in even elements of the second row of the third block matrix. Computerprogrammprodukt nach Anspruch 11, wobei es für jeden aus der Vielzahl von virtuellen Lautsprechern eine linke und eine rechte HRIR aus der Vielzahl von HRIRs gibt, die mit diesem virtuellen Lautsprecher assoziiert sind, wobei die linke HRIR, wenn sie mit dem von diesem virtuellen Lautsprecher erzeugten Frequenzbereich-Klangfeld multipliziert wird, die Komponente des Klangfelds erzeugt, das im linken Ohr des menschlichen Hörers wiedergegeben wird, und die rechte HRIR, wenn sie mit dem von diesem virtuellen Lautsprecher erzeugten Frequenzbereich-Klangfeld multipliziert wird, die Komponente des Klangfelds erzeugt, das im rechten Ohr des menschlichen Hörers wiedergegeben wird; und wobei es für jeden aus der Vielzahl von virtuellen Lautsprechern eine interaurale Zeitverzögerung (ITD) zwischen der linken HRIR, die mit diesem virtuellen Lautsprecher assoziiert ist, und der rechten HRIR, die mit diesem virtuellen Lautsprecher assoziiert ist, gibt, wobei die ITD sich in der linken und der rechten HRIR durch eine Differenz zwischen einer Anzahl von ursprünglichen Samples des Klangfelds der linken HRIR, die Nullwerte aufweisen, und einer Anzahl von ursprünglichen Samples des Klangfelds der rechten HRIR, die Nullwerte aufweisen, manifestiert.The computer program product of claim 11, wherein for each of the plurality of virtual speakers, there are left and right HRIRs of the plurality of HRIRs associated with that virtual speaker, the left HRIRs when generated with the one from the virtual speaker Is multiplied by the frequency domain sound field that produces the component of the sound field reproduced in the left ear of the human listener, and the right HRIR, when multiplied by the frequency domain sound field generated by that virtual speaker, produces the component of the sound field that is produced in the sound field right ear of the human listener is reproduced; and wherein there is an interaural time delay (ITD) between the left HRIR associated with this virtual speaker and the right HRIR associated with that virtual speaker for each of the plurality of virtual speakers, the ITD being in the left and right HRIR are manifested by a difference between a number of original samples of the sound field of the left HRIR having zero values and a number of original samples of the sound field of the right HRIR having zero values. Computerprogrammprodukt nach Anspruch 17, wobei das Verfahren des Weiteren Folgendes umfasst: Erstellen einer ITD-Einheit-Subsystem-Matrix basierend auf der ITD zwischen der linken und der rechten HRIR, die mit jedem aus der Vielzahl von virtuellen Lautsprechern assoziiert sind: und Multiplizieren der Vielzahl von HRTFs mit der ITD-Einheit-Subsystem-Matrix, um eine Vielzahl von verzögerten HRTFs zu erzeugen.The computer program product of claim 17, the method further comprising: constructing an ITD unit subsystem matrix based on the ITD between the left and right HRIR associated with each of the plurality of virtual speakers: and Multiplying the plurality of HRTFs by the ITD unit subsystem matrix to generate a plurality of delayed HRTFs. Computerprogrammprodukt nach Anspruch 11, wobei jede aus der Vielzahl von HRTFs durch Filter mit endlicher Impulsantwort (FIRs) dargestellt wird; und wobei das Verfahren des Weiteren das Durchführen eines Umwandlungsvorgangs auf jede aus der Vielzahl von HRTFs umfasst, um eine weitere Vielzahl von HRTFs zu erzeugen, die jeweils durch Filter mit unendlicher Impulsantwort (IIRs) dargestellt werden.The computer program product of claim 11, wherein each of said plurality of HRTFs is represented by finite impulse response (FIR) filters; and wherein the method further comprises performing a conversion operation on each of the plurality of HRTFs to generate a further plurality of HRTFs, each represented by Infinite Impulse Response (IIRs) filters. Elektronische Vorrichtung, die dafür konfiguriert ist, Klangfelder in einem linken und einem rechten Ohr eines menschlichen Hörers wiederzugeben, wobei die elektronische Vorrichtung Folgendes umfasst: Speicher; und mit dem Speicher verbundene Steuerschaltungen, wobei die Steuerschaltungen für Folgendes konfiguriert sind: Erhalten einer Vielzahl von Außenohr-Impulsantworten (HRIRs), wobei jede aus der Vielzahl von HRIRs mit einem virtuellen Lautsprecher aus der Vielzahl von virtuellen Lautsprechern und einem Ohr des menschlichen Hörers assoziiert ist, wobei jede aus der Vielzahl von HRIRs Samples eines Klangfelds beinhaltet, die bei einer spezifischen Samplerate in einem linken oder rechten Ohr, die in Reaktion auf einen Audioimpuls erzeugt werden, der von diesem virtuellen Lautsprecher erzeugt wird; Erstellen einer ersten Zustandsraumdarstellung von jeder aus der Vielzahl von HRIRs, wobei die erste Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der ersten Zustandsraumdarstellung eine erste Größe aufweisen; Durchführen eines Zustandsraum-Reduktionsvorgangs, um eine zweite Zustandsraumdarstellung von jeder aus der Vielzahl von HRIRs zu erzeugen, wobei die zweite Zustandsraumdarstellung eine Matrix, einen Spaltenvektor und einen Zeilenvektor beinhaltet, wobei sowohl die Matrix als auch der Spaltenvektor, sowie der Zeilenvektor der zweiten Zustandsraumdarstellung eine zweite Größe aufweisen, die geringer ist als die erste Größe; und Erzeugen einer Vielzahl von Außenohrübertragungsfunktionen (HRTFs) basierend auf der zweiten Zustandsraumdarstellung, wobei jede aus der Vielzahl von HRTFs einer jeweiligen HRIR aus der Vielzahl von HRIRs entspricht, wobei eine HRTF, die einer jeweiligen HRIR entspricht, sobald sie mit einem Frequenzbereich-Klangfeld multipliziert wird, das durch den virtuellen Lautsprecher erzeugt wird, mit dem die entsprechende HRIR assoziiert ist, eine Komponente eines Klangfelds erzeugt, das in einem Ohr des menschlichen Hörers wiedergegeben wird.An electronic device configured to reproduce sound fields in a left and a right ear of a human listener, the electronic device comprising: Storage; and control circuits connected to the memory, wherein the control circuits are configured for: Obtaining a plurality of outer ear impulse responses (HRIRs), wherein each of the plurality of HRIRs is associated with a virtual speaker of the plurality of virtual speakers and an ear of the human listener, each of the plurality of HRIRs including samples of a sound field at a specific sample rate in a left or right ear, generated in response to an audio pulse generated by that virtual speaker; Creating a first state space representation of each of the plurality of HRIRs, the first state space representation including a matrix, a column vector, and a row vector, wherein both the matrix and the column vector and the row vector of the first state space representation have a first size; Performing a state space reduction operation to generate a second state space representation of each of the plurality of HRIRs, the second state space representation including a matrix, a column vector, and a row vector, wherein both the matrix and the column vector, and the row vector of the second state space representation second size smaller than the first size; and Generating a plurality of outer ear transfer functions (HRTFs) based on the second state space representation, wherein each of the plurality of HRTFs corresponds to a respective HRIR of the plurality of HRIRs, wherein an HRTF corresponding to a respective HRIR as multiplied by a frequency domain sound field generated by the virtual speaker to which the corresponding HRIR is associated generates a component of a sound field reproduced in an ear of the human listener.
DE202017102729.5U 2016-02-18 2017-02-16 Signal processing systems for reproducing audio data on virtual speaker arrays Active DE202017102729U1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662296934P 2016-02-18 2016-02-18
US62/296,934 2016-02-18

Publications (1)

Publication Number Publication Date
DE202017102729U1 true DE202017102729U1 (en) 2017-06-27

Family

ID=59328114

Family Applications (2)

Application Number Title Priority Date Filing Date
DE202017102729.5U Active DE202017102729U1 (en) 2016-02-18 2017-02-16 Signal processing systems for reproducing audio data on virtual speaker arrays
DE102017103134.0A Active DE102017103134B4 (en) 2016-02-18 2017-02-16 Signal processing methods and systems for playing back audio data on virtual loudspeaker arrays

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE102017103134.0A Active DE102017103134B4 (en) 2016-02-18 2017-02-16 Signal processing methods and systems for playing back audio data on virtual loudspeaker arrays

Country Status (2)

Country Link
CN (1) CN107094277B (en)
DE (2) DE202017102729U1 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11172318B2 (en) 2017-10-30 2021-11-09 Dolby Laboratories Licensing Corporation Virtual rendering of object based audio over an arbitrary set of loudspeakers
US10609504B2 (en) * 2017-12-21 2020-03-31 Gaudi Audio Lab, Inc. Audio signal processing method and apparatus for binaural rendering using phase response characteristics
US10390171B2 (en) * 2018-01-07 2019-08-20 Creative Technology Ltd Method for generating customized spatial audio with head tracking
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
CN108831494B (en) * 2018-05-29 2022-07-19 平安科技(深圳)有限公司 Voice enhancement method and device, computer equipment and storage medium
JP2022504233A (en) * 2018-10-05 2022-01-13 マジック リープ, インコーポレイテッド Interaural time difference crossfader for binaural audio rendering
CN111445914B (en) * 2020-03-23 2023-10-17 全景声科技南京有限公司 Processing method and device for detachable and re-editable audio signals
CN113747335A (en) * 2020-05-29 2021-12-03 华为技术有限公司 Audio rendering method and device
CN113362805B (en) * 2021-06-18 2022-06-21 四川启睿克科技有限公司 Chinese and English speech synthesis method and device with controllable tone and accent

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0419346D0 (en) * 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation
US8467552B2 (en) 2004-09-17 2013-06-18 Lsi Corporation Asymmetric HRTF/ITD storage for 3D sound positioning
US7634092B2 (en) * 2004-10-14 2009-12-15 Dolby Laboratories Licensing Corporation Head related transfer functions for panned stereo audio content
KR100606734B1 (en) 2005-02-04 2006-08-01 엘지전자 주식회사 Method and apparatus for implementing 3-dimensional virtual sound
FR2899423A1 (en) * 2006-03-28 2007-10-05 France Telecom Three-dimensional audio scene binauralization/transauralization method for e.g. audio headset, involves filtering sub band signal by applying gain and delay on signal to generate equalized and delayed component from each of encoded channels
CN104408040B (en) * 2014-09-26 2018-01-09 大连理工大学 Head correlation function three-dimensional data compression method and system

Also Published As

Publication number Publication date
CN107094277B (en) 2019-02-05
CN107094277A (en) 2017-08-25
DE102017103134B4 (en) 2022-05-05
DE102017103134A1 (en) 2017-08-24

Similar Documents

Publication Publication Date Title
DE102017103134B4 (en) Signal processing methods and systems for playing back audio data on virtual loudspeaker arrays
US10142755B2 (en) Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
EP2189010B1 (en) Apparatus and method for determining a component signal with great accuracy
EP3117631A1 (en) Apparatus and method for processing a signal in the frequency domain
DE69726262T2 (en) SOUND RECORDING AND PLAYBACK SYSTEMS
DE69925905T2 (en) BLIND SEPARATION OF SOURCES THROUGH FOLDING WITH THE AID OF A DIVERSE DECORRELATION PROCEDURE
EP2656633B1 (en) Device and method for calculating speaker signals for a plurality of speakers using a delay in the frequency domain
DE102012017296B4 (en) Generation of multichannel sound from stereo audio signals
DE2749015A1 (en) QUADROPHONIC SOUND SOURCE
EP3061271B1 (en) Wave field synthesis system
CH703771A2 (en) Device and method for the temporal evaluation and optimization of stereophonic or pseudostereophonic signals.
DE3142157C2 (en)
EP2466864B1 (en) Transparent decorrelation of the loudspeaker signals of multi-channel echo compensators
DE102017102988B4 (en) Method and device for processing a digital audio signal for binaural reproduction
DE2728325A1 (en) MULTI-CHANNEL SOUND REPRODUCTION SYSTEMS
Weiss et al. Performance analysis of the Gaussian quasi-maximum likelihood approach for independent vector analysis
WO2015128376A1 (en) Autonomous residual determination and yield of low-residual additional signals
EP2485504A1 (en) Generation of quiet areas within the listener zone of multi-channel playback systems
DE112019004193T5 (en) AUDIO PLAYBACK DEVICE, AUDIO PLAYBACK METHOD AND AUDIO PLAYBACK PROGRAM
DE102023209048A1 (en) METHOD AND SYSTEM FOR SHIPPING VOLUME ADJUSTMENTS OF AUDIO COMPONENTS
CH708710A1 (en) Deriving multi-channel signals from two or more base signals.
Kim Authentic reproduction of stereo sound-a wiener filter approach
Blochberger Signal decorrelation for diffuse sound fields
DE102016125886A1 (en) Device for efficient calculation of auralization
Lueck Modeling of the head-related transfer functions for reduced computation and storage

Legal Events

Date Code Title Description
R207 Utility model specification
R081 Change of applicant/patentee

Owner name: GOOGLE LLC (N.D.GES.D. STAATES DELAWARE), MOUN, US

Free format text: FORMER OWNER: GOOGLE INC., MOUNTAIN VIEW, CALIF., US

R082 Change of representative

Representative=s name: BETTEN & RESCH PATENT- UND RECHTSANWAELTE PART, DE

R150 Utility model maintained after payment of first maintenance fee after three years
R151 Utility model maintained after payment of second maintenance fee after six years