DE102013223201B3 - Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes - Google Patents

Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes Download PDF

Info

Publication number
DE102013223201B3
DE102013223201B3 DE201310223201 DE102013223201A DE102013223201B3 DE 102013223201 B3 DE102013223201 B3 DE 102013223201B3 DE 201310223201 DE201310223201 DE 201310223201 DE 102013223201 A DE102013223201 A DE 102013223201A DE 102013223201 B3 DE102013223201 B3 DE 102013223201B3
Authority
DE
Germany
Prior art keywords
harmonic components
order
sound field
field data
harmonic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE201310223201
Other languages
English (en)
Inventor
Johannes Nowak
Christoph Sladeczek
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Technische Universitaet Ilmenau
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Technische Universitaet Ilmenau
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Technische Universitaet Ilmenau filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to DE201310223201 priority Critical patent/DE102013223201B3/de
Priority to JP2016530874A priority patent/JP6329629B2/ja
Priority to CN201480061929.3A priority patent/CN105766002B/zh
Priority to PCT/EP2014/073808 priority patent/WO2015071148A1/de
Priority to EP14793183.6A priority patent/EP3069530B1/de
Application granted granted Critical
Publication of DE102013223201B3 publication Critical patent/DE102013223201B3/de
Priority to US15/154,189 priority patent/US20160255452A1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

Eine Vorrichtung zum Komprimieren von Schallfelddaten (10) eines Gebiets, umfasst einen Aufteiler (100) zum Aufteilen der Schallfelddaten in einen ersten Anteil (101) und in einen zweiten Anteil (102), und einen Umsetzer (140, 180) zum Umsetzen des ersten Anteils (101) und des zweiten Anteils (102) in harmonische Komponenten (141, 182), wobei der Umsetzer (140, 180) ausgebildet ist, um den zweiten Anteil (102) in eine oder mehrere harmonische Komponenten (141) mit einer zweiten Ordnung umzusetzen, und um den ersten Anteil (101) in harmonische Komponenten mit einer ersten Ordnung umzusetzen, wobei die erste Ordnung höher als die zweite Ordnung ist, um die komprimierten Schallfelddaten zu erhalten.

Description

  • Die vorliegende Erfindung bezieht sich auf die Audiotechnik und insbesondere auf die Komprimierung von räumlichen Schallfelddaten.
  • Die akustische Beschreibung von Räumen ist von hohem Interesse zur Ansteuerung von Wiedergabeanordnungen in Form z. B. eines Kopfhörers, einer Lautsprecheranordnung mit z. B. zwei bis zu einer mittleren Anzahl von Lautsprechern, wie beispielsweise 10 Lautsprechern oder auch für Lautsprecheranordnungen mit einer großen Anzahl von Lautsprechern, wie sie bei der Wellenfeldsynthese (WFS) zum Einsatz kommen.
  • Für die räumliche Audiocodierung allgemein existieren verschiedene Ansätze. Ein Ansatz besteht z. B. darin, verschiedene Kanäle für verschiedene Lautsprecher an vordefinierten Lautsprecherpositionen zu erzeugen, wie es beispielsweise bei MPEG-Surround der Fall ist. Dadurch erhält ein Hörer, der in dem Wiedergaberaum an einer bestimmten und optimalerweise der mittleren Position angeordnet ist, ein Raumgefühl für das wiedergegebene Schallfeld.
  • Eine alternative Raumbeschreibung besteht darin, einen Raum durch seine Impulsantwort zu beschreiben. Wird beispielsweise eine Schallquelle irgendwo in einem Raum oder Gebiet positioniert, so kann dieser Raum bzw. dieses Gebiet mit einem Kreisarray von Mikrofonen im Falle eines zweidimensionalen Gebiets oder mit einem Kugel-Mikrofon-Array im Falle eines dreidimensionalen Gebiets ausgemessen werden. Wenn beispielsweise ein Kugel-Mikrofon-Array mit einer hohen Anzahl von Mikrofonen betrachtet wird, wie beispielsweise 350 Mikrofonen, so wird eine Vermessung des Raumes folgendermaßen vonstatten gehen. An einer bestimmten Position innerhalb oder außerhalb des Mikrofon-Arrays wird ein Impuls erzeugt. Daraufhin wird von jedem Mikrofon die Antwort auf diesen Impuls, also die Impulsantwort gemessen. Abhängig davon, wie stark die Nachhalleigenschaften sind, wird dann eine längere oder kürzere Impulsantwort gemessen. So haben – bezüglich der Größenordnung – Messungen in großen Kirchen beispielsweise ergeben, dass Impulsantworten über 10 s dauern können.
  • Ein solcher Satz von z. B. 350 Impulsantworten beschreibt damit die Schallcharakteristik dieses Raumes für die spezielle Position einer Schallquelle, an der der Impuls erzeugt worden ist. Mit anderen Worten ausgedrückt stellt dieser Satz von Impulsantworten Schallfelddaten des Gebiets dar, und zwar für genau den einen Fall, bei dem eine Quelle an der Position positioniert ist, an der der Impuls erzeugt worden ist. Um den Raum weiter zu vermessen, also um die Schalleigenschaften des Raumes zu erfassen, wenn eine Quelle an einem anderen Raum positioniert wird, muss die dargestellte Prozedur für jede weitere Position z. B. außerhalb des Arrays (aber auch innerhalb des Arrays) wiederholt werden. Würde man daher z. B. einen Konzertsaal schallfeldmäßig erfassen, wenn z. B. ein Musiker-Quartett spielt, bei dem die einzelnen Musiker an vier verschiedenen Positionen angeordnet sind, so werden bei dem genannten Beispiel für jede der vier Positionen 350 Impulsantworten gemessen, und diese 4 × 350 = 1400 Impulsantworten stellen dann die Schallfelddaten des Gebiets dar.
  • Da die zeitliche Länge der Impulsantworten durchaus beträchtliche Werte annehmen kann, und da womöglich noch eine detailliertere Darstellung der Schalleigenschaften des Raumes im Hinblick auf nicht nur vier sondern noch mehr Positionen gewünscht sein kann, ergibt sich eine riesige Menge an Impulsantwort-Daten, insbesondere wenn berücksichtigt wird, dass die Impulsantworten durchaus Längen über 10 s annehmen können.
  • Ansätze für räumliches Audiocoding ist z. B. spatial audio coding (SAC) [1] bzw. spatial audio object coding (SAOC) [2], die eine Bitraten-effiziente Kodierung von Mehrkanal-Audiosignalen bzw. objektbasierten räumlichen Audioszenen ermöglichen. Das spatial impulse resonse rendering (SIRR) [3] und die Weiterentwicklung directional audio coding (DirAc) [4] sind parametrische Kodierverfahren und basieren auf einer zeitabhängigen Schalleinfallsrichtungsschätzung (direction of arrival – DOA), sowie einer Schätzung der Diffusität innerhalb von Frequenzbändern. Hier wird eine Trennung zwischen nicht-diffusem und diffusem Schallfeld vorgenommen. In [5] wird die verlustfreie Kompression von Kugelmikrofonarraydaten und die Kodierung von Higher-Order-Ambisonics-Signalen behandelt. Die Kompression wird durch Ausnutzen redundanter Daten zwischen den Kanälen (interchannel redundancy) erreicht.
  • Untersuchungen in [6] zeigen eine getrennte Betrachtung von frühem und spätem Schallfeld bei der binauralen Wiedergabe. Für dynamische Systeme, in denen Kopfbewegungen berücksichtigt werden wird die Filterlänge optimiert indem nur das frühe Schallfeld in Echtzeit gefaltet wird. Für das späte Schallfeld reicht lediglich ein Filter für alle Richtungen, ohne dabei die wahrgenommene Qualität zu reduzieren. In [7] werden kopfbezogene Übertragungsfunktionen (HRTF) auf einer Kugel im sphärischen harmonischen Bereich dargestellt. Der Einfluss verschiedener Genauigkeiten mittels unterschiedlicher Ordnungen sphärischer Harmonischer auf die Interaurale Kreuzkorrelation und die Raum-Zeit-Korrelation (spatio-temporal correlation) wird analytisch untersucht. Dies geschieht in Oktavbändern im diffusen Schallfeld.
    • [1] Herre, J et al (2004) Spatial Audio Coding: Next-generation efficient and compatible coding of multi-channel audio AES Convention Paper 6186 presented at the 117th Convention, San Francisco, USA
    • [2] Engdegard, J et al (2008) Spatial Audio Object Coding (SAOC) – The Upcoming MPEG Standard on Parametric Object Based Audio Coding, AES Convention Paper 7377 presented at the 125th Convention, Amsterdam, Netherlands
    • [3] Merimaa J and Pulkki V (2003) Perceptually-based processing of directional room responses for multichannel loudspeaker reproduction, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics
    • [4] Pulkki, V (2007) Spatial Sound Reproduction with Directional Audio Coding, J. Audio Eng. Soc., Vol. 55. No. 6
    • [5] Hellerud E et al (2008) Encoding Higher Order Ambisonics with AAC AES Convention Paper 7366 presented at the 125th Convention, Amsterdam, Netherlands
    • [6] Lindau A, Kosanke L, Weinzierl S (2010) Perceptual evaluation of physical predictors of the mixing time in binaural room impulse responses AES Convention Paper presented at the 128th Convention, London, UK
    • [7] Avni, A and Rafaely B (2009) Interaural cross correlation and spatial correlation in a sound field represented by spherical harmonics in Ambisonics Symposium 2009, Graz, Austria
  • Ein Enkoder-Dekoder Schema für niedrige Bitraten wird in [8] beschrieben. Der Enkoder generiert ein Komposit-Audio-Informations-Signal, das das zu reproduzierende Schallfeld beschreibt und einen Richtungsvektor oder Steering-Control-Signal. Das Spektrum wird in Subbänder zerlegt. Zur Steuerung wird in jedem Subband die dominante Richtung ausgewertet. Basierend auf der wahrgenommenen räumlichen Audioszene wird in [9] ein räumliches Audiokodier-Framework im Frequenzbereich beschrieben. Zeit-Frequenzabhängige Richtungsvektoren beschreiben die Eingangsaudioszene.
  • [10] beschreibt ein parametrisches, kanalbasiertes Audiokodierverfahren im Zeit- und Frequenzbereich. In [11] wird ein binaural-cue-coding (BCC) beschrieben, das ein oder mehr objektbasierte Cue-Codes verwendet. Diese beinhalten Richtung, Weite und Umhüllung einer auditorischen Szene. [12] bezieht sich auf die Verarbeitung von Kugelarraydaten für die Wiedergabe mittels Ambisonics. Dabei sollen die Verzerrungen des Systems durch Messfehler, wie z. B. Rauschen, equalisiert werden. In [13] wird ein kanalbasiertes Kodierverfahren beschrieben, dass sich auch auf Positionen der Lautsprecher, sowie einzelner Audio Objekte bezieht. In [14] wird ein Matrix-basiertes Kodierverfahren vorgestellt, das die Echtzeitübertragung von Higher Order Ambisonics Schallfeldern mit Ordnungen größer als 3 ermöglicht.
  • In [15] wird eine Methode zur Kodierung von räumlichen Audiodaten beschrieben, das unabhängig vom Wiedergabesystem ist. Dabei wird das Eingangsmaterial in zwei Gruppen unterteilt, von denen die erste Gruppe das Audio beinhaltet, das hohe Lokalisierbarkeit benötigt, während die zweite Gruppe mit für die Lokalisation ausreichend niedrigen Ambisonics-Ordnungen beschrieben wird. In der ersten Gruppe wird das Signal in einen Satz aus Monokanälen mit Metadaten kodiert. Die Metadaten beinhalten Zeitinformationen, wann der entsprechende Kanal wiedergegeben werden soll und Richtungsinformationen zu jedem Moment. Bei der Wiedergabe werden die Audiokanäle für herkömmliche Panning-Algorithmen dekodiert, wobei das Wiedergabe-System bekannt sein muss. Das Audio in der zweiten Gruppe wird in Kanäle verschiedener Ambisonics-Ordnungen kodiert. Bei der Dekodierung werden dem Wiedergabesystem entsprechende Ambisonics-Ordnungen verwendet.
    • [8] Dolby R M (1999) Low-bit-rate spatial coding method and system, EP 1677576 A3
    • [9] Goodwin M and Jot J-M (2007) Spatial audio coding based on universal spatial cues, US 8,379,868 B2
    • [10] Seefeldt A and Vinton M (2006) Controlling spatial audio coding parameters as a function of auditory events, EP 2296142 A2
    • [11] Faller C (2005) Parametric coding of spatial audio with object-based side information, US 8340306 B2
    • [12] Kordon S, Batke J-M, Krüger A (2011) Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field, EP 2592845 A1
    • [13] Corteel E and Rosenthal M (2011) Method and device for enhanced sound field reproduction of spatially encoded audio input signals, EP 2609759 A1
    • [14] Abeling S et al (2010) Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three, EP 2451196 A1
    • [15] Arumi P and Sole A (2008) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction, EP 2205007 A1
  • Die EP 2 334 103 A2 offenbart eine Vorrichtung und ein Verfahren zur Tonverbesserung. Ein Quellensignal wird in ein Hochfrequenzsignal und ein Niederfrequenzsignal aufgeteilt. Ferner wird ein Prädiktionssignal erhalten, das einen vorhergesagten Grad an Verzerrung angibt, die durch das Niederfrequenzsignal eingeführt wird. Ein adaptiver Harmonischensignalgenerator erzeugt ein Signal mit höheren Harmonischen, das anstatt eines Teils der Niederfrequenzsignals basierend auf dem vorhergesagten Grad an Verzerrung substituiert wird.
  • Die Aufgabe der vorliegenden Erfindung besteht darin, ein effizienteres Konzept zum Handhaben wie z. B. Komprimieren oder Dekomprimieren von Schallfelddaten eines Gebiets zu schaffen.
  • Diese Aufgabe wird durch eine Vorrichtung zum Komprimieren von Schallfelddaten gemäß Anspruch 1, eine Vorrichtung zum Dekomprimieren von Schallfelddaten gemäß Anspruch 14, ein Verfahren zum Komprimieren von Schallfelddaten gemäß Anspruch 21, ein Verfahren zum Dekomprimieren von Schallfelddaten gemäß Anspruch 22 oder ein Computerprogramm gemäß Anspruch 23 gelöst.
  • Eine Vorrichtung zum Komprimieren von Schallfelddaten eines Gebiets umfasst einen Aufteiler zum Aufteilen der Schallfelddaten in einen ersten Anteil und in einen zweiten Anteil sowie einen nachgeordneten Umsetzer zum Umsetzen des ersten Anteils und des zweiten Anteils in harmonische Komponenten, wobei die Umsetzung so stattfindet, dass die zweite Anzahl in eine oder mehrere harmonische Komponenten mit einer zweiten Ordnung umgesetzt wird, und dass der erste Anteil in harmonische Komponenten mit einer ersten Ordnung umgesetzt wird, wobei die erste Ordnung höher als die zweite Ordnung ist, um die komprimierten Schallfelddaten zu erhalten.
  • Damit wird erfindungsgemäß eine Umsetzung der Schallfelddaten, wie beispielsweise der Menge an Impulsantworten in harmonische Komponenten durchgeführt, wobei bereits diese Umsetzung zu einer erheblichen Dateneinsparung führen kann. Harmonische Komponenten, wie sie beispielsweise mittels einer räumlichen Spektraltransformation erhaltbar sind, beschreiben ein Schallfeld wesentlich kompakter als Impulsantworten. Darüber hinaus ist die Ordnung der harmonischen Komponenten ohne Weiteres steuerbar. Die harmonische Komponente nullter Ordnung ist lediglich ein (ungerichtetes) Mono-Signal. Sie erlaubt noch keine Schallfeld-Richtungsbeschreibung. Dagegen erlauben die zusätzlichen harmonischen Komponenten erster Ordnung bereits eine relativ grobe Richtungsdarstellung analog zum Beamforming. Die harmonischen Komponenten zweiter Ordnung erlauben eine zusätzliche noch genauere Schallfeldbeschreibung mit noch mehr Richtungsinformation. Bei Ambisonics beispielsweise ist die Anzahl der Komponenten gleich 2n + 1, wobei n die Ordnung ist. Für die nullte Ordnung gibt es somit nur eine einzige harmonische Komponente. Für eine Umsetzung bis zur ersten Ordnung gibt es bereits drei harmonische Komponenten. Für eine Umsetzung mit fünfter Ordnung beispielsweise gibt es bereits 11 harmonische Komponenten und es hat sich herausgestellt, dass beispielsweise für 350 Impulsantworten eine Ordnung gleich 14 ausreichend ist. Dies bedeutet in anderen Worten, dass 29 harmonische Komponenten den Raum genauso gut beschreiben wie 350 Impulsantworten. Bereits diese Umsetzung von einem Wert von 350 Eingangskanälen auf 29 Ausgangskanäle bringt einen Kompressionsgewinn. Erfindungsgemäß wird darüber hinaus noch eine Umsetzung verschiedener Anteile der Schallfelddaten, wie beispielsweise der Impulsantworten mit verschiedenen Ordnungen durchgeführt, da herausgefunden worden ist, dass nicht alle Anteile mit der gleichen Genauigkeit/Ordnung beschrieben werden müssen.
  • Ein Beispiel hierfür besteht darin, dass die Richtungswahrnehmung des menschlichen Gehörs hauptsächlich von den frühen Reflexionen abgeleitet wird, während die späten/diffusen Reflexionen in einer typischen Impulsantwort zur Richtungswahrnehmung nichts oder nur sehr wenig beitragen. Bei diesem Beispiel wird somit der erste Anteil der frühe Anteil der Impulsantworten sein, der mit einer höheren Ordnung in den Harmonische-Komponenten-Bereich umgesetzt wird, während der späte diffuse Anteil mit einer geringen Ordnung und teilweise sogar mit einer Ordnung gleich null umgesetzt wird.
  • Ein anderes Beispiel besteht darin, dass die Richtungswahrnehmung des menschlichen Gehörs frequenzabhängig ist. Bei tiefen Frequenzen ist die Richtungswahrnehmung des menschlichen Gehörs relativ schwach. Für die Kompression von Schallfelddaten genügt es daher, den niedrigen Spektralbereich der harmonischen Komponenten mit einer relativ geringen Ordnung in den Harmonische-Komponenten-Bereich umzusetzen, während die Frequenzbereiche der Schallfelddaten, in denen die Richtungswahrnehmung des menschlichen Gehörs sehr hoch ist, mit einer hohen und vorzugsweise sogar mit der maximalen Ordnung umgesetzt werden. Hierzu können die Schallfelddaten mittels einer Filterbank in einzelne Subband-Schallfelddaten zerlegt werden und diese Subband-Schallfelddaten werden dann mit unterschiedlichen Ordnungen zerlegt, wobei wiederum der erste Anteil Subband-Schallfelddaten bei höheren Frequenzen aufweist, während der zweite Anteil Subband-Schallfelddaten bei niedrigeren Frequenzen aufweist, wobei ganz niedrige Frequenzen ebenso wiederum sogar mit einer Ordnung gleich null, also nur mit einer einzigen harmonischen Komponente dargestellt werden können.
  • Bei einem weiteren Beispiel werden die vorteilhaften Eigenschaften der zeitlichen und frequenzmäßigen Verarbeitung kombiniert. So kann der frühe Anteil, der ohnehin mit höherer Ordnung umgesetzt wird, in Spektralanteile zerlegt werden, für die dann wieder für die einzelnen Bänder angepasste Ordnungen erhalten werden können. Insbesondere dann, wenn für die Subbandsignale eine dezimierende Filterbank, wie beispielsweise eine QMF-Filterbank (QMF = Quadrature Mirror Filterbank) eingesetzt wird, reduziert sich der Aufwand zur Umsetzung der Subband-Schallfelddaten in den Harmonische-Komponenten-Bereich zusätzlich. Darüber hinaus liefert die Differenzierung verschiedener Anteile der Schallfelddaten im Hinblick auf die zu berechnende Ordnung eine erhebliche Reduktion des Berechnungsaufwands, zumal die Berechnung der harmonischen Komponenten, wie beispielsweise der zylindrischen harmonischen Komponenten oder der sphärischen harmonischen Komponenten stark davon abhängt, bis zu welcher Ordnung die harmonischen Komponenten ausgerechnet werden sollen. Eine Berechnung der harmonischen Komponenten bis zur zweiten Ordnung beispielsweise benötigt wesentlich weniger Rechenaufwand und damit Rechenzeit bzw. Batterieleistung insbesondere bei mobilen Geräten als eine Berechnung der harmonischen Komponenten bis zur Ordnung 14 beispielsweise.
  • Bei den beschriebenen Ausführungsbeispielen ist der Umsetzer somit ausgebildet, um den Anteil, also den ersten Anteil der Schallfelddaten, der für eine Richtungswahrnehmung des menschlichen Gehörs wichtiger ist, mit einer höheren Ordnung umzusetzen als den zweiten Anteil, der für die Richtungswahrnehmung einer Schallquelle weniger wichtig als der erste Anteil ist.
  • Die vorliegende Erfindung kann nicht nur für eine zeitliche Zerlegung der Schallfelddaten in Anteile oder für eine spektrale Zerlegung der Schallfelddaten in Anteile eingesetzt werden, sondern auch für eine alternative, z. B. räumliche Zerlegung der Anteile, wenn beispielsweise berücksichtigt wird, dass die Richtungswahrnehmung des menschlichen Gehörs für Schall in unterschiedlichen Azimuth- oder Elevations-Winkeln unterschiedlich ist. Wenn die Schallfelddaten beispielsweise als Impulsantworten oder andere Schallfeldbeschreibungen vorliegen, bei denen jeder einzelnen Beschreibung ein bestimmter Azimuth/Elevations-Winkel zugeordnet ist, so können die Schallfelddaten aus Azimuth/Elevations-Winkeln, bei denen die Richtungswahrnehmung des menschlichen Gehörs stärker ist, mit einer höheren Ordnung komprimiert werden als ein räumlicher Anteil der Schallfelddaten aus einer anderen Richtung.
  • Alternativ oder zusätzlich können die einzelnen Harmonischen „ausgedünnt” werden, also im Beispiel mit Ordnung 14, bei der es 29 Moden gibt. Es werden in Abhängigkeit der menschlichen Richtungswahrnehmung einzelne Moden eingespart, die das Schallfeld für unwichtige Schalleinfallsrichtungen abbilden. Im Falle von Mikrofonarraymessungen besteht hier eine Unsicherheit, weil man nicht weiss, in welche Richtung der Kopf bezogen zur Arraykugel ausgerichtet ist. Wenn man aber HRTFs mittels sphärischer Harmonischer darstellt, ist diese Unsicherheit behoben.
  • Weitere Zerlegungen der Schallfelddaten zusätzlich zu Zerlegungen in zeitlicher, spektraler oder räumlicher Richtung können ebenfalls verwendet werden, wie beispielsweise eine Zerlegung der Schallfelddaten in einen ersten und einen zweiten Anteil in Volumenklassen etc.
  • Bei Ausführungsbeispielen geschieht die Beschreibung akustischer Problemstellungen im zylindrischen oder sphärischen Koordinatensystem, also mittels vollständiger Sätze orthonormaler Eigenfunktionen, den sogenannte zylindrischen oder sphärischen harmonischen Komponenten. Mit höherer räumlicher Genauigkeit der Beschreibung des Schallfelds steigen das Datenaufkommen und die Rechenzeit bei der Verarbeitung bzw. Manipulation der Daten. Für hochqualitative Audioanwendungen sind hohe Genauigkeiten erforderlich, was zu den Problemen der langen Berechnungszeiten, die insbesondere nachteilig für Echtzeitsysteme sind, der großen Datenmengen, was die Übertragung räumlicher Schallfelddaten erschwert, und des hohen Energieverbrauchs durch intensiven Rechenaufwand insbesondere bei mobilen Geräten führt.
  • Alle diese Nachteile werden durch Ausführungsbeispiele der Erfindung dahin gehend gelindert bzw. eliminiert, weil aufgrund der Differenzierung der Ordnungen zur Berechnung der harmonischen Komponenten die Berechnungszeiten reduziert werden, und zwar im Vergleich zu einem Fall, bei dem sämtliche Anteile mit der höchsten Ordnung in harmonische Komponenten umgesetzt werden. Die großen Datenmengen werden dahin gehend erfindungsgemäß reduziert, dass die Darstellung durch harmonische Komponenten insbesondere bereits kompakter ist und dass zusätzlich noch unterschiedliche Anteile mit unterschiedlichen Ordnungen dargestellt werden, wobei die Datenmengenreduktion dadurch erreicht wird, dass eine niedrige Ordnung, wie beispielsweise die erste Ordnung nur drei harmonische Komponenten hat, während die höchste Ordnung beispielsweise 29 harmonische Komponenten hat, und zwar am Beispiel einer Ordnung von 14.
  • Die reduzierte Rechenleistung und das reduzierte Speicheraufkommen verringern automatisch den Energieverbrauch, der insbesondere für einen Einsatz von Schallfelddaten in mobilen Geräten anfällt.
  • Bei Ausführungsbeispielen wird die räumliche Schallfeldbeschreibung im zylindrischen bzw. sphärischen harmonischen Bereich basierend auf der räumlichen Wahrnehmung des Menschen optimiert. Insbesondere eine Kombination aus zeit- und frequenzabhängiger Berechnung der Ordnung sphärischer Harmonischer in Abhängigkeit der räumlichen Wahrnehmung des menschlichen Gehörs führt zu einer erheblichen Aufwandsreduktion ohne die subjektive Qualität der Schallfeldwahrnehmung zu reduzieren. Selbstverständlich wird die objektive Qualität reduziert, da die vorliegende Erfindung eine verlustbehaftete Kompression darstellt. Diese verlustbehaftete Kompression ist jedoch unkritisch, zumal der letztendliche Empfänger das menschliche Gehör ist, und zumal es daher sogar für eine transparente Wiedergabe unerheblich ist, ob Schallfeldkomponenten, die vom menschlichen Gehör ohnehin nicht wahrgenommen werden, im wiedergegebenen Schallfeld vorhanden sind oder nicht.
  • In anderen Worten stellt daher bei der Wiedergabe/Auralisation entweder binaural, also mit Kopfhörern oder mit Lautsprechersystemen mit wenigen (z. B. Stereo) oder vielen Lautsprechern (z. B. WFS) das menschlichen Gehör das wichtigste Qualitätsmaß dar. Erfindungsgemäß wird die Genauigkeit der harmonischen Komponenten wie beispielsweise der zylindrischen oder sphärischen Harmonischen im Zeitbereich und/oder im Frequenzbereich und/oder in weiteren Bereichen gehörangepasst reduziert. Dadurch wird die Daten- und Rechenzeitreduktion erreicht.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
  • 1a ein Blockdiagramm einer Vorrichtung zum Komprimieren von Schallfelddaten gemäß einem Ausführungsbeispiel;
  • 1b ein Blockdiagramm einer Vorrichtung zum Dekomprimieren von komprimierten Schallfelddaten eines Gebiets;
  • 1c ein Blockdiagramm einer Vorrichtung zum Komprimieren mit zeitlicher Zerlegung;
  • 1d ein Blockdiagramm eines Ausführungsbeispiels einer Vorrichtung zum Dekomprimieren für den Fall einer zeitlichen Zerlegung;
  • 1e eine zu 1d alternative Vorrichtung zum Dekomprimieren;
  • 1f ein Beispiel für die Anwendung der Erfindung mit zeitlicher und spektraler Zerlegung am Beispiel von 350 gemessenen Impulsantworten als Schallfelddaten;
  • 2a ein Blockdiagramm einer Vorrichtung zum Komprimieren mit spektraler Zerlegung;
  • 2b ein Beispiel einer unterabgetasteten Filterbank und einer anschließenden Umsetzung der unterabgetasteten Subband-Schallfelddaten;
  • 2c eine Vorrichtung zum Dekomprimieren für das in 2a gezeigte Beispiel der spektralen Zerlegung;
  • 2d eine alternative Implementierung des Dekomprimierers für die spektrale Zerlegung;
  • 3a ein Übersichts-Blockdiagramm mit einem speziellen Analyse/Synthese-Codierer gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung;
  • 3b eine detailliertere Darstellung eines Ausführungsbeispiels mit zeitlicher und spektraler Zerlegung;
  • 4 eine schematische Darstellung einer Impulsantwort;
  • 5 ein Blockschaltbild eines Umsetzers vom Zeit- oder Spektralbereich in den Harmonischen-Komponenten-Bereich mit variabler Ordnung; und
  • 6 eine Darstellung eines beispielhaften Umsetzers vom Harmonischen-Komponenten-Bereich in den Zeitbereich oder Spektralbereich mit anschließender Auralisation.
  • 1a zeigt ein Blockschaltbild einer Vorrichtung bzw. eines Verfahrens zum Komprimieren von Schallfelddaten eines Gebiet, wie sie an einem Eingang 10 in einen Aufteiler 100 eingegeben werden. Der Aufteiler 100 ist ausgebildet, um die Schallfelddaten in einen ersten Anteil 101 und eine zweiten Anteil 102 aufzuteilen. Darüber hinaus ist ein Umsetzer vorgesehen, der die zwei Funktionalitäten aufweist, die mit 140 oder 180 bezeichnet sind. Insbesondere ist der Umsetzer ausgebildet, um den ersten Anteil 101 umzusetzen, wie es bei 140 gezeigt ist, und um den zweiten Anteil 102 umzusetzen, wie es bei 180 gezeigt ist. Der Umsetzer setzt insbesondere den ersten Anteil 101 in eine oder mehrere harmonische Komponenten 141 mit einer ersten Ordnung um, während der Umsetzer 180 den zweiten Anteil 102 in eine oder mehrere harmonische Komponenten 182 mit einer zweiten Ordnung umsetzt. Insbesondere ist die erste Ordnung, also die den harmonischen Komponenten 141 zugrunde liegende Ordnung höher als die zweite Ordnung, was, in anderen Worten ausgedrückt bedeutet, dass der Umsetzer 140 mit höherer Ordnung mehr harmonische Komponenten 141 ausgibt als der Umsetzer 180 mit niedrigerer Ordnung. Die Ordnung n1, durch die der Umsetzer 140 angesteuert wird, ist somit größer als die Ordnung n2, mit der der Umsetzer 180 angesteuert wird. Die Umsetzer 140, 180 können steuerbare Umsetzer sein. Alternativ kann die Ordnung jedoch festgelegt sein und damit fest einprogrammiert sein, so dass die Eingänge, die mit n1 und n2 bezeichnet sind, in diesem Ausführungsbeispiel nicht vorhanden sind.
  • 1b zeigt eine Vorrichtung zum Dekomprimieren von komprimierten Schallfelddaten 20, die erste harmonische Komponenten mit einer ersten Ordnung und eine oder mehrere zweite harmonische Komponenten mit einer zweiten Ordnung aufweisen, wie sie z. B. von 1a bei 141, 182 ausgegeben werden. Die dekomprimierten Schallfelddaten müssen jedoch nicht unbedingt die harmonischen Komponenten 141, 142 im „Rohformat” sein. Stattdessen könnte in 1a noch ein verlustloser Entropie-Codierer, wie beispielsweise ein Huffman-Codierer oder ein arithmetischer Codierer vorgesehen sein, um die Anzahl von Bits, die letztendlich zur Darstellung der harmonischen Komponenten benötigt werden, weiter zu reduzieren. Dann würde der Datenstrom 20, der in eine Eingangs-Schnittstelle 200 eingespeist wird, aus Entropie-codierten harmonischen Komponenten und gegebenenfalls Seiteninformationen bestehen, wie es noch anhand von 3a dargestellt wird. In diesem Fall wäre am Ausgang der Eingangs-Schnittstelle 200 ein jeweiliger Entropie-Decodierer vorgesehen, der an den Entropie-Encodierer auf Encodierer-Seite, also bezüglich 1a angepasst ist. So stellen somit die ersten harmonischen Komponenten der ersten Ordnung 201 und die zweiten harmonischen Komponenten der zweiten Ordnung 202, wie sie in 1b dargestellt sind, gegebenenfalls noch Entropie-codierte oder aber bereits Entropie-decodierte oder tatsächlich die harmonischen Komponenten in „Rohform”, wie sie bei 141, 182 in 1a vorliegen, dar.
  • Beide Gruppen von harmonischen Komponenten werden in einen Decodierer bzw. Umsetzer/Kombinierer 240 eingespeist. Der Block 240 ist ausgebildet, um die komprimierten Schallfelddaten 201, 202 unter Verwendung einer Kombination des ersten Anteils und des zweiten Anteils und unter Verwendung einer Umsetzung von einer Harmonische-Komponenten-Darstellung in eine Zeitbereichsdarstellung zu dekomprimieren, um schließlich die dekomprimierte Darstellung des Schallfelds zu erhalten, wie es bei 240 dargestellt ist. Der Decodierer 240, der beispielsweise als Signalprozessor ausgebildet sein kann, ist somit ausgebildet, um zum einen eine Umsetzung in den Zeitbereich vom Sphärische-Harmonische-Komponentenbereich durchzuführen, und um zum anderen eine Kombination durchzuführen. Die Reihenfolge zwischen Umsetzung und Kombination kann jedoch unterschiedlich sein, wie es im Hinblick auf 1d, 1e oder 2c, 2d für verschiedene Beispiele dargestellt wird.
  • 1c zeigt eine Vorrichtung zum Komprimieren von Schallfelddaten eines Gebiets gemäß einem Ausführungsbeispiel, bei dem der Aufteiler 100 als zeitlicher Aufteiler 100a ausgebildet ist. Insbesondere ist der zeitliche Aufteiler 100a, der eine Implementierung des Aufteilers 100 von 1a ist, ausgebildet, um die Schallfelddaten in einen ersten Anteil, der erste Reflexionen in dem Gebiet umfasst, und in einen zweiten Anteil, der zweite Reflexionen in dem Gebiet umfasst, aufzuteilen, wobei die zweiten Reflexionen zeitlich später als die ersten Reflexionen auftreten. Anhand von 4 stellt der erste Anteil 101, der vom Block 100a ausgegeben wird, somit den Impulsantwort-Abschnitt 310 von 4 dar, während der zweite späte Anteil den Abschnitt 320 der Impulsantwort von 4 darstellt. Der Zeitpunkt der Aufteilung kann beispielsweise bei 100 ms liegen. Allerdings existieren auch andere Möglichkeiten der zeitlichen Aufteilung, wie beispielsweise früher oder später. Vorzugsweise wird die Aufteilung dort gelegt, wo die diskreten Reflexionen in diffuse Reflexionen übergehen. Dies kann je nach Raum ein unterschiedlicher Zeitpunkt sein, und es existieren Konzepte, um hier eine beste Aufteilung zu schaffen. Andererseits kann die Aufteilung in einen frühen und in einen späten Anteil auch abhängig von einer verfügbaren Datenrate durchgeführt werden, dahin gehend, dass die Aufteilungszeit immer kleiner gemacht wird, je weniger Bitrate vorhanden ist. Dies ist im Hinblick auf die Bitrate günstig, weil dann ein möglichst großer Anteil der Impulsantwort mit einer niedrigen Ordnung in den Harmonische-Komponenten-Bereich umgesetzt wird.
  • Der Umsetzer, der durch die Blöcke 140 und 180 in 1c dargestellt ist, ist somit ausgebildet, um den ersten Anteil 101 und den zweiten Anteil 102 in harmonische Komponenten umzusetzen, wobei der Umsetzer insbesondere den zweiten Anteil in eine oder mehrer harmonische Komponenten 182 mit einer zweiten Ordnung umsetzt und den ersten Anteil 101 in harmonische Komponenten 141 mit einer ersten Ordnung umsetzt, wobei die erste Ordnung höher als die zweite Ordnung ist, um schließlich das komprimierte Schallfeld zu erhalten, das von einer Ausgabeschnittstelle 190 schließlich zu Zwecken der Übertragung und/oder Speicherung ausgebbar ist.
  • 1d zeigt eine Implementierung des Dekomprimierers für das Beispiel der zeitlichen Aufteilung. Insbesondere ist der Dekomprimierer ausgebildet, um die komprimierten Schallfelddaten unter Verwendung einer Kombination des ersten Anteils 201 mit den ersten Reflexionen und des zweiten Anteils 202 mit den späten Reflexionen und einer Umsetzung von dem Harmonische-Komponenten-Bereich in den Zeitbereich durchzuführen. 1d zeigt eine Implementierung, bei der die Kombination nach der Umsetzung stattfindet. 1e zeigt eine alternative Implementierung, bei der die Kombination vor der Umsetzung stattfindet. Insbesondere ist der Umsetzer 241 ausgebildet, um harmonische Komponenten mit der hohen Ordnung in den Zeitbereich umzusetzen, während der Umsetzer 242 ausgebildet ist, um die harmonischen Komponenten mit der niedrigen Ordnung in den Zeitbereich umzusetzen. Im Hinblick auf 4 liefert somit der Ausgang des Umsetzers 241 etwas, das dem Bereich 210 entspricht, während der Umsetzer 242 etwas liefert, das dem Bereich 320 entspricht, wobei jedoch aufgrund der verlustbehafteten Kompression die Abschnitte am Ausgang der Brücke 241, 242 nicht identisch zu den Abschnitten 310, 320 sind. Insbesondere wird jedoch eine zumindest wahrnehmungsmäßige Ähnlichkeit oder Identität des Abschnitts am Ausgang des Blocks 241 zu dem Abschnitt 310 von 4 bestehen, während der Abschnitt am Ausgang des Blocks 242, der dem späten Anteil 320 der Impulsantwort entspricht, deutliche Unterschiede haben wird und somit den Verlauf der Impulsantwort lediglich näherungsweise darstellt. Diese Abweichungen sind jedoch für die menschliche Richtungswahrnehmung unkritisch, weil die menschliche Richtungswahrnehmung ohnehin kaum oder nicht auf dem späten Anteil bzw. den diffusen Reflexionen der Impulsantwort basiert.
  • 1e zeigt eine alternative Implementierung, bei der der Decodierer zunächst den Kombinierer 245 und dann nachfolgend den Umsetzer 244 aufweist. Die einzelnen harmonischen Komponenten werden bei dem in 1e gezeigten Ausführungsbeispiel aufaddiert, woraufhin das Ergebnis der Aufaddition umgesetzt wird, um schließlich eine Zeitbereichsdarstellung zu erhalten. Im Unterschied hierzu wird bei der Ausführung in 1d eine Kombination nicht in einer Aufaddition bestehen, sondern in einer Serialisierung, dahin gehend, dass der Ausgang des Blocks 241 zeitlich früher in einer dekomprimierten Impulsantwort angeordnet sein wird als der Ausgang des Blocks 242, um wieder eine zu 4 entsprechende Impulsantwort zu erhalten, die dann für weitere Zwecke, wie beispielsweise eine Auralisation also in eine Aufbereitung von Tonsignalen mit dem gewünschten Raumeindruck verwendet werden kann.
  • 2a zeigt eine alternative Implementierung der vorliegenden Erfindung, bei der eine Aufteilung im Frequenzbereich vorgenommen wird. Insbesondere ist der Aufteiler 100 von 1a bei dem Ausführungsbeispiel von 2a als Filterbank implementiert, um zumindest einen Teil der Schallfelddaten zu filtern, um Schallfelddaten in verschiedenen Filterbankkanälen 101, 102 zu erhalten. Die Filterbank erhält bei einem Ausführungsbeispiel, bei dem die zeitliche Aufteilung von 1a nicht implementiert ist, sowohl den frühen als auch den späten Anteil, während bei einem alternativen Ausführungsbeispiel lediglich der frühe Anteil der Schallfelddaten in die Filterbank eingespeist wird, während der späte Anteil nicht weiter spektral zerlegt wird.
  • Der Analyse-Filterbank 100b nachgeordnet ist der Umsetzer, der aus Teil-Umsetzern 140a, 140b, 140c ausgebildet sein kann. Der Umsetzer 140a, 140b, 140c ist ausgebildet, um die Schallfelddaten in verschiedenen Filterbankkanälen unter Verwendung verschiedener Ordnungen für verschiedene Filterbankkanäle umzusetzen, um für jeden Filterbankkanal einen oder mehrere harmonische Komponenten zu erhalten. Insbesondere ist der Umsetzer ausgebildet, um für einen ersten Filterbankkanal mit einer ersten Mittenfrequenz eine Umsetzung mit einer ersten Ordnung durchzuführen, und um für einen zweiten Filterbankkanal mit einer zweiten Mittenfrequenz eine Umsetzung mit einer zweiten Ordnung durchzuführen, wobei die erste Ordnung höher als die zweite Ordnung ist, und wobei die erste Mittenfrequenz, d. h. fn, höher als die zweite Mittenfrequenz f1 ist, um schließlich die komprimierte Schallfelddarstellung zu erhalten. Generell kann, je nach Ausführungsbeispiel, für das niedrigste Frequenzband eine niedrigere Ordnung als für ein mittleres Frequenzband verwendet werden. Allerdings muss je nach Implementierung das höchste Frequenzband, wie es bei dem in 2a gezeigten Ausführungsbeispiel der Filterbankkanal mit der Mittenfrequenz fn ist, nicht unbedingt mit einer höheren Ordnung als z. B. ein mittlerer Kanal umgesetzt werden. Stattdessen kann in den Bereichen, in denen die Richtungswahrnehmung am höchsten ist, die höchste Ordnung verwendet werden, wie in den anderen Bereichen, zu denen auch z. B. ein bestimmter hoher Frequenzbereich gehören kann, die Ordnung niedriger ist, weil in diesen Bereichen auch die Richtungswahrnehmung des menschlichen Gehörs niedriger ist.
  • 2b zeigt eine detailliertere Implementierung der Analyse-Filterbank 100b. Diese umfasst bei dem in 2b gezeigten Ausführungsbeispiel einen Bandfilter und hat ferner nachgeschaltete Dezimierer 100c für jeden Filterbankkanal. Wenn beispielsweise eine Filterbank bestehend aus Bandfilter und Dezimierern eingesetzt wird, die 64 Kanäle hat, so kann jeder Dezimierer mit einem Faktor 1/64 dezimieren, so dass insgesamt die Anzahl der digitalen Abtastwerte am Ausgang der Dezimierer über alle Kanäle aufaddiert der Anzahl von Abtastwerten eines Blocks der Schallfelddaten im Zeitbereich entspricht, der durch die Filterbank zerlegt worden ist. Eine beispielhafte Filterbank kann eine reelle oder komplexe QMF-Filterbank sein. Jedes Subbandsignal vorzugsweise der frühen Anteile der Impulsantworten wird dann in harmonische Komponenten mittels der Umsetzer 140a bis 140c in Analogie zu 2a umgesetzt, um schließlich für verschiedene Subbandsignale der Schallfeldbeschreibung eine Beschreibung mit zylindrischen oder vorzugsweise sphärischen harmonischen Komponenten zu erhalten, die für unterschiedliche Subbandsignale unterschiedliche Ordnungen, also eine unterschiedlich große Anzahl von harmonischen Komponenten, aufweist.
  • 2c und 2d zeigen wieder verschiedene Implementierungen des Dekomprimierers, wie er in 1b dargestellt ist, also eine unterschiedliche Reihenfolge der Kombination und anschließenden Umsetzung in 2c oder der zunächst durchgeführten Umsetzung und der anschließenden Kombination, wie es in 2d dargestellt ist. Insbesondere umfasst der Dekomprimierer 240 von 1b bei dem in 2c gezeigten Ausführungsbeispiel wieder einen Kombinierer 245, der eine Addition der unterschiedlichen harmonischen Komponenten aus den verschiedenen Subbändern durchführt, um dann eine Gesamtdarstellung der harmonischen Komponenten zu erhalten, die dann mit dem Umsetzer 244 in den Zeitbereich umgesetzt werden. Damit liegen die Eingangssignale in dem Kombinierer 245 im Harmonische-Komponenten-Spektralbereich vor, während der Ausgang des Kombinierers 345 eine Darstellung im Harmonische-Komponenten-Bereich darstellt, von dem dann durch den Umsetzer 244 eine Umsetzung in den Zeitbereich erhalten wird.
  • Bei dem in 2d gezeigten alternativen Ausführungsbeispiel werden die einzelnen harmonischen Komponenten für jedes Subband zunächst durch unterschiedliche Umsetzer 241a, 241b, 241c in den Spektralbereich umgesetzt, so dass die Ausgangssignale der Blöcke 241a, 241b, 241c den Ausgangssignalen der Blöcke 140a, 140b, 140c von 2a oder 2b entsprechen. Dann werden diese Subbandsignale in einer nachgeordneten Synthese-Filterbank, die im Falle eines Downsampling auf Encodierer-Seite (Block 100c von 2b) auch eine Hoch-Tast-Funktion, also eine Upsampling-Funktion aufweisen kann, verarbeitet. Die Synthese-Filterbank stellt dann die Kombinierer-Funktion des Decodierers 240 von 1b dar. Am Ausgang der Synthese-Filterbank liegt somit die dekomprimierte Schallfelddarstellung vor, die zur Auralisation verwendet werden kann, wie es noch dargestellt wird.
  • 1f zeigt ein Beispiel für die Zerlegung von Impulsantworten in harmonische Komponenten verschiedener Ordnungen. Die späten Abschnitte werden nicht spektral zerlegt sondern insgesamt mit der nullten Ordnung umgesetzt. Die frühen Abschnitte der Impulsantworten werden spektral zerlegt. Das niedrigste Band wird beispielsweise mit der ersten Ordnung verarbeitet, während das nächste Band bereits mit der fünften Ordnung verarbeitet wird und das letzte Band, weil es für die Richtungs/Raumwahrnehmung am wichtigsten ist, mit der höchsten Ordnung, also bei diesem Beispiel mit der Ordnung 14, verarbeitet wird.
  • 3a zeigt das gesamte Encodierer/Decodierer-Schema oder das gesamte Komprimierer/Dekomprimierer-Schema der vorliegenden Erfindung.
  • Insbesondere umfasst bei dem in 3a gezeigten Ausführungsbeispiel der Komprimierer nicht nur die Funktionalitäten von 1a, die mit 1 oder PENC bezeichnet sind, sondern auch einen Decodierer PDEC2, der wie in 1b ausgebildet sein kann. Darüber hinaus umfasst der Komprimierer noch eine Steuerung CTRL4, die ausgebildet ist, um vom Decodierer 2 erhaltene dekomprimierte Schallfelddaten mit ursprünglichen Schallfelddaten unter Berücksichtigung eines psychoakustischen Modells, wie beispielsweise dem Modell PEAQ, das von der ITU standardisiert worden ist, verglichen.
  • Daraufhin erzeugt die Steuerung 4 optimierte Parameter für die Aufteilung, wie beispielsweise die zeitliche Aufteilung, die frequenzmäßige Aufteilung in der Filterbank oder optimierte Parameter für die Ordnungen in den einzelnen Umsetzern für die verschiedenen Anteile der Schallfelddaten, wenn diese Umsetzer steuerbar ausgebildet sind.
  • Steuerparameter, wie beispielsweise Aufteilungsinformationen, Filterbankparameter oder Ordnungen können dann zusammen mit einem Bitstrom, der die harmonischen Komponenten aufweist, zu einem Decodierer bzw. Dekomprimierer übertragen werden, der mit 2 in 3a dargestellt ist. Der Komprimierer 11 besteht somit aus dem Kontrollblock CTRL4 für die Codec-Steuerung sowie einen Parameter-Codierer PENC1 und dem Parameter-Decodierer PDEC2. Die Eingaben 10 sind Daten von Mikrofon-Array-Messungen. Der Steuerblock 4 initialisiert den Encodierer 1 und stellt sämtliche Parameter für die Encodierung der Array-Daten bereit. Im PENC-Block 1 werden die Daten gemäß der beschriebenen Methodik der gehörabhängigen Aufteilung im Zeit- und im Frequenzbereich verarbeitet und für die Datenübertragung bereitgestellt.
  • 3b zeigt das Schema der Daten-En- und Decodierung. Die Eingangsdaten 10 werden zunächst durch den Aufteiler 100a in ein frühes 101 und ein spätes Schallfeld 102 zerlegt. Das frühe Schallfeld 101 wird mittels einer n-Band-Filterbank 100b in seine spektralen Anteile f1....fn zerlegt, die jeweils mit einer dem menschlichen Gehör angepassten Ordnung des sphärischen Harmonischen (x-Ordnung-SHD – SHD = Spherical Harmonics Decomposition) zerlegt werden. Diese Zerlegung in sphärische Harmonische stellt ein bevorzugtes Ausführungsbeispiel dar, wobei jedoch mittels jeder Schallfeldzerlegung (Sound Field Decomposition), die harmonische Komponenten erzeugt, gearbeitet werden kann. Da die Zerlegung in sphärische harmonische Komponenten in jedem Band je nach Ordnung unterschiedlich lange Berechnungszeiten braucht, wird es bevorzugt, die Zeitversätze in einer Verzögerungsleitung mit Verzögerungsblöcken 306, 304 zu korrigieren. Damit wird der Frequenzbereich im Rekonstruktionsblock 245, der auch als Kombinierer bezeichnet wird, rekonstruiert und mit dem späten Schallfeld im weiteren Kombinierer 243 wieder kombiniert, nachdem dieses mit einer gehörangepasst niedrigen Ordnung gerechnet wurde.
  • Der Steuerblock CTRL4 von 3a beinhaltet ein raumakustisches Analysemodul und ein Psychoakustikmodul. Der Steuerblock analysiert dabei sowohl die Eingangsdaten 10 als auch die Ausgangsdaten des Decodierers 2 von 3a, um die Codierparameter, die auch als Seiteninformationen 300 in 3a bezeichnet werden, bzw. die direkt im Komprimierer 11 dem Codierer PENC1 bereitgestellt werden, adaptiv anzupassen. Aus den Eingangssignalen 10 werden raumakustische Parameter extrahiert, die mit den Parametern der verwendeten Array-Konfiguration die initialen Parameter der Codierung vorgeben. Diese beinhalten sowohl den Zeitpunkt der Trennung zwischen frühem und spätem Schallfeld, der auch als „mixing time” oder „Mischzeit” bezeichnet wird, als auch die Parameter für die Filterbank, wie beispielsweise entsprechende Ordnungen der sphärischen Harmonischen. Die Ausgabe, die z. B. in Form von binauralen Impulsantworten vorliegen kann, wie sie vom Kombinierer 243 ausgegeben wird, wird in ein psychoakustisches Modul mit einem auditorischen Modell geführt, das die Qualität evaluiert und die Codierparameter entsprechend anpasst. Alternativ kann das Konzept auch mit statischen Parametern arbeiten. Dann entfällt das Steuermodul CTRL4 sowie das PEDC-Modul 2 auf Encodierer- bzw. Komprimiererseite 11.
  • Die Erfindung ist dahin gehend vorteilhaft, dass Daten und Rechenaufwand bei der Verarbeitung und Übertragung von Kreis- und Kugelarraydaten in Abhängigkeit des menschlichen Gehörs reduziert werden. Es ist ferner vorteilhaft, dass die so verarbeiteten Daten in bestehende Kompressionsverfahren integriert werden können und somit eine zusätzliche Datenreduktion erlauben. Dies ist in bandbegrenzten Übertragungssystemen, wie für mobile Endgeräte von Vorteil. Ein weiterer Vorteil ist die mögliche Echtzeitverarbeitung der Daten im sphärischen harmonischen Bereich auch bei hohen Ordnungen. Die vorliegende Erfindung kann in vielen Bereichen Anwendung finden, und insbesondere in den Bereichen, wo das akustische Schallfeld mittels zylindrischer oder sphärischer Harmonischer dargestellt wird. Dies erfolgt z. B. bei der Schallfeldanalyse mittels Kreis- bzw. Kugelarrays. Wenn das analysieret Schallfeld auralisiert werden soll, kann das Konzept der vorliegenden Erfindung eingesetzt werden. Bei Geräten zur Simulation von Räumen werden Datenbanken zur Speicherung existierender Räume eingesetzt. Hier ermöglicht das erfindungsgemäße Konzept eine platzsparende und qualitativ hochwertige Speicherung. Es existieren Wiedergabeverfahren, die auf Kugelflächenfunktionen beruhen, wie beispielsweise Higher Order Ambisonics oder die binaurale Synthese. Hier liefert die vorliegende Erfindung eine Reduktion von Rechenzeit und Datenaufwand. Dies kann insbesondere im Hinblick auf die Datenübertragung z. B. bei Telekonferenz-Systemen von besonderem Vorteil sein.
  • 5 zeigt eine Implementierung eines Umsetzers 140 bzw. 180 mit einstellbarer Ordnung bzw. mit zumindest unterschiedlicher Ordnung, die auch fest eingestellt sein kann.
  • Der Umsetzer umfasst einen Zeit-Frequenz-Transformationsblock 502 und einen nachgeschalteten Raum-Transformationsblock 504. Der Raum-Transformationsblock 504 ist ausgebildet, um gemäß der Berechnungsvorschrift 508 zu arbeiten. In der Berechnungsvorschrift beträgt n die Ordnung. Die Berechnungsvorschrift 508 wird je nach Ordnung nur einmal gelöst, wenn die Ordnung gleich null ist, oder wird öfter gelöst, wenn die Ordnung z. B. bis zur Ordnung 5 oder bei dem vorstehend beschriebenen Beispiel bis zur Ordnung 14 geht. Insbesondere ist das Zeit-Frequenz-Transformationselement 502 ausgebildet, um die Impulsantworten auf den Eingangsleitungen 101, 102 in den Frequenzbereich zu transformieren, wobei vorzugsweise die schnelle Fourier-Transformation eingesetzt wird. Ferner wird dann nur das halbseitige Spektrum weitergeleitet, um den Rechenaufwand zu reduzieren. Dann wird eine räumliche Fourier-Transformation im Block Raumtransformation 504 durchgeführt, wie sie in dem Fachbuch Fourier Acoustics, Sound Radiation and Nearfield Acoustical Holography, Academic Press, 1999 von Earl G. Williams beschrieben ist. Vorzugsweise ist die Raumtransformation 504 optimiert für die Schallfeldanalyse und liefert gleichzeitig eine hohe numerische Genauigkeit und eine schnelle Berechnungsgeschwindigkeit.
  • 6 zeigt die bevorzugte Implementierung eines Umsetzers vom Harmonische-Komponenten-Bereich in den Zeitbereich, wo als Alternative ein Prozessor zur Zerlegung in ebene Wellen und Beamforming 602 dargestellt ist, und zwar alternativ zu einer inversen Raumtransformationsimplementierung 604. Die Ausgangssignale beider Blöcke 602, 604 können alternativ in einen Block 606 zur Erzeugung von Impulsantworten eingespeist werden. Die inverse Raumtransformation 604 ist ausgebildet, um die Hin-Transformation im Block 504 rückgängig zu machen. Alternativ hierzu führt die Zerlegung in ebene Wellen und das Beamforming in Block 606 dazu, dass eine große Menge an Zerlegungsrichtungen gleichmäßig verarbeitet werden können, was zu einer schnellen Verarbeitung insbesondere zur Visualisierung oder Auralisierung günstig ist. Vorzugsweise erhält der Block 602 radiale Filterkoeffizienten sowie, je nach Implementierung, zusätzliche Strahlformungs- bzw. Beamforming-Koeffizienten. Diese können entweder eine konstante Gerichtetheit haben oder frequenzabhängig sein. Alternative Eingangssignale in den Block 602 können modale Radialfilter sein, und insbesondere für sphärische Arrays oder unterschiedliche Konfigurationen, wie beispielsweise eine offene Kugel mit omnidirektionalen Mikrofonen, eine offene Kugel mit Cardioid-Mikrofonen und eine starre Kugel mit omnidirektionalen Mikrofonen. Der Block 606 zur Erzeugung von Impulsantworten erzeugt Impulsantworten oder Zeitbereichssignale aus Daten entweder vom Block 602 oder vom Block 604. Dieser Block rekombiniert insbesondere die vorher weggelassene negativen Anteile des Spektrums, führt eine schnelle inverse Fourier-Transformation durch und erlaubt ein Resampling bzw. Abtastratenumsetzung auf die ursprüngliche Abtast-Rate, falls das Eingangssignal an einer Stelle herunter-abgetastet wurde. Ferner kann eine Fensteroption eingesetzt werden.
  • Details zu der Funktionalität der Blöcke 502, 504, 602, 604, 606 sind in der Fachveröffentlichung „SofiA Sound Field Analysis Toolbox” von Bernschütz u. a., ICSA – International Conference an Spatial Audio, Detmold, 10. bis 13.11.2011” beschrieben.
  • Der Block 606 kann ferner ausgebildet sein, um den kompletten Satz von dekomprimierten Impulsantworten, also beispielsweise den verlustbehafteten Impulsantworten auszugeben, wobei dann der Block 608 wieder beispielsweise 350 Impulsantworten ausgeben würde. Je nach Auralisierung wird es jedoch bevorzugt, lediglich die letztendlich für die Wiedergabe nötigen Impulsantworten auszugeben, was durch einen Block 608 bewerkstelligt werden kann, der eine Auswahl oder eine Interpolation für ein bestimmtes Wiedergabeszenario liefert. Wird beispielsweise eine Stereowiedergabe angestrebt, wie es in Block 616 dargestellt ist, so wird abhängig von der Platzierung der beiden Stereo-Lautsprecher von den 350 beispielsweise wiedergewonnenen Impulsantworten die Impulsantwort ausgewählt, die jeweils der Raumrichtung des entsprechenden Stereo-Lautsprechers entspricht. Mit dieser Impulsantwort wird dann ein Vorfilter des entsprechenden Lautsprechers eingestellt, derart, dass das Vorfilter eine Filtercharakteristik hat, die dieser Impulsantwort entspricht. Dann wird ein wiederzugebendes Audiosignal zu den beiden Lautsprechern über die entsprechenden Vorfilter geführt und wiedergegeben, um schließlich den gewünschten Raumeindruck für eine Stereo-Auralisation zu erzeugen.
  • Existiert unter den zur Verfügung stehenden Impulsantworten eine Impulsantwort in einer bestimmten Richtung, in der im tatsächlichen Wiedergabeszenario ein Lautsprecher angeordnet ist, nicht, so werden die vorzugsweise zwei oder drei am nächsten benachbarten Impulsantworten verwendet und es wird eine Interpolation durchgeführt.
  • Bei einem alternativen Ausführungsbeispiel, bei dem die Wiedergabe bzw. Auralisation durch eine Wellenfeldsynthese 612 stattfindet, wird es bevorzugt, eine Wiedergabe von frühen und späten Reflexionen über virtuelle Quellen durchzuführen, wie es in der PH. D. – Arbeit „Spatial Sound Design based an Measured Room Impulse Responses” von Frank Melchior an der TU Delft aus dem Jahr 2011 detailliert dargestellt ist, wobei diese Fachveröffentlichung ebenfalls durch Bezugnahme in ihrer Gesamtheit hierin aufgenommen ist.
  • Insbesondere werden die Reflexionen einer Quelle bei der Wellefeldsynthese-Wiedergabe 612 durch vier Impulsantworten an bestimmten Positionen für die frühen Reflexionen und 8 Impulsantworten an bestimmten Positionen für die späten Reflexionen wiedergegeben. Der Auswahlblock 608 wählte dann die 12 Impulsantworten für die 12 virtuellen Positionen aus. Hierauf werden diese Impulsantworten zusammen mit den zugehörigen Positionen in einem Wellenfeld-Synthese-Renderer, der in Block 612 angeordnet sein kann, zugeführt, und der Wellenfeld-Synthese-Renderer berechnet dann unter Verwendung dieser Impulsantworten die Lautsprechersignale für die tatsächlich vorhandenen Lautsprecher, damit diese dann die entsprechenden virtuellen Quellen abbilden. Damit wird für jeden Lautsprecher im Wellefeld-Synthese-Wiedergabesystem ein eigenes Vorfilter berechnet, über das dann ein letztendlich wiederzugebendes Audiosignal gefiltert wird, bevor es vom Lautsprecher ausgegeben wird, um eine entsprechende Wiedergabe mit hohen qualitativen Raumeffekten zu erreichen.
  • Eine alternative Implementierung der vorliegenden Erfindung besteht in einer Erzeugung eines Kopfhörersignals, also in einer Binaural-Anwendung, bei der der Raumeindruck des Gebiets über die Kopfhörerwiedergabe erzeugt werden soll.
  • Obgleich im Vorstehenden hauptsächlich Impulsantworten als Schallfelddaten dargestellt worden sind, können beliebige andere Schallfelddaten, beispielsweise Schallfelddaten nach Betrag und Vektor also im Hinblick auf z. B. Schalldruck und Schallschnelle an bestimmten Positionen im Raum ebenfalls eingesetzt werden. Auch diese Schallfelddaten können in wichtigere und weniger wichtigere Anteile im Hinblick auf die menschliche Richtungswahrnehmung aufgeteilt und in harmonische Komponenten umgesetzt werden. Die Schallfelddaten können auch jede Art von Impulsantworten, wie beispielsweise Head-Related Transfer Functions(HRTF-)Funktionen oder Binaural Room Impulse Responses(BRIR-)Funktionen oder Impulsantworten von jeweils einem diskreten Punkt zu einer vorbestimmten Position in dem Gebiet umfassen.
  • Vorzugsweise wird ein Raum mit einem Kugelarray abgetastet. Dann liegt das Schallfeld als Satz von Impulsantworten vor. Im Zeitbereich wird das Schallfeld in seine frühen und späten Anteile zerlegt. Anschließend werden beide Teile in ihre sphärischen oder zylindrischen harmonischen Komponenten zerlegt. Da die relativen Richtungsinformationen im frühen Schallfeld vorhanden sind, wird hier eine höhere Ordnung der sphärischen Harmonischen gerechnet als im späten Schallfeld, das für eine niedrige Ordnung ausreichend ist. Der frühe Teil ist verhältnismäßig kurz, beispielsweise 100 ms und wird genau, also mit vielen harmonischen Komponenten dargestellt, während der späte Teil, beispielsweise 100 ms bis 2 s oder 10 s lang ist. Dieser späte Teil wird jedoch mit weniger oder nur einer einzigen harmonischen Komponente dargestellt.
  • Eine weitere Datenreduktion ergibt sich durch die Aufspaltung des frühen Schallfelds in einzelne Bänder vor der Darstellung als sphärische Harmonische. Dazu wird nach der Trennung im Zeitbereich in frühes und spätes Schallfeld das frühe Schallfeld mittels einer Filterbank in seine spektralen Anteile zerlegt. Durch Unterabtastung der einzelnen Frequenzbänder wird eine Datenreduktion erreicht, die die Berechnung der harmonischen Komponenten deutlich beschleunigt. Zusätzlich wird für jedes Frequenzband eine in Abhängigkeit der menschlichen Richtungswahrnehmung perzeptiv ausreichend frühe Ordnung verwendet. So sind für niedrige Frequenzbänder, in denen die menschliche Richtungswahrnehmung niedrig ist, niedrige Ordnungen oder sogar für das niedrigste Frequenzband die Ordnung null ausreichen, während bei hohen Bändern höhere Ordnungen bis zur maximal sinnvollen Ordnung im Hinblick auf die Genauigkeit des gemessenen Schallfeldes benötigt werden. Auf der Decodierer- bzw. Dekomprimierer-Seite wird das komplette Spektrum rekonstruiert. Anschließend werden frühes oder spätes Schallfeld wieder kombiniert. Die Daten stehen nun zur Auralisation bereit.
  • Obwohl manche Aspekte im Zusammenhang mit einer Vorrichtung beschrieben wurden, versteht es sich, dass diese Aspekte auch eine Beschreibung des entsprechenden Verfahrens darstellen, sodass ein Block oder ein Bauelement einer Vorrichtung auch als ein entsprechender Verfahrensschritt oder als ein Merkmal eines Verfahrensschrittes zu verstehen ist. Analog dazu stellen Aspekte, die im Zusammenhang mit einem oder als ein Verfahrensschritt beschrieben wurden, auch eine Beschreibung eines entsprechenden Blocks oder Details oder Merkmals einer entsprechenden Vorrichtung dar. Einige oder alle der Verfahrensschritte können durch einen Hardware-Apparat (oder unter Verwendung eines Hardware-Apparats), wie zum Beispiel einen Mikroprozessor, einen programmierbaren Computer oder eine elektronische Schaltung ausgeführt werden. Bei einigen Ausführungsbeispielen können einige oder mehrere der wichtigsten Verfahrensschritte durch einen solchen Apparat ausgeführt werden.
  • Je nach bestimmten Implementierungsanforderungen können Ausführungsbeispiele der Erfindung in Hardware oder in Software implementiert sein. Die Implementierung kann unter Verwendung eines digitalen Speichermediums, beispielsweise einer Floppy-Disk, einer DVD, einer Blu-ray Disc, einer CD, eines ROM, eines PROM, eines EPROM, eines EEPROM oder eines FLASH-Speichers, einer Festplatte oder eines anderen magnetischen oder optischen Speichers durchgeführt werden, auf dem elektronisch lesbare Steuersignale gespeichert sind, die mit einem programmierbaren Computersystem derart zusammenwirken können oder zusammenwirken, dass das jeweilige Verfahren durchgeführt wird. Deshalb kann das digitale Speichermedium computerlesbar sein.
  • Manche Ausführungsbeispiele gemäß der Erfindung umfassen also einen Datenträger, der elektronisch lesbare Steuersignale aufweist, die in der Lage sind, mit einem programmierbaren Computersystem derart zusammenzuwirken, dass eines der hierin beschriebenen Verfahren durchgeführt wird.
  • Allgemein können Ausführungsbeispiele der vorliegenden Erfindung als Computerprogrammprodukt mit einem Programmcode implementiert sein, wobei der Programmcode dahin gehend wirksam ist, eines der Verfahren durchzuführen, wenn das Computerprogrammprodukt auf einem Computer abläuft.
  • Der Programmcode kann beispielsweise auch auf einem maschinenlesbaren Träger gespeichert sein.
  • Andere Ausführungsbeispiele umfassen das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren, wobei das Computerprogramm auf einem maschinenlesbaren Träger gespeichert ist.
  • Mit anderen Worten ist ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens somit ein Computerprogramm, das einen Programmcode zum Durchführen eines der hierin beschriebenen Verfahren aufweist, wenn das Computerprogramm auf einem Computer abläuft.
  • Ein weiteres Ausführungsbeispiel der erfindungsgemäßen Verfahren ist somit ein Datenträger (oder ein digitales Speichermedium oder ein computerlesbares Medium), auf dem das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren aufgezeichnet ist.
  • Ein weiteres Ausführungsbeispiel des erfindungsgemäßen Verfahrens ist somit ein Datenstrom oder eine Sequenz von Signalen, der bzw. die das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren darstellt bzw. darstellen. Der Datenstrom oder die Sequenz von Signalen kann bzw. können beispielsweise dahin gehend konfiguriert sein, über eine Datenkommunikationsverbindung, beispielsweise über das Internet, transferiert zu werden.
  • Ein weiteres Ausführungsbeispiel umfasst eine Verarbeitungseinrichtung, beispielsweise einen Computer oder ein programmierbares Logikbauelement, die dahin gehend konfiguriert oder angepasst ist, eines der hierin beschriebenen Verfahren durchzuführen.
  • Ein weiteres Ausführungsbeispiel umfasst einen Computer, auf dem das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren installiert ist.
  • Ein weiteres Ausführungsbeispiel gemäß der Erfindung umfasst eine Vorrichtung oder ein System, die bzw. das ausgelegt ist, um ein Computerprogramm zur Durchführung zumindest eines der hierin beschriebenen Verfahren zu einem Empfänger zu übertragen. Die Übertragung kann beispielsweise elektronisch oder optisch erfolgen. Der Empfänger kann beispielsweise ein Computer, ein Mobilgerät, ein Speichergerät oder eine ähnliche Vorrichtung sein. Die Vorrichtung oder das System kann beispielsweise einen Datei-Server zur Übertragung des Computerprogramms zu dem Empfänger umfassen.
  • Bei manchen Ausführungsbeispielen kann ein programmierbares Logikbauelement (beispielsweise ein feldprogrammierbares Gatterarray, ein FPGA) dazu verwendet werden, manche oder alle Funktionalitäten der hierin beschriebenen Verfahren durchzuführen. Bei manchen Ausführungsbeispielen kann ein feldprogrammierbares Gatterarray mit einem Mikroprozessor zusammenwirken, um eines der hierin beschriebenen Verfahren durchzuführen. Allgemein werden die Verfahren bei einigen Ausführungsbeispielen seitens einer beliebigen Hardwarevorrichtung durchgeführt. Diese kann eine universell einsetzbare Hardware wie ein Computerprozessor (CPU) sein oder für das Verfahren spezifische Hardware, wie beispielsweise ein ASIC.
  • Die oben beschriebenen Ausführungsbeispiele stellen lediglich eine Veranschaulichung der Prinzipien der vorliegenden Erfindung dar. Es versteht sich, dass Modifikationen und Variationen der hierin beschriebenen Anordnungen und Einzelheiten anderen Fachleuten einleuchten werden. Deshalb ist beabsichtigt, dass die Erfindung lediglich durch den Schutzumfang der nachstehenden Patentansprüche und nicht durch die spezifischen Einzelheiten, die anhand der Beschreibung und der Erläuterung der Ausführungsbeispiele hierin präsentiert wurden, beschränkt sei.

Claims (23)

  1. Vorrichtung zum Komprimieren von Schallfelddaten (10) eines Gebiets, mit folgenden Merkmalen: einem Aufteiler (100) zum Aufteilen der Schallfelddaten in einen ersten Anteil (101) und in einen zweiten Anteil (102); und einem Umsetzer (140, 180) zum Umsetzen des ersten Anteils (101) und des zweiten Anteils (102) in harmonische Komponenten (141, 182), wobei der Umsetzer (140, 180) ausgebildet ist, um den zweiten Anteil (102) in eine oder mehrere harmonische Komponenten (141) mit einer zweiten Ordnung umzusetzen, und um den ersten Anteil (101) in harmonische Komponenten mit einer ersten Ordnung umzusetzen, wobei die erste Ordnung höher als die zweite Ordnung ist, um die komprimierten Schallfelddaten zu erhalten.
  2. Vorrichtung nach Anspruch 1, bei der der Umsetzer (140, 180) ausgebildet ist, um für den ersten Anteil, der für eine Richtungswahrnehmung des menschlichen Gehörs wichtiger als der zweite Anteil ist, die harmonischen Komponenten mit der ersten Ordnung zu berechnen, die höher als die zweite Ordnung ist.
  3. Vorrichtung nach Anspruch 1 oder 2, bei der der Aufteiler (100) ausgebildet ist, um die Schallfelddaten (10) in den ersten Anteil, der erste Reflexionen in dem Gebiet umfasst, und in den zweiten Anteil, der zweite Reflexionen in dem Gebiet umfasst, aufzuspalten, wobei die zweiten Reflexionen zeitlich später als die ersten Reflexionen auftreten.
  4. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Aufteiler (100) ausgebildet ist, um eine spektrale Aufteilung durchzuführen und eine Filterbank (100b) zum Filtern zumindest eines Teils der Schallfelddaten (10) aufweist, um Schallfelddaten in verschiedenen Filterbankkanälen (140a, 140b, 140c) zu erhalten, und wobei der Umsetzer ausgebildet ist, um für ein Subbandsignal aus einem ersten Filterbankkanal die Komponenten mit der ersten Ordnung zu berechnen, und um für ein Subbandsignal aus einem zweiten Filterbankkanal die harmonischen Komponenten mit der zweiten Ordnung zu berechnen, wobei eine Mittenfrequenz des ersten Filterbankkanals höher als eine Mittenfrequenz des zweiten Filterbankkanals ist.
  5. Vorrichtung nach einem der Ansprüche 1 und 2, bei der der Aufteiler (100) ausgebildet ist, um die Schallfelddaten in den ersten Anteil, der erste Reflexionen in dem Gebiet umfasst, und in den zweiten Anteil, der zweite Reflexionen in dem Gebiet umfasst, aufzuteilen, wobei die zweiten Reflexionen zeitlich später als die ersten Reflexionen auftreten, und bei dem der Aufteiler (100) ferner ausgebildet ist, um den ersten Anteil in spektrale Anteile (101, 102) zu zerlegen, und um die spektralen Anteile jeweils in eine oder mehrere harmonische Komponenten mit unterschiedlicher Ordnung umzusetzen, wobei eine Ordnung für einen spektralen Anteil mit einem höheren Frequenzband höher ist als eine Ordnung für einen spektralen Anteil in einem niedrigeren Frequenzband.
  6. Vorrichtung nach einem der vorhergehenden Ansprüche, die ferner eine Ausgabe-Schnittstelle (190) aufweist, um die eine oder die mehreren harmonischen Komponenten (182) mit der zweiten Ordnung und die harmonischen Komponenten mit der ersten Ordnung (141) zusammen mit Seiteninformationen (300), die einen Hinweis auf die erste Ordnung oder die zweite Ordnung aufweisen, zur Übertragung und Speicherung zu liefern.
  7. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Schallfelddaten ein dreidimensionales Gebiet beschreiben und der Umsetzer ausgebildet ist, um als die harmonischen Komponenten zylindrische harmonische Komponenten zu berechnen, oder bei der die Schallfelddaten (10) ein dreidimensionales Gebiet beschreiben und der Umsetzer (140, 180) ausgebildet ist, um als die harmonischen Komponenten sphärische harmonische Komponenten zu berechnen.
  8. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Schallfelddaten als eine erste Anzahl von diskreten Signalen vorliegen, bei der der Umsetzer (140, 180) für den ersten Anteil (101) und den zweiten Anteil (102) eine zweite gesamte Anzahl von harmonischen Komponenten liefert, und bei der die zweite gesamte Anzahl von harmonischen Komponenten kleiner als die erste Anzahl von diskreten Signalen ist.
  9. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Aufteiler (100) ausgebildet ist, um als Schallfelddaten (10) eine Vielzahl verschiedener Impulsantworten zu verwenden, die unterschiedlichen Positionen in dem Gebiet zugeordnet sind.
  10. Vorrichtung nach Anspruch 9, bei der die Impulsantworten Head-Related Transfer Functions(HRTF-)Funktionen oder Binaural Room Impulse Responses(BRIR-)Funktionen oder Impulsantworten von jeweils einem diskreten Punkt in dem Gebiet zu einer vorbestimmten Position in dem Gebiet sind.
  11. Vorrichtung nach einem der vorhergehenden Ansprüche, die ferner folgendes Merkmal aufweist: einen Decodierer (2) zum Dekomprimieren der komprimierten Schallfelddaten unter Verwendung einer Kombination des ersten und des zweiten Anteils und unter Verwendung einer Umsetzung von einer Harmonische-Komponenten-Darstellung in eine Zeitbereichsdarstellung, um eine dekomprimierte Darstellung zu erreichen; und eine Steuerung (4) zum Steuern des Aufteilers (100) oder des Umsetzers (140, 180) bezüglich der ersten oder zweiten Ordnung, wobei die Steuerung (4) ausgebildet ist, um unter Verwendung eines psychoakustischen Moduls die dekomprimierten Schallfelddaten mit den Schallfelddaten (10) zu vergleichen und um den Aufteiler (100) oder den Umsetzer (140, 180) unter Verwendung des Vergleichs anzusteuern.
  12. Vorrichtung nach Anspruch 11, bei der der Decodierer ausgebildet ist, um die harmonischen Komponenten der zweiten Ordnung und die harmonischen Komponenten der ersten Ordnung umzusetzen (241, 242), und dann eine Kombination der umgesetzten harmonischen Komponenten durchzuführen, oder wobei der Decodierer (2) ausgebildet ist, um die harmonischen Komponenten mit der zweiten Ordnung und die harmonischen Komponenten mit der ersten Ordnung zu kombinieren (245), und um ein Ergebnis der Kombination in dem Kombinierer (245) von einem Harmonische-Komponenten-Bereich in den Zeitbereich umzusetzen (244).
  13. Vorrichtung nach Anspruch 11, bei der der Decodierer ausgebildet ist, um harmonische Komponenten verschiedener spektraler Anteile mit unterschiedlichen Ordnungen umzusetzen (140a, 140b), um unterschiedliche Verarbeitungszeiten für unterschiedliche spektrale Anteile auszugleichen (304, 306), und um in einen Zeitbereich umgesetzte spektrale Anteile des ersten Anteils mit in den Zeitbereich umgesetzten spektralen Komponenten des zweiten Anteils durch zueinander serielle Anordnung zu kombinieren.
  14. Vorrichtung zum Dekomprimieren von komprimierten Schallfelddaten, die erste harmonischen Komponenten (141) bis zu einer ersten Ordnung und eine oder mehrere zweite harmonische Komponenten (182) bis zu einer zweiten Ordnung aufweisen, wobei die erste Ordnung größer als die zweite Ordnung ist, mit folgenden Merkmalen: einer Eingangsschnittstelle (200) zum Erhalten der komprimierten Schallfelddaten; und einem Prozessor (240) zum Verarbeiten der ersten harmonischen Komponenten (201) und der zweiten harmonischen Komponenten (202) unter Verwendung einer Kombination des ersten und des zweiten Anteils und unter Verwendung einer Umsetzung von einer Harmonische-Komponenten-Darstellung in eine Zeitbereichsdarstellung, um eine dekomprimierte Darstellung zu erreichen, wobei der erste Anteil durch die ersten harmonischen Komponenten und der zweite Anteil durch die zweiten harmonischen Komponenten dargestellt sind.
  15. Vorrichtung nach Anspruch 14, bei der der Prozessor (240) folgende Merkmale aufweist: einen Kombinierer (245) zum Kombinieren der ersten harmonischen Komponenten und der zweiten harmonischen Komponenten, um kombinierte harmonische Komponenten zu erhalten; und einen Umsetzer (244) zum Umsetzen der kombinierten harmonischen Komponenten in den Zeitbereich.
  16. Vorrichtung nach Anspruch 14, bei der der Prozessor folgende Merkmale aufweist: einen Umsetzer (241, 242) zum Umsetzen der ersten harmonischen Komponenten und der zweiten harmonischen Komponenten in den Zeitbereich; und einen Kombinierer (243, 245) zum Zusammensetzen der in den Zeitbereich umgesetzten harmonischen Komponenten, um die dekomprimierten Schallfelddaten zu erhalten.
  17. Vorrichtung nach einem der Ansprüche 14 bis 16, bei der der Prozessor (240) ausgebildet ist, um Informationen über eine Wiedergabeanordnung (610, 612, 614) zu erhalten, und bei der der Prozessor (240) ausgebildet ist, um die dekomprimierten Schallfelddaten (602, 604, 606) zu berechnen und aufgrund der Informationen über die Wiedergabeanordnung einen Teil der Schallfelddaten der dekomprimierten Schallfelddaten zu Zwecken einer Wiedergabe auszuwählen (608), oder bei der der Prozessor ausgebildet ist, um nur einen Teil der für die Wiedergabeanordnung nötigen dekomprimierten Schallfelddaten zu berechnen.
  18. Vorrichtung nach einem der Ansprüche 14 bis 17, bei der die ersten harmonischen Komponenten der ersten Ordnung einen ersten Spektralbereich darstellen, und die eine oder die mehreren harmonischen Komponenten der zweiten Ordnung einen unterschiedlichen Spektralbereich darstellen, wobei der Prozessor (240) ausgebildet ist, um die harmonischen Komponenten der ersten Ordnung im den Spektralbereich umzusetzen, und um die eine oder die mehreren zweiten harmonischen Komponenten der zweiten Ordnung in den Spektralbereich umzusetzen, und um die umgesetzten harmonischen Komponenten mittels einer Synthese-Filterbank (245) zu kombinieren, um eine Darstellung von Schallfelddaten in dem Zeitbereich zu erhalten.
  19. Vorrichtung nach einem der Ansprüche 14 bis 18, bei der die ersten harmonischen Komponenten mit der ersten Ordnung frühe Reflexionen des Gebiets darstellen und die zweiten harmonischen Komponenten mit der zweiten Ordnung späte Reflexionen des Gebiets darstellen, und bei der der Prozessor (240) ausgebildet ist, um die ersten harmonischen Komponenten und die zweiten harmonischen Komponenten zu addieren und um ein Ergebnis der Addition in den Zeitbereich umzusetzen, um die dekomprimierten Schallfelddaten zu erhalten.
  20. Vorrichtung nach einem der Ansprüche 14 bis 19, bei der der Prozessor ausgebildet ist, um zum Umsetzen eine inverse Raumtransformation (604) und eine inverse Fouriertransformation (606) durchzuführen.
  21. Verfahren zum Komprimieren von Schallfelddaten (10) eines Gebiets, mit folgenden Schritten: Aufteilen (100) der Schallfelddaten in einen ersten Anteil (101) und in einen zweiten Anteil (102); und Umsetzen (140, 180) des ersten Anteils (101) und des zweiten Anteils (102) in harmonische Komponenten (141, 182), wobei der zweite Anteil (102) in eine oder mehrere harmonische Komponenten (141) mit einer zweiten Ordnung umgesetzt wird, und wobei der erste Anteil (101) in harmonische Komponenten mit einer ersten Ordnung umgesetzt wird, wobei die erste Ordnung höher als die zweite Ordnung ist, um die komprimierten Schallfelddaten zu erhalten.
  22. Verfahren zum Dekomprimieren von komprimierten Schallfelddaten, die erste harmonischen Komponenten (141) bis zu einer ersten Ordnung und eine oder mehrere zweite harmonische Komponenten (182) bis zu einer zweiten Ordnung aufweisen, wobei die erste Ordnung größer als die zweite Ordnung ist, mit folgenden Schritten: Erhalten (200) der komprimierten Schallfelddaten; und Verarbeiten (240) der ersten harmonischen Komponenten (201) und der zweiten harmonischen Komponenten (202) unter Verwendung einer Kombination des ersten und des zweiten Anteils und unter Verwendung einer Umsetzung von einer Harmonische-Komponenten-Darstellung in eine Zeitbereichsdarstellung, um eine dekomprimierte Darstellung zu erreichen, wobei der erste Anteil durch die ersten harmonischen Komponenten und der zweite Anteil durch die zweiten harmonischen Komponenten dargestellt sind.
  23. Computerprogramm zum Durchführen eines Verfahrens nach einem der Ansprüche 21 bis 22, wenn das Verfahren auf einem Computer abläuft.
DE201310223201 2013-11-14 2013-11-14 Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes Expired - Fee Related DE102013223201B3 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE201310223201 DE102013223201B3 (de) 2013-11-14 2013-11-14 Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
JP2016530874A JP6329629B2 (ja) 2013-11-14 2014-11-05 領域の音場データを圧縮および解凍するための方法および装置
CN201480061929.3A CN105766002B (zh) 2013-11-14 2014-11-05 用于对区域的声场数据进行压缩和解压缩的方法和装置
PCT/EP2014/073808 WO2015071148A1 (de) 2013-11-14 2014-11-05 Verfahren und vorrichtung zum komprimieren und dekomprimieren von schallfelddaten eines gebiets
EP14793183.6A EP3069530B1 (de) 2013-11-14 2014-11-05 Verfahren und vorrichtung zum komprimieren und dekomprimieren von schallfelddaten eines gebiets
US15/154,189 US20160255452A1 (en) 2013-11-14 2016-05-13 Method and apparatus for compressing and decompressing sound field data of an area

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE201310223201 DE102013223201B3 (de) 2013-11-14 2013-11-14 Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes

Publications (1)

Publication Number Publication Date
DE102013223201B3 true DE102013223201B3 (de) 2015-05-13

Family

ID=51846694

Family Applications (1)

Application Number Title Priority Date Filing Date
DE201310223201 Expired - Fee Related DE102013223201B3 (de) 2013-11-14 2013-11-14 Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes

Country Status (6)

Country Link
US (1) US20160255452A1 (de)
EP (1) EP3069530B1 (de)
JP (1) JP6329629B2 (de)
CN (1) CN105766002B (de)
DE (1) DE102013223201B3 (de)
WO (1) WO2015071148A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016125886A1 (de) * 2016-12-29 2018-07-05 Symonics GmbH Vorrichtung zur effizienten Berechnung einer Auralisation

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2960903A1 (de) * 2014-06-27 2015-12-30 Thomson Licensing Verfahren und Vorrichtung zur Bestimmung der Komprimierung einer HOA-Datenrahmendarstellung einer niedrigsten Ganzzahl von Bits zur Darstellung nichtdifferentieller Verstärkungswerte
WO2017119318A1 (ja) * 2016-01-08 2017-07-13 ソニー株式会社 音声処理装置および方法、並びにプログラム
US10614788B2 (en) * 2017-03-15 2020-04-07 Synaptics Incorporated Two channel headset-based own voice enhancement
US10764684B1 (en) * 2017-09-29 2020-09-01 Katherine A. Franco Binaural audio using an arbitrarily shaped microphone array
EP3525482B1 (de) 2018-02-09 2023-07-12 Dolby Laboratories Licensing Corporation Mikrofonanordnung für die erfassung eines schallfeldes
ES2954317T3 (es) * 2018-03-28 2023-11-21 Fund Eurecat Técnica de reverberación para audio 3D
JP7321170B2 (ja) * 2018-04-16 2023-08-04 ドルビー ラボラトリーズ ライセンシング コーポレイション 方向性音源のエンコードおよびデコードのための方法、装置およびシステム
GB2574873A (en) * 2018-06-21 2019-12-25 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
GB201818959D0 (en) * 2018-11-21 2019-01-09 Nokia Technologies Oy Ambience audio representation and associated rendering
EP3683794B1 (de) * 2019-01-15 2021-07-28 Nokia Technologies Oy Audioverarbeitung
CN110265042B (zh) * 2019-05-31 2021-07-23 歌尔科技有限公司 声音信号处理方法、装置及设备
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1677576A2 (de) * 1998-04-07 2006-07-05 Dolby Laboratories Licensing Corporation Verfahren und System zur räumlichen Kodierung mit niedriger Bitrate
EP2205007A1 (de) * 2008-12-30 2010-07-07 Fundació Barcelona Media Universitat Pompeu Fabra Verfahren und Vorrichtung zur Kodierung dreidimensionaler Hörbereiche und zur optimalen Rekonstruktion
EP2296142A2 (de) * 2005-08-02 2011-03-16 Dolby Laboratories Licensing Corporation Steuerung von räumlichen Audiocodierungsparametern als Funktion von Gehörereignissen
EP2334103A2 (de) * 2009-12-09 2011-06-15 Samsung Electronics Co., Ltd. Vorrichtung und Verfahren zur Tonverbesserung
EP2451196A1 (de) * 2010-11-05 2012-05-09 Thomson Licensing Verfahren und Vorrichtung zur Erzeugung und Decodierung von Schallfelddaten einschließlich Ambisonics-Schallfelddaten höher als drei
US8340306B2 (en) * 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP2592845A1 (de) * 2011-11-11 2013-05-15 Thomson Licensing Verfahren und Vorrichtung zur Verarbeitung von Signalen einer kugelförmigen Mikrofonanordnung auf einer starren Kugel zur Erzeugung einer Ambisonics-Wiedergabe des Klangfelds
EP2609759A1 (de) * 2010-08-27 2013-07-03 SonicEmotion AG Verfahren und vorrichtung für erhöhte klangfeldwiedergabe von räumlich codierten audioeingangssignalen

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54149684A (en) * 1978-05-15 1979-11-24 Sanyo Electric Co Ltd Reverberation meter
JP3295139B2 (ja) * 1992-09-28 2002-06-24 日本放送協会 残響付加装置
US5440639A (en) * 1992-10-14 1995-08-08 Yamaha Corporation Sound localization control apparatus
WO1999051062A1 (en) * 1998-03-31 1999-10-07 Lake Technolgy Limited Formulation of complex room impulse responses from 3-d audio information
FR2851879A1 (fr) * 2003-02-27 2004-09-03 France Telecom Procede de traitement de donnees sonores compressees, pour spatialisation.
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
JP4277234B2 (ja) * 2007-03-13 2009-06-10 ソニー株式会社 データ復元装置、データ復元方法及びデータ復元プログラム
CA2732079C (en) * 2008-07-31 2016-09-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Signal generation for binaural signals
US9703756B2 (en) * 2008-09-05 2017-07-11 Adobe Systems Incorporated Method and apparatus for converting spherical harmonics representations of functions into multi-resolution representations
JP5168208B2 (ja) * 2009-03-30 2013-03-21 ヤマハ株式会社 オーディオ信号処理装置およびスピーカ装置
US9047876B2 (en) * 2010-03-30 2015-06-02 Panasonic Intellectual Property Managment Co., Ltd. Audio device
EP2375779A3 (de) * 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zum Messen einer Vielzahl von Lautsprechern und Mikrofonanordnung
JP4886881B2 (ja) * 2010-06-30 2012-02-29 株式会社東芝 音響補正装置、音響出力装置、及び音響補正方法
EP2782094A1 (de) * 2013-03-22 2014-09-24 Thomson Licensing Verfahren und Vorrichtung zur Erhöhung der Richtwirkung eines Ambisonics-Signals erster Ordnung
US9674632B2 (en) * 2013-05-29 2017-06-06 Qualcomm Incorporated Filtering with binaural room impulse responses
WO2015041477A1 (ko) * 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1677576A2 (de) * 1998-04-07 2006-07-05 Dolby Laboratories Licensing Corporation Verfahren und System zur räumlichen Kodierung mit niedriger Bitrate
US8340306B2 (en) * 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
EP2296142A2 (de) * 2005-08-02 2011-03-16 Dolby Laboratories Licensing Corporation Steuerung von räumlichen Audiocodierungsparametern als Funktion von Gehörereignissen
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP2205007A1 (de) * 2008-12-30 2010-07-07 Fundació Barcelona Media Universitat Pompeu Fabra Verfahren und Vorrichtung zur Kodierung dreidimensionaler Hörbereiche und zur optimalen Rekonstruktion
EP2334103A2 (de) * 2009-12-09 2011-06-15 Samsung Electronics Co., Ltd. Vorrichtung und Verfahren zur Tonverbesserung
EP2609759A1 (de) * 2010-08-27 2013-07-03 SonicEmotion AG Verfahren und vorrichtung für erhöhte klangfeldwiedergabe von räumlich codierten audioeingangssignalen
EP2451196A1 (de) * 2010-11-05 2012-05-09 Thomson Licensing Verfahren und Vorrichtung zur Erzeugung und Decodierung von Schallfelddaten einschließlich Ambisonics-Schallfelddaten höher als drei
EP2592845A1 (de) * 2011-11-11 2013-05-15 Thomson Licensing Verfahren und Vorrichtung zur Verarbeitung von Signalen einer kugelförmigen Mikrofonanordnung auf einer starren Kugel zur Erzeugung einer Ambisonics-Wiedergabe des Klangfelds

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016125886A1 (de) * 2016-12-29 2018-07-05 Symonics GmbH Vorrichtung zur effizienten Berechnung einer Auralisation
DE102016125886B4 (de) * 2016-12-29 2019-08-29 Symonics GmbH Vorrichtung und Verfahren zur effizienten Berechnung einer Auralisation

Also Published As

Publication number Publication date
JP6329629B2 (ja) 2018-05-23
EP3069530B1 (de) 2019-02-20
WO2015071148A1 (de) 2015-05-21
US20160255452A1 (en) 2016-09-01
EP3069530A1 (de) 2016-09-21
CN105766002B (zh) 2018-04-20
JP2017500782A (ja) 2017-01-05
CN105766002A (zh) 2016-07-13

Similar Documents

Publication Publication Date Title
DE102013223201B3 (de) Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
US11622218B2 (en) Method and apparatus for processing multimedia signals
US10692508B2 (en) Method for generating filter for audio signal and parameterizing device therefor
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE60304358T2 (de) Verfahren zur verarbeitung von audiodateien und erfassungsvorrichtung zur anwendung davon
DE60311794T2 (de) Signalsynthese
KR101456640B1 (ko) 공간적 출력 다채널 오디오 신호를 결정하기 위한 장치
DE602004001868T2 (de) Verfahren zum bearbeiten komprimierter audiodaten zur räumlichen wiedergabe
EP1687809A1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE112019003358T5 (de) Verfahren und vorrichtung zum codieren und/oder decodieren immersiver audiosignale
WO2015036271A2 (de) Vorrichtung und verfahren zur dekorrelation von lautsprechersignalen
DE112015003108B4 (de) Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals
EP1471770B1 (de) Verfahren zur Erzeugung einer angenäherten Teilübertragungsfunktion
EP2357854B1 (de) Verfahren und Vorrichtung zur Erzeugung individuell anpassbarer binauraler Audiosignale
DE102011003450A1 (de) Erzeugung von benutzerangepassten Signalverarbeitungsparametern
EP2503799B1 (de) Verfahren und System zur Berechnung synthetischer Außenohrübertragungsfunktionen durch virtuelle lokale Schallfeldsynthese
DE112021004444T5 (de) Stereobasierte immersive codierung (stic)
DE102017121876A1 (de) Verfahren und vorrichtung zur formatumwandlung eines mehrkanaligen audiosignals

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R082 Change of representative

Representative=s name: SCHOPPE, ZIMMERMANN, STOECKELER, ZINKLER, SCHE, DE

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee