WO2009118347A1 - Verfahren zur wiedergabe von audiodaten mit einen kopfhörer und entsprechendes system - Google Patents

Verfahren zur wiedergabe von audiodaten mit einen kopfhörer und entsprechendes system Download PDF

Info

Publication number
WO2009118347A1
WO2009118347A1 PCT/EP2009/053529 EP2009053529W WO2009118347A1 WO 2009118347 A1 WO2009118347 A1 WO 2009118347A1 EP 2009053529 W EP2009053529 W EP 2009053529W WO 2009118347 A1 WO2009118347 A1 WO 2009118347A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio signals
channels
processed
audio data
audio
Prior art date
Application number
PCT/EP2009/053529
Other languages
English (en)
French (fr)
Inventor
Erich Meier
Original Assignee
Erich Meier
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Erich Meier filed Critical Erich Meier
Publication of WO2009118347A1 publication Critical patent/WO2009118347A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones

Definitions

  • the input audio signals are divided into exactly four channels, and in yet another advantageous embodiment, three of the four channels correspond to the three channels in the method described above.
  • three of the four channels correspond to the three channels in the method described above.
  • Figure 1 A shows a schematic plan view of a conventional
  • FIG. 1A illustrates a conventional arrangement with two loudspeakers and the head of the listener, which have been set up according to the principle of the principle of the stereo triangle.
  • the reference numerals L and R refer to the left and right speakers, respectively.
  • the reference Z stands for the listener whose ears with the two loudspeakers L and R form the equiangular (or the equilateral) triangle.
  • a reproduced audio recording sounds "natural", since the audio data are recorded and processed so that the listener Z creates the impression that the sources of audio data are within the space, which is indicated in Figure 1 A by the arrow becomes.
  • This stereo triangle principle can be extended even further speakers are inserted in this arrangement, so that the so-called surround sound or surround arrangements arise.
  • the reproduction of audio data in a surround arrangement requires specially prepared recordings, and the reproduction of this audio data with a classical arrangement (only two loudspeakers) does not distort the perception with regard to the spatial distribution of the audio sources.
  • the second channel K2 stands for the so-called crossfeed effect.
  • the crossfeed effect is also called crosstalk effect in the literature.
  • the sound waves emitted from the left speaker L are detected not only from the left ear but also from the right ear of the listener Z. The same thing happens with the sound waves radiated from the right speaker R.
  • This crossfeed effect is completely absent when playing audio data with headphones, as headphones are usually built in the form of shells that completely surround the ears.
  • a further processing module C is used in addition to the equalizer module D.
  • This processing module C in the crossfeed channel K2 accommodates a delay module. By means of a delay, a delayed copy of the input signal can be output. Thanks to a delay can be compensated for the fact that due to different lengths of propagation paths in the air, the same sound signals from the two ears are recorded with a time difference.
  • this channel K3 also contains a processing module F with a corresponding equalizer.
  • the channel K3 comprises a further processing module E, in which, similar to the second channel K2, a delay is incorporated. Thanks to a well-chosen combination of delay parameters, the desired effects can be achieved.
  • the parameters of the delay processing modules C and E can either be programmed permanently or adapted dynamically.
  • the input audio signals IN After the input audio signals IN have been supplied to the input module A, they are now divided by means of the input module A into the four channels K1, K2, K3, K4. Subsequently, the audio signals in each the four channels K1, K2, K3, K4 processed differently by means of processing modules B, ..., H.
  • the fourth channel K4 (substantially corresponds to the third channel of the embodiment with only three channels) a frontal perception of the direct audio signals is simulated, i. the left channel is routed to the left and right channels to the right channel of the output module I.
  • this channel K4 also contains a processing module H with a corresponding equalizer and a further processing module G, in which, similar to the channels K2 and K3, a delay is incorporated.
  • the parameters of the delay processing modules C, E and G can either be programmed permanently or adapted dynamically.
  • the processed audio signals from the individual channels K1, K2, K3 and K4 are fed to an output module I.
  • the output module I Output audio OUT combined together.
  • the output signals OUT basically correspond to the input signals IN in terms of the number of lines and other physical characteristics.
  • the output audio signals OUT are fed to the headphones I, r for playback.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

Die vorliegende Erfindung bezieht sich auf ein Verfahren zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten mittels Kopfhörern (I, r), wobei diese gespeicherten Audiodaten nicht für die Wiedergabe mittels Kopfhörern (I, r) aufgenommen und verarbeitet sind, in welchem Verfahren diese gespeicherten Audiodaten mittels mindestens eines Aufbereitungsmoduls (A,..., I) verarbeitet werden. Ausserdem bezieht sich diese Erfindung auch auf ein entsprechendes System. Erfindungsgemäss werden die Audiodaten vom Datenträger gelesen und als Eingangsaudiosignale (IN) mindestens einem Eingangsmodul (A) zugeführt, mittels des Eingangsmoduls (A) in mindestens zwei Kanäle (K1, K2, K3, K4) geteilt, dann in den einzelnen Kanälen (K1, K2, K3, K4) mittels Verarbeitungsmodulen (B,..., H) verarbeitet und aus den einzelnen Kanälen (K1, K2, K3, K4) einem Ausgangsmodul (I) zugeführt, wobei die verarbeiteten Audiosignale in ein Ausgangsaudiosignal (OUT) zusammen gefügt werden, und dann schliesslich den Kopfhörern (I, r) zur Wiedergabe zugeführt werden.

Description

VERFAHREN ZUR WIEDERGABE VON AUDIODATEN MIT EINEN KOPFHÖRER UND ENTSPRECHENDES
SYSTEM
Sachgebiet der Erfindung
Die vorliegende Erfindung betrifft ein Verfahren zur Wiedergabe von 5 auf einem Datenträger gespeicherten Audiodaten, sowie ein entsprechendes System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten. Die vorliegende Erfindung betrifft insbesondere ein Verfahren und ein entsprechendes System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten mittels Kopfhörern, wobei die gespeicherten Audiodaten nicht für 10 die Wiedergabe mittels Kopfhörern aufgenommen und verarbeitet sind, wobei diese gespeicherten Audiodaten mittels mindestens einem Aufbereitungsmodul verarbeitet werden.
Stand der Technik
15 Heutzutage wird zur Herstellung der Audioaufnahme, der Mischung der Aufnahme und anschliessenden Speicherung von Audiodaten, welche dem breiten Publikum auf verschiedenen Datenträgern (z.B. auf CDs) zur Verfügung gestellt werden, grundsätzlich immer das Prinzip des so genannten Stereodreiecks verwendet.
20 Das Stereodreieck geht von der heute allgemein akzeptierten Lautsprecheraufstellung aus, bei welcher der Kopf des Zuhörers zusammen mit den beiden Lautsprechern ein gleichseitiges Dreieck bildet. Dieses Dreieck hat drei gleiche 60° Winkel; also vom auf der Mittellinie befindlichen Zuhörer aus gesehen stehen die Lautsprecher in einem Schalleinfallswinkel von ±30°. Diese
25 Aufstellung der Lautsprecher wird in Fig. 1A schematisch illustriert. In Fig. 1A wird der Zuhörer durch das Bezugszeichen Z dargestellt, während die beiden Lautsprecher durch L (für links) und R (für rechts) gekennzeichnet sind.
Wird eine gemäss diesem Prinzip aufgenommene Audioaufnahme nun über diese zwei Lautsprecher L, R wiedergegeben, die sich etwa in Oh- renhöhe vor dem Zuhörer Z befinden, so entsteht im Raum eine Schallfeldüberlagerung, welche auf der Mittellinie zwischen den Lautsprechern L, R einen Stereo-Höreindruck erzeugt. Dank dem inzwischen jahrzehnteelangen Einsatz dieser Audioaufnahme- und -aufbereitungstechnik empfinden die Zuhörer heu- te solche Aufnahmen als den „natürlichen" Klang, obwohl dieser Klang nicht dem echten natürlichen Klang entspricht.
Allerdings hat die Miniaturisierung der Audiowiedergabegeräte einerseits, sowie die Einführung neuer Audioaufnahmeformate (wie MP3, etc.) andererseits seit einigen Jahren dazu geführt, dass Audioaufnahmen heute sehr oft über Kopfhörer und kopfhörerähnliche Geräte wiedergegeben werden. Da aber die Aufnahmen eben für die Wiedergabe über zwei gemäss dem Stereodreieck aufgestellte Lautsprecher L, R abgefertigt werden, klingen diese Aufnahmen im Falle einer Kopfhörerwiedergabe ziemlich anders. Dies ist nicht erstaunlich, da bei der Verwendung von Kopfhörern vollständig andere Hörbe- dingungen vorliegen. Während die Lautsprecher L, R beide Ohren beschallen, kann der Klang von einer Kopfhörermuschel I, r, wie in Fig. 1 B schematisch illustriert, je nur ein einziges Ohr des Zuhörers Z erreichen. Ausserdem sind bei der Widergabe mittels Kopfhörern die akustischen Wirkungen von Ohrmuscheln, des Kopfes und des Rumpfes vollkommen ausgeschaltet.
Daher sind bisher verschiedene Techniken entwickelt worden, welche sich eine Verbesserung der akustischen Wahrnehmung bei Wiedergabe von Audiodaten zum Ziel gesetzt haben. Eine dieser Techniken ist die Verwendung der so genannten HRTF-Funktionen (Head-related Transfer Functions) in der Audioaufnahme und -mischung. Diese HRTF-Funktionen beschreiben auf eine parametrisierte Weise den Einfluss der Anatomie des Kopfes, der Ohrmuschel und des Torsos auf die Reflexionen der Schallwellen, bevor sie von den Ohren aufgenommen werden können. Zudem kann mittels einer so genannten binauralen Aufnahme (mit zwei Mikrofonen, welche die Position der beiden Ohren simulieren), oft kombiniert mit einem künstlichen Kopf, eine relativ getreue Aufnahme zur Wiedergabe mit Kopfhörern realisiert werden. Allerdings basieren alle diese herkömmlichen Techniken auf komplizierten Konzepten (z.B. die Verwendung von so genannten HRTF-Funktionen benötigt eine sehr hohe Rechenleistung, während bei der binauralen Aufnahme eine komplizierte Aufnah- mearchitektur notwendig ist). Damit eignen sich diese herkömmlichen Techniken entweder schlecht für den Einsatz in miniaturisierten Geräten (vor allem aus Energiespargründen), oder weil eine besondere Aufnahmeapparatur zum Einsatz kommen muss.
Offenbarung der Erfindung
Es ist daher eine Aufgabe der vorliegenden Erfindung, eine neues Verfahren zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten, sowie ein neues entsprechendes System vorzuschlagen, welche nicht die oben genannten Nachteile des Standes der Technik aufweisen. Insbesondere ist es eine Aufgabe der vorliegenden Erfindung, ein Verfahren zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten und ein entsprechendes System bereitzustellen, welche ausgehend von nicht für die Wiedergabe mittels Kopfhörern optimierten Audiodaten eine sehr gute Simulation der natürlichen räumlichen Verteilung von Geräuschen auch bei der Aufnahmewiedergabe mit Kopfhörern gewährleistet. Dabei sollten die auf Datenträgern gespeicherten Audiodaten insbesondere so angepasst werden, dass bei deren Anhören mittels Kopfhörern eine Anordnung von Lautsprechern nach dem Stereodreieck- Prinzip und dadurch auch die natürliche Räumlichkeit der Klänge simuliert wer- den.
Gemäss der vorliegenden Erfindung werden diese Ziele insbesondere durch die Elemente der unabhängigen Ansprüche erreicht. Weitere vorteilhafte Ausführungsformen gehen ausserdem aus den abhängigen Ansprüchen und der Beschreibung hervor.
Insbesondere werden die Ziele der vorliegenden Erfindung dadurch erreicht, dass in einem Verfahren zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten mittels Kopfhörern, wobei die gespeicherten Audiodaten nicht für die Wiedergabe mittels Kopfhörern aufgenommen und verarbeitet sind, in welchem Verfahren die gespeicherten Audiodaten mittels mindes- tens eines Aufbereitungsmoduls verarbeitet werden, die Audiodaten vom Datenträger gelesen und als Eingangsaudiosignale mindestens einem Eingangs- modul zugeführt werden, die Eingangsaudiosignale mittels des Eingangsmo- duls in mindestens zwei Kanäle geteilt werden, die Audiosignale in den einzelnen Kanälen mittels Verarbeitungsmodulen verarbeitet werden, die verarbeiteten Audiosignale aus den einzelnen Kanälen einem Ausgangsmodul zugeführt werden, wobei die verarbeiteten Audiosignale in Ausgangsaudiosignale zusammen gefügt werden, und die Ausgangsaudiosignale den Kopfhörern zur Wiedergabe zugeführt werden.
Der Vorteil dieser Erfindung liegt insbesondere darin, dass mittels der Verarbeitungsmodule eine spezifische und gezielte Verarbeitung der auf dem Datenträger aufgenommenen Audiodaten stattfinden kann, so dass die verarbeiteten Audiodaten für eine Wiedergabe mit Kopfhörern optimiert sind. Somit können die ursprünglichen Aufnahmen (d.h. diejenigen, welche für die Wiedergabe mit zwei Lautsprechern gemäss dem Stereodreieck-Prinzip) aufgenommen und verarbeitet sind, auch für die Wiedergabe mit Kopfhörern ver- wendet werden, ohne dass die Klangnatürlichkeit verloren ginge. Ausserdem erlaubt das erfindungsgemässe Verfahren, im Gegensatz zu herkömmlichen Lösungen dieses Problems, eine Verwendung von gewöhnlichen Aufnahmen, welche sich beispielsweise auf handelsüblichen CDs befinden.
In einer vorteilhaften Ausführungsform werden die Eingangsaudio- Signale in genau drei Kanäle geteilt, während die Audiosignale in den einzelnen Kanälen in einer anderen vorteilhaften Ausführungsform durch Equalizer verarbeitet werden. Der Vorteil dieser Ausführungsformen liegt insbesondere darin, dass bei der Verwendung von genau drei Kanälen ein Direktkanal, ein Frontkanal und ein Crossfeed-Kanal realisiert werden können. Crossfeed- Effekt ist in der Literatur auch als C rossta Ik- Effekt bekannt, so dass sich dieser Kanal auch als Crosstalk-Kanal bezeichnen lassen würde. Durch die Verwendung von Equalizern kann eine einfache Anpassung der Audiosignale nach jeweils gewünschten Eigenschaften realisiert werden.
In einer anderen vorteilhaften Ausführungsform der Erfindung wer- den die Eingangsaudiosignale in genau vier Kanäle geteilt, und in einer wieder anderen vorteilhaften Ausführungsform entsprechen drei der vier Kanäle den drei Kanälen im oben beschriebenen Verfahrens. Diese Ausführungsformen haben insbesondere den Vorteil, dass im Vergleich zur Drei-Kanal-Lösung ein weiterer Kanal zur Verfügung steht, dank welchem noch eine Verbesserung der Tonqualität erreicht werden kann.
In einer weiteren Ausführungsform werden die Equalizer-Parameter dynamisch angepasst. Diese Ausführungsform hat unter anderem den Vorteil, dass die Anpassung der auf dem Datenträger gespeicherten Audiosignale für verschiedene Arten von Audioaufnahmen spezifisch und auch in Echtzeit vorgenommen werden kann (so hat z.B. eine Rock-Aufnahme völlig andere Eigenschaften als eine Aufnahme mit klassischer Musik oder mit einem Hörbuch).
Eine andere Ausführungsform stipuliert, dass die Eingangsaudiosignale über einen Kanal unverändert dem Ausgangsmodul zugefügt werden. So ist auch ein Referenzsignal vorhanden, welches mit anderen, angepassten und verarbeiteten Audiosignalen kombiniert werden kann.
In einer weiteren vorteilhaften Ausführungsform der Erfindung wer- den die Audiosignale in mindestens zwei Kanälen durch ein Delay verarbeitet. Auch werden in einer anderen Ausführungsform vorbestimmte Parametersets der Verarbeitungsmodule gespeichert und mittels eines Aktivierungsmoduls eingestellt. Diese Ausführungsformen haben die Vorteile, welche sich bei der Verwendung von Delay in einer einfachen Simulierung der Echo und HaII-Ef- fekten wiederspiegelt. In Kombination mit den anderen Signalverarbeitungstechniken kann dies eine gute Simulation des Stereodreiecks ergeben. Andererseits ist es bei der Verwendung der vorgespeicherten Parametersets beispielsweise möglich, dieselben Kopfhörer durch mehrere Personen benutzen zu lassen, wobei für jede Person eine optimale Anpassung vorgenommen wer- den kann.
An dieser Stelle soll festgehalten werden, dass sich die vorliegende Erfindung neben dem erfindungsgemässen Verfahren zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten ebenfalls auf ein entsprechendes System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten bezieht. Kurze Beschreibung der Zeichnungen
Nachfolgend werden die Ausführungsvarianten der vorliegenden Erfindung anhand von Beispielen beschrieben. Die Beispiele der Ausführungen werden durch folgende beigelegte Figuren illustriert:
Figur 1 A zeigt eine schematische Draufsicht einer herkömmlichen
Anordnung mit zwei Lautsprechern und dem Kopf eines Zuhörers, welche ge- mäss dem Stereodreieck-Prinzip aufgestellt worden sind;
Figur 1 B zeigt eine schematische Draufsicht einer herkömmlichen Anordnung mit dem Kopf eines Zuhörers, an welchem zwei Kopfhörerlautspre- eher symbolisch dargestellt sind;
Figur 1 C zeigt eine schematische Draufsicht einer Anordnung mit dem Kopf eines Zuhörers, an welchem die Wiedergabe der Audiodaten ge- mäss dem erfindungsgemässen Verfahren durchgeführt wird;
Figur 2 zeigt eine schematische Darstellung des Systems zur Wie- dergabe von auf einem Datenträger gespeicherten Audiodaten gemäss einer ersten Ausführungsvariante der vorliegenden Erfindung (Drei-Kanal-Lösung);
Figur 3 zeigt schematisch eine Darstellung des Frequenzgangs im System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten gemäss der Ausführungsvariante der vorliegenden Erfindung aus Figur 2;
Figur 4 zeigt eine schematische Darstellung des Systems zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten gemäss einer zweiten Ausführungsvariante der vorliegenden Erfindung (Vier-Kanal-Lösung); und
Figur 5 zeigt schematisch eine Darstellung des Frequenzgangs im System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten gemäss der Ausführungsvariante der vorliegenden Erfindung aus Figur 4. Ausführungsformen der Erfindung
Wie bereits weiter oben erläutert worden ist, illustriert Figur 1 A eine herkömmliche Anordnung mit zwei Lautsprechern und dem Kopf des Zuhörers, welche gemäss dem Stereodreieck-Prinzip aufgestellt worden sind. In Figur 1 A beziehen sich die Bezugszeichen L und R jeweils auf den linken und den rechten Lautsprecher. Das Bezugszeichen Z steht für den Zuhörer, wessen Ohren mit den beiden Lautsprechern L und R das gleichwinklige (bzw. das gleichseitige) Dreieck bilden. In dieser Stereodreieck-Aufstellung ertönt eine wiedergegebene Audioaufnahme „natürlich", da die Audiodaten so aufgenommen und aufgearbeitet sind, dass beim Zuhörer Z der Eindruck entsteht, dass sich die Quellen der Audiodaten innerhalb des Raumbereichs befinden, welcher in Figur 1 A durch den Pfeil angedeutet wird.
Dieses Stereodreieck-Prinzip kann noch erweitert werden, indem in diese Anordnung noch weitere Lautsprecher eingefügt werden, so dass die so genannten Raumklang- oder Surround-Anordnungen entstehen. Die Wiedergabe von Audiodaten in einer Surround-Anordnung benötigt besonders aufbereitete Aufnahmen, wobei bei der Wiedergabe dieser Audiodaten mit einer klassischen Anordnung (nur zwei Lautsprecher) keine Verzerrung der Wahrnehmung im Bezug auf die räumliche Verteilung der Audioquellen entsteht.
In Figur 1 B wird schematisch eine herkömmliche Anordnung mit dem
Kopf eines Zuhörers Z gezeigt, welcher Audiodaten über Kopfhörerlautsprecher I und r (I steht erneut für links und r für rechts) hört. In diesem Fall kommt es, im Falle einer Wiedergabe von nicht optimierten Audiodaten, zu einigen mehr oder weniger schlimmen akustischen Nachteilen:
1. Das stereophonische Feld (dargestellt durch den Pfeil in Figur 1 B) wird zu einer 180°-Anordnung verzerrt, wobei sich der Kopf des Zuhörers Z genau in der Mitte dieses stereophonischen Felds befindet. Dieser Effekt entspräche im Wesentlichen einer Situation gemäss Figur 1 A, wenn sich der Zuhörer Z unmittelbar vor den Lautsprechern L, R befände. In einem solchen Fall spricht man auch von einer In-Kopf-Positionierung des Klangs. 2. Die Stereo-Mitte ist zu leise und der gesamte Klang der Musik wird verfälscht.
3. Die Musik wird als ohne „Tiefe" wahrgenommen. Alle Audioquellen erscheinen linear verteilt zwischen den beiden Ohren und daher ist es äus- serst schwierig (auch für geübte Hörer), die genaue Position von Audioquellen innerhalb des stereophonischen Feldes zu bestimmen.
Alle diese Probleme führen dazu, dass sich bei Zuhörern Z nach einer gewissen Zeit eine so genannte Kopfhörermüdigkeit einstellt, welche zu einer noch weniger getreuen Wahrnehmung der aufgenommenen Audiodaten führt.
Diese Probleme werden dank dem erfindungsgemässen Verfahren und dem entsprechenden System gelöst, wobei in Figur 1 C schematisch eine Anordnung mit dem Kopf eines Zuhörers Z illustriert wird, an welchem die Wiedergabe der Audiodaten eben gemäss diesem erfindungsgemässen Verfahren durchgeführt wird.
In diesem Fall werden die bei der Wiedergabe der auf Datenträgern gespeicherten Audiodaten erzeugten Audiosignale so verarbeitet, dass die resultierenden Audiosignale bei einer Wiedergabe mit Kopfhörern den Eindruck einer natürlichen räumlichen Verteilung gemäss dem Stereodreieck-Prinzip ergeben, wie dies im Zusammenhang mit Figur 1A beschrieben worden ist.
Eine mögliche Realisierung des erfindungsgemässen Systems zur Durchführung des erfindungsgemässen Verfahrens zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten ist in Figur 2 dargestellt. Es handelt sich um eine Drei-Kanal-Lösung wie oben beschrieben.
Die auf dem Datenträger (nicht dargestellt) gespeicherten Audiodaten werden vom Datenträger gelesen und als Eingangsaudiosignale IN einem Eingangsmodul A zugeführt. Es ist in diesem Zusammenhang einem Fachmann klar, dass es sich beim erwähnten Datenträger um verschiedene bekannte Vorrichtungen handeln kann. Beispielsweise eignen sich die so genannten CDs (Compact Discs) sehr gut für die Aufnahmen jeder Art von digitalen Daten, so dass sich darauf auch digitale Audiodaten sehr vorteilhaft unterbringen lassen. Ausserdem können die erwähnten Datenträger auch Festplatten von Computern oder tragbaren Musikspielern (zuweilen auch als MP3-Player bekannt) sein. Weitere geeignete Datenträger umfassen DVDs (Digital Versatile Disc), HD-DVD, Blueray, Digitalbänder und alle anderen bekannten Datenspeicher.
Nachdem die Eingangsaudiosignale IN dem Eingangsmodul A zugeführt worden sind, werden sie mittels des Eingangsmoduls A in die Kanäle K1 , K2, K3 geteilt. Anschliessend werden die Audiosignale in jedem der drei Kanä- Ie K1 , K2, K3 mittels Verarbeitungsmodulen B, ..., F unterschiedlich verarbeitet.
Im ersten Kanal K1 wird das entsprechende Audiosignal direkt zum Ausgangsmodul G geleitet. Dieser Kanal K1 stellt somit einen Direktkanal dar, welcher einerseits als Referenzkanal verwendet werden kann, und welcher an- dererseits die Grundinformationen unverändert zum Ausgang und zur Wiedergabe leiten kann. Im Kanal K1 befindet sich ein Verarbeitungsmodul B, mittels welchem die Audiosignale in diesem Direktkanal nach Bedarf verarbeitet oder ausgebessert werden können. Zur Ausbesserung der Audiosignale eignen sich insbesondere Equalizer. Equalizer setzen sich üblicherweise aus mehreren Filtern zusammen (wobei diese Filter insbesondere auch als digitale Signalverarbeitungsfunktionen implementiert werden können), mittels welcher das Spektrum des Eingangssignals angepasst werden kann. Equalizer werden vorteilhaft auch in den anderen beiden Kanälen K2, K3 in den Verarbeitungsmodulen D, F eingesetzt.
Parameter, welche in den Equalizern der Verarbeitungsmodule B, D und F verwendet werden, können in den Modulen B, D und F entweder fix programmiert oder dynamisch angepasst werden. Der Vorteil einer fixen Programmierung liegt darin, dass ein sehr robustes System gebaut werden kann. Wenn Durchschnittswerte genommen werden, so kann ein System realisiert werden, welches für einen grossen Teil der potentiellen Benutzer optimale oder beinahe optimale Wiedergabequalität garantiert. Allerdings ist in diesem Fall eine Änderung der Parameter sehr schwierig oder gar nicht möglich. Die Vorteile einer dynamischen Anpassung liegen insbesondere in der grosseren Flexibilität, da die individuelle Anpassung des Verfahrens dadurch ermöglicht wird. So kann jeder Benutzer dank dem erfindungsgemässen Verfahren eine optimal an seine/ihre Bedürfnisse angepasste Verarbeitung der Audiosignale erhalten.
Der zweite Kanal K2 steht für den so genannten Crossfeed-Effekt ein. Der Crossfeed-Effekt wird in der Literatur auch Crosstalk-Effekt genannt. Bei der Aufnahme der Schallwellen durch Ohren des Zuhörers Z in der Anordnung gemäss dem Stereodreieck werden die vom linken Lautsprecher L ausgestrahlten Schallwellen nicht nur vom linken Ohr, sondern auch vom rechten Ohr des Zuhörers Z erfasst. Dasselbe passiert mit den vom rechten Lautsprecher R ausgestrahlten Schallwellen. Dieser Crossfeed-Effekt fehlt vollkommen bei der Wiedergabe von Audiodaten mit Kopfhörern, da Kopfhörer meistens in der Form von Muscheln gebaut werden, welche die jeweiligen Ohren vollständig umfassen. Im Crossfeed-Kanal K2 wird neben dem Equalizer-Modul D auch ein weiteres Verarbeitungsmodul C eingesetzt. Dieses Verarbeitungsmodul C im Crossfeed-Kanal K2 beherbergt ein Delay-Modul. Mittels eines Delays kann eine verzögerte Kopie des Eingangssignals ausgegeben werden. Dank einem Delay kann die Tatsache kompensiert werden, dass aufgrund von unterschiedlich langen Fortpflanzungswegen in der Luft die gleichen Schallsignale von den beiden Ohren mit einer zeitlichen Differenz aufgenommen werden.
Schliesslich wird im dritten Kanal K3 eine frontale Wahrnehmung der Audiosignale simuliert. Wie oben beschrieben, enthält auch dieser Kanal K3 ein Verarbeitungsmodul F mit einem entsprechenden Equalizer. Zudem um- fasst der Kanal K3 ein weiteres Verarbeitungsmodul E, in welchem, ähnlich wie im zweiten Kanal K2, ein Delay eingebaut ist. Dank einer gut gewählten Kombination von Delay-Parametern können die gewünschten Effekte erreicht werden. Auch die Parameter der Delay-Verarbeitungsmodule C und E können entweder fix programmiert oder dynamisch angepasst werden.
Schliesslich werden die verarbeiteten Audiosignale aus den einzel- nen Kanälen K1 , K2 und K3 einem Ausgangsmodul G zugeführt. Aus den drei unterschiedlichen Audiosignalen werden mittels des Ausgangsmoduls G Ausgangsaudiosignale OUT zusammen gefügt. Dabei entsprechen die Ausgangs- Signale OUT grundsätzlich den Eingangssignalen IN im Bezug auf die Anzahl von Linien und andere physikalischen Eigenschaften. Schliesslich werden die Ausgangsaudiosignale OUT den Kopfhörern I, r zur Wiedergabe zugeführt.
Figur 3 illustriert schematisch eine Darstellung des Frequenzgangs im System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten gemäss einer Ausführungsvariante der vorliegenden Erfindung. In Figur 3 stellt die Y-Achse (vertikal) die Frequenzänderung (in Dezibel [dB]), während in der X-Achse (horizontal) die einzelnen Frequenzen (in Hertz [Hz]) aufgetragen sind. Selbstverständlich können durch geschickt gewählte Parameter der ein- zelnen Verarbeitungsmodule B, ..., F auch andere Frequenzgänge realisiert werden.
Eine andere mögliche Realisierung des erfindungsgemässen Systems zur Durchführung des erfindungsgemässen Verfahrens zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten ist in Figur 4 dargestellt. Es handelt sich hier im Gegensatz zur vorherigen Variante um eine Vier-Kanal- Lösung.
Die auf dem Datenträger (nicht dargestellt) gespeicherten Audiodaten werden wie oben vom Datenträger gelesen und als Eingangsaudiosignale IN einem Eingangsmodul A zugeführt. In diesem Zusammenhang ist es einem Fachmann auch hier klar, dass es sich beim erwähnten Datenträger um verschiedene bekannte Vorrichtungen handeln kann. Beispielsweise eignen sich die so genannten CDs (Compact Discs) sehr gut für die Aufnahmen jeder Art von digitalen Daten, so dass sich darauf auch digitale Audiodaten sehr vorteilhaft unterbringen lassen. Ausserdem können die erwähnten Datenträger auch Festplatten von Computern oder tragbaren Musikspielern (zuweilen auch als MP3-Player bekannt) sein. Weitere geeignete Datenträger umfassen DVDs (Digital Versatile Disc), HD-DVD, Blueray, Digitalbänder und alle anderen bekannten Datenspeicher.
Nachdem die Eingangsaudiosignale IN dem Eingangsmodul A zuge- führt worden sind, werden sie nun mittels des Eingangsmoduls A in die vier Kanäle K1 , K2, K3, K4 geteilt. Anschliessend werden die Audiosignale in jedem der vier Kanäle K1 , K2, K3, K4 mittels Verarbeitungsmodulen B, ..., H unterschiedlich verarbeitet.
Im ersten Kanal K1 werden die entsprechenden Audiosignale wieder direkt, d.h. linker Kanal zum linken und rechter Kanal zum rechten Kanal des Ausgangsmoduls I geleitet. Im Kanal K1 befindet sich ein Verarbeitungsmodul B, mittels welchem die Audiosignale nach Bedarf verarbeitet oder ausgebessert werden können. Zur Ausbesserung der Audiosignale eignen sich insbesondere Equalizer. Wie oben beschrieben setzen sich Equalizer üblicherweise aus mehreren Filtern zusammen (wobei diese Filter insbesondere auch als digitale Signalverarbeitungsfunktionen implementiert werden können), mittels welcher das Spektrum des Eingangssignals angepasst werden kann. Equalizer werden vorteilhaft auch in den anderen Kanälen K2, K3, K4 in den Verarbeitungsmodulen D, F, H eingesetzt.
Auch in diesem Fall können Parameter, welche in den Equalizern der Verarbeitungsmodule B, D, F und H verwendet werden, in den Modulen B, D, F und H entweder fix programmiert oder dynamisch angepasst werden. Der Vorteil einer fixen Programmierung liegt darin, dass ein sehr robustes System gebaut werden kann. Wenn Durchschnittswerte genommen werden, so kann ein System realisiert werden, welches für einen grossen Teil der potentiellen Benutzer optimale oder beinahe optimale Wiedergabequalität garantiert. Allerdings ist in diesem Fall eine Änderung der Parameter sehr schwierig oder gar nicht möglich. Die Vorteile einer dynamischen Anpassung liegen insbesondere in der grosseren Flexibilität, da die individuelle Anpassung des Verfahrens dadurch ermöglicht wird. So kann jeder Benutzer dank dem erfindungsgemässen Verfahren eine optimal an seine/ihre Bedürfnisse angepasste Verarbeitung der Audiosignale erhalten.
Der zweite Kanal K2 steht auch in der vorliegenden Ausführungsvariante für den so genannten C rossfeed- Effekt ein, d. h. der linke Kanal wird zum rechten und der rechte Kanal zum linken Kanal des Ausgangsmoduls I geleitet. Bei der Aufnahme der Schallwellen durch Ohren des Zuhörers Z in der Anordnung gemäss dem Stereodreieck werden die vom linken Lautsprecher L ausgestrahlten Schallwellen nicht nur vom linken Ohr, sondern auch vom rech- ten Ohr des Zuhörers Z erfasst. Dasselbe passiert mit den vom rechten Lautsprecher R ausgestrahlten Schallwellen. Dieser Crossfeed-Effekt fehlt vollkommen bei der Wiedergabe von Audiodaten mit Kopfhörern, da Kopfhörer meistens in der Form von Muscheln gebaut werden, welche die jeweiligen Oh- ren vollständig umfassen. Im Crossfeed-Kanal K2 wird neben dem Equalizer- Modul D auch ein weiteres Verarbeitungsmodul C eingesetzt. Dieses Verarbeitungsmodul C im Crossfeed-Kanal K2 beherbergt ein Delay-Modul. Mittels eines Delays kann eine verzögerte Kopie des Eingangssignals ausgegeben werden. Dank einem Delay kann die Tatsache kompensiert werden, dass aufgrund von unterschiedlich langen Fortpflanzungswegen in der Luft die gleichen Schallsignale von den beiden Ohren mit einer zeitlichen Differenz aufgenommen werden.
Im dritten Kanal K3 wird neu eine frontale Wahrnehmung der Audiosignale des Crossfeed-Effektes simuliert, d. h. der linke Kanal wird zum rechten und der rechte Kanal zum linken Kanal des Ausgangsmoduls I geleitet. Wie oben beschrieben, enthält auch dieser Kanal K3 ein Verarbeitungsmodul F mit einem entsprechenden Equalizer. Zudem umfasst der Kanal K3 ein weiteres Verarbeitungsmodul E, in welchem, ähnlich wie im zweiten Kanal K2, ein Delay eingebaut ist. Dank einer gut gewählten Kombination von Delay-Parametern können die gewünschten Effekte erreicht werden.
Im vierten Kanal K4 (entspricht im Wesentlichen dem dritten Kanal der Ausführungsvariante mit nur drei Kanälen) wird eine frontale Wahrnehmung der direkten Audiosignale simuliert, d.h. der linke Kanal wird zum linken und rechter Kanal zum rechten Kanal des Ausgangsmoduls I geleitet. Wie schon in den Kanälen K2 und K3 enthält auch dieser Kanal K4 ein Verarbeitungsmodul H mit einem entsprechenden Equalizer und ein weiteres Verarbeitungsmodul G, in welchem, ähnlich wie in den Kanälen K2 und K3 ein Delay eingebaut ist. Auch die Parameter der Delay-Verarbeitungsmodule C, E und G können entweder fix programmiert oder dynamisch angepasst werden.
Schliesslich werden die verarbeiteten Audiosignale aus den einzelnen Kanälen K1 , K2, K3 und K4 einem Ausgangsmodul I zugeführt. Aus den vier unterschiedlichen Audiosignalen werden mittels des Ausgangsmoduls I Ausgangsaudiosignale OUT zusammen gefügt. Dabei entsprechen die Ausgangssignale OUT grundsätzlich den Eingangssignalen IN im Bezug auf die Anzahl von Linien und andere physikalischen Eigenschaften. Schliesslich werden die Ausgangsaudiosignale OUT den Kopfhörern I, r zur Wiedergabe zuge- führt.
Figur 5 illustriert schematisch eine Darstellung des Frequenzgangs im System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten gemäss einer Ausführungsvariante der vorliegenden Erfindung. In Figur 5 stellt die Y-Achse (vertikal) die Frequenzänderung (in Dezibel [dB]), während in der X-Achse (horizontal) die einzelnen Frequenzen (in Hertz [Hz]) aufgetragen sind. Durch geschickt gewählte Parameter der einzelnen Verarbeitungsmodule B, ..., H können auch andere Frequenzgänge realisiert werden.

Claims

Patentansprüche
1. Verfahren zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten mittels Kopfhörern (I, r), wobei die gespeicherten Audiodaten nicht für die Wiedergabe mittels Kopfhörern (I, r) aufgenommen und verar- beitet sind, in welchem Verfahren die gespeicherten Audiodaten mittels mindestens eines Aufbereitungsmoduls (A, ..., G) verarbeitet werden,
dadurch gekennzeichnet,
dass die Audiodaten vom Datenträger gelesen und als Eingangsaudiosignale (IN) mindestens einem Eingangsmodul (A) zugeführt werden,
dass die Eingangsaudiosignale (IN) mittels des Eingangsmoduls (A) in mindestens zwei Kanäle (K1 , K2, K3, K4) geteilt werden,
dass die Audiosignale in den einzelnen Kanälen (K1 , K2, K3, K4) mittels Verarbeitungsmodulen (B, ..., H) verarbeitet werden,
dass die verarbeiteten Audiosignale aus den einzelnen Kanälen (K1 , K2, K3, K4) einem Ausgangsmodul (I) zugeführt werden, wobei die verarbeiteten Audiosignale in Ausgangsaudiosignale (OUT) zusammen gefügt werden, und
dass die Ausgangsaudiosignale (OUT) den Kopfhörern (I, r) zur Wiedergabe zugeführt werden.
2. Verfahren gemäss Anspruch 1 , dadurch gekennzeichnet, dass die
Eingangsaudiosignale (IN) in genau drei Kanäle (K1 , K2, K3) geteilt werden.
3. Verfahren gemäss Anspruch 1 , dadurch gekennzeichnet, dass die Eingangsaudiosignale (IN) in genau vier Kanäle (K1 , K2, K3, K4) geteilt werden.
4. Verfahren gemäss Anspruch 3, dadurch gekennzeichnet, dass drei der vier Kanäle (K1 , K2, K3) den drei Kanälen (K1 , K2, K3) des Verfahrens aus Anspruch 2 entsprechen.
5. Verfahren gemäss einem der Ansprüche 1 bis 4, dadurch gekenn- zeichnet, dass die Audiosignale in den einzelnen Kanälen (K1 , K2, K3, K4) durch Equalizer verarbeitet werden.
6. Verfahren gemäss Anspruch 5, dadurch gekennzeichnet, dass die Equalizer-Parameter dynamisch angepasst werden.
7. Verfahren gemäss einem der Ansprüche 1 bis 6, dadurch gekenn- zeichnet, dass die Eingangsaudiosignale (IN) über einen Kanal (K1 ) unverändert dem Ausgangsmodul (G) zugefügt werden.
8. Verfahren gemäss einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass die Audiosignale in mindestens zwei Kanälen (K2, K3, K4) durch ein Delay verarbeitet werden.
9. Verfahren gemäss einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass vorbestimmte Parametersets der Verarbeitungsmodule (B, ..., H) gespeichert und mittels eines Aktivierungsmoduls eingestellt werden.
10. System zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten mittels Kopfhörern (I, r) gemäss einem der Ansprüche 1 bis 9, umfassend mindestens:
ein Eingangsmodul (A) zur Teilung der Eingangsaudiosignale (IN) in mindestens zwei Kanäle (K1 , K2, K3, K4),
Verarbeitungsmodule (B, ..., H) zur Verarbeitung der Audiosignale in den einzelnen Kanälen (K1 , K2, K3, K4), und
ein Ausgangsmodul (H) zur Zusammenfügung der verarbeiteten Audiosignale aus den einzelnen Kanälen (K1 , K2, K3, K4) in Ausgangsaudiosig- nale (OUT) und Zuführung der Ausgangsaudiosignale (OUT) den Kopfhörern (I, r) zur Wiedergabe.
11. System gemäss Anspruch 10, dadurch gekennzeichnet, dass die Verarbeitungsmodule (B, ..., H) Equalizer und/oder Delay umfassen.
12. System gemäss Anspruch 10 oder 11 , dadurch gekennzeichnet, dass das System ein Aktivierungsmodul zur Einstellung der in einer Datenbank gespeicherten Parameter der Verarbeitungsmodule (B, ..., H) umfasst.
PCT/EP2009/053529 2008-03-28 2009-03-25 Verfahren zur wiedergabe von audiodaten mit einen kopfhörer und entsprechendes system WO2009118347A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CH4602008A CH704501B1 (de) 2008-03-28 2008-03-28 Verfahren zur Wiedergabe von auf einem Datenträger gespeicherten Audiodaten und entsprechende Vorrichtung.
CH460/08 2008-03-28

Publications (1)

Publication Number Publication Date
WO2009118347A1 true WO2009118347A1 (de) 2009-10-01

Family

ID=40791412

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2009/053529 WO2009118347A1 (de) 2008-03-28 2009-03-25 Verfahren zur wiedergabe von audiodaten mit einen kopfhörer und entsprechendes system

Country Status (2)

Country Link
CH (1) CH704501B1 (de)
WO (1) WO2009118347A1 (de)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5667000A (en) * 1979-11-05 1981-06-05 Victor Co Of Japan Ltd Signal conversion device
JPH0418900A (ja) * 1990-05-11 1992-01-23 Sony Corp 記録/再生装置
US6026169A (en) * 1992-07-27 2000-02-15 Yamaha Corporation Sound image localization device
US6078669A (en) * 1997-07-14 2000-06-20 Euphonics, Incorporated Audio spatial localization apparatus and methods

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5667000A (en) * 1979-11-05 1981-06-05 Victor Co Of Japan Ltd Signal conversion device
JPH0418900A (ja) * 1990-05-11 1992-01-23 Sony Corp 記録/再生装置
US6026169A (en) * 1992-07-27 2000-02-15 Yamaha Corporation Sound image localization device
US6078669A (en) * 1997-07-14 2000-06-20 Euphonics, Incorporated Audio spatial localization apparatus and methods

Also Published As

Publication number Publication date
CH704501B1 (de) 2012-08-31

Similar Documents

Publication Publication Date Title
DE3752052T2 (de) Stereoeffektverbesserungssystem
DE69008247T2 (de) Räumliches Schallwiedergabesystem.
DE2244162C3 (de) «system
DE102006017791A1 (de) Wiedergabegerät und Wiedergabeverfahren
DE19950319A1 (de) Verfahren zum Synthetisieren eines dreidimensionalen Schallfeldes
DE102005003431B4 (de) Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) durch mehrere Lautsprecher
DE2525642B2 (de)
WO2019042978A1 (de) Lautsprechersystem für raumklang mit unterdrückung unerwünschten direktschalls
DE102021203640B4 (de) Lautsprechersystem mit einer Vorrichtung und Verfahren zum Erzeugen eines ersten Ansteuersignals und eines zweiten Ansteuersignals unter Verwendung einer Linearisierung und/oder einer Bandbreiten-Erweiterung
DE102021200552B4 (de) Am Kopf tragbarer Schallerzeuger und Verfahren zum Betreiben eines Schallerzeugers
WO2001047319A2 (de) Verfahren und anlage zur aufnahme und wiedergabe von klängen
DE2344259C3 (de) Mehrkanalsystem zur Aufnahme und Wiedergabe stereofoner Darbietungen
DE102015008000A1 (de) Verfahren zur Schallwiedergabe in Reflexionsumgebungen, insbesondere in Hörräumen
DE102011003450A1 (de) Erzeugung von benutzerangepassten Signalverarbeitungsparametern
DE102021200555B4 (de) Mikrophon und Verfahren zum Aufzeichnen eines akustischen Signals
DE102021205545A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Ansteuersignals für einen Schallerzeuger oder zum Erzeugen eines erweiterten Mehrkanalaudiosignals unter Verwendung einer Ähnlichkeitsanalyse
WO2009118347A1 (de) Verfahren zur wiedergabe von audiodaten mit einen kopfhörer und entsprechendes system
DE3512155A1 (de) Elektroakustische anordnung fuer richtungsorientiertes, raeumliches hoeren
DE102011108788B4 (de) Verfahren zur Verarbeitung eines Audiosignals, Audiowiedergabesystem und Verarbeitungseinheit zur Bearbeitung von Audiosignalen
DE2023377C3 (de) Verfahren zur räumlichen Wiedergabe von Schallsignalen und Anordnung zu seiner Durchfuhrung
WO2007110087A1 (de) Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher
WO2006048006A1 (de) System zur wiedergabe von audiosignalen
DE19628261A1 (de) Verfahren und Vorrichtung zum elektronischen Einbetten von Richtungseinsätzen bei Zweikanal-Ton
DE19514105A1 (de) Kopfhörer-Raumklanganpassungsschaltung
DE2007623A1 (de) Anordnung zur Umwandlung elektroakusti scher intensitatsstereophoner Informa tionen in kopfbezughche intensitats + laufzeitstereophone Informationen

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09723673

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09723673

Country of ref document: EP

Kind code of ref document: A1