DE102007018032B4 - Erzeugung dekorrelierter Signale - Google Patents

Erzeugung dekorrelierter Signale Download PDF

Info

Publication number
DE102007018032B4
DE102007018032B4 DE102007018032A DE102007018032A DE102007018032B4 DE 102007018032 B4 DE102007018032 B4 DE 102007018032B4 DE 102007018032 A DE102007018032 A DE 102007018032A DE 102007018032 A DE102007018032 A DE 102007018032A DE 102007018032 B4 DE102007018032 B4 DE 102007018032B4
Authority
DE
Germany
Prior art keywords
audio input
input signal
output signal
signal
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102007018032A
Other languages
English (en)
Other versions
DE102007018032A1 (de
Inventor
Jürgen Dr. Herre
Karsten Linzmeier
Harald Popp
Jan Plogsties
Harald Mundt
Sascha Disch
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to DE102007018032A priority Critical patent/DE102007018032B4/de
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to JP2009529719A priority patent/JP4682262B2/ja
Priority to AT08735224T priority patent/ATE452514T1/de
Priority to CN2008800005968A priority patent/CN101543098B/zh
Priority to US12/440,940 priority patent/US8145499B2/en
Priority to RU2009116268/09A priority patent/RU2411693C2/ru
Priority to KR1020097008644A priority patent/KR101104578B1/ko
Priority to EP08735224A priority patent/EP2036400B1/de
Priority to PCT/EP2008/002945 priority patent/WO2008125322A1/de
Priority to AU2008238230A priority patent/AU2008238230B2/en
Priority to CA2664312A priority patent/CA2664312C/en
Priority to DE502008000252T priority patent/DE502008000252D1/de
Priority to MYPI20091415A priority patent/MY145952A/en
Priority to TW097113879A priority patent/TWI388224B/zh
Publication of DE102007018032A1 publication Critical patent/DE102007018032A1/de
Priority to ZA2009/00801A priority patent/ZA200900801B/en
Priority to IL196890A priority patent/IL196890A0/en
Priority to HK09103754.1A priority patent/HK1124468A1/xx
Application granted granted Critical
Publication of DE102007018032B4 publication Critical patent/DE102007018032B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/05Application of the precedence or Haas effect, i.e. the effect of first wavefront, in order to improve sound-source localisation

Abstract

Dekorrelator zum Erzeugen von Ausgangssignalen (50, 52) basierend auf einem Audio-Eingangssignal (54), mit folgenden Merkmalen:
einer Verzögerungseinrichtung (56), die ausgebildet ist, um eine verzögerte Repräsentation des Audio-Eingangssignals (58) unter zeitlicher Verzögerung des Audio-Eingangssignals (54) um eine Verzögerungszeit zu erzeugen;
einem Mixer (60) zum Kombinieren der verzögerten Repräsentation des Audio-Eingangssignals (58) mit dem Audio-Eingangssignal (54), um ein erstes (50) und ein zweites (52) Ausgangssignal mit zeitlich variierenden Anteilen des Audio-Eingangssignals (54) und der verzögerten Repräsentation des Audio-Eingangssignals (58) zu erhalten, wobei
in einem ersten Zeitintervall (70) das erste Ausgangssignal (50) einen mehr als 50-prozentigen Anteil des Audio-Eingangssignals (54) und das zweite Ausgangssignal (52) einen mehr als 50-prozentigen Anteil der verzögerten Repräsentation des Audio-Eingangssignals (58) enthält, und wobei
in einem zweiten Zeitintervall (72) das erste Ausgangssignal (50) einen mehr als 50-prozentigen Anteil der verzögerten Repräsentation des Audio-Eingangssignals (58) und das zweite Ausgangssignal (52) einen mehr als 50-prozentigen Anteil...

Description

  • Die vorliegende Erfindung befasst sich mit einer Vorrichtung und einem Verfahren zum Erzeugen von dekorrelierten Signalen und insbesondere damit, wie dekorrelierte Signal von einem Signal, das Transienten enthält, derart abgeleitet werden können, dass sich bei der Rekonstruktion eines Vielkanal-Audio-Signals bzw. einer späteren Kombination des dekorrelierten Signals und des Transientensignals keine hörbare Signalverschlechterung ergibt.
  • Viele Anwendungen im Bereich der Audiosignal-Verarbeitung erfordern das Erzeugen eines dekorrelierten Signals basierend auf einem bereitgestellten Audio-Eingangssignal. Als Beispiele seien hier der Stereo-Up-Mix eines Monosignals, der Vielkanal-Up-Mix basierend auf einem Mono oder Stereo-Signal, die künstliche Hallerzeugung oder das Verbreitern der Stereo-Basis genannt.
  • Aktuelle Verfahren bzw. Systeme leiden unter einer starken Verschlechterung der Qualität bzw. des wahrnehmbaren Klangeindrucks, wenn sie mit einer speziellen Klasse von Signalen konfrontiert werden (applaus-ähnliche Signale). Dies ist insbesondere dann der Fall, wenn die Wiedergabe über Kopfhörer erfolgt. Darüber hinaus benutzen Standard-Dekorrelatoren Verfahren, die eine hohe Komplexität aufweisen, bzw. einen hohen Rechenaufwand erfordern.
  • Zur Verdeutlichung des Problems zeigen die 7 und 8 die Anwendung von Dekorrelatoren in der Signalbearbeitung. Dabei soll zunächst kurz auf den in 7 gezeigten Mono-zu-Stereo-Decoder eingegangen werden.
  • Dieser weist einen Standard-Dekorrelator 10 und eine Mix-Matrix 12 auf. Der Mono-zu-Stereo-Decoder dient dazu, ein eingespeistes Mono-Signal 14 in ein Stereo-Signal 16, bestehend aus einem linken Kanal 16a und einem rechten Kanal 16b zu verwandeln. Aus dem eingespeisten Mono-Signal 14 erzeugt der Standarddekorrelator 10 ein dekorreliertes Signal 18 (D), welches zusammen mit dem eingespeisten Mono-Signal 14 an die Eingänge der Mix-Matrix 12 angelegt wird. In diesem Zusammenhang wird das unbehandelte Mono-Signal oft auch als „trockenes” Signal bezeichnet, wo hingegen das dekorrelierte Signal D als „nasses” Signal bezeichnet wird.
  • Die Mix-Matrix 12 kombiniert das dekorrelierte Signal 18 und das eingespeiste Mono-Signal 14, um das Stereosignal 16 zu erzeugen. Dabei können die Koeffizienten der Mix-Matrix 12 (H) sowohl fest vorgegeben, signalabhängig oder auch von einer Benutzereingabe abhängig sein. Darüber hinaus kann dieser Mixing-Prozess, der von der Mix-Matrix 12 durchgeführt wird, auch frequenzselektiv sein. Das heißt, unterschiedliche Misch-Operationen bzw. Matrix-Koeffizienten können für unterschiedliche Frequenzbereiche (Frequenzbänder) angewendet werden. Dazu kann das eingespeiste Mono-Signal 14 von einer Filterbank vorprozessiert sein, so dass dieses zusammen mit dem dekorrelierten Signal 18 in einer Filterbank-Repräsentation vorliegt, in der die zu verschiedenen Frequenzbändern gehörenden Signalanteile jeweils separat prozessiert werden.
  • Die Kontrolle des Up-Mix-Prozesses, also der Koeffizienten der Mix-Matrix 12, kann durch Benutzerinteraktion über eine Mix-Kontrolle 20 vorgenommen werden. Darüber hinaus können die Koeffizienten der Mix-Matrix 12 (H) auch durch sog. „Seiten-Information” (side information) erfolgen, die zusammen mit dem eingespeisten Monosignal 14 (dem Downmix) übertragen werden. Die Seiteninformation enthält dabei eine parametrische Beschreibung, wie das erzeugte Mehrkanal-Signal aus dem eingespeisten Mono-Signal 14 (dem übermittelten Signal) erzeugt werden soll. Diese räumliche Seiteninformation wird üblicherweise von einem Encoder vor dem eigentlichen Down-Mix, also dem Erzeugen des eingespeisten Mono-Signals 14, erzeugt.
  • Oben beschriebenes Vorgehen wird normalerweise beim parametrischen (räumlichen) Audio-Kodieren angewendet (parametric spatial audio coding). Beispielsweise verwendet das sog. „parametric stereo”-Kodieren (H. Purnhagen: „Low Complexity Parametric Stereo Coding in MPEG-4”, 7th International Conference an Audio Effects (DAFX-04), Naples, Italy, October 2004) und das MPEG-Surround-Verfahren (L. Villemoes, J. Herre, J. Breebaart, G. Hotho, S. Disch, H. Purnhagen, K. Kjörling: „MPEG Surround: The forthcoming ISO standard for spatial audio coding”, AES 28th International Conference, Piteå, Sweden, 2006) ein solches Verfahren.
  • Ein typisches Beispiel eines parametrischen Stereo-Decoders ist in 8 gezeigt. Zusätzlich zum einfachen, nicht frequenz-selektiven Fall, der in 7 gezeigt ist, weist der in 6 gezeigte Decoder eine Analyse-Filterbank 30 und eine Synthese-Filterbank 32 auf. Dies ist der Fall, da hier das Dekorrelieren frequenzabhängig (in der spektralen Domäne) durchgeführt wird. Daher wird zunächst das eingespeiste Monosignal 14 von der Analyse-Filterbank 30 in Signalanteile für unterschiedliche Frequenzbereiche zerlegt. Das heißt, für jedes Frequenzband wird analog zum oben beschriebenen Beispiel ein eigenes dekorreliertes Signal erzeugt. Es werden zusätzlich zum eingespeisten Mono-Signal 14 räumliche Parameter 34 übertragen, die dazu dienen, die Matrixelemente der Mix-Matrix 12 zu bestimmen oder zu variieren, um ein gemischtes Signal zu erzeugen, welches mittels der Synthesefilterbank 32 in den Zeit-Bereich zurücktransformiert wird, um das Stereo-Signal 16 zu bilden.
  • Zusätzlich können die räumlichen Parameter 34 optional über eine Parameterkontrolle 36 verändert werden, um den Up-Mix bzw. das Stereosignal 16 für verschiedene Wiedergabeszenarien unterschiedlich zu erzeugen bzw. die Wiederqualität optimal auf das jeweilige Szenario anzupassen. Werden bei spielsweise die räumlichen Parameter 34 für binaurale Wiedergabe angepasst, können die räumlichen Parameter 34 mit Parametern der binauralen Filter kombiniert werden, um die die Mix-Matrix 12 steuernden Parameter zu bilden. Alternativ können die Parameter durch direkte Benutzerinteraktion oder andere Werkzeuge bzw. Algorithmen verändert werden (siehe beispielsweise: Breebart, Jeroen; Herre, Jurgen; Jin, Craig; Kjörling, Kristofer; Koppens, Jeroen; Plogisties, Jan; Villemoes, Lars: Multi-Channel Goes Mobile: MPEG Surround Binaural Rendering. AES 29th International Conference, Seoul, Korea, 2006 September 2–4).
  • Die Ausgabe der Kanäle L und R der Mix-Matrix 12 (H) wird aus dem eingespeisten Monosignal 14 (M) und dem dekorrelierten Signal 18 (D), beispielsweise wie folgt erzeugt:
    Figure 00040001
  • Es wird also in der Mix-Matrix 12 der Anteil des dekorrelierten Signals 18 (D), der im Ausgangssignal enthalten ist, eingestellt. Dabei wird das Mischverhältnis basierend auf den übertragenen räumlichen Parametern 34 zeitlich variiert. Diese Parameter können beispielsweise Parameter sein, die die Korrelation zwischen zwei ursprünglichen Signalen beschreiben (Parameter dieser Art werden beispielsweise beim MPEG-Surround Codieren verwendet und dort unter anderem mit ICC bezeichnet). Zusätzlich werden eventuell Parameter übertragen, die die Energieverhältnisse zwischen zwei ursprünglich vorhandenen Kanälen, die im eingespeisten Mono-Signal 14 enthalten sind, übertragen (ICLD bzw. ICD in MPEG-Surround). Alternativ oder zusätzlich können die Matrixelemente durch direkte Benutzer-Eingabe variiert werden.
  • Zum Erzeugen der dekorrelierten Signale werden bis dato eine Reihe unterschiedlicher Verfahren verwendet.
  • Parametric Stereo und MPEG Surround verwenden All-Pass-Filter, also Filter, die den gesamten Spektralbereich passieren lassen, jedoch eine spektral abhängige Filtercharakteristik aufweisen. In Binaural Cue Coding (BCC, Faller und Baumgarte, siehe beispielsweise: C. Faller: „Parametric Coding Of Spatial Audio”, Ph. D. thesis, EPFL, 2004) wird eine „Gruppenverzögerung” zur Dekorrelation vorgeschlagen. Dazu wird eine frequenzabhängige Gruppenverzögerung auf das Signal angewendet, indem die Phasen in dem DFT-Spektrum des Signals verändert werden. Es werden also verschiedene Frequenzbereiche unterschiedlich lange verzögert. Ein solches Verfahren fällt allgemein unter den Oberbegriff der Phasen-Manipulationen.
  • Zusätzlich ist die Verwendung einfacher Delays, also fester Zeitverzögerungen, bekannt. Dieses Verfahren wird beispielsweise zum Erzeugen von Surround-Signalen für die hinteren Lautsprecher in Vielkanal-Konfigurationen angewendet, um diese wahrnehmungsmäßig von den Frontsignalen zu dekorrelieren. Ein typisches solches Matrix-Surround-System ist Dolby ProLogic II, welches eine Zeitverzögerung für die hintren Audio-Kanäle zwischen 20 und 40 ms verwendet. Eine derart einfache Implementierung ist zur Erzeugung einer Dekorrelation zwischen vorderen und hinteren Lautsprechern möglich, da diese hinsichtlich des Hörerlebnisses wesentlich weniger kritisch ist als die Dekorrelation zwischen linken und rechten Kanälen. Diese hat eine wesentliche Bedeutung für die vom Hörer wahrgenommene „Breite” des rekonstruierten Signals (siehe dazu: J. Blauert: „Spatial hearing: The psychophysics of human sound localization”; MIT Press, Revised edition, 1997).
  • Die gängigen Dekorrelationsverfahren, die vorhergehend beschrieben wurden, weisen die folgenden erheblichen Nachteile auf:
    • – spektrale Einfärbung des Signals (Kammfiltereffekt)
    • – reduzierte „Knackigkeit” des Signals
    • – störende Echo- und Halleffekte
    • – unzufriedenstellend wahrgenommene Dekorrelation bzw. unzufriedenstellende Breite der Audio-Abbildung
    • – repetitiver Klangcharakter.
  • Dabei hat die Erfahrung gezeigt, dass insbesondere Signale mit einer hohen zeitlichen Dichte und räumlichen Verteilung transienter Ereignisse, die zusammen mit einer breitbandigen rausch-artigen Signalkomponente übertragen werden, die für diese Art der Signalbearbeitung kritischsten Signale darstellen. Dies ist insbesondere für applaus-ähnliche Signale der Fall, die die vorgenannten Eigenschaften besitzen. Die Ursache dafür ist, dass durch die Dekorrelation jedes einzelne transiente Signal (Ereignis) zeitlich verschmiert werden kann, während gleichzeitig der rauschähnliche Hintergrund durch Kammfiltereffekte spektral verfärbt wird, was als Veränderung der Klangfärbung des Signals leicht wahrnehmbar ist.
  • Zusammengefasst erzeugen die bekannten Dekorrelationsverfahren entweder die oben beschriebenen Artefakte oder sie sind nicht in der Lage, den erforderlichen Grad an Dekorrelation zu erzeugen.
  • Dabei gilt es insbesondere zu beachten, dass das Abhören über Kopfhörer im Allgemeinen kritischer ist als das Abhören über Lautsprecher. Daher sind die oben beschriebenen Nachteile besonders für Applikationen relevant, die üblicherweise das Abhören mit einem Kopfhörer voraussetzen. Dies ist meist für portable Abspielgeräte der Fall, die darüber hinaus nur einen geringen Energievorrat zur Verfügung haben. In diesem Zusammenhang ist auch die Rechenkapazität, die für die Dekorrelation aufwendet werden muss, ein wichtiger Aspekt. Die meisten bekannten Dekorrelationsalgorithmen sind äußerst rechenintensiv. Daher erfordern sie bei einer Implementierung eine relativ hohe Anzahl von Rechenoperationen, was dazu führt, dass schnelle Prozessoren verwendet werden müssen, die unweigerlich viel Energie verbrauchen. Zusätzlich wird zur Implementierung solcher komplizierten Algorithmen eine große Menge an Speicher benötigt. Dies führt wiederum zur Erhöhung des Energiebedarfs.
  • Insbesondere bei der Wiedergabe von binauralen Signalen (und dem Abhören über Kopfhörer) ergeben sich eine Reihe von speziellen Problemen, die die wahrgenommene Reproduktionsqualität des wiedergegebenen Signals betreffen. Zum einen ist es bei Applaussignalen besonders wichtig, den Anschlag eines jeden Klatsch-Ereignisses korrekt wiederzugeben, um das transiente Ereignis nicht zu verfälschen. Daher wird ein Dekorrelator benötigt, der den Anschlag nicht zeitlich verschmiert, der also keine zeitlich dispersive Charakteristik aufweist. Oben beschriebene Filter, die eine frequenzabhängige Gruppenverzögerung einführen, beziehungsweise All-Pass-Filter im Allgemeinen sind dafür nicht geeignet. Zusätzlich ist es erforderlich, einen repetitiven Klangeindruck zu vermeiden, wie er beispielsweise durch eine einfache Zeitverzögerung hervorgerufen wird. Sollte eine solche einfache Zeitverzögerung verwendet werden, um ein dekodiertes Signal zu erzeugen, welches daraufhin mit einer Mix-Matrix zum direkten Signal addiert wird, klingt das Ergebnis äußerst repetitiv und somit unnatürlich. Eine solche statische Verzögerung erzeugt darüber hinaus Kammfiltereffekte, also unerwünschte spektrale Verfärbungen im rekonstruierten Signal.
  • Bei Verwendung in einfachen Zeitverzögerungen kommt es darüber hinaus zum bekannten Präzedenzeffekt (siehe beispielsweise: J. Blauert: „Spatial hearing: The psychophysics of human sound localization”; MIT Press, Revised edition, 1997). Dieser rührt daher, dass es einen zeitlich führenden und einen zeitlich nachfolgenden Ausgabekanal gibt, wenn eine einfache Zeitverzögerung verwendet wird. Das menschliche Gehör nimmt den Ursprung eines Tons bzw. eines Klangs oder eines Objekts in derjenigen räumlichen Richtung wahr, aus der es das Geräusch zuerst hört. Die Signalquelle wird also in derjenigen Richtung wahrgenommen, in der zufällig der Signalanteil des zeitlich führenden Ausgabekanals (Leading-Signals) wiedergegeben wird, unabhängig davon, ob die eigentlich für die räumliche Zuordnung zuständigen räumlichen Parameter etwas anders anzeigen.
  • Die US-Patentanmeldung 2006/0053018 beschreibt einen Synthesizer zum Erzeugen eines dekorrelierten Signals, der eine Mehrzahl von Subband-Signalen verwendet, um ein dekorreliertes Signal zu erzeugen. Dabei wird jedes einzelne Subband-Signal mit einem Hall-Filter gefiltert. Die Hallgefilterten Teilsignale werden zu einem Dekorrelations-Signal zusammengefasst. Die dekorrelierten Signale werden also durch Signalmanipulation an einer Vielzahl von Subband-Signalen durchgeführt.
  • Die internationale Patentanmeldung 2005/086139 beschreibt die Dekodierung eines Mono-Downmix-Signals, das aus einem Vielkanal-Signal gewonnen wurde. Zur Rekonstruktion verwendete dekorrelierte Signale werden gewonnen, indem das Downmix-Signal (Misch-Signal) mit einer Filterbank in Subband-Signale aufgeteilt werden, welche mit variablen Phasenwinkeln beaufschlagt werden. Zusätzlich wird eine Transienten-Erkennung durchgeführt, um beim Vorliegen transienter Signale die dekorrelierten Signale anders zu erzeugen.
  • Die Aufgabe der vorliegenden Erfindung besteht darin, eine Vorrichtung und ein Verfahren zum Dekorrelieren von Signalen zu schaffen, die die Signalqualität beim Vorliegen von transienten Signalen verbessert.
  • Diese Aufgabe wird durch einen Dekorrelator gemäß Patentanspruch 1 und durch ein Verfahren zum Erzeugen dekorrelierter Signale gemäß Patentanspruch 17 gelöst.
  • Der vorliegenden Erfindung liegt dabei die Erkenntnis zugrunde, dass für transiente Audio-Eingangssignale dekorrelierte Ausgangssignale dadurch erzeugt werden können, dass das Audio-Eingangssignal mit einer um eine Verzögerungszeit verzögerten Repräsentation des Audio-Eingangssignals so gemischt wird, dass in einem ersten Zeitintervall ein erstes Ausgangssignal dem Audio-Eingangssignal und ein zweites Ausgangssignal der verzögerten Repräsentation des Audio-Eingangssignals entspricht, wobei in einem zweiten Zeitintervall das erste Ausgangssignal der verzögerten Repräsentation des Audio-Eingangssignals und das zweite Ausgangssignal dem Audio-Eingangssignal entspricht.
  • Mit anderen Worten werden von einem Audio-Eingangssignal zwei voneinander dekorrelierte Signale so abgeleitet, dass zunächst eine zeitverzögerte Kopie des Audio-Eingangssignals erzeugt wird. Dann werden die beiden Ausgangssignale dadurch erzeugt, dass das Audio-Eingangssignal und die verzögerte Repräsentation des Audio-Eingangssignals wechselseitig für die beiden Ausgangssignale verwendet werden.
  • In einer zeitdiskreten Darstellung bedeutet dies, dass die Reihe von Sample-Werten der Ausgangssignale abwechselnd direkt vom Audio-Eingangssignal und von der verzögerten Repräsentation des Audio-Eingangssignals verwendet werden. Zum Erzeugen des dekorrelierten Signals wird dabei eine Zeitverzögerung verwendet, die frequenzunabhängig ist und daher die Anschläge der Klatschgeräusche zeitlich nicht verschmiert. Im Falle einer zeitdiskreten Darstellung ist dafür eine Zeitverzögerungskette, die eine geringe Anzahl von Speicherelementen aufweist, ein guter Kompromiss zwischen der erzielbaren räumlichen Breite eines rekonstruierten Signals und des zusätzlichen Speicherbedarfs. Die gewählte Verzögerungszeit ist bevorzugt kleiner als 50 ms, besonders bevorzugt kleiner oder gleich 30 ms.
  • Somit wird das Problem der Präzedenz dadurch gelöst, dass in einem ersten Zeitintervall das Audio-Eingangssignal direkt den linken Kanal bildet, während im anschließenden zweiten Zeitintervall die verzögerte Repräsentation des Audio-Eingangssignals als linker Kanal verwendet wird. Für den rechten Kanal gilt das Vorgehen entsprechend.
  • Bei einem bevorzugten Ausführungsbeispiel ist die Umschaltzeit zwischen den einzelnen Vertauschungsvorgängen größer gewählt als die Dauer eines typischerweise im Signal auftretenden transienten Ereignisse. Werden also der führende und der folgende Kanal periodisch (oder zufällig) in Intervallen (beispielsweise 100 ms Länge) vertauscht, kann bei geeigneter Wahl der Intervalllänge eine Verfälschung der Richtungsortung durch die Trägheit des menschlichen Hörapparats unterdrückt werden.
  • Erfindungsgemäß wird es somit also möglich, ein breites Klangfeld zu erzeugen, welches transiente Signale (beispielsweise Klatschen) nicht verfälscht und darüber hinaus nicht einen repetitiven Klangcharakter besitzt.
  • Die erfindungsgemäßen Dekorrelatoren verwenden lediglich eine extrem geringe Anzahl arithmetrischer Operationen. Insbesondere sind lediglich eine einzige Zeitverzögerung und eine geringe Anzahl von Multiplikationen erforderlich, um erfindungsgemäß dekorrelierte Signale zu erzeugen. Der Austausch einzelner Kanäle ist eine einfache Kopieroperation, erfordert also keinen zusätzlichen Rechenaufwand. Optionale Signalanpassungs- bzw. Nachprozessierverfahren erfordern ebenfalls lediglich eine Addition bzw. eine Subtraktion, also Operationen, die typischerweise von bereits existierender Hardware übernommen werden können. Somit ist lediglich eine geringe Menge an zusätzlichem Speicher für die Implementierung der Verzögerungseinrichtung bzw. der Delay-Line erforderlich. Diese existiert in vielen Systemen und kann ggf. mitbenutzt werden.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
  • 1 Ein Ausführungsbeispiel eines erfindungsgemäßen Dekorrelators;
  • 2 eine Illustration der erfindungsgemäß erzeugten dekorrelierten Signale;
  • 2a zeigt ein weiteres Ausführungsbeispiels eines erfindungsgemäßen Dekorrelators;
  • 2b zeigt Ausführungsbeispiele möglicher Steuersignale für den Dekorrelator aus 2a;
  • 3 ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Dekorrelators;
  • 4 ein Beispiel für eine Vorrichtung zum Erzeugen dekorrelierter Signale;
  • 5 ein Beispiel eines erfindungsgemäßen Verfahrens zum Erzeugen von Ausgangssignalen;
  • 6 ein Beispiel für einen erfindungsgemäßen Audiodecoder;
  • 7 ein Beispiel für einen dem Stand der Technik entsprechenden Up-Mixer; und
  • 8 ein weiteres Beispiel für einen dem Stand der Technik entsprechenden Up-Mixer/Dekoder.
  • 1 zeigt ein Beispiel für einen erfindungsgemäßen Dekorrelator zum Erzeugen eines ersten Ausgangssignals 50 (L') und eines zweiten Ausgangssignals 52 (R'), basierend auf einem Audio-Eingangssignal 54 (M).
  • Der Dekorrelator enthält ferner eine Verzögerungseinrichtung 56, um eine verzögerte Repräsentation des Audio-Eingangssignals 58 (M_d) zu erzeugen. Der Dekorrelator weist ferner einen Mixer 60 zum Kombinieren der verzögerten Repräsentation des Audio-Eingangssignals 58 mit dem Audio-Eingangssignal 54 auf, um das erste Ausgangssignal 50 und das zweite Ausgangssignal 52 zu erhalten. Der Mixer 60 wird dabei durch die beiden schematisch dargestellten Schalter gebildet, mittels derer abwechselnd das Audio-Eingangssignal 54 auf das linke Ausgangssignal 50 oder das rechte Ausgangssignal 52 geschalten wird. Selbiges gilt auch für die verzögerte Repräsentation des Audio-Eingangssignals 58. Der Mixer 60 des Dekorrelators funktioniert also so, dass in einem ersten Zeitintervall das erste Ausgangssignal 50 dem Audio-Eingangssignal 54 und das zweite Ausgangssignal der verzögerten Repräsentation des Audio-Eingangssignals 58 entspricht, wobei in einem zweiten Zeitintervall das erste Ausgangssignal 50 der verzögerten Repräsentation des Audio-Eingangssignals und das zweite Ausgangssignal 52 dem Audio-Eingangssignal 54 entspricht.
  • Erfindungsgemäß wird eine Dekorrelation also dadurch erreicht, dass eine zeitverzögerte Kopie des Audio-Eingangskanals 54 angefertigt wird und dass daraufhin als Ausgangskanäle wechselseitig das Audio-Eingangssignal 54 und die verzögerte Repräsentation des Audio-Eingangssignals 58 verwendet werden. Es werden also die die Ausgangssignale bildenden Komponenten (Audio-Eingangssignals 54 und verzögerte Repräsentation des Audio-Eingangssignals 58) getaktet vertauscht. Dabei ist die Länge des Zeitintervalls, für die jeweils vertauscht wird bzw. für die jeweils ein Eingangssignal an dem Ausgangssignal entspricht, variabel. Darüber hinaus können die Zeitintervalle, für die die einzelnen Komponenten vertauscht werden, unterschiedliche Länge haben. Das heißt also, das Verhältnis derjenigen Zeiten, in welchen das erste Ausgangssignal 50 aus dem Audio-Eingangssignal 54 und der verzögerten Repräsentation des Audio-Eingangssignals 58 besteht, ist variabel einstellbar.
  • Bevorzugt ist dabei die Dauer der Zeitintervalle größer als die mittlere Dauer von Transientenanteilen, die im Audio-Eingangssignal 54 enthalten sind, um eine gute Reproduktion des Signals zu erhalten.
  • Geeignete Zeitdauern liegen dabei im Zeitintervall zwischen 10 ms und 200 ms, wobei eine typische Zeitdauer beispielsweise 100 ms ist.
  • Zusätzlich zu den Schaltzeitintervallen kann die Dauer der Zeitverzögerung an die Begebenheiten des Signals angepasst werden oder sogar zeitlich variabel sein. Bevorzugt liegen die Verzögerungszeiten in einem Intervall von 2 ms bis 50 ms. Beispiele für geeignete Verzögerungszeiten sind 3, 6, 9, 12, 15 oder 30 ms.
  • Mit dem in 1 gezeigten erfindungsgemäßen Dekorrelator ist es zum Einen möglich, dekorrelierte Signale zu erzeugen, die den Anschlag, also den Beginn von transienten Signalen zeitlich nicht verschmieren und darüber hinaus eine sehr hohe Dekorrelation des Signals gewährleisten, was dazu führt, dass ein Hörer ein mit Hilfe eines solchen dekorrelierten Signals rekonstruiertes Mehrkanalsignal als besonders räumlich ausgedehntes Signal wahrnimmt.
  • Wie anhand von 1 zu sehen ist, kann dabei der erfindungsgemäße Dekorrelator sowohl für kontinuierliche Audiosignale als auch für gesampelte Audio-Signale, also für Signale, die als Folge diskreter Abtastwerte vorliegen, angewendet werden.
  • 2 zeigt anhand eines solchen in diskreten Abtastwerten vorliegenden Signals die Funktionsweise des Dekorrelators von 1.
  • Dabei wird das aus einer Folge von diskreten Samplewerten vorliegende Audio-Eingangssignal 54 und die verzögerte Repräsentation des Audio-Eingangssignals 58 betrachtet. Der Mixer 60 ist hier nur schematisch als zwei mögliche Verbindungswege zwischen dem Audio-Eingangssignal 54 und der verzögerten Repräsentation des Audio-Eingangssignals 58 und den beiden Ausgangssignalen 50 und 52 dargestellt. Ferner ist ein erstes Zeitintervall 70 gezeigt, in dem das ersten Ausgangssignal 50 dem Audio-Eingangssignal 54 und das zweite Ausgangssignal 52 der verzögerten Repräsentation des Audio-Eingangssignals 58 entspricht. Der Funktionsweise des Mixers entsprechend entspricht in einem zweiten Zeitintervall 72 das erste Ausgangssignal 50 der verzögerten Repräsentation des Audio-Eingangssignals 58 und das zweite Ausgangssignal 52 dem Audio-Eingangssignal 54.
  • Im in 2 gezeigtem Fall ist die Zeitdauer des ersten Zeitintervalls 70 und des zweiten Zeitintervalls 72 identisch, obwohl dies nicht Vorraussetzung ist, wie bereits oben erwähnt.
  • Sie beträgt im dargestellten Fall das zeitliche Äquivalent von vier Abtastwerten, so dass im Takt von vier Abtastwer ten zwischen den beiden Signalen 54 und 58 umgeschalten wird, um das erste Ausgangssignal 50 und das zweite Ausgangssignal 52 zu bilden.
  • Das Erfindungsgemäße Konzept zum Dekorrelieren von Signalen kann im Zeitbereich, also mit der zeitlichen Auflösung, die durch die Samplefrequenz gegeben ist, angewendet werden. Genauso ist es möglich, das Konzept auf eine Filterbank-Repräsentation eines Signals anzuwenden, in der das Signal (Audio-Signal) in mehrere diskrete Frequenzbereiche zerlegt ist, wobei das Signal je Frequenzbereich üblicherweise mit verringerter Zeitauflösung vorliegt.
  • 2a zeigt ein weiteres Ausführungsbeispiel, bei dem der Mixer 60 so ausgebildet ist, dass in einem ersten Zeitintervall das erste Ausgangssignal 50 zu einem Anteil X(t) aus dem Audioeingangssignal 54 und zu einem Anteil (1 – X(t)) aus der verzögerten Repräsentation des Audio-Eingangssignals 58 gebildet wird. Dementsprechend wird im ersten Zeitintervall das zweite Ausgangssignal 52 zu einem Anteil X(t) von der verzögerten Repräsentation des Audio-Eingangssignals 58 und zu einem Anteil (1 – X(t)) von dem Audio-Eingangssignal 54 gebildet. Mögliche Implementierung der Funktion X(t), die man auch als Überblend-Funktion bezeichnen könnte, sind in 2b gezeigt. Allgemein ist dabei allen Implementierungen, dass der Mixer 60 so funktioniert, dass dieser eine um eine Verzögerungszeit verzögerte Repräsentation des Audio-Eingangssignals 58 mit dem Audio-Eingangssignal 54 kombiniert, um das erste Ausgangssignal 50 und das zweite Ausgangssignal 52 mit zeitlich variierenden Anteilen des Audio-Eingangssignals 54 und der verzögerten Repräsentation des Audio-Eingangssignals 58 zu erhalten. Dabei ist in einem ersten Zeitintervall das erste Ausgangssignal 50 zu einem mehr als 50%igen Anteil aus dem Audio-Eingangssignal 54 und das zweite Ausgangssignal 52 zu einem mehr als 50%igen Anteil aus der verzögerten Repräsentation des Audio-Eingangssignals 58 gebildet. In einem zweiten Zeitintervall ist das erste Ausgangssignal 50 aus einem mehr als 50%igen Anteil der verzögerten Repräsentation des Audio-Eingangssignals 58 und das zweite Ausgangssignal 52 aus einem mehr als 50%igen Anteil des Audio-Eingangssignals gebildet.
  • 2b zeigt mögliche Steuerfunktionen für den Mixer 60, wie er in 2a dargestellt ist. Aufgetragen ist auf der x-Achse die Zeit t in willkürlichen Einheiten sowie auf der y-Achse die Funktion X(t), die mögliche Funktionswerte von Null bis Eins aufweist. Dabei können andere Funktionen X(t) ebenfalls verwendet werden, die auch nicht notwendigerweise einen Wertebereich von 0 bis 1 aufweisen müssen. Auch andere Wertebereiche, beispielsweise von 0 bis 10, sind vorstellbar. Dargestellt sind drei Beispiele für Funktionen X(t), die die Ausgangssignale in dem ersten Zeitintervall 62 und dem zweiten Zeitintervall 64 bestimmen.
  • Eine erste Funktion 66, die kastenförmig dargestellt ist, entspricht dem in 2 beschriebenen Fall des Austauschens der Kanäle, bzw. des überblendfreien Umschaltens, das schematisch auch in 1 dargestellt ist. Betrachtet man beispielsweise das erste Ausgangssignal 50 von 2a, so wird dieses im ersten Zeitintervall 62 vollständig vom Audio-Eingangssignal 54 gebildet, während im ersten Zeitintervall 62 das zweite Ausgangssignal 52 vollständig von der verzögerten Repräsentation des Audio-Eingangssignals 58 gebildet wird. Im zweiten Zeitintervall 64 gilt dasselbe umgekehrt, wobei die Länge der Zeitintervalle nicht zwingend identisch sein muss.
  • Eine zweite, gestrichelt dargestellte, Funktion 58 schaltet die Signale nicht vollständig um, bzw. erzeugt ein erstes und ein zweites Ausgangssignal 50 und 52, die zu keinem Zeitpunkt vollständig aus dem Audio-Eingangssignal 54 oder der verzögerten Repräsentation des Audio-Eingangssignals 58 gebildet werden. Jedoch ist im ersten Zeitintervall 62 das erste Ausgangssignal 50 zu einem mehr als 50-%igen Anteil aus dem Audio-Eingangssignal 54 gebildet, was entsprechend auch für das zweite Ausgangssignal 52 gilt.
  • Eine dritte Funktion 69 ist so implementiert, dass sie zu Überblendzeitpunkten 69a bis 69c, die den Übergangszeitpunkten zwischen dem ersten Zeitintervall 62 und dem zweiten Zeitintervall 64 entsprechen, die also diejenigen Zeitpunkte markieren, an denen die Audio-Ausgangssignale variiert werden, so beschaffen, dass diese einen Überblend-Effekt erzielt. Das heißt also, dass in einem Beginnintervall und in einem Endintervall am Beginn und am Ende des ersten Zeitintervalls 62 das erste Ausgangssignal 50 und das zweite Ausgangssignal 52 sowohl Anteile des Audio-Eingangssignals 58 als auch der verzögerten Repräsentation des Audio-Eingangssignals enthalten.
  • In einem Zwischenzeitintervall 69 zwischen dem Beginnintervall und dem Endintervall entspricht das erste Ausgangssignal 50 dem Audio-Eingangssignal 54 und das zweite Ausgangssignal 52 der verzögerten Repräsentation des Audio-Eingangssignals 58. Die Steilheit der Funktion 69 an den Überblendzeitpunkt 69a bis 69c kann in weiten Grenzen variiert werden, um die wahrgenommene Reproduktionsqualität des Audiosignals an die Gegebenheiten anzupassen. Dabei ist jedoch in jedem Fall sichergestellt, dass in einem ersten Zeitintervall das erste Ausgangssignal 50 einen mehr als 50%igen Anteil des Audio-Eingangssignals 54 und das zweite Ausgangssignal 52 einem mehr als 50%igen Anteil der verzögerten Repräsentation des Audio-Eingangssignals 58 enthält, und dass in einem zweiten Zeitintervall 64 das erste Ausgangssignal 50 einen mehr als 50%igen Anteil der verzögerten Repräsentation des Audio-Eingangssignals 58 und das zweite Ausgangssignal 52 einen mehr als 50%igen Anteil des Audio-Eingangssignals 54 enthält.
  • 3 zeigt ein weiteres Ausführungsbeispiel für einen Dekorrelator, der das erfindungsgemäße Konzept implementiert. Dabei sind funktionsidentische oder ähnliche Komponenten mit denselben Bezugszeichen wie in den vorhergehenden Beispielen bezeichnet.
  • Allgemein gilt im Kontext der gesamten Anmeldung, dass funktionsidentische oder funktionsähnliche Komponenten mit denselben Bezugszeichen bezeichnet sind, so dass deren Beschreibung anhand der einzelnen Ausführungsbeispiele wechselseitig aufeinander anwendbar ist.
  • Der in 3 gezeigte Dekorrelator unterscheidet sich vom in 1 schematisch dargestellten Dekorrelator dadurch, dass das Audio-Eingangssignal 54 und die verzögerte Repräsentation des Audio-Eingangssignals 58 mittels einer optionalen Skaliereinrichtung 74 skaliert werden können, bevor diese dem Mixer 60 zugeführt werden. Die optionale Skaliereinrichtung 74 weist dabei einen ersten Skalierer 76a und einen zweiten Skalierer 76b auf, wobei der erste Skalierer 76a das Audio-Eingangssignal 54 und der zweite Skalierer 76b die verzögerte Repräsentation des Audio-Eingangssignals 58 skalieren kann.
  • Die Verzögerungseinrichtung 56 wird von dem Audio-Eingangssignal (monophonisch) 54 gespeist. Der erste Skalierer 76a und der zweite Skalierer 76b können optional die Intensität des Audio-Eingangssignals und der verzögerten Repräsentation des Audio-Eingangssignals variieren. Bevorzugt wird dabei die Intensität des zeitlich folgenden Signals (G_lagging), also der verzögerten Repräsentation des Audio-Eingangssignals 58 erhöht und/oder die Intensität des führenden Signals (G_leading), also des Audio-Eingangssignals 54, erniedrigt. Die Änderung der Intensität kann dabei beispielsweise anhand der folgenden einfachen multiplikativen Operationen vorgenommen werden, bei denen ein geeignet gewählter Verstärkungsfaktor an die einzelnen Signalkomponenten multipliziert wird: L' = M·G_leading R' = M_d·G_lagging
  • Die Verstärkungsfaktoren können dabei so gewählt werden, dass die Gesamtenergie erhalten ist. Zusätzlich können die Verstärkungsfaktoren so definiert sein, dass diese sich signalabhängig verändern. Im Falle von zusätzlich übertragender Seiteninformation, also beispielsweise bei Vielkanal-Audiorekonstruktion, können die Verstärkungsfaktoren auch von der Seiteninformation abhängig sein, so dass diese abhängig von dem zu rekonstruierenden akustischen Szenario variiert werden.
  • Durch die Applikation von Gain-Faktoren bzw. Verstärkungsfaktoren und durch die Variation der Intensität des Audio-Eingangssignals 54 bzw. der verzögerten Repräsentation des Audio-Eingangssignals 58 kann der Präzedenzeffekt (der Effekt, der sich aus der zeitlich verzögerten Wiederholung desselben Signals ergibt) kompensiert werden, indem die Intensität der direkten Komponente bezüglich der verzögerten Komponente so verändert wird, dass verzögerte Komponenten verstärkt und/oder die nicht-verzögerte Komponente abgeschwächt wird. Der durch die eingeführte Verzögerung hervorgerufene Präzedenzeffekt kann also durch Lautstärkeanpassungen (Intensitätsanpassungen), die für das räumliche Hören wichtig sind, teilweise ausgeglichen werden.
  • Wie im obigen Fall werden die verzögerte und die nicht-verzögerte Signalkomponente (das Audio-Eingangssignal 54 und die verzögerte Repräsentation des Audio-Eingangssignals 58) mit einer geeigneten Rate vertauscht, das heißt:
    L' = M und R' = M_d in einem ersten Zeitintervall und
    L' = M_d und R' = M in einem zweiten Zeitintervall.
  • Wird das Signal in Frames, also in diskreten Zeitabschnitten konstanter Länge, verarbeitet, ist das Zeitintervall des Vertauschens (Vertauschungsrate) bevorzugt ein ganzzahliges Vielfaches der Frame-Länge. Ein Beispiel für eine ty pische Vertauschungszeit oder Vertauschungsperiode ist 100 ms.
  • Das erste Ausgangssignal 50 und das zweite Ausgangssignal 52 können direkt als Ausgangssignal ausgegeben werden, wie in 1 gezeigt. Wenn die Dekorrelation auf Grundlage von transformierten Signalen stattfindet, ist nach der Dekorrelation selbstverständlich eine Rücktransformation erforderlich. Der Dekorrelator in 3 weist zusätzlich einen optionalen Nachprozessor 80 auf, der das erste Ausgangssignal 50 und das zweite Ausgangssignal 52 kombiniert, um an seinem Ausgang ein nachprozessiertes Ausgangssignal 82 und ein zweites nachprozessiertes Ausgangssignal 84 bereitzustellen, der Nachprozessor kann dabei mehrere vorteilhafte Wirkungen aufweisen. Zum einen kann er dazu dienen, dass Signal für weitere Verfahrensschritte, beispielsweise einen darauffolgenden Up-Mix in einer Mehrkanalrekonstruktion so aufzubereiten, dass ein bereits existierender Dekorrelator durch den erfindungsgemäßen Dekorrelator ersetzt werden kann, ohne den Rest der Signalverarbeitungskette verändern zu müssen.
  • So kann beispielsweise der in 3 gezeigte Dekorrelator die dem Stand der Technik entsprechenden Dekorrelatoren bzw. die Standarddekorrelatoren 10 der 7 und 8 vollständig ersetzen, wodurch die Vorteile der erfindungsgemäßen Dekorrelatoren auf einfache Art und Weise in bereits existierende Dekoder-Set-ups integriert werden können.
  • Ein Beispiel für eine Signalnachbearbeitung, wie sie durch den Nachprozessor 80 durchgeführt werden kann, ist anhand der folgenden Gleichungen gegeben, welche eine Mitte-Seite (MS)-Codierung beschreiben: M = 0.707·(L' + R') D = 0,707·(L' – R')
  • In einem weiteren Ausführungsbeispiel wird der Nachprozessor 80 dazu verwendet, den Grad der Vermischung des direkten Signals und des verzögerten Signals zu verringern. Dabei kann die anhand der obigen Formel dargestellte normale Kombination modifiziert werden, so dass beispielsweise im Wesentlichen das erste Ausgangssignal 50 skaliert und als erstes nachprozessiertes Ausgangssignal 82 verwendet wird, während das zweite Ausgangssignal 52 als Grundlage für das zweite nachprozessierte Ausgangssignal 84 verwendet wird. Der Nachprozessor bzw. die den Nachprozessor beschreibende Mix-Matrix kann dabei entweder vollständig umgangen werden oder die Matrix-Koeffizienten, die die Kombination der Signale im Nachprozessor 80 steuern, können so variiert werden, dass nur wenig oder keine zusätzliche Mischung der Signale auftritt.
  • 4 zeigt eine weitere Möglichkeit, den Präzedenz-Effekt durch eine geeignete Korrelator zu vermeiden. Dabei sind die im 3 gezeigten ersten und zweiten Skaliereinheiten 76a und 76b obligatorisch, wo hingegen der Mixer 60 entfallen kann.
  • Dabei wird, in Analogie zum oben beschriebenen Fall entweder das Audio-Eingangssignal 54 und/oder die verzögerte Repräsentation des Audio-Eingangssignals 58 verändert bzw. in seiner Intensität variiert. Um den Präzedenz-Effekt zu verhindern, werden entweder die Intensität der verzögerten Repräsentation des Audio-Eingangssignals 58 erhöht und/oder die Intensität des Audio-Eingangssignals 54 erniedrigt, wie es den folgenden Gleichungen zu entnehmen ist: L' = M·G_leading R' = M_d·G_lagging
  • Dabei wird die Intensität bevorzugt in Abhängigkeit von der Verzögerungszeit der Verzögerungseinrichtung 56 verändert, so dass bei kürzerer Verzögerungszeit eine größere Verrin gerung der Intensität des Audio-Eingangssignals 54 erreicht wird.
  • Vorteilhafte Kombinationen von Verzögerungszeiten und dazugehörigen Verstärkungsfaktoren sind in der folgenden Tabelle zusammengefasst:
    Delay (ms) 3 6 9 12 15 30
    Gain factor 0,5 0,65 0,65 0,7 0,8 0,9
  • Die skalierten Signale können dann beliebig gemischt werden, beispielsweise mittels eines oben beschriebenen Mitte-Seite-Codierers oder eines der anderen Misch-Algorithmen, die im Vorhergehenden beschrieben wurden.
  • Durch die Skalierung des Signals wird also der Präzedenzeffekt vermieden, indem die zeitlich vorauseilende Komponente in der Intensität verringert wird. Daher kann mittels einer Mischung nun ein Signal erzeugt werden, welches die im Signal enthaltenden Transientenanteile nicht zeitlich verschmiert und darüber hinaus keine unerwünschte Verfälschung des Klangeindrucks durch den Präzedenz-Effekt hervorruft.
  • 5 zeigt schematisch ein Beispiel für ein erfindungsgemäßes Verfahren zum Erzeugen von Ausgangssignalen, basierend auf einem Audio-Eingangssignal 54. In einem Kombinationsschritt 90 wird eine um eine Verzögerungszeit verzögerte Repräsentation des Audio-Eingangssignals 54 mit dem Audio-Eingangssignal 54 kombiniert, um ein erstes Ausgangssignal 52 und ein zweites Ausgangssignal 54 zu erhalten, wobei in einem ersten Zeitintervall das erste Ausgangssignal 52 dem Audio-Eingangssignal 54 und das zweite Ausgangssignal der verzögerten Repräsentation des Audio-Eingangssignals entspricht und wobei in einem zweiten Zeitintervall das erste Ausgangssignal 52 der verzögerten Repräsentation des Audio- Eingangssignals und das zweite Ausgangssignal 54 dem Audio-Eingangssignal entspricht.
  • 6 zeigt die Anwendung des erfindungsgemäßen Konzepts in einem Audio-Decoder. Ein Audio-Decoder 100 umfasst einen Standard-Dekorrelator 102 und einen Dekorrelator 104, der einem der im Vorhergehenden beschriebenen erfindungsgemäßen Dekorrelatoren entspricht. Der Audiodecoder 100 dient dem Erzeugen eines mehrkanaligen Ausgangssignals 106, welches im gezeigten Fall beispielhaft zwei Kanäle aufweist. Das mehrkanalige Ausgangssignal wird basierend auf einem Audio-Eingangssignal 108 erzeugt, das, wie gezeigt, ein Mono-Signal sein kann. Der Standard-Dekorrelator 102 entspricht den im Stand der Technik bekanten Dekorrelatoren und der Audio-Decoder ist so beschaffen, dass dieser im einem Standardbetriebs-Modus den Standard-Dekorrelator 102 verwendet, um bei einem Transienten-Audio-Eingangssignal 108 den Dekorrelator 104 alternativ zu verwenden. So wird die vom Audio-Decoder erzeugte Mehrkanalrepräsentation auch bei Vorliegen von transienten Eingangssignalen bzw. transienten Downmix-Signalen mit guter Qualität möglich.
  • Die grundlegende Intention ist also, erfindungsgemäße Dekorrelatoren anzuwenden, wenn stark dekorrelierte und transiente Signale verarbeitet werden sollen. Wenn die Möglichkeit besteht, transiente Signale zu erkennen, kann der erfindungsgemäße Dekorrelator alternativ zu einem Standard-Dekorrelator eingesetzt werden.
  • Wenn zusätzlich Dekorrelationsinformation zur Verfügung steht (beispielsweise ein ICC-Parameter, der im MPEG-Surround-Standard die Korrelation zwischen zwei Ausgangssignalen eines Vielkanaldownmixes beschreibt), kann diese zusätzlich als Entscheidungskriterium verwendet werden, um zu entscheiden, welcher Dekorrelator verwendet werden soll. So können beispielsweise bei kleinen ICC-Werten (beispielsweise Werten kleiner 0,5) Ausgänge der erfindungsgemäßen Dekorrelatoren (beispielsweise des Dekorrelators der 1 und 3) verwendet werden. Für nicht-transiente Signale (beispielsweise tonale Signale) werden also Standard-Dekorrelatoren verwendet, um zu jeder Zeit die bestmögliche Reproduktionsqualität sicherzustellen.
  • Die Anwendung der erfindungsgemäßen Dekorrelatoren im Audiodecoder 100 ist also signalabhängig. Wie oben erwähnt, existieren Möglichkeiten der Detektion von transienten Signalanteilen (beispielsweise LPC-Prädiktion im Signalspektrum oder ein Vergleich der Energien, die im niederfrequenten Spektralbereich im Signal enthalten sind mit denjenigen im hohen Spektralbereich). In vielen Decodier-Szenarien sind diese Detektionsmechanismen bereits vorhanden oder können einfach implementiert werden. Ein Beispiel für bereits vorhandene Indikatoren sind die oben erwähnten Korrelations- oder Kohärenzparameter eines Signals. Zusätzlich zur einfachen Erkennung des Vorhandenseins von transienten Signalanteilen können diese Parameter verwendet werden, um die Stärke der Dekorrelation der erzeugten Ausgangskanäle zu steuern.
  • Beispiele für die Verwendung bereits existierender Detektionsalgorithmen für transiente Signale sind MPEG-Surround, wo die Steuerinformation des STP-Werkzeuges zur Detektion geeignet ist und die Zwischen-Kanal-Kohärenz-Parameter (ICC) verwendet werden können. Die Detektion kann dabei sowohl auf der Encoder als auf der Decoderseite erfolgen. Im erstgenannten Fall wäre ein Signal-Flag oder Bit zu übermitteln, welches vom Audio-Decoder 100 ausgewertet wird, um zwischen den verschiedenen Dekorrelatoren hin und her zu schalten. Wenn das Signalverarbeitungsschema des Audiodecoders 100 auf überlappenden Fenstern zur Rekonstruktion des endgültigen Audiosignals basiert und die Überlappung der benachbarten Fenster (Frames) groß genug ist, kann eine einfache Umschaltung zwischen verschiedenen Dekorrelatoren erfolgen, ohne dass dies zur Einführung hörbarer Artefakte führt.
  • Ist dies nicht der Fall, können verschiedene Maßnahmen ergriffen werden, um einen annäherungsweise unhörbaren Übergang zwischen den unterschiedlichen Dekorrelatoren zu ermöglichen. Dabei kann zum einen eine Überblend-Technik verwendet werden, bei der zunächst beide Dekorrelatoren parallel verwendet werden. Das Signal des Standarddekorrelators 102 wird dann beim Übergang zum Dekorrealator 104 intensitätsmäßig langsam ausgeblendet, während das Signal des Dekorrelators 104 simultan eingeblendet wird. Darüber hinaus können beim hin- und herschalten Hystereseschaltkurven verwendet werden, die sicherstellen, dass nach erfolgter Umschaltung auf einen Dekorrelator dieser für eine vorbestimmte Mindestzeit verwendet wird, um mehrmaliges unmittelbares Hin- und Herschalten zwischen den verschiedenen Dekorrelatoren zu verhindern.
  • Zusätzlich zu Lautstärkeeffekten kann es zu anderen wahrnehmungspsychologischen Effekten kommen, wenn unterschiedliche Dekorrelatoren verwendet werden.
  • Dies ist insbesondere der Fall, da die erfindungsgemäßen Dekorrelatoren einen besonders „breites” Klangfeld erzeugen können. In einer nachgeschalteten Mix-Matrix, wird bei der Vielkanal-Audio-Rekonstruktion einem direkten Signal eine bestimmte Menge eines dekorrelierten Signals zugemischt. Dabei bestimmt die Menge des dekorrelierten Signals bzw. die Dominanz des dekorrelierten Signals im erzeugten Ausgangssignal üblicherweise die Breite des wahrgenommenen Klangfelds. Die Matrixkoeffizienten dieser Misch-Matrix (Mix-Matrix) werden dabei üblicherweise von den oben erwähnten übertragenen Korrelationsparametern bzw. anderen räumlichen Parametern gesteuert. Daher kann vor dem Umschalten auf einen erfindungsgemäßen Dekorrelator die Breite des Klangfeldes zunächst künstlich erhöht werden, indem die Koeffizienten der Mix-Matrix so verändert werden, dass der breite Klangeindruck langsam entsteht, bevor auf die erfindungsgemäßen Dekorrelatoren umgeschalten wird. Im anderen Fall des Umschaltens vom erfindungsgemäßen Dekorrela tor kann auf dieselbe Art und Weise die Breite des Klangeindrucks verringert werden, bevor die eigentliche Umschaltung erfolgt.
  • Natürlich können oben beschriebene Umschaltszenarien auch kombiniert werden, um einen besonders weichen Übergang zwischen verschiedenen Dekorrelatoren zu erzielen.
  • Zusammenfassend weisen die erfindungsgemäßen Dekorrelatoren gegenüber dem Stand der Technik eine Reihe von Vorteilen auf, die insbesondere bei der Rekonstruktion applausähnlicher Signale, also von Signalen, die einen hohen transienten Signalanteil aufweisen, zum Tragen kommen. So wird zum einen ein extrem breites Klangfeld erzeugt, ohne zusätzliche Artefakte einzuführen, was insbesondere im Fall von transienten, applausähnlichen Signalen ein großer Vorteil ist. Wie mehrfach gezeigt, können die erfindungsgemäßen Dekorrelatoren einfach in bereits existierende Wiedergabeketten bzw. Decoder integriert werden und sogar von Parametern, die innerhalb dieser Decoder schon vorhanden sind, gesteuert werden, um die bestmögliche Reproduktion eines Signals zu erzielen. Als Beispiele für die Integration in solche existierenden Decoder-Strukturen wurden vorher bereits Parametric Stereo und MPEG-Surround genannt. Darüber hinaus schafft es das erfindungsgemäße Konzept, Dekorrelatoren zur Verfügung zu stellen, die nur außerordentlich geringe Anforderungen an die verfügbare Rechenleistung stellen, so dass zum einen keine teure Investition in Hardware erforderlich ist und zum anderen der zusätzliche Energieverbrauch der erfindungsgemäßen Dekorrelatoren vernachlässigbar ist.
  • Obwohl im Vorhergehenden hauptsächlich anhand von diskreten Signalen, also Audio-Signalen, die durch eine Folge von diskreten Abtastwerten repräsentiert werden, argumentiert wurde, dient dies lediglich dem besseren Verständnis. Das erfindungsgemäße Konzept ist ebenso auf kontinuierliche Audiosignale anwendbar, so wie auf andere Darstellungen von Audiosignalen, beispielsweise von Parameterrepräsentationen in frequenztransformierten Darstellungsräumen.
  • Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren Erzeugen von Ausgangssignalen in Hardware oder in Software implementiert werden. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das erfindungsgemäße Verfahren Erzeugen von Ausgangssignalen ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.

Claims (22)

  1. Dekorrelator zum Erzeugen von Ausgangssignalen (50, 52) basierend auf einem Audio-Eingangssignal (54), mit folgenden Merkmalen: einer Verzögerungseinrichtung (56), die ausgebildet ist, um eine verzögerte Repräsentation des Audio-Eingangssignals (58) unter zeitlicher Verzögerung des Audio-Eingangssignals (54) um eine Verzögerungszeit zu erzeugen; einem Mixer (60) zum Kombinieren der verzögerten Repräsentation des Audio-Eingangssignals (58) mit dem Audio-Eingangssignal (54), um ein erstes (50) und ein zweites (52) Ausgangssignal mit zeitlich variierenden Anteilen des Audio-Eingangssignals (54) und der verzögerten Repräsentation des Audio-Eingangssignals (58) zu erhalten, wobei in einem ersten Zeitintervall (70) das erste Ausgangssignal (50) einen mehr als 50-prozentigen Anteil des Audio-Eingangssignals (54) und das zweite Ausgangssignal (52) einen mehr als 50-prozentigen Anteil der verzögerten Repräsentation des Audio-Eingangssignals (58) enthält, und wobei in einem zweiten Zeitintervall (72) das erste Ausgangssignal (50) einen mehr als 50-prozentigen Anteil der verzögerten Repräsentation des Audio-Eingangssignals (58) und das zweite Ausgangssignal (52) einen mehr als 50-prozentigen Anteil des Audio-Eingangssignal (54) enthält.
  2. Dekorrelator gemäß Patentanspruch 1, bei dem in dem ersten Zeitintervall (70) das erste Ausgangssignal dem Audio-Eingangssignal (54) und das zweite Ausgangssig nal (52) der verzögerten Repräsentation des Audio-Eingangssignals (58) entspricht, wobei in dem zweiten Zeitintervall (72) das erste Ausgangssignal (50) der verzögerten Repräsentation des Audio-Eingangssignals (58) und das zweite Ausgangssignal (52) dem Audio-Eingangssignal (54) entspricht.
  3. Dekorrelator gemäß Patentanspruch 1, bei dem in einem Beginnintervall und in einem Endintervall am Beginn und am Ende des ersten Zeitintervalls (70) das erste Ausgangssignal und das zweite Ausgangssignal (52) Amplitudenanteile des Audio-Eingangssignals (58) und der verzögerten Repräsentation des Audio-Eingangssignals (58) enthalten, wobei in einem Zwischenintervall zwischen dem Beginnintervall und dem Endintervall des ersten Zeitintervalls das erste Ausgangssignal dem Audio-Eingangssignal (54) und das zweite Ausgangssignal (52) der verzögerten Repräsentation des Audio-Eingangssignals (58) entspricht; und wobei in einem Beginnintervall und in einem Endintervall am Beginn und am Ende des zweiten Zeitintervalls (70) das erste Ausgangssignal und das zweite Ausgangssignal (52) Amplitudenanteile des Audio-Eingangssignals (58) und der verzögerten Repräsentation des Audio-Eingangssignals (58) enthalten, wobei in einem Zwischenintervall zwischen dem Beginnintervall und dem Endintervall des zweiten Zeitintervalls das erste Ausgangssignal der verzögerten Repräsentation des Audio-Eingangssignals (58) und das zweite Ausgangssignal (52) dem Audio-Eingangssignal (54) entspricht.
  4. Dekorrelator gemäß einem der Patentansprüche 1 bis 3, bei dem das erste und das zweite Zeitintervall zeitlich benachbart sind und aufeinander folgen.
  5. Dekorrelator gemäß einem der Patentansprüche 1 bis 4, der ferner eine Skaliereinrichtung (74) umfasst, um eine Intensität des Audio-Eingangssignals (54) und/oder der verzögerten Repräsentation des Audio-Eingangssignals (58) zu verändern.
  6. Dekorrelator gemäß Patentanspruch 5, bei dem die Skaliereinrichtung (74) ausgebildet ist, um die Intensität des Audio-Eingangssignals (54) in Abhängigkeit der Verzögerungszeit so zu skalieren, dass bei kürzerer Verzögerungszeit eine größere Verringerung der Intensität des Audio-Eingangssignals (54) erreicht wird.
  7. Dekorrelator gemäß einem der vorhergehende Patentansprüche, der ferner einen Nachprozessor (80) zum Kombinieren des ersten (50) und des zweiten Ausgangssignals (52) umfasst, um ein erstes (82) und ein zweites (84) nachprozessiertes Ausgangssignal zu erhalten und – das erste nachprozessierte Ausgangssignal M (82) und das zweite nachprozessierte Ausgangssignal D (84) aus dem ersten Ausgangssignal L' (50) und dem zweiten Ausgangssignal R' (52) derart zu bilden, dass folgende Bedingungen erfüllt sind: M = 0,707·(L' + R'), und D = 0,707·(L' – R').
  8. Dekorrelator gemäß einem der vorhergehenden Patentansprüche, bei dem die Verzögerungseinrichtung (56) ausgebildet ist, des Audio-Eingangssignals (58) um eine Verzögerungszeit zu verzögern, die größer als 2 ms und kleiner als 50 ms ist.
  9. Dekorrelator gemäß Patentanspruch 8, bei dem die Verzögerungszeit 3, 6, 9, 12, 15 oder 30 ms beträgt.
  10. Dekorrelator gemäß einem der vorhergehenden Patentansprüche, bei dem der Mixer (60) ausgebildet ist, um ein aus diskreten Abtastwerten bestehendes Audio-Eingangssignal (54) und eine aus diskreten Abtastwerten bestehende verzögerte Repräsentation des Audio-Eingangssignals (58) durch Austausch der Abtastwerte des Audio-Eingangssignals (54) und der Abtastwerte der verzögerten Repräsentation des Audio-Eingangssignals (58) zu kombinieren.
  11. Dekorrelator gemäß einem der vorhergehenden Patentansprüche, bei dem der Mixer (60) ausgebildet ist, das Audio-Eingangssignal (54) und die verzögerte Repräsentation des Audio-Eingangssignals (58) derart zu kombinieren, dass das erste und das zweite Zeitintervall die gleiche Länge besitzen.
  12. Dekorrelator gemäß einem der vorhergehenden Patentansprüche, bei dem der Mixer (60) ausgebildet ist, mehrere zeitlich aufeinanderfolgende Paare bestehend aus je einem ersten (70) und einem zweiten (72) Zeitintervall zu erzeugen.
  13. Dekorrelator gemäß Patentanspruch 12, bei dem der Mixer (60) ausgebildet ist, um zumindest ein weiteres Paar der Folge derart zu erzeugen, dass im ersten (70) und zweiten (72) Zeitintervall das erste Ausgangssignal (50) dem Audio-Eingangssignal (54) und das zweite Ausgangssignal (52) der verzögerten Repräsentation des Audio-Eingangssignals (58) entspricht.
  14. Dekorrelator gemäß Patentanspruch 12 oder 13, bei dem der Mixer (60) ausgebildet ist, die Kombination derart vorzunehmen, dass sich die einem ersten Paar der Folge zugeordneten ersten und zweiten Zeitintervalle von den einem zweiten Paar der Folge zugeordneten ersten und zweiten Zeitintervallen unterscheiden.
  15. Dekorrelator gemäß einem der vorhergehenden Patentansprüche, bei dem die Zeitdauer des ersten (70) und des zweiten (72) Zeitintervalls größer als die doppelte mittlere Zeitdauer von im Audio-Eingangssignal (54) enthaltenen transienten Signalanteilen ist.
  16. Dekorrelator gemäß einem der vorhergehenden Patentansprüche, bei dem die Zeitdauer des ersten (70) und des zweiten (72) Zeitintervalls größer als 10 ms und kleiner als 200 ms ist.
  17. Verfahren zum Erzeugen von dekorrelierten Ausgangssignalen (50, 52) basierend auf einem Audio-Eingangssignal (54), mit folgenden Schritten: Erzeugen einer verzögerten Repräsentation des Audio-Eingangssignals (58) unter zeitlicher Verzögerung des Audio-Eingangssignals (54) um eine Verzögerungszeit; Kombinieren einer um eine Verzögerungszeit verzögerten Repräsentation des Audio-Eingangssignals (58) mit dem Audio-Eingangssignal (54), um ein erstes (50) und ein zweites (52) Ausgangssignal mit zeitlich variierenden Anteilen des Audio-Eingangssignals (58) und der verzögerten Repräsentation des Audio-Eingangssignals (58) zu erhalten, wobei in einem ersten Zeitintervall (70) das erste Ausgangssignal (50) einen mehr als 50-prozentigen Anteil des Audio-Eingangssignals (54) und das zweite Ausgangssignal (52) einen mehr als 50-prozentigen Anteil der verzögerten Repräsentation des Audio-Eingangssignals (58) enthält, und wobei in einem zweiten Zeitintervall (72) das erste Ausgangssignal (50) einen mehr als 50-prozentigen Anteil der verzögerten Repräsentation des Audio-Eingangssignals (58) und das zweite Ausgangssignal (52) einen mehr als 50-prozentigen Anteil des Audio-Eingangssignal (54) enthält.
  18. Verfahren gemäß Patentanspruch 17, bei dem in dem ersten Zeitintervall (70) das erste Ausgangssignal dem Audio-Eingangssignal (54) und das zweite Ausgangssignal (52) der verzögerten Repräsentation des Audio-Eingangssignals (58) entspricht, wobei in dem zweiten Zeitintervall (72) das erste Ausgangssignal (50) der verzögerten Repräsentation des Audio-Eingangssignals (58) und das zweite Ausgangssignal (52) dem Audio-Eingangssignal (54) entspricht.
  19. Verfahren gemäß Patentanspruch 17 oder 18, bei dem in einem Beginnintervall und in einem Endintervall am Beginn und am Ende des ersten Zeitintervalls (70) das erste Ausgangssignal und das zweite Ausgangssignal (52) Amplitudenanteile des Audio-Eingangssignals (58) und der verzögerten Repräsentation des Audio-Eingangssignals (58) enthalten, wobei in einem Zwischenintervall zwischen dem Beginnintervall und dem Endintervall des ersten Zeitintervalls das erste Ausgangssignal dem Audio-Eingangssignal (54) und das zweite Ausgangssignal (52) der verzögerten Repräsentation des Audio-Eingangssignals (58) entspricht; und wobei in einem Beginnintervall und in einem Endintervall am Beginn und am Ende des zweiten Zeitintervalls (70) das erste Ausgangssignal und das zweite Ausgangssignal (52) Amplitudenanteile des Audio-Eingangssignals (58) und der verzögerten Repräsentation des Audio-Eingangssignals (58) enthalten, wobei in einem Zwischenintervall zwischen dem Beginnintervall und dem Endintervall des zweiten Zeitintervalls das erste Ausgangssignal der verzögerten Repräsentation des Audio-Eingangssignals (58) und das zweite Ausgangssignal (52) dem Audio-Eingangssignal (54) entspricht.
  20. Verfahren gemäß einem der Patentansprüche 17 bis 19, mit folgendem zusätzlichen Schritt: Verändern der Intensität des Audio-Eingangssignals (54) und/oder der verzögerten Repräsentation des Audio-Eingangssignals (58).
  21. Verfahren gemäß einem der Patentansprüche 17 bis 20 mit folgendem zusätzlichem Schritt: Kombinieren des ersten (50) und des zweiten (52) Ausgangssignals, um ein erstes (82) und ein zweites (84) nachprozessiertes Ausgangssignal zu erhalten, wobei das erste nachprozessierte Ausgangssignal M (82) und das zweite nachprozessierte Ausgangssignal D (84) aus dem ersten Ausgangssignal L' (50) und dem zweiten Ausgangssignal R' (52) derart kombiniert werden, dass folgende Bedingungen erfüllt sind: M = 0,707·(L' + R'), und D = 0,707·(L' – R').
  22. Audiodecoder zum Erzeugen eines mehrkanaligen Ausgangssignals basierend auf einem Audio-Eingangssignal (54), mit folgenden Merkmalen: einem Dekorrelator gemäß einem der Patentansprüche 1 bis 18; und einem Standard-Dekorrelator, wobei der Audio-Decoder ausgebildet ist, um in einem Standardbetriebsmodus den Standard-Dekorrelator zu verwenden und um bei einem transienten Audio-Eingangssignal (54) den erfindungsgemässen Dekorrelator zu verwenden.
DE102007018032A 2007-04-17 2007-04-17 Erzeugung dekorrelierter Signale Expired - Fee Related DE102007018032B4 (de)

Priority Applications (17)

Application Number Priority Date Filing Date Title
DE102007018032A DE102007018032B4 (de) 2007-04-17 2007-04-17 Erzeugung dekorrelierter Signale
MYPI20091415A MY145952A (en) 2007-04-17 2008-04-14 Generation of decorrelated signals
CN2008800005968A CN101543098B (zh) 2007-04-17 2008-04-14 产生输出信号的去相关器和方法以及产生多声道输出信号的音频解码器
US12/440,940 US8145499B2 (en) 2007-04-17 2008-04-14 Generation of decorrelated signals
RU2009116268/09A RU2411693C2 (ru) 2007-04-17 2008-04-14 Генерация декоррелированных сигналов
KR1020097008644A KR101104578B1 (ko) 2007-04-17 2008-04-14 비상관기, 그 비상관기를 이용하는 오디오 디코더, 오디오 입력신호에 근거한 출력신호의 발생방법 및 기록매체
EP08735224A EP2036400B1 (de) 2007-04-17 2008-04-14 Erzeugung dekorrelierter signale
PCT/EP2008/002945 WO2008125322A1 (de) 2007-04-17 2008-04-14 Erzeugung dekorrelierter signale
JP2009529719A JP4682262B2 (ja) 2007-04-17 2008-04-14 非相関信号の生成
CA2664312A CA2664312C (en) 2007-04-17 2008-04-14 Generation of decorrelated signals
DE502008000252T DE502008000252D1 (de) 2007-04-17 2008-04-14 Erzeugung dekorrelierter signale
AT08735224T ATE452514T1 (de) 2007-04-17 2008-04-14 Erzeugung dekorrelierter signale
AU2008238230A AU2008238230B2 (en) 2007-04-17 2008-04-14 Generation of decorrelated signals
TW097113879A TWI388224B (zh) 2007-04-17 2008-04-16 解相關信號的產生
ZA2009/00801A ZA200900801B (en) 2007-04-17 2009-02-03 Generation of decorrelated signals
IL196890A IL196890A0 (en) 2007-04-17 2009-02-04 Generation of decorrelated signals
HK09103754.1A HK1124468A1 (en) 2007-04-17 2009-04-23 Generation of decorrelated signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102007018032A DE102007018032B4 (de) 2007-04-17 2007-04-17 Erzeugung dekorrelierter Signale

Publications (2)

Publication Number Publication Date
DE102007018032A1 DE102007018032A1 (de) 2008-10-23
DE102007018032B4 true DE102007018032B4 (de) 2010-11-11

Family

ID=39643877

Family Applications (2)

Application Number Title Priority Date Filing Date
DE102007018032A Expired - Fee Related DE102007018032B4 (de) 2007-04-17 2007-04-17 Erzeugung dekorrelierter Signale
DE502008000252T Active DE502008000252D1 (de) 2007-04-17 2008-04-14 Erzeugung dekorrelierter signale

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE502008000252T Active DE502008000252D1 (de) 2007-04-17 2008-04-14 Erzeugung dekorrelierter signale

Country Status (16)

Country Link
US (1) US8145499B2 (de)
EP (1) EP2036400B1 (de)
JP (1) JP4682262B2 (de)
KR (1) KR101104578B1 (de)
CN (1) CN101543098B (de)
AT (1) ATE452514T1 (de)
AU (1) AU2008238230B2 (de)
CA (1) CA2664312C (de)
DE (2) DE102007018032B4 (de)
HK (1) HK1124468A1 (de)
IL (1) IL196890A0 (de)
MY (1) MY145952A (de)
RU (1) RU2411693C2 (de)
TW (1) TWI388224B (de)
WO (1) WO2008125322A1 (de)
ZA (1) ZA200900801B (de)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2210253A4 (de) * 2007-11-21 2010-12-01 Lg Electronics Inc Verfahren und vorrichtung zur verarbeitung eines signals
WO2010070016A1 (en) 2008-12-19 2010-06-24 Dolby Sweden Ab Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters
MY180970A (en) 2010-08-25 2020-12-14 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information
EP2477188A1 (de) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierung und Decodierung von Slot-Positionen von Ereignissen in einem Audosignal-Frame
CN103139930B (zh) 2011-11-22 2015-07-08 华为技术有限公司 连接建立方法和用户设备
US9424859B2 (en) * 2012-11-21 2016-08-23 Harman International Industries Canada Ltd. System to control audio effect parameters of vocal signals
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
JP6046274B2 (ja) * 2013-02-14 2016-12-14 ドルビー ラボラトリーズ ライセンシング コーポレイション 上方混合されたオーディオ信号のチャネル間コヒーレンスの制御方法
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014130554A1 (en) * 2013-02-19 2014-08-28 Huawei Technologies Co., Ltd. Frame structure for filter bank multi-carrier (fbmc) waveforms
ES2624668T3 (es) * 2013-05-24 2017-07-17 Dolby International Ab Codificación y descodificación de objetos de audio
WO2015017223A1 (en) 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
RU2648947C2 (ru) * 2013-10-21 2018-03-28 Долби Интернэшнл Аб Параметрическая реконструкция аудиосигналов
EP2866227A1 (de) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Dekodierung und Kodierung einer Downmix-Matrix, Verfahren zur Darstellung von Audioinhalt, Kodierer und Dekodierer für eine Downmix-Matrix, Audiokodierer und Audiodekodierer
WO2015173423A1 (en) * 2014-05-16 2015-11-19 Stormingswiss Sàrl Upmixing of audio signals with exact time delays
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
US10560661B2 (en) 2017-03-16 2020-02-11 Dolby Laboratories Licensing Corporation Detecting and mitigating audio-visual incongruence
CN110740404B (zh) * 2019-09-27 2020-12-25 广州励丰文化科技股份有限公司 一种音频相关性的处理方法及音频处理装置
CN110740416B (zh) * 2019-09-27 2021-04-06 广州励丰文化科技股份有限公司 一种音频信号处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
US20060053018A1 (en) * 2003-04-30 2006-03-09 Jonas Engdegard Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4792974A (en) * 1987-08-26 1988-12-20 Chace Frederic I Automated stereo synthesizer for audiovisual programs
US6526091B1 (en) 1998-08-17 2003-02-25 Telefonaktiebolaget Lm Ericsson Communication methods and apparatus based on orthogonal hadamard-based sequences having selected correlation properties
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
AUPQ942400A0 (en) * 2000-08-15 2000-09-07 Lake Technology Limited Cinema audio processing system
US7107110B2 (en) * 2001-03-05 2006-09-12 Microsoft Corporation Audio buffers with audio effects
WO2005091678A1 (en) * 2004-03-11 2005-09-29 Koninklijke Philips Electronics N.V. A method and system for processing sound signals
EP1769491B1 (de) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Tonkanalkonvertierung
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US20090052681A1 (en) * 2004-10-15 2009-02-26 Koninklijke Philips Electronics, N.V. System and a method of processing audio data, a program element, and a computer-readable medium
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
CN102163429B (zh) 2005-04-15 2013-04-10 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
JP2007065497A (ja) * 2005-09-01 2007-03-15 Matsushita Electric Ind Co Ltd 信号処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060053018A1 (en) * 2003-04-30 2006-03-09 Jonas Engdegard Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding

Also Published As

Publication number Publication date
AU2008238230A1 (en) 2008-10-23
CA2664312A1 (en) 2008-10-23
ZA200900801B (en) 2010-02-24
TW200904229A (en) 2009-01-16
IL196890A0 (en) 2009-11-18
EP2036400B1 (de) 2009-12-16
EP2036400A1 (de) 2009-03-18
CN101543098B (zh) 2012-09-05
WO2008125322A1 (de) 2008-10-23
AU2008238230B2 (en) 2010-08-26
JP4682262B2 (ja) 2011-05-11
CA2664312C (en) 2014-09-30
DE102007018032A1 (de) 2008-10-23
ATE452514T1 (de) 2010-01-15
DE502008000252D1 (de) 2010-01-28
US8145499B2 (en) 2012-03-27
JP2010504715A (ja) 2010-02-12
RU2411693C2 (ru) 2011-02-10
CN101543098A (zh) 2009-09-23
US20090326959A1 (en) 2009-12-31
RU2009116268A (ru) 2010-11-10
KR20090076939A (ko) 2009-07-13
MY145952A (en) 2012-05-31
KR101104578B1 (ko) 2012-01-11
TWI388224B (zh) 2013-03-01
HK1124468A1 (en) 2009-07-10

Similar Documents

Publication Publication Date Title
DE102007018032B4 (de) Erzeugung dekorrelierter Signale
DE102006050068B4 (de) Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
DE602004001868T2 (de) Verfahren zum bearbeiten komprimierter audiodaten zur räumlichen wiedergabe
EP2005421B1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
EP2206113B1 (de) Vorrichtung und verfahren zum erzeugen eines multikanalsignals mit einer sprachsignalverarbeitung
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE602004010188T2 (de) Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE602005002942T2 (de) Verfahren zur darstellung von mehrkanal-audiosignalen
DE602004005846T2 (de) Audiosignalgenerierung
DE602004005020T2 (de) Audiosignalsynthese
DE69827775T2 (de) Tonkanalsmischung
DE19715498A1 (de) Stereobildverbesserungsvorrichtung und -verfahren unter Verwendung von Tabellen
WO2015049334A1 (de) Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals
WO2014072513A1 (de) Nichtlineare inverse kodierung von multikanal-signalen
DE102019135690B4 (de) Verfahren und Vorrichtung zur Audiosignalverarbeitung für binaurale Virtualisierung
WO2015128379A1 (de) Kodierung und dekodierung eines niederfrequenten kanals in einem audiomultikanalsignal
DE102017121876A1 (de) Verfahren und vorrichtung zur formatumwandlung eines mehrkanaligen audiosignals

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R020 Patent grant now final

Effective date: 20110211

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20111101