AUTONOME RESIDUALBESTIMMUNG UND GEWINNUNG VON RESIDUALARMEN
ZUSATZSIGNALEN
Multikanalsignale und insbesondere dreidimensionale Signale wie beispielsweise Audiosignale stellen hohe Anforderungen an zu übertragende oder zu speichernde Datenmengen, die es möglich effizient zu reduzieren gilt.
Allgemeine bekannte Vorrichtungen oder Verfahren für eine derartige Datenreduktion sind hier parametrische Verfahren, die räumliche Information beispielsweise anhand der aus dem Stand der Technik bekannten Fast Fourier Transform (FFT) extrahieren und anschließend als permanenten Datenstrom, etwa gemeinsam mit einem Mono- oder Stereosignal als Downmixsignal , übertragen. Eine solche Audio-Technologie ist insbesondere mit MPEG Surround bekannt und stellt mathematisch betrachtet ein adaptives Filterverfahren dar.
WO2014/072513, die beispielhaft anhand von FIG. 17 kurz erläutert wird, schlägt dahingegen erstmals den Einsatz der sogenannten nichtlinearen inversen Kodierung vor, dies unter zusätzlichem Einsatz von Korrelationsvergleich; dieser Ansatz kann, da nur noch die Parameter eines räumlichen Modells, dies nicht permanent, als Headerinformation oder Datenpuls übertragen werden müssen, mathematisch als ein statisches Filterverfahren betrachtet werden.
Allerdings gibt WO2014/072513 keine explizite technische Lösung für einen solchen Korrelationsvergleich an, da hier aus dem Stand der Technik bekannte Vorrichtungen oder Verfahren existieren wie beispielsweise das Upmix-System UPM1 des britischen Unternehmens Soundfield, das, gleichfalls auf FFT basierend, insgesamt einen hohen Rechenaufwand erfordert. Die Bildung der Ausgangssignale erfolgt hier allerdings amplitudenabhängig, was den Nachteil wandernder Schallquellen und zeitlich sich verschiebender Artefakte auf den einzelnen
Kanälen mit sich bringt, und insgesamt zu deutlichen spektralen Verfärbungen führt, die im Bereich der Audiokodierung sich störend auswirken. Eine einfache Vorrichtung oder ein einfaches Verfahren für einen solchen Korrelationsvergleich, das zudem das Ziel einer möglichst hohen psychoakustischen Transparenz erfüllt, ist mit der unveröffentlichten eigenen Anmeldung CH1696/13 offenbart. Zudem wird nachgewiesen, dass bei Anwendung eines Korrelationsvergleichs auf eine Kette von Signalen eine Korrektur um den Mittelwert aller Residuale dieses Korrelationsvergleichs algebraisch die optimale Lösung darstellt. Allerdings muss bei einem solchen
Korrelationsvergleich mit anschliessender Korrektur um den Mittelwert aller Residuale dieser Mittelwert dem zu übertragenden komprimierten Signal beigefügt werden, was zu einer wesentlichen, letztlich unerwünschten Erhöhung der Bandbreite führt. Auch gestaltet sich die Extraktion weiterer Signale aus Elementen der Signalkette mittels Korrelationsvergleiches schwierig. Im schlechtesten Falle kommt es zu sekundären Residualen, was schlichtweg bedeutet, dass Residuale nochmals einem Korrelationsvergleich unterzogen werden, und sich damit störendste Artefakte bilden. Die vorliegende Erfindung soll demnach einerseits eine autonome Bestimmung von störenden Residualen ermöglichen, ohne solche übertragen zu müssen, und andererseits sollen zusätzliche Signale so gewonnen werden, dass sich einerseits keine sekundären Residuale bilden, und andererseits eine optimale Maskierung der primären Residuale oder sonstigen durch Signalverarbeitung auftretenden Artefakte erreichen lässt .
Insbesondere stellt die autonome Residualbestimmung eine einfache Vorrichtung oder ein einfaches Verfahren dar, welche
zu drastischer Bandbreitenersparnis bei allerhöchster Transparenz führt.
Sie bleibt nicht auf Audiosignale beschränkt, obwohl sich insbesondere auf diese ein solches System optimal anwenden lässt. So lassen sich mit dem Erfindungsgegenstand etwa Videosignale effizient komprimieren und dekomprimieren - bzw. deren Residuale effizient minimieren.
Allgemein lässt sich der Erfindungsgegenstand in der gesamten Signaltechnik anwenden, sofern dieser eine Fourier- Transformation bzw. eine inverse Fourier-Transformation zugrundeliegen, und führt dort beispielsweise zu drastischer Bandbreitenersparnis oder ermöglicht eine effiziente Datenextraktion.
Mit vorliegender Erfindung lässt sich beispielsweise in der Audiokodierung die Anzahl der Downmixkanäle auf ein Minimum beschränken, da die zugemischten Kanäle sich wiederum durch Korrelationsvergleich isolieren lassen und somit insgesamt eine effiziente Speicherung und Übertragung hochkomplexer Audiosignale ermöglichen.
Insbesondere lassen sich solche hochkomplexen 3D-Audiosignale, wie sie beispielsweise mit dem Format NHK 22.2 bekannt sind, nunmehr in entsprechende Downmixkanäle zusammenfassen, die teilweise oder insgesamt wiederum einem solchen Korrelationsvergleich unterworfen werden können, und bei denen bei sogar verbesserter Qualität keine Residuale übertragen werden müssen.
Beispielsweise lassen sich innerhalb des Top Layer eines NHK- 22.2-Systems, siehe FIG. 21, oder eines ähnlichen Formats wie der sogenannten Auro-Formate des Instituts für Rundfunktechnik in München, siehe FIG. 11, ein TpC in rein algebraischer Form
extrahieren oder ein LFE-Signal gemeinsam mit dem Downmix derartiger Formate mittels einfachster Filtertechniken (beispielsweise mittels aus dem Stand der Technik bekannten IRR-Filtern mit anschliessender Allpass-Korrektur) übertragen und extrahieren.
Fig. 21 zeigt eine NHK-22.2-Anordnung aus der sich eine Vielzahl von Standards und im Markt vertretener Formate für „Audio Surround Sound" ableiten lassen. Aus Gründen der Einheitlichkeit soll aber immer die gleiche Nomenklatur des NHK-22.2-Standards verwendet werden, um keine Verwirrung zu stiften. Im Folgenden wird immer nur von Kanalpositionen gesprochen, wobei damit die Position eines dem Kanal zugeordneten Lautsprechers gemeint ist. Die Positionen in Fig. 21 sollen dabei weder exakt noch einschränkend sein, sondern nur die ungefähre relative Position der Lautsprecher zueinander darstellen. Das NHK-22.2-System weist drei horizontale Ebenen auf, die als untere Ebene (Bottom Layer) , mittlere Ebene (Middle Layer) und obere Ebene (Top Layer) bezeichnet werden. Viele andere Standards für „Audio Surround Sound" weisen zwei - meist die mittlere und die obere Ebene - oder auch drei dieser Ebenen auf und sollen für alle Standards als solche bezeichnet werden. Im Folgenden werden die einzelnen Kanalpositionen des NHK-22.2 Systems kurz eingeführt.
Die mittlere Ebene weist dabei die folgenden Kanalpositionen (Abkürzung in Klammern) auf: einen vorderen linken Kanal (FL), einen vorderen zentral linken Kanal (FLc) , einen vorderen zentralen Kanal (FC) , einen vorderen zentral rechten Kanal (FRc) , einen vorderen rechten Kanal (FR) , einen seitlich rechten Kanal (SiR) , einen hinteren rechten Kanal (BR) , einen hinteren zentralen Kanal (BC) , einen hinteren linken Kanal (BL) und einen seitlich linken Kanal (SiL) .
Die obere Ebene weist dabei die folgenden Kanalpositionen (Abkürzung in Klammern) auf: einen vorderen linken Kanal (TpFL) , einen vorderen zentralen Kanal (TpFC) , einen vorderen rechten Kanal (TpFR) , einen seitlich rechten Kanal (TpSiR) , einen hinteren rechten Kanal (TpBR) , einen hinteren zentralen
Kanal (TpBC) , einen hinteren linken Kanal (TpBL) und einen seitlich linken Kanal (TpSiL) . Die untere Ebene weist die folgenden Kanäle auf (Abkürzungen in Klammern) : einen vorderen linken Kanal (BtFL) , einen vorderen zentralen Kanal (BtFC) , einen vorderen rechten Kanal (BtFR) . Zusätzlich gibt es noch einen ersten niederfrequenten Kanal (LFE1) und einen zweiten niederfrequenten Kanal (LFE2), welche jeweils für einen Subwoofer bestimmt sind.
Folgende Dokumente sind insbesondere als zum Stand der Technik gehörig zu betrachten:
EP1850639 beschreibt einen statischen Filter, der aus einem Monosignal ein Stereosignal erzeugt. Dieser Filter kann auch auf Multikanalsignale angewandt werden.
WO2009138205 beschreibt einen statischen Filter, der aus einem Monosignal ein Stereosignal erzeugt. Dieser Filter kann auch auf Multikanalsignale angewandt werden.
WO2011009649 beschreibt eine Erweiterung der in EP1850639 und WO2009138205 beschriebenen statischen Filter zur Anpassung des Korrelationsgrads des jeweils erzeugten Stereosignals. Diese Erweiterung kann auch auf Multikanalsignale angewandt werden.
r
6
WO2011009650 beschreibt Erweiterungen der in EP1850639 und WO2009138205 und WO2011009649 beschriebenen Vorrichtungen oder Verfahren, um das jeweils erzeugte Stereosignal hinsichtlich der statischen Parameter zu optimieren. Diese Erweiterungen können auch auf Multikanalsignale angewandt werden.
WO2012016992 beschreibt die erstmalige praktische Verwendung von algebraischen Invarianten allgemein in der Signaltechnik und insbesondere auf EP1850639, WO2009138205, WO2011009649 und WO2011009650.
WO2012032178 beschreibt die zeitliche Skalierung von statischen Filtern gemäss EP1850639, WO2009138205, WO2011009649, WO2011009650 und WO2012016992.
Die genannten Dokumente zeigen alle Aspekte einer sogenannten linearen inversen Kodierung auf.
WO2014/072513, die beispielhaft anhand FIG. 17 kurz dargestellt wird, beschreibt Erweiterungen dieser statischen Filter für deren gezielte Anwendung auf Multikanalsignale, dies als sogenannte nichtlineare inverse Kodierung, dies auch unter Anwendung von direktem Korrelationsvergleich, der beispielsweise unter direktem Einsatz des Upmix-Systems UPM1 des britischen Unternehmens Soundfield stattfinden kann.
Die unveröffentlichte Patentanmeldung CH1696/13 beschreibt ein auf Fourier-Transformation bzw. inverser Fourier-
Transformation basierendes, hocheffizientes System für den Korrelationsvergleich von zwei oder mehreren Eingangssignalen und beschreibt die algebraisch optimale Korrektur anhand des Mittelwerts der dabei auftretenden Residuale. Allerdings ist mit diesem Dokument eine autonome Residualbestimmung nicht möglich, und eine algebraische Extraktion von zusätzlichen Signalen unter Vermeidung von sekundären Residualen unbekannt.
HAMASAKI KIMIO ET AL : . "The 22.2 Multichannel Sound System and Its Application", AES CONVENTION 118, MAY 2005, beschreibt ein kanalbasiertes Wiedergäbeformat höchster Ordnung und räumlicher Auflösung.
MPEG Surround umschreibt als Standard die Verwendung sogenannter parametrischer Verfahren zur Übertragung von Multikanalsignalen auf Basis eines Mono- oder Stereosignals.
OFFENBARUNG DER ERFINDUNG Einleitung In eigener unveröffentlichter Anmeldung CH1696/13, siehe unten, wird eine Extraktion von Multikanalsignalen anhand einer Fourier-Transformation und inversen Fourier- Transformation beschrieben, und eine Optimierung der resultierenden Signale anhand des bestimmten Mittelwerts dabei auftretender Residuale vorgeschlagen. Allerdings bedeutet dies, dass eine Residualverminderung nur möglich ist, wenn dieser Mittelwert zuvor bekannt ist, also übertragen wurde. Insbesondere gibt das Dokument gibt keine explizite technische Lösung für eine autonome Residualbestimmung im Decoder selbst an, und somit existieren keine aus dem Stand der Technik bekannte Vorrichtungen oder Verfahren dieser Art.
In CH1696/13 wird ein solcher Korrelationsvergleich zweier Signale Li' und R±' , bei welchen respektive identische Signalanteile x(t) und y(t), welche für die Kurzzeit- Kreuzkorrelation
T
den Korrelationsgrad +1 aufweisen, beschrieben, der einerseits für zeitinvariante (stationäre) Signale eine mathematisch exakte Lösung darstellt, und bei zeitvarianten (nichtstationären) Signalen ein spezifisches Residualverhalten aufweist (wobei ein Residual die Differenz zwischen dem ursprünglichen, nichtstationären Signalabschnitts und dessen Fourier-Transformation darstellt) . In CH1696/13 werden zwei Kanäle Li', R±' , 1 -S i -S n, welche gleichartige Signalanteile Ci* aufweisen, betrachtet, wobei gilt :
Li' = Li + Ci = Ii' (t) = lx (t) + Ci (t) Ri' = Ri* + Ci* = r±' (t) = r± * (t) + Ci*(t)
Für die zeitabhängigen Signale Ii' (t) und ri' (t) werden nunmehr jeweils die Fourier-Reihen bestimmt. Es gilt demnach für die Synthese, k = -1, 0, 1, ...
it' ω = xk e L
und für die Analyse
und in der Praxis für die diskrete Fourier- ransformationen (DFT) , aus der sich unmittelbar die Fast Fourier Transforms (FFT) ableiten lassen, wobei nunmehr k = 0, N - 1:
W-1
i-jy-mk
Ri' (fc) = ^ r (m)
=0
Die Realteile von Li , Ri und C± lassen sich für stationäre Signale für alle k = 0, N - 1 dann gemäss folgender Regeln wiedergewinnen :
1. Bestimme die Vorzeichen der Realteile von Li ' (k) und Ri ' (k) .
2. Sind für k die Vorzeichen identisch, bestimme
- die Beträge der Realteile von Li ' (k) und R± ' (k) ,
- die Minima bzw. Maxima dieser Beträge der Realteile von Li ' (k) und R± ' (k) .
- Wähle jeweils als Realteil für C±(k) den diesem Minimum zugrundeliegenden Realteil von Li ' (k) oder Ri ' (k) .
- Subtrahiere den Realteil von C±(k) von dem dem Maximum zugrundeliegenden Realteil von Li ' (k) oder Ri ' (k) und wähle, sofern der Realteil von Li ' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Realteil für Li(k), andernfalls, sofern der Realteil von Ri ' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Realteil für R± (k) .
- Setze den noch nicht bestimmten Realteil von Li(k) oder R±(k) gleich Null.
3. Sind die Vorzeichen der Realteile von Li' (k) und Ri' (k) nicht identisch, setze Ci(k) gleich Null und setze Li(k)= Li' (k) und Ri (k) = Ri' (k) .
Die Imaginärteile von Li, Ri und Ci lassen sich für stationäre Signale für alle k = 0, N - 1 gemäss folgender Regeln wiedergewinnen : 1. Bestimme die Vorzeichen der Imaginärteile von Li' (k) und
Ri' (k) .
Sind für k die Vorzeichen identisch, bestimme
- die Beträge der Imaginärteile von Li' (k) und
Ri' (k) ,
- die Minima bzw. Maxima dieser Beträge der Imaginärteile von Li' (k) und Ri' (k) .
- Wähle jeweils als Imaginärteil für Ci(k) den diesem Minimum zugrundeliegenden Imaginärteil von Li' (k) oder Ri' (k) .
- Subtrahiere den Imaginärteil von Ci(k) von dem dem Maximum zugrundeliegenden Imaginärteil von Li' (k) oder Ri' (k) und wähle, sofern der Imaginärteil von Li' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Imaginärteil für Li(k), andernfalls, sofern der Imaginärteil von Ri' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Imaginärteil für Ri(k) .
- Setze den noch nicht bestimmten Imaginärteil von Li(k) oder R±(k) gleich Null.
3. Sind die Vorzeichen der Imaginärteile von Li' (k) und
Ri' (k) nicht identisch, setze Ci(k) gleich Null und setze Li(k)= Li' (k) und Ri(k)= R±' (k) .
Λ Λ
11
Um abschliessend Li , Ri und C± zu gewinnen, werden für die Synthese für die zeitabhängigen Signale, k = -1, 0, 1,
(t) = ^ hk eik^
(bzw. in der Praxis für die Analyse mittels diskreten Fourier- Transformationen (DFT) , k = 0, N - 1,
.27Γ ,
Li (fc) = ^ Zf(m)
m=0
W-l
.2π ,
fc) = ^ (m) —i-r mk
Ä£ (
m=0
W-l
Q (fc) = ^ cf(m) i-jy-mk
m=Q aus der sich unmittelbar die Fast Fourier Transforms ableiten lassen) für die Synthese die Koeffizienten fk, bestimmt, k = -1, 0, 1, gemäss der Analyse
12
bzw. für die Synthese gemäss der inversen diskreten Fourier- Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transforms (IFFT) ableiten lassen, k = 0, N - 1, w-i
27Γ
TTlfe
771=0
W-1
27Γ
TTlfe
771=0
W-1
..2277?Γ ,
mk
m=0
Der schematische Ablauf eines solchen Korrelationsvergleichs ist in FIG. 1 beispielhaft dargestellt: Für je einen Kanal des zeitabhängigen Downmixsignals Li(t), Ri(t) wird zuerst eine Fast Fourier Transform (FFT) ausgeführt, und es ergeben sich somit die frequenzabhängigen komplexwertigen Signalbeschreibungen Li(k) und Ri(k) . Auf diese werden nunmehr die Regeln zur Gewinnung der Realteile und der Imaginärteile von Li , Ri und C± angewandt. Auf die resultierenden Signalbeschreibungen Li(k), R±(k) und C±(k) wird abschliessend je eine Inverse Fast Fourier Transform (IFFT) angewandt. Es ergeben sich die zeitabhängigen Signale Ci(t), Ii ( t ) und ri ( t ) .
Für nichtstationäre Signale tritt bei dieser Form des Korrelationsvergleichs ein Residual Δ auf, das generell folgendes Verhalten aufweist:
Li = Li + Δ
R± = R± + Δ
Ci = Ci* - 2Δ
Dieses Residual spielt psychoakus tisch, sofern es sich um die reine Wiedergabe von Li, Ri und Ci nach einer inversen diskreten Fourier-Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transform (IFFT) ableiten lässt, innerhalb einer normativen Abhörsituation (innerhalb des „Sweet Spot") handelt, keine Rolle, da das Residual ausgelöscht wird. Ausserhalb des „Sweet Spot", wie dies bei Abhörsituationen des täglichen Lebens und bei nicht normativen LautsprecheraufStellungen vorkommt, kann es jedoch zu deutlich hörbaren Artefakten kommen, die es zu vermeiden gilt.
Abhängig vom Anwendungsfall ist es somit wünschenswert, solche Residuale zu bestimmen, dies insbesondere in einem Decoder, um die Bandbreite des vom Encoder zum Decoder zu übertragenden Signals drastisch zu reduzieren, und insbesondere, um Verfärbungen der Klangfarbe gegenüber dem Stand der Technik drastisch zu minimieren.
Das Residual Δ selbst lässt sich etwa frequenzabhängig (die Fourier-Transformation für Li oder Ri oder Ci ist bereits bekannt, und es ist somit nur noch in derselben Weise, wie für Li oder Ri oder Ci beschrieben, die Fourier-Transformation für Li* oder Ri* oder Ci* auszuführen) für jede Frequenz k wie folgt gewinnen (bei frequenzabhängiger Berechnung ist gegebenenfalls für A(k) im Anschluss eine inverse diskrete Fourier- Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transform (IFFT) ableiten lässt, wie für Li oder Ri oder Ci beschrieben, auszuführen) :
A(k) = Li(k) - Li*(k)
oder
A(k) Ri(k) - Ri*(k)
oder
A(k) (k) - Ci(k))
Gemäss dem Stand der Technik muss zur Gewinnung eines residualfreien Signals mittels Korrelationsvergleichs aus zwei Kanälen Li' und Ri' , 1 < i < n, welche gleichartige Signalanteile Ci* aufweisen, auch das zugehörige Residual Δ bekannt sein, welches ausserhalb des Decoders bestimmt werden muss, was beispielsweise in der Audiokodierung eine grosse Einschränkung hinsichtlich optimal reduzierter Bandbreiten darstellt, da sich etwa die absolut an den Decoder zu übertragende Kanalanzahl dahingehend nicht vermindern lässt, dass jedem Korrelationsvergleich ein solches Residual explizite im Datenstrom beigefügt werden muss. Dabei muss ein solches Residual frequenzabhängig oder zeitabhängig bestimmt werden, etwa wenn das durch Korrelationsvergleich bestimmte gemeinsame Signal C±(t) oder das durch Korrelationsvergleich bestimmte erste Individualsignal Li(t) oder das durch Korrelationsvergleich bestimmte zweite Individualsignal R±(t) zeitabhängig vorliegt.
Prinzipiell lassen sich solche residualfreien Signale durch simple Substraktion bzw. Addition sowohl frequenzabhängig als auch zeitabhängig gewinnen:
Δ
Ri = Ri - Δ
Ci* = Ci + 2Δ
Allerdings lässt sich zeigen, dass beispielsweise für jeweils benachbarte Kanäle Li, Cn, Ri, Ci? und Bi mit
Li' — Li + Cii
RH' = Ri + Cii + C
i2
Bi' = Bi + Ci2 sich nicht aus einem Residual Δι, das aus dem Korrelationsvergleich zwischen Li' und RH' resultiert, in linearer Form das Residual Δ
2, das aus dem Korrelationsvergleich zwischen Ri
2' und Bi' resultiert, ableiten lässt.
Eine ideale näherungsweise Bestimmung, die zudem die drastische Verminderung der Anzahl der zu übertragenden Residuale darstellt, besteht in der folgenden Überlegung: Wurden n Residuale Δι, Δ2, Δ3, Δ4, ..., Δη bestimmt, siehe beispielsweise FIG. 2 oder 22, und gelten für die Differenzen
Δ2 - Δι = η3 - ηη
Δ3 - Δ2 = η4 - ηι
Δι - Δη = η2 - ηη_ι dann lassen sich die Beziehungen
Δι = η
2 - η
η-ι + Δ
η Δ
2 - Δι = Δ
2 - (η
2 - η
η_ι + Δ
η) = η
3 - η
η bzw.
Δ3 - Δ2 = Δ3 - (η3 - ηη + (η2 ~ ηη-ι + Δη ) ) = η4 - ηι bzw.
Δ3 = η4 - ηι + (η3 - ηη + (η2 - ηη-ι + Δη ) )
Δ4 - Δ3 = Δ4 - (η4 - ηι + (η3 - ηη + (η2 - ηη-ι + Δη ) ) ) = η5 - η2
bzw .
Δ4 = η5 - η2 + (η4 - ηι + (η3 - ηη + (η2 - ηη_! + Δη ) ) )
Δι - Δη = (η2 - ηη_ι + Δη ) - Δη = η2 - ηη_ι bzw.
Δι = (η2 - ηη-ι + Δη ) ableiten.
Somit ist beispielsweise (η2 - ηη-ι + Δη ) ein Term, der in allen Residualen enthalten ist. Gleiche Überlegung lässt sich auf jedes Δι , i = 1, n, anwenden. Da n in der Praxis klein bleibt, folgt daraus, dass mit jedem so bestimmten Term sich jedes Residual mit hoher Genauigkeiten approximieren lässt.
Setzt man nunmehr
Δ6 - Δ5 = ην - - η4 = a5
Δ8 - Δ7 = η 9 - - η ε = a7
Δ9 - Δ8 = ηιο - η? = a8
Διο - Δ9 = Άιι - η8 = a9
Δι - Δη = η2 ~ ηη-ι= a ergibt sich
bzw . η4 = ηι + a2
η7 = ηι + a2 + a5
ηιο = ηι + a2 + a5 + a8
bzw . η5 = η2 + a3
η8 = η2 + a3 + a6
ηιι = η2 + a3 + a6 + a9
Aus den Beziehungen ηη = ηη + ai + a4 + a7 + ... + an-2 bzw.
ηη-ι = ηη-ι + an + a3 + a6 + ... + an-3 bzw.
ηη-2 = ηη_2 + an-i + a2 + as + ... + an-4 lässt sich nunmehr die „Differenzregel für Residuale"
( ai + a4 + a7 + ... + an-2) + (an + a3 + a6 + ... + an-3) + ( an-i +
a2 + a5 + ... + an-4) = 0
ableiten, was bedeutet, dass ai, a2, Ά3, · · · , an psychoakustisch innerhalb einer normativen Abhörsituation (innerhalb des „Sweet Spot") ein ideales Residualverhalten aufweisen, indem sie sich gegenseitig auslöschen.
Aus obiger „Differenzregel" lässt sich unmittelbar das folgende „Additionstheorem für Residuale" ableiten, nämlich Δι + Δ2 + Δ3 + ... + Δη = n * (η2 - ηη-ι + Δη) was bedeutet, dass der Mittelwert aller Residuale zugleich in diesen enthalten ist und sich auch unschwer, beispielsweise innerhalb eines Encoder, errechnen lässt.
Das Prinzip einer Residualkorrektur beispielsweise für den Top-Layer eines NHK-22.2-Signals zeigt FIG. 19.
Wird nun die Residualkorrektur anstelle anhand der Residuale Δι, Δ2, Δ3, .. ·, Δη nunmehr anhand von deren Mittelwert vorgenommen, lassen sich zwar Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte gezielt minimieren und eine deutliche Verbreiterung des Sweetspots erzielen, allerdings ist mit diesem Verfahren eine Residualbestimmung ausserhalb des Decoders notwendig.
Gemäss CH1696/13 ist es etwa gemäss FIG. 2 möglich, deren umschriebenenes Dreieck mit seinen Ecken die Anzahl der Downmixkanäle bezeichnet und deren eingeschriebenes, strichliertes Dreieck die Anzahl der zusätzlich mittels Korrelationsvergleich extrahierten Kanäle (die von den zugehörigen Downmixkanälen anschliessend subtrahiert werden, um sämtliche ursprünglichen Kanäle des umschriebenen Dreiecks näherungsweise zu erhalten) , bei Übertragung des Mittelwerts aller Residuale, aus wenigstens drei Kanälen maximal sechs
„„
19
Kanäle zu extrahieren, die deutlich geringere Artefakte bzw. Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte aufweisen. In anderen Worten beschreiben die Eckpunkte des umschriebenen Dreiecks die drei Downmixkanäle eines Multikanalsignals mit sechs Kanälen. Ein Eckpunkt des eingeschriebenen Dreiecks beschreibt einen, den beiden benachbarten Downmixkanälen zugemischten Kanal des Multikanalsignals. Ein solcher, zwischen zwei Downmixkanälen liegender weiterer Kanal kann durch einen Korrelationsvergleich zwischen den beiden angrenzenden Downmixkanälen (den Eckpunkten des umschriebenen Dreiecks) erhalten werden, indem dieses in beiden Downmixkanälen enthaltene Signal extrahiert wird, als auch jeweils die Summe der beiden ursprünglichen, äusseren Ecksignale vor dem Downmix mit ihrem benachbarten Signal, welches in der Mitte der, dem jeweilig betrachteten Ecksignal nächstgelegenen Seite des Dreiecks liegt (wohlgemerkt nicht auf jener Seite, auf der der erste Korrelationsvergleich durchgeführt wurde!). Wird nun auch für die beiden Downmixkanäle dieser neu betrachteten Seite ein Korrelationsvergleich ausgeführt, wird wiederum das in beiden Downmixkanälen enthaltene Signal extrahiert. Dieses lässt sich von der nächstgelegenen Summe des ersten Korrelationsvergleichs subtrahieren, und ergibt dann das ursprüngliche Ecksignal. Wenn dies für alle drei benachbarten Paare von Downmixkanälen gemacht wird, erhält man wieder die sechs Kanäle des Multikanalsignals. Da neben den Downmix- Signalen, sofern nicht stationär, nun zur exakten Berechnung der sechs Multikanalsignale neben den drei Downmixkanälen auch noch drei Residuale übertragen werden müssten, wäre die Menge der zu übertragenden Daten wieder gleich der Übertragung des Multikanalsignals. Deshalb wird nun der Mittelwert aller drei Residuale übertragen und die aus dem Korrelationsvergleich erhaltenen sechs Kanäle des Multikanalsignals werden auf der Basis dieses gemittelten Residuals korrigiert.
2 Q
Die FIG. 2 hat rein kombinatorische Bedeutung und ist nicht mit konkreten Lautsprecherpositionen zu verwechseln.
FIG. 18 veranschaulicht geometrisch die kombinatorische Anwendung eines solchen Korrelationsvergleichs auf einen entsprechenden Downmix mit vier Kanälen, die durch das umschriebene Quadrat veranschaulicht wird. Für sie gelten gleich Überlegungen wie für FIG. 2.
Das beschriebene System lässt sich auf jedes beliebige n-Eck nach unendlich erweitern, wobei allerdings der errechnete Mittelwert aller Residuale aufgrund obiger Überlegungen zunehmend zu Artefakten bzw. Verfärbungen der Klangfarbe und sonstigen Demaskierungseffekten führt.
Die Downmixkanäle bzw. Residuale, die der möglichst effizienten Speicherung und Übertragung von Audiodaten, beispielsweise zwischen einem Encoder und einem Decoder, dienen sollen, lassen sich mit einem aus dem Stand der Technik bekannten entsprechenden verlustfreien oder verlustbehafteten Base Audio Codec (Beispiele eines solchen Base Audio Codecs sind Opus oder die MPEG-Standards MP3, AAC, HE-AAC, HE-AAC v2 und USAC) zusätzlich komprimieren und dekomprimieren, wobei der jeweils verwendete Base Audio Codec hinsichtlich des insgesamt zugrundeliegenden räumlichen Kodierverfahrens zusätzlich optimiert werden kann („Tuning") .
Insbesondere, da eine Reihe von Audiocodecs zur verlustfreien oder verlustbehafteten Komprimierung von Audiosignalen sich bereits die Fourier-Transformation bzw. Fast Fourier Transform (FFT) zunutze machen, können mit geringem Rechenaufwand die oben beschriebenen Regeln zur Gewinnung der Realteile bzw. Imaginärteile von Signalen direkt in diese Audiocodecs integriert werden, bzw. Signale aus derartigen Audiocodecs abgeleitet werden, die diesen Regeln zur Gewinnung der
„„
21
Realteile bzw. Imaginärteile unterworfen werden können. Der insgesamt notwendige Rechenaufwand kann so deutlich vermindert werden . Autonome Residualbestimmung durch Fourier-Transformation
Zwei Signale, die dem gleichen beschriebenen
Korrelationsvergleich unterworden wurden, sind nach diesem Korrelationsvergleich aufgrund der dabei gebildeten Residuale „pseudo-stationär" , was bedeutet, dass nach
Korrelationsvergleich ihr Verhalten für denselben Frame, wie er für die Fourier-Transformation bzw. inverse Fourier- Transformation verwendet wurde, jenem eines stationären Signals identisch ist. Grund dafür ist die vorgängige Darstellung im Frequenzbereich, die für nichtstationäre Signale in der Praxis nur eine ungenügende zeitliche Auflösung ermöglicht und zugleich zur unerwünschten Residualbildung führt. Somit kann kein zweiter oben beschriebener Korrelationsvergleich auf den Ausgangssignalen eines solchen Korrelationsvergleichs ausgeführt werden. Pseudo-stationäre Signale sind gegen einen solchen „immun" geworden.
Ebenso ist die Bestimmung des Mittelwerts aller mittels Korrelationsvergleiches gebildeter Residuale algebraisch betrachtet von der Kenntnis der ursprünglichen Signale abhängig. Insbesondere gibt es keine Methode, ohne Kenntnis der ursprünglichen Signale einen solchen Mittelwert algebraisch zu rekonstruieren. Somit ist gemäss Stand der Technik die Übertragung des Mittelwerts gemeinsam mit den Signalen notwendig.
Die Erfindung ermöglicht, dies ebenfalls mittels Fourier- Transformation, zwar nicht die absolute Bestimmung dieses Mittelwerts aller gebildeter Residuale, vermag jedoch frequenzabhängig jene Signalanteile, welche den
Korrelationsgrad +1 aufweisen, aus nicht demselbem Korrelationsvergleich zuzuordnenden Signalen zu gewinnen. Somit lässt sich frequenzabhängig der oben beschriebene Signalanteil mit Korrelationsgrad +1 zweier Residuale Δι und Δ2 für jedes Sample absolut extrahieren, und somit ist die Auflösung der rückgewonnenen Signale im Wesentlichen nur von der Auflösung der Fourier-Transformation bzw. anschliessenden inversen Fourier-Transformation abhängig. Es handelt sich um eine Analogie zum Mittelwert aller gebildeter Residuale, wobei hier allerdings der Maximalwert Amax für jedes Sample zweier verglichener Signale extrahiert wird, sozusagen das analytisches Analogon zum Mittelwert aller gebildeter Residuale - mit dem einzigen Unterschied, dass der Maximalwert Amax ohne Kenntnis der vorhergegangenen Signale bestimmt werden kann.
Somit ist ein Korrelationsvergleich auf zwei Ausgangssignale von nicht-identischen Korrelationsvergleichen i, j anzuwenden, welche einen korrelierenden Anteil Ai max in ihren beiden Residualen Δι und Aj aufweisen. In der Praxis bedeutet dies, dass für
Li = Li* + Δ± Ri = Ri* + Δ±
C± = Ci* - 2Δ± und
+ Δ,
Ri Ri + Δ,
vorzugsweise eines der folgenden Signalpaare einem weiteren Korrelationsvergleich unterzogen werden:
Li und Lj, oder
Ri und Rj, oder
Lx und Rj, oder
Rx und oder
Ci und c3, oder
-*Li und 0.5*Cj, oder
-*Ri und 0.5*Cj, oder
Li und -0.5*Cj, oder auch
Ri und -0.5*Cj . Jeder der genannten Korrelationsvergleiche liefert dasselbe Ergebnis Aijmax bzw. -Aijmax.
Beispielsweise lassen sich für einen weiteren, mit den Korrelationsvergleichen nichtidentischen Korrelationsvergleich k nunmehr die Paare
-Ri und -Lk, oder
-C± und -Ck, oder
-*Li und 0.5*Ck, oder
-*Ri und 0.5*Ck, oder
Li und -0.5*Ck, oder auch
R± und -0.5*Ck lden als auch
"Rj und oder
"Cj und oder
-*Lj und 0.5*Ck, oder
-*Rj und 0.5*Ck, oder
Lj und -0.5*Ck, oder auch
Rj und -0.5*Ck.
Es ergeben sich somit für den Korrelationsvergleich der Ausgangssignale der Korrelationsvergleiche i, k die korrelierenden Anteile
Aikmax bzw. -Aikmax und für den Korrelationsvergleich der Ausgangssignale der Korrelationsvergleiche j , k die korrelierenden Anteile bzw. -A kmax-
^
Auf Aij max und Aikmax bzw. -Aij max und -Aikmax oder auch auf Aij max und und -Aj kmax lässt sich nunmehr in gleicher Weise ein Korrelationsvergleich ausführen, womit sich der korrelierende Anteil Ai kmax ergibt, der den Signalanteil mit Korrelationsgrad +1 für die drei vorgängigen
Korrelationsvergleiche darstellt .
Dieses System lässt sich, wie die FIG. 3 und 4 zeigen, ad infinitum erweitern, und lässt im Weiteren eine Vielzahl von äquivalenten kombinatorischen Möglichkeiten hinsichtlich der hier beschriebenen Nachschaltung von Korrelationsvergleichen zu, wie FIG. 3, 4 und 7 illustrieren.
Anstelle nunmehr in der oben beschriebenen Art und Weise die mittels Korrelationsvergleichen gewonnenen Signale um den Mittelwert aller Residuale zu korrigieren, wird an seiner Stelle das Resultat der hier beschriebenen Nachschaltung von Korrelationsvergleichen, beispielsweise für den Fall der FIG. 2 Aij kmax , in die Gleichungssysteme zur Residualkorrektur, siehe oben, eingesetzt. Für den Fall der FIG. 18 wird dieser Vorgang beispielsweise durch die FIG. 19 illustriert.
Das Ergebnis liefert sehr verfärbungsarme, mittels Korrelationsvergleiches extrahierte Signale, dies insbesondere für den Sweetspot.
Bei Signalen mit sehr hochfrequenten Anteilen kann es dabei zu einer unangenehmen Verstärkung der Wellenformen kommen. Dieser lässt sich entweder durch eine erhöhte Auflösung der verwendeten diskreten Fourier-Transformation begegnen, oder auch durch deren Gegenteil, nämlich einer diskreten Fourier- Transformation, aufgrund von deren Dimension deren harmonische Frequenzen deutlich unterhalb genannter hochfrequenter Anteile liegen. Im zweiteren Fall liegt ein ähnliches Vorgehen wie beim Mittelwert aller Residuale vor. Somit lässt sich
^r
26
beispielsweise durch die Länge einer Fast Fourier Transform (FFT) präzise das Signalverhalten steuern.
Ein solches System kann mit geringstem Rechenaufwand in einen Decoder integriert werden, und eine Übertragung des Mittelwerts aller Residuale kann somit, wie bereits bemerkt, entfallen .
Während die vorliegende Methodik vor allem im Sweetspot überraschend natürliche Ergebnisse liefert, ist die Residualkorrektur um den Mittelwert aller Residuale vor allem dann eine Alternative, wenn ein möglichst grosser Hörbereich (Sweetspot) geschaffen werden soll - bei allerdings höheren Bandbreiten bei der Übertragung von Signalen vom Encoder zum Decoder .
Gewinnung von residualarmen Zusatzsignalen
Bei Multikanalsignalen können Zusatzsignale (wie beispielsweise der TpC eines NHK-22.2-Signals oder auch der TpC eines vom Institut für Rundfunktechnik (IRT) entwickelten Auro-Signals ) auftreten, die sich gemäss Stand der Technik nicht vorteilhaft durch optimiertes Residualverhalten hinsichtlich auftretender Artefakte maskieren lassen. Praktische Beispiele solcher Signals sind das TpC-Signal eines NHK-22.2-Signals oder eines gleichartigen TpC-Signals eines vom Institut für Rundfunktechnik entwickelten Auro-Formats - oder auch sogenannte LFE-Signale, die sich aufgrund der energiereichen, tiefen Frequenzen und besonderen Aufstellung nur schwer maskieren lassen.
Im ersten Fall lassen sich jedoch aufgrund eines überraschenden algebraischen Zusammenhangs anhand der Summenbildung der aus den Korrelationsvergleichen der beiden Diagonalen der FIG. 5 abgeleiteten TpC-Signale, dies mit
^ zusätzlichen optionalen Residualkorrekturen, und der abschliessenden Differenzbildung des so gebildeten TpC jeweils mit einem der resultierenden Mittensignale der Korrelationsvergleiche der vier Seiten des Vierecks, siehe FIG. 5, dies mit zusätzlichem optionaler Residualkorrektur, siehe unten, Signale gewinnen, die hinsichtlich der dabei auftretenden primären Residuale sich wechselseitig maskieren.
Grund dafür ist einerseits der Sachverhalt, dass beispielsweise vier symmetrisch um den Kopf angeordnete Ecklautsprecher TpFL, TpFR, TpBL und TpBR, welche ein TpC- Signal mit jeweils -6dB wiedergeben, zu einem Schallfeld bei Übersprechen und zu einer Lokalisierung dieses Signals im Bereich des TpC führen, und andererseits die folgende Herleitung, die auf gezielter algebraischer, maximierter Eliminierung von störenden Signalanteilen und Residualen gemäss folgendem Schema beruht (siehe zugehörige Tabelle der FIG. 6; in der Fig. 6 zeigen die Faktoren 1 oder 0.5 die Faktoren für die jeweils beim Korrelationsvergleich 1 bis 6 auftretenden Kanäle, r stellt das beim Korrelationsvergleich 1 bis 6 auftretenden Residual dar. Somit ist die Tabelle so zu lesen, dass das Ergebnis für Korrelationsvergleich 3 sich beispielsweise wie folgt liest: 0.25 * TpC - r (TpFL) - r ( TpFR) + 0.5 * TpFC - r(0.5 * TpFC) - r(0.5 * TpSiL) - r(0.5 * TpSiR) . ) :
1. Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFL' und TpBR' zur Gewinnung eines näherungsweisen TpC-Signals aus (Zeile 1 in der zugehörigen Tabelle von FIG. 6) .
2. Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFR' und TpBL' zur Gewinnung eines näherungsweisen TpC-Signals aus (Zeile 2 in der zugehörigen Tabelle von FIG. 6) .
Bestimme gegebenenfalls das autonome Residual von Schritt 1 und 2 gemäss FIG. 7. Oder alternativ: Lies den Mittelwert aller Residuale, die aus den Schritten 6 und 8 sowie 13 und 15 entstehen, d.h. bestimme das mittlere Residual aus den Korrelationsvergleichen 3 bis 6 in Fig. 5.
Führe eine Residualkorrektur auf das Resultat von Schritt 1 durch.
Führe eine Residualkorrektur auf das Resultat von Schritt 2 durch.
Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpBL' und TpFL' zur Gewinnung eines näherungsweisen (TpSiL + TpC) -Signals aus (Zeile 6 in der zugehörigen Tabelle von FIG. 6) .
Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 6 durch.
Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFR' und TpBR' zur Gewinnung eines näherungsweisen (TpSiR + TpC) -Signals aus (Zeile 4 in der zugehörigen Tabelle von FIG. 6) .
Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 8 durch.
Addiere die anhand von Schritten 1 und 2 gewonnenen Signale .
Addiere die anhand von Schritten 6 bis 9 gewonnenen Signale .
Ziehe die in Schritt 11 gewonnenen Signale von den in Schritt 10 gewonnenen Signalen ab. Es ergibt sich als Resultat das Signal mit minimierten Residualen r' :
■0.5 * TpSiL - r' (0.5 * TpSiL) - 0.5 * TpSiR - r' (0.5 * TpSiR) . Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFL' und TpFR' zur Gewinnung eines
^ näherungsweisen (TpFC + TpC) -Signals aus (Zeile 3 in der zugehörigen Tabelle von FIG. 6) .
14. Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 13 durch.
15. Führe einen Korrelationsvergleich zwischen den
Downmixsignalen TpBR' und TpBL' zur Gewinnung eines näherungsweisen (TpBC + TpC) -Signals aus (Zeile 5 in der zugehörigen Tabelle von FIG. 6) .
16. Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 15 durch.
17. Addiere die anhand von Schritten 13 bis 16 gewonnenen Signale .
18. Ziehe die in Schritt 17 gewonnenen Signale von den in Schritt 10 gewonnenen Signalen ab. Es ergibt sich als Resultat das Signal mit minimierten Residualen r' :
-0.5 * TpFC - r' (0.5 * TpFC) - 0.5 * TpBC
- r' (0.5 * TpBC) . 19. Addiere die anhand von Schritten 11 und 17 gewonnenen
Signale mit den anhand der Schritte 12 und 18 gewonnenen Signalen. Es ergibt sich mit minimierten primären Residualen das gesuchte TpC-Signal: TpC - 2 * r ' (TpFL) - 2 * r ' ( TpFR) - 2 * r ' (TpBL)
- 2 * r' (TpBR) - 2 * r' (0.5 * TpFC)
- 2 * r' (0.5 * TpSiR) - 2 * r' (0.5 * TpBC)
- 2 * r' (0.5 * TpSiL) .
20. Ziehe die Hälfte des aus Schritt 19 gewonnenen Signals jeweils von den in Schritten 6 bis 9 und 13 bis 16 gewonnenen Signalen ab.
Das insgesamte Vorgehen beschreibt vereinfachend (ohne Schritte 11, 12 und 17, 18 und 19) das Sammelschienenschema
3 Q der FIG. 16, bei dem jeder fett bezeichnete Eingangskanal und jeder resultierende Kanal gesondert abgebildet werden. In Fig. 16 zeigt das Zeichen 100 eine Subtraktion mit dem Faktor n, das Zeichen 101 eine Addition, das Zeichen 102 eine Summation des Resultats und 103 das Ergebnis eines
Korrelationsvergleichs. Für die Eingangskanäle TpFL', TpFR', TpBR' , TpBL' und den bestimmten Mittelwert der Residuale der Extraktion der Kanäle des Vierecks oder alternativ das aus dieser Extraktion resultierende autonome Residual Amax der FIG. 3 oder äquivalent 4 werden für die Extraktion des TpC demnach folgende Sammelschienen bestimmt:
Das (0.5 * TpFC' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpFL' und TpFR' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
Das (0.5 * TpSiR' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpFR' und TpBR' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
Das (0.5 * TpBC' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpBR' und TpBL' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
Das (0.5 * TpSiL' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpBL' und TpFL' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder
„„
31
alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
• Das 0.5*TpC' zuzuordnende Sammelschienensignal wird durch die Summe des Korrelationsvergleich von TpFL' und TpBR' bzw. von TpFR' und TpBL', addiert mit dem verdoppelten
Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ nach Subtrahieren des verdoppelten autonomen Residuais dieser Korrelationsvergleiche (Atop) , siehe FIG. 7 gebildet, wobei sich (mit Schritten 11, 12 und 17, 18 und 19) 0.5 * TpC - r ' (TpFL) - r ' ( TpFR) - r ' (TpBL) - r' (TpBR) - r' (0.5 * TpFC) - r' (0.5 * TpSiR) - r' (0.5 * TpBC) - r' (0.5 * TpSiL) ergibt.
Während der so gewonnene TpC als solcher beibehalten wird, kommt es nunmehr bei minimierten primären Residualen zu einem Schallfeld bei Übersprechen und zu „Phantomschallquellen" und somit zu einer „Maskierung" gemäss FIG. 8.
Hierbei erscheinen bei sphärischer Anordnung der Lautsprecher die „Phantomschallquellen" dieser minimierten primärer Residuale gemäss FIG. 9 und 10 angehoben, der Faktor lässt sich bei NHK-22.2-Signalen wie folgt errechnen: Sofern dem Top Layer die Elevation ε zugrunde liegt, derzeit zumeist 35°, errechnet sich die Pegelzunahme für die Verkürzung der Distanz für die „Phantomschallquellen" mit
1/ (sin ( π /4) * cos ε) und somit rechnerisch mit 2.4414. Aufgrund der Zunahme des Pegels mit dem Quadrat der Distanz ist dieses Ergebnis ebenfalls zu quadrieren, es ergibt sich somit 5.9604. Hinzu kommt eine psychoakustisch bedingte Anhebung der „Phantomschallquellen" um rund +3dB, also dem Faktor 1.4142. Rechnerisch ergibt sich somit ein gesamter Faktor von 8.4292 oder +18.5157 dB!
An der Tatsache, dass bereits bei Korrektur um den Mittelwert auftretender Residuale eine praktische Korrektur des TpC um +1.6dB genügt, um diesen Faktor vollwertig zu kompensieren, zeigt, wie effizient die dargestellte TpC-Extraktion ist. Diese Korrektur kann nach unten oder oben unterschritten werden, und es empfiehlt sich insgesamt für die Kalibrierung des Decoders eine zusätzliche Kontrolle dieses Parameters unter Abhörbedingungen gemäss ITU-R Recommendation BS.1116-1.
Soll obige Überlegung auf die vom Institut für Rundfunktechnik (IRT) entwickelten Auro-Formate gemäss FIG. 11 angewandt werden, ergibt sich die Tabelle der FIG. 12. Wird der TpC mit jeweils -6dB beim Downmix den Lautsprechern TpFL, TpFR, TpBR, TpBL hinzugefügt, wird dieser bei einem Korrelationsvergleich der resultierenden Kanäle TpFL' und TpFR' gemeinsam mit dem TpFC mit ebenfalls -6dB extrahiert. Somit lässt sich der TpC durch einfache Addition des Resultats eines gegebenenfalls durch autonome Residualkorrektur, siehe FIG. 7, unterstützten Korrelationsvergleichs der Downmixsignale TpFL' - TpBR' und TpFR' - TpBL' errechnen.
Wird nun das Resultat vom durch Korrelationsvergleich ermittelten TpFC sowie vom TpBL-Signal und TpBR-Signal abgezogen, ergibt sich ebenfalls ein residualarmes, maskierendes Klangbild.
Allerdings liegt auch hier eine entsprechende Verstärkung der in FIG. 13 dargestellten „Phantomschallquellen" des gebildeten Schallfeldes bei Übersprechen vor:
In Fig. 9, 10, 14 und 15 zeigt der schwarz gefüllte Kreis im Mittelpunkt des gepunkteten Kreises die Position des Hörers. So errechnet sich deren Korrekturfaktor gemäss FIG. 14 und
^
FIG. 15 mit der Elevation ε für den Top Layer von Auro 11.1 gemäss der Formel
1/ (sin (7 * n/36) * cos ε) was für ε = 7 * n/36 einen Wert von 2.1281 ergibt. Dieser Faktor ist zu quadrieren, es ergibt sich somit 4.5288; hinzu kommt eine Anhebung der „Phantomschallquellen" um +3dB, also den Faktor 1.4142. Somit liegt ein Faktor von 6.4046 vor; dies entspricht +16.1298dB.
Allerdings ist für TpFC ein gesonderter Korrekturfaktor von - 3dB vorzusehen, da dieser ein auf TpFL und TpFR wiedergegebenes Monosignal simulieren soll und trotz der Anhebung der Mittenschallquellen hinsichtlich Residualen +3dB zu laut erschiene!
BESCHREIBUNG DER ZEICHNUNGEN
Verschiedene Ausführungsformen der vorliegenden Erfindun werden im folgenden beispielhaft beschrieben, wobei auf
folgende Zeichnungen Bezug genommen wird: · FIG. 1 zeigt das Prinzip des dargestellten
Korrelationsvergleichs, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung. Vor diesem
Korrelationsvergleich wird eine Fast Fourier Transform (FFT) ausgeführt, nach diesem eine Inverse Fast Fourier
Transform (IFFT) .
• FIG. 2 veranschaulicht geometrisch die kombinatorische Anwendung eines solchen Korrelationsvergleichs auf einen entsprechenden Downmix mit drei Kanälen, die durch das
umschriebene Dreieck veranschaulicht wird. Für einen entsprechenden Downmix mit vier Kanälen, siehe FIG. 18.
• FIG. 3 veranschaulicht das Prinzip der autonomen Residualbestimmung durch Fourier-Transformation für vier Eingangssignale .
• FIG. 4 veranschaulicht das Beispiel einer alternativen, gleichwertigen Ausführungsform, welches das Prinzip der kombinatorischen Möglichkeiten gleichwertiger Ausführungsformen verdeutlicht.
• FIG. 5 veranschaulicht geometrisch die kombinatorische Anwendung von sechs Korrelationsvergleichen innerhalb des Top Layer eines NHK-22.2-Signals zur algebraischen Bestimmung eines TpC ohne sekundäre Residualbildung.
• FIG. 6 zeigt die FIG. 5 zugehörige Tabelle der resultierenden Signale bzw. Residuale.
• FIG. 7 zeigt die autonome Residualbestimmung zur Extraktion eines TpC-Kanals im Top Layer einer NHK-22.2- Anlage bzw. einer Auro-11.1-Anordnung.
• FIG. 8 zeigt die Maskierung einer algebraischen Extraktion des TpC im gebildeten Schallfeld bei Übersprechen anhand von „Phantomschallquellen" im Top Layer einer NHK-22.2-Anordnung .
FIG. 9 zeigt den Querschnitt einer NHK-22.2-Anlage, der sich der errechnete Faktor einer optimalen Maskierung gemässt FIG. 8 entnehmen lässt.
^
• FIG. 10 zeigt den Grundriss einer NHK-22.2-Anlage, der sich der errechnete Faktor einer optimalen Maskierung gemässt FIG. 8 entnehmen lässt.
• FIG. 11 veranschaulicht geometrisch die kombinatorische Anwendung von drei Korrelationsvergleichen innerhalb des Top Layer eines Auro-11.1-Signals zur algebraischen Bestimmung eines TpC ohne sekundäre Residualbildung.
• FIG. 12 zeigt die FIG. 11 zugehörige Tabelle der resultierenden Signale bzw. Residuale.
• FIG. 13 zeigt die Maskierung einer algebraischen Extraktion eines TpC im gebildeten Schallfeld bei Übersprechen anhand von „Phantomschallquellen" im Top Layer einer Auro-11.1-Anordnung.
• FIG. 14 zeigt den Querschnitt einer Auro-11.1 -Anlage, der sich die errechneten Faktoren einer optimalen Maskierung gemässt FIG. 13 entnehmen lassen.
• FIG. 15 zeigt den Grundriss einer Auro-11.1 -Anlage, der sich die errechneten Faktoren einer optimalen Maskierung gemässt FIG. 13 entnehmen lassen.
• FIG. 16 zeigt in vereinfachender Darstellung die algebraische Extraktion eines TpC-Kanals des Top Layers eines NHK-22.2-Signals, die in der Folge zu einer Maskierung der auftretenden Residuale führt.
• FIG. 17 zeigt das Beispiel einer nichtlinearen inversen Kodierung gemäss der unveröffentlichten Anmeldung CH02300/12.
^ r
36
• FIG. 18 veranschaulicht geometrisch die kombinatorische Anwendung eines Korrelationsvergleichs auf einen entsprechenden Downmix mit vier Kanälen, die durch das umschriebene Quadrat veranschaulicht wird.
FIG. 19 zeigt einen Decoder, der anhand des gesamten Downmix und des übertragenen Mittelwerts aller von den Encoderbausteinen berechneten Residuale mittels Korrelationsvergleich, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe
Einleitung zur Offenbarung der Erfindung, und mittels Summen- und Differenzbildung die ursprünglichen Eingangssignale des Encoder näherungsweise berechnet. Abschliessend werden die Inverse Fast Fourier Transforms (IFFT) bestimmt. Die Residualkorrektur um den übertragenen Mittelwert aller von den Encoderbausteinen berechneten Residuale mittels Korrelationsvergleich kann unmittelbar durch deren autonomes Residual Amax ersetzt werden. A(k) ist in diesem Falle gleich Amax(k) im Frequenzbereich zu setzen, für den Zeitbereich gilt A(t) gleich Amax(t) . Entgegen A(k) kann Amax(k) unmittelbar im Decoder bestimmt werden und muss deshalb nicht vom Encoder zum Decoder übertragen werden, was einer drastischen Bandbreitenreduzierung gleichkommt.
• FIG. 20 zeigt das Prinzip des dargestellten Korrelationsvergleichs, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung. Vor diesem Korrelationsvergleich wird eine Fast Fourier Transform
(FFT) ausgeführt, nach diesem eine Inverse Fast Fourier Transform (IFFT) .
• FIG. 21 zeigt eine NHK-22.2-Anordnung .
DETAILLIERTE BESCHREIBUNG
Anwendung der autonomen Residualbestimmung auf ein NHK-22.2- Top-Layer-Signal (siehe FIG. 5 bis 10) :
Das erste Beispiel einer Anwendung des Erfindungsgegenstands, hier gemäss FIG. 5 bis 10, auf ein NHK-22.2-Top-Layer-Signal, siehe FIG. 21, stellt für die Kanäle TpFL, TpFR, TpFC, TpC, TpBL, TpBR, TpSiL, TpSiR, TpBC die Summenbildung (der „Downmix")
TpFL' = TpFL + 0.5 * TpFC + 0.5 * TpSiL + 0.25 * TpC
TpFR' = TpFR + 0.5 * TpFC + 0.5 * TpSiR + 0.25 * TpC
TpBL' = TpBL + 0.5 * TpBC + 0.5 * TpSiL + 0.25 * TpC
TpBR' = TpBR + 0.5 * TpBC + 0.5 * TpSiR + 0.25 * TpC dar, wobei TpFL' , TpFR' , TpBL' , TpBR' den Eckpunkten des umschriebenen Quadrats der FIG. 5 entsprechen. Es lässt sich nunmehr nicht nur für jede Seite des Quadrats ein Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, ausführen, sondern auch für die beiden Diagonalen, demnach TpFL' und TpBR' bzw. TpFR' und TpBL' .
Durch Korrelationsvergleich von TpFL' und TpBR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, wird nunmehr ein Signal 0.25 * (TpC - Δ5) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) . Siehe hierzu auch FIG. 5 und 6 sowie 16 sowie nachstehenden Abschnitt zur Anwendung der
residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer-Signal .
Durch Korrelationsvergleich von TpFR' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, wird nunmehr ein Signal 0.25 * (TpC - Ae) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) . Siehe hierzu auch FIG. 5 und 6 sowie 16 sowie nachstehenden Abschnitt zur Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer-Signal .
Auf beide Ausgangssignale wird nunmehr gemäss FIG. 7 ein weiterer frequenzabhängiger Korrelationsvergleich ausgeführt, d.h. dass vorgängig keine inverse Fourier-Transformation erfolgt. Es ergibt sich -A56max- Sowohl 0.25 * (TpC - Δ5) als auch 0.25 * (TpC - Ae) werden mit 4 multipliziert und diese jeweils mit 4 * A56max addiert. Siehe auch nachstehenden Abschnitt zur Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer- Signal .
Durch Korrelationsvergleich von TpFL' und TpFR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpFC + 0.5 * TpC - Δι) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpFL + 0.5 * TpSiL + Δι) und (TpFR + 0.5 * TpSiR + Δι) . Siehe hierzu FIG. 5, 16, 18, 19 und 20.
Durch Korrelationsvergleich von TpFR' und TpBR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpSiR + 0.5 * TpC - Δ2) extrahiert (das
^ anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpFR + 0.5 * TpFC + Δ2) und (TpBR + 0.5 * TpBC + Δ2) . Siehe hierzu FIG. 5, 16, 18, 19 und 20. Durch Korrelationsvergleich von TpBR' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpBC + 0.5 * TpC - Δ3) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpBR + 0.5 * TpSiR + Δ3) und (TpBL + 0.5 * TpSiL + Δ3) . Siehe hierzu FIG. 5, 16, 18, 19 und 20.
Durch Korrelationsvergleich von TpFL' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpSiL + 0.5 * TpC - Δ4) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpFL + 0.5 * TpFC + Δ4) und (TpBL + 0.5 * TpBC + Δ4) . Siehe hierzu FIG. 5, 16, 18, 19 und 20.
Mit den so extrahierten Signalen (TpFL + 0.5 TpSiL + Δι) , (TpFR + 0.5 * TpFC + Δ2) , (TpBR + 0.5 * TpSiR + Δ3) , (TpBL + 0.5 * TpBC + Δ4) lassen sich, sofern weder die Residuale Air Δ2, Δ3, Δ4 noch deren Mittelwert bekannt sind, nunmehr eine autonome Residualbestimmung anwenden:
So wird aus den extrahierten Signalen (TpFL + 0.5 * TpSiL + Δι) und (TpFR + 0.5 * TpFC + Δ2) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ai2max extrahiert.
Λ
40
So wird aus den extrahierten Signalen (TpFR + 0.5 * TpFC + Δ2) und (TpBR + 0.5 * TpSiR + Δ3) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ä23max extrahiert.
So wird aus den extrahierten Signalen (TpBR + 0.5 * TpSiR + Δ3) und (TpBL + 0.5 * TpBC + Δ4) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ä34max extrahiert.
So wird aus den extrahierten Signalen (TpBL + 0.5 * TpBC + Δ4) und (TpFL + 0.5 * TpSiL + Δι) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal A4imax extrahiert.
Es wird nunmehr aus den extrahierten Signalen Ai2max und Ä23max noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ai23max extrahiert .
Es wird nunmehr aus den extrahierten Signalen Ai23max und Ä34max noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur
Λ
41
Offenbarung der Erfindung, nunmehr ein Signal Ai234max extrahiert .
Es wird nunmehr aus den extrahierten Signalen Ai234max und A4imax noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Amax extrahiert. Mit Amax ergeben sich folgende fett bezeichnete Residualkorrekturen :
TpFL = (TpFL + 0.5 * TpSiL + A
x) - 0.5 * (TpSiL + 0.5 * TpC - 2 * A
4) - 2 * A
max = (TpFL + 0.5 * TpFC + A
4) - 0.5 * (TpFC + 0.5 *
TpFR = (TpFR + 0.5 * TpSiR + Ax) - 0.5 * (TpSiR + 0.5 * TpC - 2 * A2) - 2 * Amax = (TpFR + 0.5 * TpFC + A2) - 0.5 * (TpFC + 0.5
* TpC - 2 * Δι) - 2 * Amax
TpBR = (TpBR + 0.5 * TpBC + A2) - 0.5 * (TpBC + 0.5 * TpC - 2 * A3) - 2 * Amax = (TpBR + 0.5 * TpSiR + A3) - 0.5 * (TpSiR + 0.5
TpC - 2 * A2) - 2 * Amax TpBL = (TpBL + 0.5 * TpBC + A4) - 0.5 * (TpBC + 0.5* TpC - 2 * A3) - 2 * Amax = (TpBL + 0.5 * TpSiL + A3) - 0.5 * (TpSiL + 0.5
* TpC - 2 * A4) - 2 * Amax
TpFC + 0.5 * TpC = (TpFC + 0.5 * TpC - 2 * Δι) + 2 * Ama TpSiR + 0.5 * TpC = (TpSiR + 0.5 * TpC - 2 * A2) + 2 * Δ,
TpBC + 0.5 * TpC = (TpBC + 0.5 * TpC - 2 * Δ3) + 2 * Amax TpSiL + 0.5 * TpC = (TpSiL + 0.5 * TpC - 2 * Δ4) + 2 * Amax Dies führt gegenüber Signalen selbst mit Korrektur um den Mittelwert der Residuale Ai r Δ2, Δ3, Δ4 zu nochmals deutlich herabgesetzten Artefakten bzw. Verfärbungen der Klangfarbe und sonstigen Demaskierungseffekten, ohne dass der Mittelwert der Residuale Ai r Δ2, Δ3, Δ4, beispielweise von einem Encoder zu einem Decoder, übertragen werden muss. Somit ergibt sich eine drastische Reduzierung der Bandbreite.
Die Einwirkung von Amax auf das Gesamtsignal lässt sich über die Länge der benutzten diskreten Fourier-Transformation bzw. inversen diskreten Fourier-Transformation präzise steuern und stellt ein präzises Werkzeug zur Kontrolle der schlussendlichen Klangfarbe dar.
Ein NHK-22.2-Top-Layer-Signal lässt sich so hinsichtlich zu speichernder oder zu übertragenden Daten, beispielsweise zwischen einem Encoder und einem Decoder, im Sinne der FIG. 19 nochmals sehr deutlich bei deutlichstem Qualitätsgewinn reduzieren . Alternative autonome Residualbestimmungen:
Die Vorrichtungen zur autonomen Residualbestimmung sind in den Fig. 3, 4 und 7 durch eine gestrichelte Box dargestellt. In diesen Beispielen wird das autonom bestimmte Residual durch kaskadierte Anwendung von Korrelationsvergleichen von Signalpaaren bestimmt. Dadurch wird der gemeinsame bzw. der korrelierte Signalanteil aller Eingangssignale der Vorrichtung zu autonomen Residualbestimmung ermittelt. Alternativ ist es aber zur Bestimmung des autonomen Residuais auch möglich,
jedes andere Verfahren zur Bestimmung des gemeinsamen bzw. korrelierten Signalanteils aller Eingangssignale der genannten Vorrichtung zu verwenden. So könnte zum Beispiel der in Fig. 1 vorgestellte Algorithmus auf drei oder mehr Signale erweitert werden. Um zum Beispiel den korrelierten Anteil in n Signalen zu bestimmen, werden die Vorzeichen der Signalanteile pro Frequenz der n Signale verglichen. Haben alle n Signalanteile dieser Frequenz das gleiche Vorzeichen, so wird der Signalanteil des Signal mit dem minimalen absoluten Signalanteil dieser Frequenz für den korrelierten Signalanteil dieser Frequenz gewählt. Andernfalls ist dieser Signalanteil gleich null. Dieses Verfahren wird vorzugsweise sowohl für den Realteil als auch für den Imaginärteil angewandt. Allerdings könnten noch viele andere Verfahren zur Bestimmung des gemeinsamen bzw. korrelierten Signalanteils verwendet werden, um das Residual der Eingangssignale autonom zu bestimmen.
Ein Ausführungsbeispiel stellt somit die kaskadierte Bestimmung des korrelierten Signals der Eingangssignale. Die kaskadierte Bestimmung weist dabei zumindest die Bestimmung eines ersten korrelierte Signals eines ersten Signalpaars der Eingangssignale und zumindest einer weiteren Bestimmung eines zweiten korrelierten Signals aus einem Signalpaar aufweisend ein auf dem erstem korrelierten Signal basierendes Signal und ein auf einem dritten Eingangssignal basierenden Signal auf.
Ein weiteres Ausführungsbeispiel betrifft alle anderen Methoden zur Bestimmung des korrelierten Signals der Eingangssignale, d.h. diejenigen Methoden, die keine kaskadierte Bestimmung des korrelierten Signals der Eingangssignale aufweisen.
Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer-Signal (siehe FIG. 5 bis 10) :
Sämtliche Operationen führen zu Signalen, welche sowohl die in der Tabelle zu FIG. 6 enthaltenen Grundsignale als auch die genannten Residuale enthalten. Diese sollen gezielt durch die oben beschriebene zusätzliche autonome Residualbestimmung in Kombination mit algebraischen Überlegungen gemäss FIG. 5 bzw. der FIG. 6 zugehörigen Tabelle eliminiert werden.
Sowohl 0.25 * (TpC - Δ5) als auch 0.25 * (TpC - Δ6) werden analog zum vorhergehenden Abschnitt mit 2 multipliziert und mit jeweils 2 * A56max addiert. Beide resultierenden Signale werden nunmehr summiert.
Von dieser Summe wird nunmehr die Summe der oben gewonnenen Signale
TpSiR + 0.5 * TpC = (TpSiR + 0.5 * TpC 2 * Δ2) + 2 * Δ ',max und
TpSiL + 0.5 * TpC = (TpSiL + 0.5 * TpC 2 * Δ4) + 2 * Δ ',max bzw. die Summe der oben gewonnenen Signale
TpFC + 0.5 * TpC = (TpFC + 0.5 * TpC 2 * Δι) + 2 * Δ ',max und
TpBC + 0.5 * TpC = (TpBC + 0.5 * TpC 2 * Δ3) + 2 * Δ ',max subtrahiert. Es ergeben sich die Signale
- TpSiL - r' (TpSiL) - TpSiR - r' (TpSiR)
bzw .
-TpFC - r' (TpFC) - TpBC - r' (TpBC) , welche, mit dem Faktor 0.5 multipliziert, nunmehr summiert werden .
Es werden nunmehr die im vorangehenden Abschnitt gebildeten Signale
TpFC + 0.5 * TpC = (TpFC + 0.5 * TpC - 2 * Δι) + 2 * Amax TpSiR + 0.5 * TpC = (TpSiR + 0.5 * TpC - 2 * Δ2) + 2 * Amax TpBC + 0.5 * TpC = (TpBC + 0.5 * TpC - 2 * Δ3) + 2 * Amax
TpSiL + 0.5 * TpC = (TpSiL + 0.5 * TpC - 2 * Δ4) + 2 * Amax mit dem Faktor 0.5 multipliziert und ebenfalls addiert.
Die Addition der beiden letztgenannten Summen ergibt das gesuchte TpC-Signal mit minimierten primären Residualen
TpC - 2 * r' (TpFl)- 2 * r'T(TpFR) - 2 * r ' (TpBL) - 2 * r' (TpBR) - 2 * r' (0.5 * TpFC) - 2 * r' (0.5 * TpSiR)
- 2 * r' (0.5 * TpBC - 2 * r' (0.5 * TpSiL), welches sich nach Multiplikation mit dem Faktor 0.5 von obigen Formeln so abziehen lässt, dass sich TpFC, TpSiR, TpBC und TpSiL nicht nur in ausgezeichneter Näherung abbilden, sondern zusätzlich gemeinsam mit dem gebildeten TpC eine ideale
Residualmaskierung gemäss dem Überlegungen der FIG. 8 bis 10, siehe oben, ergibt.
„
46
Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein Auro-11.1-Signal (siehe FIG. 11 bis 15):
Gleiche Überlegungen können auch für die sogenannten Auro- Formate des Instituts für Rundfunktechnik (IRT) gelten.
Für das Top-Layer-Signal ergibt sich dabei folgender Downmix:
TpFL' = TpFL + 0.5 * TpFC + 0.5 * TpC
TpFR' = TpFR + 0.5 * TpFC + 0.5 * TpC
TpBL' = TpBL + 0.5 * TpC TpBR' = TpBR + 0.5 * TpC
Für die Korrelationsvergleiche 1 und 2 der Fig. 11 ist eine Korrektur um deren autonomes Residual möglich. Im Decoder wird durch Korrelationsvergleich von TpFL' und TpFR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr die Summe von TpFC und TpC gemäss der FIG. 12 zugehörigen Tabelle mit -6dB extrahiert.
In der Fig. 12 zeigen die Faktoren 1 oder 0.5 die Faktoren für die jeweils beim Korrelationsvergleich 1 bis 3 auftretenden Kanäle. r stellt das beim Korrelationsvergleich 1 bis 3 auftretenden Residual dar. Somit ist die Tabelle so zu lesen, dass das Ergebnis für Korrelationsvergleich 3 sich beispielsweise wie folgt liest: 0.5 * TpC - r (TpFL) - r ( TpFR) + 0.5 * TpFC - r (0.5 * TpFC) .
Ebenso wird im Decoder durch Korrelationsvergleich von TpFL' und TpBR' gemäss der Regeln zur Gewinnung der Real- und
Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr das TpC-Signal gemäss der FIG. 12 zugehörigen Tabelle mit ebenfalls -6dB extrahiert.
Ebenso wird im Decoder durch Korrelationsvergleich von TpFR' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr das TpC-Signal gemäss der FIG. 12 zugehörigen Tabelle mit ebenfalls -6dB extrahiert.
Es wird nunmehr aus den extrahierten TpC-Signalen noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal -Amax extrahiert.
Es wird nunmehr eine Residualkorrektur vorgenommen, indem jeweils 2*Amax mit einem beiden extrahierten verdoppelten TpC- Signale addiert.
In einem weiteren Schritt wird das TpC-Signal in guter Näherung durch einfache Addition der Resultate errechnet bei anschliessender Multiplikation mit 0.5. Wird nun die Hälfte des Resultats vom durch Korrelationsvergleich ermittelten TpFC abgezogen, lässt sich eine hervorragende Residualmaskierung mit folgender Pegelkorrektur erzielen: Das TpFC-Signal wird um -3dB abgesenkt. Es ergibt sich somit eine ideale Maskierung; dies insbesondere, sofern entweder eine erhöhte Auflösung der für die Bestimmung von -Amax verwandten diskreten Fourier-Transformation gewählt wird, oder durch deren Gegenteil, nämlich eine diskreten Fourier-
„
48
Transformation, aufgrund von deren Dimension deren harmonische Frequenzen deutlich unterhalb den hochfrequenten Signalanteile liegen. Im zweiteren Fall liegt ein ähnliches Vorgehen wie beim Mittelwert aller Residuale vor. Somit lässt sich beispielsweise durch die Länge einer Fast Fourier Transform (FFT) präzise das Signalverhalten steuern.
Im Folgenden sollen verschiedene Ausführungsbeispiele zum Dekodieren und zum Kodieren des TpC Signals vorgestellt werden:
1. Verfahren zum Dekodieren eines Audiomultikanalsignals aus einem Audiodownmixsignal , wobei das Audiodownmixsignal einen vorderen rechten Kanal (TpFR) , einen vorderen linken Kanal (TpFL) , einen hinteren linken Kanal (TpBL) und einen hinteren rechten Kanal (TpBR) aufweist, wobei das Verfahren die folgenden Schritte aufweist;
Durchführen eines ersten Korrelationsvergleichs zwischen dem vorderen linken Kanal (TpFL) und dem
hinteren rechten Kanal (TpBR) ;
Durchführen eines zweiten Korrelationsvergleichs zwischen dem vorderen rechten Kanal (TpFR) und dem hinteren linken Kanal (TpBR) ;
Bestimmen eines oberen zentralen Kanals (TpC) auf der Basis des ersten Korrelationsvergleichs und des zweiten
Korrelationsvergleichs .
2. Verfahren nach Ausführungsbeispiel 1, wobei der obere
zentrale Kanal (TpC) auf der Basis der Summe der Ausgabe des ersten Korrelationsvergleichs und des zweiten
Korrelationsvergleichs bestimmt wird.
3. Verfahren nach Ausführungsbeispiel 1 oder 2, wobei der obere zentrale Kanal (TpC) auf der Basis des ersten
Korrelationsvergleichs und des zweiten
„
49
Korrelationsvergleichs und auf der Basis eines
Residualsignals des oberen zentralen Kanals bestimmt wird . 4. Verfahren nach Ausführungsbeispiel 3, wobei der obere zentrale Kanal (TpC) auf der Basis der Subtraktion des Residualsignals des oberen zentralen Kanals von der Summe der Ausgabe des ersten Korrelationsvergleichs und des zweiten Korrelationsvergleichs bestimmt wird.
5. Verfahren nach Ausführungsbeispiel 3 oder 4, wobei das Residualsignal des oberen zentralen Kanals durch
Korrelationsvergleich der Ausgabe des ersten
Korrelationsvergleichs und des zweiten
Korrelationsvergleichs bestimmt wird.
6. Verfahren nach einem der Ausführungsbeispiele 1 bis 5, wobei ein vorderer zentraler Kanal (TpFC) des
Audiomultikanalsignals durch Korrelationsvergleich des vorderen rechten Kanals (TpFR) und des vorderen linken
Kanals (TpFL) des Audiodownmixsignals bestimmt wird, wobei der bestimmte vordere zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird. 7. Verfahren nach einem der Ausführungsbeispiele 1 bis 6, wobei ein hinterer zentraler Kanal (TpBC) des
Audiomultikanalsignals durch Korrelationsvergleich des hinteren rechten Kanals (TpBR) und des hinteren linken Kanals (TpBL) des Audiodownmixsignals bestimmt wird, wobei der bestimmte hintere zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird.
Verfahren nach einem der Ausführungsbeispiele 1 bis 7, wobei
ein rechter zentraler Kanal (TpSiR) des
Audiomultikanalsignals durch Korrelationsvergleich des
^ vorderen rechten Kanals (TpFR) und des hinteren rechten Kanals (TpBR) des Audiodownmixsignals bestimmt wird, wobei der bestimmte rechte zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird, und/oder
ein linker zentraler Kanal (TpSiL) des
Audiomultikanalsignals durch Korrelationsvergleich des vorderen linken Kanals (TpFL) und des hinteren linken Kanals (TpBL) des Audiodownmixsignals bestimmt wird, wobei der seitliche linke zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird. Verfahren nach einem der Ausführungsbeispiele 6 bis 8, wobei der vordere linke Kanal des
Audiomultikanalsignals auf der Basis des vorderen linken
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird, und
wobei der vordere rechte Kanal des
Audiomultikanalsignals auf der Basis des vorderen rechten
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird
wobei der hintere linke Kanal des
Audiomultikanalsignals auf der Basis des hinteren linken
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird, und
wobei der hintere rechte Kanal des
Audiomultikanalsignals auf der Basis des hinteren rechten
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird.
„
51
Verfahren nach Ausführungsbeispiel 9, wobei der rechte zentrale Kanal (TpSiR) , der linke zentrale Kanal (TpSiL) , der vordere zentrale Kanal (TpFC) und der hintere
zentrale Kanal (TpBC) des Audiomultikanalsignals durch ein gemeinsames Residualsignal dieser Kanäle korrigiert wird .
Verfahren nach Ausführungsbeispiel 10, wobei das
gemeinsame Residualsignal durch kaskadierte paarweise Korrelationsvergleiche von nicht aus denselben
Korrelationsvergleichen abgeleiteten Kanälen des
Audiomultikanalsignals bestimmt wird.
Verfahren nach Ausführungsbeispiel 10, wobei das
gemeinsame Residualsignal mit dem Audiodownmixsignal erhalten wird.
Verfahren nach einem der Ausführungsbeispiele 6 bis 8, wobei die Korrektur durch den oberen zentralen Kanal durch Subtraktion des oberen zentralen Kanals geschieht
Verfahren nach einem der Ausführungsbeispiele 1 bis 13, wobei ein erster Korrelationsvergleich des vorderen linken Kanals (TpFL) des Audiodownmixsignals und des vorderen rechten Kanals (TpFR) des Audiodownmixsignals ausgeführt wird,
wobei ein zweiter Korrelationsvergleich des vorderen rechten Kanals (TpFR) des Audiodownmixsignals und des hinteren rechten Kanals (TpBR) des Audiodownmixsignals ausgeführt wird,
wobei ein dritter Korrelationsvergleich des hinteren rechten Kanals (TpBR) des Audiodownmixsignals und des hinteren linken Kanals (TpBL) des Audiodownmixsignals ausgeführt wird,
wobei ein vierter Korrelationsvergleich des vorderen
__ 2 linken Kanals (TpFL) des Audiodownmixsignals und des hinteren linken Kanals (TpBL) des Audiodownmixsignals ausgeführt wird,
wobei die Resultate des ersten und dritten
Korrelationsvergleichs summiert werden und die Resultate des zweiten und vierten Korrelationsvergleichs summiert werden . Verfahren nach einem der Ausführungsbeispiele 1 bis 14, wobei ein Korrelationsvergleich den korrelierten Anteil des verglichenen Signalpaars ausgibt. Verfahren nach einem der Ausführungsbeispiele 1 bis 15, wobei die mindestens drei Eingangssignale in einer
Frequenzraumdarstellung vorliegen und/oder das gemeinsame Residualsignal in einer Frequenzraumdarstellung
ausgegeben wird. Verfahren nach einem der Ausführungsbeispiele 1 bis 16, wobei ein Korrelationsvergleich den Vergleich der
Vorzeichen der Frequenzkomponenten der beiden
verglichenen Signale aufweist. Computerprogramm ausgebildet bei Ausführung auf einem Prozessor, das Verfahren nach einem der
Ausführungsbeispiele 1 bis 17 auszuführen. Dekodiervorrichtung zum Dekodieren eines
Audiomultikanalsignals aus einem Audiodownmixsignals, wobei das Audiodownmixsignal einen vorderen rechten Kanal
(TpFR) , einen vorderen linken Kanal (TpFL) , einen
hinteren linken Kanal (TpBL) und einen hinteren rechten Kanal (TpBR) aufweist, aufweisend;
eine erste Korrelationsvergleichsvorrichtung zum Durchführen eines Korrelationsvergleichs zwischen dem vorderen linken Kanal (TpFL) und dem hinteren rechten
^
Kanal (TpBR) ;
eine zweite Korrelationsvergleichsvorrichtung zum Durchführen eines Korrelationsvergleichs zwischen dem vorderen rechten Kanal (TpFR) und dem hinteren linken Kanal (TpBL) ;
Ausgabevorrichtung zum Bestimmen eines oberen zentralen Kanals (TpC) auf der Basis des ersten
Korrelationsvergleichs und des zweiten
Korrelationsvergleichs .
Im Folgenden sollen verschiedene Ausführungsbeispiele Bestimmen eines autonomen Residuais vorgestellt werden:
Verfahren zur Bestimmung eines gemeinsamen
Residualsignals aus mindestens drei Eingangssignalen:
Durchführen eines ersten Korrelationsvergleichs zwischen einem ersten Eingangssignal und einem zweiten Eingangssignal ;
Durchführen eines zweiten Korrelationsvergleichs zwischen einem auf einem aus dem ersten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf dem dritten Eingangssignal
basierenden Signal;
Bestimmen des gemeinsamen Residualsignals auf der Basis des aus dem zweiten Korrelationsvergleichs
ausgegebenen Signals.
2. Verfahren nach dem vorherigen Ausführungsbeispiel, wobei die Bestimmung des ersten und/oder des zweiten
Korrelationsvergleichs den korrelierten Anteil, den ersten individuellen Anteil oder den zweiten
individuellen Anteil des verglichenen Signalpaars ausgibt .
Verfahren nach einem der vorherigen Ausführungsbeispiele, wobei die mindestens drei Eingangssignale in einer
Frequenzraumdarstellung vorliegen und/oder das gemeinsame Residualsignal in einer Frequenzraumdarstellung
ausgegeben wird. Verfahren nach einem der vorherigen Ausführungsbeispiele, wobei die Bestimmung des ersten und/oder des zweiten Korrelationsvergleichs den Vergleich der Vorzeichen der Frequenzkomponenten der beiden verglichenen Signale aufweist .
Verfahren zum Dekodieren eines Multikanalsignals aus einem Downmixsignal :
Durchführen eines ersten Korrelationsvergleichs zwischen einem ersten Kanal und einem zweiten Kanal des Downmixsignals ;
Durchführen eines zweiten Korrelationsvergleichs zwischen einem auf einem aus dem ersten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf einem dritten Kanal des
Downmixsignals basierenden Signal;
Bestimmen eines Korrektursignals auf der Basis des aus dem zweiten Korrelationsvergleichs ausgegebenen
Signals ;
Bestimmen eines ersten Kanals, eines zweiten Kanals und eines dritten Kanals des Multikanalsignals auf der Basis des ersten Kanals, des zweiten Kanals und des dritten Kanals des Downmixsignals;
Bestimmen eines ersten zusätzlichen Kanals des
Multikanalsignals auf der Basis des ersten
Korrelationsvergleichs oder auf der Basis eines weiteren Korrelationsvergleichs zwischen einem Kanalpaar des
Downmixsignals ;
Korrigieren zumindest eines des ersten Kanals, des
zweiten Kanals, des dritten Kanals oder des weiteren Kanals des Multikanalsignals auf der Basis des
Korrektursignals . 6. Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines zweiten zusätzlichen Kanals des Multikanalsignals auf der Basis des dritten Korrelationsvergleichs;
Durchführen eines vierten Korrelationsvergleichs zwischen dem ersten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines dritten zusätzlichen Kanals des Multikanalsignals auf der Basis des vierten Korrelationsvergleichs;
Korrigieren des zweiten zusätzlichen Kanals und des dritten zusätzlichen Kanals des Multikanalsignals auf der Basis des Korrektursignals. 7. Verfahren nach Ausführungsbeispiel 5 oder 6, wobei der zweite Korrelationsvergleich zwischen dem auf einem aus dem ersten Korrelationsvergleich ausgegebenen Signals basierenden Signal und einem auf einem aus dem dritten oder vierten Korrelationsvergleich ausgegebenen Signals basierenden Signal durchgeführt wird.
8. Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines zweiten zusätzlichen
Kanals des Multikanalsignals auf der Basis des dritten Korrelationsvergleichs ;
Durchführen eines vierten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des Downmixsignals und Bestimmen eines dritten zusätzlichen
Kanals des Multikanalsignals auf der Basis des vierten
-
56
Korrelations ergleichs ;
Durchführen eines fünften Korrelationsvergleichs zwischen dem ersten Kanal und dem vierten Kanal des
Downmixsignals und Bestimmen eines vierten zusätzlichen Kanals des Multikanalsignals auf der Basis des fünften KorrelationsVergleichs ;
Durchführen eines sechsten Korrelationsvergleichs zwischen einem auf einem aus dem zweiten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf dem dritten Kanal des Downmixsignals basierenden Signals;
Durchführen eines siebten Korrelationsvergleichs zwischen einem auf einem aus dem sechsten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf dem vierten Kanal des Downmixsignals basierenden Signals;
Bestimmen eines Korrektursignals auf der Basis des aus dem siebten Korrelationsvergleich ausgegebenen
Signal ;
Korrigieren der zusätzlichen Kanäle des
Multikanalsignals auf der Basis des Korrektursignals.
Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines zweiten zusätzlichen Kanals des Multikanalsignals auf der Basis des dritten KorrelationsVergleichs ;
Durchführen eines vierten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des Downmixsignals und Bestimmen eines dritten zusätzlichen Kanals des Multikanalsignals auf der Basis des vierten KorrelationsVergleichs ;
Durchführen eines fünften Korrelationsvergleichs zwischen dem ersten Kanal und dem vierten Kanal des
^
Downmixsignals und Bestimmen eines vierten zusätzlichen Kanals des Multikanalsignals auf der Basis des fünften Korrelations ergleichs ;
Durchführen eines sechsten Korrelationsvergleichs zwischen einem auf einem aus dem vierten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und aus dem fünften Korrelationsvergleich
ausgegebenen Signal basierenden Signal;
Durchführen eines siebten Korrelationsvergleichs zwischen einem auf einem aus dem zweiten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf einem aus dem sechsten
Korrelationsvergleich ausgegebenen Signal basierenden Signal ;
Bestimmen eines Korrektursignals auf der Basis des aus dem siebten Korrelationsvergleich ausgegebenen
Signal ;
Korrigieren der zusätzlichen Kanäle des
Multikanalsignals auf der Basis des Korrektursignals. Verfahren nach Ausführungsbeispiel 5, wobei zwei Kanäle des Multikanalsignals aus dem ersten
Korrelationsvergleich bestimmt werden, das Verfahren weiter aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen zweier Kanäle des
Multikanalsignals aus dem dritten Korrelationsvergleich;
Durchführen eines vierten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des
Downmixsignals und Bestimmen zweier Kanäle des
Multikanalsignals aus dem vierten Korrelationsvergleich;
Durchführen eines fünften Korrelationsvergleichs zwischen dem ersten Kanal und dem vierten Kanal des Downmixsignals und Bestimmen zweier Kanäle des
Multikanalsignals aus dem fünften Korrelationsvergleich;
Durchführen eines sechsten, siebten, achten und neunten Korrelationsvergleichs zwischen zwei Kanälen des Multikanalsignals, die nicht aus dem gleichen
Korrelationsvergleich bestimmt wurden;
Durchführen kaskadierter Korrelationsvergleiche zwischen Signalpaaren, die auf den vier Signalen, die aus dem sechsten, siebten, achten und neunten
Korrelationsvergleich ausgegebenen wurden, basieren, und Ausgeben eines Signals aus dem kaskadierten
Korrelationsvergleichen;
Bestimmen eines Korrektursignals auf der Basis des aus dem kaskadierten Korrelationsvergleich ausgegebenen Signal ;
Korrigieren der zusätzlichen Kanäle des
Multikanalsignals auf der Basis des Korrektursignals.
11. Verfahren nach einem der Ausführungsbeispiele 5 bis 10, wobei eine Anzahl von Kanälen des Downmixsignals durch kaskadierte Korrelationsvergleiche verglichen werden, wobei das Ausgangssignal der kaskadierten
Korrelationsvergleiche zur Bestimmung des
Korrektursignals dient. 12. Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des Downmixsignals, wobei der erste zusätzliche Kanal des Multikanalsignals auf der Basis des ersten
Korrelationsvergleichs und des dritten
Korrelationsvergleichs bestimmt wird, und wobei der zweite Korrelationsvergleich zwischen einem auf einem aus dem ersten Korrelationsvergleich ausgegebenen Signal basierenden Signal und dem auf dem aus dem dritten
Korrelationsvergleich ausgegebenen Signal basierenden
^
Signal durchgeführt wird;
Korrigieren des ersten zusätzlichen Kanals des Multikanalsignals auf der Basis des Korrektursignals. 13. Verfahren nach einem der Ausführungsbeispiele 5 bis 12, wobei die ein zusätzlicher Kanal durch die zweifache Subtraktion des Korrektursignals durchgeführt wird.
14. Verfahren nach einem der Ausführungsbeispiele 5 bis 13, aufweisend Transformieren der Kanäle des Downmixsignals in den Frequenzraum vor der Durchführung der
Korrelationsvergleiche .
15. Verfahren nach Ausführungsbeispiel 14, wobei das
Dekodierverfahren ein kanalabhängig einstellbares erstes
Profil für hochfrequente Kanäle und ein zweites Profil für niedrigfrequente Kanäle aufweist, wobei mit dem ersten Profil die Samplingrate im Frequenzraum durch Zeropadding im Vergleich zu dem zweiten Profil erhöht wird oder mit dem zweiten Profil die Samplingrate für die
Transformation in den Frequenzraum niedriger als die Samplingrate des entsprechenden Kanals des Downmixsignals gewählt wird. 16. Verfahren zur Bestimmung eines gemeinsamen
Residualsignals mindestens dreier Eingangssignale, gekennzeichnet durch die Bestimmung des gemeinsamen
Residualsignals durch die Bestimmung der gemeinsamen Signalanteile der mindestens drei Eingangssignale.
17. Verfahren nach Ausführungsbeispiel 16, wobei die
Bestimmung des ersten und/oder des zweiten
Korrelationsvergleichs den Vergleich der Vorzeichen der Frequenzkomponenten der beiden verglichenen Signale aufweist.
r n
60
18. Verfahren nach Ausführungsbeispiel 16 oder 17, wobei die gemeinsamen Signalanteile der mindestens drei
Eingangssignale den Vergleich der Vorzeichen der
Frequenzkomponenten der Eingangssignale aufweist.
19. Verfahren nach einem der Ausführungsbeispiele 16 bis 18, wobei ein Realteil und/oder ein Imaginärteil einer
Frequenzkomponente des Signals der gemeinsamen
Signalanteile der mindestens drei Eingangssignale als der Realteil und/oder der Imaginärteil der entsprechenden
Frequenzkomponente eines der mindestens drei
Eingangssignale bestimmt wird, welches den minimalen Absolutwert des Realteils und/oder des Imaginärteils beträgt, wenn alle Vorzeichen der Realteile und/oder der Imaginärteile der entsprechenden Frequenzkomponente der der mindestens drei Eingangssignale gleich sind.
20. Verfahren nach einem der vorherigen Anspruch, wobei
zumindest eines der Eingangssignale oder ein daraus gebildetes Signal durch das gemeinsame Residual
korrigiert wird.
21. Computerprogram ausgebildet bei Ausführung auf einem
Prozessor das Verfahren nach Ausführungsbeispielen 1 bis 15 auszuführen.
Schlussbemerkungen
Insgesamt dargestellte Prinzipien sind algorithmisch beliebig erweiterbar und sind nicht auf die effiziente Komprimierung von Multisignalen beliebiger, ja selbst höchster, Ordnung, dies zum Zwecke der effizienten Speicherung oder Übertragung, beispielsweise zwischen einem Encoder und einem Decoder, beschränkt .
„„
61
Vorliegende Systeme zur Bestimmung zumindest eines gemeinsamen Signals und/oder eines ersten Individualsignals und/oder eines zweiten Individualsignals aus zwei Eingangssignalen als auch im Besonderen die autonome Residualbestimmung können grundsätzlich in Zusammenhang mit Anwendungen beliebiger Natur mit Fourier-Transformationen oder inversen Fourier- Transformationen angewandt werden. Diese Anwendungen verstehen sich grundsätzlich als in der vorliegenden Erfindung mit eingeschlossen .
Alternativ könnte jedes andere Verfahren zur Bestimmung eines gemeinsamen Signals, eines ersten Individualsignals und eines zweiten Individualsignals aus zwei Eingangssignalen verwendet werden .
Des Weiteren soll hier auch die Speicherung und/oder Übertragung von Daten (z.B. eine Datei oder andere Speichermittel oder Übertragungsmittel) mit einem
Downmixsignal/Summensignal und/oder mit einem gemittelten oder autonom bestimmten Residual oder mit einem aus mehreren Residualen gemittelten Residual offenbart sein.
Ein Multikanalsignal mit n Kanälen kann wiederum ein weiteres Multikanalsignal mit n-l>2 Kanälen, ein weiteres Multikanalsignal mit n-2>2 Kanälen etc. enthalten.
Umgekehrt kann aus einem Multikanalsignal mit n>2 oder n-l>2 oder n-2>2 etc. Kanälen wiederum ein weiteres Multikanalsignal höherer Ordnung abgeleitet werden.
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der unveröffentlichten CH00743/14 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in CH00743/14 offenbarten Ausführungsbeispiele, die unter den Schutzbereich der
r„
62
Ansprüche fallen, sowohl positiv als Ausführungsbeispiel der Erfindung als auch negativ als Disclaimer der Erfindung offenbart sind. Das heisst, der durch die Patentansprüche abgedeckte Schutzbereich kann aufgeteilt werden in die/den in CH00743/14 offenbarte Ausführungsbeispiele und die durch den gewährten Schutzbereich abzüglich der in CH00743/14 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) verbleibenden
Ausführungsbeispiele/verbleibenden Schutzbereich .
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der unveröffentlichten CH0369/14 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in CH0369/14 offenbarten Ausführungsbeispiele, die unter den Schutzbereich der Ansprüche fallen, sowohl positiv als Ausführungsbeispiel der Erfindung als auch negativ als Disclaimer der Erfindung offenbart sind. Das heisst, der durch die Patentansprüche abgedeckte Schutzbereich kann aufgeteilt werden in die in CH0369/14 offenbarte Ausführungsbeispiele und die/den durch den gewährten Schutzbereich abzüglich der in CH0369/14 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) verbleibenden
Ausführungsbeispiele/verbleibenden Schutzbereich .