Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
Beschreibung
Die vorliegende Erfindung bezieht sich auf Zeit-Frequenz- Umsetzungsalgorithmen und insbesondere auf solche Algorithmen in Verbindung mit Audiokompressionskonzepten.
Für einige Anwendungen bei der Codierung zu Zwecken der Datenkompression und insbesondere bei der Audiocodierung ist eine Darstellung reellwertiger zeitdiskreter Signale in Form von komplexwertigen Spektralkomponenten notwendig. Ein komplexer Spezialkoeffizient kann durch einen ersten und einen zweiten Teilspektralkoeffizient dargestellt werden, wobei je nach Wunsch der erste Teilspektralkoeffizient der Realteil und zweite Teilspektralkoeffizient der Imaginärteil sind. Alternativ kann der komplexe Spektralkoeffizient auch durch den Betrag als ersten Teilspektralkoeffizient und die Phase als zweiten Teilspektralkoeffizient dargestellt werden.
Insbesondere bei der Audiocodierung werden oft reellwertige Transformationsverfahren eingesetzt, wie z. B. die bekannte MDCT, die in „Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation", J. Princen, A. Brad- ley, IEEE Trans. Acoust., Speech, and Signal Processing 34, S. 1153 - 1161, 1986, beschrieben ist. Es besteht z. B. in- nerhalb des psychoakustischen Modells der Bedarf nach einem komplexen Spektrum. Hierzu wird auf das psychoakustische Modell in Annex D.2.4 des Standards ISO/IEC 11172-3 verwiesen, der auch als MPEGl-Standard bezeichnet wird. Bei bestimmten Anwendungen läuft parallel zur eigentlichen MDCT- Transformation (MDCT = modifizierte diskrete Cosinustransformation) eine komplexe diskrete Fourier-Transformation mit, um psychoakustische Parameter zu berechnen, wie z. B. die psychoakustische Maskierungsschwelle.
Bei dieser diskreten Fourier-Transformation (DFT) wird das Eingangssignal zunächst mittels Multiplikation mit zeitlich gegeneinander versetzten Fensterfunktionen in Blöcke einer vorgegebenen Länge unterteilt. Jeder dieser Blöcke wird anschließend durch Anwendung der DFT in eine Spektraldarstellung überführt. Beinhalten die verwendeten Blöcke jeweils L Abtastwerte, d. h. beträgt die Fensterlänge L, so läßt sich der Ausgang der DFT wiederum in Form von insgesamt L Werten (Real- und die Imaginärteile oder Betrags- und Phasenwerte) vollständig beschreiben. Wenn beispielsweise das Eingangssignal reell ist, ergeben sich L/2 komplexe Werte. Bei der Verwendung geeigneter Fensterfunktionen kann aus dieser Darstellung mit Hilfe einer inversen DFT das Eingangssignal wieder rekonstruiert werden.
Dieser Ansatz unterliegt jedoch einigen Einschränkungen. So ist beispielsweise eine kritische Abtastung nur möglich, wenn sich aufeinanderfolgende1 Fenster nicht überlappen. An- dernfalls wären nämlich bei einem zeitlichen Versatz von N < L Werten für jeweils N neue Eingangswerte der DFT L Werte in der Spektraldarstellung zu übertragen, was insbesondere bei Datenkompressionsverfahren unerwünscht ist.
Die Verwendung nicht-überlappender Fensterfunktionen bedeutet jedoch eine starke Einschränkung der erzielbaren Güte der Spektralzerlegung, wobei insbesondere die Trennung unterschiedlicher Frequenzbänder zu nennen ist.
Eine bessere Bandtrennung läßt sich dagegen mit reellwerti- gen Transformationen mit überlappenden Fensterfunktionen erzielen. Eine besondere Klasse dieser Transformationen stellen die sogenannten modulierten Filterbänke dar, die sich durch die Möglichkeit einer effizienten Implementie- rung auszeichnen. Unter diesen modulierten Filterbänken hat sich als Sonderform die modifizierte diskrete Cosinustransformation (MDCT) durchgesetzt, bei der die Fensterlänge L
_ "5 _
aufgrund unterschiedlicher Überlappungsgrade Werte zwischen N und 2N - 1 annehmen kann.
Fig. 6 zeigt die Zerlegung eines zeitdiskreten Eingangssig- nals x(n) in die Spektralkomponenten Uk,m, wobei m den zeitlichen Blockindex darstellt, also den Zeitindex nach der Abtastratenreduktion, während k der Frequenz index oder Teilband-Index ist. Die Abtastfrequenzen sind in allen Teilbändern gleich, d. h. die Original-Abtastfxequenz ist um den Faktor N reduziert. Die in Fig. 6 dargestellte Filterbank mit Filtern 60 und nachgeschalteten Downsampling- Elementen 62 liefert eine gleichförmige Bandauf eilung.
Bei einer modulierten Filterbank entstehen die einzelnen Teilbandfilter durch Multiplikation einer Prototyp- Impulsantwort hp(n) mit einer teilbandspezifischen Modulationsfunktion, wobei für die MDCT und ähnliche Transformationen folgende Vorschrift verwendet wird:
Die obige Transformationsvorschrift kann auch von der obigen Gleichung abweichen, z. B. wenn die Sinusfunktion an- statt der Cosinusfunktion verwendet wird, oder wenn anstelle von „-N/2" „+N/2" verwendet wird. Auch der Einsatz mit der später erwähnten abwechselnden MDCT/MDST (bei Verwendung von k anstelle von k+1/2) ist denkbar.
In der oben stehenden Gleichung stellt hP(n) die Prototyp- Impulsantwort dar. hk(n) ist die Filter-Impulsantwort für das Filter, das dem Teilband k zugeordnet ist. n ist der Zählindex des zeitdiskreten Eingangssignals x(n) , während N die Anzahl der Spektralkoeffizienten angibt.
Die Ausgangswerte einer reell ertigen Transformation, wie z. B. der MDCT, die bekanntlich nicht energieerhaltend ist, sind jedoch nur bedingt für Anwendungen einsetzbar, die komplexwertige Spektra.lkomponenten erfordern. Verwendet man beispielsweise die Beträge der reellen Ausgangswerte als Näherung für die Beträge komplexwertiger Spektralkomponenten in den entsprechenden Frequenzbereichen, so ergeben sich selbst bei sinusförmigen Eingangssignalen konstanter Amplitude starke Schwankungen. Eine derartige Vorgehenswei- se liefert demnach nur schlechte Näherungen für Kurzzeit- Betragsspektren des Eingangssignals .
In der Fachveröffentl chung „A Scalable and Progressive Audio Codec", Vinton und Atlas, IEEE ICASSP 2001, 7.-11. Mai 2001, Salt Lake City, ist ein Audiocodierer mit einem Transformationsalgorithmus dargestellt, der aus einer Basistransformation und einer zweiten Transformation besteht. Das Eingangssignal wird durch eine Kaiser-Bessel- Fensterfunktion gefenstert, um zeitlich aufeinanderfolgende Blöcke von Abtastwerten zu erzeugen. Die Blöcke von Eingangswerten werden dann entweder mittels einer modifizierten diskreten Cosinustransformation (MDCT) oder mittels einer modifizierten diskreten Sinustransformation (MDST) abhängig von einem Verschiebungsindex transformiert. Dieser Basistransformationsprozeß entspricht im wesentlichen der TDAC-Filterbank, die in der zitierten Fachveröffentlichung von Princen und Bradley beschrieben ist. Hierauf werden zwei zeitlich benachbarte Blöcke von Spektralkoeffizienten in eine einzige komplexe Transformation kombiniert, derart, daß der MDCT-Block die Realteile von komplexen Spektralkoeffizienten darstellt r während der zeitlich aufeinanderfolgende MDST-Block die zugehörigen Imaginärteile der komplexen Spektralkoeffizienten darstellt. Hieraus wird eine Zeit-Frequenz-Verteiliαng des Betrags des komplexen Spekt- rums erzeugt, wobei eine zweidimensionale Betragsverteilung über der Zeit in jedem Frequenzband gefenstert wird, und zwar wieder mit 50% überlappenden Fensterfunktionen. Hierauf wird mittels der zweiten Transformation eine Betrags-
matrix berechnet. Die Phaseninformationen werden der zweiten Transformation nicht unterzogen.
Die abwechselnde Verwendung der Ausgangswerte einer MDCT als Real- und Imaginärteil wird auch in der Fachveröffent- lichunc „MDCT Filter Banks with Perfect Reconstruction", Karp und Fliege, Proc. IEEE ISCAS 1995, Seattle, WA, als "MDFT" eingeführt.
Es wurde herausgefunden, daß auch diese Approximation eines komplexen Spektrums aus einer reellwertigen Spektraldarstellung des zeitdiskreten Eingangssignals dahingehend problematisch ist, daß für Töne bestimmter Frequenzen keine angemessene Betragsdarstellung gewonnen werden kann. Somit ist auch bei dieser Transformation die Bestimmung von Kurzzeit-Betragsspektren nur bedingt möglich.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Erzeugen einer komplexen Spektral- darstellung eines zeitdiskreten Signals zu schaffen.
Diese Aufgabe wird durch eine Vorrichtung zum Erzeugen einer komplexen Spektraldarstellung nach Patentanspruch 1, ein Verfahren zum Erzeugen einer komplexen Spektraldarstel- lung nach Patentanspruch 18, eine Vorrichtung zum Codieren eines zeitdiskreten Signals nach Patentanspruch 19, ein Verfahren zum Codieren eines zeitdiskreten Signals nach Patentanspruch 20, eine Vorrichtung zum Erzeugen einer reellen Spektraldarstellung nach Patentanspruch 21, ein Verfah- ren zum Erzeugen einer reellen Spektraldarstellung nach Patentanspruch 22 oder durch ein Computer-Programm nach Patentanspruch 23 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine gute Approximation für eine Spektraldarstellung eines zeitdiskreten Signals aus einer blockweisen reellwertigen Spektraldarstellung des zeitdiskreten Signals ermittelt werden kann, indem ein erster Teilspektralkoeffizient
- D -
und/oder ein zweiter Teilspektralkoeffizient dadurch berechnet wird, daß zumindest zwei reelle Spektralkoeffizienten kombiniert werden. Damit wird z. B. der Realteil/oder der Imaginärteil eines approximierten komplexen Spektralko- effizienten für einen bestimmten Frequenzindex durch Kombination von zwei oder mehr reellen Spektralkoeffizienten vorzugsweise in zeitlicher und/oder frequenzmäßiger Nähe zu dem zu berechnenden komplexen Spektralkoeffizienten erhalten. Vorzugsweise ist die Kombination eine Linearkombinati- on, wobei ferner die zu kombinierenden reellen Spektralkoeffizienten vor der Linearkombination, d. h. einer Addition oder Subtraktion, mit konstanten Gewichtungsfaktoren ge- wichtet werden können.
An dieser Stelle sei darauf hingewiesen, daß eine Linearkombination eine Addition oder Subtraktion verschiedener Linearkombinationspartner ist, die mit Gewichtungsfaktoren vor der Linearkombination gewichtet sein können oder nicht . die Gewichtungsfaktoren können positive oder negative reel- le Zahlen einschließlich Null sein.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung sind die zwei oder mehr reellen Spektralkoeffizienten, die kombiniert werden, um einen komplexen Teil- spektralkoeffizienten für einen Frequenzindex und einen (zeitlichen) Blockindex zu erhalten, in frequenzmäßiger und/oder zeitlicher Nähe angeordnet. In frequenzmäßiger Nähe befinden sich die reellen Spektralkoeffizienten mit einem um 1 höheren oder um 1 niedrigeren Frequenzindex aus dem aktuellen (zeitlichen) Block. Darüber hinaus befinden sich in zeitlicher Nähe die entsprechenden reellen Spektralkoeffizienten aus dem unmittelbar vorausgehenden zeitlichen Block oder dem unmittelbar nachfolgenden zeitlichen Block mit demselben Frequenzindex. In zeitlicher und fre- quenzmäßiger Nähe befinden sich ferner die reellen Spektralkoeffizienten des unmittelbar vorausgehenden oder unmittelbar folgenden zeitlichen Blocks mit einem Frequenzindex, der um einen Frequenzindex höher oder niedriger ist als der
Frequenzindex des gerade berechneten Teilspektral koeffizienten .
Vorzugsweise variiert die Kombinationsvorschrift zum Be— rechnen eines Teilspektralkoeffizienten abhängig davon, ob der Frequenzindex gerade oder ungerade ist .
Erfindungsgemäß wurde herausgefunden, daß eine Kombination von reellen Spektralkoeffizienten in zeitlicher und/oder frequenzmäßiger Nähe zu dem komplexen Spektralkoeffizienten, der bestimmt werden soll , eine gute Annäherung an einen erwünschten Frequenzgang der gesamten Anordnung aus der Einrichtung zum Erzeugen einer blockweisen reellwertigen Spektraldarstellung und der Einrichtung zum Nachverarbeiten der blockweisen reellwertigen Spektraldarstellung liefert , wobei der Frequenzgang - der üblicherweise einen Bandpass— Charakter aufweist - für positive Frequenzen einen erwünschten Verlauf haben soll , und für negative Frequenzen möglichst klein bzw . gleich 0 sein soll . Ein solcher Fre- <quenzgang ergibt sich durch das erfindungsgemäße Konzept und wird für viele Anwendungen als vorteilhaft angesehen .
Die Eigenschaften dieses Frequenzgangs können bei bevorzugten Ausführungsbeispielen z . B . durch geeignete Einstellung der Gewichtungsfaktoren oder aber durch entsprechende Modifikation der Fensterfunktionen der ersten Transformation zum Erzeugen der reellwertigen Spektralkoeffizienten manipuliert werden . Das System liefert somit viele Freiheitsgrade zur Anpassung an bestimmte Bedürfnisse , wobei insbe- sondere auch die Möglichkeit zu nennen ist , nicht nur zwei reelle Spektralkoeffizienten zu kombinieren, sondern auch mehr als zwei reelle Spektralkoeffizienten zu kombinieren , um eine noch bessere Approximation an einen gewünschten Frequenzgang der Gesamtanordnung zu erreichen .
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert . Es zeigen :
Fig. 1 ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Erzeugen einer komplexen Spektraldarstellung;
Fig. 2a bis 2c eine Darstellung der einer Teilspektralkomponente für einen komplexen Spektralkoeffizient mit Frequenzindex k und Blockindex m benachbarten reellen Spektralkoeffizienten;
Fig. 3 eine schematische Darstellung zur Berechnung komplexer Teilbandsignale mit einer reellwertigen Transformation i und einer Nachverarbeitungstransformation T2;
Fig. 4 ein Blockschaltbild der erfindungsgemäßen Vorrichtung gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung mit kritischer Abtastung;
Fig. 5 ein Blockschaltbild der erfindungsgemäßen Vorrichtung gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung ohne kritische Abtastung; und
Fig. 6 eine bekannte reellwertige Filterbank mit gleichförmiger Bandaufteilung.
Fig. 1 zeigt eine Vorrichtung zum Erzeugen einer komplexen Sp ktraldarstellung eines zeitdiskreten Signals x(n). Das zeitdiskrete Signal x(n) wird in eine Einrichtung 10 zum Erzeugen einer blockweisen reellwertigen Spektraldarstellung des zeitdiskreten Signals eingespeist, wobei die Spektraldarstellung zeitlich aufeinanderfolgende Blöcke aufweist, wobei jeder Block einen Satz von Spektralkoeffizienten aufweist, wie es anhand der Fig. 2a bis 2b detaillierter erläutert wird. Am Ausgang der Einrichtung 10 liegt somit eine Folge von zeitlich aufeinanderfolgenden Blöcken
von Spektralkoeffizienten vor, die aufgrund der Eigenschaft der Einrichtung 10 reellwert ige Spektralkoeffizienten sind . Diese Folge von zeitlich aufeinanderfolgenden Blöcken von Spektralkoeffizienten wird in eine Einrichtung 12 zum Nach- verarbeiten eingespeist , um eine blockweise komplexe approximierte Spektraldarstellung zu erhalten, die aufeinanderfolgende Blöcke aufweist, wobei j eder Block einen Satz von komplexen approximierten Spektralkoeffizienten aufweist , wobei ein komplexer approximierter Spektralkoeffizient durch einen ersten Teilspektralkoeffizient und einen zweiten Spektralkoeffizient darstellbar ist , wobei zumindest der erste oder der zweite Spektralkoeffizient durch eine Kombination von zumindest zwei reellen Spektralkoeffizienten ermittelt wird.
Die Fig. 2a bis 2c zeigen zusammen eine Folge von Blöcken von Beträgen von reellwertigen Spektralkoeffizienten, wie sie durch die Einrichtung 10 von Fig. 1 erzeugt werden, m stellt einen Blockindex dar, während k einen Frequenzindex darstellt. Fig. 2 zeigt einen entlang der Frequenzachse aufgetragenen Block von reellwertigen Spektralkoeffizienten zum Zeitpunkt bzw. Blockindex (m-1) . Der Block von Spektralkoeffizienten umfaßt Spektralkoeffizienten Ui,m-ι, wobei i ein Laufindex ist, während m-1 für den Blockindex steht. Insbesondere ist in Fig. 2a eine Spektrallinie mit dem Frequenzindex i = k sowie eine Spektralkomponente mit dem Frequenzindex i = (k-1) und i = (k+1) gezeigt.
Fig. 2b zeigt dieselbe Situation, nun jedoch für den zeit- lieh nachfolgenden Block m. Schließlich zeigt Fig. 2c wieder dieselbe Situation, nun jedoch für den Blockindex (m+1) . Damit ergibt sich in der Folge der Fig. 2a, 2b, 2c ein zeitlicher Verlauf, der durch einen Pfeil 20 in den Fig. 2a bis 2c symbolisiert ist.
Fig. 3 zeigt eine alternative Darstellung der Vorrichtung zum Erzeugen einer komplexen Spektraldarstellung, wobei das zeitdiskrete Eingangssignal x(n) in der Einrichtung 10 zum
Erzeugen einer blockweisen reellen Spektraldarstellung eingespeist wird, die in Fig. 3 mit Ti bezeichnet ist. Es sei darauf hingewiesen, daß es sich hier um eine erste Umsetzung des Zeitsignals, das gefenstert worden ist, um block- weise vorzuliegen, in eine spektrale Darstellung am Ausgang der Einrichtung 10 handelt. Fig. 3 zeigt eine Momentaufnahme zum Zeitpunkt bzw. Blockindex m, bezieht sich also auf Fig. 2b, die vorstehend beschrieben worden ist. Die Ausgangswerte der Einrichtung 10, also die reellwertigen Spektralkoeffizienten, die beispielsweise MDCT- Koeffizienten sein können, werden in die Einrichtung 12 zum Nachverarbeiten eingespeist, um ausgangsseitig ein komplexes Spektrum zu erhalten, das für jeden Frequenzindex k einen ersten Teilspektralkoeffizienten pk,m und einen zweiten Teilspektralkoeffizienten qk,m umfaßt, wobei pk,m der Realteil und qk,m der Imaginärteil des komplexen Spektralkoeffizienten für den Frequenzindex k sind, wobei m den Blockindex bezeichnet.
Erfindungsgemäß werden somit zur Erzeugung komplexwertiger Spektralkomponenten reellwertige Transformationen in Form von modulierten Filterbänken für die eigentliche Spektralzerlegung eingesetzt. Es werden nunmehr reelle Spektralkoeffizienten aus zeitlich aufeinanderfolgenden und/oder spektral benachbarten Ausgangswerten der reellwertigen Transformation verwendet, die in Fig. 3 mit Ti bzw. 10 bezeichnet ist. Aus diesen wird beispielhaft ein Real- und ein Imaginärteil p, q für einen bestimmten Frequenzindex und für einen bestimmten (zeitlichen) Blockindex gebildet. Alternativ könnten selbstverständlich auch Betrag und Phase erzeugt werden. Hierbei können besondere Phasenbeziehungen der Modulationsfunktionen ausgenutzt werden, die einer modulierten Filterbank zugrunde liegen.
Bei einem bevorzugten Ausführungsbeispiel ist die Operation T2 bzw. 12, die der ersten Transformation nachgeschaltet ist, wiederum eine invertierbare, kritisch abgetastete Transformation. Damit ergibt sich ein Gesamtsystem, welches
ebenfalls die Eigenschaft der kritischen Abtastung aufweist und gleichzeitig eine Rekonstruktion aus den gewonnenen Spektralkomponenten ermöglicht .
T2 ist nun eine zweidimensionale Transformation, da bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung sowohl zeitlich benachbarte als auch frequenzmäßig benachbarte reellwertige Spektralkoeffizienten kombiniert werden, d . h . da si ch ihre Eingangswerte entlang der Zeit- und der Frequenzachse erstrecken, wie es anhand der Fig . 2a bis 2c dargestellt worden ist . Da aus j eder Transformations- Operation unter Verwendung der Einrichtung 12 j eweils ein Real- und ein Imaginärteil entsteht, ist für eine kritische Abtastung nur für j ede zweite Abtastposition der Zeit /Frequenz-Ebene ein Wertepaar zu berechnen . Dies wird bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung durch Abtastratenreduktion entlang der Zeitachse, d. h . Berechnung nur für j eden zweiten Block der ersten Transforma ion Ti erreicht . Alternativ wird dies durch Ab- tastratenreduktion entlang der Frequenzachse, d . h . Berechnung nur für j edes zweite Teilband i der ersten Transformation, erreicht . Wieder alternativ wird dies versetzt , d . h . in Form eines Schachbrett-Musters , bei dem abwechselnd jeder zweite Block und j edes zweite Band verwendet werden, erreicht .
Die Transformationskoeffizienten der zweiten Transformation, mit denen die Ausgangswerte von Ti vor ihrer Summation j eweils gewichtet werden, also die Gewichtungsfaktoren, er- füllen vorzugsweise die Bedingungen für die exakte Rekonstruktion gemäß dem j eweiligen Abtastschema . Das erfindungsgemäße System enthält eine Anzahl von Freiheitsgraden, die für eine Optimierung der Eigenschaften des Gesamtsystems , d. h . für die Optimierung des Frequenzgangs des Ge- samtsystems als komplexe Filterbank, genutzt werden können .
Es sei ferner darauf hingewiesen, daß für manche Anwendungen die kritische Abtastung nicht zwingend erforderlich
ist . Dies kann z . B . der Fall sein bei einer Nachverarbeitung der decodierten aber noch nicht in den Zeitbereich zurücktransformierten Signale in einem Audiodecodierer. In diesem Fall hat man einen höheren Freiheitsgrad bei der Wahl der Transformationskoeffizienten in T2. Dieser höhere Freiheitsgrad wi rd bevorzugt für eine bessere Optimierung des Gesamtverhaltens eingesetzt .
Nachfolgend wird anhand von Fig . 4 ein erstes Ausführungs- beispiel der vorliegenden Erfindung für die detaillierte Vorschrift der Einrichtung 12 zum Nachverarbeiten dargestellt . Es wird bevorzugt , zwischen einem geraden Frequenzindex k und einem ungeraden Frequenzindex k+1 zu unterscheiden . Im Falle eines geraden Frequenzindex, also wenn Pk,m und qk,m zu berechnen sind (m ist der Blockindex und k ist der Frequenz index) , wird gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung der Realteil pk,m durch Summation von zwei zeitlich aufeinanderfolgenden reellwertigen Spektralkoeffizienten ermittelt . pk,m ergibt sich so- mit entweder aus der Summation des Spektralkoeffizienten mit dem Index k aus den Fig. 2b und 2a oder aus den Fig . 2c und 2b .
Der zugehörige Imaginärteil qk,m wird erfindungsgemäß durch Summation zweier aufeinanderfolgender Werte mit dem Frequenzindex k-1 entweder wieder der Fig . 2a, 2b (Block m-1 und Block m) oder der Fig . 2b und 2c (Block m und Block m+1) erhalten.
Für einen ungeraden Frequenzindex k+1 wird der Realteil Pk+ι,m als Differenz zweier aufeinanderfolgender Werte berechnet , also als Differenz zwischen den Spektralkoeffizienten k+1 der Fig . 2a, 2b oder 2b, 2c . Der zugehörige I- maginärteil qk+ι, m ergibt sich als Differenz zweier aufein- anderfolgender Werte mit dem Frequenzindex k, also als Differenz aus den reellwertigen Spektralkoeffizienten mit dem Index k der Fig . 2a, 2b oder 2b, 2c .
Damit ergibt sich die in Fig. 4 dargestellte Transformationsfunktion, die insgesamt mit dem Bezugszeichen 12a bezeichnet ist, wobei die Transformationsfunktion zwei Trans- formations-Untervorschriften hL(m) und hH (m) aufweist, die, wie es in Fig. 4 gezeigt ist, paarweise alternierend auf die Ausgangswerte der Einrichtung 10 angewendet werden. Insbesondere hat die erste Unterfunktion hL(m) die Form {1, 1}, während die zweite Unterfunktion die Form {1, -1} umfaßt. Die Notation der Unterfunktionen hL(m) und hH (m) soll bedeuten, daß eine Summe bzw. Differenz der entsprechenden Spektralkoeffizienten aus zwei (zeitlich) benachbarten Blöcken zu bilden ist.
Die kritische Abtastung wird durch eine zeitliche Abtastra- tenreduktion um den Faktor 2 erzielt, wie es durch die mit 12b bezeichneten Einrichtung in Fig. 4 symbolisch dargestellt ist. Ist eine Orthogonalität der zweiten Transformation (12a, 12b) gewünscht, so können sämtliche Ausgangswerte p, q durch Multiplikation mit dem Faktor 1/V2 normiert werden.
Die der ersten Transformation, die beispielsweise eine MDCT ist, nachgeschaltete zweite Transformation (12a, 12b) greift jeweils über die zwei benachbarten Bänder, aus denen der Realteil pk,m und der Imaginärteil qk,m für einen Frequenzindex k gebildet werden. Außerdem werden, wie es durch die Funktionen hL und hH dargestellt ist, zeitlich aufeinanderfolgende reellwertige Spektralkoeffizienten in der Kombination, d. h. der Summation bzw. Differenzbildung, be- rücksichtigt.
Da bei dem in Fig. 4 gezeigten Ausführungsbeispiel die nachgeschaltete Transformation 12a, 12b keine Freiheitsgrade zur Optimierung des Gesamtsystems im Sinne von in den Funktionen hL und hH enthaltenen einstellbaren Gewichtungsfaktoren umfaßt, wird es bevorzugt, zur Optimierung des Gesamtsystems die Fensterfunktion der ersten Transformation, also beispielsweise der MDCT, zu manipulieren, d. h. im
Vergleich zu einer vorgegebenen bekannten Fensterfunktion zu verändern. Hierbei erhält man einen Freiheitsgrad N/2 bei einer Frequenzauflösung von N Teilbändern und einer Fensterlänge von L = 2 N Werten.
Zusammenfassend lautet die in Fig. 4 dargestellte Transformationsvorschrift T2 folgendermaßen:
für k gerade :
qk, m - Uk-ι,m + U]ς_ι, m-l ( 2 )
für k+1 :
Pk+l,m - Ujc+ιr m - U fc+i, m-ι ( 3 )
qk+l,m = uk,m - Uk,m_ι ( 4 )
Zur Rückgängigmachung der Transformation T , wie sie für Fig. 4 beispielhaft in den Gleichungen (1) bis ( 4 ) dargestellt ist, wird eine zu der Transformationsvorschrift T2 inverse Transformationsvorschrift T2 -1 verwendet . Wenn Gleichungen (1) bis ( 4 ) betrachtet werden, so zeigt sich, daß die reellen Spektralkomponenten uk, m_ι und uk,m aus dem Real- teil pk,m und dem Imaginärteil qk+ι,m also aus den Gleichungen (1) und (4 ) berechnet werden können, indem die beiden Gleichungen ( 1 ) und ( 4 ) für zwei Unbekannte nach den gesuchten reellen Spektralkoeffizienten uk, m-ι und uk,m aufgelöst werden . Unter Verwendung dieser inversen Kombinations- Vorschrift T2 -1 kann unter Kenntnis der Folge von Blöcken von komplexen approximierten Spektralkoeffi zienten wieder auf die Folge von reellen Spektralkoeffizienten zurückge-
rechnet werden, indem d e inverse Kombinationsvorschrift durchgeführt wird.
Nachfolgend wird anhand von Fig. 5 ein alternatives Ausfüh- rungsbeispiel beschrieben, bei dem keine kritische Abtastung vorgesehen ist. Hierbei wird der Ausgangswert u Itl der m-ten MDCT-Operation mit dem Frequenzindex k direkt zur Bildung des Realteils herangezogen. Der zugehörige Imaginärteil wird als gewichtete Summe der in der Zeit-Frequenz- Ebene umliegenden MDCT-Ausgangswerte uk_ι, m_ι, u _ι,m, uk_ι, m+ , uk, m-ι, uk, m+ι, u+1 m_ι, uk+ι,m und uk+ι, m+ι berechnet. Eine mögliche Kombination der entsprechenden Filter gemäß Fig. 5 (im Beispiel für k ungerade) lautet folgendermaßen:
für den Realteil p:
hR(m) = {0, 1, 0},
für den Imaginärteil q:
hA(m) = {a, -b, a}, hB (m) = {c, 0, -c}, hc(m) = {a, b, a}
In dem obigen Ausdruck können die Werte der Koeffizienten a, b, und c zur Optimierung des Gesamtsystems herangezogen werden, also wieder dazu, daß ein gewünschter Frequenzgang der Gesamtanordnung erreicht wird, der, wie es ausgeführt worden ist, beispielsweise dahingehend erwünscht ist, daß für positive Frequenzen eine Bandpasscharakteristik als Frequenzgang vorliegt, während für negative Frequenzen eine möglichst große Dämpfung erwünscht wird.
Gleichungsmäßig ausgedrückt stellt sich die in Fig. 5 dargestellte Transformationsvorschrift T2, die aus den Einzelfiltern 50a, 50b, 50c, 50d sowie einem Summierer 50e be- steht, folgendermaßen dar:
für k ungerade:
Pk,m = uk,m; ( 5 )
9j ,m = a ' Uk-i ,m+ι - b " Uk_ι,m + a ' U]c-ι,m_ι +
-c • uk,m+ι c • uk,m_ι +
a ' uk_ι ,m-ι + b " uk+ ,m + a " uk+ι, m_ι ; ( 6 )
Zur Berechnung von qk,m werden somit mehr oder weniger stark durch Gewichtungsfaktoren a, b, c gewichtet sämtliche zum reellen Spektralkoeffizienten uk,m in der Zeit-Frequenz- Ebene benachbarten reellen Spektralkoeffizienten verwendet, wie es in Gleichung (6) dargestellt ist.
Es sei darauf hingewiesen, dass für ein gerades k dieselben Gleichungen (4) bis (6) verwendet können. Die Gewichtungsfaktoren haben in diesem Fall vorzugsweise die gleichen Beträge, jedoch, teilweise unterschiedliche Vorzeichen.
Zur Umkehrung der in Fig. 5 dargestellten Transformationsvorschrift ist für die Ermittlung von uk,m lediglich eine triviale Operation durchzuführen, da sich dieser Wert unmittelbar aus Gleichung (5) ergibt. Nachdem es sich bei dem in Fig. 5 gezeigten System um ein nicht kritisch abgetaste- tes System handelt, sind die Real- und Imaginärteile informationsmäßig redundant dargestellt. Dies äußert sich in der invertierten Transformationsvorschrift T2 _1 dadurch, daß allein aus den Realteilen die reellen Spektralkoeffizienten berechnet werden können. Gleichung (6) muß daher nicht zur Auswertung herangezogen werden. Die der Transformationsvorschrift inverse Transformationsvorschrift ist somit bei dem in Fig. 5 gezeigten Ausführungsbeispiel identisch und durch Gleichung (5) gegeben.
Es sei darauf hingewiesen, daß bei dem im vorhergehenden beschriebenen Fall, bei dem die komplexe approximierte Spektraldarstellung beispielsweise in einem psychoakustischen Modell benötigt wird, um in einem Codierer die Quan-
tisiererschrittweite einzustellen, eine Rückrechnung von der komplexen approximierten Spektraldarstellung zu der reellen Spektraldarstellung nicht mehr benötigt wird. Alternativ können jedoch Fälle existieren, bei denen eine entsprechende Inversion benötigt wird, bei denen also aus der komplexen approximierten Spektraldarstellung wieder die zugrundeliegende reelle Spektraldarstellung berechnet werden muß .
Abhängig von den Gegebenheiten können die erfindungsgemäßen Verfahren in Hardware oder in Software implementiert werden. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken, daß das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit auf einem maschinenlesbaren Träger gespeichertem Programmcode zur Durchführung von einem oder mehreren der er- findungsgemäßen Verfahren, wenn das Computer-Programm- Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt ist die Erfindung auch ein Computer-Programm mit einem Programmcode zur Durchführung von einem oder mehreren der Verfahren, wenn das Computer-Programm auf einem Compu- ter abläuft.