DE69725650T2 - Verfahren und Gerät zur Kompressionskodierung eines digitalen Signals - Google Patents

Verfahren und Gerät zur Kompressionskodierung eines digitalen Signals Download PDF

Info

Publication number
DE69725650T2
DE69725650T2 DE69725650T DE69725650T DE69725650T2 DE 69725650 T2 DE69725650 T2 DE 69725650T2 DE 69725650 T DE69725650 T DE 69725650T DE 69725650 T DE69725650 T DE 69725650T DE 69725650 T2 DE69725650 T2 DE 69725650T2
Authority
DE
Germany
Prior art keywords
signal
sub
quantizer
perception
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69725650T
Other languages
English (en)
Other versions
DE69725650D1 (de
Inventor
François Moreau De Saint Martin
Pierrick Philippe
Xavier Durot
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telediffusion de France ets Public de Diffusion
Orange SA
Original Assignee
Telediffusion de France ets Public de Diffusion
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telediffusion de France ets Public de Diffusion, France Telecom SA filed Critical Telediffusion de France ets Public de Diffusion
Publication of DE69725650D1 publication Critical patent/DE69725650D1/de
Application granted granted Critical
Publication of DE69725650T2 publication Critical patent/DE69725650T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Kompressionscodierung eines digitalen Signals mit Kontrolle des Endrekonstruktionsfehlers.
  • Gegenwärtig bedeuten die Verarbeitung, die Speicherung und die Übertragung von Audio- und/oder Videoinformationen bei zunehmender Menge auf Grund der Durchführung von immer komplexeren Anwendungen die Durchführung von immer komplizierteren Codierprozessen von Daten oder digitalen Signalen, den Trägern dieser Informationen. Diese Codierprozesse werden im Bereich von entsprechenden Codierern durchgeführt, wobei die kompressionscodierten Daten oder digitalen Ursprungssignale zu einem oder mehreren Decodierern übertragen werden, die Decodierungsoperationen ausführen, die im wesentlichen umgekehrt zu den Kompressionscodierungsoperationen sind, um ein rekonstruiertes Signal möglichst nahe zum Ursprungssignal wiederherzustellen.
  • Die Gewinnung des Ursprungssignals dann aus dem rekonstruierten Signals, wenn dieses Signal z. B. ein Audio- und/oder Videosignal ist, bedeutet das Durchführen von Kompressionscodier-Decodier-Prozessen, die die Übertragung des codierten, die Information transportierenden Signals und dann die Wiederherstellung eines rekonstruierten Signals erlauben, das ein Minimum an Verschlechterungen im Verhältnis zum Ursprungssignal insbesondere im Wahrnehmungsbereich dieser Signale aufweist. Der Wahrnehmungsbereich entspricht einem physikalischen und physiologischen Bereich, wie z. B. dem akustischen und hörbaren Bereich im Falle von Audiofrequenzsignalen bzw. dem optischen und sichtbaren Bereich im Falle von Videofrequenzsignalen.
  • Ein solcher Kompressionscodierprozess führt zur Zeit eine Quantisierungsoperation durch, die es zum Ziel hat, einer Gruppe oder Gesamtheit von Eingangswerten oder Abtastwerten des digitalen Ursprungssignals eine andere Gruppe von Werten entsprechen zu lassen, die aus einer Gesamtheit von diskreten Werten dargestellt wird. Die Quantisierung kann skalar oder vektoriell sein, so wie in 1 dargestellt ist. Für eine Gruppe von Eingangswerten, wie z. B. einem Audio- oder Video-Abtastprobenrahmen, kann jeder Eingangsgesamtheit oder jedem Eingangsvektor V von N Abtastproben {xk, ..., xk+N–1} ein nächster beliebiger Vektor ai in einem Raum z. B. von reduzierter Abmessung zugeordnet werden, wobei das Quantisierungsrauschen der vektoriellen Differenz zwischen diesen letzteren entspricht, d. h. B = a4 – V in 1. Der beliebige Vektor wird durch seinen Index markiert, was das Reduzieren, d. h. das Komprimieren, der zur Speicherung oder zur Übertragung der durch den Eingangsvektor dargestellten Information notwendigen Informationsmenge erlaubt.
  • Zwei wesentliche Faktoren begrenzen gegenwärtig die Qualität der Ausnützung der psychophysiologischen Eigenschaften, also der psychoakustischen bzw. psychovisuellen Eigenschaften, der Codierer im Bereich der Binärzuweisung.
  • Die existierenden Techniken, die vor allem im psychoakustischen Bereich entwickelt worden sind, nehmen bei der Durchführung Filterbänke in Anspruch, die eine große Frequenzselektivität erfordern. Die erste Begrenzung der vorher erwähnten Ausnützungsqualität ergibt sich also aus der Wahl der eingesetzten Filterbänke. Wenn das Verwenden anderer Filterbänke gewünscht wird, wie z. B. geringer selektive Filter oder Analyse-Rekonstruktionsfilter mit unvollkommener Rekonstruktion, nützen die existierenden Binärzuweisungstechniken die psychophysikalischen Eigenschaften des Empfängers, d. h. die psychoakustischen Eigenschaften des Ohres, sehr schlecht aus. Diese Art von Technik ist im Standardisierungstext ISO/MPEG 1 – Audio 11172-3 beschrieben worden. Die vorher erwähnte Binärzuweisungstechnik ist häufig so dargelegt worden, als bestünde sie darin, bei der Quantisierung eines Unterbandes das in dieses Unterband durch die benachbarten Unterbänder eingebrachte Rauschen außer Acht zu lassen. Ein solcher Ansatz ist allerdings nicht realistisch, denn, wenn das in die Unterbänder jenseits der benachbarten Unterbänder injizierte Rauschen als vernachlässigbar betrachtet werden kann, da die Filter extrem selektiv sind, kann der effektive Beitrag der benachbarten Bänder keinesfalls außer Acht gelassen werden.
  • In der Praxis stützt sich die Binärzuweisung auf die Berechnung einer Maskierungsschwelle für jedes Unterband, einer Schwelle, die im allgemeinen erhalten wird, indem das Minimum der Maskierungskurve über ein Frequenzintervall genommen wird. Im Falle ideal selektiver Filter kann das Minimum über das Nennfrequenzband des Filters genommen werden, z. B. ein Minimum über 16 Linien, wenn die Filterbank 32 Bänder und 512 Frequenzlinien umfasst. In der Praxis muss allerdings der ganze Träger der Filterbank betrachtet werden, nämlich z. B. 32 Linien. Im Falle, dass das Minimum für zwei benachbarte Bänder für die gleiche Frequenzlinie erreicht wird, entsprechen die Beiträge der beiden benachbarten Bänder der maximal zulässigen Leistung, werden aber durch die Frequenzantworten der beiden Synthesefilter gedämpft. Bei einer Unabhängigkeitshypothese des Rauschens ist es möglich, die beiden Terme zusammenzuzählen. Die Eigenschaft zur vollkommenen oder quasi-vollkommenen Rekonstruktion der Filterbank erlaubt es zu zeigen, dass die resultierende Rauschleistung für diese Frequenzlinie genau die injizierbare Rauschleistung ist. Vom Standpunkt der Tatsache aus, dass die Beschränkung nicht erfüllt werden kann, ist dies der schlimmste Fall, weil sich nämlich bei anderen Konfigurationen diese Binärzuweisungstechnik als zu klug erweisen kann.
  • Die vorher erwähnte Technik ist also nur unter der Bedingung wirksam, dass die Filterbank für eine vollkommene Rekonstruktion steht und dass die Synthesefilter besondere Verhaltensweisen haben.
  • Eine zweite Begrenzung ergibt sich außerdem aus der Verwendung einer Maskierungskurve im Energie/Frequenz-Bereich. Eine solche Maskierungskurve zielt im Grunde darauf ab, eine Modellierung des Empfängers einzuführen, im vorliegenden Fall des Ohres. Im Falle der audiodigitalen Codierung sind besonders die psychoakustischen Eigenschaften durch diese Maskierungskurve gekennzeichnet, welche, ausgehend vom Ursprungssignal, den Codierungsrauschpegel in Abhängigkeit von der Frequenz beschreibt, der zugelassen werden kann, ohne die Qualität des rekonstruierten Signals zu verschlechtern. Das zu lösende Problem ist dann dasjenige einer Optimierung unter Beschränkung, wobei die die Binärzuweisung steuernde Maskierungskurve entweder eine Beschränkung bildet, wenn der Codierer mit variabler Rate arbeitet, oder die zu minimierende Funktion definiert, wenn der Codierer mit fester Rate arbeitet.
  • Alle bestehenden Binärzuweisungstechniken stützen sich im Grunde auf die Hypothese eines Einsatzes von idealen oder zumindest besondere Spektraleigenschaften besitzenden Analyse-Synthese-Filtern. Bei den vorher erwähnten Techniken insbesondere wird nur der Beitrag des Synthesefilters in Betracht gezogen, das die Aufgabe hat, die Komponente des diesem Frequenzband entsprechenden Signals zu rekonstruieren. Diese Techniken sind in den Artikeln mit den Titeln Subband Coding of Digital Audio Signals von R. N. J. VELDHUIS, M. BREEUWER und R. G. VAN DER WAAL, Philips Research Laboratories, P.O. Box 80000, 5600 IA Eindhoven, The Netherlands, Philips J. Res.44, 329–343, 1989 und Optimal Bit Allocation for MPEG Audio Standard using the Generalized BFOS Algorithm von D. GARRIDO und S. RAO, IBM T. J. Watson Research Center, New York, USA, 98th Convention 1995, 25.–28. Februar, PARIS, Audio Engineering Society Preprint. In der Praxis ist jedoch offenkundig, dass die benachbarten Filter auch Rauschen in das vorher erwähnte Frequenzband injizieren. Es ist also notwendig, in der Rauschinjizierung die Verzerrungen vorwegzunehmen, die auf die Tatsache zurückzuführen sind, dass die Filter nicht ideal sind und insbesondere einen nicht idealen Beitrag im Durchgangsband haben. Diese Modellierung ist jedoch in dem Maße grob, als sie es nicht erlaubt, das Faltungsprodukt voll zu berücksichtigen, das durch die Filter des Empfängers ausgeführt wird, wie z. B, die akustischen Filter des Ohres. Eine Verbesserung des Binärzuweisungsprozesses könnte durch die Durchführung eines solchen Zuweisungsprozesses nicht im Frequenzbereich, bei dem eine Korrektur mittels einer Maskierungskurve zur Zeit eingeführt wird, sondern im Wahrnehmungsbereich ins Auge gefasst werden, dem physiologischen Empfindlichkeitsbereich des betrachteten Hör- oder Sehempfängers. Allerdings arbeiten die zur Zeit bestehenden Binärzuweisungstechniken nur, wenn diese im Frequenzbereich geführt werden.
  • Die vorliegende Erfindung hat als Aufgabe, die vorher erwähnten Nachteile durch den Einsatz eines Verfahrens und einer Vorrichtung zur Kompressionscodierung eines digitalen Audio- oder Videosignals auszuräumen, wobei ein spezifischer Binärzuweisungsprozess bei Verwendung einer Analyse- oder Synthese-Filterbank beliebiger Art geeignet ist, eingesetzt zu werden.
  • Eine andere Aufgabe der vorliegenden Erfindung ist der Einsatz eines Verfahrens und einer Vorrichtung zur Kom pressionscodierung eines digitalen Audio- oder Videosignals, bei welchen der Binärzuweisungsprozess im Wahrnehmungsbereich des Empfängers gesteuert wird, wobei die ganze, von einer Maskierungskurve im Frequenzbereich ausgehende Steuerung dann weggelassen wird.
  • Eine weitere Aufgabe der vorliegenden Erfindung ist infolgedessen dank dem Einsatz eines im Wahrnehmungsbereich des Empfängers gesteuerten Binärzuweisungsprozesses der Einsatz eines Verfahrens und einer Vorrichtung zur Kompressionscodierung eines digitalen Audio- oder Videosignals, wobei der Empfänger durch einen psychophysikalischen Modul modelliert wird, der viel feiner als die zur Zeit benutzten Maskierungskurven ist.
  • Die Vorrichtung und das Verfahren zur Kompressionscodierung eines digitalen Signals mit Endrekonstruktionskontrolle, welche die Gegenstände der vorliegenden Erfindung sind, bei denen ein durch eine Aufeinanderfolge von Abtastprobenrahmen gebildetes, digitales Ursprungssignal einer Untersignale bildenden Zerlegung in Unterfrequenzbänder und für jedes Untersignal einem Binärzuweisungs- und danach in Abhängigkeit dieser Zuweisung einem Quantisierunqsprozess unterzogen wird, um ein codiertes digitales Signal zu erzeugen, zeichnen sich dadurch aus, dass dieser erlaubt bzw. darin besteht, eine Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten-decodierten digitalen Signal, wobei diese Differenz eine Funktion des Filterungsfehlers der Zerlegung in Unterfrequenzbänder und des Quantisierungsfehlers für eine Vielzahl von Quantisierern in jedem Untersignal ist, und eine iterative Binärzuweisung durchzuführen, die nach einem Abstandsbeschränkungskriterium zwischen dem geschätzten codierten-decodierten digitalen Signal und dem Ursprungssignal bzw. nach einer Codierungsratenbeschränkung und Berechnung des Codierungsgesamtfehlers für ei nen laufenden Quantisierer und einen benachbarten Quantisierer dieser Vielzahl von Quantisierern die Zuweisung eines optimalen Quantisierers erlaubt.
  • Das Verfahren und die Vorrichtung zur Kompressionscodierung finden Anwendung zur Speicherung und zur Übertragung von digitalen Daten, die typisch für Audio- und/oder Videofrequenzinformationen sind, insbesondere von Rundfunk- bzw. Drahtfunkprogrammen.
  • Sie werden besser verständlich beim Lesen der Beschreibung und bei der Betrachtung der Zeichnungen, in denen außer 1, die sich auf zur Zeit bekannte und verwendete Quantisierungstechniken bezieht,
  • 2 ein allgemeines Ablaufdiagramm des den Gegenstand der vorliegenden Erfindung bildenden Kompressionscodierungsverfahrens eines digitalen Signals darstellt;
  • 3a ein detailliertes Ablaufdiagramm einer ersten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Kompressionscodierungsverfahrens eines digitalen Signals mit Kontrolle des Rekonstruktionsendfehlers im Frequenzbereich im Falle einer variablen Codierungsrate darstellt;
  • 3b ein spezifisches Ablaufdiagramm einer Durchführungsvariante der ersten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Kompressionscodierungsverfahrens eines digitalen Signals im Falle einer festen Codierungsrate darstellt;
  • 4a ein veranschaulichendes Blockschaltbildschema zur Durchführung des den Gegenstand der vorliegenden Er findung bildenden Kompressionscodierungsverfahrens eines digitalen Signals in einer zweiten Ausführungsart mit Kontrolle des Rekonstruktionsendfehlers im Wahrnehmungsbereich darstellt, wobei der Wahrnehmungsbereich mittels eines psychophysikalischen Moduls definiert wird, der das Interpretieren des digitalen Ursprungssignals erlaubt;
  • 4b ein detailliertes Ablaufdiagramm der zweiten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens darstellt, so wie es in
  • 4a dargestellt ist, im Falle einer Kompressionscodierung mit variabler Codierungsrate;
  • 4c ein spezifisches Ablaufdiagramm einer Durchführungsvariante der zweiten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals im Fall einer festen Codierungsrate darstellt;
  • 4d und 4e eine Durchführungseinzelheit des psychophysikalischen Moduls darstellen, der zur Durchführung des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens verwendet wird, wenn dieses zur Kompressionscodierung von Audiofrequenzsignalen bestimmt ist, wobei der Modul ein psychoakustischer, für das menschliche Ohr repräsentativer Modul ist, bzw. zur Kompressionscodierung von Videofrequenzsignalen von feststehenden oder beweglichen Bildern bestimmt ist, wobei der Modul ein psychovisueller Modul ist, der repräsentativ für die durch das menschliche Auge und den menschlichen Sehnerv gebildete Einheit ist;
  • 5a ein Blockschaltbildschema einer Vorrichtung zur Kompressionscodierung eines digitalen Signals gemäß der ersten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens darstellt;
  • 5b ein Blockschaltbildschema einer Vorrichtung zur Kompressionscodierung eines digitalen Signals gemäß der zweiten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens im Wahrnehmungsbereich darstellt;
  • 5c die Übertragungsfunktion einer Analysefilterbank darstellt.
  • Eine detailliertere Beschreibung des Verfahrens zur Kompressionscodierung eines digitalen Signals mit Kontrolle des Rekonstruktionsendfehlers entsprechend dem Gegenstand der vorliegenden Erfindung wird nun in Verbindung mit 2 abgegeben.
  • Es wird darauf hingewiesen, dass das den Gegenstand der vorliegenden Erfindung bildende Verfahren in allgemeiner Weise zur Kompressionscodierung eines digitalen Signals bei digitalen Werten oder Audiofrequenz- und/oder Videofrequenzsignalen angewendet werden kann, insbesondere von feststehenden Bildern oder gegebenenfalls z. B. von beweglichen Fernsehbildern. In allen Fällen werden diese Signale durch eine Aufeinanderfolge von Abtastprobenrahmen gebildet, wobei das digitale Ursprungssignal als Ursprungssignal bezeichnet wird, das mit dem Bezugszeichen so versehen ist.
  • In seiner allgemeinsten Ausführungsart umfasst das Verfahren zur Kompressionscodierung nach der vorliegenden Erfindung, ausgehend vom in Rahmen angeordneten Ursprungssignal so, einen Schritt der Zerlegung in Frequenzunterbänder, wobei jedes Unterband ein mit sb bezeichnetes Untersignal bildet. Der Schritt der Zerlegung in Unterbänder, ausgehend vom Ursprungssignal so trägt in 2 das Bezugszeichen 100.
  • Entsprechend einer herkömmlichen Gestaltung der Kompressionscodierung eines digitalen Signals besteht das den Gegenstand der vorliegenden Erfindung bildende Verfahren bei in 2 nicht für jedes Untersignal sb dargestellten Schritten darin, einen Binärzuweisungsprozess zur Quantisierung in Abhängigkeit dieser Zuweisung durchzuführen, um das codierte digitale Signal sc zu erzeugen, das selbstverständlich gespeichert oder gegebenenfalls durch geeignete Mittel übertragen werden soll.
  • Man versteht somit, dass der eigentliche Kompressionscodierungsprozess darin besteht, den Quantisierungsprozess durch den Binärzuweisungsprozess zu steuern, wobei der eigentliche Binärzuweisungsprozess entsprechend dem den Gegenstand der vorliegenden Erfindung bildenden Kompressionscodierungsverfahren eines digitalen Signals Gegenstand spezifischer Maßnahmen ist, die in 2 genauer dargestellt sind.
  • Gemäß einer besonders bemerkenswerten Gestaltung des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung enthält dieses, um den vorher erwähnten Binärzuweisungsprozess sicherzustellen und somit den eigentlichen Quantisierungsprozess zu steuern, wenigstens die Schritte, so wie sie in 2 dargestellt sind.
  • Diese Schritte bestehen darin, in 101 eine Schätzung der Differenz zwischen dem Ursprungssignal so und einem geschätzten codierten/decodierten digitalen Signal, das mit scde bezeichnet ist, durchzuführen, wobei diese geschätzte Differenz gemäß einer bemerkenswerten Gestaltung des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens eine Funktion des Filterungs- und Unterbandzerlegungsfehlers und des Quantisierungsfehlers ist, der im Grunde durch den Wahl- und Zuweisungsprozess eines Quantisierers, ausgehend von einer Vielzahl von Quantisierern, in jedem Untersignal erzeugt wird.
  • So wie beim Schritt 101 von 2 beobachtet werden kann, wird darauf hingewiesen, dass der Filterungsfehler der Zerlegung in Unterbänder ausgehend von einer Wiederzusammensetzung der Untersignale oder Unterbänder sb in ein geschätztes codiertes/decodiertes digitales Signal ausgewertet wird, das vorher erwähnt worden ist und mit scde bezeichnet ist. Der vorher erwähnte Schätzungsschritt in 101 erlaubt es wirkungsvoll, eine geschätzte Differenz zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten digitalen Signal zu erhalten, das durch Wiederzusammensetzung der Untersignale oder Unterbänder sb erzielt wird. Man versteht somit, dass die Zusammensetzung des Filterungsfehlers der Zerlegung in Unterbänder und des Quantisierungsfehlers für eine Vielzahl von Quantisierern in jedem Untersignal geeignet ist, gemäß einer besonders vorteilhaften Gestaltung des den Gegenstand der vorliegenden Erfindung bildenden Kompressionscodierverfahrens die Führung einer optimalen Binärzuweisung zu erlauben, die in Verbindung mit dem Schritt 102 von 2 beschrieben werden wird.
  • Entsprechend dem vorher erwähnten Schritt 102 besteht der Binärzuweisungsprozess des den Gegenstand der vorliegenden Erfindung darstellenden Verfahrens zur Kompressionscodierung eines digitalen Signals darin, eine iterative Binärzuweisung durchzuführen, die es nach einem Abstandsbeschränkungskriterium zwischen dem vorher erwähnten geschätzten codierten/decodierten digitalen Signal scde und dem Ursprungssignal so sowie gegebenenfalls nach einer Codierungsratenbeschränkung und Berechnung des Codierungsgesamtfehlers erlaubt, für einen laufenden Quantisierer und einen zum lau fenden Quantisierer benachbarten Quantisierer aus einer Vielzahl von Quantisierern einen optimalen Quantisierer in einem Schritt 103 für einen betrachteten Abtastprobenrahmen zuzuweisen.
  • Es wird darauf hingewiesen, dass die Erlangung einer optimalen Binärzuweisung in allgemeiner Weise durch Zuweisung eines optimalen Quantisierers, dem dank der Durchführung des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals erhaltenen Ergebnis, entweder mit variabler Codierungsrate, wobei die Wahl der Quantisierer durch Minimieren der Rate unter einer ausgehend vom Rekonstruktionsfehler ausgedrückten Beschränkung vorgenommen wird, oder mit konstanter Codierungsrate erhalten werden kann, wobei die Wahl der Quantisierer durch Minimieren einer Funktion unter Berücksichtigung des Rekonstruktionsfehlers unter der Ratenbeschränkung bewerkstelligt wird, so wie es später noch in der Beschreibung beschrieben wird.
  • Gemäß einer ganz besonders vorteilhaften Gestaltung des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals kann dieses Verfahren bei einer ersten Ausführungsart im Frequenzbereich durchgeführt werden, wobei die iterative Binärzuweisung nach einem Abstandsbeschränkungskriterium im vorher erwähnten Frequenzbereich oder in einem sogenannten Wahrnehmungsbereich ausgeführt wird. Eine Vielzahl von Wahrnehmungswerten, die für die durch das Ursprungssignal so und durch das wahrgenommene geschätzte codierte/decodierte digitale Signal erzeugte physiologische Wirkung repräsentativ sind, werden erstellt, wobei diese Wahrnehmungswerte den Wahrnehmungsbereich darstellen, wobei die iterative Binärzuweisung bei dieser zweiten Ausführungsart nach einem Abstandsbeschränkungskriterium in diesem Wahrnehmungsbereich realisiert wird.
  • In allen Fällen, also der ersten oder zweiten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals, wird das Ursprungssignal jedoch einer Zerlegung in Unterbänder unterzogen, so wie es später noch in der Beschreibung beschrieben wird.
  • Ein theoretischer Beweis der Gesamtheit des Verfahrens zur Kompressionscodierung eines digitalen Signals, so wie es im Zusammenhang mit 2 beschrieben ist, wird nachfolgend angegeben.
  • Die im Zusammenhang mit der vorher erwähnten Figur beschriebene Betriebsweise erlaubt das Ausführen eines wirksamen Binärzuweisungsprozesses, wie auch immer die verwendeten Filterbänke sein mögen, um die Übertragungs- oder Speicherrate unter der Beschränkung zu minimieren, dass das Spektrum des Rekonstruktionsfehlers des codierten Signals unterhalb einer Kurve oder eines Gesetzes zur Beschränkung oder Maskierung entsprechend einer Interpretation des Ursprungssignals gelegen ist.
  • In genauerer Weise erlaubt eine als Analysetransformation bezeichnete lineare Transformation das Zerlegen des Ursprungssignals so in mehrere Untersignale oder Unterbänder sb, die im wesentlichen der Information entsprechen, die in einem Frequenzband des Ausgangssignals, also dem Ursprungssignal so, enthalten ist.
  • Für einen Rahmen des gegebenen Ursprungssignals ist eine Vielzahl von Quantisierern für jedes Unterband sb möglich und das Problem der Binärzuweisung besteht dann darin, die beste Kombination von Quantisierern pro einem Quantisierer für jedes Untersignal zu wählen.
  • Es wird daran erinnert, dass das Problem der Binärzuweisung in allgemeiner Weise darin besteht, entweder die Rate für eine gegebene Qualität, die Rekonstruktionsqualität des Ursprungssignals, zu minimieren oder dagegen die Qualität des rekonstruierten Signals unter einer Beschränkung einer festgelegten Rate zu maximieren.
  • Im Falle der Kompressionscodierung z. B. eines audiodigitalen Signals können die Qualitätsterme des rekonstruierten Signals als Frequenzspektrumsterme des Rekonstruktionsfehlers definiert werden. Es wird dann über eine Kurve, die sogenannte psychoakustische Kurve oder Maskierungskurve verfügt, die für das maximal zulässige, injizierbare Rauschen repräsentativ ist. Für die Berechnung einer solchen Maskierungskurve kann man z. B. auf das Dokument und die Spezifikationen ISO/MPEG1-Audio, 11172-3 zurückgreifen.
  • Im Falle der Codierung eines audiodigitalen Signals und für eine Rekonstruktionsqualität, d. h. einen festgelegten Wahrnehmungsabstand, versucht man somit die Rate für jeden Rahmen unter der Beschränkung zu minimieren, die darin besteht, den vorher erwähnten Rekonstruktionsfehler unter die vorhergehend erwähnte Beschränkungskurve zu platzieren. Dagegen besteht für eine Codierung mit fester Rate die Beschränkung darin, die Tatsache vorzuschreiben, dass der Rekonstruktionsfehler die Maskierungskurve möglichst wenig überschreitet. Mehrere Messungen der Überschreitung können berücksichtigt werden, so wie z. B. die Frequenz, für welche die maximale Überschreitung erreicht wird. Es wird dann versucht, die Amplitude dieser maximalen Überschreitung zu minimieren, oder es wird versucht, die der Überschreitung entsprechende Fläche zu minimieren. Für diese letztere Möglichkeit kann zweckmäßig auf den durch D. Garrido und S. Rao veröffentlichten, vorher bereits erwähnten Artikel unter dem Titel "Optimal bit allocation for MPEG Audio Standard using the generalized BFOS algorithm" zurückgegriffen werden.
  • Was den verwendeten Messprozess der Überschreitung angeht, so kommt die Kontrolle des Fehlers im Frequenzbereich dann durch ein Optimierungskriterium oder eine Beschränkung über das mit Y bezeichnete Spektrum des rekonstruierten Signals und über das mit X bezeichnete Spektrum des Ursprungssignals zum Ausdruck, wobei X und Y selbstverständlich das Spektrum dieser Signale für den betrachteten Rahmen bezeichnen. Für eine mit J(Y – X) bezeichnete Beschränkungsfunktion und im Fall einer variablen Rate wird diese Beschränkungsfunktion geschrieben: J0(Y – X) < 0mit
  • Figure 00150001
  • In dieser Beziehung stellt der Term ψ(e2πjf) die vorher erwähnte Maskierungskurve dar und f stellt die Frequenz einer im betrachteten Unterband enthaltenen Frequenzlinie dar, wobei max den Maximalwert bezeichnet.
  • Was den Schritt 102 in 2 und 3a betrifft, der sich auf die eigentliche iterative Binärzuweisung bezieht, so kann die Durchführung dieses Schrittes in theoretischer Hinsicht dadurch gerechtfertigt werden, dass das den Gegenstand der vorliegenden Erfindung bildende Verfahren zur Kompressionscodierung für Decodierungssysteme verwendet wird, bei denen das rekonstruierte Signal ausgehend von den Untersignalen oder Unterbändern sb durch eine Aufeinanderfolge von Fil terungsoperationen oder Überabtastung mittels einfacher Filter synthetisiert oder z. B. iteriert wird.
  • Das Grundprinzip des iterativen Binärzuweisungsprozesses besteht dann darin, dass die Übertragungsfunktion der Beiträge für jedes der Unterbänder sb berechnet wird, wobei das rekonstruierte Signal gleich der Summe dieser verschiedenen Beiträge ist.
  • Für ein Frequenzspektrum des rekonstruierten Signals Y für den betrachteten Rahmen und für ein Spektrum X ^ des Signals, das bei Nichtvorhandensein von Quantisierung für diesen gleichen Rahmen rekonstruiert würde, wird das Spektrum des Fehlersignals durch die Beziehung in dem Falle angegeben, in dem das verwendete Analyse-Synthese-System nicht zu einer vollkommenen Rekonstruktion gehört:
  • Figure 00160001
  • In der vorher angeführten Beziehung (2) stellt Dk eine Überabtastung im Frequenzunterband vom entsprechenden Rang k dar und Gk stellt eine Filterung für das Unterband oder das Untersignal vom entsprechenden Rang k dar, Wk stellt das Quantisierungsrauschen im Unterband oder entsprechenden Untersignal dar.
  • Der Ausdruck der vorhergehenden Beziehung (2) im Bereich der Leistungen des rekonstruierten Signals und des rekonstruierten Signals bei Nichtvorliegen von Quantisierung unter Berücksichtigung einer Rauschunabhängigkeitshypothese zwischen den verschiedenen Unterbändern oder Untersignalen vom Rang k und von einer Unabhängigkeitshypothese zwischen dem Rauschen und dem Signal wird geschrieben:
  • Figure 00170001
  • Die vorstehende Beziehung (3) gibt den Ausdruck der spektralen Leistungsdichte des auf die Quantisierung zurückzuführenden Rekonstruktionsfehlers an.
  • Der eigentliche Binärzuweisungsprozess, wie er in 2 dargestellt ist, besteht dann darin, die vorhergehende Beziehung (3) zwischen dem Rekonstruktionsfehler und den Quantisierungsfehlern in jedem der Unterbänder oder Untersignale sb für jeden aufeinanderfolgenden Rahmen auszunützen, um die eigentliche Binärzuweisung durchzuführen, damit der Zuweisungsprozess in akkurater Weise der vorher erstellten Beschränkungskurve folgt.
  • Da der dem Filterungsfehler entsprechende Term, d. h. der Zerlegung-Wiederzusammensetzung in Frequenzen, ein für alle Male berechnet wird, wird bei Berücksichtigung dieses Terms dann die Schätzung des injizierten Rauschens für verschiedene Wahlen von Quantisierern aus der Gesamtheit von verfügbaren Quantisierern sehr einfach und der eigentliche, in 2 und 3a dargestellte Binärzuweisungsprozess ist für verwendete Analyse- bzw. Synthesefilter, die beliebige Frequenzformen aufweisen, schnell.
  • Durch Filter, die beliebige Frequenzformen haben, ist der Einsatz von Filterbänken zu verstehen, deren Filter das Ausführen einer Pflasterung über einen Frequenzbereich erlauben, wie die diesen Frequenzbereich bedeckenden Frequenz-Unterbänder, und die so sind, dass zumindest 50% der Energie jedes die Filterbänke bildenden Filters in jedem betrachteten Frequenzunterband gelegen ist. Selbstverständlich kann das den Gegenstand der vorliegenden Erfindung bildende Verfahren zur Kompressionscodierung eines digitalen Signals auch ausgehend von Analyse- und Synthesefilterbänken durchgeführt werden, für die sich die Filteroperation im wesentlichen auf eine reine, den Signalen zugeführte Verzögerung reduziert, wobei das Filterungsfehlersignal auf Grund der Zerlegung-Wiederzusammensetzung in der Frequenz dann in einem solchen Fall im wesentlichen vernachlässigbar ist. In diesem letzteren Fall reduziert sich die Wahrnehmungsabstandsberechnung des Schrittes 102 der iterativen Binärzuweisung im wesentlichen auf die Berücksichtigung einzig und allein des Quantisierungsfehlers.
  • Es wird allgemein darauf hingewiesen, dass der Durchlauf einer Codierung mit konstanter Qualität und mit variabler Rate, so wie vorher bei einer Codierung mit fester Rate im wesentlichen darin besteht, das Frequenzbeschränkungskriterium durch ein spezifisches Ratenkriterium zu ersetzen, welches in theoretischer Hinsicht in nachfolgender Weise eindeutig ausgedrückt wird.
  • Unter Bezugnahme auf die vorher in der Beschreibung erwähnte Beziehung (1) richtet sich im Falle einer festen Rate die Minimierung auf eines der folgenden Kriterien: J0(Y – X) (4)
  • Figure 00180001
  • Bei den vorstehenden Beziehungen (4) und (5) wird daran erinnert, dass die Bezeichnungen denjenigen der Beziehung (1) entsprechen.
  • Wie im Falle einer festen Rate muss also die Beschränkungsfunktion J0 oder J1 unter einer Ratenbeschränkung minimiert werden. Eine solche Betriebsart entspricht einem klassischem Prozess, und insbesondere im Falle eines audiodigitalen Signals entspricht diese Betriebsart der laufenden Interpretation der Maskierungskurve.
  • In genauerer Hinsicht bestehen jedoch zwei Auffassungen, um die Analyse des Fehlersignals vorzunehmen.
  • Entsprechend einer ersten Auffassung ist es möglich, Modelle in Betracht zu ziehen, wie z. B. das als weißes Rauschen angesehene Quantisierungsrauschen, und es ist dann möglich, den resultierenden Rekonstruktionsfehler zu berechnen. Die Berechnung des Fehlers richtet sich dann auf die Berechnung eines mathematischen Erwartungswertes dieses Fehlers.
  • Entsprechend einer zweiten Auffassung kann der Fehler in Betracht gezogen werden, der für ein besonderes Signal erzeugt wird. Die Beobachtung einer Fourier-Transformation, wie z. B. einer diskreten Fourier-Transformation des Signals oder des Fehlers über einen Rahmen, zeigt dann das Vorliegen eines sehr veränderlichen Fehlerspektrums. In einem solchen Fall entspricht das durch die Beschränkungskurve erstellte Gesetz nicht einem Nichtvorliegen einer Überschreitung dieser Beschränkungskurve für jegliche Frequenzlinie der Fourier-Transformation. Diese Überschreitungen verhindern nicht, dass das vorher erwähnte Beschränkungsgesetz erfüllt wird, auf Grund der Tatsache, dass der Empfänger, im vorliegenden Fall das Ohr, im Falle eines audiodigitalen Signals das rekonstruierte Signal nicht mit einer sehr guten Frequenzauflösung analysiert. Die durch den Empfänger durchgeführten Filterungen nehmen in gewisser Weise eine Mittelung der Fehler pro Frequenzband vor und der durch diesen Empfänger wahrgenommene Fehler ist grob eine geglättete Fassung der Fourier-Transformation des Fehlersignals.
  • Entsprechend einer spezifischen Gestaltung des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals kann das Fehlersignal zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten Signal scde somit entweder ausgehend von Modellen oder ausgehend von Glättungen behandelt werden, so wie es später noch in der Beschreibung, ausgehend von den beiden Ausführungsarten des den Gegenstand der Erfindung bildenden Verfahrens beschrieben wird.
  • Der vorher erwähnte Glättungsprozess erlaubt einerseits den Fehler der Zerlegung-Wiederzusammensetzung in Frequenzunterbänder im Falle zu glätten, in dem der Analyse/Synthese-Prozess das Signal nicht vollkommen rekonstruiert, und andererseits bildet er ein Validierungsmittel, das es erlaubt, a posteriori zu verifizieren, dass der Rekonstruktionsfehler nach Quantisierung und Synthese unterhalb der Beschränkungskurve gelegen ist, so wie vorher in der Beschreibung erwähnt worden ist.
  • Im Falle der Codierung eines audiodigitalen Signals z. B. wird die vorher erwähnte Mittelung durch den Empfänger, d. h. das menschliche Ohr, entsprechend der Barks-Skala bewerkstelligt. Für eine detailliertere Definition der vorher erwähnten Leiter kann zweckmäßig auf den durch Eberhard Zwicker und U. Tilmann Zwicker veröffentlichten Artikel mit dem Titel "Audio engineering and psychoacoustics: matching signals to the final receiver, the human auditory system" – Institute of Electroacoustics, Technical University, Munich, D-8000 München 2, Germany zurückgegriffen werden, der durch das J. Audio Eng. Soc., vol. 39, N° 3, 1991, März, Seiten 115–125 veröffentlicht ist.
  • Somit ist es für eine gegebene Frequenz dann zweckmäßig, einen Mittelwert über einen Träger um diese Frequenz über eine konstante Barks-Breite entlang der Frequenzachse durchzuführen. Im Frequenzbereich wird somit eine psychoakustische Kurve berechnet, wobei diese Kurve eine Zwischenstufe einer Näherungsrechnung darstellt, die es erlaubt, als Bindeglied zwischen dem Wahrnehmungsbereich und der eigentlichen Binärzuweisung zu wirken. Die Glättung pro Bark der bewerkstelligten Fourier-Transformation ersetzt grob das Ohrmodell und erlaubt das Reduzieren der verursachten Fehler. In genauerer Weise besteht die gewählte Glättung darin, das Spektrum des Zerlegungs-/Wiederzusammensetzungsfehlers neu zu berechnen, indem für jede Linie der vorher erwähnten Fourier-Transformation der Mittelwert der Leistung des Fehlers über ein Fenster der Breite 1 Bark berechnet wird, der angenäherten Breite der Hörfilter des Ohres.
  • Eine mehr ins Einzelne gehende Beschreibung der ersten Ausführungsform des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals, wenn dieses im Frequenzbereich durchgeführt wird, erfolgt nun in Verbindung mit 3a.
  • Bei dieser ersten Ausführungsart versteht man natürlich, dass der Schritt 100 von 2 vorher ausgeführt wird. Die Schritte 101 und 102 jedoch, die sich auf die Schätzung der Differenz zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten digitalen Signal scde beziehen, und der iterative Binärzuweisungsschritt 102 werden dann in der nachfolgenden Weise ausgeführt.
  • Der Schritt 101 der Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten/decodierten digitalen Signal scde für eine Kontrolle des Rekonstruktionsfehlers im Frequenzbereich umfasst, so wie in 3a dargestellt ist, die aufeinanderfolgenden Schritte, die in einem Schritt 1010 zum Berechnen des Filterungsfehlers bestehen, der durch die Zerlegung in Frequenzunterbänder und durch die Wiederzusammensetzung dieser Frequenzunterbänder erzeugt wird. Man versteht, dass es die Berechnung dieses Filterungsfehlers erlaubt, den Prozess der Zerlegung in Unterbänder sb des Ursprungssignals so zu berücksichtigen und dann im Anschluss an die Übertragung oder an die Speicherung der übertragenen Daten nach Kompressionscodierung die Wiederzusammensetzung dieser codierten Daten zu berücksichtigen, um auf der Ebene eines Decodierers z. B. ein empfangenes oder wiederhergestelltes Ursprungssignal, das mit dem Filterungsfehler der Zerlegung/Wiederzusammensetzung der vorher erwähnten Frequenzunterbänder behaftet ist, wiederherzustellen.
  • Es wird darauf hingewiesen, dass, so wie in 3a dargestellt ist, das den Gegenstand der vorliegenden Erfindung bildende Verfahren zur Kompressionscodierung einen Schritt 1011 zur sogenannten Erstellung eines Wahrnehmungsbeschränkungsgesetzes im Frequenzbereich umfasst. Dieser Schritt 1011 kann für jeden Rahmen des Ursprungssignals so ausgeführt werden, entweder für ein Audiosignal oder für ein Videosignal, so wie es später noch in der Beschreibung beschrieben wird. Der Schritt 1011 erlaubt es, ausgehend vom Ursprungssignal und insbesondere von jedem Rahmen desselben, ein interpretiertes, mit soi bezeichnetes Ursprungssignal unter Berücksichtigung der Hör- oder Sehsensorwahrnehmung eines Empfängers, dem menschlichen Ohr oder Auge, zu erstellen. Den vorher erwähnten Schritten 1010 und 1011 ihrerseits folgt ein Schritt 1012 , der darin besteht, ausgehend vom Wahrnehmungs beschränkungsgesetz und vom beim Schritt 1010 erhaltenen Filterungsfehler, eine korrigierte Wahrnehmungsbeschränkung zu berechnen. Der Schritt 1012 zur Berechnung der korrigierten Wahrmehmungsbeschränkung analysiert sich im Grunde als eine Modifikation einer Frequenzbeschränkungskurve unter Berücksichtigung des Wahrnehmungsbeschränkungsgesetzes für den beim vorhergehenden Schritt 1011 betrachteten Rahmen.
  • Dem vorher erwähnten Schritt 1012 folgt dann für jedes Untersignal, d. h. jedes Unterband sb und für jeden zum Sicherstellen der Quantisierung verfügbaren Quantisierer ai, ein Schritt zur Berechnung der Anzahl von zum Übertragen des quantisierten Untersignals erforderlichen Bits und des quadratischen Quantisierungsfehlers zwischen dem Ursprungsuntersignal und dem quantisierten Untersignal, der jedem der möglichen Quantisierer zugeordnet ist, die für jedes Untersignal verfügbar sind. Dem vorher erwähnten Schritt 1013 seinerseits folgt ein Schritt 1014 , der darin besteht, eine Sortierung der verfügbaren Quantisierer in Abhängigkeit vom quadratischen Fehler des Quantisierungsrauschens durchzuführen, das durch diese letzteren erzeugt wird, wobei diese Sortierung der Quantisierer für jedes Untersignal wegen der Spezifität jedes möglichen Quantisierers für ein betrachtetes Untersignal oder Unterband durchgeführt wird.
  • Schließlich folgt dem Schritt 1014 seinerseits ein Schritt 1015 , der darin besteht, die Wahl wenigstens eines Quantisierers aus den vorhergehenden sortierten Quantisierern zu initialisieren, wobei es dieser Initialisierungsschritt erlaubt, im Grunde einen laufenden Quantisierer für das betrachtete Unterband sb zu wählen, der es später erlaubt, die iterative Binärzuweisung 102, die in 2 und 3a dargestellt ist, vorzunehmen.
  • Der Binärzuweisungsprozess lässt sich dann in iterativer Weise ausführen, so wie es beim Schritt 102 in 3a im Falle einer variablen Codierungsrate dargestellt ist.
  • Er besteht dann aus einem Schritt 102 zum Berechnen der spektralen Gesamtleistungsdichte des Rekonstruktionsfehlers auf Grund der Quantisierung und sodann aus einem Schritt 1021 zum Unterziehen der spektralen Gesamtleistungsdichte des vorher erwähnten berechneten Rekonstruktionsfehlers einem Frequenzbeschränkungskriterium, wobei dieses Frequenzbeschränkungskriterium den Zweck hat, die spektrale Gesamtleistungsdichte des berechneten Rekonstruktionsfehlers unter den Kurvenwert der korrigierten Wahrnehmungsbeschränkung zu platzieren, der im Anschluss an die Durchführung des vorher erwähnten Schrittes 1012 erhalten wird.
  • Bei positiver Reaktion auf den Unterziehungstest auf das vorher erwähnte Frequenzbeschränkungskriterium beim Schritt 1021 ist der festgehaltene Quantisierer dann für jedes Untersignal der laufende Quantisierer, der vorher beim Schritt 1015 für das betrachtete Unterband festgehalten wird.
  • Dagegen folgt bei negativer Reaktion auf den im Schritt 1021 ausgeführten Test diesem Schritt ein Schritt 1022 , der darin besteht, für jedes Untersignal, d. h. jedes Unterband sb, die spektrale Leistungsdichte des vorher erwähnten Gesamtfehlers bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers sowie den Gewinn an Wahrnehmungsabstand im Verhältnis zur entsprechenden Codierungsrate zu berechnen.
  • Dem Schritt 1022 folgt dann ein Schritt 1023 , welcher darin besteht, den Quantisierer des Untersignals oder Unterbandes sb, der zur besten Verbesserung des auf die Ratenvariation bezogenen Wahrnehmungsabstandes führt, zu verändern und festzuhalten. Dem vorstehend erwähnten Schritt 1023 folgt dann eine Rückkehr durch einen iterativen Aufruf 1024 des vorher erwähnten Frequenzbeschränkungskriteriumstests 1021 unter Berücksichtigung der Veränderung des Quantisierers des Untersignals, der zur besten Verbesserung des auf die Ratenvariation bezogenen Wahrnehmungsabstandes geführt hat.
  • Bei positiver Reaktion auf den beim Schritt 1021 von neuem ausgeführten Test ist der festgehaltene Quantisierer der vorher erwähnte veränderte Quantisierer und bei negativer Reaktion auf das erneut ausgeführte, vorher erwähnte Frequenzbeschränkungskriterium wird die Iteration dann bis zur Erreichung einer späteren positiven Reaktion weitergeführt.
  • Im allgemeineren Fall, d. h. demjenigen der Benutzung von beliebigen Filtern, werden nun nachfolgend verschiedene Ausführungsarten der in 3a dargestellten aufeinanderfolgenden Schritte, sowohl was den Schritt 101 zur Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten/decodierten digitalen Signal als auch was den Schritt 102 der eigentlichen iterativen Binärzuweisung betrifft, beschrieben.
  • Der Schritt 1012 zur Veränderung der Frequenzbeschränkungskurve, der es erlaubt, den Filterungsfehler bei der Zerlegung-Wiederzusammensetzung der Frequenzunterbänder zu berücksichtigen, wenn sich diese Operation nicht auf eine reine Verzögerung reduziert, wird durch eine einfache Prozedur durchgeführt, die darin besteht, dass durchgeführt werden:
    • – eine Wiederzusammensetzung der Unterbänder sb bei Nichtvorliegen von Quantisierung,
    • – die Berechnung des Rekonstruktionsfehlers auf Grund der Tatsache, dass der Zerlegungsprozess in Unterbänder sb und der Wiederzusammensetzung dieser Unterbänder zueinander nicht invers sind, unter Berücksichtigung der Nennverzögerung, die durch die Aufeinanderfolge der vorher erwähnten Zerlegung und Wiederzusammensetzung entsteht,
    • – die Berechnung der Fourier-Transformation z. B. durch eine schnelle Fourier-Transformation dieses Rekonstruktionsfehlersignals,
    • – Subtraktion der spektralen Leistungsdichte dieses Fehlersignals, das beispielsweise einem Glättungsprozess unterzogen wird, von der Beschränkungskurve, d. h. dem Wahrnehmungsbeschränkungsgesetz im Frequenzbereich, das bei dem in der Beschreibung vorher beschriebenen Schritt 1011 erstellt worden ist.
  • Was den Schritt 1013 betrifft, so werden die Berechnung für jedes Untersignal und Unterband sb und für jeden verfügbaren Quantisierer der Anzahl von Bits, die nötig sind, um dieses mit dem betrachteten Quantisierer quantisierte Untersignal oder Unterband sb zu übertragen, sowie die Berechnung der Frequenzform, die von dem durch diese Quantisierungsoperation erzeugten Quantisierungsrauschen geglättet ist, durchgeführt. Somit erlaubt es der Schritt 1013 für jeden verfügbaren Quantisierer für das betrachtete Unterband, über die Anzahl von Bits, die für die Übertragung des Untersignals nötig sind, sowie den Wert des Quantisierungsrauschens zu verfügen, das durch eine den betrachteten Quantisierer verwendenden Quantisierungsoperation erzeugt wird. Am Ende des Schrittes 1013 verfügt man über einen Satz von ent sprechenden Werten ev für jedes Untersignal und jeden für den betrachteten Rahmen verfügbaren Quantisierer.
  • Was den Schritt 1014 angeht, so kann die Sortierung der möglichen Quantisierer über ein Sortierprogramm ausgeführt werden, das es erlaubt, die möglichen Quantisierer durch z. B. anwachsende Quantisierungsfehlerordnung zu klassifizieren, wobei der Quantisierungsfehler als quadratischer Quantisierungsfehler definiert wird. Die Sortierung der möglichen Quantisierer wird dann durchgeführt, indem hernach die Quantisierer, die eine größere Anzahl von Bits verwenden, wobei ein größerer quadratischer Fehler erzeugt wird, eliminiert werden.
  • Schließlich wird der Schritt 1015 , die Initialisierung der Wahl der Quantisierer, für jedes Unterband oder Untersignal sb ohne Berücksichtigung des Einflusses der anderen Unterbänder durchgeführt. Somit wird für jedes Untersignal sb der Quantisierer festgehalten, der es mit einer minimalen Anzahl von Bits erlaubt, einen Quantisierungsfehler zu erzeugen, dessen spektrale Leistungsdichte unterhalb der veränderten Beschränkungskurve liegt, die am Ende des Schrittes 1012 im Falle erhalten wird, dass nur dieses Untersignal oder Unterband quantisiert würde.
  • Was den eigentlichen iterativen Binärzuweisungsprozess betrifft, so ist, da die Berechnung der spektralen Gesamtleistungsdichte des Rekonstruktionsfehlers im Schritt 1020 durchgeführt wird, so wie vorher beschrieben, und das Frequenzbeschränkungskriterium beim Schritt 1021 zugeführt wird, so wie vorher erwähnt, bei einer positiven Reaktion im entsprechenden Test der für das Unterband festgehaltene Quantisierer der laufende Quantisierer, der beim Initialisie rungsschritt für das betrachtete Unterband sb und selbstverständlich den entsprechenden Rahmen festgehalten wird.
  • Dagegen besteht im Falle einer negativen Reaktion auf den vorher erwähnten Test beim Schritt 1021 der Schritt 1022 darin, für jedes Untersignal oder Unterband sb und für jeden betrachteten Rahmen die spektrale Leistungsdichte des Gesamtfehlers zu berechnen, wenn man den laufenden Quantisierer, der beim Initialisierungsschritt 1015 "ab initio" für dieses Unterband sb festgehalten wird, durch einen zu diesem laufenden Quantisierer benachbarten Quantisierer wechselt. Es wird darauf hingewiesen, dass, um das den Gegenstand der vorliegenden Erfindung bildende Verfahren und insbesondere den iterativen Binärzuweisungsprozess im Falle einer variablen Rate für eine konstante Qualität, d. h. einem Wahrnehmungsabstand, der einem minimalen Fehler im Verhältnis zur vorher erwähnten Beschränkungskurve entspricht, durchzuführen, der gewählte benachbarte Quantisierer derjenige ist, der im Verhältnis zum laufenden Quantisierer die unmittelbar größere Bitanzahl enthält. Der Schritt 1022 umfasst auch eine Operation zur Berechnung des Gewinns der Qualitätsveränderung, d. h. im Grunde der Veränderung der Rauschbeschränkung oder des auf die entsprechende Ratenveränderung ΔR bezogenen Wahrnehmungsabstandes ΔJ auf Grund der Wahl dieses benachbarten Quantisierers, wobei der Ausdruck ΔJ/ΔR als die marginale Veränderung der Qualität in Bezug auf die Rate definiert wird.
  • Schließlich besteht der Schritt 1023 im Grunde in einem Wahlschritt, der darin besteht, den benachbarten Quantisierer, der sich auf ein betrachtetes Unterband oder Untersignal bezieht, festzuhalten, wobei der festgehaltene benachbarte Quantisierer derjenige ist, der zur stärksten Verbesserung der Qualität in Bezug auf die Rate geführt hat. Es wird darauf hingewiesen, dass die im Schritt 1023 ausgeführte Wahloperation durch einen Vergleich zwischen den verschiedenen Gewinnwerten oder marginalen Qualitätsveränderungen in Bezug auf die Rate jedes Untersignals oder Unterbandes erfolgt, wobei ein einziger neuer Quantisierer für jedes Untersignal bereitgestellt wird.
  • Bei einer Ausführungsvariante des Binärzuweisungsprozesses, wie er im Zusammenhang mit 3a beschrieben ist, wird darauf hingewiesen, dass der Schritt zur Berechnung des Gewinnwertes der Qualität in Bezug auf die Rate ΔJ/ΔR durch die einzige Berechnung der Qualitätsveränderung ΔJ ersetzt werden kann, wobei die Wahl des Untersignals und des benachbarten, diesem Untersignal zugeordneten Quantisierers dann für die beste Verbesserung nicht mehr vom Qualitätsgewinnwert in Bezug auf die Rate, sondern von der Qualität allein bewerkstelligt wird.
  • Eine mehr ins Einzelne gehende Beschreibung des iterativen Binärzuweisungsprozesses, d. h. des vorher in Verbindung mit 3a beschriebenen Schrittes 102, im Falle einer variablen Rate wird nun in Verbindung mit 3b für den Fall vorgenommen, dass im Gegensatz dazu die Codierungsrate fest ist.
  • So wie außerdem in 3b beobachtet werden kann, umfasst im Falle einer festen Rate der Schritt 102 in gleicher Weise wie im Fall von 3a einen Schritt 102'0 , der darin besteht, die spektrale Gesamtleistungsdichte des auf die Quantisierung zurückzuführenden Rekonstruktionsfehlers zu berechnen.
  • In nicht einschränkender Weise wird darauf hingewiesen, dass der vorher erwähnte Schritt entweder im Anschluss an die Durchführung des Schrittes 1015 von 3a, d. h. unabhängig von jeglicher Qualitätsbeschränkung, so wie vorher in Verbindung mit dieser Figur beschrieben worden ist, oder dagegen nach Durchführung des in 3a dargestellten iterativen Binärzuweisungsprozesses durchgeführt werden kann, d. h. nach positiver Reaktion in 1025 auf den Test 1021 von 3a, d. h. ausgehend von der von der optimalen Binärzuweisung bei variabler Rate hervorgegangenen Lösung. Die Durchführung entweder der einen oder der anderen der Alternativen ist im Rahmen des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals unerheblich.
  • Dem Schritt 102'0 folgt ein Testschritt 102'1 , der darauf abzielt, zu verifizieren, ob das Codierungsratenbeschränkungskriterium erfüllt ist oder nicht, wobei diese Ratenbeschränkung den vorher in der Beschreibung erwähnten Beziehungen (4) und (5) entspricht. Bei positiver Reaktion auf den vorher erwähnten Test 102'1 ist der für das betrachtete Unterband und den entsprechende Rahmen gewählte Quantisierer derjenige, der dem Schritt 1015 entspricht, z. B. der Initialisierung der Wahl der Quantisierer, d. h. des laufenden Quantisierers.
  • Bei negativer Reaktion auf den in 3b dargestellten Test 1021 ist ein Schritt 102'2 vorgesehen, welcher für jedes Unterband darin besteht, die spektrale Leistungsdichte des Gesamtfehlers zu berechnen, wenn man den laufenden Quantisierer für das betrachtete Unterband und den entsprechenden Rahmen durch einen benachbarten Quantisierer wechselt, wobei die Berechnung der marginalen Veränderung der Qualität in Bezug auf die Rate ΔJ/ΔR auch durchgeführt wird. Es wird jedoch darauf hingewiesen, dass im Gegensatz zur Betriebsart von 3a der zum laufenden Quantisierer benach barte Quantisierer derjenige ist, der die Anzahl von Bits umfasst, die unmittelbar geringer als diejenige des laufenden Quantisierers ist. Dem Schritt 102'2 folgt dann ein Schritt 102'3 , der darin besteht, den Quantisierer des Untersignals oder des entsprechenden Unterbandes aus der Vielzahl von Quantisierern zu ändern und festzuhalten, der im Grunde zur schwächsten Verringerung der Qualität, d. h. des auf die Rate bezogenen Wahrnehmungsabstandes, führt. Der iterative und durch 102'4 dargestellte Aufruf dieses benachbarten Quantisierers erlaubt es, die spektrale Gesamtleistungsdichte des für diesen festgehaltenen benachbarten Quantisierer berechneten Rekonstruktionsfehlers dem Ratenbeschränkungskriterium durch den Test 102'1 von neuem zu unterziehen.
  • Das den Gegenstand der vorliegenden Erfindung bildende Verfahren zur Kompressionscodierung eines digitalen Signals, das vorstehend in Verbindung mit den 3a und 3b in der ersten Ausführungsform dieses letzteren beschrieben wurde, beruht voll und ganz auf der psychophysikalischen, insbesondere psychoakustischen Beschränkungskurve, die beim Schritt 1011 erzeugt wird. Diese Beschränkungskurve zeigt für jede Frequenz die maximal zulässige Rauschdichte an und sie erscheint somit wie ein Berechnungszwischenwert, der es ermöglicht, die Interpretation des Ursprungssignals so zu trennen, um ein interpretiertes Ursprungssignal der eigentlichen Binärzuweisung zu liefern. Somit sind das psychophysikalische Modell und der Binärzuweisungsprozess im wesentlichen unabhängig und es ist demzufolge möglich, ein psychophysikalisches Modell durch ein anderes oder eine Binärzuweisung durch eine andere entweder unter Qualitätsbeschränkung, so wie vorher beschrieben worden ist, oder unter Ratenbeschränkung zu ersetzen. Im Falle z. B. eines audiodigitalen Signals können die durch die vorher erwähnte Norm ISO/MPEG-1 Audio, 11172-3 standardisierten psychoakustischen Modelle verwendet werden.
  • Das Verfahren zur Kompressionscodierung eines digitalen Signals im Frequenzbereich, wie es in Verbindung mit 3a und/oder 3b beschrieben worden ist, ist aus verschiedenen Gründen suboptimal.
  • Zum ersten wird darauf hingewiesen, dass die Berechnung einer Beschränkungskurve, wie z. B. einer psychoakustischen Kurve, die unabhängig von der Analyse- bzw. Synthesefilterbank ist, nur angenähert werden kann.
  • Zum zweiten muss diese Beschränkungskurve im Prinzip durch Entfaltung der Hörfilter des Ohres berechnet werden, wobei diese Operation außerordentlich komplex ist und durch die Theorie der Optimierungen unter Beschränkungsbedingungen gelöst wird. In der Praxis wird diese Kurve näherungsweise ohne Entfaltung berechnet.
  • Da die beispielsweise im Zusammenhang mit 3a vorgeschlagene iterative Binärzuweisungstechnik gemäß dem den Gegenstand der vorliegenden Erfindung bildenden Verfahren zur Kompressionscodierung bereits eine Optimierungstechnik unter Beschränkungsbedingung ist, erscheint es im Großen und Ganzen also möglich, indem diese Techniken zusammengefasst werden, nur ein einziges Optimierungsproblem zu lösen.
  • Dies ist Gegenstand der zweiten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals, bei dem gemäß einer besonders bemerkenswerten Gestaltung dieser zweiten Ausführungsart eine Modifikation der Optimierungsbeschränkungsbedingung insbesondere bei der variablen Rate durchgeführt wird.
  • Bei dieser zweiten Ausführungsart und entsprechend einer besonders vorteilhaften Gestaltung des den Gegenstand der vorliegende Erfindung bildenden Verfahrens ist das angewandte Beschränkungskriterium im Bereich der Wahrnehmungsempfindungen, sei dies im hörbaren oder sichtbaren Bereich. Es wird darauf hingewiesen, dass unter solchen Bedingungen das Spektrum des rekonstruierten Signals Y und das Spektrum des Ursprungssignals X in gleicher Weise durch den menschlichen Empfänger wahrgenommen werden müssen.
  • In beiden Fällen wird die auditive oder visuelle Wahrnehmungsempfindung dann durch eine Gruppe von durch ein Modell des Empfängers, dem menschlichen Ohr oder Auge, berechneten Größen gebildet. Diese Gruppe von Werten erlaubt es, die klangliche oder visuelle Wahrnehmung des rekonstruierten Signals bzw. des Ursprungssignals im Bereich entweder des Hörnervs oder des Sehnervs darzustellen. In beiden Fällen führt das den Gegenstand der vorliegenden Erfindung bildende Verfahren dann ein psychophysikalisches Modell durch, welches in detaillierterer Weise später in der Beschreibung für den Fall eines psychoakustischen Modells bzw. eines psychovisuellen Modells beschrieben wird.
  • Es ist dann möglich, entweder vorzuschreiben, dass die Wahrnehmungsempfindungen des Spektrums des Ursprungssignals X bzw. des Spektrums des rekonstruierten Signals Y ausreichend nah bis auf die differentielle Wahrnehmungsschwelle sind, oder vorzuschreiben, dass die über die vorher erwähnten Spektren Y – X berechnete Wahrnehmungsempfindung des Rauschens niedriger als eine sogenannte Beschränkungs- oder Maskierungskurve ist, welche ausgehend von der Wahrnehmungsempfindung des Spektrums des Ursprungssignals X berechnet werden kann.
  • Bei der zweiten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens zur Kompressionscodierung eines digitalen Signals, so wie es in 4a in Gestalt eines Blockschaltbildschemas dargestellt ist, wird die iterative Binärzuweisung nach einem Abstandsbeschränkungskriterium im Wahrnehmungsbereich ausgeführt.
  • In diesem Fall, so wie in 4a dargestellt, ist der Schritt 101 zur Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten/decodierten digitalen Signal im Vergleich zur anhand 3a beschriebenen, ersten Ausführungsart vereinfacht und, ausgehend von einem mit Ψ bezeichneten, direkt dem iterativen Binärzuweisungsprozess 102 zugeordneten psychophysikalischen Modul, eingerichtet, wobei es dieser psychophysikalische Modul Ψ erlaubt, einen Unterschritt 102a auszuführen, bei dem jedes Untersignal sb oder Frequenzunterband, sowie das Ursprungssignal so, durch den psychophysikalischen Modul Ψ behandelt werden. Der psychophysikalische Modul Ψ erlaubt das Berechnen einer Vielzahl von Wahrnehmungswerten, die für die physiologische Wirkung repräsentativ sind, die durch das Ursprungssignal so erzeugt wird. Er erlaubt außerdem das Schätzen einer Vielzahl von Wahrnehmungswerten, die für die physiologische Wirkung des geschätzten codierten/decodierten digitalen Signals repräsentativ sind. Diese Operationen zur Berechnung und Schätzung dieser Wahrnehmungswerte werden, ausgehend vom Ursprungssignal so, von der geschätzten Differenz zwischen diesem Ursprungssignal und dem geschätzten codierten/decodierten Signal und vom Quantisierungsfehler jedes Untersignals ausgeführt. Die Wahrnehmungswerte stellen den Wahrnehmungsbereich dar.
  • Der eigentliche Binärzuweisungsprozess entspricht dann einem in 4a dargestellten Schritt 102b, der ausge hend von der Gruppe von Wahrnehmungswerten, die den Wahrnehmungsbereich für den betrachteten Rahmen des Ursprungssignals so darstellen, und vom geschätzten codierten/decodierten Signal scde geführt wird. Der Binärzuweisungsprozess 102 und insbesondere der eigentliche Binärzuweisungsprozess 102b von 4a erlaubt dann das Steuern der Quantisierung, so wie vorher in der Beschreibung beschrieben.
  • Es wird darauf hingewiesen, dass sich das den Gegenstand der vorliegenden Erfindung bildende Verfahren zur Kompressionscodierung eines digitalen Signals in 4a insbesondere in seiner zweiten Ausführungsart von den gewöhnlichen Techniken insbesondere durch das Vorliegen der Verbindung AB zwischen dem durch den psychophysikalischen Modul erzeugten Schritt 102a und dem eigentlichen Binärzuweisungsprozess 102b unterscheidet. Die vorher erwähnte Verbindung AB veranschaulicht den iterativen Charakter des Binärzuweisungsprozesses in dem Maße, in dem, so wie vorher in Verbindung mit 3a beschrieben, der psychoakustische Modul Ψ mehrere Male durch den eigentlichen Binärzuweisungsprozess 102b aufgerufen wird.
  • Eine mehr in Einzelne gehende Beschreibung des Schrittes 101 zur Schätzung der Differenz zwischen dem geschätzten codierten/decodierten digitalen Signal und dem Ursprungssignal bei der zweiten Ausführungsart des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens, so wie in 4a dargestellt, wird nun in Verbindung mit 4b vorgenommen.
  • Gemäß der vorher erwähnten 4b umfasst der vorhergehend erwähnte Schritt 101 die aufeinanderfolgenden Schritte, wie z. B. einen Schritt 1010 , der darin besteht, den Filterungsfehler der Zerlegung und der Analyse der Frequenzunterbänder zu berechnen, wobei dieser Schritt 1010 , obwohl vereinfacht, ähnlich zum Schritt 1010 von 3a bei Bedingungen ist, die später in der Beschreibung noch beschrieben werden.
  • Dem vorerwähnten Schritt 1010 folgen für jedes Unterband oder -signal sb nachfolgende aufeinanderfolgende Schritte:
    • 1013 , der darin besteht, für jeden verfügbaren Quantisierer der Vielzahl von Quantisierern die Anzahl von möglichen zugeteilten Bits und den auf das Quantisierungsrauschen zurückzuführenden Quantisierungsfehler zu berechnen. Der Schritt 1013 von 4b ist ähnlich zu demjenigen von 3a;
    • – dem vorher erwähnten Schritt 1013 folgt ein Schritt 1014 , der darin besteht, eine Sortierung der Quantisierer in Abhängigkeit vom quadratischen Fehler durchzuführen, der auf das Quantisierungsrauschen zurückzuführen ist;
    • – schließlich folgt dem Schritt 1014 seinerseits ein Schritt 1015 , der darin besteht, die Wahl wenigstens eines Quantisierers aus den sortierten Quantisierern zu initialisieren, wobei der gewählte Quantisierer der laufende Quantisierer ist.
  • Was den in 4b dargestellten Schritt 1010 betrifft, so wird darauf hingewiesen, dass die Berechnung des Filterungsfehlers im Frequenzbereich, also dem Fehler der Zerlegung/Wiederzusammensetzung in Unterbänder, insbesondere durchgeführt wird, wenn die verwendeten Filterbänke zu keiner vollkommenen Rekonstruktion gehören. Die Berechnung wird ein für alle Male, im Anschluss an die Wiederzusammensetzung der Gruppe der Unterbänder sb bei Nichtvorliegen von Quantisierung, und dann wird die Berechnung des Rekonstruktionsfehlers durchgeführt, der auf die Tatsache zurückzuführen ist, dass die Systeme zur Zerlegung und zur Wiederzusammensetzung zueinander nicht invers sind, wobei die Nennverzögerung der Aufeinanderfolge der Zerlegungen/Wiederzusammensetzungen berücksichtigt ist.
  • Der Schritt 1013 besteht im Grunde in ähnlicher Weise wie der Schritt 1013 von 3a für jedes Untersignal und jeden Quantisierer darin, die Anzahl von Bits zu berechnen, die erforderlich sind, um dieses quantisierte Untersignal mit dem betrachteten Quantisierer zu übertragen, sowie darin, den Fehler des Quantisierungsrauschens, nämlich den durch diese Operation erzeugten quadratischen Fehler zu berechnen.
  • Der Schritt 1014 wird durch ein Programm zur Sortierung der für jedes der Unterbänder sb möglichen Quantisierer durchgeführt. Im Verlauf dieser Operation werden die möglichen Quantisierer nach der Ordnung des quadratischen Quantisierungsfehlers klassifiziert, der anwachsend erzeugt wird, und die Quantisierer, die mehr Bits zum Schaffen von mehr Rauschen benötigen, werden eliminiert.
  • Was schließlich den Schritt 1015 anbetrifft, so wird die Initialisierung der Wahl der Quantisierer für jedes Unterband oder Untersignal sb mangels Berücksichtigung des Einflusses der anderen Unterbänder ausgeführt.
  • Gemäß einem ersten Initialisierungskriterium wird für jedes Untersignal der Quantisierer festgehalten, der mit der minimalen Anzahl von Bits das Untersignal in ein quantisiertes Signal transformiert, dessen Wahrnehmungsempfindung bis auf die differentielle Wahrnehmungsschwelle identisch ist.
  • Gemäß einem zweiten Initialisierungskriterium wird der Quantisierer festgehalten, der es mit der minimalen Anzahl von Bits erlaubt, auf Grund der Quantisierung des betrachteten Untersignals oder Unterbandes sb einen bei Vorliegen des Ursprungssignals in der Wahrnehmung undetektierbaren Fehler zu erzeugen.
  • Gemäß dem ersten und zweiten vorher erwähnten Kriterium wird selbstverständlich der beim Schritt 1010 berechnete Filterungsfehler berücksichtigt, indem dieser Fehler dem quantisierten Untersignal oder dem Fehlersignal hinzugefügt wird. Die beiden vorher erwähnten Kriterien erlauben es, einen laufenden Quantisierer für den betrachteten Rahmen jedes Unterbandes oder Untersignals sb zu erhalten. Beim zweiten vorhergehend erwähnten Kriterium wird darauf hingewiesen, dass sich das Kriterium der Undetektierbarkeit des quantisierten Untersignals auf die Wahrnehmungswerte des Quantisierungsrauschens bezieht.
  • Es wird ganz allgemein auch darauf hingewiesen, dass das den Gegenstand der vorliegenden Erfindung bildende Verfahren zur Kompressionscodierung eines digitalen Signals bei seiner zweiten Ausführungsart selbstverständlich mit konstanter Qualität durchgeführt werden kann, d. h. mit einem im wesentlichen konstanten Wahrnehmungsabstand, aber mit variabler Rate, oder dagegen mit konstanter Rate. Bei beiden vorher erwähnten Alternativen ist die angewandte Beschränkung unterschiedlich und entspricht entweder einem Wahrnehmungsabstandskriterium über den berechneten Wahrnehmungsabstand, um eine Qualitätsbedingung vorzuschreiben, oder dagegen einem Ratenbeschränkungskriterium, so wie es nachfolgend beschrieben wird.
  • Im Falle einer variablen Codierungsrate mit konstanter Qualität, so wie in 4b dargestellt, umfasst der Bi närzuweisungsprozess 102, so wie in Verbindung mit 4a dargestellt, die Durchführung des Unterschrittes 102a, der auf Grund des psychophysikalischen Moduls darin besteht, das Ursprungssignal so und das geschätzte codierte/decodierte Signal scde in den Satz der vorher erwähnten Wahrnehmungswerte zu transformieren. Es wird darauf hingewiesen, dass diese Operation für jeden Rahmen jedes Unterbandes oder Untersignals sb ausgeführt wird.
  • Der Schritt 102 zur iterativen Binärzuweisung umfasst auch den vorher in der Beschreibung erwähnten Unterschritt 102b, der, wie in 4b dargestellt, aus einem Schritt 1020 besteht, der darin besteht, über die Wahrnehmungswerte, d. h. über den Satz Werte, die sich auf das Ursprungssignal so und scde beziehen, den Wahrnehmungsabstand zwischen dem Ursprungssignal und dem nach Quantisierung rekonstruierten Signal unter Berücksichtigung des Filterungsfehlers der Zerlegung/Wiederzusammensetzung der Unterbänder-Signale zu berechnen.
  • Dem vorher erwähnten Schritt 1020 seinerseits folgt ein Schritt 1021 , der darin besteht, den berechneten Wahrnehmungsabstand einem Wahrnehmungsabstandskriterium zu unterziehen. Ganz allgemein wird darauf hingewiesen, dass das Wahrnehmungsabstandskriterium aus einem ganz einfachen Differenz- oder Fehlerkriterium zwischen homologen Wahrnehmungswerten des Ursprungssignals und des geschätzten codierten/decodierten Signals scde bestehen kann. Es kann sich z. B. auch auf eine lineare Kombination dieser homologen Werte beziehen.
  • Bei positiver Reaktion auf das durch einen Test beim vorher erwähnten Schritt 1021 durchgeführte Abstandskriterium ist der für das Untersignal oder das betrachtete Unterband und den entsprechenden Rahmen festgehaltene Quantisierer der laufende Quantisierer, der beim vorstehend erwähnten Initialisierungsschritt 1015 erhalten wird.
  • Bei negativer Reaktion auf den im Schritt 1021 ausgeführten Test folgt dagegen diesem Schritt ein Schritt 1022 , der darin besteht, für jedes Signal oder Unterband sb den Wahrnehmungsabstand über Verwendung eines zum laufenden Quantisierer benachbarten Quantisierer zu berechnen. Der Schritt 1022 besteht auch darin, den auf die Rate bezogenen Wahrnehmungsabstandsgewinn zu berechnen. In genauer Weise wird darauf hingewiesen, dass beim Schritt 1022 der gewählte benachbarte Quantisierer der Quantisierer ist, der die Anzahl von Bits umfasst, die unmittelbar größer als diejenige des laufenden Quantisierers ist. Außerdem ist der auf die Rate bezogene Wahrnehmungsabstandsgewinn der Gewinn ΔJ0/ΔR oder die marginale Veränderung des auf die Rate bezogenen Wahrnehmungsabstandes. Schließlich folgt dem Schritt 1022 seinerseits ein Schritt 1023 , der darin besteht, den laufenden Quantisierer zu wechseln, um den Quantisierer des Untersignals oder Unterbandes sb festzuhalten, der zur besten Verbesserung des auf die Rate bezogenen Wahrnehmungsabstandes führt, d. h. des vorhergehend erwähnten Gewinnes. Dem Schritt 1023 seinerseits folgt dann ein iterativer Aufruf 1024 , der es erlaubt, den betrachteten Rahmen erneut dem Test des Wahrnehmungsabstandskriteriums 1021 unter Berücksichtigung des beim Schritt 1023 gewählten Quantisierers zu unterziehen.
  • Was den vorher erwähnten Schritt angeht, so wird darauf hingewiesen, dass die Änderung des Quantisierers des Untersignals, der zur stärksten Wahrnehmungsabstandsverringerung geführt hat, durch Vergleich zwischen den verschiedenen Untersignalen oder Unterbändern durchgeführt wird, wobei für jedes Untersignal ein einziger neuer, zum laufenden Quantisierer benachbarter Quantisierer ausgewertet wird.
  • Was den Schritt 1022 betrifft, so wird darauf hingewiesen, dass die Berechnung des auf die Rate bezogenen Wahrnehmungsabstandsgewinns ΔJ/ΔR durch die Berechnung nur der Veränderung des Wahrnehmungsabstandes ΔJ ersetzt werden kann.
  • Eine detailliertere Beschreibung eines iterativen Binärzuweisungsprozesses mit konstanter Rate erfolgt nun in Verbindung mit 4c.
  • Entsprechend einer besonders vorteilhaften Gestaltung des Verfahrens zur Kompressionscodierung nach der vorliegenden Erfindung kann die Codierung mit konstanter Rate im Anschluss an die Durchführung des Schrittes 1015 von 4b direkt ausgeführt werden, nämlich im Gegensatz dazu ausgehend von einer Lösung, die von der optimalen Binärzuweisung bei variabler Rate stammt, so wie in 4b dargestellt, d. h. nach dem Schritt 1025 der vorher erwähnten Figur.
  • Auf jeden Fall entspricht beim Schritt 102, der sich auf die iterative Binärzuweisung bezieht, die Gesamtheit der in 4c dargestellten Schritte im wesentlichen den in 4b dargestellten Schritten, wobei das Wahrnehmungsabstandskriterium über den berechneten Wahrnehmungsabstand durch ein Ratenbeschränkungskriterium ersetzt wird.
  • Somit umfasst der in 4c dargestellte Schritt 102 zur iterativen Binärzuweisung in ähnlicher Weise wie derjenige in 3b einen Schritt 102'0 , der darin besteht, den Wahrnehmungsabstand zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten digitalen Signal scde unter Berücksichtigung des Filterungsfehlers, d. h. der Zerlegung/Wiederzusammensetzung in Unterbänder, zu berechnen.
  • Dem Schritt 102'0 seinerseits folgt ein Testschritt 102'1 , der darin besteht, den vorher erwähnten, berechneten Wahrnehmungsabstand einem Codierungsratenbeschränkungskriterium zu unterziehen.
  • Bei positiver Reaktion auf den Test des Schrittes 102'1 ist der für jedes Untersignal festgehaltene Quantisierer dann der beim Schritt 1015 oder gegebenenfalls am Ende des Schrittes 1025 bei Binärzuweisung mit variabler Rate, aber bei konstanter Qualität gewählte, laufende Quantisierer.
  • Bei negativer Reaktion auf den beim Schritt 102'1 ausgeführten Test folgt diesem Schritt ein Schritt 102'2 , der darin besteht, für jedes Untersignal den Wahrnehmungsabstand bei der Verwendung eines zum laufenden Quantisierer benachbarten Quantisierer für das Unterband und den betrachteten Rahmen zu berechnen. In einem solchen Fall wird darauf hingewiesen, dass der zum laufenden Quantisierer benachbarte Quantisierer der Quantisierer ist, der die Anzahl von Bits trägt, die unmittelbar kleiner ist als diejenige des laufenden Quantisierers für das betrachtete Unterband. Der Schritt 102'2 besteht auch darin, die auf die Rate bezogene marginale Wahrnehmungsabstandsveränderung, d. h. einen ebenfalls mit ΔJ/ΔR bezeichneten Verlust oder negativen Gewinn, zu berechnen. Dem Schritt 102'2 seinerseits folgt dann ein Schritt 102'3 , der darin besteht, den Quantisierer eines Untersignals, insbesondere denjenigen, zu wechseln oder festzuhalten, der zur schwächsten Steigerung des Wahrnehmungsabstandes geführt hat, der auf die Ratenänderung bezogen ist, die durch die Veränderung des laufenden Quantisierers verursacht wird. Dem Schritt 102'3 folgt dann ein durch 102'4 dargestellter iterativer Aufruf, der es erneut erlaubt, die berechneten Wahrnehmungswerte unter Berücksichtigung der Wahl des festgehaltenen benachbarten Quantisierers dem Test des Schrittes 102'1 zur Codierungsratenbeschränkung zu unterziehen. Selbstverständlich wird der iterative Aufruf fortgeführt, solange das Kriterium des Tests des Schrittes 102'1 nicht erfüllt ist.
  • Das den Gegenstand der vorliegenden Erfindung bildende Verfahren zur Kompressionscodierung eines digitalen Signals ist in seiner zweiten Ausführungsart auf Grund der Tatsache besonders bemerkenswert, dass es eine sehr erhebliche Verringerung des Rechenumfangs wegen der Zusammenfassung der Optimierungstechniken unter Bedingungen erlaubt, die getrennt von den Beschränkungskurven des Standes der Technik und vom eigentlichen iterativen Binärzuweisungsprozess zugeführt werden, der im Rahmen des den Gegenstand der Erfindung bildenden Verfahrens definiert ist.
  • Diese Zusammenfassung wird im Bereich des psychophysikalischen Moduls Ψ bewerkstelligt, der in Beziehung mit einem psychoakustischen bzw. psychovisuellen Modul mehr ins Einzelne gehend in Verbindung mit den 4d und 4e beschrieben wird.
  • Unter Bezugnahme auf 4d wird darauf hingewiesen, dass ein psychoakustischer Modul im Grunde ein Ohrmodell bildet, das es erlaubt, die Schallwahrnehmung des Ursprungssignals im Bereich des Hörnervs darzustellen. Ein Ohrmodellbeispiel simuliert das äußere Ohr und das Mittelohr, indem sie an eine lineare Filterung angepasst werden. Dann berechnet es die Energieverteilung in den Hörfiltern gemäß einer Bank von nichtlinearen Hörfiltern. Die nichtlinearen Hörfilter liefern die Wahrnehmungswerte, die mit P0, Pj bis PN–1 be zeichnet sind. Diese Werte werden unter Berücksichtigung der absoluten Hörschwellenkurve, der zeitweisen Maskierung, des tonalen/nicht tonalen Charakters der Signale und der vorher erwähnten Wahrnehmungswerte berechnet, d. h. dass die Hörempfindung berechnet wird, wobei diese Hörempfindung z.B, durch die Schallstärke in jedem Punkt der Basilarmembran in der Schnecke bestimmt werden kann. In 4d ist außerdem die Übertragungsfunktion eines nichtlinearen Hörfilters dargestellt, welche die Abszisseneinteilung in Bark und eine Ordinateneinteilung in Schallenergie enthält. Der Teil mit gestrichelten Linien der Übertragungsfunktion eines nichtlinearen Hörfilters entspricht der Variation dieser Übertragungsfunktion auf Grund des Energiepegels des einfallenden Signals. In einer spezifischen Ausführungsform wurde die durch die Bank von nichtlinearen Hörfiltern dargestellte Schnecke des menschlichen Ohres durch eine Anzahl von 50 Filtern simuliert, die als Hörfilterbänke angelegt sind.
  • Man versteht somit, dass z. B. bei dem in 4d dargestellten psychoakustischen Modul die Maskierungskurve nach dem Stand der Technik, die bei der ersten Ausführungsart im Zusammenhang mit der Kontrolle des Rekonstruktionsfehlers im Frequenzbereich verwendet wird, im Grunde im Bereich jedes Hörfilters integriert wird. Jedoch ist die entsprechende Maskierung nicht in jedem Filter identisch.
  • Man versteht insbesondere, dass der Einsatz von psychoakustischen Modulen somit eine bessere Modellierung des Ohres gestattet, wobei der Berechnungsumfang verringert wird und dieser auf das reduziert wird, was durch die Anzahl von Hörfiltern dargestellt wird, die zum Ausführen der Modellierung des Ohres benutzt werden.
  • Was das psychovisuelle Modell betrifft, wie es in 4e dargestellt ist, so kann dieses ausgehend vom Lu minanzdifferenzsignal zwischen dem Ursprungsbildsignal so und dem geschätzten codierten/decodierten Bildsignal scde durchgeführt werden, das dann einer Fourier-Transformation, wie z. B. einer schnellen Fourier-Transformation, unterzogen wird. Das sich ergebende Signal wird dann danach einer Filterung durch eine Filterbank unterzogen, die die Sehfilter über jedes der entsprechenden Frequenzbänder simuliert. Diese Sehfilter sind in erster Analyse mit den Hörfiltern vergleichbar, weisen aber keine ähnlichen Nichtlinearitäten auf.
  • Für eine detailliertere Beschreibung dieser Art von psychovisuellem Modul könnte man zweckmäßig auf den von A. Saadane, H. Senane und D. Barba veröffentlichten Artikel mit dem Titel "Quantificateur psychovisuel et schémas de codage associés", Journées "Nouvelles Techniques de Compression et de Représentation des Signaux" zurückgreifen, der durch das CCETT, 4, Rue du Clos-Courtel, B.P.59, 35512 CESSON-SEVIGNE CEDEX, France im Januar 1995 veröffentlicht wurde.
  • Im Falle eines psychovisuellen Modells, wie z. B. in 4e dargestellt, ist dann die Schätzung des Wahrnehmungsabstandes zwischen dem durch das Ursprungssignal präsentierten Bild und dem codierten/decodierten Bild die folgende:
    • – Berechnung der psychovisuellen Schwelle in Abhängigkeit vom durch das Ursprungssignal dargestellten Bild für jedes durch die Sehfilter gelieferte Wahrnehmungsband;
    • – Schätzung des Spektrums der Differenz so wie vorhergehend in der Beschreibung beschrieben;
    • – Berechnung der Energie der Differenz über jedes der Wahrnehmungsbänder durch Summierung der Linien des Spektrums, die zum betrachteten Frequenzband gehören;
    • – für jedes der Wahrnehmungsbänder, d. h. der jedem Sehfilter entsprechenden Bänder, Vergleich der Energie des Spektrums mit der psychovisuellen Schwelle und Berücksichtigung als Wahrnehmungsabstand der größten Überschreitung.
  • Diese Betriebsart erlaubt das direkte Umsetzen des erfindungsgemäßen Verfahrens zur Kompressionscodierung eines videodigitalen Signals. In einem solchen Fall ist es also möglich, Filterbänke zur nicht vollkommenen Rekonstruktion mit psychovisuellen Kriterien zu verwenden, wie sie vorhergehend definiert worden sind. Diese Betriebsart erlaubt somit das Arbeiten bei kritischer Abtastung mit einer guten räumlichen Lokalisierung der Zerlegung und sogar das Sicherstellen der Kompatibilität des Prozesses mit anderen Bildcodierern, in welchen die Wahl der Quantisierungsschritte mit den gleichen psychovisuellen Regeln nicht erstellt würde.
  • Eine detailliertere Beschreibung einer Vorrichtung zur Kompressionscodierung eines digitalen Audiofrequenz- oder Videofrequenzsignals erfolgt nun in Verbindung mit den 5a und 5b in Beziehung mit einem Prozess zur Kontrolle des Endrekonstruktionsfehlers im Frequenzbereich bzw. im Wahrnehmungsbereich.
  • Eine Gegenstand der vorliegenden Erfindung bildende Vorrichtung zur Kompressionscodierung eines digitalen Signals mit Endrekonstruktionskontrolle, die die Durchführung des Codierungsverfahrens im vorher in der Beschreibung beschriebenen Frequenzbereich erlaubt, erfolgt nun in Verbindung mit 5a.
  • Es wird darauf hingewiesen, dass in herkömmlicher Weise die Gegenstand der vorliegenden Erfindung bildende Vorrichtung eine mit 1 bezeichnete Analysefilterbank umfasst, die das Ursprungssignal so empfängt, wobei diese Analysefilterbank 1 das Durchführen einer Zerlegung in Frequenzunterbänder dieses Ursprungssignals gemäß einer bestimmten Pflasterung von Unterbändern erlaubt, die mit sb bezeichnet sind.
  • Die Vorrichtung gemäß der Erfindung enthält auch einen Modul 2 zum Auswählen von Quantisierern und einen mit 3 bezeichneten Modul zur Endquantisierung, der die Signale in den Unterbändern sb empfängt, wobei dieser Endquantisierungsmodul 3 durch den Modul 2 zum Auswählen von Quantisierern gesteuert wird. Der Modul 3 liefert selbstverständlich das codierte Signal sc, ausgehend von den Signalen in den Unterbändern sb, wobei dieses codierte Signal, so wie vorhergehend in der Beschreibung beschrieben worden ist, entsprechend dem beschriebenen Verfahren in seiner ersten Ausführungsart quantisiert wird.
  • Gemäß einer besonders bemerkenswerten Gestaltung der Vorrichtung, die Gegenstand der vorliegenden Erfindung ist, wie sie in 5a dargestellt ist, erlaubt der Modul 2 zum Auswählen von Quantisierern für jedes Untersignal sb das Durchführen einer Binärzuweisung und einer Quantisierung in Abhängigkeit dieser Zuweisung.
  • Zu diesem Zweck umfasst der Modul 2 einen Untermodul 21 zur Schätzung der Differenz zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten Signal, das mit scde bezeichnet ist, so wie vorhergehend in der Beschreibung beschrieben worden ist. Der Modul 21 zur Schätzung dieser Differenz liefert eine geschätzte Differenz, wobei diese geschätzte Differenz eine Funktion des Filterungsfehlers der Zerlegung in Unterbänder und des Quantisierungsfehlers jedes Untersignals ist.
  • Außerdem umfasst der Modul 2 zum Auswählen von Quantisierern auch einen Modul 22 zur eigentlichen iterativen Binärzuweisung, der es erlaubt, nach Abstandsbeschränkungskriterium zwischen dem codierten/decodierten digitalen Signal scde und dem Ursprungssignal bzw. Codierungsratenbeschränkung und Berechnung des Codierungsgesamtfehlers für eine laufende Binärzuweisung eine benachbarte Zuweisung durch Änderung des laufenden Quantisierers von einem der Untersignale oder Unterbänder zu Gunsten eines benachbarten Quantisierers zu erstellen, wobei dieser Prozess die Zuteilung einer optimalen Binärzuweisung erlaubt.
  • So wie in 5a dargestellt, wird darauf hingewiesen, dass der Modul 21 zur Schätzung der Differenz zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten Signal scde in Hinsicht auf das Ausführen einer iterativen Binärzuweisung, die nach dem Wahrnehmungsabstandsbeschränkungskriterium im Frequenzbereich geführt wird, wenigstens einem Modul 210 umfasst, der es erlaubt, den Quantisierungsfehler und die geschätzte Rate zu berechnen, die auf die Quantisierung für jedes Unterband und jeden Quantisierer einer gegebenen Vielzahl von Quantisierern zurückzuführen ist. Dieser Berechnungsmodul 210 empfängt die Gesamtheit der durch die Analysefilterbank 1 gelieferten Untersignale und liefert für jedes Untersignal sb und jeden Quantisierer einen Satz von Werten ev, die für die Rate und den quadratischen Quantisierungsfehler für jeden verfügbaren Quantisierer repräsentativ sind, für jedes Frequenzunterband sb und für den betrachteten Abtastprobenrahmen.
  • So wie man in 5a wahrnehmen wird, umfasst der Modul 21 zur Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten/decodierten Signal außerdem einen Synthesefilterungsmodul 211. Der Synthesefilterungsmodul 211 empfängt die Gesamtheit der Untersignale oder Unterbänder sb, die durch den Modul 1 zur Analysefilterung geliefert wird, und liefert das vorher erwähnte, geschätzte codierte/decodierte Signal scde.
  • Außerdem umfasst der Modul 21 zur Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten/decodierten Signal einen Subtrahierer-Modul 212, der das Ursprungssignal so sowie das geschätzte codierte/decodierte Signal scde empfängt, das durch den Synthesefilterungsmodul 211 geliefert wird. Der Subtrahierer-Modul 212 liefert somit ein Differenzsignal, das mit sd bezeichnet ist.
  • So wie außerdem in 5a dargestellt ist, wird darauf hingewiesen, dass der Subtrahierer-Modul 212 im Grunde in einem mit 212a bezeichneten, eigentlichen Subtrahierer bestehen kann, der das Ursprungssignal so und das geschätzte codierte/decodierte Signal scde empfängt und ein rohes Differenzsignal liefert, wobei diesem Modul 212a ein Modul zur Berechnung der schnellen Fourier-Transformation FFT folgt, dem eine Glättungsfunktion beigefügt ist, die das rohe Differenzsignal empfängt und das vorhergehend erwähnte Differenzsignal sd liefert. Der Modul zur schnellen Fourier-Transformation FFT und zur Glättung trägt das Bezugszeichen 212b.
  • Schließlich umfasst der Modul 21 zur Schätzung der Differenz zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten Signal scde, so wie in 5a dargestellt, einen Modul zur psychophysikalischen Analyse, der mit 213 bezeichnet ist, wobei dieser Modul eine Wahrnehmungsanalyse des Ursprungssignals so erlaubt und das Interpretieren dieses Ursprungssignals entsprechend einem Wahrnehmungsbeschränkungsgesetz im Frequenzbereich gestattet. Der Modul zur psychophysikalischen Analyse liefert dann ein interpretiertes Ursprungssignal, das mit soi bezeichnet ist.
  • Schließlich umfasst der Modul 21 eine Schaltung nach Art eines Subtrahierers, die das interpretierte Ursprungssignal soi und das Differenzsignal sd empfängt und ein korrigiertes Wahrnehmungsbeschränkungssignal sdcpc liefert. Das korrigierte Wahrnehmungssignal sdcpc und der Satz von Werten ev, der durch den Modul zur Berechnung des Fehlers und der Rate für jedes Unterband und jeden Quantisierer geliefert wird, werden an den Modul 22 zur iterativen Binärzuweisung geliefert, um die iterative Binärzuweisung auszuführen, so wie vorhergehend in der Beschreibung in Verbindung mit 3a beschrieben wurde.
  • Was den Modul 22 zur iterativen Binärzuweisung betrifft, so wird darauf hingewiesen, dass dieser zumindest einen Modul 220 zur Berechnung der spektralen Gesamtleistungsdichte des auf die Quantisierung zurückzuführenden Rekonstruktionsfehlers und einen Modul 221 zur Diskriminierung enthält, ausgehend von einer laufenden Binärzuweisung einer spezifischen Binärzuweisung, die das Durchführen entweder einer Binärzuweisung mit konstanter Qualität, aber variabler Rate, oder eine Zuweisung mit konstanter Rate erlaubt, so wie in der Beschreibung vorher beschrieben.
  • Es wird daran erinnert, dass die spezifische Binärzuweisung nach Beschränkungskriterien der spektralen Gesamtleistungsdichte des wiederberechneten Rekonstruktionsfehlers durchgeführt wird. Für jedes Untersignal ist diese spezifische Binärzuweisung identisch zur laufenden Binärzuweisung bei positiver Reaktion auf das vorher erwähnte Kriterium, und bei negativer Reaktion auf dieses Kriterium unterscheidet sich die spezifische Binärzuweisung von der laufenden Binärzuweisung, die einem Quantisierer des Untersignals entspricht, der zur besten Verbesserung des auf die Ratenvariation bezogenen Wahrnehmungsabstandes führt. Diese Zuordnung wird für jedes Untersignal oder Unterband sb nach dem Berechnungskriterium der spektralen Leistungsdichte dieses Fehlers bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers und Berechnung des Wahrnehmungsabstands im Verhältnis zur entsprechenden Codierungsrate erstellt.
  • Man versteht natürlich, dass der Modul zur Berechnung der spektralen Gesamtleistungsdichte des auf die Quantisierung zurückzuführenden Rekonstruktionsfehlers z. B. ein Rechenprogramm über jeden Rahmen jedes Unterbandes durchführt, das es erlaubt, diese Berechnung entsprechend der Beziehung (3) auszuführen.
  • Was den vorher erwähnten Modul zur Diskriminierung betrifft, die von der laufenden Binärzuweisung ausgeht, so wird darauf hingewiesen, dass dieser ein Programm in Form einer Software durchführt, deren Ablaufdiagramm für die Binärzuweisung mit konstanter Qualität und mit variabler Rate selbstverständlich demjenigen der 3a bzw. für die Binärzuweisung mit konstanter Rate der 3b entspricht.
  • Was die Vorrichtung zur Kompressionscodierung eines digitalen Signals betrifft, die sich auf die zweite Ausführungsart des den Gegenstand der Erfindung bildenden Codierungsverfahrens im Wahrnehmungsbereich bezieht, wie in 5b dargestellt, so wird darauf hingewiesen, dass diese Elemente enthält, die ähnlich sind und das gleiche zahlenmäßige Bezugszeichen wie diejenigen der 5a tragen, aber wesentlich vereinfacht im Vergleich mit dieser Vorrichtung erscheint.
  • Die Vorrichtung enthält in diesem Fall, so wie in der vorher erwähnten Figur dargestellt, die Analysefilterbank 1 und den Endquantisierungsmodul 3.
  • Was indessen den Modul 21 zur Schätzung der Differenz zwischen geschätztem codierten/decodierten Signal und Ursprungssignal scde und so angeht, erscheint dieser vereinfacht in der Maßnahme, mit der zum einen die Funktion der schnellen Fourier-Transformation und Glättung 212b weggelassen ist und mit der zum anderen der psychophysikalische Modul 213 vom vorher erwähnten Modul 21 fortgelassen und in den Bereich des eigentlichen Binärzuweisungsmodul 22 verschoben ist. Wie in 5b dargestellt ist, wird jedoch im Modul 21 der Modul 210 zur Berechnung des Quantisierungsfehlers und der geschätzten Rate, auf Grund der Quantisierung, für jedes Untersignal oder Unterband sb und für jeden Quantisierer der Gesamtheit der verfügbaren Quantisierer beibehalten, wobei dieser Modul 210 die Gesamtheit der durch den Analysefilterungsmodul gelieferten Untersignale oder Unterbänder empfängt und für jedes Untersignal und jeden Quantisierer einen Satz von Werten ev der Rate und des Quantisierungsfehlers z. B. in Form eines quadratischen Fehlers und zur Quantisierung liefert. Dieser Satz von Werten ist in gleicher Weise wie im Falle der 5a mit ev bezeichnet.
  • Ebenso wie in 5a wird der Synthesefilterungsmodul 211, der identisch zu demjenigen der 5a ist, beibehalten, wobei dieser Synthesefilterungsmodul das geschätzte codierte/decodierte Signal scde liefert, das vorher in der Beschreibung beschrieben wurde.
  • Außerdem wird bei der in 5b dargestellten Vorrichtung, bei der die Funktion 212b zur schnellen Fourier-Transformation und zur Glättung fortgelassen ist, der Modul 212, also der Subtrahierer-Modul, beibehalten, allerdings auf einen einfachen eigentlichen Subtrahierer 212a reduziert, der zum einen das Ursprungssignal so und zum anderen das geschätzte codierte/decodierte Signal scde, das durch die Synthesefilterbank 211 geliefert wird, empfängt und das vorher in der Beschreibung beschriebene Differenzsignal sd liefert. Zum Berechnen der Wahrnehmungswerte der Signaldifferenz sd nämlich ist es nicht erforderlich, diese zuvor zu glätten.
  • Im Gegensatz zur Ausführungsart der 5a empfängt der Modul 22 zur iterativen Binärzuweisung bei der Ausführungsart der 5b das Ursprungssignal so, das vorher erwähnte Differenzsignal sd und den Satz von Werten ev, der durch den Modul 210 zur Berechnung des Fehlers und der Rate für jedes Unterband und jeden verfügbaren Quantisierer geliefert wird.
  • So wie in 5b dargestellt, enthält schließlich der Modul 22 zur iterativen Binärzuweisung in besonders bemerkenswerter Weise einen psychophysikalischen Modul 222, der das Ursprungssignal empfängt und das Transformieren jedes der Untersignale sb in eine Vielzahl von Wahrnehmungswerten erlaubt, nämlich die vorher in der Beschreibung beschriebenen Werte P0 bis PN–1, und zwar in Verbindung mit den 4d und 4e und den vorher erwähnten Wahrnehmungsbereich darstellend. Dank des psychophysikalischen Moduls 222 wird jedes Untersignal oder Unterband sb in eine Vielzahl von Wahrnehmungswerten transformiert, die für die physiologische Wirkung repräsentativ sind, die durch das Ursprungssignal und das wahrgenommene codierte/decodierte Signal erzeugt wird, wobei diese Wahrnehmungswerte selbstverständlich den Wahrnehmungsbereich darstellen.
  • Der Modul 22 enthält auch einen Modul 220 zur Berechnung des Wahrnehmungsabstandes, der über diese Wahrnehmungswerte zwischen dem Ursprungssignal so und dem geschätzten codierten/decodierten Signal scde unter Berücksichtigung des Filterungsfehlers der Zerlegung in Frequenzunterbänder berechnet wird.
  • Er enthält auch einen Modul 221 zur Diskriminierung, ausgehend von einer laufenden Binärzuweisung einer spezifischen Binärzuweisung nach einem Wahrnehmungsabstandsbeschränkungskriterium dieses berechneten Wahrnehmungsabstandes. Diese spezifische Binärzuweisung für jedes Untersignal oder Unterband sb ist identisch zur laufenden Binärzuweisung bei positiver Reaktion auf dieses Beschränkungskriterium. Sie unterscheidet sich dagegen bei negativer Reaktion auf dieses Beschränkungskriterium der laufenden Binärzuweisung und entspricht dann einem Quantisierer des Untersignals, der zur besten Verbesserung des auf die Codierungsrate bezogenen, berechneten Wahrnehmungsabstandes bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers führt.
  • Was den Einsatz der Module 220 und 221 betrifft, so versteht man, dass diese in Softwareform ausgeführt werden, z. B. durch Einsatz eines Programmes, dessen Ablaufplan demjenigen der vorhergehend in der Beschreibung beschriebenen 4b und 4c entspricht.
  • Bei den beiden Ausführungsarten der Gegenstand der vorliegenden Erfindung bildenden Vorrichtung, so wie sie in den 4b und 4c dargestellt sind, können schließlich die für die Analysefilterbank 1 oder die Synthesefilterbank 211 verwendeten Filter, so wie in 5c dargestellt, durch Wavelets-Filter im Falle einer Komprimierung durch Wavelets-Pakete gebildet werden, wobei die Dämpfung des Filters an der Ordinate in Dezibel aufgetragen ist, wogegen an der Abszisse die Frequenzlinien einer schnellen Fourier-Transformation von 1024 bis 512 Linien dargestellt sind. Die verwendete Filterbank ist nicht ideal. Jedes Filter weist einen breiteren Träger als sein Nennträger auf und demzufolge tragen mehrere Untersignale zur Rekonstruktion ein und derselben Frequenzlinie bei. Eine solche Verwendung wird dank Durchführung des den Gegenstand der vorliegenden Erfindung bildenden Verfahrens möglich gemacht. Für eine vollständigere Beschreibung dieses Filtertyps kann zweckmäßig auf den von P. Philippe, F. Moreau de Saint-Martin et al. veröffentlichten Artikel mit dem Titel "A relevant criterion for wavelet filters in audiocompression" in Proceedings of 8th Convention of the AES, Paris, 1995 zurückgegriffen werden.
  • Was die Durchführung des Verfahrens und der Vorrichtung zur Codierung, die Gegenstand der vorliegenden Erfindung sind, in der zweiten Ausführungsart und entsprechend der 5b im Wahrnehmungsbereich angeht, wenn das Signal ein Audiofrequenzsignal ist, so wird darauf hingewiesen, dass die psychoakustischen Modelle oder Ohrmodelle, die verwendet werden können, z. B. folgende sind:
    • – das Modell POM, so wie beschrieben von C. Colomes, "Etude d'un modèle d'audition et d'une mesure objective de la qualité d'un signal sonore dans le context du codage à réduction de débit", Thèse de l'Université de Rennes I, 1994;
    • – PAQM, beschrieben von J. G. Beerends und J. A. Stemerdink, "A Perceptual audioquality measure based on a psychoacoustic sound", Journal of the AES, vol. 40, N° 12, 963–978;
    • – PERCEVAL, beschrieben von B. Paillard, P. Mabillau, S. Morisette und J. Soumagne, "PERCEVAL: Perceptual Evaluation of the quality of audiosignals", Journal of the AES, vol. 40, N° 1/2, 21–31, 1992.
  • Es wird darauf hingewiesen, dass in den vorher erwähnten Fällen das Ohrmodell oder psychoakustische Modell in dem Maße gut angepasst erscheint, in dem das Ohrmodell darin besteht, eine Maskierungskurve im Bereich des Ohres, d. h. im Wahrnehmungsbereich, mit der Signalstärke im Bereich des In nenohres, d. h. nach Filterung durch die durch die linearen Filter modellierten Filter des Ohres, zu vergleichen. Somit hat der Beitrag des in ein Unterband injizierten Rauschens einen linearen Einfluss auf jede der Komponenten des Signals im Bereich des Ohres, da dieses Rauschen aus dem Ergebnis der Filterungen durch die Synthesefilter und durch die Ohrfilter hervorgeht. Mit anderen Worten, das Prinzip, das es erlaubt hat, die Leistung des Rauschens in jeder Spektrallinie zu berechnen, erlaubt das genaue Berechnen der Leistung jeder der Komponenten des Signals im Bereich des Ohres. Für jede Komponente ist die Rauschleistung eine lineare Kombination der Quantisierungsrauschleistungen in den Unterbändern. Die Koeffizienten dieser linearen Kombination hängen nur von den Synthesefiltern der verwendeten Filterbank und den Filtern des Ohres ab. In diesem Fall ist der Binärzuweisungsprozess eine direkte Erweiterung des Prozesses, der im Frequenzbereich beschrieben worden ist. Eine solche Betriebsart zeigt somit, dass für die vorher erwähnten Ohrmodelle die Komplexität der Binärzuweisung im wesentlichen die gleiche ist, sogar geringer als diejenige der Binärzuweisung im Frequenzbereich.

Claims (16)

  1. Verfahren zur Kompressionscodierung eines digitalen Signals mit Endrekonstruktionskontrolle, bei dem ein durch eine Aufeinanderfolge von Abtastprobenrahmen gebildetes, digitales Ursprungssignal einer Untersignale bildenden Zerlegung in Unterfrequenzbänder und für jedes Untersignal einem Binärzuweisungs- und danach in Abhängigkeit dieser Zuweisung einem Quantisierungsprozess unterzogen wird, um ein codiertes digitales Signal zu erzeugen, dadurch gekennzeichnet, dass das Verfahren wenigstens die Schritte umfasst, die darin bestehen, dass durchgeführt werden: – eine erste Schätzung eines codierten und decodierten digitalen Signals (scde) – eine Schätzung der Differenz zwischen dem Ursprungssignal (s0) und dem geschätzten codierten-decodierten digitalen Signal, wobei die geschätzte Differenz eine Funktion des Filterungsfehlers der Zerlegung in Unterfrequenzbänder und des Quantisierungsfehlers für eine Vielzahl von Quantisierern in jedem Untersignal ist; – und eine iterative Binärzuweisung nach einem Abstandsbeschränkungskriterium zwischen dem geschätzten codiertendecodierten digitalen Signal und dem Ursprungssignal bzw. nach einer Codierungsratenbeschränkung mit Berechnung des Codierungsgesamtfehlers, die darin besteht, für einen laufenden Quantisierer und einen benachbarten Quantisierer aus der Vielzahl von Quantisierern einen optimalen Quantisierer zuzuweisen, um den Abstand und/oder den Codierungsfehler zu reduzieren und die erste Schätzung des codierten-decodierten Signals zu verfeinern.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die iterative Binärzuweisung nach dem Abstandsbeschrän kungskriterium im Frequenzbereich ausgeführt wird, wobei jedes Untersignal einem durch Zerlegung in Frequenzunterbänder erhaltenen Frequenzunterband entspricht, und zwar mit variabler Codierungsrate oder mit Beschränkung auf eine konstante Rate.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten-decodierten digitalen Signal für eine Kontrolle des Rekonstruktionsfehlers im Frequenzbereich die aufeinanderfolgenden Schritte umfasst, die darin bestehen, dass – der Filterungsfehler berechnet wird, der durch die Zerlegung in Frequenzunterbänder und durch die Wiederzusammensetzung dieser Frequenzunterbänder erzeugt wird; – ein Wahrnehmungsbeschränkungsgesetz im Frequenzbereich erstellt wird; – ausgehend vom genannten Wahrnehmungsbeschränkungsgesetz und vom genannten Filterungsfehler eine korrigierte Wahrnehmungsbeschränkung berechnet wird, und für jedes Untersignal: – für jeden Quantisierer der Vielzahl von Quantisierern die Anzahl von möglichen zugewiesenen Bits und der auf das Quantisierungsrauschen zurückzuführende quadratische Fehler berechnet werden; – eine Sortierung der Quantisierer in Abhängigkeit vom quadratischen Fehler des Quantisierungsrauschens durchgeführt wird; – die Wahl wenigstens eines Quantisierers aus den Quantisierern initialisiert wird.
  4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass im Fall einer variablen Codierungsrate die genannte iterative Binärzuweisung darin besteht, dass: – die spektrale Gesamtleistungsdichte des auf die Quantisierung zurückzuführenden Rekonstruktionsfehlers berechnet wird; – die berechnete spektrale Gesamtleistungsdichte des Rekonstruktionsfehlers dem Frequenzbeschränkungskriterium unterzogen wird und bei positiver Reaktion auf dieses Kriterium der laufende Quantisierer als Quantisierer für jedes Untersignal festgehalten wird, und bei negativer Reaktion auf dieses Kriterium – für jedes Untersignal die spektrale Leistungsdichte des Gesamtfehlers bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers berechnet wird und der Wahrnehmungsabstandsgewinn in Bezug auf die entsprechende Codierungsrate berechnet wird; – der Quantisierer des Untersignals geändert wird, der zur besten Verbesserung des auf die Ratenvariation bezogenen Wahrnehmungsabstandes führt, was es erlaubt, die Binärzuweisung zu einer optimalen Zuweisung zu bringen.
  5. Verfahren nach einem der Ansprüche 2, 3 oder 4, dadurch gekennzeichnet, dass dieses im Fall einer festen Codierungsrate darin besteht, dass – die spektrale Gesamtleistungsdichte des auf die Quantisierung zurückzuführenden Rekonstruktionsfehlers berechnet wird; – die berechnete spektrale Gesamtleistungsdichte des Rekonstruktionsfehlers dem Codierungsratenbeschränkungskriterium unterzogen wird und bei positiver Reaktion auf dieses Kriterium der laufende Quantisierer als Quantisierer für jedes Untersignal festgehalten wird, und bei negativer Reaktion auf dieses Kriterium – für jedes Untersignal die spektrale Leistungsdichte des Gesamtfehlers bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers berechnet wird und die Wahrnehmungsabstandsveränderung in Bezug auf die Rate berechnet wird; – der Quantisierer des Untersignals geändert wird, der zur schwächsten Veränderung des auf die Rate bezogenen Wahrnehmungsabstandes führt.
  6. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die iterative Binärzuweisung nach dem Abstandsbeschränkungskriterium im Wahrnehmungsbereich ausgeführt wird, wobei der Schritt zur Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codierten-decodierten digitalen Signal ausgehend von einem psychophysikalischen Modul erstellt wird, wobei der psychophysikalische Modul das Berechnen einer Vielzahl von für die durch das Ursprungssignal erzeugte, physiologische Wirkung repräsentativen Wahrnehmungswerten und das Schätzen einer Vielzahl von für die physiologische Wirkung des geschätzten codierten-decodierten digitalen Signals repräsentativen Wahrnehmungswerten unter Kenntnis des Ursprungssignals, der geschätzten Differenz und der Quantisierungsfehler jedes Untersignals erlaubt, wobei die Wahrnehmungswerte den Wahrnehmungsbereich darstellen.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass für eine Kontrolle des Endrekonstruktionsfehlers im Wahrnehmungsbereich der Schritt der Schätzung der Differenz zwischen dem geschätzten codierten-decodierten digitalen Signal und dem Ursprungssignal die aufeinanderfolgenden Schritte umfasst, die darin bestehen, dass: – der Zerlegungsfilterungs- und Analysefehler der Frequenzunterbänder berechnet wird, und für jedes Untersignal – für jeden Quantisierer der Vielzahl von Quantisierern die Anzahl von möglichen zugewiesenen Bits und der auf die Quantisierung zurückzuführende quadratische Fehler berechnet werden, – eine Sortierung der Quantisierer in Abhängigkeit vom auf die Quantisierung zurückzuführenden quadratischen Fehler durchgeführt wird, – die Wahl wenigstens eines Quantisierers aus den sortierten Quantisierern initialisiert wird.
  8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass der Schritt der Initialisierung der Wahl wenigstens eines Quantisierers für jedes Untersignal darin besteht, den Quantisierer auszuwählen, der für eine minimale Anzahl von Bits dieses Untersignal in ein quantisiertes Untersignal umwandelt, dessen Satz von Wahrnehmungswerten bis auf die differentiellen Wahrnehmungsschwellen im wesentlichen identisch ist.
  9. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass der Schritt zur Initialisierung der Wahl wenigstens eines Quantisierers darin besteht, den Quantisierer auszuwählen, der für eine minimale Anzahl von Bits dieses Untersignal in ein quantisiertes Untersignal umwandelt, dessen Fehler in Bezug auf dieses Untersignal bei Vorliegen des digitalen Ursprungssignals undetektierbar ist, wobei das Kriterium der Undetektierbarkeit des quantisierten Untersignals auf den Wahrnehmungswerten Quantisierungsrauschen trägt.
  10. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass im Falle einer variablen Codierungsrate die iterative Binärzuweisung darin besteht, dass: – über die Wahrnehmungswerte der Wahrnehmungsabstand zwischen dem Ursprungssignal und dem nach Quantisierung rekonstruierten Signal unter Berücksichtigung des Zerlegungsfilterungs- und Analysefehlers berechnet wird, – der berechnete Wahrnehmungsabstand einem Wahrnehmungsabstandskriterium unterzogen wird und bei positiver Reak tion auf dieses Kriterium als Quantisierer für jedes Untersignal der laufende Quantisierer festgehalten wird, und bei negativer Reaktion auf dieses Kriterium – für jedes Untersignal der Wahrnehmungsabstand bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers berechnet wird und der Gewinn des auf die Rate bezogenen Wahrnehmungsabstands berechnet wird; – der Quantisierer des Untersignals geändert wird, der die beste Verbesserung des auf die Rate bezogenen Wahrnehmungsabstandes ergibt, was es erlaubt, die Binärzuweisung auf eine optimale Zuweisung zu bringen.
  11. Verfahren nach einem der Ansprüche 7 oder 10, dadurch gekennzeichnet, dass dieses im Falle einer festen Codierungsrate darin besteht, dass: – der Wahrnehmungsabstand zwischen dem Ursprungssignal und dem codierten-decodierten digitalen Signal unter Berücksichtigung des Filterungsfehlers berechnet wird, – der berechnete Wahrnehmungsabstand einem Codierungsratenbeschränkungskriterium unterzogen wird und bei positiver Reaktion auf dieses Kriterium als Quantisierer für jedes Untersignal der laufende Quantisierer festgehalten wird, und bei negativer Reaktion auf dieses Kriterium – für jedes Untersignal der Wahrnehmungsabstand bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers berechnet wird und die Veränderung des auf die Rate bezogenen Wahrnehmungsabstandes berechnet wird, – der Quantisierer des Untersignals geändert wird, der die schwächste Veränderung des auf die Rate bezogenen Wahrnehmungsabstandes ergeben hat.
  12. Vorrichtung zur Kompressionscodierung eines digitalen Signals mit Endrekonstruktionskontrolle, umfassend Mittel zur Analysefilterung des Ursprungssignals in Frequenzunterbänder, was das Erzeugen von Untersignalen erlaubt, Auswahlmittel von Quantisierern und Quantisierermittel, die für jedes Untersignal das Durchführen einer Binärzuweisung und einer Quantisierung in Abhängigkeit dieser Zuweisung erlauben, dadurch gekennzeichnet, dass die Auswahlmittel (2) umfassen: – Mittel (21) zur Schätzung der Differenz zwischen dem Ursprungssignal (s0) und einem in erster Annäherung geschätzten codierten-decodierten Signal (scde), wobei die geschätzte Differenz eine Funktion des Filterungsfehlers der Zerlegung in Unterbänder und des Quantisierungsfehlers jedes Untersignals ist, und – Mittel (22) zur iterativen Binärzuweisung, die ausgelegt sind, um nach einem Abstandsbeschränkungskriterium zwischen dem codierten-decodierten digitalen Signal und dem Ursprungssignal bzw. nach einer Codierungsratenbeschränkung mit Berechnung des Codierungsgesamtfehlers für einen laufenden Quantisierer und einen benachbarten Quantisierer aus einer Vielzahl von Quantisierern einen optimalen Quantisierer zuzuweisen, um den genannten Abstand und/oder den Codierungsfehler zu reduzieren und die erwähnte erste Annäherung des codierten-decodierten Signals zu verfeinern.
  13. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, dass für eine iterative Binärzuweisung, die nach dem Wahrnehmungsabstandsbeschränkungskriterium im Frequenzbereich ausgeführt wird, die erwähnten Mittel zur Schätzung der Differenz zwischen dem Ursprungssignal und dem geschätzten codiertendecodierten Signal wenigstens umfassen: – Mittel zur Berechnung des Quantisierungsfehlers und der auf die Quantisierung zurückzuführenden geschätzten Rate für jedes Unterband und jeden Quantisierer einer Vielzahl von Quantisierern, wobei diese Mittel zur Berechnung den Satz der durch die Analysefilterungsmittel gelieferten Untersignale empfangen und für jedes Untersignal und jeden Quantisierer einen Satz von Werten der Rate und des quadratischen Quantisierungsfehlers liefern; – Synthesefilterungsmittel, die den Satz der durch die Analysefilterungsmittel gelieferten Untersignale empfangen und das geschätzte codierte-decodierte Signal liefern, – Subtrahierermittel, die das Ursprungssignal und das geschätzte codierte-decodierte Signal empfangen und ein Differenzsignal liefern; – einen Modul zur psychophysikalischen Analyse des Ursprungssignals, der das Ursprungssignal empfängt und das Interpretieren des Ursprungssignals entsprechend einem Wahrnehmungsbeschränkungsgesetz im Frequenzbereich erlaubt, wobei dieser Modul zur psychophysikalischen Analyse ein interpretiertes Ursprungssignal liefert; – Berechnungsmittel, die das interpretierte Ursprungssignal und das Differenzsignal empfangen und ein korrigiertes Wahrnehmungsbeschränkungssignal liefern, wobei der erwähnte Satz von Werten und das korrigierte Wahrnehmungsbeschränkungssignal an die genannten Mittel zur iterativen Binärzuweisung geliefert werden.
  14. Vorrichtung nach den Ansprüchen 12 und 13, dadurch gekennzeichnet, dass die Mittel zur iterativen Binärzuweisung wenigstens umfassen: – Mittel zur Berechnung der spektralen Gesamtleistungsdichte des auf die Quantisierung zurückzuführenden Rekonstruktionsfehlers; – Mittel zur von einer laufenden Binärzuweisung ausgehenden Diskriminierung einer spezifischen Binärzuweisung nach einem Beschränkungskriterium der spektralen Gesamtleistungsdichte des berechneten Rekonstruktionsfehlers, wobei die spezifische Binärzuweisung für jedes Untersignal bei positiver Reaktion auf das Kriterium identisch zur laufenden Binärzuweisung und bei negativer Reaktion auf dieses Kriterium die spezifische Binärzuweisung unterschiedlich zur laufenden Binärzuweisung ist und einem Quantisierer des Untersignals entspricht, der die beste Verbesserung des auf die Ratenveränderung bezogenen Wahrnehmungsabstandes ergibt, nach einem Kriterium zur Berechnung der spektralen Leistungsdichte dieses Fehlers für jedes Untersignal bei Verwendung eines zum laufenden Quantisierer benachbarten Quantisierers und zur Berechnung des Wahrnehmungsabstandes in Bezug auf die entsprechende Codierungsrate.
  15. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, dass für eine iterative Binärzuweisung, die nach einem Wahrnehmungsabstandsbeschränkungskriterium im Wahrnehmungsbereich ausgeführt wird, in dem jedes durch ein Frequenzunterband gebildetes Untersignal in eine Vielzahl von Wahrnehmungswerten umgewandelt wird, die für die durch das Ursprungssignal und das wahrgenommene codierte-decodierte Signal erzeugte physiologische Wirkung repräsentativ sind, wobei diese Wahrnehmungswerte den Wahrnehmungsbereich darstellen, die Mittel zur Schätzung der Differenz zwischen dem codierten-decodierten Signal und dem Ursprungssignal wenigstens umfassen: – Mittel zur Berechnung des Quantisierungsfehlers und der auf die Quantisierung zurückzuführenden geschätzten Rate für jedes Untersignal und für jeden Quantisierer einer Vielzahl von Quantisierern, wobei die Mittel zur Berechnung den Satz der durch die Analysefilterungsmittel gelieferten Untersignale empfangen und für jedes Untersignal und jeden Quantisierer einen Satz von Werten der Rate und des quadratischen Quantisierungsfehlers liefern, – Synthesefilterungsmittel, welche den Satz der durch die Analysefilterungsmittel gelieferten Untersignale empfangen und ein geschätztes codiertes-decodiertes Signal liefern; – Subtrahierermittel, die das Ursprungssignal und das geschätzte codierte-decodierte Signal empfangen und ein Differenzsignal liefern, wobei das Ursprungssignal, das Differenzsignal und der Satz von Werten an die Mittel zur iterativen Binärzuweisung geliefert werden.
  16. Vorrichtung nach Anspruch 12 und 15, dadurch gekennzeichnet, dass die Mittel zur iterativen Binärzuweisung wenigstens enthalten: – einen das Ursprungssignal empfangenden psychophysikalischen Modul, der es erlaubt, jedes der Untersignale in eine Vielzahl von Wahrnehmungswerten umzuwandeln, die den Wahrnehmungsbereich darstellen; – Mittel zur Berechnung des berechneten Wahrnehmungsabstandes zwischen dem Ursprungssignal und dem geschätzten codierten-decodierten Signal nach den Wahrnehmungswerten unter Berücksichtigung des Filterungsfehlers bei der Zerlegung in Frequenzunterbänder; – Mittel zur von einer laufenden Binärzuweisung ausgehenden Diskriminierung einer spezifischen Binärzuweisung nach einem Wahrnehmungsabstandsbeschränkungskriterium dieses berechneten Wahrnehmungsabstandes, wobei die spezifische Binärzuweisung für jedes Untersignal identisch zur laufenden Binärzuweisung bei positiver Reaktion auf dieses Beschränkungskriterium ist und die spezifische Binärzuweisung bei negativer Reaktion auf dieses Beschränkungskriterium gegenüber der laufenden Binärzuweisung unterschiedlich ist und einem Quantisierer des Untersignals entspricht, der zur besten Verbesserung des auf die Codierungsrate bezogenen berechneten Wahrnehmungsabstandes bei Verwendung eines zu diesem laufenden Quantisierer benachbarten Quantisierers führt.
DE69725650T 1996-06-06 1997-06-04 Verfahren und Gerät zur Kompressionskodierung eines digitalen Signals Expired - Fee Related DE69725650T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9606982A FR2749723B1 (fr) 1996-06-06 1996-06-06 Procede et dispositif de codage en compression d'un signal numerique
FR9606982 1996-06-06

Publications (2)

Publication Number Publication Date
DE69725650D1 DE69725650D1 (de) 2003-11-27
DE69725650T2 true DE69725650T2 (de) 2004-07-29

Family

ID=9492766

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69725650T Expired - Fee Related DE69725650T2 (de) 1996-06-06 1997-06-04 Verfahren und Gerät zur Kompressionskodierung eines digitalen Signals

Country Status (3)

Country Link
EP (1) EP0812070B1 (de)
DE (1) DE69725650T2 (de)
FR (1) FR2749723B1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060140406A1 (en) * 2003-02-07 2006-06-29 Koninklijke Philips Electronics N.V. Signal processing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法

Also Published As

Publication number Publication date
FR2749723B1 (fr) 1998-09-04
DE69725650D1 (de) 2003-11-27
EP0812070B1 (de) 2003-10-22
FR2749723A1 (fr) 1997-12-12
EP0812070A1 (de) 1997-12-10

Similar Documents

Publication Publication Date Title
DE60307252T2 (de) Einrichtungen, verfahren und programme zur kodierung und dekodierung
DE3854846T2 (de) Kodierung eines Bildsignals mit Berücksichtigung des Kontrasts in jedem Bild und Dekodierung analog zur Kodierung
DE102006022346B4 (de) Informationssignalcodierung
DE60014363T2 (de) Verringerung der von der quantisierung verursachten datenblock-diskontinuitäten in einem audio-kodierer
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60207061T2 (de) Audiokompression
DE60317722T2 (de) Verfahren zur Reduzierung von Aliasing-Störungen, die durch die Anpassung der spektralen Hüllkurve in Realwertfilterbanken verursacht werden
DE69633129T2 (de) Waveletbaum-bildcoder mit überlappenden bildblöcken
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE69116476T2 (de) Digitaler Signalverschlüssler
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
EP1687810B1 (de) Vorrichtung und verfahren zum ermitteln einer quantisierer-schrittweite
DE4241131B4 (de) Einrichtung zum Kodieren und Dekodieren von Übertragungssignalen mittels Transformationen
EP0227956B1 (de) Verfahren zur Datenreduktion digitaler Bildsignale durch Vektorquantisierung
EP0414838B2 (de) Verfahren zur übertragung eines signals
DE19811039A1 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE10236694A1 (de) Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
EP0201679A1 (de) Verfahren zur Bilddatenreduktion für digitale Fernsehsignale
DE68925516T2 (de) Wirksames Kodierungsverfahren und zugehöriges Dekodierungsverfahren
EP1397799B1 (de) Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten
DE69015105T2 (de) Kompressionseinrichtung für transformiertes, digitales Audiosignal mit adaptiver Quantisierung auf Grund eines psycho-akustischen Kriteriums.
DE60214627T2 (de) Verfahren und Vorrichtung zur Bitratenkonversion
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee