DE3930760A1 - Transformation coding system for video signals - reduces data for transmission using adaptive threshold process - Google Patents
Transformation coding system for video signals - reduces data for transmission using adaptive threshold processInfo
- Publication number
- DE3930760A1 DE3930760A1 DE3930760A DE3930760A DE3930760A1 DE 3930760 A1 DE3930760 A1 DE 3930760A1 DE 3930760 A DE3930760 A DE 3930760A DE 3930760 A DE3930760 A DE 3930760A DE 3930760 A1 DE3930760 A1 DE 3930760A1
- Authority
- DE
- Germany
- Prior art keywords
- vector
- coefficients
- threshold
- address
- transformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/008—Vector quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Die Erfindung betrifft ein Transformationscodierungssy stem, insbesondere für Videosignale.The invention relates to a transformation coding system stem, in particular for video signals.
Aufgrund steigender Integrationsdichte digitaler Schaltun gen wird eine digitale Verarbeitung auch analoger Signale angestrebt. Um eine Echtzeitverarbeitung durchzuführen und aufgrund eingeschränkter Kanalkapazität des Übertragungs- oder Aufzeichnungskanals werden die digitalen Signale in ihrer Datenrate z. B. durch Transformationscodierverfahren reduziert. Die in einem Schwellentransformationscoder er zeugte Bitmustermatrix, die die Adressen der zu übertra genden Spektralkoeffizienten liefert, im folgenden Adreß bitmatrix genannt, wird durch Quellencodierung von ihrem redundanten Informationsgehalt befreit.Due to increasing integration density of digital Schaltun A digital processing of analogue signals is also possible sought. To perform a real-time processing and due to limited channel capacity of the transmission or recording channels are the digital signals in their data rate z. By transform coding methods reduced. The in a threshold transformation encoder he witnessed bitmapped matrix, which transmits the addresses of yields spectral coefficients, in the following address called bitmatrix, is by source encoding of its redundant information content freed.
Für die Kodierung der Adreßbitmuster sind eindimensionale Verfahren bekannt, wie z. B. Zigzag-Scan mit anschließender Lauflängenkodierung. (W.H. Chen, W.K. Pratt: "Scene Adap tive Coder"; IEEE Com-32 (March 1984), pp 225-232.For encoding the address bit patterns are one-dimensional Known method, such. B. Zigzag scan followed by Run length encoding. (W.H. Chen, W.K. Pratt: "Scene Adap Active Coder "; IEEE Com-32 (March 1984), pp 225-232.
Als eingeschränktes zweidimensionales Verfahren ist aus der Literatur die Methode von Lohscheller und Franke be kannt. (H. Lohscheller, M. Franke: "Colour Picture Coding - Algorithmen Optimization und Technical Realization"; Frequenz 41 (1987), pp 291-299).As a limited two-dimensional process is out the literature the method of Lohscheller and Franke be known. (H. Lohscheller, M. Franke: "Color Picture Coding - Algorithms Optimization and Technical Realization "; Frequency 41 (1987), pp 291-299).
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur zweidimensionalen Kodierung der, nach einer Schwellen operation auf Transformationsblöcke der Größe n * n, ent stehenden, beliebigen Bitmuster der Adressen anzugeben.The invention has for its object to provide a method for two-dimensional coding of, after a threshold operation on transformation blocks of size n * n ent standing, arbitrary bit pattern of the addresses.
Diese Aufgabe wird durch die im Anspruch 1 angegebenen Merkmale gelöst. Vorteilhafte Weiterbildungen der Erfin dung sind in den Unteransprüchen wiedergegeben.This object is achieved by the features specified in claim 1 Characteristics solved. Advantageous developments of the inventions tion are given in the subclaims.
Zur Datenreduktion innerhalb eines digitalisierten Bildes wird eine Schwellentransformationscodierung durchgeführt. For data reduction within a digitized image a threshold transformation coding is performed.
Dabei wird die Vorlage in Blöcke der Größe n * n Pixel zerlegt, mit z. B. n = 8, die einer Transformation unter zogen werden. Eine Schwellwertoperation eliminiert die ir relevanten Spektralkoeffizienten. Dadurch entsteht eine n * n Bitmustermatrix, die angibt, ob der Koeffizient ei ner entsprechenden Adresse übertragen wird oder nicht (1:= übertragen, 0:= nicht übertragen).The template is divided into blocks of size n * n pixels, with z. B. n = 8, which are subjected to a transformation. A thresholding operation eliminates the ir relevant spectral coefficients. This results in a n * n bit pattern matrix indicating whether the coefficient of a corresponding address is transmitted or not (1: = transmitted, 0: = not transmitted).
Das erfindungsgemäße Verfahren führt eine zweidimensiona le, bezüglich der gesamten n * n Adreßbitmatrix suboptimale Entropie-Codierung durch.The inventive method performs a two-dimensional le, with respect to the entire n * n address bit matrix sub-optimal entropy coding.
Um eine Codierung mit einem vertretbaren Aufwand durchfüh ren zu können, wird jede Adreßbitmatrix in k, z. B. k = 8, optimierte Zonen zerlegt, deren Dimension auf maxi mal 1 = 8 begrenzt ist. Pro Zone sind somit maximal 21 = 256 Bitmuster möglich.In order to perform a coding with a reasonable effort ren, each address bit matrix in k, z. B. k = 8, optimized zones decomposed whose dimension is limited to maxi times 1 = 8. A maximum of 2 1 = 256 bit patterns are possible per zone.
Um eine Adaption der Adreßcodierung an die Statistikände rung zu ermöglichen, wird die Anzahl der zu übertragenden Koeffizienten nach der Tabelle klassifiziert. Für die Dar stellung der Klassen werden drei Bits benötigt.To adapt the address coding to the statistics The number of persons to be transferred will be Coefficients classified according to the table. For the Dar Classes require three bits.
Für jede Klasse und jede Zone wird ein statistisch opti miertes Huffman-Codebuch bestimmt, mit dem jede mögliche Bit-Kombination der Zone codiert werden kann. Das Codebuch jeder Zone läßt sich dann mit 11 bit adressieren (acht Bits-Kombinationen, drei Bits-Klassen).For each class and each zone, a statistical opti Huffman codebook, with which any possible Bit combination of the zone can be coded. The codebook each zone can then be addressed with 11 bits (eight Bit combinations, three-bit classes).
Der mit diesen 11 Bits adressierte Huffman-Code wird Zone für Zone übertragen. Eine Übertragung der Klassen- und Zo nennummer kann gegebenenfalls unterlassen werden, da im Decoder (Empfänger) die Anzahl der übertragenen Koeffi zienten, damit auch die Klasse, aus der Amplitudenübertra gung ermittelt werden kann und da die Reihenfolge der Zo nenbehandlung mit dem Coder fest vereinbart ist. Im Deco der kann aus den übertragenen Huffman-Codes der Zonen das ursprüngliche zweidimensionale Adreßbitmuster eindeutig zurückgewonnen werden.The Huffman code addressed with these 11 bits becomes zone transferred for zone. A transfer of class and Zo If necessary, the number can be omitted, as in Decoder (receiver) the number of transmitted Koeffi cient, hence the class, from the amplitude transfer tion can be determined and because the order of Zo treatment with the coder. In the deco that can be done from the transmitted Huffman codes of the zones original two-dimensional address bit patterns unique be recovered.
Das erfindungsgemäße Transformationscodierungssystem bie tet eine einfache und flexible zweidimensionale Codierung der Adreßbitmuster. Es werden flächenmäßige statistische Abhängigkeiten der Adreßinformationen ohne Einschränkung der möglichen Bit-Kombinationen der Adressen ausgenutzt. Dies führt zu einer sehr guten Bildqualität bei extrem niedriger Datenrate der Adreßcodierung. Da das Huffman- Codebuch direkt mit der Bitdarstellung der Kombinationen acht Bits innerhalb einer Zone und der Klasseninformation drei Bits adressiert wird, gewährleistet das Transforma tionscodierungssystem eine einfache Hardwarerealisierung der Adreßcodierung. The transformation coding system according to the invention tet a simple and flexible two-dimensional coding the address bit pattern. There are area statistical Dependencies of the address information without restriction exploited the possible bit combinations of the addresses. This leads to a very good picture quality at extreme low data rate of the address coding. Since the Huffman Codebook directly with the bit representation of the combinations eight bits within a zone and class information three bits is addressed, the Transforma ensures tion coding system a simple hardware implementation the address coding.
Auch in einem klassischen Schwellencoder mit Skalarquanti sierung der Amplituden funktioniert das bekannte Verfahren besser als alle bisher bekannten Adreßcodierungsverfah ren.Also in a classic threshold coder with scalarquanti tion of the amplitudes, the known method works better than any previously known address coding method ren.
Nachfolgend wird ein Ausführungsbeispiel eines erfindungs gemäßen Transformationscodierungssystem anhand der Zeich nung wiedergegeben. Es zeigenHereinafter, an embodiment of an invention proper transformation coding system based on the character reproduced. Show it
Fig. 1 einen Schwellencodierer; Figure 1 is a Schwellencodierer.
Fig. 2 eine Kurve für eine Kantendetektion; FIG. 2 shows a curve for an edge detection; FIG.
Fig. 3 eine weitere Kurve für eine Kantendetektion; Fig. 3 is another graph for edge detection;
Fig. 4 einen Vektorquantisierer; Figure 4 is a vector quantizer.
Fig. 5 eine Aufteilung der Zonen sowie Fig. 5 shows a division of the zones as well
Fig. 6 Klassen- und Zonen-Codebuch. Fig. 6 class and zone codebook.
Fig. 1 zeigt ein Konzept für einen Schwellentransforma tionscodierer. Der Eingangsblock, entstanden durch eine Zerlegung der Abtastwerte eines aus zweidimensionalen Feldern bestehenden Signals, insbesondere eines digitali sierten Videosignals, wird einer Transformationsschaltung 10, z. B. einem diskreten Cosinustransformator, und einer Klassifikationsschaltung 17 zugeführt. Der DC-Anteil nach der Transformation wird über einen Skalarquantisierer 11 einem Codierer 19 zugeführt. Die AC-Anteile werden einer seits einer Siebschaltung 12 mit nachfolgender Sortier schaltung 13 als auch der Klassifikationsschaltung 17 zu geführt. Das Ausgangssignal der Klassifikationsschaltung 17 steuert die Siebschaltung 12. Die Sortierschaltung 13 ist einerseits über einen Adressencodierer 18 mit dem Co dierer 19, andererseits mit einer Steuerschaltung 14 ver bunden. Ausgänge der Steuerschaltung 14 führen auf Vektor quantisierer 15 ... 16, deren Ausgänge mit der Codierer 19 verbunden sind. Fig. 1 shows a concept for a threshold transforming encoder. The input block, created by a decomposition of the samples of a signal consisting of two-dimensional fields, in particular a digitized video signal, is a transformation circuit 10 , z. A discrete cosine transformer, and a classification circuit 17 . The DC component after the transformation is supplied to a coder 19 via a scalar quantizer 11 . The AC components are on the one hand a filter circuit 12 with subsequent sorting circuit 13 and the classification circuit 17 to be performed. The output signal of the classification circuit 17 controls the filter circuit 12 . The sorting circuit 13 is on the one hand via an address encoder 18 to the Co dier 19 , on the other hand ver with a control circuit 14 connected. Outputs of the control circuit 14 lead to vector quantizer 15 ... 16 , whose outputs are connected to the encoder 19 .
Der Aufwand der Vektorquantisierung wird mit dem erfin dungsgemäßen Schwellencodierungskonzept so reduziert, daß nach einer diskreten Cosinustransformation, im folgenden DCT genannt, die Anzahl der Koeffizienten durch eine Schwellenoperation in der Siebschaltung 12 drastisch ge mindert wird. Diese Operation wird Siebung genannt. Dabei wird jeder Koeffizient zuerst mit dem Kehrwert seiner Wahrnehmungsschwelle nach Lohscheller gewichtet. Nach der Gewichtung ist die subjektive Wahrnehmung der Koeffizien ten normiert, so daß die gewichteten Koeffizienten dann mit einer einzigen Schwelle verglichen werden können. Überschwellige Koeffizienten werden übertragen. Unter schwellige Koeffizienten werden unterdrückt. Nach der Sie bung ist die Dimension der Koeffizienten zwar reduziert, eine Vektorquantisierung kann jedoch noch nicht erfolgen. Die Vektorquantisierung benötigt einerseits eine feste Di mension der Koeffizienten, andererseits aber liefert die Siebung eine stoachistische Anzahl von überschwelligen Ko effizienten. Erfindungsgemäß werden mehrere Vektorquanti sierer 15 bis 16 mit vorgegebenen Dimensionen im Coder bzw. Decoder reserviert. Unter Berücksichtigung der Reali sierungsrandbedingungen wird dem ersten Vektorquantisierer 15 eine Dimension von vier und den restlichen Vektorquan tisierern 16 eine Dimension von sechs zugewiesen. Je nach dem wie viele Koeffizienten vorliegen, wird die tatsächli che Anzahl der benötigten Vektorquantisierer 15 bis 16 festgelegt. Gibt es z. B. 10 überschwellige Koeffizienten, werden sie in der Steuerschaltung 14 in zwei Vektoren zer legt, der erste Vektor mit vier Koeffizienten und der zweite Vektor mit sechs Koeffizienten. Es kann aber auch vorkommen, daß der letzte Vektor nicht von Koeffizienten vollständig aufgefüllt werden kann, z. B. wenn die Anzahl der Koeffizienten gleich 5 ist. In diesem Fall wird die Siebungsschwelle der Siebschaltung 12 ein wenig gesenkt, und zwar so lange bis der letzte Vektor gerade vollständig aufgefüllt werden kann. Man kann diese Maßnahme als eine Quantisierung der Anzahl der überschwelligen Koeffizienten in der Siebschaltung 12 bezeichnen, wobei die Quantisie rungsstufen an die gewählten Dimensionen der reservierten Vektorquantisierer 15 bis 16 angepaßt sind.The complexity of the vector quantization is reduced with the inventions to the invention Schwellencodierungskonzept so that after a discrete cosine transform, hereinafter called DCT, the number of coefficients by a threshold operation in the filter circuit 12 drastically ge is reduced. This operation is called screening. Each coefficient is first weighted with the reciprocal of its perception threshold to Lohscheller. After weighting, the subjective perception of the coefficients is normalized so that the weighted coefficients can then be compared to a single threshold. Over-threshold coefficients are transmitted. Under threshold coefficients are suppressed. After the exercise, the dimension of the coefficients is indeed reduced, but a vector quantization can not yet take place. On the one hand, vector quantization requires a fixed dimension of the coefficients, but on the other hand, the sieving provides a stoichiometric number of suprathreshold coefficients. According to the invention, a plurality of vector quantizers 15 to 16 having predetermined dimensions are reserved in the coder or decoder. Taking into account the conditions of realization, the first vector quantizer 15 is given a dimension of four and the remaining vector quantizers 16 a dimension of six. Depending on how many coefficients are present, the actual number of required vector quantizers 15 to 16 is determined. Is there z. B. 10 suprathreshold coefficients, they are in the control circuit 14 in two vectors zer sets, the first vector with four coefficients and the second vector with six coefficients. But it may also happen that the last vector can not be completely filled by coefficients, z. When the number of coefficients is 5. In this case, the screening threshold of the filter circuit 12 is lowered a little, until the last vector can just be completely filled up. This measure can be described as a quantization of the number of suprathreshold coefficients in the filter circuit 12 , the quantization steps being adapted to the selected dimensions of the reserved vector quantizers 15 to 16 .
Da die Koeffizienten nun in Gruppen vektoriell quantisiert werden, spielt die Zusammensetzung der einzelnen Gruppen für die später erzielbare Datenrate eine große Rolle. Des halb wird eine Sortierschaltung 13 vorgeschaltet. Da die Adressen der übertragenen Koeffizienten durch den Adreß codierer 18 auch codiert und gesendet werden müssen, hat die Sortierung in der Sortierschaltung 13 nicht nur Aus wirkung auf die Amplitudencodierung, sondern auch auf die Adreßcodierung.Since the coefficients are now vectorially quantized in groups, the composition of the individual groups plays a major role in the later achievable data rate. Half a sorting circuit 13 is connected upstream. Since the addresses of the coefficients transmitted by the address encoder 18 must also be encoded and sent, the sorting in the sorting circuit 13 has not only effect on the amplitude coding, but also on the address coding.
Mit dem Coderkonzept nach Fig. 1 können die Eigenschaften des menschlichen Auges durch:With the coder concept according to FIG. 1, the properties of the human eye can be determined by:
- a) Gewichtung nach Wahrnehmungsschwellen der Spectralkoef fizienten,a) Weighting according to perception thresholds of Spectralkoef coefficients,
-
b) Adaption der Siebungsschwelle an
- i. Aktivität
- ii. Leistungskonzentration
- iii. Kanten
- i. activity
- ii. concentration of power
- iii. edge
- c) Ausnutzung der Maskierungseffekte während Quantisierung der Amplitudenc) Exploitation of masking effects during quantization the amplitudes
sehr elegant berücksichtigt werden. Für Punkt a) werden die von Lohscheller gemessenen Wahrnehmungsschwellen für die Luminanz eingesetzt. Für Punkte b) i und b) ii wird der von Mester und Franke entwickelte Klassifikator in der Klassifikationsschaltung 17 verarbeitet. (R. Mester, U. Franke: Adaptive Schwellensteuerung in Transformations codern - ein neuer Ansatz zur Stabilisierung der Rekon struktionsqualität, Frequenz 41 (1987) 3, S. 63-70). Das Aktivitätsmaß wird dabei als die Summe aller AC-Koeffi zienten zum Betrag definiert und die Leistungskonzentra tion wird durch eine Entropienberechnung ermittelt. Mit dem Entropienmaß werden nicht nur diagonale Kanten, sondern auch Strukturen, die weißem Rauschen ähneln, als kritische Strukturen klassifiziert. Um diese Schwäche zu überwinden, wird erfindungsgemäß die Klassifikation von b) i und b) ii mit einer zusätzlichen Kantendetektion in der Klassifika tionsschaltung 17 kombiniert. Somit wird eine viel genaue re Aussage über die kritischen Strukturen ermöglicht. Für Aufgabe c) wird die Auflösung der Vektorquantisierer 15 bis 16 an die Aktivität des Blocks adaptiert. Im Prinzip gilt: Je größer die Aktivität, desto gröber die Vektor quantisierung.be considered very elegant. For point a) the perception thresholds measured by Lohscheller are used for the luminance. For points b) i and b) ii, the classifier developed by Mester and Franke is processed in the classification circuit 17 . (R. Mester, U. Franke: Adaptive Threshold Control in Transformation Coders - A New Approach to the Stabilization of the Reconstruction Quality, Frequenz 41 (1987) 3, pp. 63-70). The measure of activity is defined as the sum of all AC coefficients for the amount and the Leistungskonzentra tion is determined by a Entropienberechnung. With the measure of entropy, not only diagonal edges but also structures resembling white noise are classified as critical structures. In order to overcome this weakness, according to the invention the classification of b) i and b) ii is combined with an additional edge detection in the classification circuit 17 . Thus, a much more accurate re statement about the critical structures is possible. Task c) the resolution of the vector quantizer is 15 to 16 adapted to the type of the block. In principle, the larger the activity, the coarser the vector quantization.
Erfindungsgemäß wird im Ortsbereich eine Schwellenopera tion des Blockdifferenzsignals als Kantendetektion verwen det, wobei das Blockdifferenzsignals nach jeweils einer Differenzierung des Blocks in horizontaler, vertikaler, hauptdiagonaler und nebendiagonaler Richtung entsteht. Ein Block wird als Kante bezeichnet, falls mehrere Stellen im Vergleich zu Reststellen (Hintergrundstellen) hohe Diffe renzamplituden aufweisen.According to the invention, a threshold operation is performed in the location area tion of the block difference signal verwen as edge detection det, wherein the block difference signal after each one Differentiation of the block in horizontal, vertical, main diagonal and side-diagonal direction arises. On Block is called an edge if several digits in the Compared to residual points (background points), high differences exhibit amplitudes.
Sortiert man das Differenzsignal nach abnehmendem Betrag, siehe Fig. 2, so kann ein Verhältnis v der Aktivität in Kantenstellung zu der in Hintergrundstellen wie folgt de finiert werden:Sorting the difference signal by decreasing magnitude, see Fig. 2, a ratio v of the activity in edge position to that in background locations can be defined as follows:
Ist v größer als eine Schwelle S, wird der Block als Kante eingestuft.If v is greater than a threshold S, the block becomes an edge classified.
Eine Alternative ist ein Punkt-für-Punkt-Vergleich der sortierten Amplituden mit einer subjektiv optimierten Schwellenkurve. Diese Methode ist in Fig. 3 dargestellt. Von beiden Enden der sortierten Amplitudenkurve ausgehend wird je eine Schwellenkurve als gestrichelte Linie mit ei ner Länge von N1 bzw. N2 eingetragen. Ein Kantenblock liegt vor, falls die N1 größten Amplituden des Blocks alle oberhalb der einen Schwellenkurve und die N2 kleinsten Am plituden unterhalb der anderen Schwellenkurve liegen. Die Verläufe der Schwellenkurven werden optimiert, wobei als Optimierungskriterium die Minimierung der Fehlkantendetek tion zugrundegelegt wird. Die Kantendetektion nach Fig. 3 erzielt ein etwas besseres Ergebnis als die nach Fig. 2.An alternative is a point-by-point comparison of the sorted amplitudes with a subjectively optimized threshold curve. This method is shown in FIG . Starting from both ends of the sorted amplitude curve, a threshold curve is entered in each case as a dashed line with a length of N 1 or N 2 . An edge block is present if the N 1 largest amplitudes of the block are all above the one threshold curve and the N 2 smallest amplitudes below the other threshold curve. The curves of the threshold curves are optimized, whereby the minimization of Fehlkantendetek tion is used as an optimization criterion. The edge detection according to FIG. 3 achieves a somewhat better result than that according to FIG. 2.
Die Qualitäten der Kantendetektionen nach Fig. 2 sowie nach Fig. 3 können noch verbessert werden, indem man ab fragt, wieviele überschwellige Differenzamplituden maximal zusammenhängen und dann für das zusammenhängende Gebiet ein auf seine Fläche bezogenes Trägheitsmoment berechnet. Eine Kante soll ein linienförmiges Gebiet liefern und hat ein größeres normiertes Trägheitsmoment als impulsartige Strukturen, die kreisförmig zusammenhängende Gebiete auf weisen. Es wird also eine Abfrage nach dem Zusammenhang der überschwelligen Differenzamplituden durchgeführt.The qualities of the edge detections according to FIG. 2 as well as according to FIG. 3 can be further improved by asking how many suprathreshold differential amplitudes are maximally connected and then calculating an inertial moment related to its area for the contiguous area. An edge is supposed to provide a line-shaped area and has a larger normalized moment of inertia than impulsive structures that have circular connected areas. Thus, a query is performed on the relationship of the suprathreshold difference amplitudes.
Fig. 4 zeigt einen Vektorquantisierer zur Vektorquantisie rung der überschwelligen Spektralkoeffizienten. Die aus der Steuerschaltung 14 einem der Vektorquantisierer 15 bis 16, zugeführten überschwelligen Spektralkoeffizienten Vi werden einem Gain/Shape-Separator 20 zugeführt. Dabei ist das Gain als der Betrag des Vektors definiert. Fig. 4 shows a vector quantizer for Vektorquantisie tion suprathreshold spectral coefficients. The suprathreshold spectral coefficients Vi supplied to one of the vector quantizers 15 to 16 from the control circuit 14 are supplied to a gain / shape separator 20 . The gain is defined as the amount of the vector.
Gain/Shape-Separation bedeutet, daß der Vektor durch sei nen Betrag dividiert wird und sich daraus dann die Shape ergibt. Das Gain wird über einen Skalarquantisierer 21 ei nem Gainklassifikator 23 als auch einem Eingang des Vek torquantisierers zugeführt. Die Shape wird einerseits über einem adaptierten Shapevektorquantisierer 22 als auch di rekt einer Summationsstelle 25 zugeführt. Das Ausgangssi gnal des ersten adaptierten Shapevektorquantisierers 22 stellt einen ersten Shapecodevektor 1 dar. Das Ausgangs signal der Summationsstelle 25 wird einem zweiten adap tierten Shapevektorquantisierer 24 zugeführt, dessen Aus gangssignal einen zweiten Shapecodevektor 2 darstellt. Beide adaptierten Shapevektorquantisierer 22, 24 werden durch das Ausgangssignal des Gainklassifikators 23 gere gelt.Gain / Shape separation means that the vector is divided by its amount and then the shape results. The gain is supplied via a scalar quantizer 21 to a gain classifier 23 as well as to an input of the vector quantizer. The shape is fed on the one hand via an adapted shapefector quantizer 22 and also directly to a summation point 25 . The Ausgangssi signal of the first adapted Shapevektorquantisierers 22 represents a first Shapecodevektor 1. The output signal of the summation point 25 is supplied to a second adap shaped Shapevektorquantisierer 24 , whose output signal from a second Shapecodevektor 2 represents. Both adapted shapefector quantizers 22 , 24 are regulated by the output of the gain classifier 23 .
Um die Korrelationen zwischen den Spektralkoeffizienten besser ausnutzen zu können, sollen möglichst viele Spek tralkoeffizienten zu einem Vektor zusammengefaßt werden. Für jede durchgeführte Vektorquantisierung wird ihre Auf lösung in diesem Ausführungsbeispiel auf n = 8 Bits be grenzt. Um die Korrelationen noch hinreichend ausnutzen zu können, wird für den ersten Vektor eine Dimension von vier und für die restlichen Vektoren eine Dimension von sechs gewählt. Bei der gewählten Bitzahl und den Dimensionen ist eine optimale Vektorquantisierung jedes Vektors nicht mehr möglich. Deshalb wird erfindungsgemäß die obige adaptive Gain/Shape-separierte Technik als eine suboptimale Lösung empfunden. Da die Shape auf der Einheitskugeloberfläche liegt, hat sie einen viel kleineren Vektorraum als der originale Vektor. Deshalb braucht die Vektorquantisierung der Shape eine entsprechend viel kleinere Bitzahl. Das Gain wird skalarquantisiert. Diese suboptimale Methode hat desto weniger Einbußen, je schwächer Gain und Shape korre liert sind. Da das Gain den Kontrast und die Shape die Struktur des Bildinhalts darstellen, haben die beiden von Natur aus schwache Korrelationen. Das bedeutet, daß die Separation nicht zu viel einbüßen muß. Weil im Decoder die Shape mit dem Gain multipliziert wird, wird der Quantisie rungsfehler der Shape in Abhängigkeit des Gains mit ver stärkt. Das führt zu einem instabilen Verhalten der Codie rung. Um diesen Nachteil zu vermeiden, wird erfindungsge mäß die tatsächliche Auflösung der Shape-Vektorquan tisierung an das Gain adaptiert: Je größer das Gain, desto feiner die Shape-Vektorquantisierung. Falls für sehr gro ßes Gain ein Codebuch bis zu acht Bits nicht ausreicht, dann wird erfindungsgemäß die Shape-Quantisierung mit der zweiten VQ-Stufe 24 fortgesetzt. D. h., es wird der Diffe renzvektor zwischen dem originalen Shape und dem quanti sierten Shape in der Summenstelle 25 gebildet und mit ei nem zweiten Codebuch weiter quantisiert.In order to make better use of the correlations between the spectral coefficients, as many spectral coefficients as possible should be combined into one vector. For each vector quantization performed, its resolution in this embodiment is limited to n = 8 bits. In order to be able to make sufficient use of the correlations, a dimension of four is selected for the first vector and a dimension of six for the remaining vectors. With the number of bits and dimensions chosen, optimal vector quantization of each vector is no longer possible. Therefore, according to the invention, the above adaptive gain / shape separated technique is perceived as a suboptimal solution. Because the shape lies on the unit sphere surface, it has a much smaller vector space than the original vector. Therefore, the vector quantization of the shape needs a much smaller number of bits. The gain is scalar quantized. This suboptimal method has the less penalty the weaker the gain and shape are. Since the gain represents the contrast and the shape the structure of the image content, the two inherently have weak correlations. This means that the separation does not have to lose too much. Because in the decoder the shape is multiplied by the gain, the quantization error of the shape is strengthened depending on the gain. This leads to an unstable behavior of Codie tion. In order to avoid this disadvantage, the actual resolution of the shape vector quantization is adapted to the gain according to the invention: the greater the gain, the finer the shape vector quantization. If, for a very large gain, a codebook is not sufficient for up to eight bits, then according to the invention the shape quantization is continued with the second VQ stage 24 . That is, the difference vector between the original shape and the quantized shape is formed in the summing junction 25 and further quantized with a second codebook.
Mit dieser erfindungsgemäßen Vektorquantisierung wird der Maskierungseffekt des menschlichen Auges sehr einfach be rücksichtigt, da das Gain den Kontrast des Bildsignals darstellt. Durch eine subjektive Optimierung der Bitver teilung auf die Quantisierung der Shape jeder Gain-Klasse wird erfindungsgemäß eine subjektive angepaßte Vektorquan tisierung realisiert.With this vector quantization according to the invention, the Masking effect of the human eye very easy be takes into account, since the gain the contrast of the image signal represents. Through a subjective optimization of the bitver Divide on the quantization of the shape of each gain class According to the invention, a subjective matched vector quan realization realized.
Neben der Quantisierung und Codierung der Amplituden der überschwelligen Spektralkoeffizienten ist auch die Codie rung der Adressen ein sehr wichtiger Punkt in einem Schwellentransformationscoder. Jeder Spektralkoeffizient eines n * n Transformationsblocks hat eine feste Adresse (i,j) in dem n * n zweidimensionalen Spektralbereich, wo bei i der horizontalen und j der vertikalen Frequenz des Koeffizienten zugeordnet sind. Um das erfindungsgemäße, effiziente zweidimensionale Adreßcodierungsverfahren in den Adreßcodierer 18 einsetzen zu können, müssen die über schwelligen Koeffizienten in 13 nach einem dem Decoder be kannten, festen Schema sortiert werden, da im Decoder auch nach diesem festen Schema die in einer eindimensionalen Kette sortiert übertragenen Koeffizienten den "1"s der ebenfalls übertragenen n * n Adreßbitmatrix zugeordnet werden müssen. Aus diesem Grund werden alle überschwelli gen Koeffizienten in 13 nach dem bekannten Zigzag-Scan sortiert, siehe (W.H. Chen, W.K. Pratt: "Scene Adaptive Coder"; IEEE Com-32 8 March 1984), pp 225-232, da dann die Korrelationen zwischen den Amplituden durch die Vektor quantisierer 15 bis 16 gut ausgenutzt werden können, wenn in der Steuerschaltung 14 die einzelnen Vektoren mit den vorgegebenen Dimensionen durch Zerschneiden der so sor tierten Amplitudenkette gebildet werden.In addition to the quantization and coding of the amplitudes of the suprathreshold spectral coefficients, the coding of the addresses is also a very important point in a threshold-transformation coder. Each spectral coefficient of an n * n transformation block has a fixed address (i, j) in the n * n two-dimensional spectral range, where at i the horizontal and j are associated with the vertical frequency of the coefficient. In order to be able to use the efficient two-dimensional address coding method according to the invention in the address encoder 18 , the over-threshold coefficients in FIG. 13 must be sorted according to a fixed scheme known to the decoder, since in the decoder the coefficients transmitted in a one-dimensional string are also transmitted according to this fixed scheme must be assigned to the "1" s of the likewise transmitted n * n address bit matrix. For this reason, all the overflow coefficients in Figure 13 are sorted by the known Zigzag scan, see (WH Chen, WK Pratt: "Scene Adaptive Coder", IEEE Com-32 8 March 1984), pp 225-232, then the correlations between the amplitudes can be well exploited by the vector quantizer 15 to 16 , if in the control circuit 14, the individual vectors are formed with the predetermined dimensions by cutting the so-sor ted amplitude chain.
Das erfindungsgmäße Verfahren zur zweidimensionalen Adreßcodierung im Adreßcodierer 18 beruht auf der folgen den Philosophie:The erfindungsgmäße method for two-dimensional address coding in the address encoder 18 is based on the following philosophy:
Der Prozeß der Adreßbitmustergenerierung ist bei n * n-Blöcken zweidimensionaler Natur. Deshalb sind die Bitmuster der Adressen sowohl in der horizontalen als auch in der vertikalen Richtung gruppenweise korreliert. Die gruppenweisen Korrelationen der Adreßbitmuster werden besser ausgenutzt, wenn die Adressen nicht eindimensional, sondern zweidimensional zusammengefaßt und in Gruppen vek toriell codiert werden. Würden alle 8 * 8 Koeffizienten mit Ausnahme des dc-Koeffizienten zusammengefaßt, so ergä ben sich insgesamt 263 mögliche Bitmuster der zu übertra genden Koeffizienten. Die theoretisch kleinste Adreßdaten rate würde erzielt, wenn diese Bitmuster mit Huffman-Codes optimal codiert würden. Das ist selbstverständlich nicht zu realisieren, da das eine astronomische Anzahl von Rea lisationen (Größenordnung von 263) für die Erfassung der Auftrittswahrscheinlichkeiten und ein ebenso großes Code buch erfordern würde. Erfindungsgemäß werden die Anzahl der überschwelligen Koeffizienten klassifiziert entspre chend der TabelleThe process of address bit pattern generation is two-dimensional in n * n blocks. Therefore, the bit patterns of the addresses are correlated in groups in both the horizontal and vertical directions. The group-wise correlations of the address bit patterns are better utilized if the addresses are not summarized one-dimensionally, but two-dimensionally coded and grouped in groups. If all 8 * 8 coefficients were combined with the exception of the dc coefficient, a total of 2 63 possible bit patterns of the coefficients to be transmitted would result. The theoretically smallest address data rate would be achieved if these bit patterns were coded optimally with Huffman codes. This, of course, can not be realized, since it would require an astronomical number of realizations (in the order of 2 63 ) to record the probabilities of occurrence and an equally large code book. According to the invention, the number of suprathreshold coefficients are classified according to the table
so lassen sich bedingte Auftrittswahrscheinlichkeiten der Bitmuster für jede Anzahlklasse definieren. Zwar ist eine Messung dieser Auftrittswahrscheinlichkeiten aus dem glei chen Grund wie oben nach wie vor nicht möglich, es kann aber eine wichtige Aussage für zwei extreme Fälle gemacht werden: Ist die Anzahl der überschwelligen Koeffizienten klein, dann wird die Entropie ihrer Bitmuster vorwiegend durch die Bitmuster innerhalb niederfrequenter Zone domi niert, da in hochfrequenter Zone fast keine Spektralkoef fizienten auftreten können. Ist dagegen die Anzahl der zu übertragenden Koeffizienten groß, so wird die Entropie ihrer Bitmuster durch die Bitmuster innerhalb hochfrequen ter Zone dominiert, da in niederfrequenter Zone die Koef fizienten fast alle immer überschwellig sind; daher ist die Entropie dort gleich Null. Diese Überlegung führt dann zur erfindungsgemäßen suboptimalen zweidimensionalen Adreßcodierung: um eine Codierung mit einem vertretbaren Aufwand durchführen zu können, wird jede 8 * 8 Adreßmatrix in acht optimierte Zonen nach Fig. 5 zerlegt, deren Dimen sion auf maximal acht begrenzt ist.Thus, conditional occurrence probabilities of the bit patterns for each number class can be defined. Although it is still not possible to measure these occurrence probabilities for the same reason as above, an important statement can be made for two extreme cases: If the number of suprathreshold coefficients is small, the entropy of their bit patterns becomes predominantly due to the bit patterns within a low-frequency zone, as almost no spectral coefficients can occur in a high-frequency zone. If, on the other hand, the number of coefficients to be transmitted is large, the entropy of its bit patterns is dominated by the bit patterns within the high-frequency zone, since in low-frequency zones the coefficients are almost always suprathreshold; therefore the entropy is zero there. This consideration leads then to the invention suboptimal two-dimensional address encoding: to carry out a coding with reasonable effort, each 8 * 8 address matrix is divided into eight zones optimized by Figure 5, the dimen sion to a maximum of eight is restricted..
So sind pro Zone maximal 256 Bitmuster möglich; dadurch ist die statistische Erfassung der Auftrittswahrschein lichkeiten und die Realisierung des Huffman-Codebuches mit sehr geringem Aufwand möglich. Die überschwelligen Koeffi zienten werden nach Tabelle klassifiziert. Für die Dar stellung der Klassen werden drei Bits benötigt. Für jede Klasse und jede Zone wird ein statistisch optimiertes Huffman-Codebuch bestimmt, mit dem jedes mögliche Bitmu ster der Zone seiner klassenspezifischen Auftrittswahrsch einlichkeit entsprechend codiert wird. Das Codebuch jeder Zone läßt sich dann mit 11 bit adressieren, nämlich acht Bits für die Bitmuster und drei Bits für die Klasseninfor mation.Thus, a maximum of 256 bit patterns are possible per zone; thereby is the statistical recording of the occurrence probability Possibilities and the realization of the Huffman codebook with very little effort possible. The superstitious Koeffi Clients are classified by table. For the Dar Classes require three bits. For every Class and each zone becomes a statistically optimized Huffman codebook determines with which any bitmu the zone of its class-specific appearance probability is coded accordingly. The codebook everyone Zone can then be addressed with 11 bits, namely eight Bits for the bit patterns and three bits for the class information mation.
Die mit dieser 11 bit adressierte Huffman-Code wird Zone für Zone übertragen. Eine Übertragung der Klassen- und Zo nennummer ist nicht nötig, da im Decoder (Empfänger) die Anzahl der übertragenen Koeffizienten, damit auch die Klasse, aus der Amplitudenübertragung ermittelt werden kann und da die Reihenfolge der Zonenbehandlung mit dem Coder (Sender) fest vereinbart ist. Im Decoder kann aus den übertragenen Huffman-Codes der Zonen das ursprüngliche Adreßbitmuster eindeutig zurückgewonnen werden.The Huffman code addressed with this 11 bit becomes zone transferred for zone. A transfer of class and Zo nennummer is not necessary, there in the decoder (receiver) the Number of transferred coefficients, hence the Class, are determined from the amplitude transmission can and because the order of the zone treatment with the Coder (transmitter) is firmly agreed. In the decoder can off the transmitted Huffman codes of the zones the original one Address bit patterns are recovered uniquely.
Fig. 6 zeigt ein Hardware-Realisierungskonzept. In einer Hardwarerealisierung wird die maximale Länge der Huffman- Codeworte auf 15 Bits begrenzt. Außerdem wird ein Bit für die Wortlängenkennung benötigt. Die wiedergegebenen Blöcke und Datenverbindungen entsprechen bei einer Realisierung mittels eines programmgesteuerten Prozessors den Speichern und Datenwegen in funktionsbezogener Darstellung. Bei der Realierung beispielsweise mittels eines PC bilden die Speicher jeweils Speicher des RAM-Bereiches, während die Datenverbindungen die BUS-Struktur zeitweilig belegen. Im rechten Teil der Figur ist eine mögliche Zone mit 8 Punkten innerhalb eines 8 * 8 Blocks herausgestellt. Fig. 6 shows a hardware realization concept. In a hardware implementation, the maximum length of the Huffman codewords is limited to 15 bits. In addition, one bit is needed for the word length identifier. When reproduced using a program-controlled processor, the reproduced blocks and data connections correspond to the memories and data paths in function-related representation. When realizing for example by means of a PC, the memories each form memory of the RAM area, while the data connections occupy the BUS structure temporarily. In the right part of the figure a possible zone with 8 points within an 8 * 8 block is highlighted.
Die Erfindung beschränkt sich in ihrer Ausführung nicht auf das vorstehend angegebene bevorzugte Ausführungsbei spiel. Vielmehr ist eine Anzahl von Varianten denkbar, welche von der dargestellten Lösung auch bei grundsätzlich anders gearteten Ausführungen Gebrauch machen.The invention is not limited in their execution to the above-mentioned preferred embodiment game. Rather, a number of variants are conceivable which of the illustrated solution also in principle make use of other types.
Claims (18)
daß nach der Transformation eine adaptive Schwellenopera tion (12) durchgeführt wird und
daß die Adreßbitmatrix in zweidimensionalen Gruppen opti mal codiert wird.1. Transformation coding system ( Fig. 1), in particular for video signals, with a decomposition of the samples of the signal consisting of two-dimensional fields into blocks which are subjected to a transformation and a subsequent quantization and encoding of the spectral coefficients, characterized
that after the transformation, an adaptive threshold operation ( 12 ) is performed and
that the address bit matrix is optimally coded in two-dimensional groups.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE3930760A DE3930760A1 (en) | 1989-09-14 | 1989-09-14 | Transformation coding system for video signals - reduces data for transmission using adaptive threshold process |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE3930760A DE3930760A1 (en) | 1989-09-14 | 1989-09-14 | Transformation coding system for video signals - reduces data for transmission using adaptive threshold process |
Publications (1)
Publication Number | Publication Date |
---|---|
DE3930760A1 true DE3930760A1 (en) | 1991-03-28 |
Family
ID=6389454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE3930760A Ceased DE3930760A1 (en) | 1989-09-14 | 1989-09-14 | Transformation coding system for video signals - reduces data for transmission using adaptive threshold process |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE3930760A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993019536A1 (en) * | 1992-03-23 | 1993-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Data compression process during storage and/or transmissioin of digital audio signals for studio applications with perceptive coding and variable length code |
DE10008055A1 (en) * | 2000-02-22 | 2001-08-30 | Infineon Technologies Ag | Data compression method |
-
1989
- 1989-09-14 DE DE3930760A patent/DE3930760A1/en not_active Ceased
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993019536A1 (en) * | 1992-03-23 | 1993-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Data compression process during storage and/or transmissioin of digital audio signals for studio applications with perceptive coding and variable length code |
DE10008055A1 (en) * | 2000-02-22 | 2001-08-30 | Infineon Technologies Ag | Data compression method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0201679B1 (en) | Method for reducing the image data of digital television signals | |
DE69434271T2 (en) | Adaptive variable length coding method for video data | |
DE69720559T2 (en) | Image encoding method with variable length codes | |
DE3943879B4 (en) | Digital coding method | |
DE69731517T2 (en) | TRANSFER AND RECEIVE CODED VIDEO IMAGES | |
DE69933483T2 (en) | Apparatus and method for coding with motion-compensated prediction | |
DE3940682C2 (en) | Coding device and system, consisting of a coding device and a decoding device for digital image data | |
EP0309669B1 (en) | Method for scenery model aided image data reduction for digital television signals | |
DE69726661T2 (en) | METHOD AND DEVICE FOR CODING A DIGITAL INFORMATION SIGNAL | |
DE69922453T2 (en) | Image processing apparatus, image processing techniques and manufacturing media | |
DE4242796C2 (en) | Highly efficient coding method for natural images mixed with two-level images | |
DE69837497T2 (en) | METHOD AND DEVICE FOR CODING A VIDEO SIGNAL | |
DE4241131B4 (en) | Device for coding and decoding transmission signals by means of transformations | |
DE69721850T2 (en) | Image encoding method and encoder | |
DE3202913A1 (en) | METHOD AND DEVICE FOR PROCESSING A FACSIMILE SIGNAL CONTAINING GRAY VALUE COMPONENT | |
EP0517324A2 (en) | Apparatus for controlling the quantifier of a hybrid coder | |
DE19634600A1 (en) | Image signal coding device and associated method | |
EP0698316B1 (en) | Image transmission method with unequal error protection | |
DE3426939C2 (en) | Apparatus for closed predictive quantization of a digital vector signal | |
DE3038953C2 (en) | Method of band compression | |
DE10049571C1 (en) | Method and arrangement for transmitting a vector | |
DE69826878T2 (en) | RECORDING OF DECODED SIGNALS | |
EP0346637B1 (en) | Method for processing and transmitting a picture sequence | |
DE3726601C2 (en) | ||
DE3930760A1 (en) | Transformation coding system for video signals - reduces data for transmission using adaptive threshold process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8131 | Rejection |