AT500636A2

AT500636A2 - Verfahren zur codierung eindimensionaler digitaler signale

Info

Publication number: AT500636A2
Application number: AT14992002A
Authority: AT
Inventors: Christian Dipl Ing Feldbauer; Gernot Dipl Ing Dr Techn Kubin
Original assignee: K2 Kubin Keg
Priority date: 2002-10-04
Filing date: 2002-10-04
Publication date: 2006-02-15

Description

Beschreibung
Die Erfindung betrifft die Codierung eindimensionaler digitaler Signale, wie sie beispielsweise in Multimediasystemen, in der Festnetz- oder Mobiltelephonie oder in der Internetkommunikation eingesetzt wird. Eindimensionale digitale Signale sind Sequenzen diskreter Abtastwerte, die nur von einer einzigen unabhängigen Grösse (Zeit oder Ortskoordinate) abhängen. Bei den Signalen kann es sich um Sprachsignale, Audiosignale, Messsignale, biomedizinische Signale oder geophysikalische Signale handeln.

Die Codierung hat die Aufgabe, die als Sequenz von Abstastwerten vorliegenden digitalen Signale auf eine äquivalente digitale Sequenz abzubilden, die entweder mit einer niedrigeren Informationsrate dargestellt werden kann (in der sogenannten Kompression) oder die besser an die Eigenschaften eines Übertragungssystems angepasst ist (z.B. in der sogenannten spektrumformenden Codierung). Die Codierung kann dabei für Zwecke der Übertragung, Speicherung, Wiedergabe, Synthese, Erkennung oder Manipulation des Signals einen wichtigen Zwischenschritt darstellen.
Der Stand der Technik für die Codierung digitaler Signale umfasst eine Vielzahl von Verfahren, die je nach Einsatzgebiet und Signaltyp unterschiedlich sind und auf verschiedenen methodischen Ansätzen beruhen.

So benutzen beispielsweise zahlreiche Codierverfahren für Sprachsignale in der Telephonie Modellvorstellungen über die menschliche Sprache, wohingegen zahlreiche Codierverfahren für digitale Audiosignale auf Modelle des menschlichen Gehörs zurückgreifen und Codierfahren für Bild- oder Videosignale auf Modelle der menschlichen Sehwahrnehmung. Somit benötigt ein System, das mehrere verschiedene Signaltypen codieren soll auch mehrere Codierverfahren, um diese Signale darstellen zu können.

Diese Anforderung trifft insbesondere auf Multimediasysteme zu, die durch die gemeinsame Verarbeitung von Signalen unterschiedlicher Medientypen charakterisiert sind.
Herkömmliche Verfahren der Multimediasignalcodierung versuchen der Vielfalt von Signaltypen dadurch gerecht zu werden, das für jeden Signaltyp ein eigenes spezialisiertes Verfahren entwickelt wird, die gegebenenfalls gebündelt in einem gemeinsamen Gesamtsystem zusammengefasst werden. Dadurch ist mit einer hohen Komplexität bei der Implementierung dieser Verfahren auf elektronischen Systemen zu rechnen.

Ausserdem ist bei komprimierenden Codierverfahren für jeden Signaltyp der günstigste Kompromiss zwischen einer Datenreduktion und einer Einbusse bei der Qualität des decodierten Signals neu zu bestimmen.
Aufgabe der Erfindung ist es daher, ein verbessertes Verfahren zur Codierung eindimensionaler Signale zur Verfügung zu stellen, dass diese Aufgabe im Verbund mit der Codierung mehrdimensionaler Signale (Bilder bzw.

Bildsequenzen) löst und somit den Gesamtaufwand für ein Codiersystem für gemischte Signaltypen reduziert und seinen Entwurf vereinfacht.
Gemäss der Erfindung, die sich auf die Codierung eindimensionaler digitaler Signale bezieht, wird die Aufgabe dadurch gelöst, dass die eindimensionalen Signale durch eine Signaltransformation auf eine zeitliche Sequenz zweidimensionaler Signale (Bilder) konvertiert werden, die in einem weiteren Verfahrensschritt prinzipiell mit jedem Codierverfahren für digitale Bildsequenzen oder Videocodierverfahren codiert werden kann. Beschreibung von Sprach-, Audio- und Videosignalen mit einem einzigen Videocodierverfahren genannt, die dadurch gelingt, dass die Sprach- und Audiosignale durch die genannte Signaltransformation auf ein Videosignal konvertiert werden.

Vorteilhafte und zweckmässige Weiterbildungen des Verfahrens nach der Erfindung sowie besonders vorteilhafte Anwendungsmöglichkeiten dieses Verfahrens sind Gegenstand der auf den Anspruch 1 unmittelbar und mittelbar rückbezogenen Ansprüche.
Das Verfahren nach der Erfindung und weitere Verwendungsbeispiele werden im folgenden näher erläutert.
Als erster Verarbeitungsschritt wird eine Signaltransformation eingesetzt, die ein eindimensionales Signal in eine zeitliche Sequenz zweidimensionaler Signale konvertiert. Diese Signaltransformation kann durch zwei in Kaskade geschaltete Transformationsstufen erfolgen. Für diese Transformationsstufen kann jede Signaltransformation eingesetzt werden, die ein eindimensionales Signal in mehrere Teilsignale aufspaltet, wie das insbesondere bei den Fachkundigen bekannten Frequenztransformationen der Fall ist.

Dabei handelt es sich z.B. um die diskrete Fouriertransformation, die diskrete Cosinustransformation, mehrkanalige Filterbänke und verwandte Transformationen. Durch die erste Transformationsstufe entsteht bereits eine mehrkanalige Darstellung des Eingangssignals in Form von N parallelen Teilsignalen. In einer vorteilhaften Realisierung sind diese N Teilsignale nach der Signalfrequenz als erste Dimension der zweidimensionalen Darstellung geordnet. Die zweite Transformationsstufe spaltet darauf jedes dieser Teilsignale mit einer zweiten Transformation seinerseits in eine mehrkanalige Darstellung auf. Dadurch entstehen aus jedem der N Teilsignale wiederum M neue Teilsignale. Diese zweite Transformation kann dieselbe mathematische Struktur wie die erste Transformation haben oder eine andere Transformation sein.

In einer vorteilhaften Realisierung handelt es sich um eine zweite, genauere Frequenzanalyse oder, in einer anderen vorteilhaften Realisierung, um eine Analyse der im Signal vorhandenen Modulationsfrequenzen. Diese zweite vorteilhafte Realisierung wird durch Modellvorstellungen über die Signalverarbeitung im menschlichen Gehör unterstützt. Dieser zweite so erhaltene Frequenzparameter wird als zweite Dimension der zweidimensionalen Signaldarstellung herangezogen. Ordnet man nun alle gewonnen Teilsignale in einem Schema von N mal M Signalen an, so erhält man insgesamt ein Bild mit N mal M Bildpunkten, die sich zeitlich ändern.
Nach diesem ersten Verfahrensschritt der Signaltransformation kann in einem zweiten Verfahrensschritt die entstandene Sequenz von N mal M Bildpunkten mit einem Verfahren zur Codierung von Bildsequenzen (z.B.

JPEG Joint Pictures Experts Group) oder mit einem Videocodierverfahren (z.B. MPEG Motion Pictures Experts Group) codiert werden. In einer vorteilhaften Realisierung wird dabei zunächst die Anzahl der Bilder pro Zeiteinheit durch zeitliche Unterabtastung reduziert. Anstelle eines standardisierten Bild- oder Videocodierverfahrens können auch andere, nicht standardisierte Verfahren eingesetzt werden.

In einer vorteilhaften Realisierung werden dabei Effekte der menschlichen Hörwahrnehmung im Bild- oder Videocodierverfahren berücksichtigt.
Die so codierten eindimensionalen Signale können nun vorteilhaft gemeinsam mit anderen Bild- oder Videosignalen übertragen, gespeichert, wiedergegeben, synthetisiert, erkannt oder manipuliert werden, wobei durch die einheitlich Darstellung der verschiedenen Signaltypen als Bildsequenzen eine Reduktion der Komplexität des Gesamtsystems erreicht wird und auch die Bestimmung eines günstigen Kompromisses zwischen Datenreduktion und Signalqualität vereinfacht wird. Nach Durchführung der oben beispielhaft genannten Verarbeitungsschritte (wie Übertragung, Speicherung usw.) kann eine Decodierung der Bildsequenzen erfolgen, um die eindimensionalen Signale zurückzugewinnen.

Dazu werden die Verfahrensschritte des Codierers schrittweise invertiert. In einem ersten Verfahrensschritt wird aus dem codierten Datenstrom durch Anwendung des zum Codierer passenden Decodierers für Bildsequenzen oder des Videodecodierers wieder eine Sequenz zweidimensionaler Signale gewonnen. In einem zweiten Verfahrensschritt wird auf diese Sequenz diejenige Signaltransformation angewandt, die als mathematische Umkehrung der im Codierer eingesetzten Signaltransformation anzusehen ist. Ist diese Transformation im Codierer zweistufig ausgeführt, so ist es vorteilhaft, auch die Transformation des Decodierers zweistufig aufzubauen, wobei für die im Codierer beispielhaft aufgezählten Signaltransformationen folgende inverse Transformationen zur Verfügung stehen: inverse diskrete Fouriertransformation, inverse diskrete Cosinustransformation, inverse mehrkanalige Filterbank.

Der Fachkundige kann für eine Vielzahl verwandter Frequenztransformationen geeignete inverse Transformationen angeben. Nach Durchführung dieser inversen Transformation steht wiederum ein eindimensionales Signal am Ausgang des Decodierers zur Verfügung.

Claims

Patentansprüche

1. Verfahren zur Codierung eindimensionaler digitaler Signale, dadurch gekennzeichnet, dass die eindimensionalen Signale durch eine Signaltransformation auf eine zeitliche Sequenz zweidimensionaler Signale (Bilder) konvertiert werden, die in einem weiteren Verfahrensschritt mit einem Codierverfahren für digitale Bildsequenzen bzw. mit einem Videocodierverfahren codiert werden.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich bei den eindimensionalen Signalen um digitale Sprachsignale oder digitale Audiosignale handelt.

3. Verfahren nach einem der Ansprüche 1 bis 2, dadurch gekennzeichnet, dass die Transformation der eindimensionalen Signale durch zwei in Kaskade geschaltete Stufen erfolgt.

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Transformationsstufen eine mehrkanalige Filterbank oder eine diskrete Fouriertransformation oder eine diskrete Cosinustransformation oder eine andere Frequenztransformation umfassen, wie sie ein Fachkundiger zur Signalanalyse einsetzt.

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Transformationsstufen der Signalanalyse im menschlichen Gehör entsprechen, bei denen die erste Stufe das Signal in mehrere Teilbandsignale aufspaltet und die zweite Stufe die in den Teilbandsignalen enthaltenen Modulationsfrequenzen analysiert.

6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Abstastrate des zweidimensionalen Ausgangssignals der Transformationsstufen auf eine niedrigere Rate reduziert wird und damit eine geringere Anzahl von Bildern pro Zeiteinheit codiert werden muss.

7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die digitalen Bildsequenzen mit einem standardisierten Codierverfahren für digitale Bildsequenzen (z.B. JPEG, Joint Pictures Experts Group) oder Videocodierferfahren (z.B. MPEG, Motion Pictures Experts Group) codiert werden.

8. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die digitalen Bildsequenzen mit einem speziell angepassten Codierverfahren codiert werden, das Effekte der menschlichen Hörwahrnehmung berücksichtigt.

9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der codierte Datenstrom nach Dekodierung der Bildsequenzen mithilfe einer inversen Signaltransformation auf das ursprüngliche eindimensionale Signal konvertiert wird.

10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die inverse Signaltransformation die exakte oder näherungsweise mathematische Umkehrung der Transformationen gemäss einem der Ansprüche 3 bis 6 darstellt.

11. Verfahren nach einem der vorhergehenden Ansprüche, gekennzeichnet durch die Verwendung für die Übertragung, Speicherung, Wiedergabe, Synthese, Erkennung oder Manipulation von Sprachsignalen, Audiosignalen, Messsignalen, biomedizinischen oder geophysikalischen Signalen.

12. Verfahren nach Anspruch 11, gekennzeichnet durch die Verwendung in Multimediasystemen, in der Festnetz- oder Mobiltelephonie, oder in der Internetkommunikation.