AT500636A2 - Verfahren zur codierung eindimensionaler digitaler signale - Google Patents

Verfahren zur codierung eindimensionaler digitaler signale Download PDF

Info

Publication number
AT500636A2
AT500636A2 AT14992002A AT14992002A AT500636A2 AT 500636 A2 AT500636 A2 AT 500636A2 AT 14992002 A AT14992002 A AT 14992002A AT 14992002 A AT14992002 A AT 14992002A AT 500636 A2 AT500636 A2 AT 500636A2
Authority
AT
Austria
Prior art keywords
signals
transformation
signal
dimensional
image sequences
Prior art date
Application number
AT14992002A
Other languages
English (en)
Inventor
Christian Dipl Ing Feldbauer
Gernot Dipl Ing Dr Techn Kubin
Original Assignee
K2 Kubin Keg
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by K2 Kubin Keg filed Critical K2 Kubin Keg
Priority to AT14992002A priority Critical patent/AT500636A2/de
Publication of AT500636A2 publication Critical patent/AT500636A2/de

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description


  Beschreibung
Die Erfindung betrifft die Codierung eindimensionaler digitaler Signale, wie sie beispielsweise in Multimediasystemen, in der Festnetz- oder Mobiltelephonie oder in der Internetkommunikation eingesetzt wird. Eindimensionale digitale Signale sind Sequenzen diskreter Abtastwerte, die nur von einer einzigen unabhängigen Grösse (Zeit oder Ortskoordinate) abhängen. Bei den Signalen kann es sich um Sprachsignale, Audiosignale, Messsignale, biomedizinische Signale oder geophysikalische Signale handeln.

   Die Codierung hat die Aufgabe, die als Sequenz von Abstastwerten vorliegenden digitalen Signale auf eine äquivalente digitale Sequenz abzubilden, die entweder mit einer niedrigeren Informationsrate dargestellt werden kann (in der sogenannten Kompression) oder die besser an die Eigenschaften eines Übertragungssystems angepasst ist (z.B. in der sogenannten spektrumformenden Codierung). Die Codierung kann dabei für Zwecke der Übertragung, Speicherung, Wiedergabe, Synthese, Erkennung oder Manipulation des Signals einen wichtigen Zwischenschritt darstellen.
Der Stand der Technik für die Codierung digitaler Signale umfasst eine Vielzahl von Verfahren, die je nach Einsatzgebiet und Signaltyp unterschiedlich sind und auf verschiedenen methodischen Ansätzen beruhen.

   So benutzen beispielsweise zahlreiche Codierverfahren für Sprachsignale in der Telephonie Modellvorstellungen über die menschliche Sprache, wohingegen zahlreiche Codierverfahren für digitale Audiosignale auf Modelle des menschlichen Gehörs zurückgreifen und Codierfahren für Bild- oder Videosignale auf Modelle der menschlichen Sehwahrnehmung. Somit benötigt ein System, das mehrere verschiedene Signaltypen codieren soll auch mehrere Codierverfahren, um diese Signale darstellen zu können.

   Diese Anforderung trifft insbesondere auf Multimediasysteme zu, die durch die gemeinsame Verarbeitung von Signalen unterschiedlicher Medientypen charakterisiert sind.
Herkömmliche Verfahren der Multimediasignalcodierung versuchen der Vielfalt von Signaltypen dadurch gerecht zu werden, das für jeden Signaltyp ein eigenes spezialisiertes Verfahren entwickelt wird, die gegebenenfalls gebündelt in einem gemeinsamen Gesamtsystem zusammengefasst werden. Dadurch ist mit einer hohen Komplexität bei der Implementierung dieser Verfahren auf elektronischen Systemen zu rechnen.

   Ausserdem ist bei komprimierenden Codierverfahren für jeden Signaltyp der günstigste Kompromiss zwischen einer Datenreduktion und einer Einbusse bei der Qualität des decodierten Signals neu zu bestimmen.
Aufgabe der Erfindung ist es daher, ein verbessertes Verfahren zur Codierung eindimensionaler Signale zur Verfügung zu stellen, dass diese Aufgabe im Verbund mit der Codierung mehrdimensionaler Signale (Bilder bzw.

   Bildsequenzen) löst und somit den Gesamtaufwand für ein Codiersystem für gemischte Signaltypen reduziert und seinen Entwurf vereinfacht.
Gemäss der Erfindung, die sich auf die Codierung eindimensionaler digitaler Signale bezieht, wird die Aufgabe dadurch gelöst, dass die eindimensionalen Signale durch eine Signaltransformation auf eine zeitliche Sequenz zweidimensionaler Signale (Bilder) konvertiert werden, die in einem weiteren Verfahrensschritt prinzipiell mit jedem Codierverfahren für digitale Bildsequenzen oder Videocodierverfahren codiert werden kann. Beschreibung von Sprach-, Audio- und Videosignalen mit einem einzigen Videocodierverfahren genannt, die dadurch gelingt, dass die Sprach- und Audiosignale durch die genannte Signaltransformation auf ein Videosignal konvertiert werden.

   Vorteilhafte und zweckmässige Weiterbildungen des Verfahrens nach der Erfindung sowie besonders vorteilhafte Anwendungsmöglichkeiten dieses Verfahrens sind Gegenstand der auf den Anspruch 1 unmittelbar und mittelbar rückbezogenen Ansprüche.
Das Verfahren nach der Erfindung und weitere Verwendungsbeispiele werden im folgenden näher erläutert.
Als erster Verarbeitungsschritt wird eine Signaltransformation eingesetzt, die ein eindimensionales Signal in eine zeitliche Sequenz zweidimensionaler Signale konvertiert. Diese Signaltransformation kann durch zwei in Kaskade geschaltete Transformationsstufen erfolgen. Für diese Transformationsstufen kann jede Signaltransformation eingesetzt werden, die ein eindimensionales Signal in mehrere Teilsignale aufspaltet, wie das insbesondere bei den Fachkundigen bekannten Frequenztransformationen der Fall ist.

   Dabei handelt es sich z.B. um die diskrete Fouriertransformation, die diskrete Cosinustransformation, mehrkanalige Filterbänke und verwandte Transformationen. Durch die erste Transformationsstufe entsteht bereits eine mehrkanalige Darstellung des Eingangssignals in Form von N parallelen Teilsignalen. In einer vorteilhaften Realisierung sind diese N Teilsignale nach der Signalfrequenz als erste Dimension der zweidimensionalen Darstellung geordnet. Die zweite Transformationsstufe spaltet darauf jedes dieser Teilsignale mit einer zweiten Transformation seinerseits in eine mehrkanalige Darstellung auf. Dadurch entstehen aus jedem der N Teilsignale wiederum M neue Teilsignale. Diese zweite Transformation kann dieselbe mathematische Struktur wie die erste Transformation haben oder eine andere Transformation sein.

   In einer vorteilhaften Realisierung handelt es sich um eine zweite, genauere Frequenzanalyse oder, in einer anderen vorteilhaften Realisierung, um eine Analyse der im Signal vorhandenen Modulationsfrequenzen. Diese zweite vorteilhafte Realisierung wird durch Modellvorstellungen über die Signalverarbeitung im menschlichen Gehör unterstützt. Dieser zweite so erhaltene Frequenzparameter wird als zweite Dimension der zweidimensionalen Signaldarstellung herangezogen. Ordnet man nun alle gewonnen Teilsignale in einem Schema von N mal M Signalen an, so erhält man insgesamt ein Bild mit N mal M Bildpunkten, die sich zeitlich ändern.
Nach diesem ersten Verfahrensschritt der Signaltransformation kann in einem zweiten Verfahrensschritt die entstandene Sequenz von N mal M Bildpunkten mit einem Verfahren zur Codierung von Bildsequenzen (z.B.

   JPEG Joint Pictures Experts Group) oder mit einem Videocodierverfahren (z.B. MPEG Motion Pictures Experts Group) codiert werden. In einer vorteilhaften Realisierung wird dabei zunächst die Anzahl der Bilder pro Zeiteinheit durch zeitliche Unterabtastung reduziert. Anstelle eines standardisierten Bild- oder Videocodierverfahrens können auch andere, nicht standardisierte Verfahren eingesetzt werden.

   In einer vorteilhaften Realisierung werden dabei Effekte der menschlichen Hörwahrnehmung im Bild- oder Videocodierverfahren berücksichtigt.
Die so codierten eindimensionalen Signale können nun vorteilhaft gemeinsam mit anderen Bild- oder Videosignalen übertragen, gespeichert, wiedergegeben, synthetisiert, erkannt oder manipuliert werden, wobei durch die einheitlich Darstellung der verschiedenen Signaltypen als Bildsequenzen eine Reduktion der Komplexität des Gesamtsystems erreicht wird und auch die Bestimmung eines günstigen Kompromisses zwischen Datenreduktion und Signalqualität vereinfacht wird. Nach Durchführung der oben beispielhaft genannten Verarbeitungsschritte (wie Übertragung, Speicherung usw.) kann eine Decodierung der Bildsequenzen erfolgen, um die eindimensionalen Signale zurückzugewinnen.

   Dazu werden die Verfahrensschritte des Codierers schrittweise invertiert. In einem ersten Verfahrensschritt wird aus dem codierten Datenstrom durch Anwendung des zum Codierer passenden Decodierers für Bildsequenzen oder des Videodecodierers wieder eine Sequenz zweidimensionaler Signale gewonnen. In einem zweiten Verfahrensschritt wird auf diese Sequenz diejenige Signaltransformation angewandt, die als mathematische Umkehrung der im Codierer eingesetzten Signaltransformation anzusehen ist. Ist diese Transformation im Codierer zweistufig ausgeführt, so ist es vorteilhaft, auch die Transformation des Decodierers zweistufig aufzubauen, wobei für die im Codierer beispielhaft aufgezählten Signaltransformationen folgende inverse Transformationen zur Verfügung stehen: inverse diskrete Fouriertransformation, inverse diskrete Cosinustransformation, inverse mehrkanalige Filterbank.

   Der Fachkundige kann für eine Vielzahl verwandter Frequenztransformationen geeignete inverse Transformationen angeben. Nach Durchführung dieser inversen Transformation steht wiederum ein eindimensionales Signal am Ausgang des Decodierers zur Verfügung.

Claims (12)

Patentansprüche
1. Verfahren zur Codierung eindimensionaler digitaler Signale, dadurch gekennzeichnet, dass die eindimensionalen Signale durch eine Signaltransformation auf eine zeitliche Sequenz zweidimensionaler Signale (Bilder) konvertiert werden, die in einem weiteren Verfahrensschritt mit einem Codierverfahren für digitale Bildsequenzen bzw. mit einem Videocodierverfahren codiert werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich bei den eindimensionalen Signalen um digitale Sprachsignale oder digitale Audiosignale handelt.
3. Verfahren nach einem der Ansprüche 1 bis 2, dadurch gekennzeichnet, dass die Transformation der eindimensionalen Signale durch zwei in Kaskade geschaltete Stufen erfolgt.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Transformationsstufen eine mehrkanalige Filterbank oder eine diskrete Fouriertransformation oder eine diskrete Cosinustransformation oder eine andere Frequenztransformation umfassen, wie sie ein Fachkundiger zur Signalanalyse einsetzt.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Transformationsstufen der Signalanalyse im menschlichen Gehör entsprechen, bei denen die erste Stufe das Signal in mehrere Teilbandsignale aufspaltet und die zweite Stufe die in den Teilbandsignalen enthaltenen Modulationsfrequenzen analysiert.
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Abstastrate des zweidimensionalen Ausgangssignals der Transformationsstufen auf eine niedrigere Rate reduziert wird und damit eine geringere Anzahl von Bildern pro Zeiteinheit codiert werden muss.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die digitalen Bildsequenzen mit einem standardisierten Codierverfahren für digitale Bildsequenzen (z.B. JPEG, Joint Pictures Experts Group) oder Videocodierferfahren (z.B. MPEG, Motion Pictures Experts Group) codiert werden.
8. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die digitalen Bildsequenzen mit einem speziell angepassten Codierverfahren codiert werden, das Effekte der menschlichen Hörwahrnehmung berücksichtigt.
9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der codierte Datenstrom nach Dekodierung der Bildsequenzen mithilfe einer inversen Signaltransformation auf das ursprüngliche eindimensionale Signal konvertiert wird.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die inverse Signaltransformation die exakte oder näherungsweise mathematische Umkehrung der Transformationen gemäss einem der Ansprüche 3 bis 6 darstellt.
11. Verfahren nach einem der vorhergehenden Ansprüche, gekennzeichnet durch die Verwendung für die Übertragung, Speicherung, Wiedergabe, Synthese, Erkennung oder Manipulation von Sprachsignalen, Audiosignalen, Messsignalen, biomedizinischen oder geophysikalischen Signalen.
12. Verfahren nach Anspruch 11, gekennzeichnet durch die Verwendung in Multimediasystemen, in der Festnetz- oder Mobiltelephonie, oder in der Internetkommunikation.
AT14992002A 2002-10-04 2002-10-04 Verfahren zur codierung eindimensionaler digitaler signale AT500636A2 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AT14992002A AT500636A2 (de) 2002-10-04 2002-10-04 Verfahren zur codierung eindimensionaler digitaler signale

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
AT14992002A AT500636A2 (de) 2002-10-04 2002-10-04 Verfahren zur codierung eindimensionaler digitaler signale

Publications (1)

Publication Number Publication Date
AT500636A2 true AT500636A2 (de) 2006-02-15

Family

ID=35696061

Family Applications (1)

Application Number Title Priority Date Filing Date
AT14992002A AT500636A2 (de) 2002-10-04 2002-10-04 Verfahren zur codierung eindimensionaler digitaler signale

Country Status (1)

Country Link
AT (1) AT500636A2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634936A (zh) * 2019-09-24 2021-04-09 百度(美国)有限责任公司 用于原始音频的基于小占用空间流的模型

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634936A (zh) * 2019-09-24 2021-04-09 百度(美国)有限责任公司 用于原始音频的基于小占用空间流的模型

Similar Documents

Publication Publication Date Title
DE69608781T2 (de) Hybride wellenform- und modellbasierte kodierung und dekodierung von bildsignalen
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69737514T2 (de) System und verfahren zum bearbeiten wellenartiger und umgekehrten wellenartigen transformationen von digitalen daten
DE19534943B4 (de) Vorrichtung zur Komprimierung unter Verwendung von eingebetteten Kleinwellen
DE69722601T2 (de) Datenkompression mit hybrider verlustloser entropiekodierung von run-length codes
DE69213511T2 (de) Kodiervorrichtung zum Kodieren eines digitalen Bildsignals
EP1684521B1 (de) Umkehrbare zweidimensionale Vor-/Nachfilterung für überlappende biorthogonale Transformation
DE10200653B4 (de) Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
DE19534730B4 (de) Verfahren zum Codieren und Decodieren von Daten
EP2062254B1 (de) Steganographie in digitalen signal-codierern
WO2002089063A2 (de) Einrichtung zur interpolation von abtastwerten sowie bildencoder und bilddecoder
DE69722495T2 (de) Adaptives Abtastverfahren für Wavelet-Videokodierung
DE69121411T2 (de) Methode und gerät zur codierung von analogen signalen
EP2617198A1 (de) Kompression und dekompression von referenzbildern in einem videokoder
DE69013829T2 (de) Verfahren zum Multiplexieren eines Tonsignals mit einem analogen Videosignal und entsprechendes Verteilungssystem für Standbilder mit Ton.
EP0974105B1 (de) Verfahren zur mehrdimensionalen, diskreten wavelet-transformation und transformationseinheit zur durchführung des verfahrens
DE112010004844T5 (de) Videocodierung unter Verwendung von Pixeldatenströmen
DE69605818T2 (de) Verfahren für die wahl eines jpeg-quantifizierungsfaktors
DE60126895T2 (de) Verfahren und Vorrichtung zur Datenkompression
AT500636A2 (de) Verfahren zur codierung eindimensionaler digitaler signale
DE2460654A1 (de) Verfahren und einrichtung zum codieren eines gegebenen informationssignals
DE19951341B4 (de) Verfahren zur bewegungskompensierenden Prädiktion von Bewegtbildern sowie Einrichtung hierzu
DE102009039095A1 (de) Verfahren und Vorrichtung zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms
DE60210479T2 (de) Audiokodierer mit unregelmässiger filterbank
DE19960493B4 (de) Gerät und Verfahren zur Codierung eines Audio-/Videosignals

Legal Events

Date Code Title Description
REJ Rejection

Effective date: 20160515