DE4320990A1 - Verfahren zur Redundanzreduktion - Google Patents

Verfahren zur Redundanzreduktion

Info

Publication number
DE4320990A1
DE4320990A1 DE4320990A DE4320990A DE4320990A1 DE 4320990 A1 DE4320990 A1 DE 4320990A1 DE 4320990 A DE4320990 A DE 4320990A DE 4320990 A DE4320990 A DE 4320990A DE 4320990 A1 DE4320990 A1 DE 4320990A1
Authority
DE
Germany
Prior art keywords
signal
channel
predictor
transmitted
prediction error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE4320990A
Other languages
English (en)
Other versions
DE4320990B4 (de
Inventor
Bernd Dipl Ing Edler
Hendrik Dipl Ing Fuchs
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE4320990A priority Critical patent/DE4320990B4/de
Priority to US08/238,107 priority patent/US5511093A/en
Priority to GB9410528A priority patent/GB2279214B/en
Priority to FR9406820A priority patent/FR2706053B1/fr
Priority to JP12390894A priority patent/JP4095679B2/ja
Publication of DE4320990A1 publication Critical patent/DE4320990A1/de
Application granted granted Critical
Publication of DE4320990B4 publication Critical patent/DE4320990B4/de
Priority to JP2007323655A priority patent/JP4504414B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/02Arrangements for generating broadcast information; Arrangements for generating broadcast-related information with a direct linking to broadcast information or to broadcast space-time; Arrangements for simultaneous generation of broadcast information and broadcast-related information
    • H04H60/07Arrangements for generating broadcast information; Arrangements for generating broadcast-related information with a direct linking to broadcast information or to broadcast space-time; Arrangements for simultaneous generation of broadcast information and broadcast-related information characterised by processes or methods for the generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • H04B14/046Systems or methods for reducing noise or bandwidth
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/42Arrangements for resource management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

Stand der Technik
Die Erfindung geht aus von einem Verfahren zur Redundanzreduktion nach der Gattung des Hauptanspruchs. Es sind schon Verfahren zur Stereo-Redundanzreduktion aus J.D. Johnston, "Perceptual Transform Coding of Wideband Stereo Signals", Proc. of the ICASSP 1990 und aus R.G. van der Waal, R.N.J. Veldhuis, "Subband Coding of Stereophonic Digital Audio Signals", Proc. of the ICASSP 1991 bekannt, bei denen jedoch nur statistische Abhängigkeiten der in beiden Kanälen gleich­ zeitig auftretenden Abtastwerte ausgenutzt werden.
Vorteile der Erfindung
Das erfindungsgemäße Verfahren mit den Merkmalen des Hauptanspruchs hat demgegenüber den Vorteil, daß bestehende Kreuzkorrelationen un­ ter Berücksichtigung der Laufzeitunterschiede zur adaptiven In­ ter-Kanal-Prädiktion ausgenutzt werden. Dadurch wird der Datenre­ duktionsfaktor erhöht, d. h. die Datenredundanz verkleinert. Die Folge ist, daß eine bessere Qualität bei gleichem Reduktionsfaktor bzw. ein höherer Reduktionsfaktor bei gleicher Qualität erreicht wird.
Zeichnung
Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt und in der nachfolgen­ den Beschreibung näher erläutert. Es zeigt
Fig. 1 ein Zweikanalübertragungssystem,
Fig. 2 das Blockschaltbild eines Adaptiven Inter-Kanal-Prädiktors und
Fig. 3 eine Realisierung des Inter-Kanal-Prädiktors.
Beschreibung des Ausführungsbeispiels
In Fig. 1 sind zwei Signalkanäle dargestellt. Der erste Signalkanal enthält das zu den Abtast­ zeitpunkten n abgetastete Signal x(n), das über eine Datenleitung 21 einer Recheneinheit 1 mit Speicher zugeführt wird. Der zweite Signalkanal enthält das zu den Abtastzeitpunkten n abge­ tastete Signal y(n), das über eine weitere Datenleitung 22 der Recheneinheit 1 zugeführt wer­ den.
Die Recheneinheit 1 ermittelt, wie anschließend näher erläutert, aus dem aktuellen und den vorangegangenen Abtastwerten des Signals x(n) unter Verwendung einer Laufzeitkompensa­ tion um den Laufzeitunterschied d zwischen den beiden Signalen x(n) und y(n) sowie einer Prädiktion mit den Prädiktorkoeffizienten ak einen Schätzwert y′ (n) für den aktuellen Abtast­ wert y(n) des zweiten Kanals. Anschließend wird der Prädiktionsfehler e(n) berechnet, der sich als Differenz zwischen dem aktuellen Abtastwert y(n) und dem Schätzwert y′(n), also e(n) = y(n) - y′(n), ergibt. Die Recheneinheit 1 gibt das abgetastete Signal x(n) des ersten Ka­ nals, den Laufzeitunterschied (Verzögerung) d, die Prädiktorkoeffizienten ak und den Prädik­ tionsfehler e(n) über eine Datenleitung 20 an den Empfänger mit Recheneinheit 2 weiter. Die Datenübertragung kann jedoch auch über elektromagnetische Wellen erfolgen.
Der Empfänger mit Recheneinheit 2 rekonstruiert aus dem abgetasteten Signal x(n) des ersten Kanals, der Verzögerung d, den Prädiktorkoeffizienten ak und den Prädiktionsfehlern e(n) das Signal y(n) des zweiten Kanals und gibt dieses mit dem abgetasteten Signal x(n) zur weiteren Verarbeitung weiter.
In Fig. 2 ist die in Recheneinheit 1 enthaltene Adaptive Inter-Kanal-Prädiktion schematisch dargestellt. In einer Recheneinheit 3 werden, wie anschließend näher erläutert, für Blöcke von jeweils N aufeinanderfolgenden Abtastwerten der Signale x(n) und y(n) die optimalen Prädik­ torkoeffizienten ak und die optimale Verzögerung d ermittelt und an die Verzögerungsschal­ tung 3 bzw. den Prädiktor 4 sowie an die Recheneinheit 6 weitergegeben. Das abgetastete Signal x(n) wird einer Verzögerungsschaltung 3 zugeführt und danach einem Prädiktor 4 über­ geben. Auf diese Weise wird entsprechend der in der Beschreibung angegebenen Formel (1) ein Schätzwert y′(n) für den aktuellen Abtastwert y(n) des zweiten Kanals berechnet. Der Schätzwert y′(n) und der aktuelle Abtastwert y(n) werden einem Addierer 7 zugeführt, wobei der Schätzwert y′(n) mit einem negativen Vorzeichen versehen wird. Aus der Addition des Schätzwertes y′(n) und des aktuellen Abtastwertes y(n) wird entsprechend der Formel (2) der Prädiktionsfehler e(n) ermittelt, der anschließend ebenfalls an die Recheneinheit 6 weiterge­ reicht wird.
In Recheneinheit 6 erfolgt die für die Übertragung erforderliche weitere Bearbeitung, z. B. Co­ dierung und Multiplexing, die außerhalb der Adaptiven Inter-Kanal-Prädiktion liegt und hier nicht näher erläutert wird. Die Recheneinheit 6 gibt letztendlich das abgetastete Signal x(n), die Verzögerung d, die Prädiktorkoeffizienten ak und den Prädiktionsfehler über eine Daten­ leitung 20 an den Empfänger weiter.
Die Bestimmung der für einen Block von jeweils N aufeinanderfolgenden Abtastwerten opti­ malen Prädiktorkoeffizienten ak und des optimalen Laufzeitunterschiedes d erfolgt in Re­ cheneinheit 3 durch Minimierung der Prädiktionsfehlerleistung. Dabei wird unter Verwen­ dung der in Formel (10) angegebenen Vorschrift gemäß den Formeln (4), (5), (6), (7) und (8) die Prädiktionsfehlerleistung berechnet, die unter Variation der Verzögerung d und der Prädik­ torkoeffizienten ak minimiert wird.
Fig. 3 zeigt eine konkrete Realisierung des Inter-Kanal-Prädiktors, bestehend aus der Verzögerungsschaltung 3 und dem Prädiktor 4. Der abgetastete Signalwert x(n) des ersten Kanals 21 wird einer ersten Verzögerungsschaltung 8 zugeführt. Die Verzögerungsschaltung 8 spei­ chert den abgetasteten Signalwert x(n) für eine festgelegte Anzahl an Abtasttakten, den sogenannten Laufzeitunterschied d. Daraufhin wird der Signalwert x(n-d) einer zweiten Verzögerungsschaltung 10 und einem Nullten Multiplizierer 9 zugeführt.
In dem Nullten Multiplizierer 9 wird der Signalwert x(n-d) mit einem Prädiktorkoeffizienten a₀ multipliziert und an einen ersten Addie­ rer 12 weitergegeben. In der zweiten Verzögerungsschaltung 10 wird der Signalwert x(n-d) für einen Abtasttakt gespeichert und daraufhin der Signalwert x(n-d-1) einem ersten Multiplizierer 11 und an eine weitere Verzögerungsschaltung, die in der Fig. 3 in Form von Punk­ ten angedeutet ist, zugeführt. Der erste Multiplizierer 11 multipli­ ziert den Signalwert x(n-d-1) mit einem ersten Prädiktorkoeffizien­ ten a₁ und gibt das Produkt an den ersten Addierer 12 weiter.
Der erste Addierer 12 addiert das vom Nullten Multiplizierer 9 zuge­ führte Produkt (x(n-d)*a₀) mit dem vom ersten Multiplizierer 11 zugeführten Produkt (n(n-d-1)*a₁) und führt die Summe an einen weiteren Addierer, der in der Fig. 3 in Form von Punkten darge­ stellt ist, weiter. Mit Hilfe dieser Anordnung wird die in der Formel (1) dargestellte Summe, die den Schätzwert y′(n) für den aktuellen Abtastwert des Signals y(n) darstellt, realisiert. Zwi­ schen der ersten Verzögerungsschaltung 10 und der k-ten-Verzöge­ rungsschaltung 13 befinden sich weitere K-2 Verzögerungsschaltun­ gen.
Die Verzögerungsschaltungen sind jeweils mit einem Multiplizierer verbunden, der das zeitverzögerte Signal mit einem Prädiktorkoeffi­ zienten multipliziert und an einen Addierer weitergibt. Der Addierer summiert das von dem Multiplizierer zugeführte Produkt mit der von einem vorhergehenden Addierer ermittelten Summe und gibt diese Summe an einem weiteren Addierer weiter. Es sind also K-Zweige angeordnet, die analog zu der Verzögerungsschaltung 10, die mit dem Multipli­ zierer 11 verbunden ist und der Multiplizierer 11 mit dem Addierer 12 verbunden ist, aufgebaut sind.
In dem letzten Zweig K wird das von einer vorhergehenden Verzöge­ rungsschaltung zugeführte Signal in einer K-ten-Verzögerungsschal­ tung 13 für einen Abtasttakt gespeichert und das Signal x(n-d-K) an einen K-ten-Multiplizierer 14 zugeführt. Der K-te-Multiplizierer 14 multipliziert das zugeführte Signal mit einem K-ten-Prädiktions­ koeffizienten aK und gibt das Produkt (x(n-d-K)*aK) an einen K-ten-Addierer 15 weiter.
Der K-te-Addierer 15 addiert das Produkt, das vom K-ten-Multipli­ zierer 14 zugeführt wurde, und die Summe, die von einem (K-1)-ten Addierer ermittelt wurde zu einem Schätzwert y′(n), der in der For­ mel (1) dargestellt ist. Der K-te-Addierer 15 führt den Schätzwert y′(n) an den Addierer 7 weiter. Der Addierer 7 ermittelt aus dem aktuellen Abtastwert des Signals y(n) und dem Schätzwert y′(n) den Prädiktionsfehler e(n). Die Recheneinheit 1 mit Speicher optimiert nun den Prädiktionsfehler e(n).
Das in Fig. 3 schematisch dargestellte Verfahren zur Ermittlung des Prädiktionsfehlers e(n) unter Verwendung der Prädiktorkoeffizienten ak und des Laufzeitunterschiedes (Verzögerung) d wird, ebenso wie die bereits beschriebene Ermittlung der optimalen Verzögerung d und der optimalen Prädiktorkoeffizienten ak, von der Recheneinheit 1 mit Speicher ausgeführt.
Der Prädiktor 4 ist vorzugsweise als Fast Impulse Response (FIR) Filterstruktur ausgebildet, die aus Kammeyer "Nachrichtentechnik", Teubner Stuttgart, 1992, S. 487 bekannt ist.
Das hier vorgeschlagene Verfahren der Adaptiven Inter-Kanal-Prädiktion ermöglicht eine Redundanzreduktion bei der Codierung von mehrkanaligen Bild- und Tonsignalen, indem die zwischen den Kanälen bestehenden statistischen Bindungen ausgenutzt werden, wenn diese nicht unabhängig voneinander, sondern gemeinsam codiert werden.
Im Fall der Codierung von Stereo-Tonsignalen wird der Stand der Technik durch den als MPEG/Audio bekannten ISO/IEC Standardisierungsvorschlag [1] dargestellt. Das dort eingesetzte Verfahren zur Stereo-Redundanzreduktion basiert auf den in [2] und [3] veröffentlichten Arbeiten. Ein Stereo-Tonsignal zeichnet sich insbesondere dadurch aus, daß die Signale verschiedener Schallquellen in den beiden Kanälen zu unterschiedlichen Zeitpunkten und mit unterschiedlichen Pegeln auftreten, was bei allen heute bekannten Verfahren nur unzureichend berücksichtigt wird, da dort lediglich die statistischen Abhängigkeiten zwischen den beiden zeitgleichen Abtastwerten des linken und rechten Kanals ausgenutzt werden. Der verbesserte Ansatz, die sog. Adaptive Inter-Kanal-Prädiktion, beinhaltet eine laufzeitkompensierte Prädiktion höherer Ordnung, mit der aus den Abtastwerten des Signals in einem Kanal ein Schätzwert für den aktuellen Abtastwert im anderen Kanal berechnet wird. Ganz analog läßt sich dieser Ansatz für Signale mit mehr als zwei Kanälen übertragen. Fig. 2 zeigt das Blockschaltbild und Fig. 3 eine Realisierung des Inter-Kanal-Prädiktors.
Aus mehreren aufeinanderfolgenden Abtastwerten des Signals x(n) im einen Kanal wird der Schätzwert
für den aktuellen Abtastwert des Signals y(n) im jeweils anderen Kanal berechnet. Dabei kennzeichnet K den Grad des Prädiktors, ak die Prädiktorkoeffizienten und d eine Verzögerung, die einen Ausgleich von Laufzeitunterschieden ermöglicht. Der Prädiktionsfehler ergibt sich zu
e(n) = y(n) - y′(n) (2)
Verglichen mit der Varianz des Signals y(n) ist die Varianz des Prädiktionsfehlersignals e(n) verringert. Wird anstelle des Signals y(n) also das Prädiktionsfehlersignal e(n) codiert und übertragen, so führt dies zu einer Reduktion der Datenrate. Der Prädiktionsgewinn
ist durch das Verhältnis der Varianzen bestimmt.
Das hier vorgeschlagene Verfahren der Adaptiven Inter-Kanal-Prädiktion ermöglicht eine Redundanzreduktion bei der Codierung von mehrkanaligen Bild- und Tonsignalen, indem die zwischen den Kanälen bestehenden statistischen Bindungen ausgenutzt werden, wenn diese nicht unabhängig voneinander, sondern gemeinsam codiert werden.
Im Fall der Codierung von Stereo-Tonsignalen wird der Stand der Technik durch den als MPEG/Audio bekannten ISO/IEC Standardisierungsvorschlag [1] dargestellt. Das dort eingesetzte Verfahren zur Stereo-Redundanzreduktion basiert auf den in [2] und [3] veröffentlichten Arbeiten. Ein Stereo-Tonsignal zeichnet sich insbesondere dadurch aus, daß die Signale verschiedener Schallquellen in den beiden Kanälen zu unterschiedlichen Zeitpunkten und mit unterschiedlichen Pegeln auftreten, was bei allen heute bekannten Verfahren nur unzureichend berücksichtigt wird, da dort lediglich die statistischen Abhängigkeiten zwischen den beiden zeitgleichen Abtastwerten des linken und rechten Kanals ausgenutzt werden. Der verbesserte Ansatz, die sog. Adaptive Inter-Kanal-Prädiktion, beinhaltet eine laufzeitkompensierte Prädiktion höherer Ordnung, mit der aus den Abtastwerten des Signals in einem Kanal ein Schätzwert für den aktuellen Abtastwert im anderen Kanal berechnet wird. Ganz analog läßt sich dieser Ansatz für Signale mit mehr als zwei Kanälen übertragen. Fig. 2 zeigt das Blockschaltbild und Fig. 3 eine Realisierung des Inter-Kanal-Prädiktors.
Aus mehreren aufeinanderfolgenden Abtastwerten des Signals x(n) im einen Kanal wird der Schätzwert
für den aktuellen Abtastwert des Signals y(n) im jeweils anderen Kanal berechnet. Dabei kennzeichnet K den Grad des Prädiktors, ak die Prädiktorkoeffizienz und d eine Verzögerung, die einen Ausgleich von Laufzeitunterschieden ermöglicht. Der Prädiktionsfehler ergibt sich zu
e(n) = y(n) - y′(n) (2)
Verglichen mit der Varianz des Signals y(n) ist die Varianz des Prädiktionsfehlersignals e(n) verringert. Wird anstelle des Signals y(n) also das Prädiktionsfehlersignal e(n) codiert und übertragen, so führt dies zu einer Reduktion der Datenrate. Der Prädiktionsgewinn
ist durch das Verhältnis der Varianzen bestimmt.
Ohne Einschränkung der Allgemeinheit wird im folgenden angenommen, daß x(n), y(n), y′(n) und e(n) stationär und mittelwertfrei sind. Für eine vorgegebene Verzögerung d können die optimalen Prädiktorkoeffizienten ak durch Minimierung der Varianz des Prädiktionsfehlersignals σe² = E[e²(n)] berechnet werden. Dies führt auf das folgende lineare Gleichungssystem
wobei
σx² = E[x²(n-d-k) ] (5)
die Varianz der Abtastwerte des Signals x(n) ist,
die Autokorrelationskoeffizienten der Abtastwerte des Signals x(n) und
die Kreuzkorrelationskoeffizienten zwischen den Abtastwerten der Signale x(n) und y(n) sind.
Für die optimalen Prädiktorkoeffizienten ak wird die Prädiktionsfehlerleistung
minimal und der Prädiktionsgewinn
maximal für den vorgegebenen Wert der Verzögerung d.
Die Verzögerung d kann z. B. der aus einer Vorabanalyse bestimmte Schätzwert für den Laufzeitunterschied zwischen den Signalen x(n) und y(n) sein. Der maximale Prädiktionsgewinn läßt sich durch gleichzeitige Optimierung der Prädiktorkoeffizienten ak und der Verzögerung d erreichen.
Bei nichtstationären Eingangssignalen sind die optimalen Prädiktorparameter von den aktuellen Signaleigenschaften abhängig, d. h. zeitvariant. Daher ist es vorteilhaft, den Prädiktor an die aktuellen Signaleigenschaften zu adaptieren. Dies läßt sich erreichen, indem die Codierung der Signale x(n) und y(n) in Blöcken {x(mN) . . . x(mN+N-1)} bzw. {y(mN) . . . y(mN+N-1)} erfolgt und die zugehörigen optimalen Prädiktorparameter unter Verwendung der Kurzzeitmittelwerte
berechnet werden. Auf diese Weise wird die Prädiktionsfehlerleistung für jeden Block minimiert. Für jeden Block müssen daher neben dem Signal x(n) und dem Prädiktionsfehlersignal e(n) auch die Prädiktorparameter übertragen werden.
Um die Effizienz der Adaptiven Inter-Kanal-Prädiktion zu erhöhen, wird diese nicht auf das breitbandige Eingangssignal, sondern auf schmalbandige Spektralkomponenten angewendet. Dabei wird die Tatsache ausgenutzt, daß die Prädiktion bei einzelnen tonalen Signalkomponenten besonders effektiv ist. Bei der Anwendung der Adaptiven Inter-Kanal-Prädiktion auf schmalbandige Spektralkomponenten ist einerseits gewährleistet, daß nur einzelne oder wenige tonale Signalkomponenten in einer Spektralkomponente enthalten sind und somit Prädiktoren geringer Ordnung verwendet werden können. Außerdem lassen sich so die Prädiktorparameter an die signalabhängige Verteilung der tonalen Signalkomponenten im Spektralbereich anpassen, so daß z. B. in Spektralkomponenten, die keine tonalen Signalkomponenten enthalten, die Prädiktion abgeschaltet werden kann.
In einem ersten Schritt wurde die Adaptive Inter-Kanal-Prädiktion in einen ISO MPEG Layer II Codec [1] integriert, wo die Spektralkomponenten mittels einer gleichförmigen Filterbank mit 32 Teilbändern gewonnen werden. In diesem Fall sind x(n) und y(n) die unterabgetasteten Signale des Stereosignals im i-ten Teilband. Für x(n) = l(n) und y(n) = r(n) erfolgt die Prädiktion vom linken auf das rechte Signal. Vertauscht man die Zuordnung, so ergibt sich die umgekehrte Prädiktionsrichtung. Die Prädiktorkoeffizienten ak und die Verzögerung d werden jeweils für kurze Zeitintervalle (T=24 ms) bestimmt. Eine Besonderheit des Adaptiven Inter-Kanal-Prädiktors liegt darin, daß die Prädiktorstruktur sowohl im Encoder als auch im Decoder eine FIR-Struktur ist und daher keinerlei Einschwing- und Stabilitätsprobleme auftreten. Dies ist insbesondere dann wichtig, wenn man mit der Decodierung an beliebigen Stellen im Signal beginnen möchte.
Anstelle von x(n) und y(n) müssen hier x(n) und e(n) codiert und übertragen werden. Weiterhin muß die für den Prädiktor notwendige Nebeninformation (Verzögerung d, Prädiktorkoeffizienten ak) übertragen werden. Die Prädiktionsrichtung, d. h. die Zuordnung von l(n) und r(n) und x(n) und y(n), kann fest oder variabel sein und muß dann auch übertragen werden. Im Encoder werden als Eingangswerte des Prädiktors die quantisierten Werte von x(n) verwendet. Dadurch wird gewährleistet, daß die Prädiktoren sowohl im Encoder als auch im Decoder gleiche Eingangssignale verarbeiten. Die Quantisierungsfehler des Signals y(n) sind somit identisch mit denen des Prädiktionsfehlersignals e(n). Andernfalls würde eine zusätzlichhe Überlagerung der Quantisierungsfehler des Signals x(n) hinzukommen.
Erste Untersuchungen haben gezeigt, daß sich insbesondere für eine Klasse von Testsignalen, die sich in den während der ISO-Standardisierung durchgeführten Hörtests [4] als besonders kritisch erwiesen hat (Testsignale mit Einzelinstrument-Charakteristik, die sehr viele tonale Spektralkomponenten von teilweise relativ hoher Energie auch im oberen Frequenzbereich aufweisen, wie z. B. "Klarinette" oder "Harpsichord"), große Prädiktionsgewinne ergeben. Für das Testsignal "Klarinette" ergeben sich beispielsweise in einzelnen Teilbändern über große Signalabschnitte Prädiktionsgewinne im Bereich zwischen 30 und 40 dB, was zu einer deutlichen Verbesserung der Audioqualität führt. Der Prädiktionsgewinn ist hauptsächlich auf die unteren 6-12 Teilbänder konzentriert. Bei verschiedenen Testsignalen ergaben sich mittlere Prädiktionsgewinne in diesen unteren Teilbändern liegt zwischen 3 und 16 dB, in den oberen Teilbändern dagegen liegt er unterhalb von 3 dB, über das gesamte Signal gemittelt liegt der Prädiktionsgewinn zwischen 1.5 und 6.5 dB.
Eine wesentliche Besonderheit der Adaptiven Inter-Kanal-Prädiktion liegt in der Tatsache, daß sich große Prädiktionsgewinne insbesondere in solchen Signalabschnitten ergeben, die besonders schwierig zu codieren sind, also sehr viel Datenrate erfordern.
[1] ISO/IEC, "Draft International Standard DIS 11172: Information technology - coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s", ISO/IEC JTC1/SC29/WG11, Geneva, April 1992.
[2] J.D: Johnston, "Perceptual Transform Coding of Wideband Stereo Signals", Proc. of the ICASSP 1990.
[3] R.G. van der Waal, R.N.J. Veldhuis, "Subband Coding of Stereophonic Digital Audio Signals", Proc. of the ICASSP 1991.
[4] H. Fuchs, "Report on the MPEG/Audio subjective listening tests in Hannover", ISO/IEC JTC1/SC29/WG11: Doc.-No. MPEG 91/331, November 1991.

Claims (2)

1. Verfahren zur Reduzierung von Daten bei einer Datenübertragung von mindestens zwei Ton- und/oder Bildkanälen, wobei statistische Bindungen zwischen den Kanälen ermittelt werden, die bei einer ge­ meinsamen Codierung ausgenutzt werden, und ein Signal eines Kanals und ein Prädiktionsfehler zusammen mit den aus den statistischen Bindungen ermittelten Prädiktorkoeffizienten und Laufzeit­ unterschieden übertragen werden und von einem Empfänger aus dem übertragenen Signal eines Kanals und dem Prädiktionsfehler und den Prädiktorkoeffizienten und den Laufzeitunterschieden das Signal des anderen Kanals rekonstruiert wird, indem zeitlich verschobene Kreuz­ korrelationen und die entsprechenden Laufzeitunterschiede zwischen den Signalen der zwei Kanäle ermittelt werden, ein Signalkanal und die aus den ermittelten Kreuzkorrelationen gewonnenen Prädiktor­ koeffizienten und Laufzeitunterschiede d übertragen werden und aus dem übertragenen Signal, dem Prädiktionsfehler, den Prädiktor­ koeffizienten und den Laufzeitunterschieden beim Empfänger das Signal des zweiten Kanals rekonstruiert wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
daß die Kreuzkorrelation zwischen den zwei Signalkanälen ausgenutzt wird, indem ein Schätzwert y′(n) aus abgetasteten Signalwerten x(n) des ersten Kanals nach folgender Summenformel ermittelt werden: wobei y′(n) ein Schätzwert des Signalwertes y(n) des zweiten Kanals zum Abtastzeitpunkt n ist, ak ein Prädiktorkoeffizient, d ein Laufzeitunterschied, der aus einer festgelegte Anzahl an Abtasttakten besteht, k eine Laufvariable und K eine festgelegte Zahl ist, die den Grad des Prädiktors festlegt, und x(n-d-k) der Abtastwert des Signals des ersten Kanals zum Ab­ tastzeitpunkt (n-d-k) ist und
daß der Schätzwert y′(n) mit dem Abtastwert y(n) des zweiten Kanals verglichen wird und ein Prädiktionsfehler e(n) ermittelt wird und die Prädiktorkoeffizienten ak und der Laufzeitunterschied d durch Minimierung des Prädiktionsfehlers e(n) optimiert werden und der Prädiktionsfehler e(n), die Prädiktorkoeffizienten ak′ der Lauf­ zeitunterschied d und das Signal x(n) des ersten Kanals übertragen werden und aus diesen Daten das Signal des zweiten Kanals beim Empfänger rekonstruiert wird.
DE4320990A 1993-06-05 1993-06-24 Verfahren zur Redundanzreduktion Expired - Fee Related DE4320990B4 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE4320990A DE4320990B4 (de) 1993-06-05 1993-06-24 Verfahren zur Redundanzreduktion
US08/238,107 US5511093A (en) 1993-06-05 1994-05-04 Method for reducing data in a multi-channel data transmission
GB9410528A GB2279214B (en) 1993-06-05 1994-05-26 Method of reducing redundancy
FR9406820A FR2706053B1 (fr) 1993-06-05 1994-06-03 Procédé pour réduire la redondance des données.
JP12390894A JP4095679B2 (ja) 1993-06-05 1994-06-06 冗長性低減方法
JP2007323655A JP4504414B2 (ja) 1993-06-05 2007-12-14 冗長性低減方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE4318763 1993-06-05
DEP4318763.3 1993-06-05
DE4320990A DE4320990B4 (de) 1993-06-05 1993-06-24 Verfahren zur Redundanzreduktion

Publications (2)

Publication Number Publication Date
DE4320990A1 true DE4320990A1 (de) 1995-01-05
DE4320990B4 DE4320990B4 (de) 2004-04-29

Family

ID=25926535

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4320990A Expired - Fee Related DE4320990B4 (de) 1993-06-05 1993-06-24 Verfahren zur Redundanzreduktion

Country Status (5)

Country Link
US (1) US5511093A (de)
JP (2) JP4095679B2 (de)
DE (1) DE4320990B4 (de)
FR (1) FR2706053B1 (de)
GB (1) GB2279214B (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997004621A1 (de) 1995-07-20 1997-02-06 Robert Bosch Gmbh Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5710786A (en) * 1995-08-25 1998-01-20 Sdl, Inc. Optical fibre laser pump source for fibre amplifiers
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
US6782365B1 (en) 1996-12-20 2004-08-24 Qwest Communications International Inc. Graphic interface system and product for editing encoded audio data
US5864820A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for mixing of encoded audio signals
US5864813A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for harmonic enhancement of encoded audio signals
US6516299B1 (en) 1996-12-20 2003-02-04 Qwest Communication International, Inc. Method, system and product for modifying the dynamic range of encoded audio signals
US5845251A (en) * 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
US6463405B1 (en) 1996-12-20 2002-10-08 Eliot M. Case Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
US6477496B1 (en) 1996-12-20 2002-11-05 Eliot M. Case Signal synthesis by decoding subband scale factors from one audio signal and subband samples from different one
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6370180B2 (en) 1999-01-08 2002-04-09 Corning Incorporated Semiconductor-solid state laser optical waveguide pump
US6961432B1 (en) * 1999-04-29 2005-11-01 Agere Systems Inc. Multidescriptive coding technique for multistream communication of signals
SG99314A1 (en) * 2000-07-19 2003-10-27 Ct For Signal Proc Nanyang Tec Method and apparatus for the prediction of audio signals
KR100322485B1 (ko) * 2001-07-05 2002-02-07 이동욱 다중채널 영상신호 부호화 장치 및 그 방법
US6751587B2 (en) * 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
CN1311426C (zh) * 2002-04-10 2007-04-18 皇家飞利浦电子股份有限公司 立体声信号的编码、解码方法和装置及其传输设备
KR101016251B1 (ko) 2002-04-10 2011-02-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호의 코딩
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
ATE545131T1 (de) * 2004-12-27 2012-02-15 Panasonic Corp Tonkodierungsvorrichtung und tonkodierungsmethode
BRPI0608753B1 (pt) * 2005-03-30 2019-12-24 Koninl Philips Electronics Nv codificador de áudio, decodificador de áudio, método para codificar um sinal de áudio de multicanal, método para gerar um sinal de áudio de multicanal, sinal de áudio de multicanal codificado, e meio de armazenamento
EP1953736A4 (de) * 2005-10-31 2009-08-05 Panasonic Corp Stereo-codierungseinrichtung und stereosignal-prädiktionsverfahren
CN1909064B (zh) * 2006-08-22 2011-05-18 复旦大学 一种在线自然语音卷积混合信号的时域盲分离方法
EP2133872B1 (de) 2007-03-30 2012-02-29 Panasonic Corporation Codierungseinrichtung und codierungsverfahren
WO2008132826A1 (ja) * 2007-04-20 2008-11-06 Panasonic Corporation ステレオ音声符号化装置およびステレオ音声符号化方法
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
WO2009057327A1 (ja) 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
US8918325B2 (en) * 2009-06-01 2014-12-23 Mitsubishi Electric Corporation Signal processing device for processing stereo signals
EP2539889B1 (de) * 2010-02-24 2016-08-24 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung zur erzeugung eines verstärkten abwärtsmischsignals, verfahren zur erzeugung eines verstärkten abwärtsmischsignals und computerprogramm
US10757485B2 (en) 2017-08-25 2020-08-25 Honda Motor Co., Ltd. System and method for synchronized vehicle sensor data acquisition processing using vehicular communication
US11181929B2 (en) 2018-07-31 2021-11-23 Honda Motor Co., Ltd. System and method for shared autonomy through cooperative sensing
US11163317B2 (en) 2018-07-31 2021-11-02 Honda Motor Co., Ltd. System and method for shared autonomy through cooperative sensing

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4141034A (en) * 1977-08-19 1979-02-20 Bell Telephone Laboratories, Incorporated Digital encoding of color video signals
JPH0761043B2 (ja) * 1986-04-10 1995-06-28 株式会社東芝 ステレオ音声伝送蓄積方式
CA1268546C (en) * 1985-08-30 1990-05-01 STEREO VOICE SIGNAL TRANSMISSION SYSTEM
JPH0758938B2 (ja) * 1985-08-30 1995-06-21 株式会社東芝 ステレオ信号伝送符号化・復号化方法、符号化装置および復号化装置
EP0342687B1 (de) * 1988-05-20 1995-04-12 Nec Corporation Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5253275A (en) * 1991-01-07 1993-10-12 H. Lee Browne Audio and video transmission and receiving system
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997004621A1 (de) 1995-07-20 1997-02-06 Robert Bosch Gmbh Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen

Also Published As

Publication number Publication date
GB9410528D0 (en) 1994-07-13
JPH0723009A (ja) 1995-01-24
DE4320990B4 (de) 2004-04-29
GB2279214A (en) 1994-12-21
US5511093A (en) 1996-04-23
JP2008146081A (ja) 2008-06-26
FR2706053B1 (fr) 1995-11-03
JP4095679B2 (ja) 2008-06-04
JP4504414B2 (ja) 2010-07-14
FR2706053A1 (fr) 1994-12-09
GB2279214B (en) 1997-12-10

Similar Documents

Publication Publication Date Title
DE4320990B4 (de) Verfahren zur Redundanzreduktion
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE19811039B4 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE102004009954B4 (de) Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
DE60225381T2 (de) Verfahren zur Kodierung von Sprach- und Musiksignalen
DE60317722T2 (de) Verfahren zur Reduzierung von Aliasing-Störungen, die durch die Anpassung der spektralen Hüllkurve in Realwertfilterbanken verursacht werden
WO1999004506A1 (de) Verfahren zum codieren eines audiosignals
EP3544003B1 (de) Vorrichtung und verfahren zum ermitteln eines schätzwerts
DE69121411T2 (de) Methode und gerät zur codierung von analogen signalen
DE10236694A1 (de) Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
WO2003088212A1 (de) Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten
DE102006051673A1 (de) Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
DE69015105T2 (de) Kompressionseinrichtung für transformiertes, digitales Audiosignal mit adaptiver Quantisierung auf Grund eines psycho-akustischen Kriteriums.
EP1397799B1 (de) Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten
EP0464534B1 (de) Transformationskodierer mit adaptiver Fensterfunktion
DE19743662A1 (de) Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
DE68907098T2 (de) Differentieller Kodierer mit auto-adaptivem Prädiktorfilter und dazugehörigem Dekodierer.
DE60116809T2 (de) Vorrichtung zum Transkodieren eines Audiodatenstroms

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20130101