DE4345171A1 - Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen - Google Patents

Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen

Info

Publication number
DE4345171A1
DE4345171A1 DE4345171A DE4345171A DE4345171A1 DE 4345171 A1 DE4345171 A1 DE 4345171A1 DE 4345171 A DE4345171 A DE 4345171A DE 4345171 A DE4345171 A DE 4345171A DE 4345171 A1 DE4345171 A1 DE 4345171A1
Authority
DE
Germany
Prior art keywords
coding
signals
similarity
determined
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE4345171A
Other languages
English (en)
Other versions
DE4345171C2 (de
Inventor
Juergen Dipl Ing Herre
Bernhard Dipl Ing Grill
Ernst Dipl Ing Eberlein
Karlheinz Dr Brandenburg
Dieter Prof Dr Seitzer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority claimed from DE4331376A external-priority patent/DE4331376C1/de
Priority to DE4331376A priority Critical patent/DE4331376C1/de
Priority to DE4345171A priority patent/DE4345171C2/de
Priority to DK94920980.3T priority patent/DK0719483T3/da
Priority to KR1019950705724A priority patent/KR0171100B1/ko
Priority to EP94920980A priority patent/EP0719483B1/de
Priority to AT94920980T priority patent/ATE152871T1/de
Priority to US08/557,046 priority patent/US5736943A/en
Priority to JP7508926A priority patent/JP2800068B2/ja
Priority to RU96107254A priority patent/RU2124272C1/ru
Priority to AU71879/94A priority patent/AU678270B2/en
Priority to DE59402680T priority patent/DE59402680D1/de
Priority to PCT/EP1994/002250 priority patent/WO1995008227A1/de
Priority to CA002161263A priority patent/CA2161263C/en
Publication of DE4345171A1 publication Critical patent/DE4345171A1/de
Publication of DE4345171C2 publication Critical patent/DE4345171C2/de
Application granted granted Critical
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Die Erfindung bezieht sich auf ein Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenig­ stens zwei Signalen, bei dem jedes Signal in den Frequenzbe­ reich transformiert wird und ausgehend von den Spektralwer­ ten ein Ähnlichkeitsmaß für die Ähnlichkeit von jeweils we­ nigstens zwei Signalen zueinander ermittelt wird, gemäß dem Oberbegriff des Patentanspruchs 1.
Insbesondere befaßt sich die Erfindung mit einer optimierten Codierungswahl für die Codierung von zwei oder mehr Signa­ len, von denen wenigstens zwei voneinander nicht unabhängig sind, sondern zumindest teilweise redundante bzw. irrele­ vante Informationen enthalten.
Allgemein werden bei Verfahren zur datenreduzierten Codie­ rung digitaler Audiosignale die Signale aus dem Zeitbereich zunächst in den Frequenzbereich transformiert. Handelt es sich um Signale, die nicht unabhängig voneinander sind, so ist es üblich, sich einer datenreduzierenden Codierung zu bedienen, welche die Redundanz zwischen den beiden oder den mehreren Kanälen berücksichtigt.
Eine derartige Codierung ist als sogenannte Mitte/Seite-Co­ dierung bekannt geworden (J. D. Johnston, "Perceptual Trans­ form Coding of Wideband Stereo Signal", IC ASSP, IEEE, 1989, S. 1993 bis 1996). Bei dieser Mitte/Seite-Codierung wird aufgrund des linken und rechten Kanales einerseits die Summe bzw. Mitte und anderseits die Differenz bzw. Seite der Ste­ reosignale codiert.
Eine weitere, mittlerweile übliche Codierungsart ist das Intensity-Stereo-Verfahren, das in der Veröffentlichung "Subband Coding of Stereophonie Digital Audio Signals", Proc. of the IC ASSP, 1991, IEEE, Toronto, S. 3601 bis 3604, beschrieben ist. Bei dem Intensity-Stereo-Verfahren wird aufgrund der beiden Kanäle ein Monosignal gebildet und mit einer zusätzlichen Information über die Links/Rechts-Vertei­ lung des Signales übertragen.
Bereits in dem Deutschen Patent 41 36 825 der Anmelderin ist es beschrieben, daß bei derartigen Verfahren starke Störun­ gen auftreten können, wenn die Signale nur eine relativ ge­ ringe Ähnlichkeit aufweisen oder gar vollständig unabhängig voneinander sind. So ist es bekannt, daß eine stark unter­ schiedliche Zusammensetzung der Signale im linken und rech­ ten Kanal bei der Mitte/Seite-Codierung zu Artefakten führt, die durch das tatsächlich im Kanal vorhandene Signal nicht verdeckt werden können. Bei der Verwendung des Intensity- Stereo-Verfahrens kann es zur Zerstörung des räumlichen Klangbildes kommen, wenn der linke und rechte Kanal erheb­ lich voneinander abweichende Spektralwerte haben.
Um diesem Problem zu begegnen, wird in der bereits genannten Deutschen Patentschrift 41 36 825 vorgeschlagen, aufgrund der Spektralwerte der in den Frequenzbereich transformierten Signale ein Ähnlichkeitsmaß zu ermitteln, aufgrund dessen eine Umschaltung zwischen unterschiedlichen Codierungsarten vorgenommen wird. Ergeben die Spektralwerte ein hohes Ähn­ lichkeitsmaß, so wird bei dem dort beschriebenen Verfahren eine Mitte/Seite-Codierung eingesetzt, während im Falle eines niedrigen Ähnlichkeitsmaßes und somit im Falle einer geringen spektralen Ähnlichkeit der betrachteten Kanäle eine getrennte Codierung der Kanäle vorgenommen wird. Gleichfalls ist es aus diesem Patent bekannt, aufgrund der zu codieren­ den Signale mittels eines psychoakustischen Modelles die Maskierungsschwelle zu berechnen, mit der eine der Mitte/Seite-Codierungstufe nachgeschaltete Datenverminde­ rungsstufe angesteuert wird, die unter Berücksichtigung der Verdeckung eine Datenreduktion erreicht.
Obgleich mit dem aus dem Deutschen Patent 41 36 825 bekann­ ten Verfahren bereits eine erhebliche Qualitätssteigerung gegenüber unveränderten Mitte/ Seite-Codierungs-Verfahren so­ wie gegenüber unveränderten Intensity-Stereo-Verfahren er­ reicht wird, ist eine weitere Steigerung der Qualität der zu übertragenden Daten bei weiterer Reduktion der Datenrate wünschenswert.
Ausgehend von diesem Stand der Technik liegt der Erfindung daher die Aufgabe zugrunde, ein Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen so weiterzubilden, daß bei Erhöhung der Quali­ tät der codierten Daten bzw. Erhöhung der Qualität der auf­ grund dieser Daten decodierten Signale eine weitere Datenre­ duktion erreicht wird.
Diese Aufgabe wird durch Verfahren gemäß Patentanspruch 1 gelöst.
Gemäß einem wesentlichen Aspekt der Erfindung wird ausgehend von den Spektralwerten zweier Signale, die beispielsweise zwei unterschiedlichen Kanälen entsprechen, eine Selektion oder Bewertung der tatsächlich hörbaren Spektralanteile unter Verwendung einer durch eine psychoakustische Berechnung ermittelten Mithörschwelle vorgenommen, woraufhin das Ähnlichkeitsmaß, mit dem eine von wenigstens zwei Codie­ rungsarten ausgewählt wird, aufgrund der so selektierten oder bewerteten hörbaren Spektralanteile der wenigstens zwei Signale ermittelt wird. Dieser Ansatz der Erfindung nutzt im Gegensatz zum Stand der Technik die durch eine psychoaku­ stische Berechnung ermittelte Mithörschwelle nicht oder zumindest nicht nur zum Zwecke der Datenreduktion des codierten Signales, sondern für die Bestimmung des Ähnlich­ keitsmaßes, mit dem die Auswahl der Codierungsart vorge­ nommen wird. Dieses Konzept, das den drei Aspekten der Erfindung gemeinsam ist, steht im klaren Gegensatz zum bisherigen Stand der Technik und erlaubt eine Auswahl der Codierungsart unter psychoakustischen Gesichtspunkten.
Bevorzugte Weiterbildungen der erfindungsgemäßen Verfahren sind in den Unteransprüchen festgelegt.
Nachfolgend werden unter Bezugnahme auf die bei liegenden Zeichnungen bevorzugte Ausführungsbeispiele von Vorrich­ tungen zur Durchführung der erfindungsgemäßen Verfahren näher erläutert. Es zeigt:
Fig. 1a ein erstes Ausführungsbeispiel einer Vorrichtung zur Durchführung wesentlicher Teile des Verfahrens zur Bestimmung der zu wählenden Codierungsart;
Fig. 1b ein zweites, gegenüber dem ersten Ausführungsbei­ spiel nur geringfügig abgewandeltes Ausführungs­ beispiel einer Vorrichtung zur Durchführung wesent­ licher Teile des Verfahrens zur Bestimmung der zu wählenden Codierungsart;
Fig. 2 ein drittes Ausführungsbeispiel einer Vorrichtung zur Durchführung wesentlicher Teile des erfindungs­ gemäßen Verfahrens zur Bestimmung der zu wählenden Codierungsart;
Fig. 3 ein Blockdiagramm einer Vorrichtung zum Bestimmen des Ähnlichkeitsmaßes aufgrund der Ausgangssignale der Vorrichtung gemäß Fig. 1;
Fig. 4 ein Blockdiagramm einer Vorrichtung zum Bestimmen des Ahnlichkeitsmaßes aufgrund der Ausgangssignale einer Vorrichtung gemäß Fig. 2;
Fig. 5 ein gegenüber der Fig. 3 abgewandeltes Blockdia­ gramm der Vorrichtung zum Bestimmen des Ähnlich­ keitsmaßes aufgrund der Ausgangssignale der Vor­ richtung gemäß Fig. 1;
Fig. 6 ein Blockdiagramm zur Verdeutlichung der Struktur der jeweiligen ersten beiden Blöcke für jedes Sig­ nal bei den Vorrichtungen gemäß den Fig. 1 und 2 zur Durchführung der Zeit/Frequenz-Transformation und der Bestimmung der Kurzzeitenergien und
Fig. 7 eine Tabelle zur Verdeutlichung der Funktionsweise und Struktur einer Hybrid- bzw. Polyphasen-Filter­ bank zur Durchführung einer an die Charakteristik des menschlichen Hörsinnes angepaßten Transforma­ tion mit ungleicher Zeit/Frequenz-Auflösung.
Fig. 1a zeigt das Blockdiagramm einer Vorrichtung zur Durch­ führung wesentlicher Teile des Verfahrens nach dem ersten Aspekt zum Bestimmen der zu wählenden Codierungsart. Das hier gezeigte Ausführungsbeispiel ist einsetzbar zur Steuerung der Umschaltung zwischen einer getrennten Codierung von zwei Stereokanälen k1, k2 und einer Codierung nach dem "Intensity-Stereo-Codierungsverfahren", welches an sich aus der eingangs gewürdigten Schrift zu entnehmen ist.
Es sei jedoch bereits an dieser Stelle hervorgehoben, daß die Verfahren sich nicht nur zur Auswahl entweder einer getrennten Codierung zweier Stereokanäle k1, k2 oder einer Codierung der Kanäle nach dem Intensity-Stereo-Verfahren eignen, sondern auch zur Auswahl einer Codierungsart von wenigstens zwei beliebigen Codierungsarten dient, von denen sich eine besser als die nicht-ausgewählte andere zur Codierung von Signalen eignet, die eine gewisse Ähnlichkeit untereinander haben, wodurch eine höhere Bitreduktion erreicht wird. Die Anwendung des erfindungsgemäßen Verfahren, wie sie nachfolgend im einzelnen erläutert wer­ den, beschränkt sich nicht auf die Codierung von Stereosig­ nalen beispielsweise gemäß ISO/MPEG Layer 1 bis 3, sondern beispielsweise auch für die Multikanalcodierung, wie sie beispielsweise gemäß MPEG 2 vorgenommen werden kann.
Wie in Fig. 1a verdeutlicht wird, enthält die dort gezeigte Vorrichtung vier Signalverarbeitungszweige z1, z2, z3, z4, von denen ein jeder drei übereinstimmende Blöcke b1, b2, b3 aufweist.
Der Block b1 dient zur Zeit/Frequenz-Transformation des eingangsseitigen diskreten Zeitsignales k1, k2, ki1, ki2. In Betracht kommen hier beliebige, an sich bekannte Frequenz­ transformationsverfahren für die Transformation der ein­ gangsseitigen Audiodaten von dem Zeitbereich in dem Frequenz- bzw. Spektralbereich. In Betracht kommen Ver­ fahren, wie beispielsweise FFT, DCT, MDCT, die Verwendung einer Polyphasenfilterbank oder einer Hybridfilterbank.
Vorzugsweise bedient sich jedoch, wie nachfolgend im einzel­ nen näher erläutert werden wird, die Erfindung eines Trans­ formationsverfahrens mit ungleicher Zeit- und Frequenzauf­ lösung, die der Charakteristik des menschlichen Hörsinnes angepaßt ist. Bei einem derartigen Verfahren, wie es an sich im Bereich der Psychoakustik bekannt ist, haben lediglich die unteren Frequenzgruppen eine übereinstimmende Breite, während die Breite von Frequenzgruppen ab einer bestimmten Frequenz zunimmt, wie dies im einzelnen unter Bezugnahme auf die Tabelle der Fig. 7 weiter verdeutlicht werden wird. Entsprechend der Heisenberg-Grenze von 0,5 für das Produkt aus Frequenzgruppenbreite und Zeitauflösung nimmt die Zeitauflösung mit zunehmender Frequenzgruppenbreite ab.
Im zweiten Block b2 werden die durch Transformation gewon­ nenen Spektralwerte beispielsweise durch Quadrierung und Summation über die entsprechenden Zeiten in Kurzzeitenergie­ werte für die einzelnen Frequenzgruppenbänder umgewandelt. Die so gewonnen Kurzzeitenergiewerte für die einzelnen Fre­ quenzgruppenbreiten werden im dritten Block b3 unter Verwen­ dung einer Mithörschwelle, die aus einer psychoakustischen Berechnung für das betreffende Signal hergeleitet ist, se­ lektiert oder bewertet, um aus den realen Energien nur die tatsächlich hörbaren Anteile zur Berücksichtigung psycho­ akustischer Verdeckungseffekte herauszunehmen. Im Block b3 kann, auch wenn dies für die Zwecke der Erfindung nicht zwingend ist, ferner eine interne Darstellung bzw. weitere Abbildung zur Modellierung des menschlichen Innenohres durchgeführt werden, die die Nicht-Linearitäten des menschlichen Innenohres beschreibt. Hierzu können beispiels­ weise Funktionen der Form xα verwendet werden, wobei für den Exponenten α gilt: 0,1 < α < 10.
Die beschriebene Berechnung wird nicht nur für die beiden Originalkanäle k1, k2 des Stereosignales in den ersten beiden Zweigen z1, z2 vorgenommen, um die Werte x1, x2 zu erhalten. Gleichfalls werden diese Berechnungen für zwei codierungsfehler-behaftete Signale ki1, ki2 zur Bildung der Ausgangswerte xi1, xi2 durchgeführt, wobei die codierungs­ fehlerbehafteten Werte aus den beiden Originalkanälen k1, k2 dadurch gewonnen werden, daß diese zunächst mit der Codierungsart codiert werden, welche im Fall der größeren Ähnlichkeit angewendet wird, wobei diese Codierungsart in dem bevorzugten Ausführungsbeispiel die Intensity-Stereo- Codierungsart ist. Die so durch gemeinsame Codierung gewonnenen codierten Signale werden nach dem Intensity-Ste­ reo-Verfahren in an sich bekannter Art decodiert, um die codierungsfehler-behafteten Signale ki1, ki2 zu gewinnen.
Die Bestimmung des Ähnlichkeitsmaßes zur Selektion der jeweils vorteilhafteren Codierungsart aufgrund der Ausgangs­ signale x1, x2, xi1, xi2 kann auf verschiedenartige Weise erfolgen, wie auch die nachfolgende Beschreibung unter Be­ zugnahme auf die Fig. 3 und 5 verdeutlichen wird. Es genügt jedoch, lediglich die Ähnlichkeit eines der Codierungsfeh­ ler-behafteten Ausgangssignale xi1 oder xi2 bezogen auf das zugehörige nicht-codierungsfehler-behaftete Signal x1 bzw. x2 zu bewerten. Das Fehlermaß zwischen diesen ausgangsseiti­ gen Spektralwerten, von dem das Ähnlichkeitsmaß abgeleitet werden kann, kann im einfachsten Fall durch Differenzbildung bestimmt werden, wenngleich auch diese Berechnungsart nicht die einzig mögliche ist.
Fig. 1b zeigt ein zweites, gegenüber dem ersten Ausführungs­ beispiel nur geringfügig abgewandeltes Ausführungsbeispiel einer Vorrichtung zur Durchführung wesentlicher Teile des Verfahrens zur Bestimmung der zu wählenden Codierungsart. Bei diesem Ausführungsbeispiel werden die Signale k1, k2 im dritten und vierten Zweig z3, z4 zunächst in den Blöcken b1 in den Frequenzbereich transformiert und erst nach ihrer Transformation in den Frequenzbereich derjenigen Codierungs­ art unterworfen, welche im Falle der Feststellung eines hohen Ähnlichkeitsmaßes verwendet wird, und sodann wieder decodiert, um zwei codierungsfehler-behaftete Signale ki1, ki2 zu erzeugen. Sodann werden mittels einer durch eine psychoakustische Berechnung ermittelten Mithörschwelle die jeweiligen, tatsächlich hörbaren Spektralanteile ausgehend sowohl von den Spektralwerten xi1, xi2 der Codierungsfeh­ ler-behafteten Signale ki1, ki2 wie auch von den Spek­ tralwerten der zu diesen codierungsfehler-behafteten Signale zugehörigen Signale selektiert oder bewertet. Anschließend wird das Ähnlichkeitsmaß, aufgrund dessen eine der wenigstens zwei Codierungsarten ausgewählt wird, aufgrund der so selektierten oder bewerteten hörbaren Spektralanteile wenigstens des codierungsfehler-behafteten Signales und des zugehörigen Signales berechnet.
Eine Vorrichtung zur Bestimmung des Ähnlichkeitsmaßes für die Selektion des jeweils geeigneteren Codierungsverfahrens nach dem erfindungsgemäßen Verfahren ist in Fig. 2 dargestellt. Durch Vergleich mit Fig. 1a und Fig. 1b erkennt man, daß die Vorrichtung gemäß Fig. 2 den ersten beiden Zweigen z1, z2 gemäß Fig. 1a und Fig. 1b identisch entspricht. Der dritte und vierte Zweig z3, z4 können hier entfallen. Aufgrund der Identität der ersten beiden Zweige z1, z2 bedarf es keiner erneuten Erläuterung der durch die Blöcke dieser Zweige durchgeführten Signalverarbeitung. Bei der Vorrichtung gemäß Fig. 2 werden also aufgrund der beiden Originalkanäle k1, k2 durch Zeit/Frequenz-Transformation und Bildung der Kurzzeitenergiewerte und deren Selektion oder Bewertung die tatsächlich hörbaren Spektralanteile x1, x2 der Originalkanäle k1, k2 gewonnen, wobei das Maß der Ähnlichkeit dieser tatsächlich hörbaren, selektierten oder bewerteten Spektralanteile x1, x2 mit einem Schwellenwert k verglichen wird. Überschreitet das Ähnlichkeitsmaß den Schwellenwert k, so wird diejenige Codierungsart ausgewählt, die sich aufgrund der höheren Datenreduktion besser zur Codierung von annähernd übereinstimmenden Stereosignalen eignet. Bei dem bevorzugten Ausführungsbeispiel kann dies das Intensity-Stereo-Codierungsverfahren sein. Liegt das Ähnlichkeitsmaß unter diesem Schwellenwert k, so werden die Kanäle bei dem bevorzugten Ausführungsbeispiel getrennt codiert.
Eine mögliche Vorrichtung zur Verarbeitung der Ausgangssig­ nale der in Fig. 1a und Fig. 1b gezeigten Vorrichtungen zur Durchführung des erfindungsgemäßen Verfahrens zum Bestimmen der zu wählenden Codierungsart ist in Fig. 3 dargestellt. Hier werden jeweils die spektralen Codierungsfehler x1 minus xi1 bzw. x2 minus xi2 mit einem Schwellenwert k verglichen. Liegen beide Fehlerwerte x1 minus xi1 bzw. x2 minus xi2 unter dem Schwellenwert k, so wird das stärker datenreduzie­ rende Verfahren verwendet, das bei dem bevorzugten Ausfüh­ rungsbeispiel das Intensity-Stereo-Verfahren ist.
Fig. 5 zeigt ein abgewandeltes Ausführungsbeispiel der Vorrichtung zum Bestimmen des Ähnlichkeitsmaßes gemäß Fig. 3 aufgrund der Ausgangssignale der in Fig. 1a und Fig. 1b gezeigten Vorrichtungen zum Bestimmen der zu wählenden Codierungsart. Die beiden miteinander übereinstimmenden Schaltungsteile umfassen jeweils einen Knoten, an dem die Differenz xi1 minus x1 bzw. xi2 minus x2 zur Erzeugung eines Codierungsfehlersignales gebildet wird, sowie zwei Blöcke b4, b5 zur Aufsummation der Fehlersignale xi1 minus x1 bzw. xi2 minus x2 sowie der entsprechenden Nutzsignale x1 bzw. x2 über jeweils einen Signalblock. Nach dem blockweisen absolu­ ten Aufsummieren dieser Fehler sowie Nutzsignalanteile wird in einem weiteren Block b6 ein Quotient der aufsummierten absoluten Fehlersignale bezogen auf die auf summierten abso­ luten Nutzsignale gebildet und mit dem Schwellenwert k ver­ glichen. Überschreitet das relative Fehlermaß in einem der beiden Kanäle die Schwelle k, so darf keine Intensity-Ste­ reo-Codierung vorgenommen werden, sondern es muß eine ge­ trennte Codierung verwendet werden.
Nunmehr soll unter Bezugnahme auf Fig. 6 eine mögliche Ausführungsform der Blöcke b1 und b2 der Zweige z1, z2 bzw. z1 bis z4 gemäß den Fig. 1a, Fig. 1b und 2 erläutert werden. Es sei jedoch bereits an dieser Stelle hervorgehoben, daß sowohl die Zeit/Frequenz-Transformation diskreter Audiosig­ nale wie auch die Bildung der Kurzzeitenergiewerte Maßnahmen sind, die dem Fachmann aus dem Bereich der Codierung, wenn auch nicht aus dem Bereich der Auswahl der Codierungsarten, bekannt sind.
Wie in Fig. 6 verdeutlicht wird, werden diskrete Eingangs­ signale einer Polyphasen-Filterbank PF zugeführt, die eine Zeit/Frequenz-Transformation des zeitdiskreten Eingangssig­ nales in 32 (0 bis 31) "Polybänder" vornimmt. Bezüglich dieser Bänder wird auf Fig. 7, rechter Abschnitt "Polypha­ sen-Implementierung", linke und mittlere Spalte verwiesen. Wie der Fachmann gleichfalls aus Fig. 7 erkennt, ist die Bandbreite für jedes Scalefactor Band bei den frequenzmäßig unteren Scalefactor-Band-Nummern jeweils gleichbleibend und erst ab einer Grenzfrequenz ansteigend, um die Frequenzgrup­ penbreite und die zugehörige Zeitauflösung der Charakteri­ stik des menschlichen Hörsinnes zu simulieren. Die Spektral­ werte der 32 Polybänder (0 bis 31) werden in dem der Poly­ phasen-Filterbank b1 folgenden Block b2a zur Bildung der Energiewerte quadriert. In dem hierauffolgenden Block fin­ det einerseits eine Summierung zur Bildung von Kurzzeit­ energien für jedes Scalefactor-Band über jeweils unter­ schiedliche Summationslängen statt (Vergleiche Fig. 7, rechte Spalte), wobei mit den Summationslängen (sum. length) jeweils die Anzahl der aufeinanderfolgenden, aufzusummieren­ den Werte bezeichnet sind. Ferner werden die 32 Polybänder zu einer reduzierten Anzahl von Scalefactor-Bändern durch Zusammenfassung entsprechender Frequenzbänder zusammenge­ faßt. Im Falle von ISO Layer 111 sind insgesamt 21 Scale­ factor-Bänder gewählt, wobei die Bildung der Kurzzeitener­ gien für jedes Scalefactor-Band durch Summation der aufein­ anderfolgenden Werte ab SB-Nr. 10 implementiert ist.
In Fig. 6 wird darauf verzichtet, auch eine detailliertere Ausführungsform des Blockes b3 gemäß den Fig. 1 oder 2 wiederzugeben, da die Wichtung einzelner Spektralwerte nach Hörbarkeit unter Verwendung einer psychoakustisch berechne­ ten Mithörschwelle allgemeines Fachwissen ist.
Zur Berechnung der Mithörschwelle wird auf folgende Fachver­ öffentlichung hingewiesen: ISO/IEC 11172 International Standard "Coding of moving pictures and associated audio for digital storage media up to 1,5 Mbit/s", Part 3: Audio, ANNEX D: Psychacoustic Models.
Soweit die Wichtung der Spektralanteile nach Hörbarkeit und nach interner Darstellung betroffen ist, kann auf folgende Standardliteraturstellen verwiesen werden:
  • - John G. Beerends, Jan A. Stemerdink: "A Perceptual Audio Quality Measure based on a psychoacoustic Sound representation", J. Audio Eng. Soc., Bd. 40, Nr. 12, Dezember 1992; sowie
  • - E. Zwicker, H. Fastl: "Psychoacoustics", Springer Verlag Berlin Heidelberg, 1990, Kap. 8.7.1 "Specific Loudness".

Claims (6)

1. Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen (k1, k2), bei dem eine Transformation von wenigstens zwei der Sig­ nale in den Frequenzbereich durchgeführt und ausgehend von Spektralwerten ein Ähnlichkeitsmaß für die Ähnlich­ keit dieser Signale zueinander ermittelt wird, aufgrund dessen eine von wenigstens zwei Codierungsarten ausge­ wählt wird, dadurch gekennzeichnet,
daß ausgehend von den Spektralwerten der jeweiligen Signale (k1, k2) eine Selektion oder Bewertung der tatsächlich hörbaren Spektralanteile unter Verwendung einer durch eine psychoakustische Berechnung ermittelten Mithörschwelle vorgenommen wird, und
daß das Ähnlichkeitsmaß aufgrund der derart selektierten oder bewerteten hörbaren Spektralanteile der wenigstens zwei Signale (k1, k2) zur Auswahl der Codierungsart ermittelt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
daß zur Selektion oder Bewertung der tatsächlich hörbaren Spektralanteile eines jeden Signales (k1, k2) zunächst die Kurzzeitenergiewerte innerhalb von Fre­ quenzbereichen, die in Abhängigkeit von Frequenzgrup­ penbreiten gewählt sind, bestimmt werden, und
daß aus diesen Kurzzeitenergiewerten die hörbaren Ener­ giewerte durch deren Vergleich mit einer berechneten Mithörschwelle selektiert oder bewertet werden.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Kurzzeitenergiewerte für jeden Frequenzbereich über eine Zeitdauer ermittelt werden, die entsprechend der zeitlichen Auflösung des menschlichen Ohres für den betreffenden Frequenzbereich bei zunehmender Frequenz­ gruppenbreite abnimmt.
4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeich­ net, daß zur Selektion oder Bewertung der tatsächlich hörbaren Spektralwerte eine die Nichtlinearitäten des menschlichen Innenohres beschreibende Funktion auf die selektierten oder bewerteten Spektralanteile angewendet wird.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Funktion zur Beschreibung der Nichtlinearitäten des menschlichen Ohres die Form (xα) hat, wobei für den Exponenten α gilt: 0,1 < α < 10.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet,
daß das Ähnlichkeitsmaß mit einem Schwellenwert (k) verglichen wird und
daß für den Fall, daß das Ähnlichkeitsmaß den Schwellen­ wert unterschreitet, eine getrennte Codierung der Kanäle vorgenommen wird, während anderenfalls eine Intensity- Stereo-Codierung der Kanäle vorgenommen wird.
DE4345171A 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen Expired - Lifetime DE4345171C2 (de)

Priority Applications (13)

Application Number Priority Date Filing Date Title
DE4331376A DE4331376C1 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4345171A DE4345171C2 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
RU96107254A RU2124272C1 (ru) 1993-09-15 1994-07-08 Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов
AU71879/94A AU678270B2 (en) 1993-09-15 1994-07-08 Process for determining the type of coding to be selected for coding at least two signals
EP94920980A EP0719483B1 (de) 1993-09-15 1994-07-08 Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen
AT94920980T ATE152871T1 (de) 1993-09-15 1994-07-08 Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen
US08/557,046 US5736943A (en) 1993-09-15 1994-07-08 Method for determining the type of coding to be selected for coding at least two signals
JP7508926A JP2800068B2 (ja) 1993-09-15 1994-07-08 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法
DK94920980.3T DK0719483T3 (da) 1993-09-15 1994-07-08 Fremgangsmåde til bestemmelse af den kodningsart, der skal vælges til kodning af mindst to signaler
KR1019950705724A KR0171100B1 (ko) 1993-09-15 1994-07-08 두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법
DE59402680T DE59402680D1 (de) 1993-09-15 1994-07-08 Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen
PCT/EP1994/002250 WO1995008227A1 (de) 1993-09-15 1994-07-08 Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen
CA002161263A CA2161263C (en) 1993-09-15 1994-07-08 Process for determining the type of coding to be selected for coding at least two signals

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE4331376A DE4331376C1 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4345171A DE4345171C2 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen

Publications (2)

Publication Number Publication Date
DE4345171A1 true DE4345171A1 (de) 1995-03-16
DE4345171C2 DE4345171C2 (de) 1996-02-01

Family

ID=6497803

Family Applications (2)

Application Number Title Priority Date Filing Date
DE4345171A Expired - Lifetime DE4345171C2 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE59402680T Expired - Lifetime DE59402680D1 (de) 1993-09-15 1994-07-08 Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE59402680T Expired - Lifetime DE59402680D1 (de) 1993-09-15 1994-07-08 Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen

Country Status (1)

Country Link
DE (2) DE4345171C2 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0803989A1 (de) * 1996-04-26 1997-10-29 Deutsche Thomson-Brandt Gmbh Verfahren und Apparat zur Kodierung eines digitalen Audiosignals
WO1998023130A1 (de) * 1996-11-15 1998-05-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Gehörangepasste qualitätsbeurteilung von audiosignalen
EP2987166A4 (de) * 2013-04-15 2016-12-21 Nokia Technologies Oy Bestimmer für mehrkanaligen audiosignalcodierermodus
EP3095117A4 (de) * 2014-01-13 2017-06-21 Nokia Technologies Oy Multikanal-audiosignalklassifizierer

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19706268A1 (de) * 1997-02-18 1998-08-20 Christian Wenz Dateiformatspezifisches Packverfahren
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4136825C1 (de) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4136825C1 (de) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
BEERENDS, STEMERDINK: A Perceptual Audio Quality Measure Based on a Phsychoacoustic Sound Representation. In: J. Audio Eng. Soc., Bd. 40, 1992, Nr. 12, S. 963-978 *
International Standard: ISO/IEC 11172-3, Information technology - Coding of moving Pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - Part 3: Audio, first edition 1993-08-01 *
JOHNSTON, J.D.: Perceptual Transform Coding of Wideband Stereo Signals. In: IC ASSP, IEEE 1989, S. 1993-1996 *
VAN DER WAAL, VELDHUIS: Subband Coding of Stereophonic Digital Audio Signals. In: Proc. of the IC ASSP, IEEE, 1991, S. 3601-3604 *
ZWICKER, FASTL: Psychoacoustics, Berlin: Springer-Verlag, 1990, Kap. 8.7.1 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0803989A1 (de) * 1996-04-26 1997-10-29 Deutsche Thomson-Brandt Gmbh Verfahren und Apparat zur Kodierung eines digitalen Audiosignals
WO1998023130A1 (de) * 1996-11-15 1998-05-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Gehörangepasste qualitätsbeurteilung von audiosignalen
US6271771B1 (en) 1996-11-15 2001-08-07 Fraunhofer-Gesellschaft zur Förderung der Angewandten e.V. Hearing-adapted quality assessment of audio signals
EP2987166A4 (de) * 2013-04-15 2016-12-21 Nokia Technologies Oy Bestimmer für mehrkanaligen audiosignalcodierermodus
EP3095117A4 (de) * 2014-01-13 2017-06-21 Nokia Technologies Oy Multikanal-audiosignalklassifizierer
US9911423B2 (en) 2014-01-13 2018-03-06 Nokia Technologies Oy Multi-channel audio signal classifier

Also Published As

Publication number Publication date
DE4345171C2 (de) 1996-02-01
DE59402680D1 (de) 1997-06-12

Similar Documents

Publication Publication Date Title
DE4331376C1 (de) Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE69210064T2 (de) Teilbandkodierer und Sender unter Verwendung dieses Kodierers
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE60318835T2 (de) Parametrische darstellung von raumklang
DE602004007945T2 (de) Codierung von audiosignalen
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
EP0649588B1 (de) Übertragung und speicherung von mehrkanaligen tonsignalen bei anwendung von bitratenreduzierenden codierverfahren
DE19747132A1 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE19628292A1 (de) Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE19811039A1 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE69211452T2 (de) Kodieranordnung und Kodierverfahren mit einem Unterbandkoder zum Unterbandkodieren eines Breitband-Digitalsignals, das aus einer ersten und einer zweiten Signalkomponente aufgebaut ist
DE4217276C1 (de)
DE60017825T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
EP2457390A1 (de) Vorrichtung und verfahren zur optimierung stereophoner oder pseudostereophoner audiosignale
DE69928842T2 (de) Kanal koppelung für einen ac-3 kodierer
DE4345171C2 (de) Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE69823557T2 (de) Schnelle frequenztransformationstechnik für transform audio koder
DE69813912T2 (de) Digitaler audiokodierer mit verschiedenen genauigkeiten

Legal Events

Date Code Title Description
AC Divided out of

Ref country code: DE

Ref document number: 4331376

Format of ref document f/p: P

AC Divided out of

Ref country code: DE

Ref document number: 4331376

Format of ref document f/p: P

OP8 Request for examination as to paragraph 44 patent law
AC Divided out of

Ref country code: DE

Ref document number: 4331376

Format of ref document f/p: P

D2 Grant after examination
8364 No opposition during term of opposition
R071 Expiry of right
R071 Expiry of right