DE4345171C2 - Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen - Google Patents
Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei SignalenInfo
- Publication number
- DE4345171C2 DE4345171C2 DE4345171A DE4345171A DE4345171C2 DE 4345171 C2 DE4345171 C2 DE 4345171C2 DE 4345171 A DE4345171 A DE 4345171A DE 4345171 A DE4345171 A DE 4345171A DE 4345171 C2 DE4345171 C2 DE 4345171C2
- Authority
- DE
- Germany
- Prior art keywords
- coding
- signals
- similarity
- values
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Die Erfindung bezieht sich auf ein Verfahren zum Bestimmen
der zu wählenden Codierungsart für die Codierung von wenig
stens zwei Signalen, bei dem jedes Signal in den Frequenzbe
reich transformiert wird und ausgehend von den Spektralwer
ten ein Ähnlichkeitsmaß für die Ähnlichkeit von jeweils we
nigstens zwei Signalen zueinander ermittelt wird, gemäß dem
Oberbegriff des Patentanspruchs 1.
Insbesondere befaßt sich die Erfindung mit einer optimierten
Codierungswahl für die Codierung von zwei oder mehr Signa
len, von denen wenigstens zwei voneinander nicht unabhängig
sind, sondern zumindest teilweise redundante bzw. irrele
vante Informationen enthalten.
Allgemein werden bei Verfahren zur datenreduzierten Codie
rung digitaler Audiosignale die Signale aus dem Zeitbereich
zunächst in den Frequenzbereich transformiert. Handelt es
sich um Signale, die nicht unabhängig voneinander sind, so
ist es üblich, sich einer datenreduzierenden Codierung zu
bedienen, welche die Redundanz zwischen den beiden oder den
mehreren Kanälen berücksichtigt.
Eine derartige Codierung ist als sogenannte Mitte/Seite-Co
dierung bekannt geworden (J. D. Johnston, "Perceptual Trans
form Coding of Wideband Stereo Signal", IC ASSP, IEEE, 1989,
S. 1993 bis 1996). Bei dieser Mitte/Seite-Codierung wird
aufgrund des linken und rechten Kanales einerseits die Summe
bzw. Mitte und anderseits die Differenz bzw. Seite der Ste
reosignale codiert.
Eine weitere, mittlerweile übliche Codierungsart ist das
Intensity-Stereo-Verfahren, das in der Veröffentlichung
"Subband Coding of Stereophonie Digital Audio Signals",
Proc. of the IC ASSP, 1991, IEEE, Toronto, S. 3601 bis 3604,
beschrieben ist. Bei dem Intensity-Stereo-Verfahren wird
aufgrund der beiden Kanäle ein Monosignal gebildet und mit
einer zusätzlichen Information über die Links/Rechts-Vertei
lung des Signales übertragen.
Bereits in dem Deutschen Patent 41 36 825 der Anmelderin ist
es beschrieben, daß bei derartigen Verfahren starke Störun
gen auftreten können, wenn die Signale nur eine relativ ge
ringe Ähnlichkeit aufweisen oder gar vollständig unabhängig
voneinander sind. So ist es bekannt, daß eine stark unter
schiedliche Zusammensetzung der Signale im linken und rech
ten Kanal bei der Mitte/Seite-Codierung zu Artefakten führt,
die durch das tatsächlich im Kanal vorhandene Signal nicht
verdeckt werden können. Bei der Verwendung des Intensity-
Stereo-Verfahrens kann es zur Zerstörung des räumlichen
Klangbildes kommen, wenn der linke und rechte Kanal erheb
lich voneinander abweichende Spektralwerte haben.
Um diesem Problem zu begegnen, wird in der bereits genannten
Deutschen Patentschrift 41 36 825 vorgeschlagen, aufgrund
der Spektralwerte der in den Frequenzbereich transformierten
Signale ein Ähnlichkeitsmaß zu ermitteln, aufgrund dessen
eine Umschaltung zwischen unterschiedlichen Codierungsarten
vorgenommen wird. Ergeben die Spektralwerte ein hohes Ähn
lichkeitsmaß, so wird bei dem dort beschriebenen Verfahren
eine Mitte/Seite-Codierung eingesetzt, während im Falle
eines niedrigen Ähnlichkeitsmaßes und somit im Falle einer
geringen spektralen Ähnlichkeit der betrachteten Kanäle eine
getrennte Codierung der Kanäle vorgenommen wird. Gleichfalls
ist es aus diesem Patent bekannt, aufgrund der zu codieren
den Signale mittels eines psychoakustischen Modelles die
Maskierungsschwelle zu berechnen, mit der eine der
Mitte/Seite-Codierungstufe nachgeschaltete Datenverminde
rungsstufe angesteuert wird, die unter Berücksichtigung der
Verdeckung eine Datenreduktion erreicht.
Obgleich mit dem aus dem Deutschen Patent 41 36 825 bekann
ten Verfahren bereits eine erhebliche Qualitätssteigerung
gegenüber unveränderten Mitte / Seite-Codierungs-Verfahren so
wie gegenüber unveränderten Intensity-Stereo-Verfahren er
reicht wird, ist eine weitere Steigerung der Qualität der zu
übertragenden Daten bei weiterer Reduktion der Datenrate
wünschenswert.
Ausgehend von diesem Stand der Technik liegt der Erfindung
daher die Aufgabe zugrunde, ein Verfahren zum Bestimmen der
zu wählenden Codierungsart für die Codierung von wenigstens
zwei Signalen so weiterzubilden, daß bei Erhöhung der Quali
tät der codierten Daten bzw. Erhöhung der Qualität der auf
grund dieser Daten decodierten Signale eine weitere Datenre
duktion erreicht wird.
Diese Aufgabe wird durch das Verfahren gemäß Patentanspruch 1
gelöst.
Gemäß einem wesentlichen Aspekt der Erfindung wird ausgehend
von den Spektralwerten zweier Signale, die beispielsweise
zwei unterschiedlichen Kanälen entsprechen, eine Selektion
oder Bewertung der tatsächlich hörbaren Spektralanteile
unter Verwendung einer durch eine psychoakustischen
Berechnung ermittelten Mithörschwelle vorgenommen, woraufhin
das Ähnlichkeitsmaß, mit dem eine von wenigstens zwei Codie
rungsarten ausgewählt wird, aufgrund der so selektierten
oder bewerteten hörbaren Spektralanteile der wenigstens zwei
Signale ermittelt wird. Dieser Ansatz der Erfindung nutzt im
Gegensatz zum Stand der Technik die durch eine psychoaku
stische Berechnung ermittelte Mithörschwelle nicht oder
zumindest nicht nur zum Zwecke der Datenreduktion des
codierten Signales, sondern für die Bestimmung des Ähnlich
keitsmaßes, mit dem die Auswahl der Codierungsart vorge
nommen wird. Dieses Konzept, das den drei Aspekten der
Erfindung gemeinsam ist, steht im klaren Gegensatz zum
bisherigen Stand der Technik und erlaubt eine Auswahl der
Codierungsart unter psychoakustischen Gesichtspunkten.
Bevorzugte Weiterbildungen der erfindungsgemäßen Verfahren
sind in den Unteransprüchen festgelegt.
Nachfolgend werden unter Bezugnahme auf die beiliegenden
Zeichnungen bevorzugte Ausführungsbeispiele von Vorrich
tungen zur Durchführung der erfindungsgemäßen Verfahren
näher erläutert. Es zeigt:
Fig. 1a ein erstes Ausführungsbeispiel einer Vorrichtung
zur Durchführung wesentlicher Teile des Verfahrens
zur Bestimmung der zu wählenden Codierungsart;
Fig. 1b ein zweites, gegenüber dem ersten Ausführungsbei
spiel nur geringfügig abgewandeltes Ausführungs
beispiel einer Vorrichtung zur Durchführung wesent
licher Teile des Verfahrens zur Bestimmung der zu
wählenden Codierungsart;
Fig. 2 ein drittes Ausführungsbeispiel einer Vorrichtung
zur Durchführung wesentlicher Teile des erfindungs
gemäßen Verfahrens zur Bestimmung der zu wählenden
Codierungsart;
Fig. 3 ein Blockdiagramm einer Vorrichtung zum Bestimmen
des Ähnlichkeitsmaßes aufgrund der Ausgangssignale
der Vorrichtung gemäß Fig. 1;
Fig. 4 ein Blockdiagramm einer Vorrichtung zum Bestimmen
des Ähnlichkeitsmaßes aufgrund der Ausgangssignale
einer Vorrichtung gemäß Fig. 2;
Fig. 5 ein gegenüber der Fig. 3 abgewandeltes Blockdia
gramm der Vorrichtung zum Bestimmen des Ähnlich
keitsmaßes aufgrund der Ausgangssignale der Vor
richtung gemäß Fig. 1;
Fig. 6 ein Blockdiagramm zur Verdeutlichung der Struktur
der jeweiligen ersten beiden Blöcke für jedes Sig
nal bei den Vorrichtungen gemäß den Fig. 1 und 2
zur Durchführung der Zeit/Frequenz-Transformation
und der Bestimmung der Kurzzeitenergien; und
Fig. 7 eine Tabelle zur Verdeutlichung der Funktionsweise
und Struktur einer Hybrid- bzw. Polyphasen-Filter
bank zur Durchführung einer an die Charakteristik
des menschlichen Hörsinnes angepaßten Transforma
tion mit ungleicher Zeit/Frequenz-Auflösung.
Fig. 1a zeigt das Blockdiagramm einer Vorrichtung zur Durch
führung wesentlicher Teile des Verfahrens nach dem ersten
Aspekt zum Bestimmen der zu wählenden Codierungsart. Das
hier gezeigte Ausführungsbeispiel ist einsetzbar zur
Steuerung der Umschaltung zwischen einer getrennten
Codierung von zwei Stereokanälen k1, k2 und einer Codierung
nach dem "Intensity-Stereo-Codierungsverfahren", welches an
sich aus der eingangs gewürdigten Schrift zu entnehmen ist.
Es sei jedoch bereits an dieser Stelle hervorgehoben, daß
die Verfahren sich nicht nur zur Auswahl entweder einer
getrennten Codierung zweier Stereokanäle k1, k2 oder einer
Codierung der Kanäle nach dem Intensity-Stereo-Verfahren
eignen, sondern auch zur Auswahl einer Codierungsart von
wenigstens zwei beliebigen Codierungsarten dient, von denen
sich eine besser als die nicht-ausgewählte andere zur
Codierung von Signalen eignet, die eine gewisse Ähnlichkeit
untereinander haben, wodurch eine höhere Bitreduktion
erreicht wird. Die Anwendung des erfindungsgemäßen
Verfahren, wie sie nachfolgend im einzelnen erläutert wer
den, beschränkt sich nicht auf die Codierung von Stereosig
nalen beispielsweise gemäß ISO/MPEG Layer 1 bis 3, sondern
beispielsweise auch für die Multikanalcodierung, wie sie
beispielsweise gemäß MPEG 2 vorgenommen werden kann.
Wie in Fig. 1a verdeutlicht wird, enthält die dort gezeigte
Vorrichtung vier Signalverarbeitungszweige z1, z2, z3, z4,
von denen ein jeder drei übereinstimmende Blöcke b1, b2, b3
aufweist.
Der Block b1 dient zur Zeit/Frequenz-Transformation des
eingangsseitigen diskreten Zeitsignales k1, k2, ki1, ki2. In
Betracht kommen hier beliebige, an sich bekannte Frequenz
transformationsverfahren für die Transformation der ein
gangsseitigen Audiodaten von dem Zeitbereich in dem
Frequenz- bzw. Spektralbereich. In Betracht kommen Ver
fahren, wie beispielsweise FFT, DCT, MDCT, die Verwendung
einer Polyphasenfilterbank oder einer Hybridfilterbank.
Vorzugsweise bedient sich jedoch, wie nachfolgend im einzel
nen näher erläutert werden wird, die Erfindung eines Trans
formationsverfahrens mit ungleicher Zeit- und Frequenzauf
lösung, die der Charakteristik des menschlichen Hörsinnes
angepaßt ist. Bei einem derartigen Verfahren, wie es an sich
im Bereich der Psychoakustik bekannt ist, haben lediglich
die unteren Frequenzgruppen eine übereinstimmende Breite,
während die Breite von Frequenzgruppen ab einer bestimmten
Frequenz zunimmt, wie dies im einzelnen unter Bezugnahme auf
die Tabelle der Fig. 7 weiter verdeutlicht werden wird.
Entsprechend der Heisenberg-Grenze von 0,5 für das Produkt
aus Frequenzgruppenbreite und Zeitauflösung nimmt die
Zeitauflösung mit zunehmender Frequenzgruppenbreite ab.
Im zweiten Block b2 werden die durch Transformation gewon
nenen Spektralwerte beispielsweise durch Quadrierung und
Summation über die entsprechenden Zeiten in Kurzzeitenergie
werte für die einzelnen Frequenzgruppenbänder umgewandelt.
Die so gewonnen Kurzzeitenergiewerte für die einzelnen Fre
quenzgruppenbreiten werden im dritten Block b3 unter Verwen
dung einer Mithörschwelle, die aus einer psychoakustischen
Berechnung für das betreffende Signal hergeleitet ist, se
lektiert oder bewertet, um aus den realen Energien nur die
tatsächlich hörbaren Anteile zur Berücksichtigung psycho
akustischer Verdeckungseffekte herauszunehmen. Im Block b3
kann, auch wenn dies für die Zwecke der Erfindung nicht
zwingend ist, ferner eine interne Darstellung bzw. weitere
Abbildung zur Modellierung des menschlichen Innenohres
durchgeführt werden, die die Nicht-Linearitäten des
menschlichen Innenohres beschreibt. Hierzu können beispiels
weise Funktionen der Form xα verwendet werden, wobei für den
Exponenten α gilt: 0,1 < α < 10.
Die beschriebene Berechnung wird nicht nur für die beiden
Originalkanäle k1, k2 des Stereosignales in den ersten
beiden Zweigen z1, z2 vorgenommen, um die Werte x1, x2 zu
erhalten. Gleichfalls werden diese Berechnungen für zwei
Codierungsfehler-behaftete Signale ki1, ki2 zur Bildung der
Ausgangswerte xi1, xi2 durchgeführt, wobei die Codierungs
fehler-behafteten Werte aus den beiden Originalkanälen k1,
k2 dadurch gewonnen werden, daß diese zunächst mit der
Codierungsart codiert werden, welche im Fall der größeren
Ähnlichkeit angewendet wird, wobei diese Codierungsart in
dem bevorzugten Ausführungsbeispiel die Intensity-Stereo-
Codierungsart ist. Die so durch gemeinsame Codierung
gewonnenen codierten Signale werden nach dem Intensity-Ste
reo-Verfahren in an sich bekannter Art decodiert, um die
Codierungsfehler-behafteten Signale ki1, ki2 zu gewinnen.
Die Bestimmung des Ähnlichkeitsmaßes zur Selektion der
jeweils vorteilhafteren Codierungsart aufgrund der Ausgangs
signale x1, x2, xi1, xi2 kann auf verschiedenartige Weise
erfolgen, wie auch die nachfolgende Beschreibung unter Be
zugnahme auf die Fig. 3 und 5 verdeutlichen wird. Es genügt
jedoch, lediglich die Ähnlichkeit eines der Codierungsfeh
ler-behafteten Ausgangssignale xi1 oder xi2 bezogen auf das
zugehörige nicht-Codierungsfehler-behaftete Signal x1 bzw.
x2 zu bewerten. Das Fehlermaß zwischen diesen ausgangsseiti
gen Spektralwerten, von dem das Ähnlichkeitsmaß abgeleitet
werden kann, kann im einfachsten Fall durch Differenzbildung
bestimmt werden, wenngleich auch diese Berechnungsart nicht
die einzig mögliche ist.
Fig. 1b zeigt ein zweites, gegenüber dem ersten Ausführungs
beispiel nur geringfügig abgewandeltes Ausführungsbeispiel
einer Vorrichtung zur Durchführung wesentlicher Teile des
Verfahrens zur Bestimmung der zu wählenden Codierungsart.
Bei diesem Ausführungsbeispiel werden die Signale k1, k2 im
dritten und vierten Zweig z3, z4 zunächst in den Blöcken b1
in den Frequenzbereich transformiert und erst nach ihrer
Transformation in den Frequenzbereich derjenigen Codierungs
art unterworfen, welche im Falle der Feststellung eines
hohen Ähnlichkeitsmaßes verwendet wird, und sodann wieder
decodiert, um zwei Codierungsfehler-behaftete Signale ki1,
ki2 zu erzeugen. Sodann werden mittels einer durch eine
psychoakustische Berechnung ermittelten Mithörschwelle die
jeweiligen, tatsächlich hörbaren Spektralanteile ausgehend
sowohl von den Spektralwerten xi1, xi2 der Codierungsfeh
ler-behafteten Signale ki1, ki2 wie auch von den Spek
tralwerten der zu diesen Codierungsfehler-behafteten Signale
zugehörigen Signal selektiert oder bewertet. Anschließend
wird das Ähnlichkeitsmaß, aufgrund dessen eine der
wenigstens zwei Codierungsarten ausgewählt wird, aufgrund
der so selektierten oder bewerteten hörbaren Spektralanteile
wenigstens des Codierungsfehler-behafteten Signales und des
zugehörigen Signales berechnet.
Eine Vorrichtung zur Bestimmung des Ähnlichkeitsmaßes für
die Selektion des jeweils geeigneteren Codierungsverfahrens
nach dem erfindungsgemäßen Verfahren ist in Fig. 2
dargestellt. Durch Vergleich mit Fig. 1a und Fig. 1b erkennt
man, daß die Vorrichtung gemäß Fig. 2 den ersten beiden
Zweigen z1, z2 gemäß Fig. 1a und Fig. 1b identisch
entspricht. Der dritte und vierte Zweig z3, z4 können hier
entfallen. Aufgrund der Identität der ersten beiden Zweige
z1, z2 bedarf es keiner erneuten Erläuterung der durch die
Blöcke dieser Zweige durchgeführten Signalverarbeitung. Bei
der Vorrichtung gemäß Fig. 2 werden also aufgrund der beiden
Originalkanäle k1, k2 durch Zeit/Frequenz-Transformation und
Bildung der Kurzzeitenergiewerte und deren Selektion oder
Bewertung die tatsächlich hörbaren Spektralanteile x1, x2
der Originalkanäle k1, k2 gewonnen, wobei das Maß der
Ähnlichkeit dieser tatsächlich hörbaren, selektierten oder
bewerteten Spektralanteile x1, x2 mit einem Schwellenwert k
verglichen wird. Überschreitet das Ähnlichkeitsmaß den
Schwellenwert k, so wird diejenige Codierungsart ausgewählt,
die sich aufgrund der höheren Datenreduktion besser zur
Codierung von annähernd übereinstimmenden Stereosignalen
eignet. Bei dem bevorzugten Ausführungsbeispiel kann dies
das Intensity-Stereo-Codierungsverfahren sein. Liegt das
Ähnlichkeitsmaß unter diesem Schwellenwert k, so werden die
Kanäle bei dem bevorzugten Ausführungsbeispiel getrennt
codiert.
Eine mögliche Vorrichtung zur Verarbeitung der Ausgangssig
nale der in Fig. 1a und Fig. 1b gezeigten Vorrichtungen zur
Durchführung des erfindungsgemäßen Verfahrens zum Bestimmen
der zu wählenden Codierungsart ist in Fig. 3 dargestellt.
Hier werden jeweils die spektralen Codierungsfehler x1 minus
xi1 bzw. x2 minus xi2 mit einem Schwellenwert k verglichen.
Liegen beide Fehlerwerte x1 minus xi1 bzw. x2 minus xi2
unter dem Schwellenwert k, so wird das stärker datenreduzie
rende Verfahren verwendet, das bei dem bevorzugten Ausfüh
rungsbeispiel das Intensity-Stereo-Verfahren ist.
Fig. 5 zeigt ein abgewandeltes Ausführungsbeispiel der
Vorrichtung zum Bestimmen des Ähnlichkeitsmaßes gemäß Fig. 3
aufgrund der Ausgangssignale der in Fig. 1a und Fig. 1b
gezeigten Vorrichtungen zum Bestimmen der zu wählenden
Codierungsart. Die beiden miteinander übereinstimmenden
Schaltungsteile umfassen jeweils einen Knoten, an dem die
Differenz xi1 minus x1 bzw. xi2 minus x2 zur Erzeugung eines
Codierungsfehlersignales gebildet wird, sowie zwei Blöcke
b4, b5 zur Aufsummation der Fehlersignale xi1 minus x1 bzw.
xi2 minus x2 sowie der entsprechenden Nutzsignale x1 bzw. x2
über jeweils einen Signalblock. Nach dem blockweisen absolu
ten Aufsummieren dieser Fehler sowie Nutzsignalanteile wird
in einem weiteren Block b6 ein Quotient der aufsummierten
absoluten Fehlersignale bezogen auf die aufsummierten abso
luten Nutzsignale gebildet und mit dem Schwellenwert k ver
glichen. Überschreitet das relative Fehlermaß in einem der
beiden Kanäle die Schwelle k, so darf keine Intensity-Ste
reo-Codierung vorgenommen werden, sondern es muß eine ge
trennte Codierung verwendet werden.
Nunmehr soll unter Bezugnahme auf Fig. 6 eine mögliche
Ausführungsform der Blöcke b1 und b2 der Zweige z1, z2 bzw.
z1 bis z4 gemäß den Fig. 1a, Fig. 1b und 2 erläutert werden.
Es sei jedoch bereits an dieser Stelle hervorgehoben, daß
sowohl die Zeit/Frequenz-Transformation diskreter Audiosig
nale wie auch die Bildung der Kurzzeitenergiewerte Maßnahmen
sind, die dem Fachmann aus dem Bereich der Codierung, wenn
auch nicht aus dem Bereich der Auswahl der Codierungsarten,
bekannt sind.
Wie in Fig. 6 verdeutlicht wird, werden diskrete Eingangs
signale einer Polyphasen-Filterbank PF zugeführt, die eine
Zeit/Frequenz-Transformation des zeitdiskreten Eingangssig
nales in 32 (0 bis 31) "Polybänder" vornimmt. Bezüglich
dieser Bänder wird auf Fig. 7, rechter Abschnitt "Polypha
sen-Implementierung", linke und mittlere Spalte verwiesen.
Wie der Fachmann gleichfalls aus Fig. 7 erkennt, ist die
Bandbreite für jedes Scalefactor Band bei den frequenzmäßig
unteren Scalefactor-Band-Nummern jeweils gleichbleibend und
erst ab einer Grenzfrequenz ansteigend, um die Frequenzgrup
penbreite und die zugehörige Zeitauflösung der Charakteri
stik des menschlichen Hörsinnes zu simulieren. Die Spektral
werte der 32 Polybänder (0 bis 31) werden in dem der Poly
phasen-Filterbank b1 folgenden Block b2a zur Bildung der
Energiewerte quadriert. In dem hierauf folgenden Block fin
det einerseits eine Summierung zur Bildung von Kurzzeit
energien für jedes Scalefactor-Band über jeweils unter
schiedliche Summationslängen statt (Vergleiche Fig. 7,
rechte Spalte), wobei mit den Summationslängen (sum. length)
jeweils die Anzahl der aufeinanderfolgenden, aufzusummieren
den Werte bezeichnet sind. Ferner werden die 32 Polybänder
zu einer reduzierten Anzahl von Scalefactor-Bändern durch
Zusammenfassung entsprechender Frequenzbänder zusammenge
faßt. Im Falle von ISO Layer III sind insgesamt 21 Scale
factor-Bänder gewählt, wobei die Bildung der Kurzzeitener
gien für jedes Scalefactor-Band durch Summation der aufein
anderfolgenden Werte ab SB-Nr. 10 implementiert ist.
In Fig. 6 wird darauf verzichtet, auch eine detailliertere
Ausführungsform des Blockes b3 gemäß den Fig. 1 oder 2
wiederzugeben, da die Wichtung einzelner Spektralwerte nach
Hörbarkeit unter Verwendung einer psychoakustisch berechne
ten Mithörschwelle allgemeines Fachwissen ist.
Zur Berechnung der Mithörschwelle wird auf folgende Fachver
öffentlichung hingewiesen: ISO/IEC 11172 International
Standard "Coding of moving pictures and associated audio for
digital storage media up to 1,5 Mbit/s", Part 3: Audio,
ANNEX D: Psychoacustic Models.
Soweit die Wichtung der Spektralanteile nach Hörbarkeit und
nach interner Darstellung betroffen ist, kann auf folgende
Standardliteraturstellen verwiesen werden:
- - John G. Beerends, Jan A. Stemerdink: "A Perceptual Audio Quality Measure based on a psychoacoustic Sound representation", J. Audio Eng. Soc., Bd. 40, Nr. 12, Dezember 1992, Seiten 963-978; sowie
- - E. Zwicker, H. Fastl: "Psychoacoustics", Springer Verlag Berlin Heidelberg, 1990, Kap. 8.7.1 "Specific Loudness".
Claims (6)
1. Verfahren zum Bestimmen der zu wählenden Codierungsart
für die Codierung von wenigstens zwei Signalen (k1, k2),
bei dem eine Transformation von wenigstens zwei der Sig
nale in den Frequenzbereich durchgeführt und ausgehend
von Spektralwerten ein Ähnlichkeitsmaß für die Ähnlich
keit dieser Signale zueinander ermittelt wird, aufgrund
dessen eine von wenigstens zwei Codierungsarten ausge
wählt wird, dadurch gekennzeichnet,
daß ausgehend von den Spektralwerten der jeweiligen Signale (k1, k2) eine Selektion oder Bewertung der tatsächlich hörbaren Spektralanteile unter Verwendung einer durch eine psychoakustische Berechnung ermittelten Mithörschwelle vorgenommen wird, und
daß das Ähnlichkeitsmaß aufgrund der derart selektierten oder bewerteten hörbaren Spektralanteile der wenigstens zwei Signale (k1, k2) zur Auswahl der Codierungsart ermittelt wird.
daß ausgehend von den Spektralwerten der jeweiligen Signale (k1, k2) eine Selektion oder Bewertung der tatsächlich hörbaren Spektralanteile unter Verwendung einer durch eine psychoakustische Berechnung ermittelten Mithörschwelle vorgenommen wird, und
daß das Ähnlichkeitsmaß aufgrund der derart selektierten oder bewerteten hörbaren Spektralanteile der wenigstens zwei Signale (k1, k2) zur Auswahl der Codierungsart ermittelt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
daß zur Selektion oder Bewertung der tatsächlich hörbaren Spektralanteile eines jeden Signales (k1, k2) zunächst die Kurzzeitenergiewerte innerhalb von Fre quenzbereichen, die in Abhängigkeit von Frequenzgrup penbreiten gewählt sind, bestimmt werden, und
daß aus diesen Kurzzeitenergiewerten die hörbaren Ener giewerte durch deren Vergleich mit einer berechneten Mithörschwelle selektiert oder bewertet werden.
daß zur Selektion oder Bewertung der tatsächlich hörbaren Spektralanteile eines jeden Signales (k1, k2) zunächst die Kurzzeitenergiewerte innerhalb von Fre quenzbereichen, die in Abhängigkeit von Frequenzgrup penbreiten gewählt sind, bestimmt werden, und
daß aus diesen Kurzzeitenergiewerten die hörbaren Ener giewerte durch deren Vergleich mit einer berechneten Mithörschwelle selektiert oder bewertet werden.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet,
daß die Kurzzeitenergiewerte für jeden Frequenzbereich
über eine Zeitdauer ermittelt werden, die entsprechend
der zeitlichen Auflösung des menschlichen Ohres für den
betreffenden Frequenzbereich bei zunehmender Frequenz
gruppenbreite abnimmt.
4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeich
net,
daß zur Selektion oder Bewertung der tatsächlich
hörbaren Spektralwerte eine die Nichtlinearitäten des
menschlichen Innenohres beschreibende Funktion auf die
selektierten oder bewerteten Spektralanteile angewendet
wird.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet,
daß die Funktion zur Beschreibung der Nichtlinearitäten
des menschlichen Ohres die Form (xα) hat, wobei für den
Exponenten α gilt: 0,1 < α < 10.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch
gekennzeichnet,
daß das Ähnlichkeitsmaß mit einem Schwellenwert (k) verglichen wird, und
daß für den Fall, daß das Ähnlichkeitsmaß den Schwellen wert unterschreitet, eine getrennte Codierung der Kanäle vorgenommen wird, während anderenfalls eine Intensity- Stereo-Codierung der Kanäle vorgenommen wird.
daß das Ähnlichkeitsmaß mit einem Schwellenwert (k) verglichen wird, und
daß für den Fall, daß das Ähnlichkeitsmaß den Schwellen wert unterschreitet, eine getrennte Codierung der Kanäle vorgenommen wird, während anderenfalls eine Intensity- Stereo-Codierung der Kanäle vorgenommen wird.
Priority Applications (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4345171A DE4345171C2 (de) | 1993-09-15 | 1993-09-15 | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
DE4331376A DE4331376C1 (de) | 1993-09-15 | 1993-09-15 | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
EP94920980A EP0719483B1 (de) | 1993-09-15 | 1994-07-08 | Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen |
KR1019950705724A KR0171100B1 (ko) | 1993-09-15 | 1994-07-08 | 두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법 |
CA002161263A CA2161263C (en) | 1993-09-15 | 1994-07-08 | Process for determining the type of coding to be selected for coding at least two signals |
DE59402680T DE59402680D1 (de) | 1993-09-15 | 1994-07-08 | Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen |
AU71879/94A AU678270B2 (en) | 1993-09-15 | 1994-07-08 | Process for determining the type of coding to be selected for coding at least two signals |
JP7508926A JP2800068B2 (ja) | 1993-09-15 | 1994-07-08 | 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法 |
RU96107254A RU2124272C1 (ru) | 1993-09-15 | 1994-07-08 | Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов |
AT94920980T ATE152871T1 (de) | 1993-09-15 | 1994-07-08 | Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen |
PCT/EP1994/002250 WO1995008227A1 (de) | 1993-09-15 | 1994-07-08 | Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen |
DK94920980.3T DK0719483T3 (da) | 1993-09-15 | 1994-07-08 | Fremgangsmåde til bestemmelse af den kodningsart, der skal vælges til kodning af mindst to signaler |
US08/557,046 US5736943A (en) | 1993-09-15 | 1994-07-08 | Method for determining the type of coding to be selected for coding at least two signals |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4331376A DE4331376C1 (de) | 1993-09-15 | 1993-09-15 | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
DE4345171A DE4345171C2 (de) | 1993-09-15 | 1993-09-15 | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4345171A1 DE4345171A1 (de) | 1995-03-16 |
DE4345171C2 true DE4345171C2 (de) | 1996-02-01 |
Family
ID=6497803
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4345171A Expired - Lifetime DE4345171C2 (de) | 1993-09-15 | 1993-09-15 | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
DE59402680T Expired - Lifetime DE59402680D1 (de) | 1993-09-15 | 1994-07-08 | Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE59402680T Expired - Lifetime DE59402680D1 (de) | 1993-09-15 | 1994-07-08 | Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen |
Country Status (1)
Country | Link |
---|---|
DE (2) | DE4345171C2 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19706268A1 (de) * | 1997-02-18 | 1998-08-20 | Christian Wenz | Dateiformatspezifisches Packverfahren |
DE19742655A1 (de) * | 1997-09-26 | 1999-04-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0803989B1 (de) * | 1996-04-26 | 1999-06-16 | Deutsche Thomson-Brandt Gmbh | Verfahren und Apparat zur Kodierung eines digitalen Audiosignals |
DE19647399C1 (de) * | 1996-11-15 | 1998-07-02 | Fraunhofer Ges Forschung | Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen |
WO2014170530A1 (en) * | 2013-04-15 | 2014-10-23 | Nokia Corporation | Multiple channel audio signal encoder mode determiner |
CN106104684A (zh) * | 2014-01-13 | 2016-11-09 | 诺基亚技术有限公司 | 多通道音频信号分类器 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4136825C1 (de) * | 1991-11-08 | 1993-03-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De |
-
1993
- 1993-09-15 DE DE4345171A patent/DE4345171C2/de not_active Expired - Lifetime
-
1994
- 1994-07-08 DE DE59402680T patent/DE59402680D1/de not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19706268A1 (de) * | 1997-02-18 | 1998-08-20 | Christian Wenz | Dateiformatspezifisches Packverfahren |
DE19742655A1 (de) * | 1997-09-26 | 1999-04-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
DE19742655C2 (de) * | 1997-09-26 | 1999-08-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
Also Published As
Publication number | Publication date |
---|---|
DE4345171A1 (de) | 1995-03-16 |
DE59402680D1 (de) | 1997-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE4331376C1 (de) | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen | |
EP0750811B1 (de) | Verfahren zum codieren mehrerer audiosignale | |
DE69432538T2 (de) | Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger | |
DE69333394T2 (de) | Hochwirksames Kodierverfahren und -gerät | |
DE69210064T2 (de) | Teilbandkodierer und Sender unter Verwendung dieses Kodierers | |
DE69432012T2 (de) | Wahrnehmungsgebundene Kodierung von Audiosignalen | |
DE69533500T2 (de) | Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten | |
DE69232251T2 (de) | Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung | |
DE69533577T2 (de) | Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals | |
DE69331428T2 (de) | Kodierung und Dekodierung digitaler Signale | |
DE69310990T2 (de) | Verfahren zum Einfügen digitaler Daten in ein Audiosignal vor der Kanalkodierung | |
DE69431025T2 (de) | Signalkodier- oder -dekodiergerät und Aufzeichnungsmedium | |
EP0611516B1 (de) | Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle | |
EP0649588B1 (de) | Übertragung und speicherung von mehrkanaligen tonsignalen bei anwendung von bitratenreduzierenden codierverfahren | |
DE19742655C2 (de) | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals | |
DE19747132A1 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
DE69211452T2 (de) | Kodieranordnung und Kodierverfahren mit einem Unterbandkoder zum Unterbandkodieren eines Breitband-Digitalsignals, das aus einer ersten und einer zweiten Signalkomponente aufgebaut ist | |
DE4217276C1 (de) | ||
DE69217590T2 (de) | Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals | |
DE69425768T2 (de) | Kodierverfahren, Kodierer und Dekodierer für ein Digitalsignal | |
DE69529222T2 (de) | Einrichtung und verfahren zum kodieren eines digitalen signals mit mindestens einer ersten und einer zweiten digitalen signalkomponente | |
EP2457390A1 (de) | Vorrichtung und verfahren zur optimierung stereophoner oder pseudostereophoner audiosignale | |
DE69928842T2 (de) | Kanal koppelung für einen ac-3 kodierer | |
DE4345171C2 (de) | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen | |
DE69823557T2 (de) | Schnelle frequenztransformationstechnik für transform audio koder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AC | Divided out of |
Ref country code: DE Ref document number: 4331376 Format of ref document f/p: P |
|
AC | Divided out of |
Ref country code: DE Ref document number: 4331376 Format of ref document f/p: P |
|
OP8 | Request for examination as to paragraph 44 patent law | ||
AC | Divided out of |
Ref country code: DE Ref document number: 4331376 Format of ref document f/p: P |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
R071 | Expiry of right | ||
R071 | Expiry of right |