DE19959156A1 - Verfahren und Vorrichtung zum Verarbeiten eines Stereoaudiosignals - Google Patents
Verfahren und Vorrichtung zum Verarbeiten eines StereoaudiosignalsInfo
- Publication number
- DE19959156A1 DE19959156A1 DE19959156A DE19959156A DE19959156A1 DE 19959156 A1 DE19959156 A1 DE 19959156A1 DE 19959156 A DE19959156 A DE 19959156A DE 19959156 A DE19959156 A DE 19959156A DE 19959156 A1 DE19959156 A1 DE 19959156A1
- Authority
- DE
- Germany
- Prior art keywords
- channel
- signal
- channels
- modified
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 86
- 238000012545 processing Methods 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims description 19
- 230000004048 modification Effects 0.000 claims abstract description 11
- 238000012986 modification Methods 0.000 claims abstract description 11
- 238000013139 quantization Methods 0.000 claims description 30
- 230000003595 spectral effect Effects 0.000 claims description 26
- 238000013016 damping Methods 0.000 claims description 21
- 230000000873 masking effect Effects 0.000 claims description 12
- 230000002238 attenuated effect Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000000926 separation method Methods 0.000 abstract description 22
- 230000009467 reduction Effects 0.000 abstract description 9
- 230000009466 transformation Effects 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 101150087426 Gnal gene Proteins 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 240000006890 Erythroxylum coca Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 235000008957 cocaer Nutrition 0.000 description 1
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 235000021395 porridge Nutrition 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Bei einer Vorrichtung zum Verarbeiten eines Stereosignals mit einem ersten Kanal und einem zweiten Kanal wird das Stereosignal zunächst analysiert, um ein Maß für eine Menge an Bits zu erhalten, die von einem Codierer benötigt wird, um das Stereoaudiosignal unter Verwendung eines Codieralgorithmus zu codieren. Hierauf werden der erste und der zweite Kanal modifiziert, wenn das Maß für die Menge an Bits größer als ein vorbestimmter Wert ist, wobei die Modifikation derart vonstatten geht, daß die Energie eines Summensignals aus dem ersten und zweiten modifizierten Kanal in einem vorbestimmten Verhältnis zur Energie eines Summensignals aus dem ersten und zweiten Kanal ist, und daß ein Differenzsignal aus dem ersten und zweiten modifizierten Kanal gegenüber dem Differenzsignal aus dem ersten und zweiten Kanal gedämpft ist. Insbesondere für Audiocodierer, die eine konstante Ausgangsbitrate erfordern, wird im Falle von Stereoaudiosignalen, deren Codierung die Ausgangsbitrate des Codierers nicht einhalten kann, der Seite-Kanal gedämpft, wodurch Stereokanaltrennung zugunsten einer erhöhten Audiobandbreite bzw. einer Verringerung von Quantisierungsstörungen aufgegeben wird.
Description
Die vorliegende Erfindung bezieht sich allgemein auf die Co
dierung von Audiosignalen und insbesondere auf eine Verar
beitung von Stereosignalen.
Ein Stereosignal umfaßt zumindest zwei Kanäle, d. h. einen
linken Kanal und einen rechten Kanal. Darüber hinaus können
Stereosignale noch einen linken und rechten Surround-Kanal
haben. Außerdem besteht die Möglichkeit, daß ein Stereosi
gnal fünf verschiedene Kanäle hat, d. h. einen vorderen lin
ken Kanal, einen vorderen Mitte-Kanal und einen vorderen
rechten Kanal sowie einen linken hinteren und einen hinteren
rechten Kanal.
Für eine datenreduzierende Codierung von Stereosignalen be
steht die Möglichkeit, daß Ähnlichkeiten von zumindest zwei
Kanälen ausgenutzt werden, um die Menge an Bits zu reduzie
ren, die benötigt wird, um ein Stereosignal mit mindestens
zwei Kanälen zu codieren.
Ein bekanntes Verfahren zum Verarbeiten von Stereosignalen,
um eine effizientere Codierung zu erreichen, wird als Mit
te/Seite-Verfahren (M/S-Verfahren) bezeichnet. Beim M/S-Ver
fahren werden der erste und der zweite Kanal miteinander
kombiniert, um einen Mitte-Kanal und einen Seite-Kanal zu
erzeugen. Aus Übersichtlichkeitsgründen wird im nachfolgen
den nicht mehr von einem ersten und einem zweiten Kanal,
sondern von einem linken Kanal (L-Kanal) und von einem rech
ten Kanal (R-Kanal) gesprochen. Es ist bekannt, daß der Mit
te-Kanal gleich der Summe aus linkem Kanal L und rechtem Ka
nal R, multipliziert mit einem Faktor von 0,5, ist, während
der Seite-Kanal die Differenz zwischen dem linken Kanal L
und dem rechten Kanal R ist, multipliziert mit einem Faktor
von z. B. 0,5 (andere Faktoren sind ebenfalls möglich).
Gleichungsmäßig ausgedrückt bedeutet dies:
M = 0,5.(L + R)
S = 0,5.(L - R).
Wenn der linke Kanal L und der rechte Kanal R relativ ähn
lich zueinander sind, so bringt eine M/S-Verarbeitung eine
deutliche Einsparung der zum Codieren benötigten Bitmenge,
da der Seite-Kanal relativ weniger Energie als R oder L
haben wird. Im Grenzfall, bei dem der linke Kanal L und der
rechte Kanal R identisch sind, wird der Mitte-Kanal gleich
dem linken Kanal L oder gleich dem rechten Kanal R sein,
während der Seite-Kanal 0 ist. Es ist zu sehen, daß somit
aufgrund der Tatsache, daß der Seite-Kanal 0 ist, eine
theoretisch maximale Bitrateneinsparung beim Codieren von
50% erreicht wird, da nur der Mitte-Kanal codiert werden
muß, während für den Seite-Kanal keinerlei Bits aufgewendet
werden müssen.
Es besteht somit die allgemeine Regel, daß je ähnlicher sich
der rechte und der linke Kanal sind, desto kleiner, d. h.
energieärmer, wird der Seite-Kanal sein, und umso weniger
Bits werden zur Codierung des Seite-Kanals benötigt.
Ein Hörer wird die Ähnlichkeit von linkem und rechtem Kanal
dadurch wahrnehmen, daß, im Falle von identischen Kanälen,
ein Sprecher oder ein Orchester genau in der Mitte zwischen
den beiden Lautsprechern wahrgenommen wird. Andererseits
wird ein Hörer unähnliche Kanäle dadurch wahrnehmen, daß er
einen ausgeprägten Stereo-Effekt hat, d. h. daß ein Spre
cher, ein Orchester bzw. einzelne Instrumente eines Orche
sters genau links und/oder genau rechts lokalisiert werden
können. Wird der Fall betrachtet, daß der linke Kanal viel
Energie hat, und daß der rechte Kanal nur wenig Energie hat,
d. h. der Fall, bei dem z. B. nur ein einziges Instrument
ganz links im Aufzeichnungsraum angeordnet ist, und nur im
linken Kanal hörbar ist, während auf dem rechten Kanal le
diglich Rauschen ist, so wird der Mitte-Kanal nach einer
M/S-Verarbeitung etwa gleich dem linken Kanal sein. Darü
berhinaus wird auch der Seite-Kanal etwa gleich dem linken
Kanal sein. In diesem Fall haben somit sowohl der Mitte-
Kanal als auch der Seite-Kanal nahezu gleich viel Energie
und müssen beide mit einer relativ großen Anzahl von Bits
codiert werden. Im Vergleich zum ursprünglichen Fall hat
sich bei dieser Signalkonstellation die zur Codierung er
forderliche Bitmenge aufgrund der M/S-Codierung nicht ver
kleinert, sondern im Grenzfall sogar verdoppelt, wenn davon
ausgegangen wird, daß der linke Kanal L eine bestimmte Ener
giemenge umfaßt, während der rechte Kanal R 0 ist. Hier wäre
es wesentlich günstiger gewesen, keine M/S-Verarbeitung
durchzuführen, sondern lediglich eine L/R-Verarbeitung. Die
Auswirkungen auf die Anzahl von Bits, die benötigt werden,
um ein Stereosignal zu codieren, reichen somit in einem
Extremfall von einer Einsparung von 50% bis zum anderen
Extremfall, der eine Verdoppelung der zum Codieren benötig
ten Bits zur Folge hat. Es muß daher beim Einsatz eines
M/S-Verfahrens genau darauf geachtet werden, ob das Stück
für eine M/S-Verarbeitung geeignet ist oder nicht. In dem
Fall, in dem ein Stereosignal (z. B. ein Testausschnitt von
20 ms, der auch als Frame bezeichnet wird) nicht für eine
M/S-Verarbeitung geeignet ist, wird aus Biteffizienzgründen
auf die M/S-Verarbeitung verzichtet, und es werden sowohl
der linke als auch der rechte Kanal für sich gesehen co
diert. Dieser "normale" Fall wird auch als L/R-Verarbeitung
bezeichnet.
Übliche Audiocodierverfahren, wie sie beispielsweise verwen
det werden, um Audiosignale zu codieren, die gemäß einem der
MPEG-Standards decodiert werden, gliedern sich generell in
mehrere Schritte. Zunächst wird ein Audiosignal, das bei
spielsweise in Form von PCM-Abtastwerten vorliegt, wie sie
z. B. ein CD-Player ausgibt, mittels einer Zeit-Frequenz-
Transformation oder einer Filterbank in eine spektrale Dar
stellung überführt. Typischerweise wird ein Block mit einer
bestimmten Anzahl von Abtastwerten, der auch als "Frame"
bezeichnet wird, verwendet, um einen Block von komplexen
Spektralwerten zu erzeugen, die ein Kurzzeitspektrum des
Frames von Audioabtastwerten ("Samples") bilden. Die Block
bildung wird unter Verwendung von Transformationsfenstern
erreicht, welche beispielsweise 1024 Abtastwerte lang sind.
Wenn beispielsweise überlappende Fenster zur Transformation
verwendet werden, deren Überlappungsgrad 50% beträgt, werden
aus 1024 Abtastwerten 1024 Spektralwerte gebildet. Diese
Spektralwerte werden anschließend mittels eines bekannten
Iterationsprozesses quantisiert, wonach die quantisierten
Spektralwerte einer Entropie-Codierung z. B. unter Verwen
dung einer Mehrzahl von festgelegten Huffmann-Codetabellen
unterzogen werden, um schließlich einen Bitstrom zu erhal
ten, der einerseits die codierten quantisierten Spektral
werte enthält und der andererseits auch Seiteninformationen
aufweist, die sich auf die Fenster, auf Skalenfaktoren, die
beim Quantisieren berechnet werden sowie auf weitere Infor
mationen beziehen, die zum Decodieren des Bitstroms benötigt
werden.
Eine Mitte/Seite-Verarbeitung kann entweder vor der Trans
formation in den Spektralbereich durchgeführt werden, d. h.
unter Verwendung der digitalen zeitdiskreten Abtastwerte.
Alternativ kann eine Mitte/Seite-Verarbeitung jedoch auch
nach der Transformation, d. h. mit den komplexen Spektral
werten durchgeführt werden. Die letztere Alternative bietet
darüberhinaus den Vorteil, daß eine Mitte/Seite-Verarbeitung
nicht, wie im Zeitbereich, für das gesamte Spektrum einge
setzt werden kann, sondern auch für bestimmte Frequenzbän
der, wenn bestimmte Spektralwerte einer Mitte/Seite-Verar
beitung unterzogen werden, und andere nicht.
Üblicherweise sind Audiocodierer derart ausgelegt, daß sie
eine konstante Bitrate, d. h. eine bestimmte Anzahl von Bits
pro Sekunde, liefern. Eine andere Randbedingung besteht dar
in, daß das durch das Quantisieren eingeführte Quantisie
rungsrauschen wenn möglich derart gewählt wird, daß seine
Energie unter der psychoakustischen Maskierungsschwelle oder
Mithörschwelle des Audiosignals ist. Das grundsätzliche Ver
fahren, um das Quantisierungsrauschen im Frequenzbereich
einzustellen, besteht in der "Formung" des Rauschens unter
Verwendung der Skalenfaktoren. Zu diesem Zweck wird, wie es
bekannt ist, das Spektrum in mehrere Gruppen von Spektralko
effizienten aufgeteilt, die Skalenfaktorbänder genannte wer
den, denen ein einziger Skalenfaktor zugeordnet ist. Ein
Skalenfaktor stellt einen Multiplikationswert dar, der ver
wendet wird, um die Amplitude aller Spektralkoeffizienten in
diesem Skalenfaktorband zu verändern. Dieser Mechanismus
wird verwendet, um die Zuordnung des Quantisierungsrauschens
im Spektralbereich, das durch den Quantisierer erzeugt wird,
so einzustellen, daß in jedem Skalenfaktorband die Energie
des Quantisierungsrauschens unter der psychoakustischen
Maskierungsschwelle in diesem Skalenfaktorband ist. Es ist
ersichtlich, daß weder das Quantisieren noch das Entropie-
Codieren Vorgänge sind, die eine konstante Bitrate begün
stigen. Es sei angemerkt, daß - ganz im Gegenteil - beide
Verfahren eine variable Bitrate begünstigen. Für Übertra
gungsanwendungen ist es jedoch oftmals gefordert, daß der
Codierer eine konstante Bitrate am Ausgang hat. Um eine
konstante Bitrate zu liefern, wird üblicherweise ein soge
nanntes Bitreservoir eingesetzt. Wenn das Audiosignal derart
beschaffen ist, daß kurzzeitig weniger Bits als durch die
äußere Bitrate am Ausgangs des Codierers vorgegeben benötigt
werden, so werden Bits dem Bitreservoir zugeordnet, um im
Falle eines Audiosignalabschnitts, der mehr Bits zur Codie
rung benötigt, auch mehr Bits geben zu können, wodurch das
Bitreservoir wieder geleert wird.
Es sei darauf hingewiesen, daß eine Randbedingung eines sol
chen Codierers wie erwähnt die konstante Ausgangsbitrate
ist, und daß die andere Randbedingung darin besteht, daß das
Quantisierungsrauschen kleiner oder gleich der psychoakusti
schen Maskierungsschwelle ist, damit es durch das Audiosi
gnal maskiert oder verdeckt wird.
Im nachfolgenden wird auf Möglichkeiten eingegangen, was zu
unternehmen ist, wenn die "innere Bitrate" des Codierers von
der äußeren konstanten Ausgangsbitrate abweicht. Ist die in
nere Bitrate derart niedrig, daß beispielsweise das Bitre
servoir auf seinen maximalen Wert aufgefüllt ist, so exi
stiert selbstverständlich kein Problem, da der Quantisierer
dann derart gesteuert werden kann, daß er nun noch feiner
als nötig quantisiert, wodurch mehr Bits zum Quantisieren
benötigt werden. Dies wird so lange durchgeführt, bis die
"äußere" konstante Bitrate erreicht ist.
Kritischer ist jedoch der Fall, bei dem die "innere Bitrate"
des Codierers höher ist als die ausgangsseitig geforderte
konstante Bitrate. Dieser Fall wird auftreten, wenn das
Audiosignal schwer zu codieren ist, d. h. wenn der Codierer
viele Bits aufwenden muß, um das Audiosignal zu codieren,
was auch anschaulich als "hohe Last" des Codierers bezeich
net werden kann. Für die Transformationscodierung besteht
der Merksatz, daß sie tonale Stücke relativ effizient co
diert werden kann, daß jedoch rauschhafte Signale, die re
lativ hohe Energien haben, und die darüberhinaus ein relativ
kompliziertes Spektrum haben, wie beispielsweise Sprache
oder Schlagzeug- bzw. Trommelmusik, relativ wenig kompri
miert werden können. Auch Signale, die transient sind, d. h.
die ein unregelmäßiges Zeitverhalten haben, können nur rela
tiv aufwendig codiert werden, wenn keine Codierungsartefakte
erzeugt werden sollen. Im Fall von transienten Signalen wird
bereits bei der Fensterung von langen Fenstern auf kürzere
Fenster umgeschaltet, um eine bessere zeitliche Auflösung zu
erreichen, bzw. um zu erreichen, daß sich das Quantisie
rungsrauschen nur über eine kleinere Anzahl von Audioabtast
werten "verschmiert". Im Falle von kurzen Fenstern fallen
wesentlich mehr Seiteninformationen an.
Ein Codierer, der feststellt, daß die Ausgangsbitrate nicht
reicht, und der auch schon das Bitreservoir "leergefahren"
hat, hat nun mehrere Möglichkeiten, um seine innere Bitrate
"gewaltsam" zu reduzieren, um das Kriterium der konstanten
Ausgangsbitrate zu erfüllen. Eine Möglichkeit besteht darin,
auf die Umschaltung zu kurzen Fenstern zu verzichten. Dies
führt jedoch zu hörbaren Codierartefakten.
Eine weitere Möglichkeit besteht darin, die psychoakustische
Maskierungsschwelle bei der Quantisierung bewußt zu verlet
zen, um gröber als eigentlich erforderlich zu quantisieren,
um eine niedrigere Bitrate zu erreichen. Auch dies führt zu
hörbaren Störungen.
Eine weitere Möglichkeit besteht darin, die Audiobandbreite
zu verringern, d. h. nicht mehr die volle Audiobandbreite zu
codieren sondern ab einer bestimmten von der Ausgangsbitrate
abhängigen Grenzfrequenz die darüberliegenden Spektralwerte
zu 0 zu setzen, um somit die Ausgangsbitrate zu reduzieren.
Dieses Verfahren führt nicht zu hörbaren Quantisierungsstö
rungen, führt jedoch zu einem Verlust an Höhen im Audiosi
gnal. Oftmals wird dieser Verlust jedoch weniger stark wahr
genommen als ein hörbares Quantisierungsrauschen.
Ein besonderes Problem bei der Codierung von Stereosignalen
besteht in dem als "Stereo Unmasking" bezeichneten Effekt,
der nachfolgend kurz dargelegt wird. Wird eine normale L/R-
Codierung eingesetzt, so wird sowohl der linke Kanal als
auch der rechte Kanal für sich transformiert, quantisiert
und codiert, so daß das im linken Kanal und rechten Kanal
zur Datenreduzierung eingeführte Quantisierungsrauschen un
abhängig vom jeweils anderen Kanal sind. Das heißt, daß das
Quantisierungsrauschen im linken Kanal und das Quantisie
rungsrauschen im rechten Kanal nicht korreliert sind. Wird
der Fall betrachtet, daß sich linker und rechter Kanal re
lativ ähnlich sind, so bedeutet dies, daß ein Hörer nach
einer Decodierung dieses Signal so wahrnehmen wird, daß
beispielsweise ein Sprecher in der Mitte ist. Der "Stereo-
Unmasking"-Effekt besteht nun darin, daß aufgrund der Tat
sache, daß das Quantisierungsrauschen in den beiden Kanälen
nicht korreliert ist, das Quantisierungsrauschen des linken
Kanals links und das Quantisierungsrauschen des rechten Ka
nals rechts wahrgenommen wird. Eine hohe Verdeckung des Rau
schens findet aber lediglich in der Mitte statt, wo auch das
Nutzsignal ist, jedoch nicht links und rechts.
Die M/S-Codierung hat daher neben ihrer Datenraten-reduzie
renden Wirkung bei speziellen Signalen auch den Vorteil, daß
das Quantisierungsrauschen sowohl im linken Kanal als auch
im rechten Kanal mit dem Quantisierungsrauschen des jeweils
anderen Kanals korreliert wird, so daß auch das Quantisie
rungsrauschen in der Mitte stattfindet und dort von dem
Nutzsignal im wesentlichen vollständig bzw. wesentlich bes
ser als im unkorrelierten Fall verdeckt wird. Anders ist der
Fall, bei dem der linke und der rechte Kanal relativ unähn
lich sind. Wenn hier M/S-Codierung eingesetzt wird, so wird
aufgrund des Stereoeffekts das Nutzsignal entweder links
oder rechts sein, während aufgrund der M/S-Codierung das
Quantisierungsrauschen korreliert ist und eher in der Mitte
liegt. Auch hier findet sozusagen ein Stereo-Unmasking
statt.
In jüngster Zeit werden immer mehr skalierbare Audiocodierer
untersucht. Skalierbare Audiocodierer sind derart angeord
net, daß ihr ausgangsseitiger Bitstrom zumindest eine erste
und eine zweite Skalierungsschicht aufweist. Ein Decodierer,
der einfach ausgelegt ist, wird aus dem skalierten Bitstrom
lediglich die erste Skalierungsschicht entnehmen, die bei
spielsweise ein codiertes Audiosignal mit reduzierter Band
breite aufweist bzw. ein mit einem einfachen Codieralgorith
mus codiertes Audiosignal ist. Ein anderer Decodierer, der
voll ausgelegt ist, wird sowohl die erste Skalierungsschicht
als auch die zweite Skalierungsschicht aus dem Bitstrom neh
men, um die erste Skalierungsschicht mit einem ersten Deco
dierer zu decodieren, und um dann die zweite Skalierungs
schicht ebenfalls zu decodieren, die alleine oder zusammen
mit der decodierten ersten Skalierungsschicht ein Audiosi
gnal mit voller Bandbreite liefert.
Skalierbare Codierer sind besonders im Bereich der Stereosi
gnale erwünscht, da hier als erste Skalierungsschicht ein
Mono-Signal, d. h. der Mitte-Kanal, verwendet werden kann,
während als zweite Skalierungsschicht z. B. der Seite-Kanal
genommen werden kann. Ein einfacher Decodierer bzw. ein De
codierer, der auf schnellen Betrieb ausgelegt ist, wird le
diglich das Mono-Signal liefern, während ein besserer Deco
dierer bzw. ein Decodierer, bei dem die Schnelligkeit der
Übertragung nicht das entscheidenste Kriterium ist, neben
der Mono- bzw. Mitte-Schicht auch die Seite-Schicht nehmen
wird, um ein volles Stereosignal am Ausgang des Decodierers
zu erzeugen.
Für den Aufbau der Skalierungsschichten existieren verschie
dene Möglichkeiten. Die erste Skalierungsschicht kann sich
von der zweiten Skalierungsschicht bzw. von einer beliebigen
Anzahl weiterer Skalierungsschichten im Audiocodierverfahren
selbst, in der Audiobandbreite, in der Audioqualität, bezüg
lich Mono/Stereo und oder einer Kombination der genannten
Qualitätskriterien bzw. weiterer denkbarer Kriterien unter
scheiden. Für eine hohe Codiereffizienz wird es angestrebt,
daß die zweite Skalierungsschicht eine möglichst kleine An
zahl an Bits aufweist, bzw. daß ein Decodierer, der die
zweite Skalierungsschicht decodiert, möglichst umfassend
auch die erste Skalierungsschicht verwendet. Wenn ein ska
lierbarer Codierer für Stereosignale betrachtet wird, der
als erste Skalierungsschicht das Mitte-Signal, d. h. das
Mono-Signal liefert, und der als zweite Schicht den Seite-
Kanal liefert, so ist zu sehen, daß seine Gesamteffizienz
umso besser ist, je öfter die M/S-Codierung eingesetzt wird.
Diese Forderung steht jedoch bei bestimmten Stereosignalen
im Widerspruch zur Biteffizienz, nämlich bei Stereosignalen,
die eine hohe Stereokanaltrennung haben. Andererseits lie
fert die M/S-Verarbeitung eine gewisse "natürliche" Skalier
barkeit und führt zu einer Korrelation des Quantisierungs
rauschen im linken Kanal und im rechten Kanal.
Die genannten Probleme bezüglich der M/S-Codierung gelten
umso mehr, je mehr ein zu codierendes Audiosignal seine Ei
genschaften bezüglich der M/S-Codierung plötzlich ändert.
Hat ein zu codierendes Audiosignal auf einmal nicht mehr die
Eigenschaft, daß der linke Kanal ähnlich dem rechten ist,
fällt der M/S-Codierungsgewinn weg. Eine Folge wird daher in
der Regel eine Zunahme der Quantisierungsstörung womöglich
über die psychoakustische Hörschwelle hinaus und/oder eine
Reduktion der Audiobandbreite je nach konkreter Implementie
rung des Codierers sein.
Dieses Problem macht sich besonders stark, aber nicht nur,
bei der skalierbaren Audiocodierung bemerkbar, und insbe
sondere dort, wo die sogenannte Mono-Stereo-Skalierbarkeit
benutzt wird, wie es oben ausgeführt worden ist.
Die Aufgabe der vorliegenden Erfindung besteht darin, eine
Vorrichtung und ein Verfahren zum Verarbeiten eines Stereo
audiosignals zu schaffen, das zu weniger hörbaren Störungen
führt.
Diese Aufgabe wird durch eine Vorrichtung zum Verarbeiten
eines Stereoaudiosignals nach Patentanspruch 1 sowie durch
ein Verfahren zum Verarbeiten eines Stereoaudiosignals nach
Patentanspruch 18 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde,
daß es bei Stereoaudiosignalen oftmals günstiger ist, auf
eine hohe Stereokanaltrennung zu verzichten, um eine höhere
Audiobandbreite und/oder geringere hörbare Störung im Ver
gleich zu dem Fall zu erreichen, bei dem die Stereokanal
trennung beibehalten wird, während die Audiobandbreite redu
ziert wird, oder durch das Quantisieren eingeführte Störun
gen hörbar werden.
Erfahrungsgemäß wird ein Hörer hörbare Quantisierungsstö
rungen eher als unangenehm empfinden, als eine geringere
Stereokanaltrennung. Hörbare Quantisierungsstörungen sind
generell ein Fremdkörper in einem Audiosignal, während ein
Hörer eines erfindungsgemäß verarbeiteten Stereosignals
nicht unbedingt weiß, wie die Stereokanaltrennung des
Ausgangssignals war und somit eine geringere Stereokanal
trennung nicht als Codierartefakt empfinden wird.
Eine Verringerung der Stereokanaltrennung wird somit einge
setzt, um die ausgangsseitige Bitrate des Codierers generell
zu verringern, oder auf einen vorbestimmten Wert zu redu
zieren.
Eine erfindungsgemäße Vorrichtung zum Verarbeiten eines Ste
reosignals, das einen ersten Kanal und einen zweiten Kanal
aufweist, umfaßt eine Einrichtung zum Analysieren des Ste
reoaudiosignals, um ein Maß für eine Menge an Bits zu erhal
ten, die von einem Codierer benötigt wird, um das Stereo
audiosignal unter Verwendung eines Codieralgorithmus zu co
dieren, und eine Einrichtung zum Modifizieren des ersten und
des zweiten Kanals, um einen modifizierten ersten und einen
modifizierten zweiten Kanal zu erhalten, wobei die Einrich
tung zum Modifizieren auf die Einrichtung zum Analysieren
anspricht, um wirksam zu sein, wenn das Maß für die Menge an
Bits ein vorbestimmtes Maß überschreitet, und wobei die Ein
richtung zum Modifizieren derart ausgestaltet ist, daß ein
Summensignal aus dem ersten und zweiten modifizierten Kanal
zumindest gemäß einer Charakteristik des Signals, die sich
ähnlich zu der Energie des Signals ändert, im wesentlichen
gleich der Charakteristik eines Summensignals aus dem ersten
und zweiten Kanal ist, und daß ein Differenzsignal aus dem
ersten und dem zweiten modifizierten Kanal gegenüber dem
Differenzsignal aus dem ersten und zweiten Kanal gedämpft
ist.
Es sei darauf hingewiesen, daß die Charakteristik, die ähn
lich zur Energie verläuft, die Energie selbst sein kann,
aber auch z. B. die Summe von quadrierten Abtastwerten in
einer bestimmten Zeitdauer, die Summe von quadrierten Spek
tralwerten in einem bestimmten Frequenzbereich, die Summe
von Abtastwertbeträgen in einer bestimmten Zeitdauer oder
die Summe von quadrierten Spektralwerten in einem bestimmten
Frequenzbereich ist oder aber auch eine Kombination zwischen
zwei oder mehreren der genannten Charakteristika. Aus Ein
fachheitsgründen wird im nachfolgenden jedoch beispielhaft
von der Energie als Charakteristik, die ähnlich zur Energie
verläuft, gesprochen.
Das Modifizieren des Stereoaudiosignals, d. h. das Reduzie
ren der Kanaltrennung, wird unter der Voraussetzung durchge
führt, daß die Lautstärke des Signals nicht schwankt. Eine
reduzierte Kanaltrennung selbst wird nicht zu störenden Ar
tefakten im decodierten Signal führen, eine Schwankung der
Lautstärke jedoch schon. Daher werden der erste und der
zweite Kanal, z. B. der linke Kanal und der rechte Kanal,
derart modifiziert, daß die Lautstärke, d. h. das Summensi
gnal, gegenüber dem unmodifizierten ersten und zweiten Kanal
zumindest energiemäßig und bevorzugterweise sogar signal
mäßig im wesentlichen gleich bleibt, während das Differenz
signal gedämpft ist.
Die erfindungsgemäße Vorverarbeitung des Stereosignals wird
immer dann einsetzen, wenn festgestellt wird, daß die Menge
an Bits, die benötigt wird, um das Stereoaudiosignal zu co
dieren, zu hoch wird. Das Maß für die Menge an Bits, die zum
Codieren des Stereoaudiosignals benötigt werden, kann aus
dem Stereoaudiosignal durch Analyse desselben auf verschie
dene Arten und Weisen abgeleitet werden.
Zunächst kann der Mitte- und der Seite-Kanal des Stereo
audiosignals betrachtet werden, um aufgrund eines Energie
verhältnisses bzw. einer Differenz der Logarithmen der
Energien derselben festzustellen, wieviel Bits benötigt wer
den. Ohne die genaue Anzahl von Bits feststellen zu müssen,
ist die Schlußfolgerung zulässig, daß im Falle eines kleinen
Energieverhältnisses zwischen Mitte- und Seite-Kanal, d. h.
im Falle von etwa gleich großen Kanälen, eine hohe Anzahl
von Bits nötig sein wird. Je geringer somit das Energiever
hältnis zwischen dem Mitte- und dem Seite-Kanal ist, umso
mehr Dämpfung des Seite-Kanals wird notwendig sein, um eine
bestimmte Ausgangsbitrate zu erreichen. Ein kleines Energie
verhältnis zwischen dem Mitte- und dem Seite-Kanal liegt
vor, wenn das ursprüngliche Audiosignal eine hohe Stereoka
naltrennung hat, beispielsweise wenn der linke Kanal viel
Energie hat, während der rechte Kanal im wesentlichen Rau
schen hat. Ein kleines Energieverhältnis liegt jedoch auch
vor, wenn im linken Kanal die Sprache eines Sprechers ist,
und wenn im rechten Kanal die Sprache eines anderen Spre
chers ist, was dazu führt, daß der linke Kanal und der rech
te Kanal unter Umständen gleich viel Energie haben, daß
jedoch beide Kanäle unkorreliert sind. Auch in diesem Fall
liegt eine hohe Stereosignaltrennung vor, und der Mitte-Ka
nal und der Seite-Kanal werden eine relativ geringe Diffe
renz der Logarithmen der Energie haben.
Eine weitere Möglichkeit zur Bestimmung des Maßes für eine
Menge an Bits besteht jedoch unabhängig von der Beschaf
fenheit des Mitte-Kanals und des Seite-Kanals darin, den
Codierer an sich zu betrachten. Ein Maß für die von einem
Codierer benötigte Anzahl an Bits ist die sogenannte Percep
tual Entropy (PE), die gleich dem Energieverhältnis zwischen
dem Nutzaudiosignal und der für das Nutzaudiosignal berech
neten psychoakustischen Mithörschwelle ist. Ist die PE groß,
kann gefolgert werden, daß das Audiosignal eine relativ
geringe Verdeckungsfähigkeit hat. Ist die PE dagegen klein,
d. h. liegt die Energie des Nutzsignals nur knapp über der
psychoakustischen Mithörschwelle, so muß das Nutzsignal nur
relativ grob quantisiert werden, und das Quantisierungsrau
schen ist immer noch unter der psychoakustischen Mithör
schwelle "versteckt". Wird festgestellt, daß die Summe aus
der, vorzugsweise über einer gewissen Zeit gemittelten, PE
des linken Kanals und der, ebenfalls vorzugsweise über einer
gewissen Zeit gemittelten, PE für den rechten Kanal über
einem vorbestimmten Wert liegt, so wird erfindungsgemäß der
Seite-Kanal gedämpft, um die erforderliche Anzahl von Bits
zu reduzieren. Dieser alternative Aspekt der vorliegenden
Erfindung befaßt sich somit nicht mit dem individuellen
Aussehen des Mitte- und des Seite-Kanals, sondern mit dem
Stereoaudiosignal selbst, das nicht bezüglich seiner M/S-Co
dierfähigkeit beurteilt wird, sondern seiner generellen
Audiocodierfähigkeit, d. h. der Schwierigkeit, dasselbe zu
codieren, um eine bestimmte Zielbitrate zu erreichen.
Eine Verallgemeinerung des zweiten Aspekts besteht darin,
irgendeine andere Größe als Maß für die Menge an Bits zu
verwenden, welche auf die "Last" des Codierers hinweist.
Eine solche Größe kann beispielsweise auch ein Signal sein,
das aufgrund transienter Eigenschaften des Audiosignals an
zeigt, daß ein Audiocodierer kurze Fenster zum Fenstern ver
wenden muß, da es Tatsache ist, daß kurze Fenster nicht
zuletzt aufgrund der gestiegenen Anzahl von Seiteninforma
tionen ein höhere Bitrate erforderlich machen. Zwecks der
vorliegenden Erfindung kann somit die gesamte Palette von
Steuergrößen eines Audiocodierers verwendet werden, um ein
Maß dafür zu finden, daß bzw. wie stark der Seite-Kanal ge
dämpft werden muß, um die Ausgangsbitrate des Codierers zu
verringern.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung
führen eine zeitlich zunehmende bzw. zeitlich abnehmende
Dämpfung des Seite-Kanals durch, um zu verhindern, daß ein
Hörer die abnehmende Stereokanaltrennung unmittelbar wahr
nimmt, sondern daß die Verringerung der Stereokanaltrennung
nach und nach eintritt bzw. die Vergrößerung der Stereoka
naltrennung nach und nach zunimmt, um die codiererseitige
Manipulation des Stereoaudiosignals möglichst gut zu ver
schleiern.
Es sei darauf hingewiesen, daß zum Beibehalten einer nicht
schwankenden Lautstärke aufgrund des Modifizierens das Sum
mensignal des modifizierten linken und rechten Kanals nicht
unbedingt zu dem Summensignal des nicht modifizierten linken
und rechten Kanals identisch sein muß, sondern daß es ge
nügt, daß lediglich die Energien der beiden Summensignale im
wesentlichen gleich sind bzw. in einem vorbestimmten Ver
hältnis zueinander liegen. Ein Zuhörer weiß nicht, wie groß
die Lautstärke des unmodifizierten Stereoaudiosignals war
und wird es daher nicht als Störung empfinden, wenn durch
die Vorverarbeitung eine Lautstärkenveränderung in Richtung
höherer Lautstärke bzw. geringerer Lautstärke eingeführt
worden ist. Aufgrund der Einfachheit der Implementation wird
es jedoch bevorzugt, daß dieses Verhältnis gleich 1 ist.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung
werden nachfolgend bezugnehmend auf die beiliegenden Zeich
nungen detailliert erläutert. Es zeigen:
Fig. 1 ein Prinzipblockschaltbild der erfindungsgemäßen
Vorrichtung zum Verarbeiten eines Stereoaudiosi
gnals;
Fig. 2 eine detailliertere Darstellung einer bevorzugten
Ausgestaltung der Einrichtung zum Modifizieren;
und
Fig. 3 ein Blockschaltbild einer erfindungsgemäßen Vor
richtung als Vorverarbeitungsstufe für einen ska
lierbaren Codierer mit Mono/Stereo-Skalierbarkeit.
Fig. 1 zeigt ein Blockschaltbild der erfindungsgemäßen Vor
richtung zum Verarbeiten eines Stereoaudiosignals, das an
einem Eingang 10 in die Vorrichtung eingespeist wird und
einen ersten Kanal L und einen zweiten Kanal R aufweist. Das
Stereoaudiosignal in Form des ersten Kanals L und des zwei
ten Kanals R wird einerseits in eine Einrichtung 12 zum Ana
lysieren des Stereoaudiosignals eingespeist, und wird ande
rerseits auch in eine Einrichtung 14 zum Modifizieren des
ersten und zweiten Kanals eingespeist, um an einem Ausgang
16 einen modifizierten ersten Kanal L' und einen modifi
zierten zweiten Kanal R' zu erhalten. Generell werden sich
der modifizierte erste Kanal L' und der modifizierte zweite
Kanal R' am Ausgang 16 vom nicht modifizierten ersten Kanal
L und vom nicht modifizierten zweiten Kanal R am Eingang 10
darin unterscheiden, daß das am Ausgang 16 anliegende modi
fizierte Stereoaudiosignal eine geringere Kanaltrennung als
das nicht-modifizierte Stereoaudiosignal am Eingang 10 haben
wird.
Die Einrichtung 12 zum Analysieren des Stereoaudiosignals
ermittelt ein Maß für eine Menge an Bits, die von einem in
Fig. 1 nicht gezeigten Codierer benötigt wird, um das Ste
reoaudiosignal unter Verwendung eines durch den Codierer
vorgegebenen Codieralgorithmus zu codieren. Das Maß für die
Bitmenge wird von der Einrichtung 12 zum Analysieren über
einen Signalpfad 18 der Einrichtung 14 zum Modifizieren
zugeführt. Übersteigt das über den Signalpfad 18 zugeführte
Maß für die Bitmenge ein vorbestimmtes Maß, so wird die Ein
richtung 14 zum Modifizieren wirksam, um den ersten Kanal L
und den zweiten Kanal R zu modifizieren. Erfindungsgemäß
wird die Modifikation des ersten und zweiten Kanals derart
durchgeführt, daß die Energie der Summe des modifizierten
Stereoaudiosignals am Ausgang 16 in einem vorbestimmten Ver
hältnis und vorzugsweise im wesentlichen gleich der Energie
des nicht modifizierten Stereoaudiosignals am Eingang 10
ist, während jedoch das Differenzsignal, das abgesehen von
dem Faktor von z. B. 0,5 dem Seite-Kanal entspricht, im
modifizierten Stereoaudiosignal am Ausgang 16 gegenüber dem
nicht modifizierten Stereoaudiosignal am Eingang 10 gedämpft
ist.
In Fig. 1 sind zwei Möglichkeiten der Speisung der Einrich
tung 12 zum Analysieren dargestellt, die einzeln oder in
Kombination verwendet werden können. Die erste Möglichkeit
ist durch einen linken Pfeil 15a dargestellt, der gewisser
maßen eine Vorwärtskopplung darstellt, d. h. die Einrichtung
zum Analysieren des Stereoaudiosignals wird mit dem nicht
modifizierten Signal L, R gespeist. Die andere Möglichkeit
besteht darin, die Einrichtung 12 zum Analysieren mit dem
modifizierten Signal L', R' zu speisen. Insbesondere in Fäl
len, in denen die Dämpfung des Seite-Signals zeitlich lang
sam abläuft, ist es unerheblich, ob die Dämpfung abhängig
von dem aktuellen nicht modifizierten Signal oder von einem
der letzten Verarbeitungsblocks des modifizierten Signals
gewissermaßen rückkopplungsmäßig gesteuert wird. Damit ist
es unerheblich, ob das Stereoaudiosignal selbst direkt
analysiert wird, oder aber indirekt anhand eines voraus
gehenden modifizierten Signals.
Im nachfolgenden wird auf verschiedene Ausgestaltungen der
Einrichtung 12 zum Analysieren des nicht modifizierten Ste
reoaudiosignals am Eingang 10 eingegangen. Eine Möglichkeit
besteht darin, daß die Einrichtung 12 zum Analysieren sowohl
den Mitte- als auch den Seite-Kanal des Stereoaudiosignals
bildet und dann das Verhältnis der Energien des Mitte- und
des Seite-Kanal betrachtet. Das Energieverhältnis zwischen
dem Mitte- und dem Seite-Kanal wird vorzugsweise über eine
bestimmte Zeit gemittelt, die beispielsweise in der Größen
ordnung von 10 Audio-Frames liegen kann, was einem Wert von
200 ms entspricht, wenn als Audiocodierer ein MPEG-2-AAC-
Codierer eingesetzt wird, der eine Frame-Länge von etwa 20 ms
haben kann. Bezüglich des MPEG-2-AAC-Codierers wird auf
den Standard ISO/IEC 13818-7 verwiesen, in dem die einzelnen
Funktionsblöcke eines Audiocodierers und eines Audio-Deco
dierers sowie ihr Zusammenwirken detailliert beschrieben
sind.
Wird festgestellt, daß das Energieverhältnis bzw. die Diffe
renz der Logarithmen kleiner als ein bestimmter abhängig vom
Anwendungsfall empirisch zu bestimmender Wert ist, der bei
spielsweise zu 6 dB gewählt werden kann, wird die Einrich
tung 14 zum Modifizieren aktiviert, um eine Dämpfung des
Seite-Kanals zu erreichen, wie es bezugnehmend auf Fig. 2
noch detaillierter ausgeführt werden wird. Gemäß dem im
vorstehenden dargelegten ersten Aspekt der vorliegenden
Erfindung arbeitet die Einrichtung 12 zum Analysieren des
Stereoaudiosignals somit aufgrund einer direkten Untersu
chung der MS-Codierfähigkeit des Stereoaudiosignals. Bei
einer Implementation dieses ersten Aspekts der vorliegenden
Erfindung wird die erfindungsgemäße Vorrichtung zum Verar
beiten des Stereoaudiosignals lediglich dann den Seite-Kanal
dämpfen, wenn das Signal eine nicht mehr so gute MS-Codier
fähigkeit aufweist, weil beispielsweise beide Kanäle entwe
der energiemäßig und/oder signalmäßig unähnlich zueinander
sind. Gemäß diesem Aspekt wird somit eine Stereokanaltren
nung immer dann reduziert, wenn das Beibehalten der ur
sprünglichen Stereokanaltrennung zu einer zu hohen Ausgangs
bitrate führen würde, und wenn die Stereokanaltrennung über
haupt hoch war.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird
die Dämpfung des Seite-Kanals zur Reduktion der ausgangs
seitigen Codiererbitrate eingesetzt, unabhängig davon, ob
das Stereoaudiosignal eine bestimmte MS-Codierfähigkeit hat
oder nicht. Dieser zweite erfindungsgemäße Aspekt geht davon
aus, daß selbst im Falle einer geringen Stereokanaltrennung
immer noch eine weitere Dämpfung des Seite-Kanals erreicht
werden kann, um eine vorbestimmte Ausgangsbitrate des Audio
codierers nicht zu überschreiten. Hierzu wird unabhängig von
der MS-Codierfähigkeit des Audiosignals die Anzahl an Bits
abgeschätzt, die benötigt wird, um das Audiosignal zu co
dieren.
Wie es in der Technik bekannt ist, verwenden moderne Audio
codierer, und beispielsweise auch ein MPEG-2-AAC-Audioco
dierer, ein psychoakustisches Modell, das dazu dient, von
einem zu codierenden Audiosignal die frequenzabhängige psy
choakustische Maskierungsschwelle zu berechnen. Grob gesagt
liefert das psychoakustische Modell als psychoakustische
Maskierungsschwelle für jedes Skalenfaktorband einen Ener
giewert. Liegt das durch den Quantisierer eingeführte Quan
tisierungsrauschen unter dem Energiewert oder ist das durch
die Quantisierungsstörungen eingeführte Rauschen gleich dem
Energiewert, so wird entsprechend der Psychoakustiktheorie
das eingeführte Quantisierungsrauschen im wesentlichen un
hörbar sein.
Das Energieverhältnis bzw. die Differenz der Logarithmen des
Audiosignals an sich und seiner psychoakustischen Maskie
rungsschwelle, die auch als Perceptual Entropy (PE) bezeich
net wird, liefert somit ein Maß dafür, wieviel Bits zum Co
dieren des Audiosignals benötigt werden. Ist die PE hoch, so
werden viele Bits benötigt, da die Maskierungsfähigkeit des
Audiosignals relativ gering ist und somit fein quantisiert
werden muß. Ist die PE dagegen klein, so werden relativ we
nig Bits benötigt, da das Audiosignal relativ gut maskiert,
und somit nur eine relativ grobe Quantisierung erforderlich
ist.
Gemäß einem bevorzugten Ausführungsbeispiel wird beim zwei
ten Aspekt der vorliegenden Erfindung das Maß für die Menge
an Bits folgendermaßen bestimmt. Die PE-Werte für die ein
zelnen Skalenfaktorbänder werden über der Frequenz inte
griert, d. h. aufsummiert. Dies wird sowohl für den linken
als auch für rechten Kanal durchgeführt. Anschließend wird
die PE-Summe für den linken Kanal zu der PE-Summe für den
rechten Kanal summiert. Dieser Summen-PE-Wert aus linkem und
rechtem Kanal stellt den Bitbedarf für einen Frame dar. Die
ser Summen-Kanal-PE-Wert wird dann noch vorzugsweise über
eine bestimmte Anzahl von Frames, wie z. B. 10, gemittelt,
um einen gemittelten PE-Wert für das Stereoaudiosignal zu
erhalten. Wenn dieser gemittelte PE-Wert größer oder gleich
einem typischerweise empirisch zu bestimmenden vorbestimmten
Wert ist, wird die Einrichtung zum Multiplizieren aktiviert,
um den Seite-Kanal zu dämpfen.
Verallgemeinert kann somit als Maß für die Menge an Bits,
die ein Codierer benötigen wird, irgendeine andere Regel
größe verwendet werden, die ein Maß für die "Last" des Co
dierers darstellt, wie z. B. ein Steuersignal des Codierers,
das den Einsatz von kurzen Fenster beim Fenstern signali
siert. Das Fenstern mit kurzen Fenstern führt per se zu ei
ner höheren Anzahl an Bits, da kürzere Fenster nicht so bit
sparend codiert werden können, wie längere Fenster.
Bezüglich des Dämpfungsbetrags des Seite-Kanals existieren
mehrere Möglichkeiten, die sich hier bezüglich ihres Auf
wands unterscheiden. Die einfachste Art und Weise besteht
darin, einen vorgegebenen Dämpfungswert als Zielwert zu ver
einbaren, der beispielsweise empirisch festgesetzt sein
kann. Eine weitere Möglichkeit besteht jedoch auch darin,
den Dämpfungswert adaptiv zu bestimmen, d. h. den Seite-Ka
nal um einen vorbestimmten Inkrementenbetrag zu dämpfen, und
dann wieder zu sehen, ob sich die Anzahl von Bits bereits
ausreichend verringert hat oder nicht. Es kann dann in eine
neue Iterationsschleife mit einem weiteren Inkrementen-Dämp
fungsbetrag eingestiegen werden, um wiederum festzustellen,
ob die Anzahl von Bits bereits ausreichend gering ist. Die
ses Verfahren kann so oft wiederholt werden, bis die vom Co
dierer benötigte Anzahl von Bits in einem Zielkorridor
liegt. Es ist jedoch ersichtlich, daß der Rechenzeit- und
Implementierungsaufwand im Falle der adaptiven Dämpfungsan
passung wesentlich höher als im Falle einer vorgegebenen
Dämpfung ist. Andererseits liefert eine adaptive Dämpfungs
anpassung die besten und genauesten Ergebnisse.
Im nachfolgenden wird auf Fig. 2 eingegangen, in der eine
detaillierte Darstellung der Einrichtung 14 zum Modifizieren
gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden
Erfindung dargestellt ist. Die Einrichtung 14 zum Modifizie
ren kann derart aufgefaßt werden, daß sie einen ersten Ein
gang 20a für den ersten Kanal L und einen zweiten Eingang
20b für den zweiten Kanal R aufweist. Die Einrichtung 14 um
faßt einen ersten Multiplizierer 22a zum Multiplizieren des
ersten Kanals L mit einem bestimmten Faktor x, einen zweiten
Multiplizierer 22b zum Multiplizieren des ersten Kanals L
mit einem Faktor y, einen dritten Multiplizierer zum Multi
plizieren des zweiten Kanals R mit dem Faktor x und schließ
lich einen vierten Multiplizierer 22d zum Multiplizieren des
zweiten Kanals R mit dem Faktor y. Darüberhinaus umfaßt die
Einrichtung 14 zum Modifizieren einen ersten Summierer 24a
zum Summieren des Ausgangssignals des ersten Multiplizierers
22a mit dem Ausgangssignal des vierten Multiplizierers 22d,
und einen zweiten Summierer 24b zum Summieren des Ausgangs
signals des zweiten Multiplizierers 22b mit dem Ausgangssi
gnal des dritten Multiplizierers 22c. Am Ausgang 26a des er
sten Summierers 24a liegt schließlich der modifizierte erste
Kanal L' an, und am Ausgang 26b des zweiten Summierers 24b
liegt der modifizierte zweite Kanal R' an.
Im nachfolgenden wird auf die Bestimmung der beiden Multi
plikationsfaktoren x, y eingegangen, um einen gedämpften
Seite-Kanal zu erreichen, während der Mitte-Kanal am Ausgang
26a, 26b gleich dem Mitte-Kanal am Eingang 20a, 20b der
Einrichtung 14, die in Fig. 2 gezeigt ist, ist. Für die von
der Einrichtung 14 zum Modifizieren durchgeführte Signal
verarbeitung gilt folgende Matrix:
L' = xL + yR (1)
R' = yL + xR (2).
Die Aufgabe besteht nun darin, daß x und y bestimmt werden,
damit gilt:
L' + R' = L + R = M = M', (3)
und daß gilt:
L' - R' = S' = Dämpfung.S = Dämpfung.(L-R) (4).
Es ergibt sich:
M = 0,5 (x + y) (L + R) (5).
Da M nicht durch die Verarbeitung modifiziert werden soll,
gilt ferner folgende Gleichung:
x + y = 1 (6).
Für den Seite-Kanal ergibt sich:
S = 0,5 (x - y) (L - R) (7).
Aus Gleichung (7) ergibt sich, daß S um den Faktor x - y re
duziert wird, oder, logarithmisch ausgedrückt, durch
10.log10(x-y)dB = att, gedämpft wird. att steht für die
Dämpfung, und es gilt, daß att kleiner als 0 dB ist.
Für eine Dämpfung in dB-Schritten ergibt sich:
att(in dB) = 20.log10(x - y) (8).
Aus Gleichung (8) ergibt sich dann folgender Ausdruck:
exp(0,05 att) = x - y (9).
Aus Gleichung (6) und Gleichung (9) ergibt sich für x die
Gleichung (10) und für y die Gleichung (11).
x = 0,5.(1 + exp(0,05 att)) (10)
y = 0,5.(1 - exp(0,05 att)) (11).
Die Dämpfung "att" (in dB) wird in Abhängigkeit von einer
der beschriebenen Regelgrößen bestimmt. Damit ergeben sich
mit den Gleichungen (9) und (10) die Faktoren x und y für
die durch Fig. 2 dargestellte Dämpfungsmatrix, die sich
gleichungsmäßig in den Gleichungen (1) und (2) widerspie
gelt. Um Implementierungsaufwand und Rechenaufwand einzu
sparen, muß keine vollständig adaptive Anpassung der Dämp
fung att durchgeführt werden, sondern es kann ein bestimmter
Dämpfungswert att, der empirisch festgelegt worden ist, ein
gesetzt werden, falls das Maß für die Menge an Bits einen
vorbestimmten Grenzwert überschreitet.
Erfindungsgemäß wird die Dämpfung nicht schlagartig erhöht,
da eine Verringerung der Kanaltrennung, die schlagartig von
statten geht, unter Umständen zu einer hörbaren Störung bzw.
zu einer Verwunderung beim Hörer führen könnte, beispiels
weise wenn ein Sprecher zunächst links plaziert war und auf
einmal mittig wahrgenommen wird. Daher wird in dem Fall, in
dem festgestellt wird, daß der Seite-Kanal zu dämpfen ist,
eine schrittweise Dämpfung des Seite-Kanals beispielsweise
unter Verwendung eines vorbestimmten Inkrementwerts, unter
nommen, derart, daß anschaulich gesprochen der Nachrichten
sprecher langsam von der linken Seite in die Mitte "wan
dert". Wird im entgegengesetzten Fall festgestellt, daß das
Maß für die Menge an Bits wieder kleiner als der vorbestimm
te Wert ist, wird die Dämpfung nicht schlagartig aufgehoben,
sondern wieder langsam auf 0 zurückgeführt, derart, daß um
im Beispiel zu bleiben der Sprecher wieder langsam von der
Mitte zur Seite "wandert". Diese schrittweise Dämpfung bzw.
schrittweise Aufhebung der Dämpfung sollte möglichst langsam
stattfinden, damit die Dämpfung des Seite-Kanals praktisch
nicht wahrgenommen wird. Die Verringerung der Dämpfung muß
jedoch so schnell stattfinden, daß der Codierer aufgrund der
hohen Bitrate am Ausgang nicht damit beginnt, die psychoaku
stische Maskierungsschwelle zu verletzen bzw. Audiobandbrei
te zu entfernen. Erfindungsgemäß wird daher bei Codierern,
die einen Bitreservoir-Mechanismus haben, dieses Bitreser
voir ausgenutzt, um die Dämpfung langsam zu erhöhen, bis der
Zielwert erreicht ist, bei dem die Dämpfung so hoch ist, daß
die vorbestimmte Bitrate am Ausgang des Codierers eingehal
ten werden kann. Wenn die Dämpfung dann wieder aufgehoben
wird, kann das Bitreservoir wieder entleert werden.
Bei der in Fig. 2 dargestellten Implementierung war eine
Randbedingung zur Bestimmung von x und y derart beschaffen,
daß das Summen-Signal, das dem Mitte-Kanal bis auf den
Faktor 0,5 entspricht, nicht verändert wurde. Es sind jedoch
Signale denkbar, bei denen der linke und der rechte Kanal
zwar ähnlich sind, aber eine Phasenverschiebung im Bereich
von 180 Grad zueinander aufweisen. Es sei darauf hingewie
sen, daß solche Signale nicht besonders häufig anzutreffen
sind, da sie mit Mono-Wiedergabegeräten nicht gut präsen
tiert werden können. Nichtsdestoweniger sind solche Signale
aber denkbar. In diesem Fall würde der Mitte-Kanal M klein
und der Seite-Kanal groß werden. Würde dann S so stark
gedämpft werden, das S kleiner als M wird, würde auch die
Gesamtlautstärke stark beeinflußt werden. Im Gegensatz zu
einer Verringerung der Stereokanaltrennung ist es jedoch für
einen Zuhörer nicht tolerierbar, wenn die Lautstärke stark
schwankt, und zwar unabhängig von dem Audiosignal an sich.
Eine solche Störung wird ein Hörer als lästig empfinden.
Um diesem Problem aus dem Weg zu gehen, wird es bevorzugt,
zusätzlich in der Einrichtung 12 zum Analysieren festzu
stellen, ob die Phasenverschiebung von L und R in der Nähe
von 180 Grad liegt. Wird dies festgestellt, so kann einfach
das Vorzeichen von R umgekehrt werden. Zwar geht dann der
ursprünglich gewollte räumliche Stereoeffekt verloren, aber
der Effekt der reduzierten Lautstärke wird vermieden, was
einen Zuhörer weniger stören wird.
Alternativ zur Vorzeichenumkehr könnte der M-Kanal auch in
der Einrichtung zum Modifizieren bzw. in einer nachgeschal
teten Codierer-Stufe auf einen bestimmten Wert verstärkt
werden, derart, daß die Energie des modifizierten M-Kanals
in einem vorbestimmten Verhältnis zur Energie des M-Kanals
des unmodifizierten Stereoaudiosignals ist. Für das Energie
verhältnis wird ein Wert von 1 bevorzugt, wobei jedoch auch
durch die Modifizierereinrichtung eine bestimmte Verstärkung
oder Dämpfung ausgeführt werden kann, wobei jedoch immer das
Verhältnis zum nicht modifizierten Stereoaudiosignal im we
sentlichen beibehalten werden soll, damit ein Zuhörer keine
wesentlichen Lautstärkeschwankungen aufgrund der Vorverar
beitung wahrnehmen wird. Selbstverständlich sind kleine
Lautstärkeschwankungen nicht so problematisch und manchmal
sogar noch nicht wahrnehmbar. Große Lautstärkeschwankungen
wird ein Testhörer jedoch als lästig empfinden.
An dieser Stelle sei darauf hingewiesen, daß es unerheblich
ist, ob am Eingang 10 der erfindungsgemäßen Vorrichtung zum
Verarbeiten eines Stereoaudiosignals zeitdiskrete Abtastwer
te anliegen, oder Spektralwerte anliegen. Sämtliche Opera
tionen zur Analyse des Stereoaudiosignals können sowohl mit
zeitdiskreten Abtastwerten als auch mit Spektralwerten
durchgeführt werden. Darüberhinaus können sämtliche Opera
tionen in der Einrichtung zum Modifizieren sowohl mit zeit
diskreten Abtastwerten als auch mit Spektralwerten durchge
führt werden. Die erfindungsgemäße Vorrichtung zum Verarbei
ten eines Stereoaudiosignals könnte somit auch nach der
Zeit-Frequenz-Transformationsstufe eines Zeit/Frequenz-
Transformations-basierten Codierers angeordnet sein, wie
z. B. einem MPEG-Audio-Codierer. Dieses Konzept ergibt sogar
die zusätzliche Möglichkeit, daß die Stereo-Vorverarbeitung
frequenzselektiv vorgenommen werden kann, d. h. daß bei
spielsweise eine unterschiedliche Dämpfung des Signals S in
Abhängigkeit der Frequenz durchgeführt werden kann. Dies ist
insbesondere sinnvoll, da die Möglichkeit zur Richtungsor
tung des menschlichen Gehörs nicht für alle Frequenzen
gleich empfindlich ist. Wird somit die erfindungsgemäße
Verarbeitung spektralwertweise durchgeführt, so können Spek
tralwerte des Seite-Kanals um so stärker gedämpft werden, je
weniger das menschliche Gehör in diesem Frequenzbereich
richtungsabhängig hört, während Spektralwerte nicht oder nur
ganz wenig angetastet werden, die in Frequenzbereichen lie
gen, in denen das menschliche Gehör eine gute Richtungsor
tung liefert.
Es sei darauf hingewiesen, daß bei modernen Audiocodierern
ohnehin frequenzmäßig unter Verwendung der sogenannten M/S-
Maske festgestellt wird, wo eine M/S-Codierung durchgeführt
werden soll, und wo eine L/R-Codierung besser ist. In diesem
Fall würde die erfindungsgemäße Verarbeitung lediglich auf
die Frequenzbereiche angewandt werden, in denen eine MS-Co
dierung vorhanden ist, d. h. in denen die MS-Maske gesetzt
ist. Alternativ könnte auch in mehr Bändern die MS-Maske
gesetzt werden, d. h. eine MS-Codierung, durchgeführt wer
den, wobei in diesen im Vergleich zum bekannten Verfahren
zusätzlichen MS-Bändern der Seite-Kanal gedämpft ist, um
Bitratenanforderungen einzuhalten.
Im nachfolgenden wird auf Fig. 3 Bezug genommen, in der eine
Vorrichtung zum Verarbeiten eines Stereoaudiosignals darge
stellt ist, die zusätzlich zu den in Fig. 1 gezeigten Funk
tionsblöcken ebenfalls einem MS-Codierer 30 sowie einen ska
lierbaren Codierer 32 umfaßt, der ausgangsseitig einen ska
lierten Bitstrom BS ausgibt. Der MS-Codierer 30 umfaßt, wie
es in der Technik bekannt ist, einen Summierer 30a zum Sum
mieren des modifizierten linken Kanals L' und des modifi
zierten rechten Kanals R', um nach einer Multiplikation mit
einem Multiplizierer 30b, dem ein Faktor von z. B. 0,5
zugeordnet ist, den multiplizierten Mitte-Kanal zu erzeugen.
Darüberhinaus umfaßt der MS-Codierer 30 einen Subtrahierer
30c sowie einen weiteren Multiplizierer 30d, um den modifi
zierten Seite-Kanal S' zu erzeugen, das gegenüber einem Sei
te-Signal, das aus dem nicht modifizierten Stereoaudiosignal
am Eingang 10 gebildet ist, gedämpft ist. Der Mitte-Kanal M'
und der Seite-Kanal S' werden beide in den skalierbaren
Codierer 32 eingespeist, der vorzugsweise eine Mono-Stereo-
Skalierbarkeit aufweist. Die erste Skalierungsschicht wird
das Mono-Signal M' darstellen, und die zweite Skalierungs
schicht wird den modifizierten Seite-Kanal S' umfassen. Wei
tere Skalierungsmöglichkeiten, wie z. B. daß der modifizier
te oder nicht-modifizierte Mono-Kanal M' zusätzlich bandbe
grenzt ist, und daß in der zweiten Skalierungsschicht neben
dem modifizierten Seite-Kanal auch das obere Mono-Band ent
halten ist, sind möglich.
Der Effekt der Skalierbarkeit bei dem Mono-Stereo-Codierer
32 ist besonders günstig, wenn eben keine LR-Codierung son
dern eine MS-Codierung eingesetzt wird. Die erfindungsgemäße
Stereosignalverarbeitung durch die Einrichtungen 12 und 14
ist daher besonders in Verbindung mit dem skalierbaren Co
dierer 32 besonders vorteilhaft. Um eine Mono-Stereo-Ska
lierbarkeit zu erhalten, kann nämlich auch eine MS-Codierung
eingesetzt werden, wenn sie gegenüber der LR-Codierung ei
gentlich nicht mehr zu bevorzugen ist. Dies wird eben da
durch erreicht, daß der Seite-Kanal am Eingang des skalier
baren Codierers 32 gegenüber dem unmodifizierten Fall ge
dämpft ist.
In Fig. 3 ist ferner ein gestrichelter Signalpfad 36 vom
skalierbaren Codierer 32 zur Einrichtung 12 zum Analysieren
eingezeichnet. Dieser gestrichelte Signalpfad 36 soll symbo
lisieren, daß bestimmte Maßnahmen, um ein Maß für die Menge
an Bits abzuleiten, die der skalierbare Codierer benötigen
wird, um das Stereoaudiosignal am Eingang 10 zu codieren,
nicht direkt in der Einrichtung 12 berechnet werden müssen,
sondern aus dem skalierbaren Codierer in die Einrichtung 12
ausgegeben werden können, wie z. B. die Perceptual Entropy
PE, der Hinweis auf die Verwendung kurzer Fenster usw. Das
heißt, daß diese Funktionsblöcke nicht sowohl in der Ein
richtung 12 zum Analysieren als auch im skalierbaren Codie
rer 32 vorhanden sein müssen, sondern daß ihre Implementie
rung lediglich im skalierbaren Codierer 32 genügt.
In diesem Fall würde die Einrichtung zum Modifizieren 14, um
das Maß 18 für die Bitmenge zu bestimmen, zunächst keine
Modifikation durchführen. Die in Fig. 3 gezeichnete Vorrich
tung wäre dann gewissermaßen in einem "Vorlaufmodus", wo
kein Bitstrom geschrieben wird, sondern wo lediglich der
erforderliche Dämpfungsgrad für den Seite-Kanal bestimmt
wird. Im dann anschließenden Codier-Modus, in dem der Bit
strom BS dann durch den skalierbaren Codierer geschrieben
wird, wird die Einrichtung 14 zum Modifizieren mit entspre
chend festgelegten Faktoren x, y arbeiten.
Wird die in Fig. 3 gezeigte Vorrichtung mit Spektralwerten
für den ersten Kanal L und den zweiten Kanal R betrieben,
und ist der skalierbare Codierer ein Zeit/Frequenz-Transfor
mationscodierer, so würde die Stufe des skalierbaren Codie
rers 32, die die Zeit-Frequenz-Transformation durchführt,
dem Eingang 10 vorgeschaltet sein. Die Einrichtungen 12, 14
und 30 wären dann in den skalierbaren Codierer 32 eingebet
tet.
Die Signalpfade 36a, 36b verdeutlichen, daß auch die modifi
zierten Kanäle ohne M/S-Codierung zum skalierbaren Codierer
geleitet werden können, damit derselbe dann feststellen
kann, ob eine M/S- oder L/R-Codierung günstiger ist.
Claims (18)
1. Vorrichtung zum Verarbeiten eines Stereoaudiosignals,
das einen ersten Kanal (L) und einen zweiten Kanal (R)
aufweist, mit folgenden Merkmalen:
einer Einrichtung (12) zum Analysieren des Stereoaudio signals oder eines von dem Stereoaudiosignals abgelei teten Signals, um ein Maß für eine Menge an Bits zu er halten, die von einem Codierer (32) benötigt wird, um das Stereoaudiosignal unter Verwendung eines Codieral gorithmus zu codieren; und
einer Einrichtung (14) zum Modifizieren des ersten und zweiten Kanals (L, R), um einen modifizierten ersten und einen modifizierten zweiten Kanal (L', R') zu er halten,
wobei die Einrichtung (14) zum Modifizieren auf die Einrichtung (12) zum Analysieren anspricht, um wirksam zu werden, wenn das Maß (18) für die Menge an Bits ein vorbestimmtes Maß überschreitet, und
wobei die Einrichtung (12) zum Modifizieren derart aus gestaltet ist, daß eine Charakteristik eines Summensi gnals aus dem ersten und dem zweiten modifizierten Ka nal (L', R'), die ähnlich der Energie des Summensignals verläuft, in einem vorbestimmten Verhältnis zu der Cha rakteristik eines Summensignals aus dem ersten und dem zweiten Kanal (L, R) ist, und daß ein Differenzsignal aus dem ersten und dem zweiten modifizierten Kanal (L', R') gegenüber einem Differenzsignal aus dem ersten und dem zweiten Kanal (L, R) gedämpft ist.
einer Einrichtung (12) zum Analysieren des Stereoaudio signals oder eines von dem Stereoaudiosignals abgelei teten Signals, um ein Maß für eine Menge an Bits zu er halten, die von einem Codierer (32) benötigt wird, um das Stereoaudiosignal unter Verwendung eines Codieral gorithmus zu codieren; und
einer Einrichtung (14) zum Modifizieren des ersten und zweiten Kanals (L, R), um einen modifizierten ersten und einen modifizierten zweiten Kanal (L', R') zu er halten,
wobei die Einrichtung (14) zum Modifizieren auf die Einrichtung (12) zum Analysieren anspricht, um wirksam zu werden, wenn das Maß (18) für die Menge an Bits ein vorbestimmtes Maß überschreitet, und
wobei die Einrichtung (12) zum Modifizieren derart aus gestaltet ist, daß eine Charakteristik eines Summensi gnals aus dem ersten und dem zweiten modifizierten Ka nal (L', R'), die ähnlich der Energie des Summensignals verläuft, in einem vorbestimmten Verhältnis zu der Cha rakteristik eines Summensignals aus dem ersten und dem zweiten Kanal (L, R) ist, und daß ein Differenzsignal aus dem ersten und dem zweiten modifizierten Kanal (L', R') gegenüber einem Differenzsignal aus dem ersten und dem zweiten Kanal (L, R) gedämpft ist.
2. Vorrichtung nach Anspruch 1, bei der die Einrichtung
(14) zum Analysieren folgende Merkmale aufweist:
eine Einrichtung zum Bestimmen der Charakteristik der Summe des ersten und zweiten Kanals über einer vorbe stimmten Zeitdauer;
eine Einrichtung zum Bestimmen der Charakteristik der Differenz aus dem ersten und zweiten Kanal über einer vorbestimmten Zeitdauer; und
einer Einrichtung zum Bilden des Verhältnisses der Cha rakteristik der Summe des ersten und zweiten Kanals und der Charakteristik der Differenz des ersten und zweiten Kanals, wobei das Verhältnis der Charakteristika das Maß (18) für die Menge an Bits ist.
eine Einrichtung zum Bestimmen der Charakteristik der Summe des ersten und zweiten Kanals über einer vorbe stimmten Zeitdauer;
eine Einrichtung zum Bestimmen der Charakteristik der Differenz aus dem ersten und zweiten Kanal über einer vorbestimmten Zeitdauer; und
einer Einrichtung zum Bilden des Verhältnisses der Cha rakteristik der Summe des ersten und zweiten Kanals und der Charakteristik der Differenz des ersten und zweiten Kanals, wobei das Verhältnis der Charakteristika das Maß (18) für die Menge an Bits ist.
3. Vorrichtung nach Anspruch 1, bei der die Einrichtung
(12) zum Analysieren folgende Merkmale aufweist:
eine erste Einrichtung zum Bestimmen eines ersten Cha rakteristikverhältnisses zwischen dem ersten Kanal und der psychoakustischen Maskierungsschwelle des ersten Kanals über einer vorbestimmten Zeit;
eine zweite Einrichtung zum Bestimmen eines zweiten Charakteristikverhältnisses zwischen dem zweiten Kanal und der psychoakustischen Maskierungsschwelle des zwei ten Kanals über einer vorbestimmten Zeit; und
eine Einrichtung zum Summieren des ersten und zweiten Charakteristikverhältnisses, wobei die Summe des ersten und des zweiten Charakteristikverhältnisses auf das Maß (18) für die Menge an Bits hinweist.
eine erste Einrichtung zum Bestimmen eines ersten Cha rakteristikverhältnisses zwischen dem ersten Kanal und der psychoakustischen Maskierungsschwelle des ersten Kanals über einer vorbestimmten Zeit;
eine zweite Einrichtung zum Bestimmen eines zweiten Charakteristikverhältnisses zwischen dem zweiten Kanal und der psychoakustischen Maskierungsschwelle des zwei ten Kanals über einer vorbestimmten Zeit; und
eine Einrichtung zum Summieren des ersten und zweiten Charakteristikverhältnisses, wobei die Summe des ersten und des zweiten Charakteristikverhältnisses auf das Maß (18) für die Menge an Bits hinweist.
4. Vorrichtung nach Anspruch 1, bei der der Codierer (32)
angeordnet ist, um ansprechend auf die zeitliche Struk
tur des Stereoaudiosignals lange oder kurze Fenster für
eine Überführung eines zeitlichen Stereoaudiosignals in
ein spektrales Stereoaudiosignal zu verwenden, und bei
der die Einrichtung (12) zum Analysieren angeordnet
ist, um zu erfassen, ob kurze oder lange Fenster im
Codierer (32) eingesetzt werden, wobei das Maß für die
Menge an Bits ist, daß kurze Fenster eingesetzt werden.
5. Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der die Einrichtung (14) zum Modifizieren angeord
net ist, um derart wirksam zu werden, daß das Diffe
renzsignal aus dem ersten und zweiten Kanal ausgehend
von keiner Dämpfung bis zu einer bestimmten Dämpfung
allmählich gedämpft wird, und um derart wirksam zu
sein, daß die Dämpfung von der bestimmten Dämpfung zu
keiner Dämpfung allmählich reduziert wird.
6. Vorrichtung nach Anspruch 5, bei der die Geschwindig
keit des Dämpfens so langsam als möglich gewählt wird,
jedoch noch so schnell, daß ein Bitreservoir-Mechanismus
des Codierers (32) ausgenutzt wird, damit der Codierer
(32) weder die Audiobandbreite verringert noch eine
psychoakustische Maskierungsschwelle bei einer Quanti
sierung verletzt.
7. Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der die Einrichtung (14) zum Modifizieren angeord
net ist, um abhängig von dem ermittelten Maß das Diffe
renzsignal adaptiv zu dämpfen.
8. Vorrichtung nach Anspruch 2, bei der die Einrichtung
(14) zum Modifizieren angeordnet ist, um abhängig von
einem Charakteristikverhältnis, das durch die Einrich
tung zum Bilden des Charakteristikverhältnisses erzeugt
wird, das Differenzsignal zu dämpfen, so daß die Dämp
fung des Differenzsignals hoch ist, wenn das Charak
teristikverhältnis klein ist, und daß die Dämpfung des
Differenzsignals niedrig ist, wenn das Charakteristik
verhältnis hoch ist.
9. Vorrichtung nach Anspruch 7 oder Anspruch 8, bei der
die Einrichtung (14) zum Modifizieren derart ausgestal
tet ist, daß sie das Differenzsignal derart adaptiv
dämpft, daß das Charakteristikverhältnis des Differenz
signals zum Summensignal zu einem vorbestimmten Wert im
wesentlichen gleich ist.
10. Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der die Einrichtung (14) zum Modifizieren folgende
Merkmale aufweist:
einen ersten Multiplizierer (22a) zum Multiplizieren des ersten Kanals (L) mit einem ersten Faktor (x);
einen zweiten Multiplizierer (22b) zum Multiplizieren des ersten Kanals (L) mit einem zweiten Faktor (y);
einen dritten Multiplizierer (22c) zum Multiplizieren des zweiten Kanals mit dem ersten Faktor (x);
einen vierten Multiplizierer (22d) zum Multiplizieren des zweiten Kanals (R') mit dem zweiten Faktor (y);
einen ersten Summierer (24a) zum Summieren des Aus gangssignals des ersten Multiplizierers (22a) und des Ausgangssignals des vierten Multiplizierers (22d), um den modifizierten ersten Kanal (L') zu erzeugen; und
einem zweiten Summierer (24b) zum Summieren des Aus gangssignals des dritten Multiplizierers (22c) und des Ausgangssignals des zweiten Multiplizierers (22b), um den modifizierten zweiten Kanal (R') zu erzeugen;
wobei der erste und der zweite Faktor (x, y) derart gewählt sind, daß das Summensignal des ersten und zwei ten Kanals und das Summensignal des modifizierten er sten und zweiten Kanals im wesentlichen gleich sind, und das Differenzsignal um einen bestimmten Faktor ge dämpft ist.
einen ersten Multiplizierer (22a) zum Multiplizieren des ersten Kanals (L) mit einem ersten Faktor (x);
einen zweiten Multiplizierer (22b) zum Multiplizieren des ersten Kanals (L) mit einem zweiten Faktor (y);
einen dritten Multiplizierer (22c) zum Multiplizieren des zweiten Kanals mit dem ersten Faktor (x);
einen vierten Multiplizierer (22d) zum Multiplizieren des zweiten Kanals (R') mit dem zweiten Faktor (y);
einen ersten Summierer (24a) zum Summieren des Aus gangssignals des ersten Multiplizierers (22a) und des Ausgangssignals des vierten Multiplizierers (22d), um den modifizierten ersten Kanal (L') zu erzeugen; und
einem zweiten Summierer (24b) zum Summieren des Aus gangssignals des dritten Multiplizierers (22c) und des Ausgangssignals des zweiten Multiplizierers (22b), um den modifizierten zweiten Kanal (R') zu erzeugen;
wobei der erste und der zweite Faktor (x, y) derart gewählt sind, daß das Summensignal des ersten und zwei ten Kanals und das Summensignal des modifizierten er sten und zweiten Kanals im wesentlichen gleich sind, und das Differenzsignal um einen bestimmten Faktor ge dämpft ist.
11. Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der die Einrichtung (12) zum Analysieren ferner
folgendes Merkmal aufweist:
eine Einrichtung zum Bestimmen, ob ein Phasenwinkel zwischen dem ersten und zweiten Kanal (L, R) einen Wert in der Nähe von 180° aufweist; und
wobei die Vorrichtung zum Modifizieren (18) ferner fol gendes Merkmal aufweist:
eine Einrichtung zum Umkehren des Vorzeichens eines Ka nals (L, R), falls der Phasenwinkel in der Nähe von 180° ist.
eine Einrichtung zum Bestimmen, ob ein Phasenwinkel zwischen dem ersten und zweiten Kanal (L, R) einen Wert in der Nähe von 180° aufweist; und
wobei die Vorrichtung zum Modifizieren (18) ferner fol gendes Merkmal aufweist:
eine Einrichtung zum Umkehren des Vorzeichens eines Ka nals (L, R), falls der Phasenwinkel in der Nähe von 180° ist.
12. Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der der erste und der zweite Kanal (L, R) des Ste
reosignals durch Spektralwerte gegeben sind, die aus
einem zeitlichen Stereosignal durch Überführung in den
Spektralbereich erzeugt worden sind, wobei die Einrich
tung zum Modifizieren (14) angeordnet ist, um eine fre
quenzselektive Dämpfung des Differenzsignals durchzu
führen.
13. Vorrichtung nach Anspruch 12, bei der die Einrichtung
zum Modifizieren angeordnet ist, um in einen Frequenz
bereich, in dem die Richtungsordnung des menschlichen
Gehörs verringert ist, stärker zu dämpfen als in einem
Frequenzbereich, in dem die Richtungsortung des mensch
lichen Gehörs nicht verringert ist.
14. Vorrichtung nach einem der vorhergehenden Ansprüche,
die ferner folgende Merkmale aufweist:
eine Mitte/Seite-Einrichtung (30) zum Erzeugen eines Mitte-Kanals (M'), der gleich der Hälfte der Summe des modifizierten linken (L') und modifizierten rechten Ka nals (R') ist,
eine Seite-Einrichtung (30) zum Erzeugen eines Seite- Kanals, der gleich der Hälfte der Differenz des modifi zierten ersten Kanals (L') und des modifizierten zwei ten Kanals (R') ist; und
einen skalierbaren Codierer (32), der angeordnet ist, um den Mitte-Kanal (M') zu codieren und in einen Bit strom (BS) als erste Skalierungsschicht zu schreiben, und der ferner angeordnet ist, um den Seite-Kanal (S') zu codieren und in den Bitstrom (BS) als zweite Skalie rungsschicht zu schreiben.
eine Mitte/Seite-Einrichtung (30) zum Erzeugen eines Mitte-Kanals (M'), der gleich der Hälfte der Summe des modifizierten linken (L') und modifizierten rechten Ka nals (R') ist,
eine Seite-Einrichtung (30) zum Erzeugen eines Seite- Kanals, der gleich der Hälfte der Differenz des modifi zierten ersten Kanals (L') und des modifizierten zwei ten Kanals (R') ist; und
einen skalierbaren Codierer (32), der angeordnet ist, um den Mitte-Kanal (M') zu codieren und in einen Bit strom (BS) als erste Skalierungsschicht zu schreiben, und der ferner angeordnet ist, um den Seite-Kanal (S') zu codieren und in den Bitstrom (BS) als zweite Skalie rungsschicht zu schreiben.
15. Vorrichtung nach Anspruch 14, bei der der skalierbare
Codierer (32) angeordnet ist, um für den Fall, daß das
Maß für die Menge von Bits einen vorbestimmten Wert
überschreitet, eine Bitreservoireinrichtung zu verwen
den, damit nicht die Audiobandbreite verringert wird
und/oder die psychoakustische Maskierungsschwelle ver
letzt wird.
16. Verfahren nach einem der vorhergehenden Ansprüche, bei
dem die Charakteristik, die ähnlich zur Energie ver
läuft, die Energie selbst, die Summe von quadrierten
Abtastwerten in einer bestimmten Zeitdauer, die Summe
von quadrierten Spektralwerten in einem bestimmten Fre
quenzbereich, die Summe von Abtastwertbeträgen in einer
bestimmten Zeitdauer und/oder die Summe von quadrierten
Spektralwerten in einem bestimmten Frequenzbereich ist.
17. Verfahren nach einem der vorhergehenden Ansprüche, bei
dem das Stereoaudiosignal blockweise verarbeitete wird,
und bei dem das beim Analysieren verwendete von dem
Stereoaudiosignal abgeleitete Signal das modifizierte
Signal eines vorausgehenden Verarbeitungsblocks ist.
18. Verfahren zum Verarbeiten eines Stereoaudiosignals, das
einen ersten Kanal (L) und einen zweiten Kanal (R) auf
weist, mit folgenden Schritten:
Analysieren (12) des Stereoaudiosignals oder eines von dem Stereoaudiosignal abgeleiteten Signals, um ein Maß für eine Menge an Bits zu erhalten, die von einem Co dieralgorithmus benötigt wird, um das Stereoaudiosignal zu codieren; und
Modifizieren (14) des ersten und zweiten Kanals (L, R), um einen modifizierten ersten und einen modifizierten zweiten Kanal (L', R') zu erhalten, falls im Schritt des Analysieren ein Maß (18) für die Menge an Bits be stimmt wird, das ein vorbestimmtes Maß überschreitet, wobei das Modifizieren derart ausgeführt ist, daß eine Charakteristik eines Summensignals aus dem ersten und dem zweiten modifizierten Kanal (L', R'), die ähnlich der Energie des Summensignals verläuft, in einem vorbe stimmten Verhältnis zu einer Charakteristik eines Sum mensignals aus dem ersten und dem zweiten Kanal (L, R) ist, und daß ein Differenzsignal aus dem ersten und dem zweiten modifizierten Kanal (L', R') gegenüber einem Differenzsignal aus dem ersten und dem zweiten Kanal (L, R) gedämpft ist.
Analysieren (12) des Stereoaudiosignals oder eines von dem Stereoaudiosignal abgeleiteten Signals, um ein Maß für eine Menge an Bits zu erhalten, die von einem Co dieralgorithmus benötigt wird, um das Stereoaudiosignal zu codieren; und
Modifizieren (14) des ersten und zweiten Kanals (L, R), um einen modifizierten ersten und einen modifizierten zweiten Kanal (L', R') zu erhalten, falls im Schritt des Analysieren ein Maß (18) für die Menge an Bits be stimmt wird, das ein vorbestimmtes Maß überschreitet, wobei das Modifizieren derart ausgeführt ist, daß eine Charakteristik eines Summensignals aus dem ersten und dem zweiten modifizierten Kanal (L', R'), die ähnlich der Energie des Summensignals verläuft, in einem vorbe stimmten Verhältnis zu einer Charakteristik eines Sum mensignals aus dem ersten und dem zweiten Kanal (L, R) ist, und daß ein Differenzsignal aus dem ersten und dem zweiten modifizierten Kanal (L', R') gegenüber einem Differenzsignal aus dem ersten und dem zweiten Kanal (L, R) gedämpft ist.
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19959156A DE19959156C2 (de) | 1999-12-08 | 1999-12-08 | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
EP00985148A EP1230827B1 (de) | 1999-12-08 | 2000-12-07 | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
US10/149,248 US7260225B2 (en) | 1999-12-08 | 2000-12-07 | Method and device for processing a stereo audio signal |
AT00985148T ATE251376T1 (de) | 1999-12-08 | 2000-12-07 | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
JP2001543072A JP4000261B2 (ja) | 1999-12-08 | 2000-12-07 | ステレオ音響信号の処理方法と装置 |
DE50003945T DE50003945D1 (de) | 1999-12-08 | 2000-12-07 | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
PCT/EP2000/012352 WO2001043503A2 (de) | 1999-12-08 | 2000-12-07 | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
JP2007165445A JP4579273B2 (ja) | 1999-12-08 | 2007-06-22 | ステレオ音響信号の処理方法と装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19959156A DE19959156C2 (de) | 1999-12-08 | 1999-12-08 | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19959156A1 true DE19959156A1 (de) | 2001-06-28 |
DE19959156C2 DE19959156C2 (de) | 2002-01-31 |
Family
ID=7931846
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19959156A Expired - Lifetime DE19959156C2 (de) | 1999-12-08 | 1999-12-08 | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
DE50003945T Expired - Lifetime DE50003945D1 (de) | 1999-12-08 | 2000-12-07 | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE50003945T Expired - Lifetime DE50003945D1 (de) | 1999-12-08 | 2000-12-07 | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
Country Status (6)
Country | Link |
---|---|
US (1) | US7260225B2 (de) |
EP (1) | EP1230827B1 (de) |
JP (2) | JP4000261B2 (de) |
AT (1) | ATE251376T1 (de) |
DE (2) | DE19959156C2 (de) |
WO (1) | WO2001043503A2 (de) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19959156C2 (de) * | 1999-12-08 | 2002-01-31 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
DE10102159C2 (de) * | 2001-01-18 | 2002-12-12 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer |
US6859238B2 (en) * | 2002-02-26 | 2005-02-22 | Broadcom Corporation | Scaling adjustment to enhance stereo separation |
US7079657B2 (en) * | 2002-02-26 | 2006-07-18 | Broadcom Corporation | System and method of performing digital multi-channel audio signal decoding |
US6832078B2 (en) * | 2002-02-26 | 2004-12-14 | Broadcom Corporation | Scaling adjustment using pilot signal |
US8086448B1 (en) * | 2003-06-24 | 2011-12-27 | Creative Technology Ltd | Dynamic modification of a high-order perceptual attribute of an audio signal |
EP1492084B1 (de) * | 2003-06-25 | 2006-05-17 | Psytechnics Ltd | Vorrichtung und Verfahren zur binauralen Qualitätsbeurteilung |
US7620545B2 (en) * | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
WO2006035705A1 (ja) * | 2004-09-28 | 2006-04-06 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
JPWO2006059567A1 (ja) * | 2004-11-30 | 2008-06-05 | 松下電器産業株式会社 | ステレオ符号化装置、ステレオ復号装置、およびこれらの方法 |
US20080162148A1 (en) * | 2004-12-28 | 2008-07-03 | Matsushita Electric Industrial Co., Ltd. | Scalable Encoding Apparatus And Scalable Encoding Method |
KR100682915B1 (ko) * | 2005-01-13 | 2007-02-15 | 삼성전자주식회사 | 다채널 신호 부호화/복호화 방법 및 장치 |
EP1852689A1 (de) * | 2005-01-26 | 2007-11-07 | Matsushita Electric Industrial Co., Ltd. | Sprachcodierungseinrichtung und sprachcodierungsverfahren |
RU2416129C2 (ru) * | 2005-03-30 | 2011-04-10 | Конинклейке Филипс Электроникс Н.В. | Масштабируемое многоканальное кодирование звука |
CN101288117B (zh) * | 2005-10-12 | 2014-07-16 | 三星电子株式会社 | 对音频数据和扩展数据进行编码/解码的方法和设备 |
US7734053B2 (en) * | 2005-12-06 | 2010-06-08 | Fujitsu Limited | Encoding apparatus, encoding method, and computer product |
JP2007183528A (ja) * | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
US8032371B2 (en) * | 2006-07-28 | 2011-10-04 | Apple Inc. | Determining scale factor values in encoding audio data with AAC |
US8010370B2 (en) * | 2006-07-28 | 2011-08-30 | Apple Inc. | Bitrate control for perceptual coding |
JP4698688B2 (ja) * | 2007-02-27 | 2011-06-08 | シャープ株式会社 | 送受信方法、送受信装置及びプログラム |
US8064624B2 (en) * | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
CN117542365A (zh) | 2016-01-22 | 2024-02-09 | 弗劳恩霍夫应用研究促进协会 | 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法 |
CN111370032B (zh) * | 2020-02-20 | 2023-02-14 | 厦门快商通科技股份有限公司 | 语音分离方法、系统、移动终端及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4032717A (en) * | 1975-03-13 | 1977-06-28 | Siemens Aktiengesellschaft | Circuit arrangement for a continuous adjustment of the base width in a stereo decoder |
US5278909A (en) * | 1992-06-08 | 1994-01-11 | International Business Machines Corporation | System and method for stereo digital audio compression with co-channel steering |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
US5491773A (en) * | 1991-09-02 | 1996-02-13 | U.S. Philips Corporation | Encoding system comprising a subband coder for subband coding of a wideband digital signal constituted by first and second signal components |
US5859826A (en) * | 1994-06-13 | 1999-01-12 | Sony Corporation | Information encoding method and apparatus, information decoding apparatus and recording medium |
WO1999043110A1 (en) * | 1998-02-21 | 1999-08-26 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd | A fast frequency transformation techique for transform audio coders |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2244629B (en) * | 1990-05-30 | 1994-03-16 | Sony Corp | Three channel audio transmission and/or reproduction systems |
DE4229654A1 (de) * | 1991-09-25 | 1993-04-22 | Thomson Brandt Gmbh | Verfahren zur uebertragung eines audio- und/oder videosignals |
US5228093A (en) * | 1991-10-24 | 1993-07-13 | Agnello Anthony M | Method for mixing source audio signals and an audio signal mixing system |
JPH08123488A (ja) * | 1994-10-24 | 1996-05-17 | Sony Corp | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 |
JPH08289900A (ja) | 1995-04-20 | 1996-11-05 | Jiyunko Tairiyou | 遠赤外線放射カイロ |
GB9509831D0 (en) * | 1995-05-15 | 1995-07-05 | Gerzon Michael A | Lossless coding method for waveform data |
US5825830A (en) * | 1995-08-17 | 1998-10-20 | Kopf; David A. | Method and apparatus for the compression of audio, video or other data |
US5870480A (en) * | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
US6345246B1 (en) * | 1997-02-05 | 2002-02-05 | Nippon Telegraph And Telephone Corporation | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates |
JPH1132399A (ja) * | 1997-05-13 | 1999-02-02 | Sony Corp | 符号化方法及び装置、並びに記録媒体 |
US6356211B1 (en) * | 1997-05-13 | 2002-03-12 | Sony Corporation | Encoding method and apparatus and recording medium |
DE19959156C2 (de) * | 1999-12-08 | 2002-01-31 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
-
1999
- 1999-12-08 DE DE19959156A patent/DE19959156C2/de not_active Expired - Lifetime
-
2000
- 2000-12-07 DE DE50003945T patent/DE50003945D1/de not_active Expired - Lifetime
- 2000-12-07 AT AT00985148T patent/ATE251376T1/de active
- 2000-12-07 US US10/149,248 patent/US7260225B2/en not_active Expired - Lifetime
- 2000-12-07 JP JP2001543072A patent/JP4000261B2/ja not_active Expired - Lifetime
- 2000-12-07 WO PCT/EP2000/012352 patent/WO2001043503A2/de active IP Right Grant
- 2000-12-07 EP EP00985148A patent/EP1230827B1/de not_active Expired - Lifetime
-
2007
- 2007-06-22 JP JP2007165445A patent/JP4579273B2/ja not_active Expired - Lifetime
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4032717A (en) * | 1975-03-13 | 1977-06-28 | Siemens Aktiengesellschaft | Circuit arrangement for a continuous adjustment of the base width in a stereo decoder |
US5491773A (en) * | 1991-09-02 | 1996-02-13 | U.S. Philips Corporation | Encoding system comprising a subband coder for subband coding of a wideband digital signal constituted by first and second signal components |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
US5278909A (en) * | 1992-06-08 | 1994-01-11 | International Business Machines Corporation | System and method for stereo digital audio compression with co-channel steering |
US5859826A (en) * | 1994-06-13 | 1999-01-12 | Sony Corporation | Information encoding method and apparatus, information decoding apparatus and recording medium |
WO1999043110A1 (en) * | 1998-02-21 | 1999-08-26 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd | A fast frequency transformation techique for transform audio coders |
Also Published As
Publication number | Publication date |
---|---|
ATE251376T1 (de) | 2003-10-15 |
DE19959156C2 (de) | 2002-01-31 |
WO2001043503A3 (de) | 2002-05-10 |
JP2007316658A (ja) | 2007-12-06 |
EP1230827B1 (de) | 2003-10-01 |
JP2003516555A (ja) | 2003-05-13 |
US7260225B2 (en) | 2007-08-21 |
JP4579273B2 (ja) | 2010-11-10 |
US20030091194A1 (en) | 2003-05-15 |
JP4000261B2 (ja) | 2007-10-31 |
EP1230827A2 (de) | 2002-08-14 |
WO2001043503A2 (de) | 2001-06-14 |
DE50003945D1 (de) | 2003-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19959156C2 (de) | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals | |
EP1145227B1 (de) | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals | |
DE69333394T2 (de) | Hochwirksames Kodierverfahren und -gerät | |
DE602004010188T2 (de) | Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
DE60024501T2 (de) | Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution | |
EP0290581B1 (de) | Verfahren zum übertragen digitalisierter tonsignale | |
DE60103424T2 (de) | Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden | |
EP0954909B1 (de) | Verfahren zum codieren eines audiosignals | |
EP0846405B1 (de) | Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen | |
WO2006094635A1 (de) | Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms | |
EP0251028B1 (de) | Verfahren zur Übertragung eines Audiosignales | |
WO2003088212A1 (de) | Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten | |
DE69932861T2 (de) | Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung | |
DE60113602T2 (de) | Audiokodierer mit psychoakustischer Bitzuweisung | |
DE60124079T2 (de) | Sprachverarbeitung | |
WO1998048531A1 (de) | Verfahren zum verschleiern von fehlern in einem audiodatenstrom | |
DE60311619T2 (de) | Datenreduktion in Audiokodierern unter Ausnutzung nichtharmonischer Effekte | |
EP0464534B1 (de) | Transformationskodierer mit adaptiver Fensterfunktion | |
DE19743662A1 (de) | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms | |
DE69823458T2 (de) | Mehrband-Sprachdecoder | |
EP1277346B1 (de) | Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales | |
EP0340301B1 (de) | Digitales adaptives transformationscodierverfahren | |
DE19742201C1 (de) | Verfahren und Vorrichtung zum Codieren von Audiosignalen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
R071 | Expiry of right |