DE69210689T2 - Kodierer/dekodierer für mehrdimensionale schallfelder - Google Patents
Kodierer/dekodierer für mehrdimensionale schallfelderInfo
- Publication number
- DE69210689T2 DE69210689T2 DE69210689T DE69210689T DE69210689T2 DE 69210689 T2 DE69210689 T2 DE 69210689T2 DE 69210689 T DE69210689 T DE 69210689T DE 69210689 T DE69210689 T DE 69210689T DE 69210689 T2 DE69210689 T2 DE 69210689T2
- Authority
- DE
- Germany
- Prior art keywords
- subband
- signal
- signals
- composite
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000003595 spectral effect Effects 0.000 claims abstract description 172
- 239000002131 composite material Substances 0.000 claims abstract description 97
- 238000013139 quantization Methods 0.000 claims description 58
- 230000004807 localization Effects 0.000 claims description 21
- 238000002156 mixing Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000003786 synthesis reaction Methods 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 abstract description 44
- 238000000034 method Methods 0.000 description 158
- 230000008569 process Effects 0.000 description 80
- 239000013598 vector Substances 0.000 description 46
- 230000005540 biological transmission Effects 0.000 description 25
- 238000007667 floating Methods 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 11
- 230000002441 reversible effect Effects 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 230000036961 partial effect Effects 0.000 description 6
- 230000009467 reduction Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 102000003712 Complement factor B Human genes 0.000 description 1
- 108090000056 Complement factor B Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000001429 visible spectrum Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/91—Arrangements characterised by the broadcast information itself broadcasting computer programmes
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Stereophonic System (AREA)
Description
- Die Erfindung bezieht sich allgemein auf die Aufzeichnung, Übertragung und Wiedergabe von für menschliches Hören gedachten Schallfeldern. Insbesondere bezieht sich die Erfindung auf die tontreue Kodierung und Dekodierung von Signalen, die solche Schallfelder wiedergeben, worin die kodierten Signale von einem zusammengesetzten Audioinformationssignal und einem Lenksteuersignal [steering control signal] getragen werden können.
- Ein Ziel für die tontreue Wiedergabe aufgezeichneter oder gesendeter Töne ist die Darstellung zu einer anderen Zeit oder an einem anderen Ort, eine naturgetreue Wiedergabe eines "Originalschallfeldes". Ein Schallfeld wird definiert als eine Sammlung von Schalldrücken, die eine Funktion von Zeit und Raum sind. Folglich wird bei der tontreuen Wiedergabe der Versuch gemacht, akustische Drücke wiederzuerzeugen, die im ursprünglichen Schallfeld in einer Region um einen Zuhörer herum bestanden.
- Idealerweise sind Unterschiede zwischen dem ursprünglichen Schallfeld und dem wiedergegebenen Schallfeld nicht hörbar, oder wenn sie es nicht sind, sind sie zumindest für die meisten Zuhörer verhältnismäßig unbemerkbar. Zwei allgemeine Maßnahmen der Treue sind "Schallqualität" und "Schallfeldlokalisierung".
- Zu der Schallqualität gehören Eigenschaften der Wiedergabe, wie der Frequenzbereich (Bandbreite), die Genauigkeit relativer Amplitudenpegel über den Frequenzbereich hinweg (Klangfarbe), der Bereich des Schallamplitudenpegels (Dynamikbereich), die Genauigkeit der Oberwellenamplitude und Phase (Verzerrungspegel) sowie der Amplitudenpegel und die Frequenz störender Töne und Artefakte, die im ursprünglichen Schall nicht vorhanden waren (Rauschen). Auch wenn die meisten Aspekte der Schallqualität mit Geräten meßbar sind, machen Eigenschaften des menschlichen Gehörapparates (psychoakustische Effekte) gewisse meßbare Abweichungen von den "ursprünglichen" Tönen in praktischen Systemen unhörbar oder verhältnismäßig unbemerkbar.
- Die Schallfeldlokalisierung ist ein Maß räumlicher Treue. Der Erhalt der offensichtlichen Richtung, sowohl Azimut als auch Höhe, und der Entfernung einer Schallquelle ist manchmal als Winkel- oder Tiefenlokalisierung bekannt. Bei gewissen Orchesteraufzeichnungen und ähnlichen soll eine derartige Lokalisierung dem Zuhörer den tatsächlichen physischen Ort der Musiker und ihrer Instrumente vermitteln. Was, andere Aufzeichnungen betrifft, insbesondere mehrspurige Aufzeichnungen, die in einem Studio erzeugt werden, da hat die Winkelrichtung und Tiefe unter Umständen keinerlei Beziehung zu irgendeiner Anordnung von Musikern und ihren Instrumenten wie "im wirklichen Leben", und die Lokalisierung ist lediglich Teil eines gewollten künstlerischen Gesamteindrucks, der dem Zuhörer gegeben werden soll. Auf jeden Fall ist es aber ein Zweck von tontreuen Mehrkanalwiedergabeanlagen, räumliche Aspekte eines stattfindenden Schallfeldes wiederzugeben, gleichgültig ob es real oder synthetisiert ist. Wie im Fall der Qualität des Tons, sind meßbare Änderungen der Lokalisierung in praktischen Systemen unter bestimmten Bedingungen unhörbar oder verhältnismäßig unbemerkbar wegen der Eigenschaften des menschlichen Gehörs.
- Selbst bei denjenigen Aufzeichnungen, bei denen die Lokalisierung den Eindruck erwecken soll, als sei man bei der ursprünglichen Aufzeichnung anwesend, muß der Produzent unter verschiedenen Philosophien der Mikrophonanordnung sowie des Tonmischens und Aufzeichnens wählen, was jeweils dazu führt, daß Schallfelder eingefangen werden, die sich voneinander unterscheiden. Außer den Variationen, die durch artistische und technische Beurteilungen und Präferenzen eingeführt werden, ist das Einfangen eines Schallfeldes wegen der naturbedingten technischen und praktischen Einschränkungen von Aufzeichnungs-, Übertragungs und Wiedergabegeräten und Techniken bestenfalis eine Annäherung an das ursprüngliche Schallfeld.
- Zahlreiche Entscheidungen, Einstellungen und Kombinationen, die einem Schallfeldproduzenten zur Verfügung stehen, sind einem Fachmann offenkundig. Es reicht, sich darüber klar zu sein, daß ein Produzent aufgezeichnete oder übermittelte Signale entwickeln kann, die im Zusammenhang mit einem Wiedergabesystem einem menschlichen Zuhörer ein Schallfeld bieten, welches spezifische Eigenschaften hinsichtlich der Schallqualität und Schallfeldlokalisierung hat. Das dem Zuhörer präsentierte Schallfeld kann sich dem idealen, vom Erzeuger beabsichtigten Schallfeld eng annähern, oder es kann davon in Abhängigkeit von vielen Faktoren, einschließlich des Wiedergabegeräts und der akustischen Wiedergabeumgebung abweichen.
- In den meisten, wenn nicht in allen Fällen arbeitet der Schallfeldproduzent in einem verhältnismäßig gut definierten System, in welchem es bekannte Wiedergabe- oder Präsentationskonfigurationen und Umfelder gibt. Zum Beispiel erwartet man bei einer stereophonen Zweikanal-Aufzeichnung eine Wiedergabe oder Darstellung entweder mit einem stereophonen oder einem monophonen Wiedergabeoder Präsentationssystem. Die Aufzeichnung ist normalerweise so optimiert, daß sie für die meisten Zuhörer gut klingt, denen eine große Vielfalt an stereophonen und monophonen Geräten in einem Bereich von sehr einfach bis zu sehr hochentwickelt zur Verfügung steht. Als weiteres Beispiel wird eine Aufzeichnung in Stereo mit Raumklang für Kinofilm in der Erwartung gemacht, daß Filmtheater entweder eine bekannte, insgesamt standardisierte Einrichtung zur Wiedergabe des linken, mittleren, rechten, des Baß- und des Raumklangkanals haben oder als Alternative eine klassische monophone "Academy"-Wiedergabe. Solche Aufzeichnungen werden auch in der Erwartung gemacht, daß sie zuhause in einer Zuhörumgebung dargestellt werden, wo Geräte von einem Fernseher mit nur einem kleinen Lautsprecher bis zu verhältnismäßig hochentwickelten Heimraumklangsystemen reichen, die die Kinoraumklangerfahrung gut wiederholen.
- Ein zur Sendung oder Wiedergabe eingefangenes Schallfeld wird zu einem bestimmten Punkt von ein oder mehr elektrischen Signalen wiedergegeben. Solche Signale bilden meistens einen oder mehrere Kanäle am Ort des Einfangens des Schallfeldes ("Einfangkanäle"), am Ort der übertragung oder Aufzeichnung des Schallfeldes ("Übertragungskanäle") sowie am Ort der Präsentation des Schallfeldes ("Darstellungskanäle"). Auch wenn innerhalb gewisser Grenzen mit zunehmender Anzahl dieser Kanäle die Fähigkeit, komplexe Schallfelder wiederzugeben zunimmt, werden durch praktische Überlegungen der Anzahl solcher Kanäle Grenzen auferlegt.
- Frühe Schallaufzeichnungs- und Wiedergabeanlagen verließen sich auf einzelne Übertragungs- und Darstellungskanäle. Später kamen Mehrkanalanlagen in Gebrauch, von denen die beliebteste für Musik immer noch die stereophone Anlage ist, die zwei Übertragungs- und Darstellungskanäle aufweist. Schallsysteme für Kino- und Heimvideofilme benutzen im allgemeinen vier oder mehr Darstellungskanäle. Zur Verringerung der Anzahl von Übertragungskanälen sind Audiomatrixtechniken angewandt worden, insbesondere um Audioinformationen für vier Darstellungskanäle in den Zweispurmedien für optische Kinofilmtonspuren und Heimvideo zu führen. Solche Matrixtechniken erlauben eine angenäherte Wiedergabe des Schallfeldes, welches von vier Darstellungskanälen, gestützt auf vier Übertragungskanäle erzeugt würde. Allerdings führen bestehende Matrixtechniken zu einer Verschlechterung des wiedergegebenen Schallfeldes, insbesondere im Hinblick auf die Trennung zwischen Darstellungskanälen, und zwar selbst wenn Matrixaufbereitungsschaltungen bei der Wiedererlangung der der Matrixtechnik unterzogenen Schallsignale angewandt werden.
- Aus diesem Grund ist es manchmal trotz des damit einhergehenden geringen Wirkungsgrades nötig, viele Übertragungskanäle über den ganzen Aufzeichnungs- und Sendeprozeß hinweg beizubehalten, um wünschenswerte Niveaus räumlicher Treue zu erzielen.
- Außer den oben erwähnten Wahlmöglichkeiten gehören zur Darstellung eines Schallfeldes mittels eines oder mehrerer Kanäle auch zusätzliche künstlerische und technische Auswahlentscheidungen. Ein Schallfeldproduzent kann wählen, wieviele Einfangkanäle er benutzen will, und wie das Schallfeld auf den Einfangkanälen "abgebildet" werden soll. Der Schallfeldsender kann die Anzahl Übertragungskanäle ebenso wählen wie die Art, in der die Audioinformation zum Aufzeichnen oder Übermitteln kodiert wird. Der Zuhörer kann die Zahl der Darstellungskanäle wählen, oder die Wahl kann durch sein Wiedergabegerät diktiert sein, welches es beispielsweise erforderlich macht, daß ein in einem stereophonen Zweikanalformat aufgezeichnetes Schallfeld über ein monophones Einkanalsystem wiedergegeben oder dargestellt wird. Der Zuhörer kann auch wählen, wo Wandler oder Lautsprecher, welche die Kanäle wiedergeben, in einer Zuhörumgebung angeordnet sind, und ob der Schall Vvaufbereitetvv oder modifiziert werden soll durch Verstärken oder Ausschneiden von Anteilen des Schallspektrums oder durch Hinzufügen von Nachhall oder Nebengeräuschen. In manchen Fällen hat der Zuhörer wenig Kontrolle, beispielsweise im Filmtheater.
- Allerdings sollte die Zahl der in einem System verwendeten Kanäle für den Zuhörer kein Grund zur Sorge sein, sobald die Anlage eingerichtet ist und funktioniert. Die Aufmerksamkeit des Zuhörers sollte nicht hörbar von solchen technischen Details des Schallsystems angezogen werden, ebensowenig wie ein Betrachter sich visuell bewußt sein sollte, daß das Farbfernsehen nur drei Farben statt des gesamten sichtbaren Spektrums benutzt.
- Abweichungen zwischen dem gewünschten Schallfeld und dem tatsächlich wiedergegebenen Schallfeld ergeben sich häufig wegen des Wunsches, die Anzahl erforderlicher Informationen zum Erzielen einer tongetreuen Wiedergabe auf ein Minimum zu reduzieren. Ein Beispiel, das oben schon erwähnt wurde, ist die Verwendung einer Matrix zum Übertragen von vier Kanälen von Schallinformationen auf zweispurigen Trägern. Bei den im Audiogebiet Arbeitenden besteht allerdings der Wunsch, das ursprüngliche Schallfeld genauer beizubehalten und dabei gleichzeitig die Menge an erforderlicher Information für die Darstellung des Schallfeldes während des Übertragungs und Aufzeichnungsverfahrens noch mehr zu verringern. Durch das Reduzieren der Menge an benötigter Information können Signale über Übertragungskanäle mit reduzierter Informationskapazität übermittelt werden, beispielsweise Übertragungswege von geringerer Bandbreite oder mit mehr Rauschen oder über Aufzeichnungsträger mit geringerer Speicherkapazität. Idealerweise sollte eine derartige Anordnung mit verringerten Informationsbedürfnissen die Wiedergabe eines Schallfeldes in einer Weise erlauben, die nicht hörbar zu unterscheiden ist oder nahezu nicht zu unterscheiden ist von dem ursprünglich beabsichtigten Schallfeld.
- Informationserfordernisse können manchmal durch verschiedene Techniken ohne Verlust an wahrnehmbarer Audioqualität verringert werden. So können zum Beispiel analoge Signale, die einer Audiokompression oder -Reduktion des Dynamikbereichs unterworfen wurden, geringere Übermittlungsinformationskapazitätserfordernisse erzwingen als derartige Signale ohne Kompression. Digitale Signale, die mit weniger binären Bits kodiert sind, erzwingen geringere Übertragungsinformationskapazitätserfordernisse als kodierte Signale, die eine größere Anzahl von Bits zur Darstellung des Signals benutzen. Natürlich gibt es Grenzen für das Ausmaß an Reduktion, das verwirklicht werden kann, ohne die akustische Qualität hörbar zu verschlechtern. In den folgenden Absätzen werden Beschränkungen erörtert, die sich mehr auf Digitaltechniken beziehen; aber es sollte klar sein, daß entsprechende Überlegungen auch für Analogtechniken gelten.
- Die Bitanforderungen für digitale Signale sind proportional zur Anzahl der Bits, die benutzt werden, um jede digitalisierte Signalprobe darzustellen, und zur Anzahl der digitalisierten Signalproben. Die Anzahl Proben für ein gegebenes Signalsegment wird insgesamt durch die Abtastrate festgelegt.
- Die Mindestabtastrate wird vom Nyquist-Satz diktiert. Der Nyquist-Satz besagt, daß ein Signal aus einzelnen Proben nur dann exakt wiedergewonnen werden kann, wenn das Intervall zwischen den Proben nicht größer ist als die Hälfte der Periode der Signalkomponente mit der höchsten Frequenz. Liegt die Abtastrate unterhalb dieser Nyquist-Rate, werden Komponenten höherer Frequenz fälschlich als Komponenten niedrigerer Frequenz dargestellt. Die Komponente niedrigerer Frequenz ist für die wahre Komponente ein "alias".
- Die Zahl der verfügbaren Bits für die Darstellung jeder digitalisierten Signalprobe legt die Genauigkeit der Signaldarstellung durch die kodierten Signalproben fest. Niedrigere Bitraten bedeuten, daß weniger Bits zur Verfügung stehen, um jede Probe darzustellen; deshalb implizieren niedrigere Bitraten größere Quantisierungsungenauigkeiten oder Quantisierungsfehler. In vielen Anwendungsfällen zeigen sich Quantisierungsfehler als Quantisierungsrauschen, und wenn die Fehler groß genug sind, wird durch das Quantisierungsrauschen die subjektive Qualität des kodierten Signals verschlechtert.
- Einige bekannte Techniken beanspruchen, Informationserfordernisse ohne hörbare Verschlechterung durch das Ausnutzen verschiedener psychoakustischer Effekte zu verringern. Das menschliche Ohr zeigt Frequenzanalyseeigenschaften ähnlich denen höchst asymmetrischer, abgestimmter Filter mit variablen Mittenfrequenzen und Bandbreiten, die als Funktion der Mittenfrequenz variieren. Die Fähigkeit des menschlichen Ohrs, unterscheidbare Töne zu erkennen und deren Richtung aufzulösen, nimmt insgesamt mit zunehmendem Unterschied in der Frequenz zwischen den Tönen zu, allerdings bleibt die Auflösungsfähigkeit des Ohres im wesentlichen konstant bei Frequenzunterschieden, die geringer sind als die Bandbreite der zuvor genannten Filter. Somit variiert die Fähigkeit des menschliches Ohres zur Frequenzauflösung und Richtungsunterscheidung je nach der Bandbreite dieser Filter über das ganze Audiospektrum hinweg. Die tatsächliche Bandbreite eines solchen Gehörfilters wird als "kritisches Band" bezeichnet. Es ist wahrscheinlicher, daß ein dominantes Signal innerhalb eines kritischen Bandes die Hörbarkeit anderer Signale, sogar von Signalen mit unterschiedlicher offenbarer Richtung irgendwo innerhalb des kritischen Bandes abdeckt, als daß es andere Signale mit Frequenzen außerhalb jenes kritischen Bandes überdeckt. Siehe insgesamt das "Audio Engineering Handbook", K. Blair Benson ed., McGraw-Hiil, San Francisco, 1988, Seiten 1.40-1.42 und 4.8-4.10.
- Signalaufzeichnungs-, Übermittlungs- oder Wiedergabetechniken, welche die nützliche Signalbandbreite in Frequenzbänder mit solchen Bandweiten unterteilen, die den kritischen Bändern des menschlichen Ohres angenähert sind, können psychoakustische Effekte besser ausnutzen als Techniken mit breiteren Bändern. Zu den das kritische Band befreffenden Verfahren gehört das Unterteilen der Signalbandbreite mit einer Filterbank, das Verarbeiten des von jedem Filterband hindurchgelassenen Signals sowie das Rekonstruieren einer Kopie des ursprünglichen Signals mit einer Umkehrfilterbank. Zwei derartige Techniken sind die Teilbandkodierung und die Transformationskodierung. Teilband- und Transformationskodierer können übertragene Informationen in bestimmten Frequenzbändern reduzieren, wo die resultierende Kodierungenauigkeit oder Rauschen durch benachbarte Spektralkomponenten psychoakustisch überdeckt ist, ohne daß die subjektive Qualität des kodierten Signals verschlechtert wird.
- Teilbandkodierer können entweder analoge oder digitale Verfahren, oder eine Hybridtechnik dieser beiden anwenden. Die Teilbandkodiererfilterbank kann als eine Bank digitaler Bandpaßfilter oder eine Bank analoger Bandpaßfilter verwirklicht sein.
- Für digitale Filterteilbandkodierer wird das Eingabesignal vor dem Filtern abgetastet. Die Abtastergebnisse werden durch eine digitale Filterbank geschickt und dann herababgetastet, um ein Teilbandsignal zu erhalten. Jedes Teilbandsignal weist Abtastwerte auf, die einen Teil des Eingabesignalspektrums darstellen.
- Für analoge Filterteilbandkodierer wird das Eingabesignal in mehrere analoge Signale jeweils in einer Bandbreite entsprechend den Bandpaßfilterbandbreiten der Filterbank aufgeteilt. Die analogen Teilbandsignale können in analoger Form beibehalten oder durch Abtasten und Quantisieren in digitale Form. umgewandelt werden.
- Digitale Transformationskodierer können durch eine beliebige Transformation von der Zeitdomäne zur Frequenzdomäne verwirlicht werden, die eine Bank digitaler Bandpaßfilter implementieren. Das abgetaste Eingabesignal wird vor dem Filtern in "Signalprobenblöcke" segmentiert. Einer oder mehrere einander benachbarte Transformationskoeffizienten können miteinander gruppiert werden und "Teilbänder" bilden, deren effektive Bandbreiten die Summen einzelner Transformationskoeffizientenbandbreiten sind. In der ganzen folgenden Diskussion soll der Ausdruck "Teilbandkodierer" sich auf wirkliche Teilbandkodierer, Transformationskodierer und sonstige Kodiertechniken beziehen, die auf Teile der nützlichen Signalbandbreite einwirken. Der Ausdruck "Teilband" soll für diese Abschnitte der nützlichen Signalbandbreite gelten, gleichgültig ob sie von einem wirklichen Teilbandkodierer, einem Transformationskodierer oder durch ein anderes Verfahren realisiert sind.
- Der Ausdruck "Teilbandblock" bezieht sich auf die Darstellung der spektralen Energie über die nützliche Signalbandbreite für ein gegebenes Intervall oder einen Zeitblock. Für wahre Teilbandkodierer, die durch eine digitale Filterbank verwirklicht sind, weist ein Teilbandblock den Satz Proben oder Abtastwerte für alle Teilbänder über ein gegebenes Zeitintervall auf. Für wahre Teilbandkodierer, die durch eine analoge Filterbank verwirklicht sind, weist ein Teilbandblock alle Teilbandsignale für ein Zeitintervallsegment auf. Für Transformationskodierer weist ein Teilbandblock den Satz aller Transformationskoeffizienten auf, die einem Signalprobenblock entsprechen.
- Die Erfinder haben experimentell festgestellt, daß für praktische Zwecke, sobald das Signal in Teilbänder aufgeteilt wurde, deren Bandbreiten in der Größenordnung der kritischen Bänder des Ohres liegen oder schmaler sind als diese, das Ohr, wenn Töne innerhalb eines Teilbandes von einem Lautsprecher oder Darstellungskanal oder von einer Stelle zwischen zwei Lautsprechern oder Darstellungskanälen zu kommen scheinen, keinerlei Schall innerhalb dieses Teilbandes wahrnimmt, der von sonst irgendwo kommt. Diese Wirkung ist begrifflich in Fig. 1 dargestellt; ein Zuhörer 101 nimmt wahr, daß Töne innerhalb eines Teil bandes vom Punkt 111 zwischen Lautsprecher 102 und 104 kommen, obgleich Töne innerhalb des Teilbandes tatsächlich von den Lautsprechern 102 bis einschließlich 110 kommen.
- Wenn jedes von zwei akustischen Signalen, die in der Frequenz um erheblich mehr als ein kritisches Band voneinander entfernt sind, durch getrennte Darstellungskanäle, beispielsweise Lautsprecher oder Kopfhörerwandler reproduziert wird, kann ein Zuhörer wahrnehmen, daß jedes der beiden Signale von einer bestimmten Quelle ausgeht. Wenn der Abstand in der Frequenz zwischen den beiden Signalen so abnimmt, daß er innerhalb eines kritischen Bandes liegt, nimmt allerdings auch die Fähigkeit eines Zuhörers ab, diese als von unterschiedlichen Quellen kommend wahrzunehmen.
- Die zur Vermittlung mehrerer Kanäle von ein Schallfeld wiedergebenden Audiosignalen erforderliche informationsmäßige Kapazität kann also durch Unterteilen der Audiosignalkanäle in Teilbänder verrringert werden, deren Bandbreiten im wesentlichen die gleichen sind oder kleiner als die der kritischen Bandbreiten des Ohrs, wobei jedes Teilband als ein Mischsignal, welches Spektralamplituden und Richtungsinformation aufweist, übermittelt oder aufgezeichnet wird, sowie durch das Erzeugen eines Satzes von Signalen, die die Amplituden und Richtungen jedes Teilbandes beibehalten, im Moment der Wiedergabe oder Darstellung.
- In der europäischen Patentanmeldung EP 0 372 601 wird ein Verfahren zum Kombinieren eines primären Audiosignals und zusätzlicher Information auf eine solche weise offenbart, daß das primäre Audiosignal durch bestehende Empfänger wiedergegeben werden kann, ohne daß es einen wahrnehmbaren Unterschied gegenüber einer Reproduktion des Primärsignals allein gibt, wobei trotzdem die zusätzliche Information auch von einem Empfänger mit einem entsprechenden Dekodierer erhalten werden kann. Das wird erreicht durch Aufteilen des primären Audiosignals in kritische Bandsignale mit fester Bitrate, Quantisieren der Teilbandsignale unter Verwendung von gerade genügend Bits zum Abdecken der Quantisierungsstörungen, Kodieren der zusätzlichen Information unter Verwendung der restlichen Bits für jedes Teilbandsignal, Verschmelzen der kodierten Teilbandsignale zu einem Breitbandsignal und Übermitteln oder Aufzeichnen des Bandsignales für die spätere Wiedergabe. Ein bestehender Empfänger kann das Primärsignal normal wiedergeben. Ein Empfänger mit entsprechendem Dekodierer kann auch die zusätzliche Information erhalten, indem er das kodierte Signal in Teilbandsignale aufteilt, die Zahl der Bits bestimmt, die in jedem Teilband nötig sind, um das Quantisierungsrauschen gerade zu überdecken, die restlichen Bits für jedes Teilbandsignal extrahiert und die extrahierten Bits so zusammensetzt, daß die zusätzliche Information erhalten wird. In einer Zweikanal- oder stereophonen Anlage können zum Beispiel die Signale des linken und rechten Kanals jeweils mit einem anderen Raumklangkanal kombiniert werden; allerdings wird bei diesem Verfahren die erforderliche Bitrate nicht bis über diejenige hinaus reduziert, die von herkömmlichen Teilbandkodierern bereitgestellt wird, welche psychoakustische Effekte ausnutzen.
- Die europäische Patentanmeldung EP 0 402 973 offenbart ein System zum Formatieren eines digitalen Audiosignals in Pakete. Bei einem Ausführungsbeispiel stellt ein System Audiosignale in einer Form dar, die Signalproben aufweist, welche vor der Quantisierung mit entsprechenden Skalierungsfaktoren multipliziert werden. Stereophone Signalproben vom linken und rechten Kanal werden zu einem monophonen Signal zusammengefügt, und die monophonen Signalproben und Skalierungsfaktoren von jedem der beiden Kanäle werden zu Paketen formatiert. Ein Empfänger kann Lokalisierungseffekte synthetisieren, die als "Intensitätstereo" bezeichnet werden, indem er die Skai ierungsfaktoren des linken und rechten Kanals zum Skalieren des monophonen Signals benutzt. Obwohl jede beliebige Anzahl von Kanälen zu Paketen formatiert werden kann, werden gemäß der Offenbarung nur zwei Kanäle auf diese Weise kombiniert; zusätzliche Kanäle, beispielsweise Raumklangkanäle werden gesondert in Spezialpaketen als "zusätzliche Information" formatiert. Ferner wird diese einfache Summiertechnik nur dann angewandt, wenn Phasendifferenzen zwischen dem linken und rechten Kanal irrelevant sind. Schließlich kann die Lokalisierung des synthetisierten Stereoeffekts einigen bekannten Matrixtechniken unterlegen sein, weil sie sich auf Signalamplitudenskalierfaktoren verlassen muß, die die Spektralleistung eines Teilbandsignals stark falsch darstellen können, insbesondere wenn die Teilbandsignale höchst unstationär sind.
- Weitere Techniken können benutzt werden, um die Informationskapazität weiter zu verringern, die erforderlich ist, um ein gegebenes Niveau in der Qualität der Signalwiedergabe zu erzielen. Mit jeder wird eine Verringerung auf Kosten einer Verringerung der Signalwiedergabegenauigkeit erzielt. Eine digitale Technik besteht in einer Fließkommadarstellung von Zahlen. Fließkommazahlen können einen größeren Wertebereich mit weniger Bits darstellen als es bei ganzzahliger Darstellung möglich ist. Eine Fließkommazahl weist eine Mantisse und einen Exponenten auf. Ein weiteres digitales Verfahren ist eine Block-Fließkommadarstellung. Bei Verwendung dieses Verfahrens werden mehrere Größen als Gruppe oder Block von Mantissen dargestellt, die einem einzigen Exponenten zugeordnet sind. Für die eine oder andere Fließkommatechnik kann der Exponent als ein Skalierungsfaktor oder ein grobes Quantisierungsniveau betrachtet werden. Die Mantisse kann als Objekt des Skalierungsfaktors oder als ein feinerer Quantisierungspegel betrachtet werden.
- Die vorliegende Erfindung ist auf Mehrkanalschallkodier/Übertragungssysteme gerichtet, bei denen wiedergegebene Schallfelder von einem Schallfeld, das von einem System einzelner Kanäle erzeugt würde, hörbar nicht zu unterscheiden oder nahezu nicht zu unterscheiden sind und die auch bekannten 4-2-4 Matrixsystemen mit aufbereiteter Dekodierung hörbar überlegen sind, aber dennoch eine wesentliche Bandbreite gegenüber solchen bekannten Einzel- und Matrixsystemen beibehalten. Gemäß der vorliegenden Erfindung unterteilt ein Kodierer zwei oder mehr Audiokanäle in eine Anzahl von Teilbandsignalen, die vorzugsweise Bandbreiten entsprechend den kritischen Bändern des menschlichen Ohrs haben. Ein oder mehrere Mischsignale werden gebildet, und es werden Lenksteuersignale erzeugt. Die Mischsignale entstehen durch Kombinieren von Teilbandsignalen in einem entsprechenden Teilband von zwei oder mehr Audiokanälen. Die Lenksteuersignale beziehen sich auf die konstituierenden Teil bandsignale, die in jedem der Teilbänder zu den Mischsignalen kombiniert sind. Die Mischsignale und die Teilbandsignale, welche nicht zu einem entsprechenden Mischsignal kombiniert sind, werden kodiert. Bei bevorzugten Ausführungsbeispielen weist die kodierte Form grob quantisierte Werte und feiner quantisierte werte auf. Die kodierte Information und die Lenksteuersignale werden zu einem Ausgabesignal zusammengestellt. Auch wenn die Erfindung unter Verwendung analoger oder digitaler Techniken oder sogar mittels einer hybriden Anordnung solcher Techniken verwirklicht werden kann, wird die Erfindung zweckmäßiger durch Anwendung digitaler Techniken realisiert, und die hier offenbarten, bevorzugten Ausführungsbeispiele sind digitale Verwirklichungen.
- Es sei auch darauf hingewiesen, daß die Anwendung der Lehren der Erfindung, obwohl die Benutzung von Teilbändern mit Bandbreiten entsprechend den kritischen Bandbreiten des menschlichen Ohrs eine größere Ausnutzung psychoakustischer Effekte ermöglicht, nicht in dieser Weise eingeschränkt sind. Für den Fachmann liegt auf der Hand, daß diese Lehren auch bei Breitbandsignalen anwendbar sind. Deshalb sollte ein Hinweis auf Teilbänder im Verlauf der folgenden Diskussion als eines oder mehrere Frequenzbänder aufgefaßt werden, die die gesamte nützliche Bandbreite von Eingabesignalen überspannen.
- Bei einem ersten Ausführungsbeispiel der Erfindung empfängt ein Kodierer eine Vielzahl von Eingai;igskanälgn. und stellt an seinem Dekodierer die gleiche Anzahl von Ausgangskanälen zur Verfügung. Die kodierte Information kann für jedes Teilband eine Einzeldarstellung für jeden der Eingangskanäle und/oder eine Gesamtdarstellung für einige oder alle der Eingangskanäle einschließen. Die Gesamtdarstellung weist ein zusammengesetztes Audioinformationssignal sowie ein Lenksteuersignal auf, welches eine Annäherung der Eingangssignalpegel für jedes der Teilbänder in dem zusammengesetzten Audioinformationssignal wiedergibt.
- Fig. 2 ist eine begriffliche Darstellung dessen, wie das erste Ausführungsbeispiel die Gesamtdarstellung bildet. Ein Kodierer, der Prozesse 204 und 206 aufweistv empfängt Teilbandsignale, die ein Schallfeld wiedergeben, von einer Vielzahl von Eingangskanälen 202. Der Prozeß 204 kombiniert die Eingabesignale zu einem zusammengesetzten Audioinformationssignal, welches entlang des Weges 208 weitergeleitet wird. Der Prozeß 206 bestimmt Eingangskanalpegel und legt ein Lenksteuersignal fest, welches die Pegel jedes Kanals wiedergibt, den es längs des Weges 210 weitergibt. Die Wege 208 und 210 werden hier kollektiv als ein Mischkanal bezeichnet. Ein Dekodierer, der einen Prozeß 212 aufweist, empfängt ein Mischkanalsignal von den Wegen 208 und 210 und teilt Mischkanalteilbänder zu, um Ausgabesignale längs Ausgangskanälen 214 zur Darstellung des Schallfeldes zu erzeugen.
- Bei einem zweiten Ausführungsbeispiel der Erfindung empfängt ein Kodierer Schallfeldsignale von einer Vielzahl von Eingangskanälen ebenso wie Lokalisierungscharakteristiken jedes dieser Eingangskanäle. Der Dekodierer empfängt ebenfalls ein kodiertes Signal ebenso wie die Lokalisierungsmerkmale des Wandlers für jeden Ausgangskanal und stellt ein Signal für jeden Ausgangskanal bereit, um das von den Eingangskanalsignalen wiedergegebene Schallfeld so genau wie möglich zu reproduzieren. Die kodierte Information kann für jedes Teilband eine Einzeldarstellung für jeden der Eingangskanäle und/oder eine Gesamtdarstellung für einige oder alle der Eingangskanäle enthalten. Die Gesamtdarstellung weist ein zusammengesetztes Audioinformationssignal, welches den gesamten Nettoschallfeldpegel wiedergibt, sowie ein Lenksteuersignal auf, welches Schallokalisierungsinformationen für jedes der Teilbänder in dem zusammengesetzten Audioinformationssignal enthält. Diese Lokalisierungsinformation wird hier als Nettorichtungsvektor bezeichnet.
- Fig. 3 ist eine begriffliche Darstellung dessen, wie das zweite Ausführungsbeispiel die Gesamtdarstellung bildet. Ein Prozesse 304 und 306 aufweisender Kodierer empfängt Teilbandsignale, die ein Schallfeld wiedergeben, von einer Vielzahl von Eingangskanälen 302 und empfängt von einem Weg 303 Informationen darüber, wie das Schallfeld auf jedem dieser Eingangskanäle abgebildet wird. Der Prozeß 304 kombiniert die Eingabesignale zu einem zusammengesetzten Audioinformationssignal und gibt dieses längs Weg 308 weiter. Der Prozeß 306 bestimmt Nettorichtungen und legt ein Lenksteuersignal fest, welches die offenbaren Richtungen des Schallfeldes wiedergibt, die es längs Weg 310 weiterleitet Auf die Wege 308 und 310 wird hier kollektiv als Mischkanal Bezug genommen. Ein einen Prozeß 312 aufweisender Dekodierer empfängt vom Weg 313 Informationen über die Anzahl Ausgangskanäle und die räumliche Konfiguration von Ausgangskanalwandlern im Darstellungssystem, empfängt ein Mischkanalsignal von den Wegen 308 und 310 und teilt Mischkanalteilbänder zu, um längs der Ausgangskanäle 314 Ausgabesignale zur Darstellung des Schallfeldes zu erzeugen.
- Die kodierten Signale des zweiten Ausführungsbeispiels können von denen des ersten Ausführungsbeispiels abgeleitet werden, vorausgesetzt das Verhältnis zwischen den Mehrfachkanälen und dem gewünschten reproduzierten Schallfeld ist bekannt. Insgesamt können die kodierten Signale des ersten Ausführungsbeispiels nicht von denen des zweiten Ausführungsbeispiels abgeleitet werden, mindestens im Fall eines Systems, bei dem das Schallfeld von mehr als zwei Kanälen geführt werden soll. Das liegt daran, daß viele Kombinationen von Kanalamplituden den gleichen Nettorichtungsvektor erzeugen können.
- Bei praktischen Anwendungen des ersten und zweiten Ausführungsbeispiels ist die Information an den Kodierer eine Vielfalt von Eingangskanälen. Im Fall des zweiten Ausführungsbeispiels befaßt sich der Kodierer jedoch mit den Lokalisierungsmerkmalen des gewünschten reproduzierten Schallfeldes. Aus diesem Grund muß er Lokalisierungsinformationen über die Eingangskanäle und darüber empfangen, wie diese Eingangskanäle zu dem Schallfeld in Beziehung stehen sollen. Bei einem Fünfkanal-Kinofilmsystem zum Beispiel mit linker, zentraler, rechter, sowie linker und rechter Raumklangwiedergabe durch insgesamt standardisierte Lautsprecherorte kann der Nettorichtungsvektor von den fünf Kanalsignalen abgeleitet werden, die an jene Lautsprecherorte angelegt werden sollen. Ein Dekodierer gemäß dem zweiten Ausführungsbeispiel, der Informationen über die Wiedergabe- oder Darstellungsumgebung empfängt, kann den Nettorichtungsvektor benutzen, um einen Satz Signale für die beabsichtigte Fünfkanal-Wiedergabe oder Darstellung oder für eine andere Wiedergabe- oder Darstellungsumgebung zu erzeugen, die eine andere Zahl von Kanälen und/oder Lautsprecherorten vorsieht. Zum Beispiel kann das zusammengesetzte Audioinformationssignal und der Nettorichtungsvektor für eine Dreikanal-Links-, Mitte- und Rechtskanal-Wiedergabe oder Darstellungsanordnung dekodiert werden.
- Bei beiden Ausführungsbeispielen ist es erwünscht, daß das reproduzierte Schallfeld, wenn es von einer Wiedergabe- oder Darstellungsanordnung erzeugt wird, von den meisten Zuhörern hörbar nicht oder nahezu nicht unterscheidbar ist von demjenigen, welches ein System wiedergibt, welches die gleiche Anzahl einzelner Einfang-, Übertragungs- und Darstellungskanäle hat.
- Die Erfindung ist nicht auf die Verwendung mit irgendeinem bestimmten Schema zum Erzeugen mehrfacher Eingangskanäle noch auf irgendein bestimmtes Schema zum Einfangen oder Neuschaffen von Schallfeldern begrenzt. Im Fall des ersten Ausführungsbeispiels oder des Typs I nimmt die Erfindung als Eingabe am Kodierer jeden beliebigen Satz mehrfacher Eingangskanäle an, gleichgültig wie sie abgeleitet wurden, und liefert als Ausgabe an den Dekodierer eine Annäherung des Satzes der mehrfachen Eingangskanäle. Im Fall des zweiten Ausführungsbeispiels oder des Typs II akzeptiert die Erfindung als Eingang am Kodierer jeden beliebigen Satz mehrfacher Eingangskanäle mit Informationen, die erforderlich sind, um festzulegen, wie der Erzeuger der Eingangskanäle sie in einem Schallfeld erzeugen wollte, zum Beispiel ihre beabsichtigte Richtung in bezug auf den Zuhörer, und stellt als Ausgang an einem Dekodierer einen Satz von Darstellungskanälen bereit, die das bestmögliche Schallfeld entsprechend den Fähigkeiten der Wiedergabe- oder Darstellungsausrüstung und -umgebung erzeugen.
- Wie vorstehend erörtert, gilt die vorliegende Erfindung für Teilbandkodierer, die durch eines von verschiedenen Verfahren verwirklicht sind. Eine bevorzugte Verwirklichung arbeitet mit eine Transformation, insbesondere eine Transformation von der Zeitdomäne zur Frequenzdomäne entsprechend der "Time Domain Aliasing Cancellation (TDAC) Technik". Siehe Princen und Bradley "Analysis/Synthesis Filter Bannk Design Based on Time Domain Aliasing Cancellation" IEEE Trans. on Acoust.. Speech. Signal Proc., Band ASSP-34, 1986, 55. 11 53-1161. Ein Beispiel eines Transformationskodier/Dekodiersystems, welches eine TDAC-Transformation nutzt, ist in der internationalen Veröffentlichung Nr. WO 90/09022 beschrieben.
- Zur typischen Einkanal-Teilbandkodierung gehört, wie in Fig. 4 gezeigt, das Aufteilen des Eingabesignals in Teilbänder mittels Filterbank 1010, Umwandeln der Teilbandinformation in quantisierte Codewörter mittels eines Kodierers 1030 sowie das Zusammensetzen der quantisierten Codewörter zu einer für die Übertragung oder Speicherung geeigneten Form mittels eines Formatierers 1040. Wenn die Filterbank durch digitale Filter oder diskrete Transformationen verwirklicht ist, wird das Eingabesignal mittels eines Abtasters 1000 abgetastet und digitalisiert, ehe es mittels der Filterbank gefiltert wird. Ist die Filterbank in Form analoger Filter vorgesehen, können die Teilbandsignale von einem Abtaster 1020 zur digitalen Kodierung mittels des Kodierers 1030 abgetastet und digitalisiert werden. Die vorliegende Erfindung bezieht sich auf den Kodierer 1030 für mehrfache Informationskanäle.
- Zu typischer digitaler Einkanal-Teilbanddekodierung gehört, wie in Fig. 5 gezeigt, das Auseinandernehmen der formatierten Codewörter mittels eines Deformatierers 1050, die Wiedergewinnung der Teilbandinformation mittels eines Dekodierers 1060 und das Verschmelzen der Teilbandinformation zu einem Einkanalsignal mittels einer Umkehrfilterbank 1080. Wenn die Umkehrfilterbank von Analogfiltern gebildet und das Signal digital kodiert ist, wird die Teilbandinformation von einem Umsetzer 1070 vor dem Filtern mittels der Umkehrfilterbank in analoge Form umgewandelt. Ist die Umkehrfilterbank von digitalen Filtern oder diskreten Transformationen gebildet, wird das digitale Signal mittels eines Umsetzers 1090 in analoge Form umgewandelt. Die vorliegende Erfindung bezieht sich auf den Dekodierer 1060 für mehrfache Informationskanäle.
- Entsprechend den Lehren der vorliegenden Erfindung zum Kodieren kombiniert ein Teilbandlenkung genannter Prozeß spektrale Komponeten von zwei oder mehr Kanälen in einem bestimmten Teilband zur Schaffung eines zusammengesetzten Audioinformationssignals und eines Lenksteuersignals. Fig. 6 veranschaulicht das Konzept. Mehrfache Eingangskanäle sind durch horizontale Balken wiedergegeben, die mit Ch A, Ch B, Ch C ... Ch Z bezeichnet sind. Diese Eingangskanäle sind in Teilbänder aufgeteilt, welche durch senkrechte Säulen wiedergegeben sind, die SB 0, SB 1 ... SB N markiert sind. Die Teilbänder erstrecken sich insgesamt über die nützliche Bandbreite der Eingangskanäle. Ein weiterer Kanal ist ein Mischkanal, der in Fig. 6 durch den horizontalen, "zusammengesetzte" bezeichneten Balken wiedergegeben ist. Der Mischkanal ist ein theoretisches Konstrukt, welches für das Verständis der Teilbandlenkung nützlich ist und weist das zusammengesetzte Audioinformationssignal sowie das Lenksteuersignal auf.
- Die Teilbandlenkung kombiniert spektrale Komponenten des Teilbandes aus den mehreren Eingangskanälen zu einer zusammengesetzten Darstellung. Unter Hinweis auf Fig. 6 werden beispielsweise die Spektralkomponenten im Teilband SB 1 für die Kanäle Ch A bis Ch Z zu einem einzigen Teilbanndsatz spektraler Komponenten kombiniert, die durch den querschraffierten Bereich im Teilband SB 1 fuf den Mischkanal daßestellt sind. Die zusammengesetzte Darstellung für das Teilband SB 1 kann anstelle der durch das Mischkanalteilband wiedergegebenen spektralen Komponente des Teilbandes individueller Kanäle lubermittelt oder aufgezeichnet werden.
- Gemäß den Lehren der vorliegenden Erfindung brauchen nicht alle Teilbänder gelenkt zu werden. Unter nochmaligem Hinweis auf Fig. 6 sind zum Beispiel die spektralen Komponenten für die Kanäle Ch A bis einschließlich Ch Z im Teilband SB 0 nicht gelenkt. Der Mischkanal enthält keinerlei zusammengesetzte Darstellung für dieses Teilband. Folglich kann ein Ausführungsbeispiel der vorliegenden Erfindung Mehrfachkanäle, welche ein Schallfeld wiedergeben, zu einem Gemisch einzelner Kanaldarstellungen und zusammengesetzter Kanaldarstellungen kodieren. Ein "gelenktes Teilband" ist ein Teilband, in welchem Spektralkomponenten aus einem oder mehr Kanälen zu einer Mischdarstellung kombiniert sind. Die Mischdarstellung aller gelenkten Teilbänder einschließlich der zusammengesetzten Audioinformationssignale und Lenksteuersignale ist der "Mischkanal". Die durch den Mischkanal dargestellten Kanäle sind die "gelenkten Kanäle".
- Ein Lenksteuersignal wird auf eine von zwei Weisen erzeugt. Das erste Ausführungsbeispiel oder Typ I, welches begrifflich in Fig. 2 dargestellt ist, erzeugt ein Lenksteuersignal, welches die Pegel der Spektralkomponenten aus allen gelenkten Kanälen vermittelt. Das zweite Ausführungsbeispiel, bzw. Typ II, welches begrifflich in Fig. 3 gezeigt ist, erzeugt ein Lenksteuersignal, welches die scheinbaren Richtungen oder Nettorichtungsvektoren der Spektralkomponenten von allen gelenkten Kanälen wiedergibt.
- Ebenfalls kann in Übereinstimmung mit den Lehren der vorliegenden Erfindung das Kodieren einzelner Mehrfachkanäle mit adaptiver Teilbandlenkung arbeiten. In Fällen, in denen eine Anzahl einzelner Übertragungskanäle höchsterwünscht ist für einen bestimmten Anwendungsfall, erlaubt eine adaptive Lenkung es, einzelne Kanäle immer dann zu übertragen, wenn das möglich ist. Bei adaptiver Teilbandlenkung kann die Lenkung eines gegebenen Teilbandes immer dann benutzt werden, wenn die Übertragungskanalkapazität ansonsten durch die Menge an Informationen überschritten wird, die nötig ist, um kodierte spektrale Komponenten für einzelne Kanäle zu übertragen. So wird der Lenkprozeß nur auf spezielle Teilbänder angewandt, die sonst eine unzureichende Kanalkapazität empfangen, um ein gewünschtes Niveau an Kodierungsgenauigkeit zu erzielen. Es wird die Mischdarstellung spektraler Komponenten statt der Teilbandspektralkomponenten in den gelenkten Kanälen kodiert.
- Ferner kann gemäß den Lehren der vorliegenden Erfindung zum Kodieren der Lenkprozeß auf nur bestimmte Teilbänder eingeschränkt werden, wobei Spektralkomponenten in anderen Teilbändern immer als Einzelkanalinformation verarbeitet werden. Der Fachmann sollte verstehen, daß unterschiedliche Kriterien herangezogen werden können, um ausgewählte Teilbänder von der Teilbandlenkung auszuschließen. So können zum Beispiel einige oder alle Teilbänder in Kanälen hoher Priorität von der Teilbandlenkung ausgeschlossen werden, oder es können Teilbänder hoher Priorität innerhalb einiger oder aller Kanäle von der Teilbandlenkung ausgenommen werden. Es sollte aucri verstanden werden, daß die Ausschlußkriterien festgelegt oder adaptiv entsprechend dem Signalinhalt und den Kodierungserfordernissen gewählt werden können. Wiederum als Beispiel können Teilbänder aus Mehrfachkanälen, die dominante spektrale Komponenten enthalten, welche sich außer Phase miteinander befinden, adaptiv vom Lenkverfahren ausgeschlossen werden, weil die Teilbandlenkung einen hörbaren Signalverlust erzeugen kann.
- Ferner kann, wiederum gemäß den Lehren der vorliegenden Erfindung zum Kodieren, der von Lenkkanälen mit Komponenten außer Phase resultierende Signalverlust durch eines von mehreren Kompensationsschemata vermieden oder auf ein Minimum eingegrenzt werden. Ein solches Schema legt Mindestpegel für die Amplitude spektraler Komponenten im Mischkanal fest. Bei einem anderen Schema wird die Phase spektraler Komponenten in einzelnen Kanälen vor dem Schaffen des Mischkanals eingestellt und Nebeninformationen an einen Dekodierer weitergeleitet, die es ihm ermöglichen, die Phaseneinstellung umzukehren.
- Gemäß den Lehren der vorliegenden Erfindung für digitale Kodiertechniken werden numerische Werte, welche die Spektralkomponenten darstellen, zu Codewörtern quantisiert, wobei eine veränderliche Bitzahl mindestens einigen der Codewörter aus einem Pool an Bits adaptiv zugeordnet wird. Die Bitzuordnung basiert darauf, ob wegen des Signalinhalts Quantisierfehler in einigen Teilbändern die Signalkodierqualität stärker verschlechtert als Quantisierfehler in anderen Teilbändem. Insbesondere werden mehr Bits den Spektralkomponenten in jenen Teilbändern zugeteilt, deren Quantisierungsrauschen für mehr hörbar erachtet wird als das Quantisierungsrauschen in anderen Teilbändern.
- Außerdem können gemäß den Lehren der vorliegenden Erfindung für das digitale Kodieren die hörbaren Auswirkungen von Quantisierfehlern dadurch verringert werden, daß die statistischen Merkmale der Quantisierfehler der Spektralkomponenten geändert werden. Bei einem Ausführungsbeispiel wird eine derartige Abänderung nicht für Teilbänder benutzt, in denen wenig oder keine spektrale Energie vorhanden ist.
- Gemäß den Lehren der vorliegenden Erfindung zum Dekodieren wird, sofern eine Teilbandlenkung beim Lenken angewandt wird, eine Umkehrlenkung verwendet, die das Lenksteuersignal benutzt, um eine Darstellung der gelenkten Kanäle aus dem Mischkanal wiederzugewinnen. Für das Kodieren des Typs I werden mehrfache Informationskanäle wiedergewonnen, wobei jeder wiedergewonnene Kanal einem der Eingangskanäle entspricht. Bei Kodieren des Typs II werden ein oder mehrere Kanäle zur Darstellung auf einem bestimmten Darstellungssystem erzeugt. Die Anzahl Kanäle für Dekodierer des Typs II wird von Eigenschaften des Präsentationssystems diktiert, so daß sie deshalb nicht unbedingt der Anzahl Eingangskanäle gleicht.
- Auch wird entsprechend den Lehren der vorliegenden Erfindung für digitale Dekodierverfahren ein adaptiver Bitzuordnungsprozeß durchgeführt, der im wesentlichem dem beim Kodieren benutzten ähnelt, um die Anzahl Bits festzustellen, die jedem quantisierten Codewort zugeteilt sind. Diese Information wird herangezogen, um die spektralen Komponenten des Teilbandes zu rekonstruieren.
- Gemäß den Lehren der vorliegenden Erfindung zum digitalen Dekodieren werden außerdem Quantisierfehlei: dadurch verringert, daß die Rekonstruktion von Spektralkomponenten statistisch aufbereitet wird. Bei einem Ausführungsbeispiel wird eine solche statistische Aufbereitung nicht für Teilbänder herangezogen, in denen wenig oder keine spektrale Energie vorhanden ist.
- Die verschiedenen Merkmale der Erfindung und ihre bevorzugten Ausführungsbeispiele sind in den folgenden "Arten der Verwirklichung der Erfindung" und den beigefügten Zeichnungen mehr im einzelnen erläutert.
- Fig. 1 ist ein begriffliches Diagramm, welches eine Person darstellt, die einem von mehrfachen Darstellungskanälen erzeugten Schallfeld lauscht, aber wahrnimmt, daß ein Ton von einem Punkt zwischen zwei Darstellungskanälen kommt.
- Fig. 2 ist ein begriffliches Blockschaltbild, welches ein erstes Ausführungsbeispiel oder Typ I der Teilbandlenkung darstellt.
- Fig. 3 ist ein begriffliches Blockschaltbild, welches ein zweites Ausführungsbeispiel oder Typ II der Teilbandlenkung darstellt.
- Fig. 4 ist ein Funktionsblockschaltbild, welches den Grundaufbau eines Teilbandkodierers darstellt.
- Fig. 5 ist ein Funktionsblockschaltbild, welches den Grundaufbau eines Teilbanddekodiers darstellt.
- Fig. 6 ist eine hypothetische graphische Darstellung der Teilbandlenkung.
- Fig. 7 ist ein Funktionsblockschaltbild, welches den Grundaufbau der Erfindung in bezug auf Teilbandkodierung darstellt.
- Fig. 8 ist ein Funktionsblockschaltbild, welches den Grundaufbau der Erfindung in bezug auf Teilbanddekodierung darstellt.
- Fig. 9 ist eine hypothetische graphische Darstellung eines Wiedergabesystems in drei Dimensionen mit fünf Darstellungskanälen.
- Fig. 10a ist eine hypothetische graphische Darstellung von Quantisierungenauigkeiten, die einer digitalen 3-Bit Zweierkomplement-Wiedergabe eines abgebrochenen Real- Wertes innewohnen.
- Fig. 10b ist eine hypothetische graphische Darstellung von Quantisierungenauigkeiten, die einer digitalen 3-Bit Zweierkomplement-Wiedergabe eines Real-Wertes mit Rundung vor dem Abbrechen innewohnen.
- Tabelle I zeigt die Transformationakoeffiziententeilbandgruppierung, Haupt- und Teilbandexponentenstruktur und Koeffizientenzuteilungserfordernisse für ein bevorzugtes Ausführungsbeispiel der Erfindung in bezug auf die Teilbandquantisierung bei Verwendung im Zusammenhang mit einer 512-Punkt TDAC-Umwandlung, basierend auf einem Kodierer für ein Signal der Bandbreite 20 kHz, welches mit 48 kHz abgetastet wird.
- Die vorliegende Erfindung kann unter Verwendung einer Vielfalt an analogen und digitalen Kodiertechniken verwirklicht werden. Die Erfindung wird mit digitalen Verfahren zweckmäßiger verwirklicht, und die hier offenbarten Ausführungsbeispiele sind digitale Verwirklichungen.
- Digitale Verwirklichungen können mit adaptiven Bitzuordnungstechniken arbeiten. Die folgende Beschreibung eines bevorzugten Ausführungsbeispiels offenbart sowohl adaptive Bitzuordnung und Teilbandlenkungskonzepte, wobei allerdings darauf hingewiesen sei, daß auch digitale Implementierungen der Teilbandlenkung mit Bitzuteilungsschemata benutzt werden können, die nicht adaptiv sind. Der offenbarte adaptive Bitzuteilungsprozeß kann auch in einer Kodierer/Dekodiereranlage ohne Teilbandlenkung benutzt werden.
- Das nachfolgend erörterte, bevorzugte Ausführungsbeispiel offenbart eine adaptive Lenktechnik, die spezieller für digitale Verwirklichungen mit adaptiver Bitzuordnung geeignet ist, wobei jedoch zu verstehen gegeben sei, daß die Teilbandlenkung auch nichtadaptiv, das heißt kontinuierlich benutzt werden kann. Variationen der Teilbandlenkung werden nachfolgend erörtert.
- Der Grundaufbau für ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung in ihrem Bezug auf die Teilbandkodierung ist in Fig. 7 veranschaulicht. Bei diesem bevorzugten Ausführungsbeispiel gehört zu der vorliegenden Erfindung als Kodierer des Typs I ein Grobpegelquantisierer 100, der Mehrfachkanäle von spektraler Teilbandinformation grob quantisiert, wobei jeder Kanal als Abschnitte eines Weges 1 wiedergegeben ist, die mit Ch 1, Ch 2 ... Ch N bezeichnet sind; ein Teilbandzuteilungsschwellenschätzer 200, der die Mindestanzahl Bits abschätzt, die für jedes Teilband erforderlich sind, um ein gegebenes Niveau der Signalkodierqualität in Abhängigkeit von der vom Weg 11 erhaltenen groben Quantisierungsinformation zu erzielen; ein adaptiver Bitzuteiler 300, der in Abhängigkeit von grober Quantisierungsinformation, die von einem Weg 13 erhalten wird, von einem Weg 46 erhaltener Lenkinformation sowie der für die Zuteilung verfügbaren Bitzahl, die von einem Weg 35 aus einem Bitpool 350 empfangen wird, den sich mindestens einige der Kanäle teilen, verschiedenen Teilbändern eine Anzahl Bits zuordnet; ein Lenk-Controller 400, der in Abhängigkeit von über einen weg 21 empfangenen geschätzten erforderlichen Zuteilungsschwellen, Bitzuteilungsinformation, die von einem Weg 31 erhalten wird, sowie von einem Weg 12 erhaltenen 40 groben Quantisierungsinformationen und Spektralkomponenteninformationen ausgewählte Teilbänder zu einer zusammengesetzten spektralen Information gelenkt; ein Quantisierer 500, der über Wege 41 bis einschließlich 45 erhaltene Lenk- und Spektralinformationen zu quantisierten Codewörten quantisiert und die quantisierten Codewörter, grobe Quantisierung ebenso wie Lenkinformation längs Wegen 51 bis 54 weiterleitet
- Bei diesem bevorzugten Ausführungsbeispiel weist die vorliegende Erfindung als Kodierer des Typs II ferner einen Eingabeweg 2 auf, längs dessen der Lenk-Controller 400 Informationen empfängt, welche die Lokalisierungsmerkmale für jedes Kanalsignal beschreiben.
- Der Grundaufbau für ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung in ihrem Bezug auf die Teilbanddekodierung ist in Fig. 8 veranschaulicht. Bei diesem bevorzugten Ausführungsbeispiel gehört zu dem Dekodierer als Typ I der vorliegenden Erfindung ein adaptiver Bitzuteilungsrechner 600, der in Abhängigkeit von aus einem Weg 58 erhaltener grober Quantisierungsinformation, aus einem Weg 59 erhaltenen Lenksteuerkennzeichen sowie der Anzahl für die Zuteilung verfügbarer Bits, die über einen Weg 65 aus einem Bitpool 650 erhalten werden, die jedem Codewort während der Quantisierung zugeordnete Anzahl Bits bestimmt; ein Dequantisierer 700, der das aus einem Weg 55 empfangene Lenksteuersignal dequantisiert und Spektralkomponenteninformation wiedergewinnt in Abhängigkeit von quantisierten Codewörtern, die aus einem Weg 56 erhalten werden, grober Quantisierungsinformation, die aus einem Weg 57 erhalten wird sowie Bitzuteilungsinformationen, die aus einem Weg 61 erhalten werden, und der längs eines Weges 74 die von einem Weg 62 erhaltenen Lenksteuerkennzeichen weiterleitet; sowie einen Umkehrlenk-Controller 800, der in Abhängigkeit von Lenk- und zusammengesetzten Spektralinformationen, die über Wege 71 bis 74 erhalten werden, gelenkte Teilbänder rekonstruiert und einen vollständigen Satz Teilbänder für Mehrfachkanäle von spektraler Teilbandinformation bereitstellt, wobei jeder Kanal als Abschnitte eines Weges 81 dargestellt ist, die mit Ch 1, Ch 2 ... Ch N bezeichnet sind.
- Bei diesem bevorzugten Ausführungsbeispiel weist die vorliegende Erfindung als Dekodierer des Typs II ferner einen Eingabeweg 82 auf, über den der Umkehrlenk- Controller 800 Informationen empfängt, welcher die Anzahl der Ausgangskanäle sowie den Ort von Wandlern, wie mit den Ausgangskanälen verbundenen Lautsprechern beschreiben.
- Das bevorzugte Ausführungsbeispiel der vorliegenden Erfindung in ihrem Bezug auf das Kodieren und Dekodieren ist in den folgenden Abschnitten in größerer Einzelheit beschrieben. Alternative Ausführungsbeispiele und Strukturen für die gegenwärtige Erfindung werden im Verlauf der Diskussion vorgestellt.
- Unter Hinweis auf Fig. 7, die die vorliegende Erfindung im Hinblick auf die Teilbandkodierung darstellt, ist erkennbar, daß der Grobpegelquantisierer 100 Mehrfachkanäle von Teilbandinformationen längs eines Weges 1 empfängt. Wenn die Teilbandblöcke von einer diskreten Transformation, wie der Diskreten Fourier-Transformation (DFT) abgeleitet werden, besteht jedes Teilband aus einem oder mehreren einzelnen Transformationskoeffizienten. Die Tabelle I zeigt eine spezielle Teilbandgruppierung von Transformationskoeffizienten für ein Signal der Bandbreite 20 kHz Die Tabelle beruht auf einer 512 Punkte Transformation und einer Eingabesignalabtastrate von 48 kHz. Die Teilbänder entsprechen insgesamt den kritischen Bändern des Ohrs. Es können andere Teilbandgruppierungen, Abtastraten und Transformationslängen benutzt werden, ohne den Bereich der vorliegenden Erfindung zu verlassen.
- Bei einem bevorzugten Ausführungsbeispiel der Erfindung werden die Spektralkomponenten vom Grobpegelquantisierer dadurch grob quantisiert, daß er den Exponenten für die spektralen Komponenten, ausgedrückt in Block-Fließkomma-Form festlegt. Obwohl viele Formate möglich sind, sieht das von der Erfindung in Betracht gezogene Format Hauptexponenten für Gruppen von Teilbändern, einen Blockexponenten für jedes Teilband sowie eine Mantisse für jede Spektralkomponente innerhalb jedes Teilbandes vor.
- Die Mantisse ist wiedergegeben als ein ganzzahlig bewerteter, mit Vorzeichen versehener Ausdruck, der in Zweier- Komplementform ausgedrückt wird. In der Zweier-Komplementform ist das höchstwertige Bit der Mantisse ein Vorzeichenbit. Das nächsthöchstwertlge Bit stellt Daten dar und wird hier als das höchstwertige Datenbit bezeichnet. Ein Vorzeichen bit mit dem Wert Null bezeichnet eine nichtnegative Zahl; umgekehrt bezeichnet ein Vorzeichenbit mit einem Nichtnull-Wert eine negative Zahl. Von einer positiven nichtnull Mantisse wird gesagt, sie sei "normalisiert" wenn ihr höchstwertiges Datenbit nichtnull ist. Eine negativ bewertete Nichtnull- Mantisse ist normalisiert, wenn ihr höchstwertiges Datenbit Null ist. Eine normalisierte Mantisse stellt sicher, daß die größte Anzahl signifikanter Bits für die numerische Menge innerhalb der begrenzten Bitlänge der Mantisse enthalten ist.
- Der Exponent ist eine ganze Zahl ohne Vorzeichen, dessen Wert der Anzahl Rechtsverschiebungen gleicht, die nötig sind, um die normalisierte Mantisse in den wahren Wert der dargestellten numerischen Menge umzuwandeln. Der Grobpegelquantisierer berechnet die Teilbandexponenten, indem er die größte Spektralkomponente in jedem Teilband findet und die Anzahl Linksverschiebungen bestimmt, die zur Normalisierung desselben erforderlich sind. Da die Block- Fließkommadarstellung einen Exponenten für einen Block von Mantissen benutzt, sind einige Mantissen im Block unter Umständen nicht normalisiert. Die Mantisse für die Menge mit der größten Größe im Block wird normalisiert, vorausgesetzt daß sie nicht zu klein ist, das heißt der Exponent geeignet ist, die Zahl der Rechtsverschiebungen auszudrücken, die zum Konvertieren der normalisierten Menge in ihren wahren Wert erforderlich ist. Ob die Mantissen normalisiert sind oder nicht, gibt der Exponent allerdings immer wieder, wie oft die ganzzahlig bewertete Mantisse im Block nach rechts verschoben werden muß, um den wahren Wert der Fließkommamenge zu erhalten.
- Hauptexponenten sind 2-Bit ganze Zahlen ohne Vorzeichen, die benutzt werden, um den Dynamikbereich der Block- Fließkommadarstellung zu vergrößern. Jeder Hauptexponent zeigt an, ob die Teilbandexponenten innerhalb der dem Hauptexponenten zugeordneten Gruppe von Teilbändern justiert wurden, um Signalen niedrigeren Pegels gerechtzuwerden. Aus der Tabelle list zu entnehmen, daß der Hauptexponent MEXPO Teilbänder 0 bis einschließlich 16 wiedergibt. Hauptexponent MEXP1 gilt für höherfrequente Teilbänder 17 bis einschließlich 38. Wenn bei einem bevorzugten Ausführungsbeispiel der Erfindung alle Teilbandexponenten in einer Gruppe zwei oder größer sind, wird der Hauptexponent fuir diese Gruppe auf eins gesetzt, und alle Teilbandexponenten in dieser Gruppe werden um zwei verringert. Wenn alle Teilbandexponenten in einer Gruppe vier für größer sind, wird der Hauptexponent für diese Gruppe auf zwei gesetzt, und die Teilbandexponenten in dieser Gruppe werden um vier verringert. Wenn alle Teilbandexponenten in einer Gruppe sechs oder größer sind, wird der Hauptexponent für diese Gruppe auf drei gesetzt, und alle Teilbandexponenten in dieser Gruppe werden um sechs verringert. Ist ein Hauptexponent zum Beispiel auf eins gesetzt, zeigt dies an, daß alle normalisierten Mantissen innerhalb aller Teilbänder in der Gruppe zwei mal mehr nach links verschoben sind als es durch die Teilbandexponentenwerte angezeigt wird. Wenn ein Hauptexponent Null ist, gleicht jeder Teilbandexponent in der Gruppe der Anzahl Linksverschiebungen für jede normalisierte Mantisse in dem Teilband. Diese Hauptexponenten ermöglichen es, kürzere Teil bandexponenten zu benutzen, während sie gleichzeitig einen ausreichenden Dynamikbereich erlauben. Ein 4-Bit Teilbandexponent im Zusammenhang mit einem 2-Bit Hauptexponenten, die in der hier beschriebenen Weise benutzt werden, vergrößert den Dynamikbereich jeder zugehörigen Mantisse um etwa 126 dB.
- Von Teilbandexponenten, die in der beschriebenen Weise reduziert oder angepaßt wurden, um den Hauptexponentenwert widerzuspiegeln, wird gesagt, sie seien "beeinflußt"; somit gibt der Wert eines "unbeeinflußten" Exponenten genau die Anzahl Rechtsverschiebungen wieder, die erforderlich ist, um eine zugehörige normalisierte Mantisse in ihren wahren Wert umzuwandeln. Der Beeinflussungsvorgang wird von dem unten erläuterten Quantisierer 500 durchgeführt. In der ganzen folgenden Erörterung bevorzugter Ausführungsbeispiele beziehen sich die Ausdrücke "Exponent", "Teilbandexponent" und andere ähnliche Ausdrücke auf unbeeinflußte Exponenten, wenn nicht eine gegenteilige Bedeutung ausdrücklich angegeben ist.
- In anderen Ausführungsbeispielen der vorliegenden Erfindung können Spektralkomponenten in andere Formen kodiert werden, beispielsweise in einem Satz skalierter Werte mit linearen multiplikativen Skalierungsfaktoren. Es können auch andere Fließkommaformate benutzt werden. Das wesentliche des Grobpegelquantisiererprozesses besteht darin, ein grobes Maß des Teilbandgehaltes abzuleiten, beispielsweise Block- Fließkommaexponenten, sowie ein entsprechendes feineres Maß der spektralen Bestandteile innerhalb dieses Teilbandes, beispielsweise Fließkomma-- Mantissen.
- Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung lenkt der Grobpegelquantisierer Teilbandexponenten längs eines Weges 11 zum Teilbandzuteilungsschwellenschätzer 200 und längs eines Weges 13 zum adaptiven Bitzuteiler 300 und leitet die Exponenten und die nicht normalisierten Mantissen längs eines Weges 12 zum Lenk-Controller 400.
- Unter Hinweis auf Fig. 7 schätzt der Teilbandzuteilungsschwellenschätzer 200 die Zahl erforderlicher Bits für das Quantisieren jedes Teilbandes, um einen gewünschten Pegel der Signalwiedergabequalität zu erzielen. Die Schätzung erfolgt in Abhängigkeit von dem groben Maß an Teilbandinhalt, den der Grobpegelquantisierer 100 erzeugt hat und der über den Weg 11 empfangen wird. Bei einem bevorzugten Ausführungsbeispiel der Erfindung ist dieses grobe Maß der Satz der Teilband-Block-Fließkomma-Exponenten.
- Der Schätzungsprozeß ist eng verwandt mit der Art und dem Grad an gewünschter Signalwiedergabequalität; deshalb können viele P)äne zum Schätzen benutzt werden. Bei einem bevorzugten Ausführungsbeispiel werden psychoakustische Ausblendschwellen herangezogen, um Compact- Disc-Qualität in der Wiedergabe von Breitbandaudio-Mehrfachkanälen mit niedrigen Bitraten zu erzielen. Bei diesem Ausführungsbeispiel wird die für jedes Teilband zum Erreichen psychoakustischer Maskierung erforderliche Bitzuteilung anhand des Teilbandexponenten und des in Tabelle I gezeigten "Lenkschwellen"-Wertes geschätzt. Der Lenkschwellenwert basiert auf der Anzahl Bits, die für jede Spektralkomponente in einem Teilband erforderlich sind, um Quantisierungsrauschen unterhalb der Ausblendschwelle eines einzigen Sinuswellensignals zu halten, dessen Frequenz in diesem Teilband zentriert ist. Diese Werte sind konservative Zahlen, weil Breitbandaudiosignale, beispielsweise Musik normalerweise viele Spektralkomponenten enthalten und die von solchen Signalen erzeugten Ausblendeffekte größer sind als der Fall mit einer einzigen Sinuswelle. Die zum Schätzen der erforderlichen Zuteilung benutzte Formel lautet:
- E = ½(F Xj + THj) (1)
- wo E = Zuteilungsschätzung
- F = -0.4375 (ein empirisch festgelegter Faktor)
- THj = Lenkschwelle für Teilband j (siehe Tabelle I), und
- Xj = Wert des Exponenten für Teilband j.
- Der in Fig. 7 gezeigte adaptive Bitzuteiler 300 ordnet den Spektralkomponenten innerhalb der Kanäle eine variierende Bitzahl zu. Bei einem Ausführungsbeispiel der vorliegenden Erfindung werden alle Spektralkomponenten in allen Kanälen allein anhand von Bits quantisiert, die ihnen aus einem gemeinsamen Bit-Pool 350 zugeteilt werden, den sich alle Kanäle teilen.
- Ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung für Transformationskodierer schließt Transformationskoeffizienten der niedrigsten Frequenz vom adaptiven Bitzuteilungsprozeß aus und schreibt diesen eine feste Bitzahl zu. Wenn die Transformationskoeffizienten der niedrigsten Frequenz in den adaptiven Bitzuteilungsprozeß eingeschlossen werden, erzeugt ein Transformationskodierer hörbares Quantisierungsrauschen einer Frequenz, die der Teil bandblockrate gleicht, sobald ein Eingabesignal niederfrequente spektrale Komponenten enthält, deren Periode im Vergleich zur Teilbandblocklänge groß ist. Bei Annahme einer 512-Punkt Transformation mit einer Signalabtastrate von 48 kHz ist die Teilbandblockrate 93,7 Hz (oder 48 kHz/512).
- Der vorherrschende Grund besteht in der Tatsache, daß der Abschnitt des Signals, der vom Transformationskoeffizienten der niedrigsten Frequenz wiedergegeben wird, häufig unhörbar ist. Der adaptive Bitzuteilungsprozeß geht davon aus, daß jede quantisierte spektrale Signalkomponente eine gewisse Maskierung ihres eigenen Quantisierungsrauschens bietet; aber, da häufig unhörbar, kann der quantisierte Transformationskoeffizient der niedrigsten Frequenz nicht immer das eigene Quantisierungsrauschen ausblenden.
- Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung werden vom adaptiven Bitzuteilungsprozeß auch die Spektralkomponenten der niedrigsten Amplitude ausgeschlossen. Bei einem bevorzugten Ausführungsbeispiel unter Verwendung des oben beschriebenen Block-Fließkom maschemas sind die von der adaptiven Bitzuteilung ausgeschlossenen Spektralkomponenten der niedrigsten Amplitude diejenigen Komponenten, die von Mantissen innerhalb von Teilbändern wiedergegeben werden, welche einen beeinflußten Teilbandexponentenwert von 15 haben.
- Es sind viele weitere Abwandlungen in der Zuteilungstechnik möglich. Bitzuteilungen können auf der Kanalpriorität beruhen. Zum Beispiel können die Kanäle in zwei oder mehr Gruppen eingeteilt werden, wobei jede Kanalgruppe ihren eigenen Bitpool hat, dessen Größe proportional zur Priorität der zugehörigen Kanäle ist. Ferner können solche Gruppen auch aus nur einem Kanal bestehen. Darüber hinaus können ausgewählte Teilbänder aus einigen oder allen Kanälen vom adaptiven Zuteilungsprozeß ausgenommen und ihnen einfach eine feste Bitzahl übertragen werden.
- Der bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung verwandte Zuteilungsprozeß beruht auf Amplitudenwerten von Spektralkomponenten. Dieser Zuteilungsprozeß kann auf der Grundlage von Spitze-zu-Spitze- Amplitude, Quadratwurzelamplitude oder sonstige Funktionen des Signalpegels gestützt werden.
- Der Zuteilungsprozeß kann auch allein auf dem groben Maß des Teilbandinhalts beruhen. Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung ist dieses grobe Maß der vom Weg 13 erhaltene Teilbandexponent, wie in Fig. 7 gezeigt. Zur leichteren Erörterung wird dieses bevorzugte Ausführungsbeispiel herangezogen, um in den folgenden Absätzen das Zuteilungsverfahren zu beschreiben.
- Im Zuteilungsprozeß wird zunächst Xmax festgelegt, was dem Wert des größten Teilbandexponenten, folglich der kleinsten Spitzenamplitude der Spektralkomponente des Teilbandes gleicht, und zwar für alle Teilbänder in allen Kanälen. In diesem Zusammenhang und in der folgenden Erörterung gilt "alle" nur für jene Teilbänder und Kanäle, die an einem adaptiven Zuteilungsprozeß teilnehmen, bei welchem Bits aus einem gemeinsamen Bitpool zugeschrieben werden.
- Im nächsten Schritt nimmt der Zuteilungsprozeß eine "relative Zuteilung" auf die Spektralkomponenten in allen Teilbändern vor. Für jedes Teilband j wird der Wert R aus der Differenz zwischen Xmax und jedem Teilbandexponenten Xj errechnet, diese Differenz durch vier geteilt, der Quotient abgebrochen und ein Zuordnungsbasisfaktor Bj hinzugefügt, der aus einer Wertetabelle erhalten wird. Eine solche Wertetabelle für ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist in der "Zuordnungsbasis" bezeichneten Spalte in Tabelle I gezeigt.
- Begrifflich stellen die Faktoren der Zuordnungsbasis, die in Fig. 1 gezeigt sind, eine ideale Bitzuteilung für ein Breitbandsignal mit einer spektralen Komponente in jedem Teilband dar, wobei alle Komponenten von gleicher Amplitude sind. Im relativen Zuteilungsprozeß werden Teilbändern mit größeren Komponenten, das heißt Teilbändern mit kleineren Teilbandexponenten mehr Bits zugeteilt. Ein zusätzliches Bit wird einer Spektralkomponente für jede 24 dB Amplitudensteigerung, wie durch die Teilbandexponenten ausgedrückt, zugeteilt.
- Bei einem bevorzugten Ausführungsbeispiel der Erfindung unter Verwendung der oben erörterten Fließkommadarstellung gibtiede zusätzliche Verschiebung, die zum Normalisieren einer Spektralkomponenten-Mantisse erforderlich ist, eine Abnahme der Spektralamplitude um etwa 6 dB wieder. Die Amplitude einer normalisierten Spektralkomponente mit einem Fließkommaexponenten entsprechend 0101&sub2; ist zum Beispiel um etwa 6 dB größer als die Amplitude einer normalisierten Komponente mit einem Exponenten, der 0110&sub2; gleicht. Eine Differenz von vier zwischen den Werten von zwei Teilbandexponenten gleicht etwa einem Unterschied von 24 dB in den Amplituden ihrer jeweiligen spektralen Komponenten.
- So wird zum Beispiel allen Spektralkomponenten im Teilband Y, deren Teilbandexponent einen Wert von vier weniger als der Teilbandexponent für das Teilband Z hat, ein Bit mehr zugeteilt als den Spektralkomponenten im Teilband Z. Ist der Unterschied zwischen den Exponenten acht, so werden zwei zusätzliche Bits zugeteilt.
- Wenn die relative Zuteilung beendet ist, wird an der Gesamtzuteilung eine Justierung vorgenommen, um sicherzustellen, daß die Gesamtzahl zugeteilter Bits der Gesamtzahl für die Zuteilung verfügbarer entspricht. Die Zuteilungsjustierung legt einen Anpassungswert A fest, indem die Gesamtanzahl der für die Zuteilung verfögbaren Bits hergenommen, davon die Gesamtzahl durch relative Zuteilung zugeteilter Bits subtrahiert wird, die Differenz durch die Zahl aller Spektralkomponenten dividiert wird, die an der adaptiven Bitzuteilung teilnehmen, der Quotient auf die nächstniedrige ganze Zahl abgerundet und das Ergebnis zu der relativen Zuteilungszahl für jede Spektralkomponente addiert wird. Es ist zu beachten, daß der Anpassungswert A entweder eine positive oder eine negative Zahl ist, je nach dem ob die relative Zuteilung weniger oder mehr Bits zuteilte als für die adaptive Zuteilung verfügbar waren.
- Die Zahl der jeder Spektralkomponente zugeteilten Bits gleicht der algebraischen Summe Rj+A. Siehe Gleichungen 2a und 2b.
- wo A = Zuteilungsanpassung,
- Bj = Zu ordnungsbasisfaktor (siehe Tabelle I),
- M = Anzahl der Spektralkomponenten in allen Teilbändern,
- Nj = Anzahl der Spektralkomponenten im Teilband j über alle Kanäle hinweg,
- Rj = relative Zuteilung zu jeder Spektralkomponente im Teilband j,
- SB = Anzahl der Teilbänder,
- T = Anzahl der für die adaptive Zuteilung verfügbaren Bits,
- Xj = Exponentenwert für Teilband j,
- Xmax = Wert des größen Teilbandexponenten über alle Kanäle hinweg,
- FLOOR[x] erhält die größte ganze Zahl, nicht größer als x, und
- INT[x] erhält den ganzzahligen Teil von x.
- Insgesamt bleiben einige Bits nach der Zuteilungsjustierung übrig, weil die FLOOR-Funktion in der Gleichung 2b Bitbruchteile pro Teilband an den Bitpool zurückgibt. Die restlichen Bits können auf eine von verschiedenen Arten zugeteilt werden. So können sie zum Beispiel dadurch zugeteilt werden, daß ein zusätzliches Bit Spektralkomponenten über alle Kanäle hinweg zugeschrieben wird, beginnend mit den niedrigstfrequenten Komponenten und fortschreitend zu Komponenten höherer Frequenz, bis alle verbliebenen Bits zugeschrieben sind. Wenn den Signalen in bestimmten Kanälen höhere Priorität gegeben wird, können die verbliebenen Bits Spektralkomponenten in den Kanälen höherer Priorität zugeordnet werden. Wenn das Kodierersystem mit invariabler Länge kodierten Signalen arbeiten kann, können die restlichen Bits zurückgehalten und dem Bitpool für das Quantisieren nachfolgender Teilbandblöcke hinzugefügt werden. Es sind viele weitere Abwandlungen möglich.
- Bei einem Ausführungsbeispiel wird der Anzahl Bits, die jeder Spektralkomponente zugeteilt werden können, eine Decke auferlegt. Ein bevorzugter wert für diese Decke für ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist 9 Bits pro Transformationskoeffizient.
- Der oben beschriebene Bitzuteilungsprozeß für ein bevorzugtes Ausführungsbeispiel der Erfindung kann abgewandelt werden, ohne die vorliegende Erfindung zu verlassen. Bits können Teilbändern mit einer anderen Rate zugeteilt werden als mit einem Bit pro 24 dB Amplitudenzuwachs, wie oben erörtert. Ferner kann eine veränderliche Zuteilungsrate als Funktion der Teilbandfrequenz benutzt werden. Durch Benutzung eines Wertes von 6 beispielsweise für den Nenner in der Gleichung 2a für niederfrequente Teilbänder unterhalb einer innerhalb des Bereichs von 1 kHz bis 4 kHz gewählten Frequenz kann eine relative Zuteilung von einem Bit pro 36 dB Amplitudenzuwachs spektralen Komponenten in jenen Teilbändern für Audioanwendungsfälle zugeteilt werden, bei denen die niederfrequenten spektralen Komponenten für die wahrgenommene Signalqualität sehr wichtig sind.
- Es wird nachfolgend ein Teilbandlenkungsverfahren beschrieben, welches sich in Abhängigkeit von adaptiven Bitzuteilungserfordernissen anpaßt. Wenn ein Kodierer mit einem solchen Teilbandlenkungsverfahren arbeitet, kann der adaptive Bitzuteilungsprozeß erneut aufgerufen werden, um Bits nur den ungelenkten Teilbändern und den Teilbändern im Mischkanal zuzuordnen. Bei einem bevorzugten Ausführungsbeispiel der Erfindung erfolgt der adaptive Bitzuteilungsprozeß in Abhängigkeit von Lenksteuerkennzeichen und zusammengesetzten Teilbandexponenten, die von dem Lenk-Controller 400 längs eines Weges 46 erhalten werden, und die Exponenten für jene Teilbänder, die nicht kooridiniert sind, vom Weg 13 erhalten werden.
- Sobald der Teilbandzuteilungsschwellenschätzer 200 abschätzt, daß mehr Bits erforderlich als verfügbar sind, um einen Teilbandblock zu kodieren, damit ein gewünschtes Niveau an Kodiergenauigkeit erreicht wird, gelenkt der Lenk-Controller 400 eines oder mehrere Teilbänder zur Reduzierung der Anzahl der zum Kodieren des Teilbandblocks erforderlichen Bits. Ohne eine Teilbandlenkung in diesen Fällen müssen einer oder mehreren Spektralkomponenten in dem Teilbandblock weniger Bits zugeteilt werden als von dem Teilbandzuteilungsschwellenschätzer als notwendig angezeigt. Das kann hörbares Quantisierungsrauschen hervorrufen. Wenn eine ausreichende Anzahl Bits für die Zuteilung zu allen spektralen Komponenten zur Verfügung steht, ist eine Teilbandlenkung nicht erforderlich.
- Der Teilbandlenkungsprozeß kombiniert die Spektralkomponenten eines Teilbandes aus Mehrfachkanälen, um ein zusammengesetztes Einkanalteilband zu schaffen, wodurch die Anzahl der Spektralkomponenten, die quantisiert und übertragen werden müssen, verringert wird. Ein Lenksteuersignal, welches Informationen über die Spektralkomponentenpegel jedes Kanals in einem gelenkten Teilband übermittelt, wird mit den kodierten Mischkanal- Spektralkomponenten weitergeleitet, damit der empfangende Dequantisierer Spektralkomponenten für jeden Kanal zurückgewinnen kann. Es sollte bemerkt werden, daß im allgemeinen die aus dem Mischkanal zurückgewonnenen Spektralkomponenten nicht identisch sind mit den Spektralkomponenten, die ein Empfänger aus Einzelkanälen ohne Teilbandlenkung dekodiert. In vielen Fällen verursacht jedoch die Anwendung der Teilbandlenkung, insbesondere einer unten erörterten adaptiven Teilbandlenkung keine merkliche Veränderung im zurückgewonnenen Signal.
- Jene Bits, die durch das Kodieren eines Mischkanalteilbandes statt der Kodierung eines Teilbandes für einzelne, nicht gelenkte Kanäle eingespart werden, können im adaptiven Bitzuteilungprozeß für die Zuordnung zu anderen Teilbändern benutzt werden.
- Bei einem bevorzugten Ausführungsbeispiel der Erfindung zum Quantisieren von Breitbandaudiosignalen werden Teilbänder, die Spektralkomponenten enthalten, deren Frequenzen niedriger sind als eine Grenzfrequenz innerhalb des Bereichs von ca. 1 bis 2 kHz von der Lenkung ausgeschlossen. Genauer gesagt werden für eine Gruppierung von Transformationskoeffizienten bei dem auf Tranformation beruhenden Ausführungsbeispiel zu Teilbändern, wie in der Tabelle I gezeigt, die Teilbandnummern Null bis sechzehn von der Lenkung ausgenommen. Es sind auch weitere Abwandlungen, beispielsweise das Ausschließen eines oder aller Teilbänder aus Kanälen mit hoher Priorität oder das Einschließen aller Teilbänder in allen Kanälen in den Lenkprozeß möglich und weichen nicht vom Umfang der vorliegenden Erfindung ab. In den nachfolgenden Absätzen werden die Ausdrücke "alle Teilbänder" und "alle Kanäle" so benutzt, daß sie sich nur auf alle Teilbänder und Kanäle beziehen, die am Lenkprozeß teilnehmen.
- Wenn eine Teilbandlenkung erforderlich ist, werden im ersten Schritt des Lenkverfahrens diejenigen Teilbänder ausgewählt, die gelenkt werden sollen. Bei einem bevorzugten Ausführungsbeispiel der Erfindung werden zu den für die Lenkung gewählten Teilbändern gehörende Informationen längs eines weges 41 als Satz von Lenksteuerkennzeichen weitergeleitet. Die Lenksteuerkennzeichen und Mischteilbandexponenten werden dem adaptiven Bitzuteiler 300 längs eines Weges 46 zur Bitneuzuteilung zugeführt.
- Es sind viele verschiedene Wahlprogramme möglich, aber insgesamt beruht die Wahl auf einem oder mehreren der folgenden Faktoren: aus einem Weg 21 erhaltenen Zuteilungsschwelleninformationen; aus einem Weg 31 erhaltenen Informationen über tatsächliche Bitzuteilungen, die ohne Teilbandlenkung stattfinden werden oder stattgefunden haben; aus einem Weg 12 erhaltenen Informationen über das Spektralkomponentenniveau.
- Bei einem Schema werden alle Teilbänder gewählt, die nicht auf andere Weise mindestens die Schwellenbitzahl erhalten. Eine Variation dieses Verfahrens wählt all jene Teilbänder aus, die ansonsten nicht mindestens die Schwellenbitzahl erhalten, und zwar beginnend mit den Teilbändern, in denen Kodierungenauigkeiten am wenigsten anstößig sind. So kann beispielsweise die Lenkung mit dem Teilband der höchsten Frequenz beginnen und sich in der Frequenz nach unten vorarbeiten, bis ausreichend viele Bits verfügbar sind, um den Bitzuteilungsprozeß für alle anderen Teilbänder zu vervollständigen.
- Bei einem anderen Schema werden Teilbänder nur aus Kanälen niedriger Priorität gewählt. Bei manchen Mehrfachkanal- Audioanwendungen ktnnen gewisse Kanäle Signale führen, die vor einer Zuhörerschaft präsentiert werden sollen, während andere Kanäle Signale führen, die der Seite oder der Rückseite einer Zuhörerschaft präsentiert werden sollen. In solchen Fällen kann den vorderen Kanälen eine höhere Priorität zugeteilt werden, und deshalb sind sie die letzten Kanäle für die Teilnahme an der Teilbandlenkung. Natürlich können, wie oben erörtert, Kanäle hoher Priorität auch vom Lenkverfahren ausgeschlossen werden.
- Gemäß noch einem weiteren Schema werden Teilbänder auf der Basis des Verhältnisses der Spektralkomponentenpegel zwischen den Kanälen mit der größten Spektralkomponente innerhalb eines gegebenen Teilbandes und allen anderen Kanälen für das Teilband gewählt. Entsprechend einem Ansatz werden Teilbänder mit den größten Verhältnissen zwischen Kanälen als erstes für die Lenkung unter der Annahme ausgewählt, daß Teilbänder mit solchen Verhältnissen weniger leicht Fehlern unterliegen, die durch eine außer Phase-Signallöschung verursacht werden. Teilbänder mit Komponenten außer Phase können auch adaptiv von der Lenkung ausgeschlossen werden. Gemäß einem anderen Ansatz werden diejenigen Teilbänder mit den größten Verhältnissen als letztes für die Lenkung gewählt unter der Annahme, daß die Lenkung von Teilbändern mit kleinen Verhältnissen die geringste Änderung in objektiven Maßen der Lokalisierung verursachen wird.
- Im zweiten Schritt des Lenkverfahrens werden Mischkanalteilbänder durch Kombinieren der Spektralkomponenten der für die Lenkung ausgewählten einzelnen Teilbänder aus gelenkten Kanälen geschaffen. Ein bevorzugtes Verfahren setzt jeden Spektralkomponentenwert im zusammengesetzten Teil band so fest, daß er dem Durchschnitt der entsprechenden Spektralkomponentenwerte in den gelenkten Kanälen gleicht. Alternative Maßnahmen können andere lineare Kombinationen oder gewichtete Summen der Spektralkomponentenwerte in den gelenkten Kanälen erzeugen. Gemäß diesem bevoizugten Verfahren können Spektralkomponenten in jedem Mischteilband die Amplitude von spektralen Komponenten in den gelenkten Kanälen stark verfälscht wiedergeben. So kann sich zum Beispiel in einer Fünfkanalanlage, in der nur einer der Kanäle ein Signal führt, eine Mischteilbandspektralkomponente von der gelenkten Spektralkomponente um bis zu 14 dB (20 log&sub1;&sub0;5) unterscheiden. Wenn adative Bitzuteilungsentscheidungen auf der Basis von Teilbandexponentenwerten getroffen werden, können die Teilbandexponenten für ein Mischteilband, die in der gleichen Weise wie für die ungelenkten Kanalteilbänder festgelegt wurden, adaptive Bitzuteilungen wesentlich und nachteilig beeinflussen. Zur Lösung dieses Problems kann eine von verschiedenen Techniken herangezogen werden.
- Zunächst kann der tatsächliche Spitzenwert jeder Spektralkomponente über alle gelenkten Kanäle hinweg benutzt werden, um die Bitzuteilungsentscheidung zu informieren. Allerdings wird durch diese Technik die Menge an Nebeninformationen vergrößert, die einem begleitenden Dekodierer zugeleitet werden müssen. Zweitens kann der Exponent für ein Mischteilband so festgesetzt werden, daß er dem Exponenten des Teilbandes des gelenkten Kanals gleicht, welches die größte spektrale Komponente über die gelenkten Kanalteilbänder hinweg enthält; aber bei dieser Technik wird das Quantisierungsrauschen verstärkt, weil eine Normalisierung der spektralen Komponenten des zusammengesetztes Teilbandes verhindert wird. Drittens kann die relative Zuteilung (siehe Gleichung 2a oben) für jede Spektralkomponente in allen Mischteilbändern um ein oder mehr Bits vergrößert werden. Das läßt sich erreichen, wenn eine Tabelle für zusammengesetzte Teilbänder benutzt wird, die sich von der für ungelenkte Teilbänder unterscheidet (zum Beispiel siehe Tabelle I), um den Zuordnungsbasisfaktor B fest zulegen, oder es läßt sich erreichen durch Addieren entweder einer im voraus festgelegten oder einer adaptiven Zahl Bits zur Bitzahl, die ansonsten ungelenkten Kanalteilbändern zugeteilt wird.
- Mit dieser dritten Technik können einerseits mehr Bits als nötig in denjenigen Fällen zugeteilt werden, wo die spektrale Information über die Teilbänder der gelenkten Kanäle verhältnismäßig gleichförmig ist. Andererseits werden mit dieser Technik unter Umständen nicht genügend Bits für Anlagen mit fünf Kanälen oder mehr in denjenigen Fällen zugeteilt, in denen nur ein Kanal innerhalb eines Teilbandes spektrale Energie enthält. Allerdings ist dies gewöhnlich kein Problem, weil derartige Teilbänder selten gelenkt werden, es sei denn es würde eine nichtadaptive Lenkung angewandt. Infolgedessen bekommt man mit dieser dritten Technik insgesamt gute Ergebnisse in Hörversuchen, und sie wird wegen ihrer Einfachheit bevorzugt.
- Wenn nicht das Verfahren der Wahl von Teilbändern für die Lenkung die Wahl von Kanälen mit Spektralkomponenten außer Phase vermeidet, werden mit dem bevorzugten Verfahren der Schaffung spektraler Komponenten zusammengesetzter Teilbänder aus dem Durchschnitt entsprechender Spektralkomponenten in den gelenkten Kanälen die außer Phase befindlichen Spektralkomponenten subtraktiv kombiniert, wodurch in dem Darstellungssignal ein Signalverlust erzeugt wird, der hörbar sein kann. Das Verfahren der Schaffung des zusammengesetzten Teilbandes kann einen solchen Signalverlust dadurch vermeiden, daß eines von verschiedenen Kompensationsprogrammen für den außer-Phasezustand inkorporiert wird.
- In der ganzen folgenden Erläuterung von Kompensationsschemata soll der Ausdruck SUM(k)c die Summe der Spektralkomponente k mit jedem von c Kanälen oder
- darstellen,
- wo c = Zahl der in der Teilsumme eingeschlossenen Kanäle,
- i {Satz gelenkter Kanäle}, und
- SC(k)i = Amplitude der Spektralkomponente k im Kanal i.
- Folglich ist SUM(k)c eine Teilsumme in dem Sinne, daß die "vollständige" Summe SUM(k) die Spektralkomponenten aller Kanäle einschließt, die in den Lenkprozeß eingeschlossen sind, oder
- wo CC = Anzahl der in das Lenkverfahren eingeschlossenen Kanäle.
- Ein erster außer-Phase-Ausgleichsplan stellt sicher, daß jeder durchschnittliche Spektralkomponentenwert im Mischkanalteilband nicht wesentlich geringer ist als die größte der entsprechenden individuellen Spektralkomponenten. Wenn ein Bruchteil des absoluten Wertes von SC(k)max, welches die Spektralkomponente mit der größten Größe k über alle gelenkten Kanäle hinweg ist, größer ist als der absolute Wert der entsprechenden Summe von Spektralkomponenten SUM(k), wird der Bruchteil der Spektralkomponente größter Größe als die Spektralsumme herangezogen. Das läßt sich darstellen als
- wo F = ein Faktor im Bereich von 2 bis CC, der Anzahl der im Lenkprozeß eingeschlossenen Kanäle. Bei diesem Schema wird die Anzahl der erforderlichen Bits für die Darstellung des kodierten Signals nicht erhöht; aber ein Begleitdekodierer kann veranlaßt werden, abrupte Phasenänderungen in dem wiedergegebenen Signal zu erzeugen. Auch wenn das menschliche Ohr verhältnismäßig unempfindlich gegenüber Phasenänderungen in Spektralkomponenten oberhalb etwa 2 kHz ist, können diese Änderungen in der Phase in Situationen wahrnehmbar sein, wo sie auch abrupte Änderungen in der Mischkanalamplitude hervorrufen, die hörbar sind.
- Ein zweites außer-Phase-Ausgleichsschema kehrt die Phase der Spektralkomponenten eines Kanals um, ehe es sie zu einem Mischkanal kombiniert, wenn festgestellt wird, daß weniger Löschung im Vergleich zu der Löschung ohne Phasenumkehr stattfindet. Die Verwendung der Phasenumkehr wird als Nebeninformation an den Begleitdekodierer weitergeleitet, der die richtige Phase für jeden Kanal wiederherstellen kann.
- Bei einem bevorzugten Ausführungsbeispiel wird die relativen Beträge der außer-Phase-Aufhebung anhand der Durchführung von zwer Zwischenrechnungen bestimmt, wenn die Spektralkomponenten jedes Kanals mit ihren entsprechenden Partialsummen kombiniert werden. Die erste, unten durch Gleichung 3d wiedergegebene Zwischenrechnung legt ein erstes inneres Produkt eines ersten Wertesatzes fest, der durch Addieren jeder der Spektralkomponenten im cten Kanal zu den entsprechenden Spektralkomponententeilsummen gebildet wird. Mit der zweiten, durch die Gleichung 3e wiedergegebenen Zwischenrechnung wird ein zweites inneres Produkt eines zweiten Wertesatzes festgelegt, der durch Subtrahieren jeder der Spektralkomponenten im cten Kanal von den entsprechenden Spektralkomponententeilsummen gebildet wird. Die inneren Produkte werden durch Berechnen von
- festgelegt, wo
- IP1c = erstes Innenprodukt für die ersten c Kanäle,
- IP2c = zweites Innenprodukt für die ersten c Kanäle,
- k {Satz von Spektralkomponenten in allen gelenkten Teilbändern}, und
- SM = Anzahl der im Lenkprozeß eingeschlossenen Spektralkomponenten
- Ist das zweite Innenprodukt größer als das erste Innenprodukt, wird das zweite Innenprodukt als neue Partialsumme benutzt und einem Begleitdekodierer ein Hinweis gegeben, daß die Phase des cten Kanals umgekehrt worden ist. Ansonsten wird das erste Innenprodukt als neue Partialsumme herangezogen und ein Hinweis weitergeleitet, daß die Phase des cten Kanals nicht umgekehrt wurde.
- Dieses Schema erfordert nur eine mäßige Zunahme von einem Bit pro Kanal, kann aber trotzdem viele Signalverluste aufgrund der außer-Phase-Aufhebung angemessen ausgleichen. Das Inkrement der Kompensation kann dadurch verkleinert werden, daß die Anzahl Bits erhöht wird, die für die Weiterleitung der Phasenänderungsinformation an einen Dekodierer benutzt werden. So ermöglichen es zum Beispiel zwei Bits pro Kanal dem Kodierer, individuelle Kanaiphase in Inkrementen von 90º einzustellen.
- Die Fähigkeit zur Vornahme von Phaseneinstellungen hängt teilweise von der Verwirklichung der im Zusammenhang mit der vorliegenden Erfindung benutzten Filterbank ab. Phaseneinstellungen können leicht gemacht werden, wenn Filterbänke durch komplexbewertete transformierte, wie DFT verwirklicht sind. Für Filterbänke, die durch eine TDAC- Transformation verwirklicht sind, ist jedoch jegliche Phaseneinstellung außer einer einfachen Umkehr schwieriger.
- Für die von Princen und Bradley beschriebene, gleichmäßig gestapelte TDAC-Transformation kann 40 eine Einstellung ähnlich einer 90º Phasenänderung dadurch bewerkstelligt werden, daß Spektral komponenten zwischen einanderbenachbarten Teilbandblöcken ausgetauscht werden. Im einzeinen. weist dieae TDAC-Transformation die alternierende Anwendung einer modifizierten DCT und einer modifizierten DST auf. Ein Austausch von Transformationskoeffizienten zwischen einanderbenachbarten DCT-Blöcken und DST-Blöcken würde sich einer 90º Phasenänderung annähern.
- Es ist nicht wichtig, ob die Änderung tatsächlich eine 90º Phasenänderung ist oder nicht. Wichtig ist, daß Spektralkomponenten während des Kodierungsverfahrens auf eine Weise kombiniert werden, die eine außer-Phase-Aufhebung vermeidet und doch eine ordnungsgemäße Rekonstruktion mittels eines Dekodierungsverfahrens erlaubt. Bei Verwendung von nur zwei Bits pro Kanal kann ein TDAC-Kodierer einem Begleitkodierer anzeigen, in welcher von vier Arten er Kanäle kombiniert hat: 1.) ohne Phasenumkehr innerhalb des gleichen Teilbandblocks, 2.) mit Phasenumkehr innerhalb des gleichen Teilbandblocks, 3.) ohne Phasenumkehr aber mit Austausch zwischen einanderbenachbarten Teilbandblöcken und 4.) mit Phasenumkehr und mit Austausch zwischen einanderbenachbarten Teilbandblöcken. Ein Begleit-TDAC-Dekodierer kann den Prozeß umkehren, um die gelenkten Kanäle ordnungsgemäß zu rekonstruieren.
- Der Austausch von Spektralkomponenten zwischen einanderbenachbarten Teilbandblöcken ist besonders attraktiv bei Ausführungsbeispielen der vorliegenden Erfindung, die im Zusammenhang mit TDAC-Filterbanken benutzt werden, bei denen das modifizierte DCT und das modifizerte DST gleichzeitig durchgeführt wird. Eine solche Verwirklichung ist in der internationalen Veröffentlichung Nr. WO 90/09022 näher beschrieben, auf die oben schon Bezug genommen wurde.
- Ein drittes Schema zum Ausgleich des außer-Phase-Zustandes ähnelt dem zweiten, oben erörterten Schema, außer daß die Berechnung von Innenprodukten und die Phaseneinstellung der Spektralkomponenten eines Kanals unabhängig für jedes in den Lenkprozeß eingeschlossene Teilband durchgeführt wird. Bei einem bevorzugten Ausführungsbeispiel, wie dem in Tabelle I gezeigten, wo nur Spektralkomponenten oberhalb etwa 2 kHz in die Lenkung eingehen, werden zweiundzwanzig Teilbänder pro Kanal in das Lenkverfahren eingeschlossen. Deshalb erfordert eine 5-Kanalanlage zur Weiterleitung von Teilbandphasenumkehrinformationen an einen Dekodierer achtundachtzig Bits Nebeninformation.
- Es sollte für den Fachmann einzusehen sein, daß die vorliegende Erfindung die drei Kompensationsschemata in verschiedenen Kombinationen nutzen kann.
- Im dritten Schritt des Lenkverfahrens wird das Lenksteuersignal konstruiert, welches vom Dequantisierungsverfahren in einem Empfänger benutzt wird, um die Spektralkomponenten des gelenkten Kanals vom Mischkanal wiederzugewinnen. Dafür sind viele Methoden möglich.
- Bei einem Ausführungsbeispiel des Typs I der vorliegenden Erfindung repräsentiert das Lenksteuersignal ein aus der Amplitude berechnetes Niveau oder alternativ die Leistung der Spektralkompqnenten in jedem Teilband für alle gelenkten Kanäle. Ein "errechneter Pegel" eines Kanals für ein bestimmtes Teilband kann vom Spitzenwert, vom Durchschnitt oder einer sonstigen linearen Kombination oder gewichteten Summe der Spektralkomponenten innerhalb dieses Teilbandes für diesen Kanal erhalten werden. Bevorzugt wird ein errechneter Pegel, der aus der durchschnittlichen Amplitude des zusammengesetzten Teilbandes erhalten wurde, um Artefakte in dem von einem Begleitdekodierer erhaltenen Signal zu vermeiden, die sich als subtiler "Zwitscher"-Ton manifestieren.
- Ein Verfahren des Typs I konstruiert einen Vektor aus Elementen für jedes gelenkte Teilband, welches die Differenz im errechneten Pegel zwischen jedem gelenkten Kanal und dem Mischkanal wiedergibt. Jedes Element des Lenksteuersignalvektors entspricht einem gelenkten Kanal und gibt den Unterschied zwischen dem errechneten Pegel des Mischkanals und dem errechneten Pegel jedes gelenkten Kanals wieder.
- Ein zweites Verfahren des Typs I konstruiert einen Vektor aus Faktoren für jedes gelenkte Teil band, welches den relativen Wert des errechneten Pegeis jedes gelenkten Kanals darstellt. Jedes Element des Lenksteuersignalvektors gibt das Verhältnis zwischen dem errechneten Pegel eines gelenkten Kanals und dem errechneten Pegel des Mischkanals wieder.
- Das Konstruierverfahren sollte gewährleisten, daß die Verhältnisse nicht undefiniert oder übermäßig groß sind. Eine solche Bedingung kann bei zusammengesetzten Teilbändern eintreten, welche Spektralkomponenten in verschiedenen Kanälen wiedergeben, die wesentlich außer Phase miteinander sind. Wie oben erwähnt, kann diese Situation dadurch vermieden werden, daß Kanäle aus dem Lenkprozeß ausgeschlossen werden, wenn solche außer Phase-Bedingungen existieren oder durch die Benutzung eines Programms zum Ausgleich des Zustands außer Phase. Wenn ein solcher Ausschluß oder eine solche Kompensation allerdings nicht besteht, wird durch eine einfache aber angemessene Technik der Faktor auf einen Wert begrenzt, welcher der Anzahl Kanäle gleicht, die von dem zusammengesetzten Teilband wiedergegeben werden, wenn das Verhältnis definiert ist, und der Faktor wird auf Null gesetzt, wenn das Verhältnis undefiniert ist, das heißt wenn der errechnete Pegel des zusammengesetzten Teilbandes im wesentlichen Null gleicht.
- Ein drittes und bevorzugtes Verfahren des Typs I konstruiert einen Vektor aus Elementen für jedes gelenkte Teilband, welches den absoluten oder nichtrelativen Wert des errechneten Pegels jedes gelenkten Kanals darstellt.
- Bei einem Ausführungsbeispiel des Typs II der vorliegenden Erfindung weist das Lenksteuersignal für jedes gelenkte Teilband einen Satz aus Statistiken auf, welche die Schallfeldlokalisierungsmerkmale für dieses Teilband über alle Kanäle hinweg wiedergeben. Die Elemente im Satz stellen ein statistisches Maß der scheinbaren Richtung der Quelle eines mehrdimensionalen Schallfeldes dar. Dieser Satz kann eine oder mehrere Richtungen, die Standardabweichung und möglicherweise statistische Maße höherer Ordnung der Schallstreuung über die Richtungen einschließen. Bei einem Ausführungsbeispiel der vorliegenden Erfindung konstruiert eine grundlegende Methode einen Vektor für jedes gelenkte Teilband, welcher nur die primäre räumliche Richtung wiedergibt.
- Der Gedanke dieses grundlegenden Verfahrens ist unter Hinweis auf Fig. 9 besser zu verstehen, in der ein hypothetisches Wiedergabesystem dargestellt ist, welches fünf Darstellungskanäle aufweist. Jeder dieser hypothetischen Darstellungskanäle, die einem der Eingabekanäle entsprechen, gibt einen Lautsprecher wieder, der sich an der Oberfläche einer Einheitskugel befindet. Der beabsichtigte Zuhörer befindet sich in der Mitte der Kugel. Einer der Kanäle ist mit RF bezeichnet. Die augenscheinliche Richtung des Kanals RF für den Zuhörer ist durch einen Einheitsvektor dargestellt.
- Gemäß diesem grundsätzlichen Verfahren der Kodierung des Typs II gibt der Lenksteuersignalvektor j die Hauptrichtung des Schallfeldes für das gesteuerte Teilband j wieder. Obwohl ein kartesisches Koordinatensystem eine bevorzugte Richtungsdarstellung ist, können auch andere Darstellungen, beispielsweise Polarkoordinaten benutzt werden, ohne den Geist der Erfindung zu verlassen. Das Lenksteuersignal läßt sich ausdrücken als
- wo i = Richtungseinheitsvektor für Kanal i,
- LIij = errechneter Pegel für Teilband j im Kanal i,
- S = Gesamtzahl gelenkter Kanäle,
- = Lenksteuersignalvektor für Teilband j,
- DI = Richtungseinheitsvektoren für alle gelenkten Kanäle und
- j= errechnete Pegel für Teiband j in allen gelenkten Kanälen
- Ein Vorteil der Ausführungsbeispiele des Typs II liegt darin, daß das Kodierformat und die Biterfordernisse des Lenksteuersignals von der Anzahl der in den Lenkprozeß eingeschlossenen Kanäle unabhängig ist. Andererseits muß der Kodierlenkungsprozeß über die Anzahl und den Ort für die Schallquellen informiert werden, die von jedem der Eingabekanäle wiedergegeben sind, ebenso wie der Dekodierlenkungsprozeß über die Anzahl und Anordnung von Lautsprechern informiert werden muß, die im Empfängerdekodiersystem benutzt werden, um auf diese Weise die ursprünglichen, mehrdimensionalen Schallokalisierungsmerkmale beizubehalten. Unter Hinweis auf Fig. 7 wird dem Lenk-Controller längs Weg 2 ein Richtungsvektor i für jeden Eingabekanal bereitgestellt, der bei einem Ausführungsbeispiel des Typs II der Erfindung erforderlich ist.
- Kodierer des Typs II, die mit adaptiver Teilbandlenkung arbeiten, müssen dem Dekodierer auch für jeden Eingabekanal i den i Vektor zuleiten. Diese Information ist notwendig, damit der Dekodierer die einzelnen oder ungelenkten Kanalteilbänder zu einem Signalsatz umwandeln kann, welcher für das Darstellungssystem geeignet ist.
- Bei Beendigung des Teilbandlenkungsprozesses sollte allen Spektralkomponenten der ungelenkten Kanalteilbänder und den Mischkanalteilbändern genügend Informationskapazität zugeteilt worden sein, um sicherzustellen, daß das Lenkrauschen nicht hörbar ist. Für digitale Verwirklichungen der vorliegenden Erfindung gleicht dies der Zuteilung einer ausreichenden Bitzahl, so daß das Quantisierungsrauschen nicht hörbar ist.
- Der Quantisierer 500 bereitet eine quantisierte Darstellung des kodierten Signals für das anschließende Formatieren zu einer für die Übertragung oder Speicherung geeigneten Form vor. Der Quantisierer empfängt Lenksteuerkennzeichen längs eines Weges 41, die anzeigen, welche Teilbänder gelenkt wurden, und leitet sie längs eines Weges 51 weiter. Er quantisiert das vom Weg 42 erhaltene Lenksteuersignal und gibt die quantisierte Information längs eines Weges 52 weiter. Der Quantisierer erzeugt auch quantisierte Spektralcodewörter in Abhängigkeit von der vom Weg 43 erhaltenen groben Quantisierungsinformation und den vom Weg 44 erhaltenen Spektralkomponentenwerten und gibt die quantisierten Codewörter längs eines Weges 54 weiter. Auch die grobe Quantisierungsinformation wird quantisiert und längs eines Weges 53 weitergeleitet.
- Das Format des quantisierten Lenksteuersignals variiert entsprechend der für das Konstruieren des Lenksteuersignals angewandten Methode. Bei Ausführungsbeispielen des Typs I der Erfindung kann das als Differenz-, Absolut- oder Relativpegelvektor ausgedrückte Lenksteuersignal als ein Vektor von 8-Bitzahlen kodiert werden, die Pegel über einen ausgewählten Dynamikbereich, beispielsweise einen Bereich von 100 dB wiedergeben. Durch Verwendung dieser Zahlen als Index in einer Nachschlagetabelle kann jede 8-Bitzahl für ein logarithmisches Inkremt von .39 dB (100 dB/256) stehen.
- Bei Ausführungsbeispielen des Typs II der vorliegenden Erfindung kann ein Lenksteuersignal, welches als Richtungsvektor eines Schallfeldes ausgedrückt ist, als Block aus 4-Bit Mantissen kodiert sein, die sich einen 4-Bit Exponenten teilen. Insgesamt ist eine Mantisse für jede Dimension des Richtungsvektors erforderlich, aber dies hängt von dem für die Darstellung von Richtungen benutzten Koordinatensystem ab.
- Im Quantisierungsverfahren sind viele Variationen möglich. Bei Ausführungsbeispielen der Erfindung mit digitaler Transformation unter Verwendung der oben erörterten Block- Fließkommadarstellung empfängt der Quantisierer Spektralkomponentenmantissen vom Weg 44, normalisiert sie in Abhängigkeit von über den Weg 43 erhaltenen Teilbandexponenten, bricht die normalisierten Mantissen zu Codewörtern mit einer Bitlänge ab, die der vom Weg 45 erhaltenen Bitzuteilungsinformation entspricht, und leitet die quantisierten Codewörter längs des Weges 54 weiter. Die vom Weg 43 erhaltenen, unbeeinflußten Teilbandexponenten werden entsprechend den gleichfalls vom Weg 43 erhaltenen Hauptexponenten eingestellt oder beeinflußt. Die beeinflußten Teilbandexponenten und Hauptexponenten werden längs des Weges 53 weitergeleitet.
- Bei einem Ausführungsbeispiel der vorliegenden Erfindung können die hörbaren Effekte von Quantisierungsfehlern verringert werden, wenn jeder Spektralkomponente vor dem Quantisieren ein störungsähnliches Signal hinzugefügt wird. Die Amplitude des störungsähnlichen Signals wird für 40 jede Spektralkomponente entsprechend der dieser Spektralkomponente zugeteilten Bitzahl gewählt, so daß die durchschnittliche Amplitude des störungsählichen Signals zu dem erwarteten Quantisierfehler paßt.
- In einem System mit einer Zweierkomplementdarstellung, bei dem Mantissen von Spektralkomponenten 8 Bits lang sind, kann zum Beispiel eine Mantisse durch die Schreibweise #.#######&sub2; dargestellt werden, bei der es sich um einen Strang aus sieben binären Symbolen #, gefolgt durch den binären Punkt und ein einziges binäres Symbol # vor dem binären Punkt handelt, der das Vorzeichen wiedergibt. Jedes Symbol # kann einen Wert von entweder 0 oder 1 annehmen. Die 8-Bitmantisse 0.1100000&sub2; gibt zum Beispiel die Menge .75&sub1;&sub0; wieder. Angenommen, der Mantisse seien drei Bits zugeteilt, dann kann die Quantisierung ein Codewort der Form #.##&sub2; dadurch konstruieren, daß die 8-Bit Darstellung zu 3 Bits abgebrochen wird; damit ist der Minimal- und Maximalwert des Quantisierfehlers 0.0000000&sub2; bzw. 0.0011111&sub2;. Die hörbaren Auswirkungen dieses Quantisierfehlers können durch Addieren eines störungsähnlichen Signals zu jeder 8-Bit Mantisse vor deren Quantisierung reduziert werden. Das störungsähnliche Signal kann von einem Pseudozufallszahlgenerator erzeugt werden, der innerhalb des vom Minimal- oder Maximalquantisierungsfehler begrenzten Bereichs gleichförmig Werte generiert.
- Das Verfahren, welches das störungsähnliche Signal hervorruft, wird periodisch neu initialisiert. Die Neuinitialisierung ist durch ein im kodierten Teilbandblock enthaltenes "Rückstell"- Kennzeichen markiert, welches ein Begleitdekodierer zum Synchronieren eines komplementären Prozesses benutzen kann. Die Periode des störungsähnlichen Signals ist nicht kritisch, liegt aber vorzugsweise im Bereich von 50 Millisekunden bis zu zwei Sekunden. Kürzere Perioden können verursachen, daß der Prozeß hörbare Artefakte erzeugt. Längere Perioden verlängern die Zeitspanne, die ein Begleitdekodierer zum Initialisieren oder erneuten Initialisieren nach dem Verlust der Synchronisation braucht.
- Bei einem Ausführungsbeispiel ist das Rückstellkennzeichen ein einziges Bit. Bei einem alternativen Ausführungsbeispiel weist das Rückstellkennzeichen zwei oder mehr Bits auf, was einen Index in eine Wertetabelle bereitstellt, die als Samenkorn für einen Pseudozufallzahlgenerator benutzt wird, der das störungsähnliche Signal erzeugt.
- In Situationen, wo kein Teilbandsignal vorhanden ist, kann das störungsähnliche Signal hörbar sein, wenn nicht Spektralkomponenten in benachbarten Teilbändern es abdecken können. Deshalb kann es bei Ausführungsbeispielen der vorliegenden Erfindung, die mit einer Block- Fließkommadarstellung, wie der oben erörterten, arbeiten, wünschenswert sein, dieses Verfahren nicht zum Erzeugen eines störungsähnlichen Signals für Mantissen innerhalb von Teilbändern mit großen Exponenten zu benutzen.
- Unter Hinweis auf Fig. 8, in der die vorliegende Erfindung mit Bezug auf die Teilbanddekodierung dargestellt ist, empfängt ein adaptiver Bitzuteilungsrechner 600 grobe Quantisierungsinformation sowohl für einzelne als auch für zusammengesetzte Kanalteilbänder von einem Weg 58, Lenksteuerkennzeichen längs eines Weges 59 und die für die Zuteilung verfügbare Bitzahl längs eines Weges 65 vorn Bitpool 650. Die Zahl Bits im Bitpool 650 gleicht der Zahl Bits im Bitpool 350 des Kodierers. Der Rechner bestimmt die Anzahl der vom Kodierer für das Quantisieren jedes Spektralkomponentencodewortes benutzten Bits anhand eines Prozesses, der im wesentlichen dem Prozeß gleicht, den der adaptive Bitzuteiler 300 während des Kodierzuteilungsprozesses verwendet. Diese Information ist nötig, um das ankommende kodierte Signal aufzuteilen und die spektrale Information darin zu entpacken.
- Der Dequantisierer 700 kehrt den vom Quantisierer 500 während des Kodierverfahrens angewandten Prozeß um, um eine Annäherung jeder Spektralkomponente von den quantisierten Codewörtern zu rekonstruieren, die vom Weg 56 empfangen werden. Bei einem bevorzugten Ausführungsbeispiel der Erfindung unter Verwendung der oben erörterten Block-Fließkommadarstellung und des adaptiven Bitzuteilungsprozesses wird von einem Weg 61 Bitzuteilungsinformation empfangen, welche die Bitlängen der Codewörter bestimmt. Eine nicht normalisierte Darstellung der Mantissen der Spektralkomponenten wird unter Benutzung der Teil bandexponenten einschließlich Hauptexponenten festgelegt, die von einem Weg 57 empfangen werden. Die beeinflußten Teilbandexponenten werden in unbeeinflußte eingestellt und längs eines Pfades 72 weitergeleitet. Mit einem Verfahren umgekehrt zu dem vom Kodierquantisierverfahren benutzten wird ein Lenksteuersignal in Abhängigkeit von der vom Weg 55 erhaltenen quantisierten Lenksteuerinformation erzeugt. Vom Weg 62 empfangene Lenksteuerkennzeichen werden längs des Weges 74 zum Umkehrlenk-Controller weitergeleitet.
- In Kodiersystem ist es ein Maß für die Tontreue, wie sehr die Amplitude der dekodierten oder ausgegebenen spektralen Komponenten der Amplitude der ursprünglich eingegebenen Spektralkomponenten ähnelt oder ihnen "folgt". Insgesamt sind Diskrepanzen von nicht mehr als etwa .5 dB zwischen eingegegebenen und ausgegebenen Spektralkomponenten für viele tontreue Anwendungsfälle angemessen.
- Ein Spektralamplitudennachlauf innerhalb etwa .5 dB ist möglich für quantisierte Zweierkomplementdarstellungen von 4 Bits oder mehr; aber ein solcher Nachlauf kann für Spektralkomponenten, die in einer Zweierkomplementdarstellung unter Verwendung von 3 Bits oder weniger kodiert sind, nicht sichergestellt werden. Eine 3-Bit Zweierkomplementzahl kann acht ganzzahlige Werte von -4 bis 3. wiedergeben. Innerhalb eines Ausführungsbeispiels der vorliegenden Erfindung unter Verwendung der oben erörterten Zweierkomplementfließkommadarstellung werden Mantissen, denen 3 Bits zugeteilt sind, auf einen von acht ganzzahligen Werten quantisiert. Fig. 10a zeigt den Abbildungseffekt der Quantisierungsfunktion q(x). So werden zum Beispiel Spektralkomponenten mantissen innerhalb des Bereichs von .75&sub1;&sub0; oder 0.11&sub2; einschließlich bis zu, aber nicht einschließlich 1 .00&sub1;&sub0; zu dem ganzzahligen Wert 3 quantisiert. Mantissen innerhalb des Bereichs von .25&sub1;&sub0; oder 1.11&sub2; einschließlich bis zu, aber nicht einschließlich 0.00 werden auf den ganzzahligen Wert -1 quantisiert. Folglich können Spektralamplituden Nachlaufungenauigkeiten für die größten Spektralkomponenten, die auf 3 abgebildet sind, bis zu 1 betragen, ein Fehler von etwa 33 % oder 3.2 dB. Die relativen Quantisierungsungenauigkeiten ktnnen sogar noch größer sein für Spektralkomponenten kleinerer Amplitude.
- Eine weitere Quantisierungsfunktion ist in Fig. 10b gezeigt, in der Mantissen vor dem Quantisieren auf 3-Bit Genauigkeit gerundet werden. In diesem Fall ist jedoch der Quantisierfehler selbst für die größte Spektralkomponente immer noch 1 Teil in 6, oder etwa 1.6 dB.
- Bei einem bevorzugten Ausführungsbeispiel eines Dekodierers gemäß der vorliegenden Erfindung kann der Spektralamplitudennachlauf durch Rekonstruieren der normalisierten Mantissen mit Hilfe der einen oder anderen von zwei Techniken verbessert werden, die hier als "statistisch aufbereitete Rekonstruktion" (SER) bezeichnet werden. Mittels SER wird die subjektive Qualität des dekodierten Signals signifikant verbessert, indem die häufig durch digitale Kodiersysteme manifestierten "spröden" Charakteristiken hochfrequenter Komponenten reduziert werden.
- Die erste SER Technik (SER-1) bietet ein Substitut für die niedrigstwertigen Bits jeder Mantisse, die durch Quantisieren verlorengeht, weil nur eine begrenzte Anzahl Bits verfügbar ist, um jede Mantisse wiederzugeben. In einem System mit einer Zweierkomplementdarstellung, bei der Mantissen eine Länge von 8 Bits haben und unter der Annahme, daß einer quantisierten Mantisse drei Bits zugeteilt sind, wird beispielsweise beim Dequantisieren ohne SER-1 eine Mantisse der Form #.##00000&sub2; rekonstruiert; der Strang #.00#####&sub2; stellt also den Quantisierungsfehler dar. SER-1 geht davon aus, daß der Quantisierungsfehler bestenfalls kaum hörbar ist und daß der Fehler statistisch dem Rauschen näher ist als Tönen. Es wird bevorzugt, rauschähnliche Merkmale anzunehmen, weil additives Rauschen insgesamt weniger aufdringlich ist als additive Töne. Mittels SER-1 wird der Wert des Quantisierungsfehlers durch Erzeugen eines störungsähnlichen Signals mit der gleichen durchschnittlichen Amplitude wie der Quantisierungsfehler statistisch rekonstruiert. Für den Fall der in Fig. loa gezeigten Quantisierungsfunktion kann SER-1 durch eine Funktion verwirklicht werden, die gleichmäßig Pseudozufallszahlen innerhalb des Intervalls von und einschließlich 0.0000000&sub2; bis zu einschließlich 0.0011111&sub2; generiert. Für die in Fig. 10b gezeigte Quantisierungsform kann SER-1 durch eine Funktion verwirklicht werden, die Pseudozufallszahlen gleichmäßig innerhalb des Intervalls von und einschließlich 1.1110000&sub2; oder -.125&sub1;&sub0; bis zu, aber nicht einschließlich 0.0010000&sub2; oder +.125&sub1;&sub0; erzeugt. Es sollte für den Fachmann ersichtlich sein, daß SER-1 auch durch andere Signalgeneratoren, einschließlich Rauschgeneratoren mit anderen Amplituden, anderen Amplitudenwahrscheinlichkeitsdichtefunktionen und anderen Spektralformen verwirklicht werden kann.
- Bei einem bevorzugten Ausführungsbeispiel wird die SER-1- Technik sowohl auf den Mischkanal als auch auf die Einzelkanäle angewandt. Mittels SER-1 wird die Rekonstruktion von Mantissen in den Mischkanalteilbändern vor der Umkehrlenkung aufbereitet, wie unten erörtert. SER-1 ist auch auf die Einzelkanalteilbänder anwendbar, die durch Umkehrlenkung rekonstruiert werden.
- Bei alternativen Ausführungsbeispielen der vorliegenden Erfindung, die mit anderen Darstellungen als der oben erörterten bevorzugten Block-Fließkommadarstellung arbeiten, ist es unter Umständen nicht wünschenswert, SER-1 für Teilbänder zu benutzen, in denen wenig oder kein Signal vorhanden ist, weil sonst ein ständiges Rauschsignal von geringem Pegel erzeugt wird, welches hörbar sein kann, wenn nicht Spektralkomponenten in benachbarten Teilbändern es maskieren können.
- Mit dem zweiten SER-Verfahren (SER-2) wird der Quantisierungsfehler in einer Art und Weise komplementär zu der oben für den Kodierer beschriebenen statistisch geändert. In Abhängigkeit von einem "Rückstell"-Kennzeichen in einem kodierten Teilbandblock wird vom Dekodierer ein Prozeß neu initialisiert, der ein störungsähnliches Signal hervorruft, welches mit dem im Begleitkodierer erzeugten identisch ist. Das Signal wird so skaliert, daß es der erwarteten Amplitude des Quantisierungsfehlers entspricht und wird von jeder Spektralkomponente nach dem Dequantisieren subtrahiert. SER-2 wird nicht in Situationen verwandt, in denen der komplementäre Prozeß im Begleitkodierer nicht angewandt wurde.
- Der Umkehrlenk-Controller 800 rekonstruiert eine Einzelkanaldarstellung des Mischkanals in Abhängigkeit von einem Lenksteuersignal, Lenksteuerkennzeichen, groben Quantisierungspegeln und Spektralkomponentenwerten, die von Wegen 71 bis einschließlich 74 empfangen werden. Grobe Quantisierungspegelinformation und Spektralkomponenten für ungelenkte Teil bänder, die gleichfalls von Wegen 72 und 73 empfangen werden, werden längs eines Weges 81 zur Umkehrfilterbank weitergeleitet.
- Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung werden gelenkte Teilbänder von den Lenksteuerkennzeichen identifiziert, die vom Weg 74 erhalten werden. Spektralkomponenten für jedes der vom Mischkanal wiedergegebenen gelenkten Teilbänder werden in Abhängigkeit von dem vom Weg 71 empfangenen Lenksteuersignal, vom Weg 72 empfangenen Mischkanalteilbandexponenten und den vom Weg 73 empfangenen Mischkanalspektralkomponenten erzeugt. Insgesamt ist das Rekonstruktionsverfahren umgekehrt zu dem während des Kodierverfahrens angewandten Verfahren für die Schaffung des Lenksteuersignals. In den folgenden Absätzen werden Rekonstruktionsmethoden erörtert, die für jede der oben besprochenen Konstruktionsmethoden angewandt werden können.
- Für Ausführungsbeispiele des Typs I unter Verwendung eines Lenksteuersignals mit Differenzpegelvektor kann die Rekonstruktionsmethode Spektralkomponenten für jeden gelenkten Kanal durch algebraisches Addieren des entsprechenden Elements des Differenzpegelvektors zu dem entsprechenden Mischkanalspektralkomponentenwert generieren.
- Für Ausführungsbeispiele des Typs I, die ein Lenksteuersignal mit Relativpegelvektor benutzen, kann die Rekonstruktionsmethode Spektralkomponenten für jedes gelenkte Kanalteilband aus dem Produkt der Elemente im Relativpegelvektor und den entsprechenden Spektralkomponenten des Mischkanalteilbandes generieren.
- Für Ausführungsbeispiele des Typs I unter Verwendung eines Lenksteuersignals mit Absolutpegel kann die Rekonstruktionsmethode Spektralkomponenten für jeden gelenkten Kanal durch Multiplizieren jeder Spektralkomponente in einem zusammengesetzten Teilband mit einem Faktor generieren, der aus dem Verhältnis des entsprechenden Elements des Absolutpegelvektors zum errechneten Pegel des zusammengesetzten Teilbandes festgelegt wurde. Wenn der errechnete Pegel für jedes Mischkanalteilband nicht in dem kodierten Signal enthalten ist, muß der Umkehrlenk-Controller ihn anhand des gleichen Prozesses ableiten, der in dem Lenk-Controller des Kodierers angewandt wird, um die errechneten Pegel für jedes gelenkte Kanalteilband zu bestimmen.
- Allerdings sollte beim Bestimmen des Faktors die Rekonstruktionsmethode sicherstellen, daß das Verhältnis von Lenksteuerinformation zum errechneten Pegel des Mischteilbandes nicht undefiniert oder übermäßig groß ist. Eine solche Bedingung kann sich einstellen für zusammengesetzte Teilbänder, die Spektralkomponenten in verschiedenen Kanälen darstellen, die zueinander wesentlich außer Phase sind. Wie zuvor erwähnt, kann diese Situation dadurch vermieden werden, daß aus dem Lenkprozeß Kanäle ausgeschlossen werden, wenn ein solcher Zustand außer Phase existiert, oder daß ein Kompensationsschema für den Zustand außer Phase angewandt wird. Wenn allerdings ein solcher Ausschluß oder Ausgleich fehlt, wird mit einer einfachen aber adäquaten Technik der Faktor auf einen Wert begrenzt, der der Anzahl der durch das zusammengesetzte Teilband wiedergegebenen Kanäle gleicht, wenn das Verhältnis definiert ist, und den Faktor auf Null setzt, wenn das Verhältnis undefiniert ist, das heißt wenn der errechnete Pegel des zusammengesetzten Teilbandes im wesentlich Null gleicht.
- Ausführungsbeispiele des Typs II arbeiten mit einer Richtungsvektorform des Lenksteuersignals. Um die räumlichen Charakteristiken des kodierten Signals beizubehalten muß der Rekonstruktionsprozeß die Anzahl und den Ort der an der Dekodierörtlichkeit eingebauten Lautsprecher berücksichtigen, um die Amplitude der rekonstruierten gelenkten Kanalteilbänder einzustellen, die den Darstellungskanälen zugeführt werden. Der Richtungsvektor i für jeden Darstellungskanal i wird längs eines Weges 82 für den Umkehrlenk-Controller bereitgestellt.
- Eine bevorzugte Rekonstruktionsmethode des Typs II kann Spektralkomponenten für jeden gelenkten Kanal dadurch erzeugen, daß die Spektralkomponenten des Mischkanals einem oder mehreren Darstellungskanälen zugeteilt werden, um ein Schallfeld mit der räumlichen Orientierung und möglicherweise den Streuungsmerkmalen des durch das Lenksteuersignal repräsentierten Teilbandes zu erhalten. Die Aufteilung auf jede Spektralkomponente ist proportional zum errechneten Pegel für ihr Darstellungskanalteilband.
- Durch Anwenden der Gleichung 4 auf das Darstellungssystem läßt sich das Lenksteuersignal ausdrücken als
- worin i = Richtungseinheitsvektor für Darstellungskanal 4
- LOi,j= errechneter Pegel für Teiband j im Kanal 4
- S = Gesamtzahl gelenkter Kanäle,
- = Lenksteuersignalvektor für Teiband j,
- DO = Richtungseinheitvektoren für alle gelenkten Kanäle und
- j = errechnete Pegel für Teiband j in allen gelenkten Kanälen Kodierer des Typs II, die mit adaptiver Lenkung arbeiten, müssen die Vektoren auch an den Dekodierer weiterleiten. Die Information über den errechneten Pegel LI kann unmittelbar von den Spektralkomponenten des Einzelkanals abgeleitet werden. Folglich kann jedes unkoodinierte Teilband auf die Darstellungskanäle abgebildet werden, indem für alle Kanäle 1 die Gleichung
- erfüllt wird, wo DO -1 = Umkehrung der DO Matrix.
- Eine zusätzliche Einschränkung, die den errechneten Pegeln LO auferlegt ist, besteht darin, daß die Lautstärke des vom Darstellungssystem erzeugten Schallfeldes der Lautstärke des ursprünglichen Schallfeldes gleichen sollte. Im einzelnen unterliegt jeder j Vektor einer solchen Einschränkung, daß die Lautstärke oder der Gesamtpegel des Schallfeldes für jedes vom Darstellungssystem erzeugte Teilband dem Pegel des Teilbandes im ursprünglichen Schallfeld gleicht. Bei einem bevorzugten Ausführungsbeispiel eines Kodierers des Typs II stellt der Pegel L des zusammengesetzten Teilbandes 1 den durchschnittlichen Pegel für die koodinierten Kanalteilbänder dar, die durch das zusammengesetzte Teilband wiedergegeben werden oder
- Der Gesamtpegel für alle koodinierten, durch das zusammengesetzte Teilband dargestellten Kanäle ist SLj.
- Ausgangspegel für jeden Kanal i im Teiband j, welche die Lautstärke und die Richtungseigenschaften des ursprünglichen Schallfeldes aufrechterhalten, können durch Anpassungen am Vektor festgelegt werden, der durch Umschreiben des rechten Teils der Gleichung 5 wie folgt erhalten wird so daß für alle j
- wo j = gewünschte Anpassungen an den j Vektor,
- Kj = Länge des j Vektors und
- = ein Vektor, wie unten beschrieben.
- Der Vektor hat keine Nettorichtung, aber die Summe des absoluten Wertes seiner Elemente ist eins. Es stellt einen Satz errechneter Pegel für jeden Kanal in einem gegebenen Darstellungssystem dar, welches ein Schallfeld mit keiner Nettorichtung generiert. Der Vektor kann mittels Techniken abgeleitet werden, die ein untergezwungenes System linearer Gleichungen lösen. Siehe zum Beispiel Press,. Numerical Recipes: The Art of Scientific Computing, New York: Cambridge University Press, 1986 Folglich kann der j Vektor für jedes Teilband j durch das Lösen der wie folgt umgeschriebenen Gleichung 9 erhalten werden
- Die Richtung des Q Vektors wird durch das Produkt der &supmin;¹ Matrix und des Vektors festgelegt, die beide bekannt sind.
- Die Länge K des Vektors gibt den Unterschied zwischen dem gewünschten Pegel S Lj und dem aus Gleichung 6 erhaltenen Gesamtpegel des Schallfeldes wieder, oder
- Wie vorstehend erörtert, kann das Lenksteuersignal so konstruiert werden, daß es statistisch die Hauptrichtung des von einem gelenkten Teilband erzeugten Schallfeldes darstellt. Mit einer alternativen Methode wird ein Satz Statistiken für jedes gelenkte Teilband konstruiert, welches Mehrfachrichtungen wiedergibt. Die Zahl der Richtungen kann fixiert sein oder adaptiv auf der Disparität der Hauptrichtungen und der Amplitude des aus den Hauptrichtungen entspringenden Teilbandsignals basieren.
- Wie oben erwähnt, kann ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ein Signal mit einem Dynamikbereich von über 100 dB reproduzieren. Es ist jedoch nicht ungewöhnlich, daß es in manchen Anwendungsfällen nicht benutzt werden soll oder kann. Beispielsweise kann es ein Rundfunksender wünschen, den Dynamikbereich des übermittelten Signals zu komprimieren, um dessen Rauschabstand zu verbessern, und der Besitzer eines Filmtheaters mit hohem Umgebungslärm zieht es unter Umständen vor, Kinofilmtonspuren zu komprimieren, damit sanftere Tonspurpassagen hörbar werden. Auch selektive Kanalverstärkung kann erwünscht sein, um einen Ausgleich für Raumakustik oder Merkmale des Darstellungssystems zu schaffen.
- Auch wenn es möglich ist, herkömmliche Signaldynamikpresser, Dynamikdehner und Verstärker zum Anpassen des Dynamikbereichs und der Verstärkung eines Signals zu benutzen, ehe es kodiert wurde oder auch nachdem es dekodiert wurde, können solche Änderungen durch ein Ändern der Teilbandexponenten vom Kodierer nach dem Kodieren und/oder vom Dekodierer vor dem Dekodieren vorgenommen werden.
- Eine Abnahme von zwei-zu-eins im Dynamikbereich kann zum Beispiel dadurch erzielt werden, daß jeder Teilbandexponent durch zwei dividiert wird. Eine 6 dB-Verstärkung kann verwirklicht werden 4q durch das Addieren von eins zu jedem Teilbandexponenten. Ferner können solche Anpassungen an ausgewählten Teilbändern und/oder Kanälen in ähnlicher Weise vorgenommen werden, wie es durch Vielfachbandentzerrer geschieht, indem solche Änderungen auf ausgewählte Kanal/Teilband-- Exponenten beschränkt werden.
- Von einem Kodierer am Dynamikbereich eines kodierten Signals vorgenommene Anpassungen können durch einen Begleitdekodierer wieder revidiert werden, wenn die Merkmale der Anpassung zuvor dem Dekodierer bekannt sind oder dem Dekodierer über Nebeninformationen im kodierten Signal verfügbar gemacht werden.
- Die vorliegende Erfindung kann benutzt werden, um mehrfache Kanäle von Information zu kodieren, die mit Blöcken anderer Information verzahnt ist, bei der es sich entweder um mit der Mehrfachkanalinformation verwandte oder nichtverwandte handeln kann. Wie oben erörtert, wird die kodierte Mehrfachkanalinformation zu etwas kodiert, was als Teilbandblöcke bezeichnet wird. Auf die zusätzlichen verzahnten Blöcke wird hier als Hilfsblöcke verwiesen.
- Hilfsblöcke ähneln Teilbandblöcken, sind aber Blöcke, die von einem Kodierer und Dekodierer zusätzlich zu den Teilbandblöcken verarbeitet werden können, welche für die Darstellung der Mehrfachkanalinformation erforderlich sind. Die Teilbandblockrate für jeden Kanal bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung beträgt 93.75 Hz (48000 Abtastungen pro Sekunde/512 Abtastungen pro Block). Ein gemäß diesem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung verwirklichtes Kodier/Dekodiersystem, welches Teilbandblöcke mit einer Geschwindigkeit von mehr als 93.75 Hz verarbeiten kann, sind auch in der Lage, Hilfsblöcke zu verarbeiten. Für andere Ausführungsbeispiele kann die Teilbandrate unterschiedlich sein.
- In jeden Block kann ein spezieller Schlüssel eingesetzt werden, der es dem Dekodierer ermöglicht, zu erkennen, welche Blöcke Teilbandblöcke und welche Hilfsblöcke sind. Ferner können Hilfsblöcke, die für andere Zwecke beabsichtigt sind, mit anderen Schlüsselwerten bezeichnet sein. Zum Beispiel könnten 4 Bits jedes Blocks den Blocktyp 0000&sub2; für Teilbandbiöcke und 0001&sub2; bis einschließlich 1111&sub2; jeden von 15 unterschiedlichen Hilfsblocktypen bezeichnen.
- Gemäß einer Alternative kann jeder Block eine Blockzahl enthalten, die zum Beispiel 7 Bits mit Inkrementen von 0 bis 127 aufweist und dann wiederum zu 0 umläuft. Es kann ein Schema errichtet werden, in dem gewisse Blockzahlen für Hilfsblöcke reserviert sind. Für den Fachmann sollten viele weitere Variationen offensichtlich sein.
- Bei Kinofilmanwendungen beispielsweise kann die vorliegende Erfindung benutzt werden, um Mehrfachkanäle von Audioinformation synchron mit dem Bild auf den Film digital zu kodieren. Die Wahl der zum Anbringen des kodierten Signals auf dem Film angewandten Technik ist hier nicht relevant und geht über den Bereich der vorliegenden Erfindung hinaus. Eine Standardfilmgeschwindigkeit beträgt 24 Bildfelder pro Sekunde; deshalb sind etwa 3.9 Teilbandblöcke pro Bildfeld erforderlich, um eine Teilbandblockrate von 93.75 Hz zu verwirklichen. Das Kodieren einer beliebigen Zahl von Blöcken über 3.9 Blöcke pro Bildfeld hinaus bietet überschüssige Kapazität, die für Hilfsblöcke verwendet werden kann.
- Wenn für jedes Bildfeld vier Blöcke kodiert werden, enthält ein vier Sekunden langes Segment des Film, welches 96 Bildfelder enthält, auch 384 kodierte Blöcke. Innerhalb dieses vier Sekunden Segments sind nur 375 Teilbandblöcke für die Darstellung von Audioinformation nötig. Die restlichen 9 Blöcke, die Hilfsblöcke, können für einen beliebigen Zweck herangezogen werden, der mit der Audioinformation oder dem Bild in Zusammenhang steht oder auch nicht. Bei einem Ausführungsbeispiel der Erfindung weist jedes Segment aus 128 Blökken eine feste Sequenz von 42 Teilbandblöcken, 1 Hilfsblock, 42 Teilbandblöcken, 1 Hilfsblock, 41 Teilbandbiöcken und 1 Hilfsblock auf. Es sollte für den Fachmann offensichtlich sein, daß auch andere feste Sequenzen oder adaptive Sequenzen möglich sind, und daß eine andere Zahl als vier Teilbandblöcke pro Bildfeld kodiert werden kann.
- Die Hilfsblöcke können allgemeine Informationen über den vom Dekodierer benötigten Kodierprozeß enthalten, beispielsweise die Gesamtzahl Kanäle, die Größe des Bitpools für die adaptive Zuteilung und die räumliche Orientierung des Lautsprechersystems, von dem der Kodierer ausgeht. Diese Hilfsblöcke können am Beginn jeder Spule oder über den ganzen Film hinweg kodiert sein, um entweder den Neuanlauf eines Films in der Mitte einer Spule zu erleichtern oder vom Kodierer benutzte adaptive Information zu vermitteln.
- Die Hilfsblöcke können andere zum Film gehörige Informationen führen, beispielsweise Filmprojektorsteuerungen, Filmeditierinformationen sowie Information zum Laden in mittels Software gesteuerte Vorrichtungen. Beispielsweise können Programme oder Tabellen, die ein Dekodierer benötigt, auf dem Film kodiert sein und in einen Dekodiererspeicher geladen werden, wenn der Film für eine Präsentation läuft. Hierdurch kann die Kompatibilität des Dekodierers mit gegenwärtigen und zukünftigen Kodierprogrammen erzielt werden. Die einzige Funktion, die im Dekodierer verbleiben muß, ist das Mittel zur Identifizierung von Blocktypen und zum Laden von Hilfsblockdaten in den Dekodiererspeicher. Tabelle I Transformationskoeffizententeilbandgruppierung Teilband Nr. Koeffizientenzahlen Zuordnungsbasis Lenkschwelle MEXP0 MEXP1 (*) Für die TDAC-Transformation ist der MDST-Koeffizent 0 immer Null; deshalb brauchen der Exponent und die Mantisse für 0 nicht quantisiert zu werden. Die Länge des MDCT-Koeffizenten ist auf 9 Bits festgelegt. (+) Für die TDAC-Transformation ist die Bitlänge für den MDST- Koeffizenten 1 auf 9 Bits festgelegt. Die Bitlänge für den MDCT-Koeffizenten 1 wird durch adaptive Bitzuteilung festgelegt.
Claims (24)
1. Kodierer zum Kodieren von zwei oder mehr Audiokanälen mit:
- einer Teilbandeinrichtung (1010) zum Erzeugen von Teilbandsignalen, wobei jedes
Teilbandsignal Spektralenergie in einem entsprechenden Teilband eines entsprechenden der
Audiokanäle wiedergibt,
- einer Mischeinrichtung (400) zum Schaffen eines oder mehrerer zusammengesetzter Signale,
wobei jedes zusammengesetzte Signal durch Kombinieren von Teilbandsignalen in einem
entsprechenden Teilband eines oder mehrerer der Audiokanäle gebildet wird, und zum Erzeugen von
Steuerinformation für ein entsprechendes zusammengesetztes Signal, die entweder Spektralpegel
oder Lokalisierungseigenschaften aller zu dem entsprechenden zusammengesetzten Signal
kombinierten, teilnehmenden Teilbandsignale übermittelt,
- einer Kodiereinrichtung (100, 200, 300, 500) zum Erzeugen kodierter Information durch
Zuteilen von Bits zu dem einen oder mehreren zusammengesetzten Signalen und nicht zu einem
entsprechenden zusammengesetzten Signal kombinierten Teilbandsignalen und Quantisieren
derselben, bei der die kodierte Information in einer Form dargestellt wird, die grob quantisierte Werte
und feiner quantisierte Werte aufweist, und
- einer Formatiereinrichtung (1040) zum Zusammensetzen der kodierten Information und der
Steuerinformation zu einem Ausgabesignal.
2. Kodierer nach Anspruch 1, bei dem die Mischeinrichtung das eine oder mehrere
zusammengesetzte Signale nur bildet, wenn die Anzahl Bits, die von der Kodiereinrichtung zum
Kodieren von Teilbandsignalen benötigt wird, welche von der Teilbandeinrichtung erzeugt werden, eine
Grenze überschreitet, wobei die Mischeinrichtung die zusammengesetzten Signale nur in dem
Ausmaß bildet, in dem die Zahl der durch das Kodieren der zusammengesetzten Signale statt der
teilnehmenden Teilbandsignale gesparten Bits ausreicht, das Generieren der kodierten Information
unter Verwendung einer Anzahl von Bits zu erlauben, die die Grenze nicht überschreitet.
3. Kodierer nach Anspruch 1 oder 2, bei dem die Bits aus einem gemeinsamen Pool an Bits
(350) zugeteilt werden.
4. Kodierer nach einem der Ansprüche 1 bis 3, bei dem die Kodiereinrichtung eine Einrichtung
enthält, um den Teilbandsignalen und dem einen oder mehreren zusammengesetzten Signalen vor
dem Quantisieren ein rauschähnliches Signal hinzuzufügen.
5. Kodierer nach einem der Ansprüche 1 bis 4, bei dem die Mischeinrichtung eine
Wähleinrichtung enthält, um jedes Teilband auszuwählen, aus dem ein entsprechendes des einen
oder der mehreren zusammengesetzten Signale gebildet wird.
6. Kodierer nach Anspruch 5, bei dem die Wähleinrichtung ein oder mehrere vorherbestimmte
Teilbänder auswählt.
7. Kodierer nach Anspruch 5 oder 6, bei dem die Wähleinrichtung ein oder mehrere der
höchstfrequenten Teilbänder auswählt.
8. Kodierer nach einem der Ansprüche 5 bis 7, bei dem die Wähleinrichtung ein oder mehrere
Teilbänder so auswählt, daß das resultierende eine oder mehrere zusammengesetzte Signale am
wenigsten wahrscheinlich Fehlern unterliegt, die durch ein Außerphase-Signallöschen verursacht
werden.
9. Kodierer nach einem der Ansprüche 5 bis 8, bei dem die Wähleinrichtung Teilbänder
auswählt, deren Teilbandsignalen, wenn sie nicht durch ein entsprechendes zusammengesetztes
Signal repräsentiert sind, eine entsprechende Mindestanzahl Bits nicht zugeteilt würde.
10. Kodierer nach Anspruch 9, bei dem die entsprechende Mindestanzahl Bits die Bitzahl ist,
die erforderlich ist, um das Quantisierungsrauschen in dem entsprechenden Teilband im
wesentlichen unhörbar zu machen.
11. Kodierer nach einem der Ansprüche 5 bis 9, bei dem die Wähleinrichtung ein Teilband,
beginnend mit Teilbändern, in denen Kodierungenauigkeiten am wenigsten unangenehm sind,
auswählt.
12. Kodierer nach einem der Ansprüche 5 bis 8, bei dem die Wähleinrichtung das
höchstfrequente Teilband auswählt, wobei sie repetitiv das Teilband der höchsten Frequenz
auswählt, welches nicht bereits ausgewählt wurde, bis genügend Bits zum Generieren des kodierten
Signals verfügbar gemacht sind.
13. Kodierer nach einem der Ansprüche 5 bis 12, bei dem die Einrichtung zur Auswahl ferner
Teilbandsignale danach auswählt, in welchen Audiokanälen sich die Teilbandsignale befinden.
14. Kodierer nach einem der Ansprüche 1 bis 13, bei dem die Spektralpegel für jedes
entsprechende zusammengesetzte Signal eine Anzeige des Leistungspegels vermitteln.
15. Kodierer nach einem der Ansprüche 1 bis 14, bei dem die Steuerinformation entweder
eine Vielzahl von Elementen ist, von denen jedes Element den Unterschied in der Amplitude
oder im Leistungspegel zwischen einem entsprechenden teilnehmenden Teilbandsignal und einem
Pegel des zusammengesetzten Signals ist, oder
eine Vielzahl von Elementen ist, von denen jedes Element das Verhältnis der Amplitude oder
des Leistungspegels zwischen einem entsprechenden teilnehmenden Teilbandsignal und einem Pegel
des zusammengesetzten Signals, oder
eine Vielzahl von Elementen ist, von denen jedes Element den absoluten Wert der Amplitude
oder des Leistungspegels jedes entsprechenden teilnehmenden Teilbandsignals darstellt.
16. Kodierer nach einem der Ansprüche 1 bis 1 5, bei dem die Mischeinrichtung eine
Einrichtung zum Kompensieren von Signalkomponenten außer Phase zwischen Teilbandsignalen
enthält, aus denen das eine oder die mehreren zusammengesetzten Signale gebildet sind.
17. Kodierer nach einem der Ansprüche 1 bis 16, bei dem das eine oder die mehreren
zusammengesetzten Signale und die nicht durch ein entsprechendes zusammengesetztes Signal
repräsentierten Teilbandsignale in einer Form dargestellt werden, die einen oder mehrere
Skaherungsfaktoren aufweist, welche jeweils einem oder mehreren skalierten Werten zugeordnet sind,
wobei der Kodierer ferner eine Einrichtung aufweist, um durch Manipulieren der Werte des einen
oder der mehreren Skalierungsfaktoren entweder den Dynamikbereich öder die Verstärkung oder
beides anzupassen.
18. Dekodierer zum Dekodieren eines von einem Kodierer erzeugten, kodierten Signals, wobei
das kodierte Signal Teilbänder einer Vielzahl von Audiokanälen wiedergibt, wobei jedes Teilband
einen Bereich des Spektrums der Audiokanäle bildet, wobei der Dekodierer folgendes aufweist:
- eine Deformatiereinrichtung (1050) zum Erhalten von Teilbandinformation und
Steuerinformation aus dem kodierten Signal, bei der die Teilbandinformation in einer Form wiedergegeben
wird, die grob quantisierte Werte und feiner quantisierte Werte aufweist,
- eine Dekodiereinrichtung (600, 700) zum Ableiten von Teilbandsignalen und
zusammengesetzten Signalen durch Zuteilen von Bits zu der Teilbandinformation und Dequantisieren
derselben, wobei jedes Teilbandsignal Spektralenergie in einem entsprechenden Teilband eines
entsprechenden der Audiokanäle wiedergibt,
- eine Rekonstruktionseinrichtung (800) zum Ableiten von Teilbandsignalen in Abhängigkeit
von dem einen oder den mehreren zusammengesetzten Signalen und der Steuerinformation, bei der
jedes entsprechende zusammengesetzte Signal eine Kombination aus teilneh menden
Teilbandsignalen in einem entsprechenden Teilband für zwei oder mehr der Audiokanäle wiedergibt und die
Steuerinformation für jedes entsprechende zusammengesetzte Signal entweder Spektralpegel oder
Lokalisierungsmerkmale der teilnehmenden Teilbandsignale vermittelt, und
- eine Syntheseein richtung (1080) zum Erzeugen einer Vielzahl von Ausgabesignalen in
Abhängigkeit von den abgeleiteten Teilbandsignalen.
19. Dekodierer nach Anspruch 18, bei dem die Dekodiereinrichtung eine Einrichtung enthält,
um die niedrigstwertigen Bits der feiner quantisierten Werte durch ein rauschähnliches Signal zu
ersetzen.
20. Dekodierer nach Anspruch 18, bei dem die feiner quantisierten Werte ein rauschähnliches
Signal einschließen, welches vor ihrer Quantisierung in dem Kodierer hinzugefügt wurde, bei dem
die Dekodiereinrichtung eine Einrichtung enthält, die ein rauschähnliches Signal erzeugt, welches
im wesentlichen das gleiche ist wie das vor dem Quantisieren hinzugefügte, und eine Einrichtung
zum Subtrahieren des rauschähnlichen Signals von den feiner quantisierten Werten nach einer
Dequantisierung.
21. Dekodierer nach einem der Ansprüche 18 bis 20, bei dem die Bits aus einem
gemeinsamen Bitpool (650) zugeteilt werden.
22. Dekodierer nach einem der Ansprüche 18 bis 21, bei dem die Spektralpegel für ein
entsprechendes zusammengesetztes Signal eine Anzeige des Leistungspegels vermitteln.
23. Dekodierer nach einem der Ansprüche 18 bis 22, ferner mit einer Einrichtung zum
Revidieren des Außerphase- Ausgleichs zwischen teilnehmenden Teilbandsignalen für ein
entsprechendes zusammengesetztes Signal nach Anlegen durch den Kodierer.
24. Dekodierer nach einem der Ansprüche 18 bis 23, bei dem die Teilbandinformation in einer
Form wiedergegeben wird, die einen oder mehrere Skalierungsfaktoren aufweist, die jeweils einem
oder mehreren skalierten Werten zugeordnet sind, wobei der Dekodierer ferner eine Einrichtung
aufweist, um entweder den Dynamikbereich oder die Verstärkung oder beides in der
Teilbandinformation durch Manipulieren der Werte des einen oder der mehreren Skalierungsfaktoren
anzupassen.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63889691A | 1991-01-08 | 1991-01-08 | |
US80497691A | 1991-12-11 | 1991-12-11 | |
PCT/US1992/000133 WO1992012607A1 (en) | 1991-01-08 | 1992-01-08 | Encoder/decoder for multidimensional sound fields |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69210689D1 DE69210689D1 (de) | 1996-06-20 |
DE69210689T2 true DE69210689T2 (de) | 1996-11-21 |
Family
ID=27093204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69210689T Expired - Lifetime DE69210689T2 (de) | 1991-01-08 | 1992-01-08 | Kodierer/dekodierer für mehrdimensionale schallfelder |
Country Status (12)
Country | Link |
---|---|
US (4) | US5583962A (de) |
EP (1) | EP0520068B1 (de) |
JP (2) | JP3449715B2 (de) |
KR (1) | KR100228688B1 (de) |
AT (1) | ATE138238T1 (de) |
AU (1) | AU653582B2 (de) |
CA (1) | CA2077662C (de) |
DE (1) | DE69210689T2 (de) |
DK (1) | DK0520068T3 (de) |
ES (1) | ES2087522T3 (de) |
SG (1) | SG49883A1 (de) |
WO (1) | WO1992012607A1 (de) |
Families Citing this family (311)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE40280E1 (en) | 1988-12-30 | 2008-04-29 | Lucent Technologies Inc. | Rate loop processor for perceptual encoder/decoder |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
WO1994016537A1 (en) * | 1990-01-09 | 1994-07-21 | Desper Products, Inc. | Stereophonic manipulation apparatus and method for sound image enhancement |
US5274740A (en) * | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
DE4111131C2 (de) * | 1991-04-06 | 2001-08-23 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen digitalisierter Tonsignale |
EP0559348A3 (de) | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rateurregelschleifenprozessor für einen wahrnehmungsgebundenen Koder/Dekoder |
US5278909A (en) * | 1992-06-08 | 1994-01-11 | International Business Machines Corporation | System and method for stereo digital audio compression with co-channel steering |
US6252909B1 (en) * | 1992-09-21 | 2001-06-26 | Aware, Inc. | Multi-carrier transmission system utilizing channels of different bandwidth |
EP0608930B1 (de) * | 1993-01-22 | 2000-06-14 | Koninklijke Philips Electronics N.V. | Digitale Dreikanalübertragung von linken und rechten Stereosignalen und von einem Mittelsignal |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
JP3993229B2 (ja) * | 1993-10-27 | 2007-10-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 第1および第2主信号成分の送信および受信 |
US6944298B1 (en) | 1993-11-18 | 2005-09-13 | Digimare Corporation | Steganographic encoding and decoding of auxiliary codes in media signals |
US6449377B1 (en) | 1995-05-08 | 2002-09-10 | Digimarc Corporation | Methods and systems for watermark processing of line art images |
US6611607B1 (en) | 1993-11-18 | 2003-08-26 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US6614914B1 (en) | 1995-05-08 | 2003-09-02 | Digimarc Corporation | Watermark embedder and reader |
AU1199195A (en) * | 1993-12-07 | 1995-06-27 | Sony Corporation | Information processing method, information processing device and media |
JP3404837B2 (ja) * | 1993-12-07 | 2003-05-12 | ソニー株式会社 | 多層符号化装置 |
JP3277679B2 (ja) * | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
EP0707761B1 (de) * | 1994-05-19 | 2001-09-26 | Koninklijke Philips Electronics N.V. | Vorrichtung zur bestimmung des signalspektrums eines digitalen breitbandsignals und zur ableitung einer bitzuweisungsinformation |
WO1995032499A1 (fr) * | 1994-05-25 | 1995-11-30 | Sony Corporation | Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur |
JP3277699B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 信号符号化方法及び装置並びに信号復号化方法及び装置 |
JP3250376B2 (ja) * | 1994-06-13 | 2002-01-28 | ソニー株式会社 | 情報符号化方法及び装置並びに情報復号化方法及び装置 |
US6560349B1 (en) | 1994-10-21 | 2003-05-06 | Digimarc Corporation | Audio monitoring using steganographic information |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
KR0154387B1 (ko) * | 1995-04-01 | 1998-11-16 | 김주용 | 음성다중 시스템을 적용한 디지탈 오디오 부호화기 |
WO1996032710A1 (en) * | 1995-04-10 | 1996-10-17 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals for digital transmission |
US6301555B2 (en) * | 1995-04-10 | 2001-10-09 | Corporate Computer Systems | Adjustable psycho-acoustic parameters |
US6700958B2 (en) * | 1995-04-10 | 2004-03-02 | Starguide Digital Networks, Inc. | Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth |
US6760463B2 (en) | 1995-05-08 | 2004-07-06 | Digimarc Corporation | Watermarking methods and media |
US7562392B1 (en) | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
KR0174085B1 (ko) * | 1995-08-09 | 1999-04-01 | 조백제 | 다채널 오디오 복호화기의 복합 디코딩장치 |
EP0845176A4 (de) * | 1995-08-16 | 2001-09-12 | Starguide Digital Networks Inc | Dynamische bandbreitenzuweisung zur ubertragung von audio und videosignalen |
JPH0969783A (ja) * | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
BR9610415A (pt) * | 1995-09-01 | 1999-09-14 | Starguide Digital Networks Inc | Sistema de distribuição e produção de arquivos de áudio |
DE19638997B4 (de) * | 1995-09-22 | 2009-12-10 | Samsung Electronics Co., Ltd., Suwon | Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
GB9606680D0 (en) * | 1996-03-29 | 1996-06-05 | Philips Electronics Nv | Compressed audio signal processing |
US6252965B1 (en) | 1996-09-19 | 2001-06-26 | Terry D. Beard | Multichannel spectral mapping audio apparatus and method |
US5924064A (en) * | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
WO1998015887A2 (en) * | 1996-10-09 | 1998-04-16 | Starguide Digital Networks | Aggregate information production and display system |
US6477496B1 (en) | 1996-12-20 | 2002-11-05 | Eliot M. Case | Signal synthesis by decoding subband scale factors from one audio signal and subband samples from different one |
US6463405B1 (en) | 1996-12-20 | 2002-10-08 | Eliot M. Case | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband |
US6516299B1 (en) * | 1996-12-20 | 2003-02-04 | Qwest Communication International, Inc. | Method, system and product for modifying the dynamic range of encoded audio signals |
US7333863B1 (en) * | 1997-05-05 | 2008-02-19 | Warner Music Group, Inc. | Recording and playback control system |
DK0887958T3 (da) * | 1997-06-23 | 2003-05-05 | Liechti Ag | Fremgangsmåde til komprimering af optagelser af omgivelseslyd, fremgangsmåde til detektering af programelementer deri, indretninger og computerprogram dertil |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
WO1999010719A1 (en) | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
WO1999016050A1 (en) * | 1997-09-23 | 1999-04-01 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
FR2769165B1 (fr) | 1997-09-26 | 2002-11-29 | Technical Maintenance Corp | Systeme sans fil a transmission numerique pour haut-parleurs |
US6055502A (en) * | 1997-09-27 | 2000-04-25 | Ati Technologies, Inc. | Adaptive audio signal compression computer system and method |
US5903872A (en) * | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
US5913191A (en) * | 1997-10-17 | 1999-06-15 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries |
US5899969A (en) * | 1997-10-17 | 1999-05-04 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with gain-control words |
JP3164038B2 (ja) * | 1997-11-05 | 2001-05-08 | 日本電気株式会社 | 音声帯域分割復号装置 |
DE69722973T2 (de) * | 1997-12-19 | 2004-05-19 | Stmicroelectronics Asia Pacific Pte Ltd. | Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio |
DE69711102T2 (de) * | 1997-12-27 | 2002-11-07 | Stmicroelectronics Asia Pacific Pte Ltd., Singapur/Singapore | Verfahren und gerät zur schätzung von koppelparametern in einem transformationskodierer für hochwertige tonsignale |
US7194757B1 (en) | 1998-03-06 | 2007-03-20 | Starguide Digital Network, Inc. | Method and apparatus for push and pull distribution of multimedia |
KR100304092B1 (ko) * | 1998-03-11 | 2001-09-26 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 |
US8284774B2 (en) | 1998-04-03 | 2012-10-09 | Megawave Audio Llc | Ethernet digital storage (EDS) card and satellite transmission system |
US6160797A (en) | 1998-04-03 | 2000-12-12 | Starguide Digital Networks, Inc. | Satellite receiver/router, system, and method of use |
US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
WO1999053479A1 (en) * | 1998-04-15 | 1999-10-21 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. | Fast frame optimisation in an audio encoder |
US6624873B1 (en) | 1998-05-05 | 2003-09-23 | Dolby Laboratories Licensing Corporation | Matrix-encoded surround-sound channels in a discrete digital sound format |
US6161088A (en) * | 1998-06-26 | 2000-12-12 | Texas Instruments Incorporated | Method and system for encoding a digital audio signal |
JP4174859B2 (ja) * | 1998-07-15 | 2008-11-05 | ヤマハ株式会社 | デジタルオーディオ信号のミキシング方法およびミキシング装置 |
FR2781591B1 (fr) | 1998-07-22 | 2000-09-22 | Technical Maintenance Corp | Systeme de reproduction audiovisuelle |
GB2340351B (en) * | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
US6226618B1 (en) * | 1998-08-13 | 2001-05-01 | International Business Machines Corporation | Electronic content delivery system |
US6195633B1 (en) * | 1998-09-09 | 2001-02-27 | Sony Corporation | System and method for efficiently implementing a masking function in a psycho-acoustic modeler |
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
US6765930B1 (en) * | 1998-12-11 | 2004-07-20 | Sony Corporation | Decoding apparatus and method, and providing medium |
US6182030B1 (en) * | 1998-12-18 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced coding to improve coded communication signals |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
KR100297832B1 (ko) * | 1999-05-15 | 2001-09-26 | 윤종용 | 음성 신호 위상 정보 처리 장치 및 그 방법 |
US6687663B1 (en) * | 1999-06-25 | 2004-02-03 | Lake Technology Limited | Audio processing method and apparatus |
FR2796482B1 (fr) | 1999-07-16 | 2002-09-06 | Touchtunes Music Corp | Systeme de gestion a distance d'au moins un dispositif de reproduction d'informations audiovisuelles |
JP2001092434A (ja) * | 1999-09-21 | 2001-04-06 | Sony Corp | 情報処理装置、画像生成方法及びプログラム格納媒体 |
US8767969B1 (en) | 1999-09-27 | 2014-07-01 | Creative Technology Ltd | Process for removing voice from stereo recordings |
US6405163B1 (en) | 1999-09-27 | 2002-06-11 | Creative Technology Ltd. | Process for removing voice from stereo recordings |
JP3804902B2 (ja) * | 1999-09-27 | 2006-08-02 | パイオニア株式会社 | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 |
US6931370B1 (en) * | 1999-11-02 | 2005-08-16 | Digital Theater Systems, Inc. | System and method for providing interactive audio in a multi-channel audio environment |
FR2802329B1 (fr) * | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
FR2805377B1 (fr) | 2000-02-23 | 2003-09-12 | Touchtunes Music Corp | Procede de commande anticipee d'une selection, systeme numerique et juke-box permettant la mise en oeuvre du procede |
FR2805060B1 (fr) | 2000-02-16 | 2005-04-08 | Touchtunes Music Corp | Procede de reception de fichiers lors d'un telechargement |
FR2805072B1 (fr) | 2000-02-16 | 2002-04-05 | Touchtunes Music Corp | Procede d'ajustement du volume sonore d'un enregistrement sonore numerique |
US6968564B1 (en) * | 2000-04-06 | 2005-11-22 | Nielsen Media Research, Inc. | Multi-band spectral audio encoding |
FR2808906B1 (fr) | 2000-05-10 | 2005-02-11 | Touchtunes Music Corp | Dispositif et procede de gestion a distance d'un reseau de systemes de reproduction d'informations audiovisuelles |
US6785655B1 (en) | 2000-05-15 | 2004-08-31 | Lsi Logic Corporation | Method for independent dynamic range control |
US6782366B1 (en) | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
US20020026253A1 (en) * | 2000-06-02 | 2002-02-28 | Rajan Jebu Jacob | Speech processing apparatus |
US6754618B1 (en) * | 2000-06-07 | 2004-06-22 | Cirrus Logic, Inc. | Fast implementation of MPEG audio coding |
FR2811175B1 (fr) | 2000-06-29 | 2002-12-27 | Touchtunes Music Corp | Procede de distribution d'informations audiovisuelles et systeme de distribution d'informations audiovisuelles |
US7023922B1 (en) * | 2000-06-21 | 2006-04-04 | Microsoft Corporation | Video coding system and method using 3-D discrete wavelet transform and entropy coding with motion information |
FR2811114B1 (fr) | 2000-06-29 | 2002-12-27 | Touchtunes Music Corp | Dispositif et procede de communication entre un systeme de reproduction d'informations audiovisuelles et d'une machine electronique de divertissement |
US7298852B2 (en) | 2001-07-11 | 2007-11-20 | American Technology Corporation | Dynamic power sharing in a multi-channel sound system |
US6973184B1 (en) | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
US6879652B1 (en) * | 2000-07-14 | 2005-04-12 | Nielsen Media Research, Inc. | Method for encoding an input signal |
FR2814085B1 (fr) | 2000-09-15 | 2005-02-11 | Touchtunes Music Corp | Procede de divertissement base sur les jeux concours a choix multiples |
US7003467B1 (en) * | 2000-10-06 | 2006-02-21 | Digital Theater Systems, Inc. | Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio |
EP1199812A1 (de) | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Kodierung der akustischen Signale mit Verbesserung der Wahrnehmung |
WO2002069073A2 (en) * | 2000-11-13 | 2002-09-06 | Starguide Digital Networks, Inc. | Ethernet digital storage (eds) card and satellite transmission system including faxing capability |
KR20020076312A (ko) * | 2000-12-18 | 2002-10-09 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 재생 디바이스 |
US7660424B2 (en) * | 2001-02-07 | 2010-02-09 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
AUPR433901A0 (en) | 2001-04-10 | 2001-05-17 | Lake Technology Limited | High frequency signal construction method |
FI110729B (fi) * | 2001-04-11 | 2003-03-14 | Nokia Corp | Menetelmä pakatun audiosignaalin purkamiseksi |
US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7451006B2 (en) | 2001-05-07 | 2008-11-11 | Harman International Industries, Incorporated | Sound processing system using distortion limiting techniques |
US6804565B2 (en) | 2001-05-07 | 2004-10-12 | Harman International Industries, Incorporated | Data-driven software architecture for digital sound processing and equalization |
US7447321B2 (en) | 2001-05-07 | 2008-11-04 | Harman International Industries, Incorporated | Sound processing system for configuration of audio signals in a vehicle |
US8572640B2 (en) * | 2001-06-29 | 2013-10-29 | Arbitron Inc. | Media data use measurement with remote decoding/pattern matching |
GB0119569D0 (en) * | 2001-08-13 | 2001-10-03 | Radioscape Ltd | Data hiding in digital audio broadcasting (DAB) |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
ITMI20020566A1 (it) * | 2002-03-18 | 2003-09-18 | Daniele Ramenzoni | Dispositivo per captare movimenti anche piccoli nell'aria e nei fluidi adatto per applicazioni cibernetiche e di laboratorio come trasduttor |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7275036B2 (en) * | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
ES2268340T3 (es) * | 2002-04-22 | 2007-03-16 | Koninklijke Philips Electronics N.V. | Representacion de audio parametrico de multiples canales. |
US7428440B2 (en) * | 2002-04-23 | 2008-09-23 | Realnetworks, Inc. | Method and apparatus for preserving matrix surround information in encoded audio/video |
JP4744874B2 (ja) | 2002-05-03 | 2011-08-10 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | サウンドの検出および特定システム |
US20040086130A1 (en) * | 2002-05-03 | 2004-05-06 | Eid Bradley F. | Multi-channel sound processing systems |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
US20030233230A1 (en) * | 2002-06-12 | 2003-12-18 | Lucent Technologies Inc. | System and method for representing and resolving ambiguity in spoken dialogue systems |
US11029823B2 (en) | 2002-09-16 | 2021-06-08 | Touchtunes Music Corporation | Jukebox with customizable avatar |
US8332895B2 (en) | 2002-09-16 | 2012-12-11 | Touchtunes Music Corporation | Digital downloading jukebox system with user-tailored music management, communications, and other tools |
US7822687B2 (en) | 2002-09-16 | 2010-10-26 | Francois Brillon | Jukebox with customizable avatar |
US8103589B2 (en) | 2002-09-16 | 2012-01-24 | Touchtunes Music Corporation | Digital downloading jukebox system with central and local music servers |
US12100258B2 (en) | 2002-09-16 | 2024-09-24 | Touchtunes Music Company, Llc | Digital downloading jukebox with enhanced communication features |
US8584175B2 (en) | 2002-09-16 | 2013-11-12 | Touchtunes Music Corporation | Digital downloading jukebox system with user-tailored music management, communications, and other tools |
US10373420B2 (en) | 2002-09-16 | 2019-08-06 | Touchtunes Music Corporation | Digital downloading jukebox with enhanced communication features |
US9646339B2 (en) | 2002-09-16 | 2017-05-09 | Touchtunes Music Corporation | Digital downloading jukebox system with central and local music servers |
US8437868B2 (en) * | 2002-10-14 | 2013-05-07 | Thomson Licensing | Method for coding and decoding the wideness of a sound source in an audio scene |
KR100542129B1 (ko) * | 2002-10-28 | 2006-01-11 | 한국전자통신연구원 | 객체기반 3차원 오디오 시스템 및 그 제어 방법 |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
FR2851879A1 (fr) * | 2003-02-27 | 2004-09-03 | France Telecom | Procede de traitement de donnees sonores compressees, pour spatialisation. |
US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
SG185134A1 (en) * | 2003-05-28 | 2012-11-29 | Dolby Lab Licensing Corp | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
US7912226B1 (en) * | 2003-09-12 | 2011-03-22 | The Directv Group, Inc. | Automatic measurement of audio presence and level by direct processing of an MPEG data stream |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
US7970144B1 (en) | 2003-12-17 | 2011-06-28 | Creative Technology Ltd | Extracting and modifying a panned source for enhancement and upmix of audio signals |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE102004009955B3 (de) * | 2004-03-01 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite |
ATE527654T1 (de) | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US7899191B2 (en) * | 2004-03-12 | 2011-03-01 | Nokia Corporation | Synthesizing a mono audio signal |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
JP5032977B2 (ja) * | 2004-04-05 | 2012-09-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチチャンネル・エンコーダ |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0400997D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
US7565213B2 (en) * | 2004-05-07 | 2009-07-21 | Gracenote, Inc. | Device and method for analyzing an information signal |
KR100636145B1 (ko) * | 2004-06-04 | 2006-10-18 | 삼성전자주식회사 | 확장된 고해상도 오디오 신호 부호화 및 복호화 장치 |
NL1029156C2 (nl) * | 2004-06-04 | 2006-07-25 | Samsung Electronics Co Ltd | Apparaat en werkwijze. |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
US20060019605A1 (en) * | 2004-07-20 | 2006-01-26 | Jeng-Jye Shau | Wireless signal transfer by sound waves |
US7751804B2 (en) * | 2004-07-23 | 2010-07-06 | Wideorbit, Inc. | Dynamic creation, selection, and scheduling of radio frequency communications |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
TWI497485B (zh) | 2004-08-25 | 2015-08-21 | Dolby Lab Licensing Corp | 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法 |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
KR20070065401A (ko) * | 2004-09-23 | 2007-06-22 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 데이터를 처리하는 시스템 및 방법, 프로그램구성요소, 및 컴퓨터-판독가능 매체 |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
CA2581810C (en) | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
EP1817767B1 (de) | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametrische raumtonkodierung mit objektbasierten nebeninformationen |
US7761304B2 (en) | 2004-11-30 | 2010-07-20 | Agere Systems Inc. | Synchronizing parametric coding of spatial audio with externally provided downmix |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
US20080262834A1 (en) * | 2005-02-25 | 2008-10-23 | Kensaku Obata | Sound Separating Device, Sound Separating Method, Sound Separating Program, and Computer-Readable Recording Medium |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
CN102276769B (zh) * | 2005-04-18 | 2013-12-04 | 巴斯夫欧洲公司 | 一种呈由至少三种不同的单烯属不饱和单体构成的聚合物形式的共聚物 |
EP1905004A2 (de) * | 2005-05-26 | 2008-04-02 | LG Electronics Inc. | Verfahren zum codieren und decodieren eines audiosignals |
KR101251426B1 (ko) * | 2005-06-03 | 2013-04-05 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법 |
WO2007004831A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US8082157B2 (en) * | 2005-06-30 | 2011-12-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
AU2006266655B2 (en) * | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
US7966190B2 (en) | 2005-07-11 | 2011-06-21 | Lg Electronics Inc. | Apparatus and method for processing an audio signal using linear prediction |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
JP2009503574A (ja) * | 2005-07-29 | 2009-01-29 | エルジー エレクトロニクス インコーポレイティド | 分割情報のシグナリング方法 |
WO2007013784A1 (en) * | 2005-07-29 | 2007-02-01 | Lg Electronics Inc. | Method for generating encoded audio signal amd method for processing audio signal |
JP5173811B2 (ja) * | 2005-08-30 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
KR100891686B1 (ko) | 2005-08-30 | 2009-04-03 | 엘지전자 주식회사 | 오디오 신호의 인코딩 및 디코딩 장치, 및 방법 |
KR20070025905A (ko) * | 2005-08-30 | 2007-03-08 | 엘지전자 주식회사 | 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법 |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
US8577483B2 (en) * | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
JP5108767B2 (ja) * | 2005-08-30 | 2012-12-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
US8319791B2 (en) * | 2005-10-03 | 2012-11-27 | Sharp Kabushiki Kaisha | Display |
KR20070037987A (ko) | 2005-10-04 | 2007-04-09 | 엘지전자 주식회사 | 다채널 오디오 신호의 디코딩 방법 및 장치 |
US7696907B2 (en) * | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
KR100857111B1 (ko) * | 2005-10-05 | 2008-09-08 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
ES2478004T3 (es) * | 2005-10-05 | 2014-07-18 | Lg Electronics Inc. | Método y aparato para decodificar una señal de audio |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US7752053B2 (en) * | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
JP2007221445A (ja) * | 2006-02-16 | 2007-08-30 | Sharp Corp | サラウンドシステム |
WO2007120452A1 (en) | 2006-04-04 | 2007-10-25 | Dolby Laboratories Licensing Corporation | Audio signal loudness measurement and modification in the mdct domain |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
CA2648237C (en) | 2006-04-27 | 2013-02-05 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
EP1853092B1 (de) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Verbesserung von Stereo-Audiosignalen mittels Neuabmischung |
US8712061B2 (en) * | 2006-05-17 | 2014-04-29 | Creative Technology Ltd | Phase-amplitude 3-D stereo encoder and decoder |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
EP1870880B1 (de) | 2006-06-19 | 2010-04-07 | Sharp Kabushiki Kaisha | Signalverarbeitungsverfahren, Signalverarbeitungsvorrichtung und Aufzeichnungsmedium |
US7907579B2 (en) * | 2006-08-15 | 2011-03-15 | Cisco Technology, Inc. | WiFi geolocation from carrier-managed system geolocation of a dual mode device |
EP2105019A2 (de) * | 2006-09-29 | 2009-09-30 | Avinity Systems B.V. | Verfahren zum streaming paralleler benutzersitzungen, system und computersoftware |
WO2008039041A1 (en) * | 2006-09-29 | 2008-04-03 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
JP4993992B2 (ja) * | 2006-10-04 | 2012-08-08 | シャープ株式会社 | 信号処理方法、信号処理装置及びプログラム |
EP2084901B1 (de) | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Vorrichtung zum verarbeiten eines mischsignals und verfahren dafür |
KR100891668B1 (ko) | 2006-10-12 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호 처리 방법 및 장치 |
KR100891667B1 (ko) | 2006-10-13 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호의 처리 방법 및 장치 |
RU2413357C2 (ru) | 2006-10-20 | 2011-02-27 | Долби Лэборетериз Лайсенсинг Корпорейшн | Обработка динамических свойств аудио с использованием перенастройки |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
WO2008060111A1 (en) | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
KR100891669B1 (ko) | 2006-12-01 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호의 처리 방법 및 장치 |
JP5450085B2 (ja) | 2006-12-07 | 2014-03-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
KR101062353B1 (ko) | 2006-12-07 | 2011-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 그 장치 |
EP2595152A3 (de) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Transkodiervorrichtung |
US8194889B2 (en) * | 2007-01-03 | 2012-06-05 | Dolby Laboratories Licensing Corporation | Hybrid digital/analog loudness-compensating volume control |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
EP3145200A1 (de) | 2007-01-12 | 2017-03-22 | ActiveVideo Networks, Inc. | Mpeg-objekte und systeme und verfahren zur verwendung von mpeg-objekten |
US9171419B2 (en) | 2007-01-17 | 2015-10-27 | Touchtunes Music Corporation | Coin operated entertainment system |
DE602008001787D1 (de) * | 2007-02-12 | 2010-08-26 | Dolby Lab Licensing Corp | Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer |
JP5530720B2 (ja) | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
US8290167B2 (en) * | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009007639A1 (fr) * | 2007-07-03 | 2009-01-15 | France Telecom | Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe |
CN101790758B (zh) * | 2007-07-13 | 2013-01-09 | 杜比实验室特许公司 | 用于控制音频信号的信号处理的设备和方法 |
KR100912826B1 (ko) | 2007-08-16 | 2009-08-18 | 한국전자통신연구원 | G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및복호화 장치와 그 방법 |
US8332887B2 (en) | 2008-01-10 | 2012-12-11 | Touchtunes Music Corporation | System and/or methods for distributing advertisements from a central advertisement network to a peripheral device via a local advertisement server |
US10290006B2 (en) | 2008-08-15 | 2019-05-14 | Touchtunes Music Corporation | Digital signage and gaming services to comply with federal and state alcohol and beverage laws and regulations |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
WO2009086174A1 (en) | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
WO2010005569A1 (en) | 2008-07-09 | 2010-01-14 | Touchtunes Music Corporation | Digital downloading jukebox with revenue-enhancing features |
TWI449442B (zh) | 2009-01-14 | 2014-08-11 | Dolby Lab Licensing Corp | 用於無回授之頻域主動矩陣解碼的方法與系統 |
KR101433701B1 (ko) | 2009-03-17 | 2014-08-28 | 돌비 인터네셔널 에이비 | 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩 |
KR101748448B1 (ko) | 2009-03-18 | 2017-06-16 | 터치튠즈 뮤직 코포레이션 | 엔터테인먼트 서버 및 관련 소셜 네트워킹 서비스 |
US9292166B2 (en) | 2009-03-18 | 2016-03-22 | Touchtunes Music Corporation | Digital jukebox device with improved karaoke-related user interfaces, and associated methods |
US10564804B2 (en) | 2009-03-18 | 2020-02-18 | Touchtunes Music Corporation | Digital jukebox device with improved user interfaces, and associated methods |
US12112093B2 (en) | 2009-03-18 | 2024-10-08 | Touchtunes Music Company, Llc | Entertainment server and associated social networking services |
US10719149B2 (en) | 2009-03-18 | 2020-07-21 | Touchtunes Music Corporation | Digital jukebox device with improved user interfaces, and associated methods |
US8302047B2 (en) | 2009-05-06 | 2012-10-30 | Texas Instruments Incorporated | Statistical static timing analysis in non-linear regions |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
JP5771618B2 (ja) | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
US8301803B2 (en) * | 2009-10-23 | 2012-10-30 | Samplify Systems, Inc. | Block floating point compression of signal data |
SI2510515T1 (sl) | 2009-12-07 | 2014-06-30 | Dolby Laboratories Licensing Corporation | Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije |
EP2568472A1 (de) | 2010-01-26 | 2013-03-13 | Touchtunes Music Corporation | Digitale Jukebox-Vorrichtung mit verbesserten Benutzeroberflächen sowie entsprechende Verfahren |
JP5335134B2 (ja) * | 2010-04-16 | 2013-11-06 | 日本電信電話株式会社 | 周波数オフセット推定方法および周波数オフセット推定装置 |
CA2814070A1 (en) | 2010-10-14 | 2012-04-19 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
US9729120B1 (en) | 2011-07-13 | 2017-08-08 | The Directv Group, Inc. | System and method to monitor audio loudness and provide audio automatic gain control |
GB2522772B (en) | 2011-09-18 | 2016-01-13 | Touchtunes Music Corp | Digital jukebox device with karaoke and/or photo booth features, and associated methods |
WO2013078056A1 (en) | 2011-11-22 | 2013-05-30 | Dolby Laboratories Licensing Corporation | Method and system for generating an audio metadata quality score |
WO2013106390A1 (en) | 2012-01-09 | 2013-07-18 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
US8527264B2 (en) | 2012-01-09 | 2013-09-03 | Dolby Laboratories Licensing Corporation | Method and system for encoding audio data with adaptive low frequency compensation |
US11151224B2 (en) | 2012-01-09 | 2021-10-19 | Touchtunes Music Corporation | Systems and/or methods for monitoring audio inputs to jukebox devices |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
TWI538000B (zh) | 2012-05-10 | 2016-06-11 | 杜比實驗室特許公司 | 多階段過濾器,音頻編碼器,音頻解碼器,施行多階段過濾的方法,用以編碼音頻資料的方法,用以將編碼音頻資料解碼的方法,及用以處理編碼位元流的方法和裝置 |
CN107578781B (zh) | 2013-01-21 | 2021-01-29 | 杜比实验室特许公司 | 利用响度处理状态元数据的音频编码器和解码器 |
KR102071860B1 (ko) | 2013-01-21 | 2020-01-31 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
TR201802631T4 (tr) | 2013-01-21 | 2018-03-21 | Dolby Laboratories Licensing Corp | Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder |
CN104019885A (zh) | 2013-02-28 | 2014-09-03 | 杜比实验室特许公司 | 声场分析系统 |
US10275128B2 (en) | 2013-03-15 | 2019-04-30 | Activevideo Networks, Inc. | Multiple-mode system and method for providing user selectable video content |
EP2974253B1 (de) | 2013-03-15 | 2019-05-08 | Dolby Laboratories Licensing Corporation | Normalisierung von schallfeldausrichtungen auf basis von auditorischer szenenanalyse |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
US8804971B1 (en) | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
EP3005712A1 (de) | 2013-06-06 | 2016-04-13 | ActiveVideo Networks, Inc. | Überlagerte darstellung einer benutzerschnittstelle auf quellvideoinhalten |
WO2015070070A1 (en) | 2013-11-07 | 2015-05-14 | Touchtunes Music Corporation | Techniques for generating electronic menu graphical user interface layouts for use in connection with electronic devices |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
JP6777545B2 (ja) | 2014-03-25 | 2020-10-28 | タッチチューンズ ミュージック コーポレイションTouchtunes Music Corporation | 改善されたユーザインターフェースを備えたデジタルジュークボックス装置および関連する方法 |
US9496922B2 (en) | 2014-04-21 | 2016-11-15 | Sony Corporation | Presentation of content on companion display device based on content presented on primary display device |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
US9197232B1 (en) * | 2014-05-12 | 2015-11-24 | Cable Television Laboratories, Inc. | Spectrally weighted analog to digital conversion |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US20160070871A1 (en) * | 2014-09-04 | 2016-03-10 | Quattro Folia Oy | System and method for recommending optimum insulin bolus dosage |
US9747910B2 (en) * | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US9973851B2 (en) | 2014-12-01 | 2018-05-15 | Sonos, Inc. | Multi-channel playback of audio content |
CN113593585A (zh) * | 2020-04-30 | 2021-11-02 | 华为技术有限公司 | 音频信号的比特分配方法和装置 |
FR3112016B1 (fr) * | 2020-06-30 | 2023-04-14 | Fond B Com | Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé |
CN112151046B (zh) * | 2020-09-25 | 2024-06-18 | 北京百瑞互联技术股份有限公司 | Lc3编码器自适应调节多声道传输码率的方法、装置及介质 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1124580A (en) * | 1911-07-03 | 1915-01-12 | Edward H Amet | Method of and means for localizing sound reproduction. |
US1850130A (en) * | 1928-10-31 | 1932-03-22 | American Telephone & Telegraph | Talking moving picture system |
US1793772A (en) * | 1929-02-26 | 1931-02-24 | Thomas L Talley | Apparatus and method for localization of sound on screens |
US2361490A (en) * | 1941-12-29 | 1944-10-31 | Rca Corp | Sound reproducing system |
BE529308A (de) * | 1953-10-08 | |||
GB871992A (en) * | 1956-10-13 | 1961-07-05 | Emi Ltd | Improvements relating to stereophonic sound transmission systems |
US3067287A (en) * | 1957-06-19 | 1962-12-04 | Percival William Spencer | Stereophonic sound transmission systems |
US3067292A (en) * | 1958-02-03 | 1962-12-04 | Jerry B Minter | Stereophonic sound transmission and reproduction |
DE1130899B (de) * | 1958-12-12 | 1962-06-07 | Siemens Ag | Verfahren und Anordnung zum Aufzeichnen und Abtasten von Magnetogrammen |
US3272906A (en) * | 1960-10-25 | 1966-09-13 | Zenith Radio Corp | Audio reproduction system |
US3845572A (en) * | 1972-08-02 | 1974-11-05 | Singer Co | Modular vehicle trainer sound system having a plurality of separately controllable sound generators and a polyphonic speaker array |
JPS5235282B2 (de) * | 1972-09-09 | 1977-09-08 | ||
JPS5317283B2 (de) * | 1973-03-07 | 1978-06-07 | ||
US3848092A (en) * | 1973-07-02 | 1974-11-12 | R Shamma | System for electronic modification of sound |
USRE29490E (de) * | 1973-07-02 | 1977-12-06 | ||
JPS5248001B2 (de) * | 1973-08-20 | 1977-12-07 | ||
DE2354286A1 (de) * | 1973-10-30 | 1975-05-07 | Plank Kg Ernst | Projektor |
US3973839A (en) * | 1974-12-30 | 1976-08-10 | Mca Systems, Inc. | Special effects generation and control system for motion pictures |
USRE30278E (en) * | 1974-12-30 | 1980-05-20 | Mca Systems, Inc. | Special effects generation and control system for motion pictures |
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
US4256389A (en) * | 1978-09-27 | 1981-03-17 | Paramount Sound Systems Corporation | Method and system of controlling sound and effects devices by a film strip |
US4251688A (en) * | 1979-01-15 | 1981-02-17 | Ana Maria Furner | Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals |
US4321675A (en) * | 1980-01-21 | 1982-03-23 | Texas Instruments Incorporated | Method and apparatus for increasing the dynamic range of a data acquisition system at low frequencies without reducing high frequency gain |
US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
CA1253255A (en) * | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
DE3734084A1 (de) * | 1987-10-08 | 1989-04-27 | Inst Rundfunktechnik Gmbh | Verfahren zum wiedergeben mehrkanaliger tonsignale |
BG60225B2 (bg) * | 1988-09-02 | 1993-12-30 | Qsound Ltd. | Метод и устройство за формиране на звукови изображения |
US5255210A (en) * | 1988-10-28 | 1993-10-19 | The Regents Of The University Of California | Self-coherence restoring signal extraction apparatus and method |
NL8901032A (nl) * | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
BR9007063A (pt) * | 1989-01-27 | 1991-10-08 | Dolby Lab Licensing Corp | Codificador,descodificador e codificador/descodificador de transformada de taxa de bites baixa para audio de alta qualidade |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5230038A (en) * | 1989-01-27 | 1993-07-20 | Fielder Louis D | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
US5539829A (en) * | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
GB8913758D0 (en) * | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
US5384725A (en) * | 1990-05-18 | 1995-01-24 | Yale University | Method and apparatus for encoding and decoding using wavelet-packets |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
NL9100173A (nl) * | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
US5481643A (en) * | 1993-03-18 | 1996-01-02 | U.S. Philips Corporation | Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component |
DE69428939T2 (de) * | 1993-06-22 | 2002-04-04 | Deutsche Thomson-Brandt Gmbh | Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix |
US5737720A (en) * | 1993-10-26 | 1998-04-07 | Sony Corporation | Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation |
EP0775389B1 (de) * | 1994-05-02 | 2002-12-18 | Koninklijke Philips Electronics N.V. | Einrichtung und verfahren zum kodieren eines digitalen signals mit mindestens einer ersten und einer zweiten digitalen signalkomponente |
-
1992
- 1992-01-08 SG SG1996008134A patent/SG49883A1/en unknown
- 1992-01-08 CA CA002077662A patent/CA2077662C/en not_active Expired - Lifetime
- 1992-01-08 JP JP50447492A patent/JP3449715B2/ja not_active Expired - Lifetime
- 1992-01-08 US US07/927,429 patent/US5583962A/en not_active Expired - Lifetime
- 1992-01-08 ES ES92904177T patent/ES2087522T3/es not_active Expired - Lifetime
- 1992-01-08 KR KR1019920702095A patent/KR100228688B1/ko not_active IP Right Cessation
- 1992-01-08 AT AT92904177T patent/ATE138238T1/de not_active IP Right Cessation
- 1992-01-08 AU AU11997/92A patent/AU653582B2/en not_active Expired
- 1992-01-08 DK DK92904177.0T patent/DK0520068T3/da active
- 1992-01-08 DE DE69210689T patent/DE69210689T2/de not_active Expired - Lifetime
- 1992-01-08 EP EP92904177A patent/EP0520068B1/de not_active Expired - Lifetime
- 1992-01-08 WO PCT/US1992/000133 patent/WO1992012607A1/en active IP Right Grant
-
1995
- 1995-06-07 US US08/472,231 patent/US5633981A/en not_active Expired - Lifetime
-
1997
- 1997-05-23 US US08/862,587 patent/US5909664A/en not_active Expired - Lifetime
-
1999
- 1999-03-09 US US09/264,781 patent/US6021386A/en not_active Expired - Fee Related
-
2002
- 2002-06-26 JP JP2002186283A patent/JP2003099099A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
KR920704539A (ko) | 1992-12-19 |
JPH05505298A (ja) | 1993-08-05 |
SG49883A1 (en) | 1998-06-15 |
EP0520068A1 (de) | 1992-12-30 |
JP3449715B2 (ja) | 2003-09-22 |
CA2077662A1 (en) | 1992-07-09 |
DK0520068T3 (da) | 1996-07-15 |
US5909664A (en) | 1999-06-01 |
JP2003099099A (ja) | 2003-04-04 |
KR100228688B1 (ko) | 1999-11-01 |
CA2077662C (en) | 2001-04-17 |
ES2087522T3 (es) | 1996-07-16 |
AU653582B2 (en) | 1994-10-06 |
US5583962A (en) | 1996-12-10 |
WO1992012607A1 (en) | 1992-07-23 |
AU1199792A (en) | 1992-08-17 |
US5633981A (en) | 1997-05-27 |
US6021386A (en) | 2000-02-01 |
DE69210689D1 (de) | 1996-06-20 |
EP0520068B1 (de) | 1996-05-15 |
ATE138238T1 (de) | 1996-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69210689T2 (de) | Kodierer/dekodierer für mehrdimensionale schallfelder | |
DE69214523T2 (de) | Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder | |
US5632005A (en) | Encoder/decoder for multidimensional sound fields | |
DE69933659T2 (de) | Verfahren und system zur räumlichen kodierung mit niedriger bitrate | |
DE602005006385T2 (de) | Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals | |
DE69633633T2 (de) | Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung | |
DE69422343T2 (de) | Gerät, verfahren und system zur komprimierung eines digitalen eingangssignals in mehr als einem kompressionsmodus | |
DE60206390T2 (de) | Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate | |
DE69804478T2 (de) | Verfahren und vorrichtung zur codierung und decodierung mehrere tonkanäle mit geringer bitrate | |
DE602006000239T2 (de) | Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter | |
EP1864279B1 (de) | Vorrichtung und verfahren zum erzeugen eines datenstroms und zum erzeugen einer multikanal-darstellung | |
DE69406295T2 (de) | Mehrkanal-sender-/empfängersystem mit lieferung von matrix/dekodierungskompatiblen signalen | |
DE69311569T2 (de) | Adaptive Rematrixierung von matrixförmigen Audiosignalen | |
DE602004010885T2 (de) | Audio-transkodierung | |
DE69323106T2 (de) | Verfahren und Vorrichtung für perceptuelles Kodieren von Audio-Signalen | |
DE60006953T2 (de) | Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen | |
DE602005006424T2 (de) | Stereokompatible mehrkanal-audiokodierung | |
DE69524512T2 (de) | Verfahren zur Aufnahme und Wiedergabe digitaler Audiosignale und Apparat dafür | |
DE69829242T2 (de) | Tonsignalkodierverfahren und -gerät | |
DE69325952T2 (de) | Kodierung und Dekodierung von Audio-information | |
DE69533500T2 (de) | Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten | |
DE69431230T2 (de) | Wahrnehmungsgebundene Mehrkanal-Audiokodierung mit adaptiver Bitverteilung | |
DE69434225T2 (de) | Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger | |
EP2094031A2 (de) | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms | |
DE69932861T2 (de) | Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: DOLBY LABORATORIES LICENSING CORP., SAN FRANCISCO, |