DE69933659T2 - Verfahren und system zur räumlichen kodierung mit niedriger bitrate - Google Patents

Verfahren und system zur räumlichen kodierung mit niedriger bitrate Download PDF

Info

Publication number
DE69933659T2
DE69933659T2 DE69933659T DE69933659T DE69933659T2 DE 69933659 T2 DE69933659 T2 DE 69933659T2 DE 69933659 T DE69933659 T DE 69933659T DE 69933659 T DE69933659 T DE 69933659T DE 69933659 T2 DE69933659 T2 DE 69933659T2
Authority
DE
Germany
Prior art keywords
signal
output channels
subband
sound
sound field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69933659T
Other languages
English (en)
Other versions
DE69933659D1 (de
Inventor
Ray Milton San Francisco Dolby
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of DE69933659D1 publication Critical patent/DE69933659D1/de
Publication of DE69933659T2 publication Critical patent/DE69933659T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Communication Control (AREA)

Description

  • Technisches Gebiet
  • Die Erfindung bezieht sich insgesamt auf das Aufzeichnen, Senden und Wiedergeben mehrdimensionaler Schallfelder, die für menschliches Hören beabsichtigt sind. Im einzelnen bezieht sich die Erfindung auf Verbesserungen an einem perzeptuellen Kodiersystem, Kodierern und Dekodierern sowie Verfahren für dasselbe, bei dem kodierte Signale von einem zusammengesetzten Tonsignal und einem Richtungsvektor übertragen werden. Die Erfindung ist besonders an die Benutzung in Systemen angepaßt, die äußerst niedrige Bitraten erfordern.
  • Einschlägiger Stand der Technik
  • In den US-Patenten 5 583 962, 5 632 005 und 5 633 981 sind zwei perzeptuelle Kodiersysteme mit verringerter Bitrate für Tonsignale beschrieben, die darin als "Typ I" und "Typ II" bezeichnet sind. Jedes der genannten drei Patente 5 583 962, 5 632 005 und 5 633 981 ist durch diesen Hinweis hier vollinhaltlich eingeschlossen. Gemäß einem beiden Systemen zugrundeliegenden Prinzip erzeugt ein Kodierer Frequenzteilbandsignale in Abhängigkeit von eingegebenen Tonsignalströmen, wobei die Teilbänder insgesamt den kritischen Bändern des menschlichen Ohrs entsprechen.
  • Im Kodierer des in den genannten Patenten beschriebenen Systems vom Typ I wird jeder Tonsignalstrom unabhängig kodiert, wenn eine ausreichende Anzahl Bits verfügbar ist. Wenn es an Bits mangelt, werden die Signalkomponenten in einigen oder allen Teilbändern zu einem zusammengesetzten Signal und einer Vielzahl Skalierungsfaktoren, einem Skalierungsfaktor für jeden eingegebenen Tonsignalstrom kombiniert, wobei jeder Skalierungsfaktor auf irgendeiner Größe in den Teilbandsignalkomponenten in jedem der Tonsignalströme beruht. Der Dekodierer des Typs I rekonstruiert eine Darstellung der ursprünglichen Signalströme aus dem zusammengesetzten Signal und den Skalierungsfaktoren. Damit bietet das System vom Typ I einen Biteinspar- oder Kodiergewinn gegenüber einem zweckgebundenen einzelnen System, bei dem jeder Tonsignalstrom unabhängig kodiert wird. Das System des Typs I wird bei der AC-3 Kodierung angewandt, welches die Grundlage für ein Dolby Digital perzeptuelles Kodiersystem bildet, bei dem 5.1 Tonkanäle (links, Mitte, rechts, linker Raum, rechter Raum und ein Tieftonkanal begrenzter Bandbreite) zu einem Datenstrom mit verringerter Bitrate kodiert werden.
  • Bei dem Kodierer des in den genannten Patenten beschriebenen Systems vom Typ II wird jeder Tonsignalstrom unabhängig kodiert, wenn eine ausreichende Anzahl Bits verfügbar ist. Wenn es an Bits mangelt, werden die Signalkomponenten in einigen oder allen der Teilbänder zu einem zusammengesetzten Signal und einem oder mehr Richtungsvektoren kombiniert, wobei die Richtungsvektoren die eine oder mehr Hauptrichtungen eines Schallfeldes anzeigen, welches von den Tonsignalströmen wiedergegeben wird. Der Dekodierer des Typs II rekonstruiert aus dem zusam mengesetzten Signal und dem einen oder mehr Richtungsvektoren eine Wiedergabe des von den ursprünglichen Signalströmen dargestellten Schallfeldes. Das System des Typs II bietet damit einen Biteinspar- oder Kodiergewinn gegenüber einem zweckgebundenen, einzelnen System, bei dem jeder Tonsignalstrom unabhängig kodiert wird, und gegenüber dem System des Typs I, bei dem das zusammengesetzte Signal mit Skalierungsfaktoren für jeden Tonsignalstrom assoziiert wird.
  • Die in den genannten Patenten beschriebenen Systeme des Typs I und II sind in verschiedenerlei Hinsicht adaptiv. Ein Aspekt ihrer Adaptivität besteht darin, daß eins oder mehr der Frequenzteilbänder während eines Teils der Zeit in einem "einzelnen" Modus funktionieren kann, so daß alle Teilbandkomponenten der Tonsignalströme im Frequenzteilband jeweils unabhängig kodiert und dekodiert werden, während ein Mangel an Bits beispielsweise dazu führt, daß die Teilbandkomponenten der Tonsignalströme in einem bestimmten Frequenzteilband entweder gemäß dem Ansatz des Typ I oder dem des Typ 2 kodiert werden.
  • Es ist gleichfalls bekannt, von einer Betriebsweise des Typs I zu einer des Typs II innerhalb eines oder mehrerer Frequenzteilbänder adaptiv hin und her zu wechseln. Solche Anordnungen sind Gegenstand der US Patentanmeldung von Mark Franklin Davis, Nr. 08/895, 496, eingereicht am 16. Juli 1997 unter dem Titel "Method and Apparatus for Encoding and Decoding Multiple Audio Channels at Low Bit Rates." Da das Prinzip gemäß Typ II weniger Bits erfordert als das des Typs 1 kann ein kurzfristiger Mangel an Bits überwunden werden, wenn man auf das Kodieren und Dekodieren des Typs II zurückgreift.
  • Offenbarung der Erfindung
  • Die vorliegende Erfindung bezieht sich auf Kodieren Typ II, Kodierer und Dekodierer für dasselbe sowie Umfelder, in denen derartige Dekodierer mit Vorteil eingesetzt werden. Insbesondere ist die vorliegende Erfindung auf neue Aspekte von Kodierern, Dekodierern des Typs II sowie Dekodiererumfelder gerichtet, die nicht in den genannten Patenten 5 583 962, 5 632 005 und 5 633 981 offenbart sind. Auch wenn hier offenbarte, spezifische Ausführungsbeispiele sich auf eine vereinfachte Version des Typs II beziehen, bei der die Kodierer und Dekodierer vorzugsweise zweckgebundene Vorrichtungen des Typs II sind und ein einziger Richtungsvektor angewandt wird, können gewisse Aspekte der Verbesserungen der Kodierung Typ II, die Gegenstand der Erfindung sind, an komplizierteren Formen von Systemen des Typs II angewandt werden, einschließlich der in den genannten Patenten 5 583 962, 5 632 005 und 5 633 981 beschriebenen adaptiven Anordnungen und in einem adaptiven System Typ I/Typ II, wie dem in der genannten, anhängigen Anmeldung von Davis beschriebenen. Die räumliche Natur des Kodierens mit Hilfe eines Richtungsvektors in der vereinfachten Version mit einem einzigen Richtungsvektor des Kodierers Typ II gibt Veranlassung, vielleicht von einem "räumlichen Kodierer" zu sprechen. Durchgängig wird in der vorliegenden Beschreibung die Version mit einem einzigen Vektor der Kodierung Typ II gemäß den genannten Patenten 5 583 962, 5 632 005 und 5 633 981 als "räumliches Kodieren" bezeichnet.
  • Der Erfinder ist der Meinung, daß innerhalb einer ausreichend kurzen Zeitspanne in der Größenord nung einer kleinen Anzahl von Millisekunden das menschliche Ohr Schall nur aus einer einzigen Richtung in einem kritischen Band hören kann, auch wenn Töne aus vielfachen Richtungen jeweils in unterschiedlichen Frequenzen innerhalb des kritischen Bandes vorhanden sind. Aus diesem Grund ist für ein System, bei dem der Richtungsvektor sich innerhalb eines ausreichend kurzen Zeitintervalls ändern kann, die grundlegende Form mit einem einzigen Richtungsvektor des Systems Typ II, verwirklicht in einem räumlichen Kodierer, angemessen für die Darstellung des Schallfeldes, auch wenn hiermit nicht die Möglichkeit besteht, sämtliche der Vielzahl von Kanälen kontinuierlich und gleichzeitig wiederzugeben. Diese Wirkung ist in der Konzeptdarstellung der 1 gezeigt: Ein Zuhörer 101, nimmt wahr, daß Schall innerhalb eines Teilbandes vom Punkt 111 zwischen Lautsprechern 102 und 104 kommt, obwohl Töne innerhalb des Teilbandes tatsächlich von allen Lautsprechern 102 bis 110 kommen.
  • Dieser "Einzelrichtung"-Effekt hat oberflächlich eine gewisse Ähnlichkeit mit dem bekannten "Örtlichkeitssummier"-Effekt. Bei diesem zuletzt genannten Effekt, beschrieben von Blauert (Spatial Hearing: The Psychophysics of Human Sound Localization von Jens Blauert, The MIT Press, Cambridge, Massachusetts, überarbeitete Ausgabe, 1997), vermitteln zwei oder mehr Schallquellen, die kohärente Signale innerhalb einer bestimmten Amplitude voneinander und innerhalb einer bestimmten Zeit voneinander ausstrahlen, den Eindruck eines einzigen Phantomsignals, siehe insbesondere Seiten 204, 271 und 272 des Textes von Blauert. In dem Maß, in dem ein Paar anfangs kohärenter Signale immer weniger kohärent wird, kann ein Zuhörer zunehmend besser unterschiedliche Signale feststellen, siehe insbesondere die Seiten 240 und 242 bei Blauert. Gemäß dem Einzelrichtungseffekt des gegenwärtigen Erfinders nimmt hingegen die Fähigkeit eines Zuhörers, wenn die Frequenztrennung zwischen vielen Signalen in ein kritisches Band hinein absinkt und das Zeitintervall ausreichend kurz ist, diese Signale als aus verschiedenen Richtungen kommend wahrzunehmen, gleichfalls ab.
  • Der Erfinder ist sich darüber klar, daß ein Kompromiß gefunden werden muß zwischen der Kürze des Zeitintervalls und den zusätzlichen Erfordernissen hinsichtlich der Bitrate (aufgrund höherer Abtastgeschwindigkeiten), die sich wegen des kürzer werdenden Zeitintervalls stellen mögen (siehe Beschreibung weiter unten auf Seite 28). So kann bei einem System mit sehr niedriger Bitrate, bei dem die Abtastrate weniger als optimal ist für den Einzelrichtungseffekt ein gewisser Verlust an mehr Richtungs- und mehr Signalwahrnehmung des Zuhörers und Genauigkeit der Schallortung unter bestimmten Signalbedingungen eintreten. Trotzdem ist es wahrscheinlich, daß die erhaltene Wiedergabe eine angenehme und akzeptable Hörerfahrung aus vielen Richtungen bietet. Die vorliegende Erfindung ist besonders nützlich zur Verwendung in Sende- oder Aufzeichnungssystemen, bei denen die Bitraten äußerst beschränkt sind, beispielsweise im Fall von Audio übers Internet.
  • Ein Aspekt der vorliegenden Erfindung beruht auf der Kenntnis, daß was bisher als Mängel räumlicher Kodierung angesehen wurde, hauptsächlich eine Wirkung des "Signalabtauchens", tatsächlich Tugenden sind, wenn die räumliche Kodierung in einer Tonwiedergabeanordnung angewandt wird, bei der der oder die Zuhörer sich an vorhersagbarem Ort innerhalb eines Zuhörbereichs befinden. Die Erfindung ist besonders gut geeignet für Zuhörumgebungen, in denen sich ein oder vielleicht auch zwei Zuhörer voraussagbar an einer Stelle befinden, die man als "Vorzugsplatz für räumliche Kodierung" bezeichnen könnte, wie weiter unten im Zusammenhang mit den 2, 3 und 4 noch beschrieben wird. Die Tatsache, daß mit räumlichem Kodieren innerhalb eines solchen Zuhörbereiches, nämlich einem Vorzugsplatz für räumliche Kodierung, ein an Artefakten freies Schallfeld erzeugt werden kann, ist ein unerwartetes Ergebnis. Am Vorzugsplatz für räumliche Kodierung wird die Signalabtauchwirkung von einem oder mehr Zuhörern psychoakustisch nicht wahrgenommen. Es wird ein stabiles, normales Schallfeld erhalten.
  • 2 zeigt einen Zuhörer 202, der sich in einem vorhersagbaren Zuhörbereich, einem idealisierten, im wesentlichen kreisförmigen Vorzugsplatz für räumliche Kodierung 204, inmitten von fünf Lautsprechern – links (206), Mitte (208), rechts (210), linker Raum (212) und rechter Raum (214), einer typischen Anordnung für Runduz-Raumklangwiedergabe, befindet.
  • In PC-Tonsystemen ("Multimedia") werden üblicherweise nur zwei Lautsprecher verwendet, ein linker und ein rechter Lautsprecher, die neben oder in der Nähe des Bildschirmgeräts stehen (und wahlweise ein Tieftonlautsprecher, der entfernt, beispielsweise auf dem Fußboden angeordnet sein kann – der Tieftonlautsprecher ist in der vorliegenden Beschreibung außer acht gelassen). Die beiden Lautsprecher erzeugen einen verhältnismäßig kleinen optimalen Zuhörbereich. 3 zeigt einen Zuhörer 302 in einem vorhersagbaren Zuhörbereich, einem idealisierten Vorzugsplatz für räumliche Kodierung 304, vor einem Computerbildschirm 306, an dessen Seiten sich ein linker (308) und rechter (310) Lautsprecher befinden. In aufwendigeren Computertonsystemen können mehr als zwei Lautsprecher nach Art der Anordnung gemäß 2 verwendet sein (der Computerbildschirm würde sich dann an der gleichen Stelle befinden wie der Mitte-Lautsprecher, zwischen dem linken und rechten Lautsprecher).
  • Ein ähnlicher kleiner, optimaler Zuhörbereich entsteht bei einigen Fernsehgeräten, bei denen beiderseits des Bildschirms ein Lautsprecherpaar angeordnet ist. 4 zeigt einen Zuhörer 402 in einem vorhersagbaren Zuhörbereich, einem idealisierten Vorzugsplatz für räumliche Kodierung 404, vor einem Fernsehgerät 406 mit eingebauten Lautsprechern links (408) und rechts (410) neben der Bildröhre 412. Aufwendigere Fernsehtonsysteme können mehr als zwei Lautsprecher nach Art der in 2 gezeigten Anordnung umfassen. Zum Beispiel könnte der Fernseher in das Gehäuse integrierte Links-, Mitte- und Linkslautsprecher umfassen, oder diese Lautsprecher könnten sich zusammen mit Raumklanglautsprechern außerhalb des Fernsehgehäuses befinden.
  • Mit dem Dolby AC-3 System und vielen anderen Systemen wird der vorhersagbare Ort eines Zuhörers vor einem Rechner- oder Fernsehtonsystem nicht voll ausgenutzt, wodurch in solchen Umgebungen Bits verschwendet werden. Auch wenn die räumliche Kodierung bei den in 1, 2 und 3 gezeigten Umgebungen beispielsweise besonders nützlich ist, ist räumliche Kodierung auch in größeren Umfeldern von Nutzen, wobei sich von selbst versteht, daß die Größe des vorhersagbaren Zuhörbereichs mit dem Abstand zwischen den Lautsprechern zunimmt. Räumliche Kodierung kann in größeren Umfeldern auch selbst für Zuhörer nützlich sein, die sich außerhalb des vorhersagbaren Zuhörbereichs befinden, wenn sie nur während kurzer, an Bits armer Zeitintervalle angewandt wird.
  • In einem vereinfachten Raumklangsystem mit räumlichem Kodierer (d.h. einem System Typ II, welches mit nur einem einzigen Richtungsvektor arbeitet) braucht nur ausreichend viel Information gesendet zu werden, um einen Zuhörer in einem vorhersagbaren Zuhörbereich oder einem Vorzugsplatz für räumliche Kodierung zufriedenzustellend. Man braucht nicht zu versuchen, sämtliche Daten verfügbar zu machen, die nötig sind, um beispielsweise alle fünf Kanäle als genaue Wiedergaben der fünf Eingangskanäle wiederherzustellen, wie das beim AC-3 System geschieht. Das führt zu einer signifikanten Verringerung an Bits. So ist der räumliche Kodierer insofern sehr wirkungsvoll, als er nicht irgend etwas kodiert, was im vorhersagbaren Zuhörbereich zu keinem Moment zu hören ist. Dieses vereinfachte System kann sogar noch für, sagen wir zwei Zuhörer funktionieren, vorausgesetzt sie sind einander nahe und innerhalb des vorhersagbaren Ortes.
  • Die Nebenwirkung des "Signalabtauchens" bei dieser vereinfachten Behandlung besteht darin, daß für einen Zuhörer, wenn er sich aus dem vorhersagbaren Ort bewegt und an irgendeinen bestimmten Lautsprecher ein Ohr anlegt, mit dem sich ändernden Programminhalt ein Ton erscheinen und verschwinden kann – die Signalabtauchwirkung (das Signal aus einem bestimmten Lautsprecher kann "abtauchen" oder durch Signale aus anderen Kanälen moduliert werden). Diese Wirkung ist genau das, was Klarinettisten schon immer wußten; ihre stillen Beiträge für die Zuhörerschaft verschwinden mit jedem Posaunenstoß und erscheinen wundersamerweise erneut, sobald man sie wieder entlastet. Eine solche Nebenwirkung wäre bei einer großen Zuhörerschaft in kommerziellen Theatern oder auch zuhause, wo Zuhörer (statt innerhalb eines verhältnismäßig kleinen Vorzugsplatzes für räumliche Kodierung, wie in 3 gezeigt) im Raum verteilt sind, zwar nicht akzeptabel; aber für einen oder zwei Zuhörer in einem vorhersagbaren Zuhörbereich ist die Wirkung milde und nicht hörbar. Aber, wie schon gesagt, kann räumliches Kodieren auch für kommerzielle Theater und zuhause für große Zuhörerschaften nützlich sein, wenn die Zuhörer im Raum verteilt sind, vorausgesetzt, es wird nur während kurzer Zeitintervalle angewandt, beispielsweise solange Bedingungen eines extremen Bitmangels herrschen.
  • Die Nebenwirkung des Signalabtauchens beim räumlichen Kodieren ist innerhalb des vorhersagbaren Zuhörbereichs unhörbar, so daß die Bitanforderungen des Kodierers auf diejenigen begrenzt werden können, die zum Erzeugen eines angenehmen Höreindrucks innerhalb dieses Bereichs absolut nötig sind. Ein Ergebnis nach Art des "direkten Drahts zum Vorteil" ist gar nicht beabsichtigt, aber es wird doch eine gute, praktikable, erfreuliche Wirkung innerhalb des Vorzugsplatzes für räumliche Kodierung mit guter Lokalisierung und minimalen Artefakten wahrgenommen.
  • Um die Raumklangwirkung einer Tonwiedergabeanordnung mit zwei Lautsprechern am Rechner oder Fernsehgerät zu verbessern, ist es vorteilhaft, die dekodierten räumlichen Kodierersignale "räumlich zu gestalten", indem man einen "Raumeffektgestalter" ("spatializer") benutzt, der eine Löschvorrichtung für akustisches Nebensprechen (oder Quereinkopplung) umfaßt. Stereomaterial erzeugt bei einer Wiedergabe über zwei Lautsprecher mittels herkömmlicher Mittel im allgemeinen Tonabbildungen, die auf die zwei Lautsprecher selbst und den Raum dazwischen beschränkt sind. Diese Wirkung resultiert aus der Quereinspeisung des akustischen Signals von jedem Lautsprecher in das entfernte Ohr eines vor dem Computerbildschirm sitzenden Zuhörers. Durch das Anlegen der Raumkanalsignale an eine Löschvorrichtung für akustisches Nebensprechen und Summieren der verarbeiteten Signale mit den Links- und Rechtssignalen ist es möglich, die Wahrnehmung hervorzurufen, daß Raumklanginformation von virtuellen Lautsprecherorten hinter oder seitlich von einem Zuhörer kommt, wenn nur zwei vor ihm angeordneten Lautsprecher benutzt werden (die Links- und Rechtskanalsignale kommen von den tatsächlichen Lautsprecherorten, wie es gewöhnlich der Fall wäre).
  • Der Ursprung der Löschvorrichtung für akustisches Nebensprechen wird gewöhnlich B.S. Atal und Manfred Schrieder der Bell Telephone Laboratories zugeschrieben (siehe beispielsweise US Patent 3 236 949, das durch diesen Hinweis hier vollinhaltlich eingeschlossen wird). Wie ursprünglich von Schroeder und Atal beschrieben, kann die akustische Nebensprechwirkung gemildert werden, wenn man ein geeignetes Löschsignal vom entgegengesetzten Lautsprecher einführt. Da das Löschsignal selbst akustisch quereinkoppelt, muß es auch durch ein geeignetes Signal des ursprünglich aussendenden Lautsprechers gelöscht werden und so weiter.
  • 5A ist ein Funktionsblockschaltbild einer Art von Raumeffektgestalter mit einem Löschnetz für Tonnebensprechen gemäß der vorliegenden Erfindung, kann verwendet werden. Es werden fünf Toneingangssignale, links, Mitte, rechts, linker Raum und rechter Raum wie beim Dolby Digital AC-3 System empfangen. Die Eingänge werden jeweils an wahlweise vorgesehene DC-Blockierfilter 502, 504, 506, 508 und 510 angelegt. Wahlweise vorgesehene Verzögerungsglieder 512, 514 und 516 in den Links- Mitte- und Rechtseingangsleitungen haben Zeitverzögerungen in Übereinstimmung mit dem Zeitversatz, falls vorhanden, im Löschnetz für Nebensprechen 520. Gewöhnlich gibt es im Netz 520 keinen Zeitversatz, und die Verzögerungsglieder 512, 514 und 516 sind weggelassen, wenn nicht ein Netz 556 beispielsweise einen Amplitudenkompressor/Begrenzer umfaßt. Die Eingaben in das Löschnetz 520 sind bei diesem Beispiel die vom linken Raum und rechten Raum. Ein vereinfachtes Ausführungsbeispiel des Löschnetzes 520 wird im Zusammenhang mit dem in 5C gezeigten Ausführungsbeispiel beschrieben. Unter nochmaligem Hinweis auf 5A empfängt ein erstes, lineares additives Summierglied 522 den verzögerten Tonsignalstrom des Linkskanals. Ein zweites lineares, additives Summierglied 524 empfängt den verzögerten Tonsignalstrom des Rechtskanals. Der verzögerte Tonsignalstrom des Mittekanals wird an das Summierglied 522 und das Summierglied 524 angelegt. Der verarbeitete Tonsignalstrom des linken Raumkanals vom Netz 520 wird gleichfalls dem Summierglied 522 zugeführt. Auch der verarbeitete Tonsignalstrom des rechten Raumkanals vom Netz 520 wird dem Summierglied 524 zugeleitet. Im Löschnetz werden nur die Tonsignalströme des linken und rechten Raumkanals verarbeitet. Die Kanäle links vorn und rechts vorn werden zu den im Löschnetz verarbeiteten Kanälen linker Raum beziehungsweise rechter Raum addiert. Der Mittekanal wird phasengleich ohne weitere Verarbeitung dem linken und rechten Ausgang hinzugefügt.
  • Die in 5A gezeigte Anordnung kann auch angewandt werden, wenn es vier Eingangssignale gibt (Links-, Mitte- und Rechtskanal, ein einziger Raumkanal) wie von einem Dekodierer "Dolby Surround" oder "Dolby Surround Pro Logic" vorgesehen. In diesem Fall sollten durch Aufheben der Korrelation aus dem einzigen Raumkanal zwei pseudostereophone Signale gemacht werden, die ihrerseits an die Eingänge der Löschvorrichtung angelegt werden. Eine einfache Pseudostereoumwandlung kann benutzt werden, die mit Phasenverschiebung arbeitet, so daß ein Signal mit dem anderen außer Phase ist. Es sind viele weitere Pseudostereoumwandlungstechniken bekannt.
  • 5B zeigt zusätzliche Alternativen für den Raumeffektgestalter gemäß 5A. In 5B sind die Kanäle links und rechts vorn durch teilweises Gegenphasemischen im Block 526 geringfügig erweitert. Gegenphasemischen zum Erweitern der scheinbaren Stereo-"Stufe" ist eine allgemein bekannte Technik. Als weitere Option kann der Mittekanal gelöscht werden, um die Färbung auf ein Minimum einzuschränken, die daraus resultiert, daß das Mittesignal von jedem Ohr zweimal gehört wird – einmal vom nahen Lautsprecher und noch einmal vom entfernten Lautsprecher. Statt der Verwirklichung einer eigenen Löschvorrichtung können die akustischen Quereinkopplungssignale des Mittekanals dadurch gelöscht werden, daß sie an das Löschnetz für Nebensprechen auf dem Raumkanal angelegt werden. So wird das Mittekanalsignal über die linearen, additiven Summierglieder 526 bzw. 528 in die Eingänge linker Raum und rechter Raum ins Löschnetz für Nebensprechen 520 eingemischt.
  • 5C ist ein Funktionsblockschaltbild der Grundelemente einer einfachen Löschvorrichtung für akustisches Nebensprechen, die in den Anordnungen gemäß 5A oder 5B verwendbar ist. Es können aber auch andere, kompliziertere Löschvorrichtungen angewandt werden. Jedes Verzögerungsglied 530 und 532 hat üblicherweise etwa 140 Mikrosekunden für Lautsprecher, die in Bezug auf einen Zuhörer vor ihm unter Winkeln von +/– 15° angeordnet sind, einem typischen Winkel für die in 1 gezeigte Umgebung eines Computerbildschirms und die in 2 gezeigte Umgebung eines Fernsehgeräts. Jeder der Filter 534 und 536 ist ganz einfach ein frequenzunabhängiger Dämpfungsfaktor K, normalerweise etwa 0,9. Die Eingabe jedes Quereinkopplungsschenkels 538 und 540 wird von der Ausgabe eines additiven Summiergliedes (542 bzw. 544) in einer Kreuzkanalanordnung mit negativer Rückkopplung entnommen (jeder Schenkel wird am jeweiligen Summierglied subtrahiert), um aus jedem vorhergehenden Löschsignal ein Löschsignal zu erzeugen, wie vorstehend beschrieben. Das ist digital eine sehr leicht zu verwirklichende Löschvorrichtung für akustisches Nebensprechen: zwei Summierungen, zwei Multiplikationen und ein Paar 6-Abtastwert-Ringpuffer für die Verzögerungen. Vorzugsweise wird die Löschvorrichtung für akustisches Nebensprechen, falls gebraucht, digital in Software verwirklicht und in Echtzeit auf einem PC laufen gelassen, der dem Bildschirmgerät 306 in 3 oder einem Mikroprozessor im Fernsehgerät 406 gemäß 4 zugeordnet ist.
  • Gemäß der vorliegenden Erfindung bringt ein Kodierer ein zusammengesetztes Toninformationssignal hervor, welches das wiederherzustellende Schallfeld und einen Richtungsvektor bzw. ein "Steuerkontrollsignal" wiedergibt. Das Frequenzspektrum des zusammengesetzten Toninformationssignals ist in eine Anzahl von Teilbändern aufgeteilt, die vorzugsweise mit den kritischen Bändern des menschlichen Ohrs übereinstimmen. Das Steuerkontrollsignal hat eine Komponente, die sich auf die dominante Richtung des Schallfeldes in jedem der Teilbänder bezieht.
  • Auch wenn die Erfindung mittels analoger oder digitaler Techniken oder sogar einer hybriden Anordnung derselben verwirklicht werden kann, ist eine Verwirklichung der Erfindung mit Hilfe digitaler Techniken zweckmäßiger, und die hier offenbarten, bevorzugten Ausführungsbeispiele sind digitale Verwirklichungen.
  • Bei einem Ausführungsbeispiel der Erfindung empfängt ein Kodierer eine Vielzahl Tonsignalströme, die jeweils einen Eingangskanal und Lokalisierungseigenschaften jedes dieser Eingangskanäle darstellen. Der Dekodierer empfängt ein kodiertes Signal ebenso wie den Ort oder virtuellen Ort des Schallwandlers für jeden Ausgangskanal und liefert einen Signalstrom für jeden Ausgangskanal, um das durch die Eingangskanalsignale wiedergegebene Schallfeld so genau wie möglich wiederherzustellen. Da das räumliche Kodierschema gemäß der vorliegenden Erfindung von der Prämisse ausgeht, daß in jedem Moment nur Schall aus einer einzigen Richtung gehört wird, braucht der Dekodierer immer nur jeweils ein Signal nicht an mehr als zwei Schallwandler anzulegen. Die kodierte Information enthält für jedes Teilband eine angesammelte Wiedergabe sämtlicher Eingangskanäle. Die angesammelte Wiedergabe weist ein zusammengesetztes Toninformationssignal, welches den gesamten Nettoschallfeldpegel wiedergibt, und ein Steuerkontrollsignal auf, das Lokalisierungsinformation für das Schallfeld aufweist. Diese Lokalisierungsinformation wird hier als Nettorichtungsvektor bezeichnet.
  • Auch im Dekodierer ist es so, daß nur eine Richtung Bits erhält, so daß innerhalb jedes kritischen Bandes nur ein oder zwei Darstellungskanäle während jedes Zeitintervalls Bits bekommen (ein Darstellungskanal ist angemessen, wenn die Schallfeldrichtung zufällig mit der Darstellungskanalrichtung kongruent ist; ansonsten sind zwei Darstellungskanäle nötig, um die Schallfeldrichtung zu positioneren).
  • Ein Aspekt der Erfindung ist ein räumliches Kodiersystem mit
    niedriger Bitrate zum Kodieren einer Vielzahl von ein Schallfeld wiedergebenden Tonsignalströmen zu einem kodierten Signal und zum Dekodieren des kodierten Signals, wobei das System einen Kodierer und einen Dekodierer umfaßt. Der Kodierer weist folgendes auf:
    einen Teilbandsignalgenerator, der eine Vielzahl von Teilbändern in Abhängigkeit von der Vielzahl der Tonsignalströme erzeugt, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt,
    einen Signalkombinierer, der ein zusammengesetztes Signal erzeugt, welches die Kombination von Teilbandsignalen in den jeweiligen Frequenzteilbändern wiedergibt,
    einen Schallfeldrichtungsdetektor, der ein Steuerkontrollsignal für das zusammengesetzte Signal erzeugt, welches die Hauptrichtung des Schallfeldes in jeweiligen Teilbändern anzeigt;
    einen Kodierer und Bitzuteiler, der kodierte Information durch Zuordnen von Bits zu dem zusammengesetzten Signal und Steuerkontrollsignal erzeugt, und
    einen Formatierer, der die kodierte Information zu einem kodierten Signal zusammenfügt.
  • Der Dekodierer weist folgendes auf:
    einen Deformatierer, der das zusammengesetzte Signal und Steuerkontrollsignal aus dem kodierten Signal ableitet,
    einen inversen Teilbandgenerator, der Teilbandsignale in Abhängigkeit von dem zusammengesetzten Signal und dem Steuerkontrollsignal ableitet,
    eine Informationseingabe, welche die Zahl der Ausgangskanäle des Dekodierers und den Ort oder virtuellen Ort von Schallwandlern beschreibt, die mit den jeweiligen Ausgangskanälen verbunden sind, wobei drei oder mehr Ausgangskanäle vorhanden sind, und
    einen Signalgenerator, der einen Tonsignalstrom in nicht mehr als zwei Ausgangskanälen zur Zeit in Abhängigkeit von den Teilbandsignalen und Wiedergabeinformation erzeugt.
  • Ein weiterer Aspekt der Erfindung ist ein räumliches Kodiersystem mit niedriger Bitrate zum Kodieren einer Vielzahl von ein Schallfeld wiedergebenden Tonsignalströmen zu einem kodierten Signal, Dekodieren des kodierten Signals und Wiederherstellen eines Hörebenbildes des Schallfeldes, wobei das System einen Kodierer und einen Dekodierer umfaßt. Der Kodierer weist folgendes auf:
    einen Teilbandsignalgenerator, der eine Vielzahl Teilbandsignale in Abhängigkeit von der Vielzahl der Tonsignalströme erzeugt, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt,
    einen Signalkombinierer, der ein zusammengesetztes Signal erzeugt, welches die Kombination aus Teilbandsignalen in jedem Frequenzteilband wiedergibt,
    einen Schallfeldrichtungsdetektor, der ein Steuerkontrollsignal für das zusammengesetzte Signal erzeugt, welches die Hauptrichtung des Schallfeldes in jedem Teilband anzeigt,
    einen Kodierer und Bitzuteiler, der durch Zuordnen von Bits zum zusammengesetzten Signal und Steuerkontrollsignal kodierte Information erzeugt, und
    einen Formatierer, der die kodierte Information zu einem kodierten Signal zusammenfügt.
  • Der Dekodierer weist folgendes auf:
    einen Deformatierer, der das zusammengesetzte Signal und Steuerkontrollsignal von dem kodierten Signal ableitet,
    einen inversen Teilbandgenerator, der Teilbandsignale in Abhängigkeit von dem zusammengesetzten Signal und Steuerkontrollsignal ableitet,
    eine Informationseingabe, welche die Zahl der Ausgangskanäle des Dekodierers und einen Ort oder virtuellen Ort von Schallwandlern beschreibt, die mit den jeweiligen Ausgangskanälen verbunden sind, und
    einen Signalgenerator, der einen Tonsignalstrom in einem oder mehr Ausgangskanälen in Abhängigkeit von den Teilbandsignalen und Wiedergabeinformation erzeugt.
  • Das System weist ferner folgendes auf:
    eine Vielzahl Schallwandler, die mit den Ausgangskanälen des Dekodierers gekoppelt und so angeordnet sind, daß sie ein Hörebenbild des Schallfeldes für einen oder mehr Zuhörer innerhalb eines Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugen.
  • Noch ein weiterer Aspekt der Erfindung ist ein Dekodierer zur Verwendung in einem räumlichen Kodiersystem mit niedriger Bitrate zum Dekodieren eines kodierten Signals, welches aus einer Vielzahl von ein Schallfeld wiedergebenden Tonsignalströmen abgeleitet ist, durch Erzeugen einer Vielzahl von Teilbandsignalen in Abhängigkeit von der Vielzahl der Tonsignalströme, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt, Erzeugen eines zusammengesetzten Signals, welches die Kombination von Teilbandsignalen in jeweiligen Frequenzteilbändern wiedergibt, Erzeugen eines Steuerkontrollsignals für das zusam mengesetzte Signal, welches die Hauptrichtung des Schaltfeldes in jeweiligen Teilbändern anzeigt, Erzeugen kodierter Information durch Zuordnen von Bits zum zusammengesetzten Signal und Steuerkontrollsignal und Zusammenfügen der kodierten Information zu einem kodierten Signal. Der Dekodierer weist folgendes auf:
    einen Deformatierer, der das zusammengesetzte Signal und Steuerkontrollsignal von dem kodierten Signal ableitet,
    einen inversen Teilbandgenerator, der Teilbandsignale in Abhängigkeit von dem zusammengesetzten Signal und Steuerkontrollsignal ableitet,
    eine Informationseingabe, die die Zahl der Ausgangskanäle des Dekodierers und den Ort oder virtuellen Ort von Schallwandlern beschreibt, die mit den jeweiligen Ausgangskanälen verbunden sind, wobei es drei oder mehr Ausgangskanäle gibt, und
    einen Signalgenerator, der einen Tonsignalstrom in nicht mehr als zwei Ausgangskanälen zur Zeit in Abhängigkeit von den Teilbandsignalen und Wiedergabeinformation erzeugt.
  • Noch ein weiterer Aspekt der Erfindung ist ein Dekodierer- und Wiederherstellungssystem zur Verwendung in einem räumlichen Kodiersystem niedriger Bitrate zum Dekodieren und Wiedergeben eines kodierten Signals, welches aus einer Vielzahl von ein Schallfeld wiedergebenden Tonsignalströmen abgeleitet ist, durch Erzeugen einer Vielzahl von Teilbandsignalen in Abhängigkeit von der Vielzahl der Tonsignalströme, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt, Erzeugen eines zusammengesetzten Signals, welches die Kombination aus Teilbandsignalen in jeweiligen Frequenzteilbändern wiedergibt, Erzeugen eines Steuerkontrollsignals für das zusammengesetzte Signal, welches die Hauptrichtung des Schallfeldes in jeweiligen Teilbändern anzeigt, Erzeugen kodierter Information durch Zuteilen von Bits zum zusammengesetzten Signal und Steuerkontrollsignal, und Zusammenfügen der kodierten Information zu einem kodierten Signal. Das Dekodierer- und Wiedergabesystem weist folgendes auf:
    einen Deformatierer, der das zusammengesetzte Signal und Steuerkontrollsignal von dem kodierten Signal ableitet,
    einen inversen Teilbandgenerator, der Teilbandsignale in Abhängigkeit von dem zusammengesetzten Signal und Steuerkontrollsignal ableitet,
    eine Informationseingabe, die die Zahl der Ausgangskanäle des Dekodierers und den Ort oder virtuellen Ort von Schallwandlern anzeigt, die mit den jeweiligen Ausgangskanälen verbunden sind, und
    einen Signalgenerator, der einen Tonsignalstrom in einem oder mehr Ausgangskanälen in Abhängigkeit von den Teilbandsignalen und Wiedergabeinformation erzeugt, und
    eine Vielzahl von Schallwandlern, die mit den Ausgangskanälen des Dekodierers gekoppelt und so angeordnet sind, daß sie ein Hörebenbild des Schallfeldes für einen oder mehr Zuhörer innerhalb eines Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugen.
  • Die verschiedenen Merkmale der Erfindung und ihre bevorzugten Ausführungsbeispiele werden in der folgenden Beschreibung "Beste Art und Weise zum Ausführen der Erfindung" und den beigefügten Zeichnungen mehr im einzelnen erläutert.
  • Kurzbeschreibung der Zeichnungen
  • 1 ist ein Konzeptschema und zeigt eine Person, die einem von einer Vielzahl von Präsentationskanälen erzeugten Schallfeld zuhört, aber wahrnimmt, daß ein Ton von einem Punkt kommt.
  • 2 ist eine schematische Draufsicht und zeigt einen Zuhörer an einem idealisierten Vorzugsplatz räumlicher Kodierung in einer Raumklangwiedergabeanordnung zwischen fünf Lautsprechern.
  • 3 ist eine schematische Draufsicht und zeigt einen Zuhörer an einem idealisierten Vorzugsplatz räumlicher Kodierung vor einem Computerbildschirm mit Lautsprechern an den Seiten.
  • 4 ist eine schematische Draufsicht und zeigt einen Zuhörer an einem idealisierten Vorzugsplatz räumlicher Kodierung vor einem Fernsehgerät mit der Bildröhre benachbarten Lautsprechern.
  • 5A ist ein Funktionsblockschaltbild eines Raumeffektgestalters mit einer Löschvorrichtung für akustisches Nebensprechen.
  • 5B ist ein Funktionsblockschaltbild eines modifizierten Raumeffektgestalters mit einer Löschvorrichtung für akustisches Nebensprechen.
  • 5C ist ein Funktionsblockschaltbild einer einfachen Löschvorrichtung für akustisches Nebensprechen mit vier Anschlüssen gemäß dem Stand der Technik.
  • 6 ist ein Konzeptblockschaltbild und zeigt räumliches Kodieren und Dekodieren.
  • 7 ist ein Funktionsblockschaltbild des Grundaufbaus eines Teilbandkodierers.
  • 8 ist ein Funktionsblockschaltbild des Grundaufbaus eines Teilbanddekodierers.
  • 9 ist ein Funktionsblockschaltbild des Grundaufbaus der Erfindung in Bezug auf die Teilbandkodierung.
  • 10 ist ein Funktionsblockschaltbild des Grundaufbaus der Erfindung in Bezug auf die Teilbanddekodierung.
  • 11 ist eine hypothetische graphische Darstellung eines Wiedergabesystems in drei Dimensionen mit fünf Präsentationskanälen.
  • 12A ist ein schematisches Funktionsblockschaltbild eines räumlichen Dekodierers, der im Zusammenhang mit einer vorhersagbaren Abspielumgebung arbeitet.
  • 12B ist ein schematisches Funktionsblockschaltbild eines räumlichen Dekodierers, der im Zusammenhang mit einer weiteren vorhersagbaren Abspielumgebung arbeitet.
  • Beste Art und Weise zum Ausführen der Erfindung
  • 6 ist eine Konzeptionsdarstellung eines Ausführungsbeispiels des Kodiersystems Typ II. Ein Kodierer, der Prozesse 604 und 606 aufweist, empfängt von einem in 7 gezeigten Teilbandkodierer Teilbandsignale, die ein Schallfeld von einer Vielzahl von Eingabekanälen 602 darstellen und empfängt von einem Weg 603 Information darüber, wie das Schallfeld auf jeden dieser Eingabekanäle abgebildet ist. Der Prozeß 604 kombiniert die Signale zu einem zusammengesetzten Toninformationssignal, welches er längs eines Weges 608 weitergibt. Der Prozeß 606 etabliert ein Steuerkontrollsignal, welches die scheinbare Richtung des Schallfeldes wiedergibt und welches er längs eines Weges 610 weitergibt. Ein Dekodierer, der einen Prozeß 612 aufweist, empfängt von einem Weg 613 Information für die Zahl der Ausgangskanäle und die tatsächliche oder virtuelle räumliche Konfiguration von Ausgangskanalschallwandlern im Präsentationssystem, empfängt ein zusammengesetztes Kanalsignal von den Wegen 608 und 610 und erzeugt Ausgabesignale längs Ausgangskanälen 614 zur Darstellung des Schallfeldes.
  • Bei Anwendungen des räumlichen Kodierers in der Praxis ist die Information an den Kodierer eine Vielfalt von Signalströmen, die Eingabekanäle wiedergeben. Der Kodierer befaßt sich mit dem gewünschten wiederhergestellten Schallfeld und muß deshalb Information darüber empfangen, wie diese Eingabekanäle zu dem Schallfeld in Beziehung stehen sollen. Beispielsweise im Fall einer Fünfkanalquelle mit Wiedergabe links, Mitte, rechts, linker Raum und rechter Raum mittels insgesamt standardisierter Lautsprecherorte kann der Nettorichtungsvektor von den fünf Kanalsignalen abgeleitet werden, die an diese Lautsprecherorte angelegt werden sollen.
  • Ein räumlich kodierender Dekodierer, der Information zur Abspiel- oder Präsentationsumgebung empfangen soll, kann den Nettorichtungsvektor benutzen, um einen Signalsatz für die beabsichtigte Fünfkanalabspiel- oder Darstellungsumgebung oder für eine andere Abspiel- oder Präsentationsumgebung mit einer anderen Anzahl von Kanälen und/oder Lautsprecherorten zu erzeugen. Beispielsweise kann das zusammengesetzte Toninformationssignal und der Nettorichtungsvektor für ein Computerbildschirmumfeld mit zwei Lautsprechern dekodiert werden. Wie schon gesagt, kann die Dekodierung einen "Raumeffektgestalter" umfassen, so daß die resultierende Darstellung die psychoakustische Wirkung eines Schallfeldes bietet, welches nicht auf die beiden Lautsprecher und den Raum zwischen ihnen begrenzt ist.
  • Die Erfindung ist weder auf die Benutzung bei einem bestimmten Schema zum Erzeugen mehrerer Eingabekanäle, noch auf irgendein bestimmtes Schema zum Einfangen oder Neuerschaffen von Schallfeldern begrenzt. Die Erfindung akzeptiert als Eingabe am Kodierer jeden beliebigen Satz mehrerer Eingabekanäle mit Informationen, die nötig sind, um festzulegen, wie der Erzeuger der Eingabekanäle sie für die Erzeugung eines Schallfeldes beabsichtigt hatte, z.B. deren beabsichtigte Richtung in Bezug auf den Zuhörer. Der Kodierer übersetzt diese Information und diese Tonkanäle in ein zusammengesetztes Toninformationssignal und ein Steuerkontrollsignal als Nettorichtungsvektor, so daß der Dekodierer als Ausgabe einen Satz von Präsentationskanälen bereitstellen kann, die das bestmögliche Schallfeld in Übereinstimmung mit den Möglichkeiten des Abspiel- oder Wiedergabegeräts und der Umgebung hervorbringen. Die Anzahl der vom Dekodierer erzeugten Kanäle wird von Eigenschaften des Darstellungssystems diktiert und ist deshalb nicht notwendigerweise gleich der Zahl der Eingabekanäle.
  • Die vorliegende Erfindung läßt sich auf Teilbandkodierer anwenden, die durch eines von vielen bekannten Verfahren verwirklicht sind. Eine bevorzugte Verwirklichung arbeitet mit einer Transformation, genauer gesagt einer Transformation von der Zeitdomäne in die Frequenzdomäne gemäß der TDAC-Technik (Time Domain Aliasing Cancellation), siehe Princen und Bradley "Analysis/Synthesis Filter Bank Design Based on Time Aliasing Cancellation", IEEE Trans. on Acoust., Speech, Signal Proc. Bd. ASSP-34, 1986, SS. 1153–1161. Ein Beispiel eines Transformationskodierer/Dekodierersystems mit TDAC-Transformation findet sich in der US Patentschrift 5 109 417, die durch diesen Hinweis hier vollinhaltlich eingeschlossen ist.
  • Wie 7 zeigt, weist typische Einkanalteilbandkodierung das Aufteilen eines eingegebenen Signalstroms 810 in Teilbänder mittels einer Filterbank 710, das Umwandeln der Teilbandinformation in quantisierte Codewörter mittels eines Kodierers 730 und das Zusammenfügen der quantisierten Codewörter zu einer zum Senden oder Speichern geeigneten Form mittels eines Formatierers 740 auf. Wenn die Filterbank durch digitale Filter oder diskrekte Transformationen verwirklicht ist, wird das Eingabesignal vor dem Filtern mittels der Filterbank von einem Abtaster 700 abgetastet und digitalisiert. Wenn die Filterbank durch analoge Filter verwirklicht ist, können die Teilbandsignale mittels eine Abtasters 720 zur digitalen Kodierung mittels eines Kodierers 730 abgetastet und digitalisiert werden. Gemäß einem Aspekt bezieht sich die vorliegende Erfindung auf den Kodierer 730 für mehrere Informationskanäle. Zum Beispiel bildet jede der Eingaben 602 in 6 Teilbandinformation, die an den Kodierer 730 gelangt.
  • Wie 8 zeigt, weist typische digitale Einkanalteilbanddekodierung das Auseinandernehmen der formatierten Codewörter mittels eines Deformatierers 810, Wiederherstellen der Teilbandinformation mittels eines Dekodierers 820 und Verschmelzen der Teilbandinformation mittels einer inversen Filterbank 840 zu einem Einkanalsignal auf. Wenn die inverse Filterbank von analogen Filtern gebildet und das Signal digital kodiert ist, wird die Teilbandinformation vor dem Filtern in der inversen Filterbank mittels eines Umsetzers 830 in analoge Form umgesetzt. Ist die inverse Filterbank von digitalen Filtern oder diskreten Transformationen gebildet, wird das digitale Signal mittels eines Umsetzers 850 in analoge Form umgesetzt. Ansonsten bezieht sich die vorliegende Erfindung auf den Dekodierer 820 für mehrere Informationskanäle.
  • Die Teilbandsteuerung kombiniert Teilbandspektralkomponenten aus einem oder mehr Kanälen zu einem zusammengesetzten Signal. Die zusammengesetzte Darstellung des Teilbandes wird anstelle der Teilbandspektralkomponenten individueller Kanäle die vom zusammengesetzten Kanalteilband wiedergegeben werden, gesendet oder aufgezeichnet. Es gibt zwei gleichwertige Verfahren zum Schaffen eines zusammengesetzten Kanals. Mit dem einen oder anderen Verfahren wird das gleiche Ergebnis erhalten. Ein Ansatz besteht darin, zunächst Einlagerungskanal-Maskierkriterien auf jeden Kanal anzuwenden, um die Zahl der für jeden Kanal erforderlichen Bits zu verringern, indem die Kodierung maskierter Signalkomponenten ausgeschlossen wird, und dann als nächstes nach der Bitreduzierung die Kanäle zu kombinieren, um ein zusammengesetztes Signal zu erzeugen. Der nachfolgend noch mehr im einzelnen beschriebene andere Ansatz besteht darin, zunächst die ursprünglichen Kanalsignale zu kombinieren, um das zusammengesetzte Signal zu erzeugen und dann als zweites Einlagerungskanal-Maskierkriterien auf das zusammengesetzte Signal zur Reduzierung der Bits anzuwenden, indem das Kodieren maskierter Signalkomponenten ausgeschaltet wird. Es wird angenommen, daß das erhaltene, zusammengesetzte Signal in beiden Fällen das gleiche oder im wesentlichen das gleiche ist. In beiden Fällen berücksichtigt der räumliche Kodierer zwei Arten von Maskierung, nämlich Kreuzkanalmaskierung und Einlagerungskanalmaskierung innerhalb des resultierenden zusammengesetzten Kanals. Die Erfindung soll die Anwendung des einen oder anderen Verfahrens zur Erzeugung eines zusammengesetzten Signals abdecken.
  • Das Steuerkontrollsignal (bzw. der Nettorichtungsvektor) stellt die scheinbare, dominante Richtung der Spektralkom-ponenten von allen Kanälen dar.
  • Gemäß den Lehren der vorliegenden Erfindung für digitale Kodiertechniken werden numerische Werte, die Spektralkomponenten wiedergeben, zu Codewörtern quantisiert, wobei eine variable Anzahl Bits mindestens einigen der Codewörter aus einem Bitpool adaptiv zugeordnet werden können. Die Bitzuteilung beruht darauf, ob wegen des gegenwärtigen Signalinhalts Quantisierfehler in einigen Teilbändern die Signalkodierqualität stärker herabsetzen als Quantisierfehler in anderen Teilbändern. Genauer gesagt, werden mehr Bits Spektralkomponenten innerhalb von Teilbändern zugeteilt, deren Quantisierungsrauschen psychoakustischer Maskierung weniger stark unterliegt als Quantisierungsrauschen in anderen Teilbändern.
  • Gemäß den Lehren der vorliegenden Erfindung zur Dekodierung wird bei der Umkehrsteuerung das Steuerkontrollsignal benutzt, um eine Darstellung der gesteuerten Kanäle aus dem zusammengesetzten Kanal wiederzugewinnen. Da für das räumliche Kodieren gemäß der vorliegenden Erfindung ein einziger Richtungsvektor benutzt wird und angesichts des zugrundeliegenden Prinzips, daß ein Zuhörer nur Schall aus einer Richtung zur Zeit hört, brauchen zur Darstellung eines spezifischen Präsentationssystems nur ein oder zwei Kanäle erzeugt zu werden. Die Zahl der Kanäle für den Dekodierer wird von den Eigenschaften des Präsentationssystems bestimmt und infolgedessen ist die Zahl nicht unbedingt gleich der Zahl der Eingabekanäle.
  • Gemäß den Lehren der vorliegenden Erfindung für digitale Dekodiertechniken wird ein adaptiver Bitzuteilungsprozeß durchgeführt, der im wesentlichen dem während der Kodierung benutzten ähnelt, um die Zahl der jedem quantisierten Codewort zugeteilten Bits festzulegen. Diese Information wird für die Wiederherstellung der Teilbandspektralkomponenten benutzt.
  • 9 ist ein schematisches Funktionsblockschaltbild eines Kodierers für räumliches Kodieren (d.h. eines vereinfachten Kodierers mit einem einzigen Vektor des Typs II). Der Kodierer kann mit Hilfe einer Vielfalt an analogen und digitalen Kodiertechniken verwirklicht werden. Zweckmäßiger läßt sich die Erfindung verwirklichen, wenn man digitale Techniken anwendet, und die hier offenbarten Ausführungsbeispiele sind digitale Verwirklichungen.
  • Digitale Verwirklichungen können adaptive Bitzuteilungstechniken verwenden. In der folgenden Beschreibung eines bevorzugten Ausführungsbeispiels werden Ideen sowohl der adaptiven Bitzuteilung als auch der Teilbandsteuerung offenbart, obwohl klar sein sollte, daß digitale Verwirklichungen der räumlichen Kodierung bei Bitzuteilungen angewandt werden können, die nicht adaptiv sind.
  • Wie 9 zeigt, werden Teilbandsignalkomponenten für jeden der Vielzahl von Eingabekanälen 1 bis einschließlich N auf dem Eingabeweg 901 von einem Generator 902 für scheinbare Richtung und zusammengesetzte Signale verarbeitet, um ein Steuerkontrollsignal scheinbare Richtung und ein zusammengesetztes Signal festzulegen. Der Prozeß empfängt auch Quelleninformation, die anzeigt, wie das Quellenschallfeld auf jeden der Eingabekanäle abgebildet ist (Information, welche die beabsichtigte räumliche Richtung für jedes Kanalsignal beschreibt). Die Quellen- und Reproduktionsinformation kann unterschiedlich entweder dauerhaft oder programmierbar sein. Der Kodierer kann Daueranweisungen hinsichtlich der Quelle und/oder Abspiel-umgebung umfassen, oder solche Instruktionen können von außen über Eingabewege in den Kodierer eingegeben werden, wie in 9 gezeigt. Von den eingegebenen Teilbandsignalen und der Quelleninformation wird ein zusammengesetztes Toninformationssignal abgeleitet, welches das Quellenschallfeld wiedergibt. Ein Steuerkontrollsignal in Form eines einzigen Richtungsvektors, welches Lokalisierungsinformation für das Schallfeld aufweist, wird von den eingegebenen Teilbandsignalen und der Quelleninformation abgeleitet.
  • Das vom Block 902 ausgegebene, zusammengesetzte Signal wird auch an einen Grobpegelquantisierer 904 angelegt, der die Teilbandspektralinformation des einzigen zusammengesetzten Kanals quantisiert. Von einem adaptiven Bitzuteiler 908 wird die Anzahl Bits verschiedenen Teilbändern in Abhängigkeit von grober Quantisierungsinformation, die vom Grobpegelquantisierer 904 erhalten wurde, und der Anzahl zur Zuteilung verfügbarer Bits, die von einem Bitpool 910 empfangen wurde, zugeteilt. Die zusammengesetzte Signalspektralinformation wird von einem Quantisierer 912 in Abhängigkeit von dem zusammengesetzten Signal, der Ausgabe des Grobpegelquantisierers und der Ausgabe des adaptiven Bitzuteilers zu quantisierten Codewörtern adaptiv quantisiert. Auch wenn nachfolgend ein geeigneter Algorithmus beschrieben wird, ist der Algorithmus, mit dem der Kodierer Bits adaptiv zuteilt, für die vorliegende Erfindung nicht von kritischer Bedeutung. Der Quantisierer 912 quantisiert auch das Steuerkontrollsignal. Der Quantisierer 912 liefert als Ausgaben die Steuerinformation, quantisierte Codewörter und grobe Quantisierungsinformation längs entsprechender Wege 914 bis 918.
  • 10 ist ein schematisches Funktionsblockschaltbild eines räumlich kodierenden Dekodierers. Ein adaptiver Bitzuteilungsrechner 1002 legt in Abhängigkeit von vom Kodiererausgang 918 empfangener, grober Quantisierungsinformation und der von einem Bitpool 1004 empfangenen Zahl von für die Zuteilung verfügbaren Bits die Zahl der jedem Codewort während des Quantisierens zugeordneten Bits fest; ein Dequantisierer 1006 dequantisiert das vom Kodiererausgang 914 empfangene Steuerkontrollsignal und stellt in Abhängigkeit von vom Kodiererausgang 916 empfangenen, quantisierten Codewörtern, vom Kodiererausgang 918 empfangener, grober Quantisierungsinformation und vom adaptiven Bitzuteilungsrechner 1002 empfangener Bitzuteilungsinformation Spektralkomponenteninformation wieder her und liefert an seinen Ausgängen die Information über den einzigen Richtungsvektor auf einem Weg 1008, die Teilbandexponenten des zusammengesetzten Kanals auf einer Leitung 1010 und die Spektralkomponenten des zusammengesetzten Kanals auf einem Weg 1012. Diese Ausgaben werden an einen inversen Generator 1014 der scheinbaren Richtung und des zusammengesetzten Signals angelegt, der gleichfalls Wiedergabeinformation empfängt, welche die erwartete Anzahl der Ausgangskanäle und den Ort oder virtuellen Ort von Wandlern (beispielsweise Lautsprechern) beschreibt, die an die Ausgangskanäle angeschlossen sind. Die Wiedergabeinformation kann dauerhaft oder programmierbar sein. Der Dekodierer kann Daueranweisungen hinsichtlich des Abspielumfeldes umfassen, oder solche Anweisungen können von außerhalb über einen Eingabeweg, wie in 10 gezeigt, an den Dekodierer gegeben werden. In Abhängigkeit von Steuer- und zusammengesetzter Spektralinformation, die auf Wegen 10081012 empfangen werden, rekonstruiert der Generator 1014 Teilbänder und liefert innerhalb jedes Zeitintervalls, während dessen ein Satz aus Teilbandsignalen und Richtungsvektor empfangen wird, einen kompletten Satz an Teilbändern für einen oder zwei Kanäle mit Teilbandspektralinformation, wobei jeder Kanal als Abschnitte eines Weges 1016 wiedergegeben ist, die mit Ch 1, ... Ch N gekennzeichnet sind. Die Aktivierung von nur einem oder zwei Kanälen für jedes Teilband während des Zeitintervalls reicht aus, um Schall aus einer einzigen Richtung innerhalb jedes Teilbandes wiederzugeben. Anders ausgedrückt, hinsichtlich jedes beliebigen Teilbandes ist während jedes Zeitintervalls nur ein oder zwei Kanäle aktiv.
  • Das bevorzugte Ausführungsbeispiel der vorliegenden Erfindung wird in bezug auf das Kodieren und Dekodieren in den folgenden Abschnitten mehr im einzelnen erläutert. Im Verlauf der Beschreibung werden auch alternative Ausführungsbeispiele und Strukturen für die vorliegende Erfindung genannt.
  • In 9, in der ein Teilbandkodierer des Typs II dargestellt ist, ist zu erkennen, daß der Generator 902 für die scheinbare Richtung und das zusammengesetzte Signal längs des Weges 901 mehrere Kanäle mit Teilbandinformation empfängt. Wenn die Teilbandblöcke durch diskrete Transformation, beispielsweise diskrete Fourier Transformation (DFT) abgeleitet werden, besteht jedes Teilband aus einem oder mehr diskreten Transformationskoeffizienten. Auf eine bestimmte Teilbandanordnung für ein Signal der Bandbreite 20 kHz wird eine 512 Punkt Transformation und eine Eingabesignalabtastrate von 48 kHz angewandt. Die Teilbänder entsprechen insgesamt den kritischen Bändern des Ohrs. Es können auch andere Teilbandgruppierungen, Abtastraten und Transformationslängen angewandt werden, ohne den Umfang der vorliegenden Erfindung zu verlassen.
  • Wie schon gesagt, wird angenommen, daß der Einzelrichtungseffekt zum Tragen kommt, wenn das Zeitintervall ausreichend kurz ist. Bei einer Abtastrate von 48 kHz und einer Transformation mit 512 Punkten, hat jeder Transformationsblock ein Zeitintervall von grob gesagt 10 Millisekunden (im Fall der TDAC-Transformation ist dies lediglich eine Näherung angesichts der Mittelung von Block zu Block, die dem TDAC-Prozeß inhärent ist). Das bedeutet also, daß etwa alle 10 Millisekunden eine Folge zusammengesetzter Teilbandsignale erzeugt wird. Jedem zusammengesetzten Block kann ein einziger Richtungsvektor zugeordnet sein, oder es können alternativ Richtungsvektoren auf regelmäßiger Basis mehr oder weniger häufig während der Blockperiode erzeugt werden. Als weitere Alternative können ein oder mehr zusätzliche Richtungsvektoren innerhalb einer Blockperiode nur dann erzeugt werden, wenn eine Verlagerung in der dominanten Richtung von mehr als einer Schwelle (sagen wir mehr als 30°) eintritt. Der Erfinder hat festgestellt, daß ein System auf der Basis einer TDAC-Transformation mit Blocklängen von etwa 10 Millisekunden und einem einzigen Richtungsvektor während jeder Blockperiode eine angenehme Musikwiedergabeerfahrung bietet.
  • Im Prozeß des Generators für die scheinbare Richtung und das zusammengesetzte Signal werden die Spektralkomponenten von vielen Kanälen kombiniert, um ein zusammengesetztes Einkanalteilband zu schaffen, was die Zahl der Spektralkomponenten verringert, die quantisiert und gesendet werden müssen. Ein Steuerkontrollsignal, welches Informationen über die scheinbare Richtung des Schallfeldes (eine einzige Richtung) innerhalb eines Zeitintervalls übermittelt, wird mit den kodierten Spektralkomponenten des zusammengesetzten Kanals weitergegeben, um es dem empfangenden Dequantisierer zu ermöglichen, Spektralkomponenten aus einem oder zwei Kanälen wiederzugewinnen, was für die Wiedergabe einer einzigen Richtung ausreicht. Es sei darauf hingewiesen, daß insgesamt die aus dem zusammengesetzten Kanal und dem Steuersignal der einzigen Richtung wiedergewonnenen Spektralkomponenten nicht mit den Spektralkomponenten eines Empfängers identisch sind, der aus einzelnen Kanälen oder aus einem zusammengesetzten Kanal und Skalierungsfaktoren für jeden Kanal dekodieren würde (wie beim System des Typs I).
  • Durch das Kodieren eines Teilbandes in Form eines zusammengesetzten Kanals und eines sekundären Einzelrichtungsvektors anstelle der Kodierung von Teilbändern diskreter Kanäle oder eines zusammengesetzten Kanalteilbandes und Kanalskalierungsfaktoren (wie beim System des Typs I) eingesparte Bits werden vom adaptiven Bitzuteilungsprozeß beispielsweise zur Zuteilung zu anderen Teilbändern und vom Quantisierer zum Quantisieren des Steuerkontrollsignals benutzt.
  • Die Spektralkomponenten der Teilbänder in einem oder mehr Kanälen werden kombiniert. Gemäß den genannten Patenten 5 583 962, 5 632 005 und 5 633 981 wird bei einem bevorzugten Verfahren jeder Spektralkomponentenwert im zusammengesetzten Teilband so gesetzt, daß er dem Durchschnitt der entsprechenden Spektralkomponentenwerte in den gesteuerten Kanälen gleicht, und mit alternativen Verfahren können andere lineare Kombinationen oder gewichtete Summen der Spektralkomponentenwerte in den gesteuerten Kanälen gebildet werden.
  • Das Steuerkontrollsignal gibt die primäre (d.h. dominante) räumliche Richtung der Teilbandkomponenten im zusammengesetzten Kanal wieder. Gemäß der vereinfachten Version des Systems Typ II, die Gegenstand dieser Erfindung ist, wird von einem Grundverfahren während jedes Zeitintervalls ein einziger Vektor erzeugt, der nur die primäre oder dominante räumliche Richtung für jedes Teilband im zusammengesetzten Signal wiedergibt.
  • Die Idee dieses Grundverfahrens ist unter Hinweis auf 11 besser zu verstehen, denn dort ist ein hypothetisches Wiedergabesystem veranschaulicht, welches fünf Präsentationskanäle aufweist. Jeder dieser Präsentationskanäle, die einem der Eingabekanäle entsprechen, stellt einen Lautsprecher dar, der sich auf der Oberfläche einer Kugeleinheit befindet. Der beabsichtigte Zuhörer befindet sich in der Mitte der Kugel. Einer der Kanäle ist mit RF bezeichnet. Die für den Zuhörer scheinbare Richtung des Kanals RF ist mit dem Einheitsvektor D →I wiedergegeben.
  • Bei diesem Grundverfahren des Kodierens stellt der Steuerkontrollsignalvektor V →j die hauptsächliche (dominante) Richtung des Schallfeldes für das zusammengesetzte Signalteilband j dar. Auch wenn ein kartesisches Koordinatensystem eine bevorzugte Darstellung für die Richtung ist, können auch andere Darstellungen, beispielsweise Polarkoordinaten benutzt werden, ohne vom Gedanken der Erfindung abzuweichen. Der Richtungsvektor jedes Kanals wird nach Pegel gewichtet. Das Steuerkontrollsignal läßt sich wie folgt ausdrücken:
    Figure 00180001
    worin
    • D →Ii = Richtungseinheitsvektor für Kanal i,
    • LIi,j = berechneter Pegel für Teilband j im Kanal i,
    • S = Gesamtzahl der Eingabekanäle
    • V →j = Steuerkontrollsignalvektor für Teilband j,
    • D →I = Richtungseinheitsvektoren für alle Eingabekanäle und
    • L →Ij = berechnete Pegel für Teilband j in allen Eingabekanälen
  • Weitere Einzelheiten eines für die vorliegende Erfindung verwendbaren Kodierers Typ II sind in den genannten Patenten 5 583 962, 5 632 005 und 5 633 981 beschrieben.
  • In dem in 10 gezeigten Dekodierer für räumliches Kodieren stellt der inverse Generator 1014 für scheinbare Richtung und zusammengesetztes Signal eine einzige Richtungsdarstellung des zusammengesetzten Kanals in Abhängigkeit von einem Steuerkontrollsignal, groben Quantisierungspegeln und Signalkomponentenwerten wieder her, die jeweils über die entsprechenden Wege 1008 bis 1012 empfangen wurden.
  • Wie schon gesagt, wird für das Kodieren Typ II von der Erfindung ein Steuerkontrollsignal in Form eines Richtungsvektors verwendet. Zur Annäherung der Richtung des kodierten Signals muß der Wiederherstellungsprozeß die Zahl und den Ort der am Dekodierplatz installierten Lautsprecher berücksichtigen. Der Richtungsvektor D →Oi für jeden Präsentationskanal i wird dem inversen Generator 1014 für scheinbare Richtung und zusammengesetztes Signal als Wiedergabeinformationseingabe zur Verfügung gestellt. Der Wiederherstellungsprozeß erzeugt vorzugsweise Spektralkomponenten für nur einen oder zwei Präsentationskanäle, was ausreicht, um ein Schallfeld mit räumlicher Orientierung des zusammengesetzten Signalteilbandes zu erhalten, welches vom Steuerkontrollsignal wiedergegeben ist.
  • Wenn man die Gleichung 1 auf das Präsentationssystem anwendet, kann das Steuerkontrollsignal wie folgt ausgedrückt werden:
    Figure 00190001
    worin
    • DO i = Richtungseinheitsvektor für Präsentationskanal i,
    • LOij = berechneter Pegel für Teilband j im Kanal i,
    • S = Gesamtzahl der Präsentationskanäle
    • V →j = Steuerkontrollsignalvektor für Teilband j,
    • DO = Richtungseinheitsvektoren für alle Präsentationskanäle, und
    • L →Oj = berechnete Pegel für Teilband j in allen Präsentationskanälen
  • Eine zusätzliche Bedingung, die den berechneten Pegeln LO auferlegt ist, besteht darin, daß die Lautstärke des vom Präsentationssystem erzeugten Schallfeldes der Lautstärke des ursprünglichen Schallfeldes gleich sein sollte. Genauer gesagt, unterliegt jeder L →Oj Vektor dem Zwang, daß die Lautstärke oder der Gesamtpegel des Schallfeldes für jedes vom Präsentationssystem erzeugte Teilband dem Pegel des Teilbandes im ursprünglichen Schallfeld gleich sein muß.
  • Weitere Einzelheiten des für die vorliegende Erfindung anwendbaren Dekodierers Typ II sind in den genannten Patenten 5 583 962, 5 632 005 und 5 633 981 beschrieben.
  • 12A ist ein schematisches Funktionsblockschaltbild eines räumlichen Dekodierers, der im Zusammenhang mit einer vorhersagbaren Abspielumgebung funktioniert. Steuerinformation, quantisierte Codewörter und grobe Quantisierungsinformation wird längs Eingabewegen 1202, 1204 bzw. 1206 einem räumlichen Dekodierer 1208 zugeführt. Die Eingabesignale können dem räumlichen Dekodierer mittels einer Vielfalt an Sende- oder Speichertechniken zugeleitet werden, einschließlich beispielsweise verdrahteter oder drahtloser Übermittlung, magnetischer Datenträger und optischer Datenträger. Wie schon gesagt, werden die Eingabesignale entsprechend der Version mit einem einzigen Vektor des Systems Typ II kodiert. Der Dekodierer 1208 liefert vier oder fünf Ausgabesignale, die an einen wahlweise vorgesehenen Raumeffektgestalter 1210 angelegt werden können, der mit einer Löschvorrichtung für akustisches Nebensprechen arbeitet. Die jeweilige Verwirklichung des Raumeffektgestalters 1210 ist nicht von kritischer Bedeutung; geeignete Anordnungen sind im Zusammenhang mit den 5A, 5B und 5C beschrieben worden. Der Ausgang des Raumeffektgestalters 1210, wenn denn einer benutzt wird, wird an einen linken und rechten Lautsprecher 1212 und 1214 (über geeignete Verstärkungs- und Kopplungsmittel, die nicht gezeigt sind) angelegt. Ansonsten werden die Ausgaben des Dekodierers 1208 über geeignete, nicht gezeigte Verstärkungs- und Kopplungsmittel den Lautsprechern zugeführt. Die Lautsprecher, die beispielsweise nach Art der 3 oder 4 angeordnet sind, erzeugen einen länglichen Vorzugsplatz für räumliche Kodierung 1216 (idealisiert dargestellt), an dem sich ein Zuhörer 1217 befindet. Wenn ein Raumeffektgestalter 1210 benutzt wird, kann dieser ein integraler Bestandteil des Dekodierers 1208 sein.
  • 12B ist ein schematisches Funktionsblockschaltbild eines räumlichen Dekodierers, der im Zusammenhang mit einem weiteren vorhersagbaren Abspielumfeld funktioniert. Steuerinformation, quantisierte Codewörter und grobe Quantisierungsinformation, die längs Eingabewegen 1202, 1204 bzw. 1206 an einen räumlichen Dekodierer 1208 angelegt werden, sind in der Anordnung gemäß 12A gezeigt. Die Anordnung gemäß 12B unterscheidet sich dadurch, daß die Umgebung für das Abspielen eine standardisierte Raumklanganordnung mit fünf Lautsprechern ist. In diesem Fall ist kein Raumeffektgestalter nötig. Die Ausgaben des räumlichen Dekodierers 1208 werden an die fünf Lautsprecher gegeben – links (1218), Mitte (1220), rechts (1222), linker Raum (1224) und rechter Raum (1226), die einen kreisförmigen Vorzugsplatz für räumliche Kodierung 1228 erzeugen (idealisiert dargestellt), in welchem sich ein Zuhörer 1230 befindet.

Claims (28)

  1. Räumliches Kodiersystem mit niedriger Bitrate zum Kodieren einer Vielzahl von ein Schallfeld wiedergebenden Tonsignalströmen zu einem kodierten Signal und zum Dekodieren des kodierten Signals, wobei das System einen Kodierer und einen Dekodierer umfaßt, und der Kodierer folgendes aufweist: einen Teilbandsignalgenerator (710), der eine Vielzahl von Teilbändern in Abhängigkeit von der Vielzahl der Tonsignalströme erzeugt, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt, einen Signalkombinierer (902), der ein zusammengesetztes Signal erzeugt, welches die Kombination von Teilbandsignalen in den jeweiligen Frequenzteilbändern wiedergibt, einen Schallfeldrichtungsdetektor (902), der ein Steuerkontrollsignal für das zusammengesetzte Signal erzeugt, welches die Hauptrichtung des Schallfeldes in jeweiligen Teilbändern anzeigt; einen Kodierer und Bitzuteiler (730; 904, 908, 910, 912), der kodierte Information durch Zuordnen von Bits zu dem zusammengesetzten Signal und dem Steuerkontrollsignal erzeugt, und einen Formatierer (740), der die kodierte Information zu einem kodierten Signal zusammenfügt, und der Dekodierer folgendes aufweist: einen Deformatierer (810), der das zusammengesetzte Signal und Steuerkontrollsignal aus dem kodierten Signal ableitet, einen inversen Teilbandgenerator (840), der Teilbandsignale in Abhängigkeit von dem zusammengesetzten Signal und dem Steuerkontrollsignal ableitet, eine Informationseingabe, welche die Zahl der Ausgangskanäle des Dekodierers und den Ort oder virtuellen Ort von Schallwandlern beschreibt, die mit den jeweiligen Ausgangskanälen verbunden sind, wobei drei oder mehr Ausgangskanäle vorhanden sind, und einen Signalgenerator (1014), der einen Tonsignalstrom in nicht mehr als zwei Ausgangskanälen zu jedem Zeitpunkt in Abhängigkeit von den Teilbandsignalen und Wiedergabeinformation erzeugt.
  2. System nach Anspruch 1, ferner aufweisend: eine Vielzahl Schallwandler (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224), die mit den Ausgangskanälen des Dekodierers gekoppelt und so angeordnet sind, daß sie ein Hörebenbild des Schallfeldes für einen oder mehr Zuhörer innerhalb eines Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugen.
  3. System nach Anspruch 1 oder 2, ferner aufweisend: einen Raumeffektgestalter (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520) zur Verarbeitung von Tonsignalströmen in den Ausgangskanälen, wobei der Raumeffektgestalter (1210) eine verringerte Zahl Aus gangskanäle bereitstellt, die Tonsignalströme mit solchen Eigenschaften haben, daß bei einer Kopplung mit Schallwandlern (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) der Höreindruck eines Schallfeldes ähnlich demjenigen entsteht, das erhalten worden wäre, wenn die ursprüngliche Zahl der Ausgangskanäle mit einer größeren Anzahl Schallwandler (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) gekoppelt wäre.
  4. System nach Anspruch 1 oder 2, bei dem das Steuerkontrollsignal einen Richtungsvektor für jedes Teilband umfaßt.
  5. System nach Anspruch 1 oder 2, bei dem das jeweilige Frequenzteilband eine Bandbreite entsprechend einem jeweiligen kritischen Band des menschlichen Hörsystems hat.
  6. System nach Anspruch 1 oder 2, bei dem die Bits nach psychoakustischen Grundsätzen zugeteilt werden.
  7. System nach Anspruch 2, bei dem der Dekodierer ferner einen Raumeffektgestalter (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520) zum Verarbeiten von Tonsignalströmen in den Ausgangskanälen aufweist, wodurch das Hörebenbild des innerhalb des Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugten Schallfeldes den Eindruck eines Schallfeldes einer breiten Bühne oder von Rundum-Raumklang erweckt.
  8. Dekodierer zur Verwendung in einem räumlichen Kodiersystem mit niedriger Bitrate zum Dekodieren eines kodierten Signals, welches aus einer Vielzahl von ein Schallfeld wiedergebenden Tonsignalströmen abgeleitet ist, durch Erzeugen einer Vielzahl von Teilbandsignalen in Abhängigkeit von der Vielzahl der Tonsignalströme, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt, Erzeugen eines Steuerkontrollsignals, welches die Hauptrichtung des Schallfeldes in jeweiligen Teilbändern anzeigt, Erzeugen kodierter Information durch Zuordnen von Bits zum zusammengesetzten Signal und Steuerkontrollsignal, und Zusammenfügen der kodierten Information zu einem kodierten Signal, aufweisend: einen Deformatierer (810), der das zusammengesetzte Signal und Steuerkontrollsignal von dem kodierten Signal ableitet, einen inversen Teilbandgenerator (840), der Teilbandsignale in Abhängigkeit von dem zusammengesetzten Signal und Steuerkontrollsignal ableitet, eine Informationseingabe, die die Zahl der Ausgangskanäle des Dekodierers und den Ort oder virtuellen Ort von Schallwandlern (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) anzeigt, die mit den jeweiligen Ausgangskanälen verbunden sind, wobei drei oder mehr Ausgangskanäle vorhanden sind, und einen Signalgenerator (1014), der einen Tonsignalstrom in nicht mehr als zwei Ausgangskanälen zu jedem Zeitpunkt in Abhängigkeit von den Teilbandsignalen und Wiedergabeinformation erzeugt.
  9. Dekodierer nach Anspruch 8, ferner aufweisend: einen Signalgenerator (1014), der einen Tonsignalstrom in einem oder mehr Ausgangskanälen in Abhängigkeit von den Teilband signalen und Wiedergabeinformation erzeugt, und eine Vielzahl von Schallwandlern (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224), die mit den Ausgangskanälen des Dekodierers gekoppelt und so angeordnet sind, daß sie ein Hörebenbild des Schallfeldes für einen oder mehr Zuhörer innerhalb eines Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugt.
  10. Dekodierer nach Anspruch 8 oder 9, ferner aufweisend: einen Raumeffektgestalter (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520) zur Verarbeitung von Tonsignalströmen in den Ausgangskanälen, wobei der Raumeffektgestalter (1210) eine verringerte Zahl Ausgangskanäle bereitstellt, die Tonsignalströme mit solchen Eigenschaften haben, daß bei einer Kopplung mit Schallwandlern (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) der Höreindruck eines Schallfeldes ähnlich demjenigen entsteht, das erhalten worden wäre, wenn die ursprüngliche Zahl der Ausgangskanäle mit einer größeren Anzahl Schallwandler (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) gekoppelt wäre.
  11. Dekodierer nach Anspruch 8 oder 9, bei dem das Steuerkontrollsignal einen Richtungsvektor für jedes Teilband aufweist.
  12. Dekodierer nach Anspruch 8 oder 9, bei dem das jeweilige Frequenzteilband eine Bandbreite entsprechend einem jeweiligen kritischen Band des menschlichen Hörsystems hat.
  13. Dekodierer nach Anspruch 8 oder 9, bei dem die Bits nach psychoakustischen Grundsätzen zugeteilt werden.
  14. Dekodierer nach Anspruch 8 oder 9, bei dem der Dekodierer ferner einen Raumeffektgestalter (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520) zum Verarbeiten von Tonsignalströmen in den Ausgangskanälen aufweist, wodurch das Hörebenbild des innerhalb des Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugten Schallfeldes den Eindruck eines Schallfeldes einer breiten Bühne oder von Rundum-Raumklang erweckt.
  15. Verfahren zur räumlichen Kodierung mit niedriger Bitrate zum Kodieren einer Vielzahl von ein Schallfeld wiedergebenden Tonsignalströmen zu einem kodierten Signal und Dekodieren des kodierten Signals, wobei das Verfahren Kodieren und Dekodieren umfaßt, und das Kodieren aufweist: Erzeugen einer Vielzahl von Teilbandsignalen in Abhängigkeit von der Vielzahl der Tonsignalströme, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt, Erzeugen eines zusammengesetzten Signals, welches die Kombination von Teilbandsignalen in jeweiligen Frequenzteilbändern wiedergibt, Erzeugen eines Steuerkontrollsignals für das zusammengesetzte Signal, welches die Hauptrichtung des Schallfeldes in jeweiligen Teilbändern anzeigt; Erzeugen kodierter Information durch Zuordnen von Bits zu dem zusammengesetzten Signal und dem Steuerkontrollsignal, und Zusammenfügen der kodierten Information zu einem kodierten Signal, und das Dekodieren aufweist: Ableiten des zusammengesetzten Signals und Steuerkontrollsignals von dem kodierten Signal, Ableiten von Teilbandsignalen in Abhängigkeit von dem zusammengesetzten Signal und dem Steuerkontrollsignal, Liefern von Wiederherstellungsinformation, welche die Zahl der Ausgangskanäle des Dekodierers und den Ort oder virtuellen Ort von Schallwandlern (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) beschreibt, die mit den jeweiligen Ausgangskanälen verbunden sind, wobei drei oder mehr Ausgangskanäle vorhanden sind, und Erzeugen eines Tonsignalstroms in nicht mehr als zwei Ausgangskanälen zu jedem Zeitpunkt in Abhängigkeit von den Teilbandsignalen und der Wiederherstellungsinformation.
  16. Verfahren nach Anspruch 15, ferner aufweisend: Koppeln der Ausgangskanäle mit einer Vielzahl von Schallwandlern (206, 208, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224), die so angeordnet sind, daß sie ein Hörebenbild des Schallfeldes für einen oder mehr Zuhörer innerhalb eines Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugen.
  17. Verfahren nach Anspruch 15 oder 16, ferner aufweisend: Verarbeiten von Tonsignalströmen in den Ausgangskanälen mittels eines Raumeffektgestalters (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520), wobei die Verarbeitung eine verringerte Zahl Ausgangskanäle mit Tonsignalströmen bereitstellt, die solche Eigenschaften haben, daß sie beim Koppeln an Schallwandler (206, 208, 210; 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) den Höreindruck eines Schallfeldes ähnlich demjenigen bieten, welches erhalten worden wäre, wenn die ursprüngliche Zahl der Ausgangskanäle mit einer größeren Zahl Schallwandler (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) gekoppelt wäre.
  18. Verfahren nach Anspruch 15 oder 16, bei dem das Steuerkontrollsignal einen Richtungsvektor für jedes Teilband umfaßt.
  19. Verfahren nach Anspruch 15 oder 16, bei dem das jeweilige Frequenzteilband eine Bandbreite entsprechend einem jeweiligen kritischen Band des menschlichen Hörsystems hat.
  20. Verfahren nach Anspruch 15 oder 16, bei dem die Bits nach psychoakustischen Grundsätzen zugeteilt werden.
  21. Verfahren nach Anspruch 17, bei dem das Dekodieren ferner aufweist, Tonsignalströme in den Ausgangskanälen mittels eines Raumeffektgestalters (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520) zu verarbeiten, wodurch das Hörebenbild des innerhalb des Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugten Schallfeldes den Eindruck eines Schallfeldes einer breiten Bühne oder von Rundum-Raumklang erweckt.
  22. Verfahren zum Dekodieren räumlicher Kodierung mit niedriger Bitrate zur Dekodierung eines kodierten Signals, welches von einer Vielzahl von ein Schallfeld wiedergebenden Tonsignal strömen abgeleitet ist, durch Erzeugen einer Vielzahl von Teilbandsignalen in Abhängigkeit von der Vielzahl der Tonsignalströme, wobei jedes Teilbandsignal ein jeweiliges Frequenzteilband eines jeweiligen der Tonsignalströme wiedergibt, Erzeugen eines zusammengesetzten Signals, welches die Kombination aus Teilbandsignalen in jeweiligen Frequenzteilbändern wiedergibt, Erzeugen eines Steuerkontrollsignals für das zusammengesetzte Signal, welches die Hauptrichtung des Schallfeldes in jeweiligen Teilbändern anzeigt, Erzeugen kodierter Information durch Zuordnen von Bits zu dem zusammengesetzten Signal und dem Steuerkontrollsignal, und Zusammenfügen der kodierten Information zu einem kodierten Signal, aufweisend: Ableiten des zusammengesetzten Signals und Steuerkontrollsignals von dem kodierten Signal, Ableiten von Teilbandsignalen in Abhängigkeit von dem zusammengesetzten Signal und dem Steuerkontrollsignal, Liefern von Wiederherstellungsinformation, welche die Zahl der Ausgangskanäle des Dekodierers und den Ort oder virtuellen Ort von Schallwandlern ((206, 208, 210; 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) beschreibt, die mit den jeweiligen Ausgangskanälen verbunden sind, wobei es drei oder mehr Ausgangskanäle gibt, und Erzeugen eines Tonsignalstroms in nicht mehr als zwei Ausgangskanälen zu jedem Zeitpunkt in Abhängigkeit von den Teilbandsignalen und der Wiederherstellungsinformation.
  23. Verfahren nach Anspruch 22, ferner aufweisend: Koppeln einer Vielzahl von Schallwandlern (206, 208, 210; 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) mit den Ausgangskanälen des Dekodierens, wobei die Schallwandler (206, 208, 210; 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) so angeordnet sind, daß sie ein Hörebenbild des Schallfeldes für einen oder mehr Hörer innerhalb eines Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugen.
  24. Verfahren nach Anspruch 22 oder 23, ferner aufweisend: Verarbeiten von Tonsignalströmen in den Ausgangskanälen mittels eines Raumeffektgestalters (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520), wobei das Verarbeiten eine verringerte Zahl Ausgangskanäle bereitstellt, die Tonsignalströme mit solchen Eigenschaften haben, daß bei einer Kopplung mit Schallwandlern (206, 208, 210; 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) der Höreindruck eines Schallfeldes ähnlich demjenigen erzeugt wird, der erhalten worden wäre, wenn die ursprüngliche Zahl der Ausgangskanäle mit einer größeren Zahl Schallwandler (206, 208, 210; 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) gekoppelt wäre.
  25. Verfahren nach Anspruch 22 oder 23, bei dem das Steuerkontrollsignal einen Richtungsvektor für jedes Teilband aufweist.
  26. Verfahren nach Anspruch 22 oder 23, bei dem das jeweilige Frequenzteilband eine Bandbreite entsprechend einem jeweiligen kritischen Band des menschlichen Hörsystems hat.
  27. Verfahren nach Anspruch 22 oder 23, bei dem die Bits nach psychoakustischen Grundsätzen zugeteilt werden.
  28. Verfahren nach Anspruch 23, ferner aufweisend: Verarbeiten von Tonsignalströmen in den Ausgangskanälen mittels eines Raumeffektgestalters (1210) mit einer Löschvorrichtung für akustisches Nebensprechen (520), wodurch das Hörebenbild des Schallfeldes des innerhalb des Vorzugsplatz-Zuhörbereichs für räumliche Kodierung erzeugten Schallfeldes den Eindruck eines Schallfeldes einer breiten Bühne oder von Rundum-Raumklang erweckt.
DE69933659T 1998-04-07 1999-04-05 Verfahren und system zur räumlichen kodierung mit niedriger bitrate Expired - Fee Related DE69933659T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/056,503 US6016473A (en) 1998-04-07 1998-04-07 Low bit-rate spatial coding method and system
US56503 1998-04-07
PCT/US1999/007456 WO1999052326A1 (en) 1998-04-07 1999-04-05 Low bit-rate spatial coding method and system

Publications (2)

Publication Number Publication Date
DE69933659D1 DE69933659D1 (de) 2006-11-30
DE69933659T2 true DE69933659T2 (de) 2007-08-23

Family

ID=22004835

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69933659T Expired - Fee Related DE69933659T2 (de) 1998-04-07 1999-04-05 Verfahren und system zur räumlichen kodierung mit niedriger bitrate

Country Status (14)

Country Link
US (1) US6016473A (de)
EP (2) EP1070438B1 (de)
JP (1) JP2002511683A (de)
KR (1) KR100828952B1 (de)
CN (1) CN1142705C (de)
AT (1) ATE343311T1 (de)
AU (1) AU749062B2 (de)
CA (1) CA2327281C (de)
DE (1) DE69933659T2 (de)
DK (1) DK1070438T3 (de)
ES (1) ES2272062T3 (de)
HK (1) HK1036728A1 (de)
TW (1) TW439051B (de)
WO (1) WO1999052326A1 (de)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6323909B1 (en) * 1998-10-28 2001-11-27 Hughes Electronics Corporation Method and apparatus for transmitting high definition television programming using a digital satellite system transport and MPEG-2 packetized elementary streams (PES)
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
AU2337101A (en) * 1999-12-27 2001-07-09 Martin Pineau Method and apparatus for producing spatially distributed sound into a set of headphones
US6725110B2 (en) * 2000-05-26 2004-04-20 Yamaha Corporation Digital audio decoder
US6647149B2 (en) 2001-01-03 2003-11-11 Electronics For Imaging, Inc. Methods and apparatus for securely transmitting and processing digital image data
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP2003061198A (ja) * 2001-08-10 2003-02-28 Pioneer Electronic Corp オーディオ再生装置
JP4016681B2 (ja) * 2002-03-18 2007-12-05 ヤマハ株式会社 効果付与装置
JP4714416B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
US7443987B2 (en) * 2002-05-03 2008-10-28 Harman International Industries, Incorporated Discrete surround audio system for home and automotive listening
US20030233230A1 (en) * 2002-06-12 2003-12-18 Lucent Technologies Inc. System and method for representing and resolving ambiguity in spoken dialogue systems
EP1552724A4 (de) 2002-10-15 2010-10-20 Korea Electronics Telecomm Verfahren zum erzeugen und aufbrauchen einer 3d-audioszene mit erweiterter räumlichkeit der schallquelle
WO2004080125A1 (en) 2003-03-04 2004-09-16 Nokia Corporation Support of a multichannel audio extension
AU2003222397A1 (en) * 2003-04-30 2004-11-23 Nokia Corporation Support of a multichannel audio extension
KR100556365B1 (ko) * 2003-07-07 2006-03-03 엘지전자 주식회사 음성 인식장치 및 방법
CN1875402B (zh) * 2003-10-30 2012-03-21 皇家飞利浦电子股份有限公司 音频信号编码或解码
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
JP3815482B2 (ja) * 2004-03-09 2006-08-30 セイコーエプソン株式会社 データ転送制御装置及び電子機器
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
EP1749296B1 (de) 2004-05-28 2010-07-14 Nokia Corporation Mehrkanalige audio-erweiterung
EP1779385B1 (de) * 2004-07-09 2010-09-22 Electronics and Telecommunications Research Institute Verfahren und vorrichtung zum codieren und decodieren eines mehrkanaligen audiosignals unter verwendung von virtuelle-quelle-ortsinformationen
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
DE602005017302D1 (de) 2004-11-30 2009-12-03 Agere Systems Inc Synchronisierung von parametrischer raumtonkodierung mit extern bereitgestelltem downmix
EP1817767B1 (de) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametrische raumtonkodierung mit objektbasierten nebeninformationen
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR100755471B1 (ko) * 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
WO2007011157A1 (en) * 2005-07-19 2007-01-25 Electronics And Telecommunications Research Institute Virtual source location information based channel level difference quantization and dequantization method
WO2007055463A1 (en) * 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR100880645B1 (ko) 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
EP1989704B1 (de) 2006-02-03 2013-10-16 Electronics and Telecommunications Research Institute Verfahren und vorrichtung zur steuerung der wiedergabe eines mehrfachobjekts oder mehrfachkanal-audiosignals unter verwendung eines räumlichen hinweises
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
ATE531036T1 (de) * 2006-03-15 2011-11-15 France Telecom Einrichtung und verfahren zur codierung durch hauptkomponentenanalyse eines mehrkanaligen audiosignals
AU2007312597B2 (en) 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US8705748B2 (en) * 2007-05-04 2014-04-22 Creative Technology Ltd Method for spatially processing multichannel signals, processing module, and virtual surround-sound systems
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
RU2452043C2 (ru) * 2007-10-17 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудиокодирование с использованием понижающего микширования
WO2009067741A1 (en) * 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
ES2592416T3 (es) 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
EP2486567A1 (de) 2009-10-09 2012-08-15 Dolby Laboratories Licensing Corporation Automatische erzeugung von metadaten für audiodominanzeffekte
US9578419B1 (en) * 2010-09-01 2017-02-21 Jonathan S. Abel Method and apparatus for estimating spatial content of soundfield at desired location
US9445174B2 (en) 2012-06-14 2016-09-13 Nokia Technologies Oy Audio capture apparatus
EP3061268B1 (de) * 2013-10-30 2019-09-04 Huawei Technologies Co., Ltd. Verfahren und mobile vorrichtung zur verarbeitung eines audiosignals
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
ES2779603T3 (es) * 2015-11-17 2020-08-18 Dolby Laboratories Licensing Corp Sistema y método de salida binaural paramétrico
SG11201803909TA (en) * 2015-11-17 2018-06-28 Dolby Laboratories Licensing Corp Headtracking for parametric binaural output system and method
KR102640940B1 (ko) 2016-01-27 2024-02-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 음향 환경 시뮬레이션
GB2574873A (en) * 2018-06-21 2019-12-25 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
USD982375S1 (en) 2019-06-06 2023-04-04 Sharkninja Operating Llc Food preparation device

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US29490A (en) * 1860-08-07 hutchinson
US30278A (en) * 1860-10-02 graham
US871992A (en) * 1906-11-01 1907-11-26 Glazier Stove Company Hydrocarbon-burner.
US1124580A (en) * 1911-07-03 1915-01-12 Edward H Amet Method of and means for localizing sound reproduction.
US1850130A (en) * 1928-10-31 1932-03-22 American Telephone & Telegraph Talking moving picture system
US1793772A (en) * 1929-02-26 1931-02-24 Thomas L Talley Apparatus and method for localization of sound on screens
US2361490A (en) * 1941-12-29 1944-10-31 Rca Corp Sound reproducing system
BE529308A (de) * 1953-10-08
US3067287A (en) * 1957-06-19 1962-12-04 Percival William Spencer Stereophonic sound transmission systems
US3067292A (en) * 1958-02-03 1962-12-04 Jerry B Minter Stereophonic sound transmission and reproduction
DE1130899B (de) * 1958-12-12 1962-06-07 Siemens Ag Verfahren und Anordnung zum Aufzeichnen und Abtasten von Magnetogrammen
US3272906A (en) * 1960-10-25 1966-09-13 Zenith Radio Corp Audio reproduction system
US3845572A (en) * 1972-08-02 1974-11-05 Singer Co Modular vehicle trainer sound system having a plurality of separately controllable sound generators and a polyphonic speaker array
JPS5235282B2 (de) * 1972-09-09 1977-09-08
JPS5317283B2 (de) * 1973-03-07 1978-06-07
US3848092A (en) * 1973-07-02 1974-11-12 R Shamma System for electronic modification of sound
JPS5248001B2 (de) * 1973-08-20 1977-12-07
DE2354286A1 (de) * 1973-10-30 1975-05-07 Plank Kg Ernst Projektor
US3973839A (en) * 1974-12-30 1976-08-10 Mca Systems, Inc. Special effects generation and control system for motion pictures
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
US4256389A (en) * 1978-09-27 1981-03-17 Paramount Sound Systems Corporation Method and system of controlling sound and effects devices by a film strip
US4251688A (en) * 1979-01-15 1981-02-17 Ana Maria Furner Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
DE3233882A1 (de) * 1982-09-13 1984-03-15 Robert Bosch Gmbh, 7000 Stuttgart System zur fernsehmaessigen uebertragung
CA1253255A (en) * 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
BG60225B2 (en) * 1988-09-02 1993-12-30 Q Sound Ltd Method and device for sound image formation
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
EP0455738B2 (de) * 1989-01-27 2007-04-04 Dolby Laboratories Licensing Corporation Transformationscodierer, -decodierer und -codierer/decodierer mit niedriger bitrate für audio-anwendungen hoher qualität
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
EP0520068B1 (de) * 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Kodierer/dekodierer für mehrdimensionale schallfelder
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US6052470A (en) * 1996-09-04 2000-04-18 Victor Company Of Japan, Ltd. System for processing audio surround signal

Also Published As

Publication number Publication date
EP1070438A1 (de) 2001-01-24
KR20010042497A (ko) 2001-05-25
DK1070438T3 (da) 2007-02-12
KR100828952B1 (ko) 2008-05-13
US6016473A (en) 2000-01-18
AU3382999A (en) 1999-10-25
WO1999052326A1 (en) 1999-10-14
CA2327281A1 (en) 1999-10-14
CN1142705C (zh) 2004-03-17
EP1070438B1 (de) 2006-10-18
ES2272062T3 (es) 2007-04-16
EP1677576A3 (de) 2007-06-27
CN1295778A (zh) 2001-05-16
TW439051B (en) 2001-06-07
AU749062B2 (en) 2002-06-20
JP2002511683A (ja) 2002-04-16
HK1036728A1 (en) 2002-01-11
CA2327281C (en) 2008-02-05
DE69933659D1 (de) 2006-11-30
EP1677576A2 (de) 2006-07-05
ATE343311T1 (de) 2006-11-15

Similar Documents

Publication Publication Date Title
DE69933659T2 (de) Verfahren und system zur räumlichen kodierung mit niedriger bitrate
DE69214523T3 (de) Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE69832595T2 (de) Mehrweg-audiodekoder
DE602004001868T2 (de) Verfahren zum bearbeiten komprimierter audiodaten zur räumlichen wiedergabe
DE60306512T2 (de) Parametrische beschreibung von mehrkanal-audio
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
EP2005421B1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE602004008613T2 (de) Treueoptimierte kodierung mit variabler rahmenlänge
CN1655651B (zh) 用于合成听觉场景的方法和设备
EP0667063B1 (de) Verfahren zur übertragung und/oder speicherung digitaler signale mehrerer kanäle
US8880413B2 (en) Binaural spatialization of compression-encoded sound data utilizing phase shift and delay applied to each subband
MX2007009559A (es) Codificacion de junta parametrica de fuentes de audio.
DE102005014477A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
EP1687809A1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE102006010212A1 (de) Vorrichtung und Verfahren zur Simulation von WFS-Systemen und Kompensation von klangbeeinflussenden WFS-Eigenschaften
Faller et al. Binaural cue coding applied to audio compression with flexible rendering
US5864813A (en) Method, system and product for harmonic enhancement of encoded audio signals
Baumgarte et al. Audio coder enhancement using scalable binaural cue coding with equalized mixing
Uhle et al. Methods for Low Bitrate Coding Enhancement Part II: Spatial Enhancement
DE10154932B4 (de) Verfahren zur Audiocodierung
KR20080033840A (ko) 믹스 신호의 처리 방법 및 장치

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee