DE112015003108B4 - Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals - Google Patents

Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals Download PDF

Info

Publication number
DE112015003108B4
DE112015003108B4 DE112015003108.1T DE112015003108T DE112015003108B4 DE 112015003108 B4 DE112015003108 B4 DE 112015003108B4 DE 112015003108 T DE112015003108 T DE 112015003108T DE 112015003108 B4 DE112015003108 B4 DE 112015003108B4
Authority
DE
Germany
Prior art keywords
channel
signals
signal
block
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE112015003108.1T
Other languages
English (en)
Other versions
DE112015003108T5 (de
Inventor
Seung Kwon Beack
Jeong-Il Seo
Jong Mo Sung
Tae Jin Lee
Dae Young Jang
Jin Woong Kim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority claimed from PCT/KR2015/006788 external-priority patent/WO2016003206A1/ko
Publication of DE112015003108T5 publication Critical patent/DE112015003108T5/de
Application granted granted Critical
Publication of DE112015003108B4 publication Critical patent/DE112015003108B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/07Generation or adaptation of the Low Frequency Effect [LFE] channel, e.g. distribution or signal processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Verfahren zur Verarbeitung eines Mehrkanal-Audiosignals, aufweisend die folgenden Verfahrensschritte:Bestimmung eines Restsignals und N/2-Downmix-Signalen erzeugt aus N Kanaleingangssignalen;Anwendung der N/2-Downmix-Signale und des Restsignals auf die eine erste Matrix;Ausgeben eines ersten Signals durch die erste Matrix, welches an jeden von N/2 Dekorrelatoren übergeben wird, welche N/2 Eins-zu-Zwei (OTT)-Blöcken entsprechen, und eines zweiten Ausgangssignals, das einer zweiten Matrix ohne Eingabe in die N/2 Dekorrelatoren übermittelt wird;Ausgabe eines dekorrelierten Signals aus dem ersten Signal durch die N/2 Dekorrelatoren;Anwendung des dekorrelierten Signals und des zweiten Signals auf die zweite Matrix; sowie Generierung von N-Kanal-Ausgangssignalen durch die zweite Matrix.

Description

  • In diesem Kontext werden die Anwendungsweisen der Mehrkanalsysteme gemeint, die auf die Arbeit der Audiosignale basiert sind; und zwar wird eine effiziente Bearbeitung der Mehrkanal-Audisignale mittels der Struktur N-N / 2-N hier gemeint.
  • Vorgänger der modernen Audiosysteme
  • MPEG Surround (MPS) stellt einen Lautcodec für die Kodierung der Mehrkanalsignalaudiosysteme, wie 5.1-kanalige und 7.1-kanalige Audiosysteme dar, die die Kodierung und Dekodierung der Systeme mittels Kompression und nachfolgender Übertragung der Mehrkanalaudiosysteme mit einem hohen Kompressionsgrad darstellen. Doch MPS hat die Beschränkung nach der Kompatibilität in den Prozessen der Kodierung und Dekodierung. So wird der Bitstrom, komprimiert mit Hilfe von MPS, auf den Decoder nur vorbehaltlich der Ausführung der einschränkenden Bedingung übertragen, dass der Bitstrom im Mono- oder Stereo-Format wiedergegeben wird.
  • Sogar wenn die Anzahl der Eingangskanäle, die das Signal bilden, zunimmt, soll der Bitstrom, der auf den Decoder übertragen wird, ein verschlüsseltes Mono-Signal oder ein stereophones Signal sein. Der Decoder kann zusätzliche Informationen auffangen, damit das gemischte Mono- oder Stereo-Signal in Form vom Bitstrom übertragen wird. Der Decoder kann das Mehrkanalsignal aus dem monophonen oder stereophonen Signal beim Vorhandensein der zusätzlichen Informationen wieder herstellen.
  • Doch mit der Vergrößerung der Nachfrage auf die Anwendung der Mehrkanalsignalaudiosysteme 5.1 und 7.1 und der mehr fortgeschrittenen Versionen hat die Bearbeitung der Mehrkanallautsignale unter Anwendung der existierenden Struktur MPS zur Verschlechterung der Qualität der Audiosignale geführt.
  • Ausführliche Beschreibung
  • Technisches Objekt
  • Die Varianten der Realisation gewährleisten die Bearbeitungsweise der Mehrkanal-Audiosignalsysteme mittels der Struktur N-N / 2-N.
  • Technische Lösung
  • Entsprechend einem Aspekt der Erfindung dieses Gerätes wird eine Bearbeitungsweise der Mehrkanalsignalaudiosysteme vorgeschlagen, wobei diese Weise die Bestimmung der restlichen Signale, sowie der Signale mit herabgesetzter Mischung N 2 /, erhalten von den Eingangs-N-Kanalsignalen, unter Anwendung der N / 2 herabsetzenden gemischten Signale und des restlichen Signals der ersten Matrix aufnimmt, führt das erste Signal, das in jeden von N / 2 Dekorrelatoren, die den zusammengebunden N / 2 Kanälen (Block OTT) entsprechen, durch die erste Matrix eingeführt wird, und ein zweites Ausgangssignal das an eine zweite Matrix übertragen wird ohne in die N/2 Dekorrelatoren eingegeben zu werden, mit der Ausgabe des dekorrelierten Signals aus dem ersten Signal, das durch N / 2 Dekorrelator geht, unter Anwendung der dekorrelierten Signale und des Signals auf der zweiten Matrix mit der Generierung der Ausgangssignale N durch die zweite Matrix übertragen wird.
  • BREEBAART, J.; HERRE, J.; FALLER, C.; ́RÖDÉN, J.; MYBURG, F.; DISCH, S.; PURNHAGEN, H.; HOTHO, G.; NEUSINGER, M.; KJORLING, K.; OOMEN, W.: MPEG spatial audio coding/MPEG surround: „Overview and current status“. In: Audio Engineering Society Convention paper, 2005, 1 - 17, beschreiben Verfahren zur räumlichen Audio-Kodierung, wobei eine vollständig rückwärtskompatible Darstellung von Mehrkanalton bei Bitraten ermöglicht wird, die nur geringfügig höher sind als die derzeit für die Kodierung von Mono- oder Stereoton üblichen Raten. Die Technologie ermöglicht ein breites Spektrum an Skalierbarkeit in Bezug auf die Seiteninformationsrate, wodurch nahezu jedes denkbare Anwendungsszenario abgedeckt werden kann.
  • Die WO 2007/078254 A2 beschreibt eine personalisierte Decodierung von Mehrkanal-Surround-Sound, wobei ein parametrischer Mehrkanal-Surround-Audio-Bitstrom in einem Mehrkanaldecoder empfangen wird. Der empfangene Raumparameter werden in der Kombiniereinheit in einen neuen Satz von Raumparametern transformiert, die verwendet werden, um eine Decodierung des Mehrkanal-Raumklangs zu erhalten, die nicht ein einfaches Äquivalent des ursprünglichen Eingangs-Mehrkanal-Raumklangsignals ist, sondern z.B. dadurch personalisiert werden kann, dass die Transformation auf einer Darstellung von auf den Kopf des Benutzers bezogenen Filtern basiert, die von einer Einheit erhalten werden.
  • Wenn der Niederfrequenzkanal (LFE) die Ausgangssignale des Kanales N nicht aufnimmt, so darf man die Schlussfolgerung ziehen, dass N / 2 Dekorrelator dem Block N / 2 OTT identisch ist.
  • Wenn die Zahl der Dekorrelatoren den Referenzbetriebswert nach dem Modul überschreitet, können die Indexe der Dekorrelatoren auf Basis des Standardwertes vielfach verwendet werden.
  • Beim Eingang der Ausgangssignale N in den LFE-Kanal entsprechen alle Parameter des Dekorrelators, mit Ausnahme der Zahl der LFE-Kanäle aus N / 2, und der Kanal LFE, wie bekannt, kann den Dekorrelator OTT nicht verwenden.
  • Wenn das Instrument temporär nicht verwendet wird, darf ein Strom, der das zweite dekorrelierte Signal, erhalten vom Dekorrelator, und das restliche Signal, erhalten aus dem Dekorrelator, aufnimmt, auf den Eingang der zweiten Matrix eingeführt sein.
  • Wenn das Instrument im Laufe der Ausführung der Operationen ist, so dürfen der Strom, der direkte Signale, sowohl das zweite, als auch das restliche Signal, erhalten aus dem Dekorrelator, aufnimmt, sowie der Strom, der diffuse Signale aufnimmt, darunter dekorrelierte Signale, auf den Eingang der zweiten Matrix eingeführt sein.
  • Die Generierung der Ausgangskanalsignale N kann die Bildung der temporären Ausgangssignale mittels der Anwendung des Untersetzungsfaktors aufgrund des diffusen Signals und des direkten Signals zum diffusen Teil des Ausgangssignals unter Anwendung der Ressource Subband Domain Time Processing (STP) einschließen.
  • Die Generierung der Ausgangssignale des Kanales N kann deren Kompression und Abänderung mittels der Umwandlung der entsprechenden direkten Signale für alle Ausgangssignalkanäle N, unter Anwendung der Ressource Guided Envelope Shaping (GES) einschließen.
  • Die Größe der ersten Matrix kann aufgrund der Anzahl der Kanäle mit herabsetzender Mischung der Signale und Anzahl der Dekorrelatoren bestimmt sein, zu der die erste Matrix gehört, und das Element der ersten Matrix kann aufgrund der Verschiedenheit der Kanalniveaus (CLD) unter Anwendung der Ressource Channel Prediction Coefficient (CPC) bestimmt sein.
  • Entsprechend anderem Aspekt der Erfindung dieses Gerätes ist die Bearbeitungsweise der Mehrkanal-Audiosignale vorgeschlagen, wobei die angegebene Weise die Bestimmung der N / 2 Kanäle mit herabgesetzter Mischung der Signale und N / 2 Kanäle mit den restlichen Signalen, Generierung der Ausgangskanäle mit den Signalen N mittels der Einführung des Kanales N/2 und N / 2 Kanäle mit den restlichen Signalen vom Block N / 2 OTT aufnimmt, wo das Block N / 2 OTT parallel ohne gegenseitige Verbindung verbunden ist, die Anlegung des Blockes OTT mit dem Ausgang der Kanäle LFE relativ N / 2 OTT ist so ausgeführt, um die Möglichkeit des (1) Auffangens der Signale mit herabgesetzter Mischung zur Seite von restlichen S zu sichern.
  • Effekt der Erfindung dieses Gerätes
  • Alle Varianten der Realisation beachtend, darf man die Lautsignale der mehren Kanäle, als die Anzahl der Kanäle, bestimmt in MPEG Surround (MPS), mittels der Bearbeitung der Mehrkanal-Audiosignale durch die Struktur N-N / 2-N zusätzlich effizient bearbeiten.
  • Figurenliste
    • Die illustriert detailliert einen dreidimensionalen (3D) Lautdecoder entsprechend der Variante der Realisation.
    • Die illustriert detailliert die Domäne, die mit Hilfe des Laudecoders 3D entsprechend der Variante der Realisation bearbeitet ist.
    • Die illustriert das Prinzip von Geräten Audio Coding (USC), 3D -Coder und Decoder USC 3D entsprechend der Variante der Realisation.
    • Die - das erste Schema, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
    • Die stellt das zweite Schema dar, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist ein drittes Schema, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
    • Die stellt das vierte Schema vor, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist ein erstes Schema, das die Konfiguration des zweiten Blockes der Dekodierung in der entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist ein zweites Schema, das die Konfiguration des zweiten Blockes der Dekodierung in der entsprechend der Variante der Realisation detailliert zeigt.
    • Die - das dritte Schema, das die Konfiguration des zweiten Blockes der Dekodierung in der entsprechend der Variante der Realisation detailliert illustriert.
    • Die illustriert das Beispiel der Realisation in der entsprechend der Variante der Realisation.
    • Die - die vereinfachte Version der entsprechend der Variante der Realisation.
    • Die illustriert detailliert die Konfiguration des zweiten Blockes der Kodierung und des ersten Blockes der Dekodierung in der entsprechend der Variante der Realisation.
    • Die illustriert detailliert das Ergebnis des Kombinierens des ersten und zweiten Blockes der Kodierung, gezeigt in der , und die Vereinigung des ersten Blockes der Dekodierung oder des zweiten Blockes der Dekodierung, gezeigt in der entsprechend der Variante der Realisation.
    • Die - die vereinfachte Version der entsprechend der Variante der Realisation.
    • In der ist das Schema gezeigt, das die Bearbeitungsweise des Lausignals für die Struktur N-N / 2-N entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist das Schema gezeigt, das die N-N / 2-N Struktur in Form von der baumförmigen Struktur entsprechend der Variante der Realisation detailliert illustriert.
    • Die stellt das Schema dar, das den Coder und Decoder für die Vierkanal-Elementstruktur (FCE) entsprechend der Variante der Realisation detailliert illustriert.
    • Die stellt das Schema dar, das den Coder und Decoder für die Dreikanal-Elementstruktur (TCE) entsprechend der Variante der Realisation detailliert illustriert.
    • Die stellt das Schema dar, das den Coder und Decoder für die Struktur des Achtkanalelementes des Kanales ECE entsprechend der Variante der Realisation illustriert.
    • Die stellt das Schema dar, das den Coder und Decoder für das Sechskanalelement der SiCE Struktur entsprechend der Variante der Realisation illustriert.
    • Die - das Schema, das den Prozess der Bearbeitung der lautlichen 24-Kanalsignale aufgrund der Struktur FCE entsprechend der Variante der Realisation detailliert illustriert.
    • Die - das Schema, das den Prozess der Bearbeitung der lautlichen 24-Kanalsignale aufgrund der Struktur ECE entsprechend der Variante der Realisation detailliert illustriert.
    • In der ist das Schema gezeigt, das den Prozess der Bearbeitung der lautlichen 14-Kanalsignale aufgrund der Struktur FCE entsprechend der Variante der Realisation detailliert illustriert.
    • Die stellt das Diagramm dar, das den Prozess der Bearbeitung der Lautsignale aufgrund der Struktur ECE und Struktur SiCE entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist ein Schema, das den Prozess der Bearbeitung der Audiosignale 11.1 aufgrund der Struktur TCE entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist ein Schema, das den Prozess der Bearbeitung der Lausignale 11.1, aufgrund der Struktur FCE entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist ein Schema, das den Prozess der Bearbeitung der Audiosignale 9.0 aufgrund der Struktur TCE entsprechend der Variante der Realisation detailliert illustriert.
    • Die ist ein Diagramm, das den Prozess der Bearbeitung der Lautsignale 9.0 aufgrund der Struktur FCE entsprechend der Variante der Realisation detailliert illustriert.
  • Ausführliche Beschreibung der Realisation der Prozesse
  • Ferner sind die Varianten der Realisation der Prozesse entsprechend der Verweisung auf die beigefügten Schemen beschrieben.
  • In der ist das Schema gezeigt, das den dreidimensionalen (3D) Lautdecoder entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend den Varianten der Realisation, kann der Coder die Mischung der Mehrkanal-Audiosignale herabsetzen, und der Decoder kann das lautliche Mehrkanalsignal mittels erhöhter Mischung wieder herstellen. Die Beschreibung, die zum Decoder unter den folgenden Varianten der Realisation gehört, soll entsprechend der Verweisung auf die gewährt sein, wobei der Punkt 29 der entsprechen kann. Gleichzeitig, in der illustriert der Punkt 29 die Bearbeitungsweise der Mehrkanal-Audiosignale und kann jedem zusammengestellten Komponenten des Bitstroms, des Gerätes Audio Coding (USAC), 3D Decoder, DRC-1 und der Transformation des Formates entsprechen.
  • Die illustriert die Domäne, die mit Hilfe des Laudecoders 3D entsprechend der Variante der Realisation bearbeitet ist.
  • Der USAC-Decoder (in der ) wird für die Kodierung des Grundbereiches des Kernes, sowie für die Bearbeitung des Lautsignals in einem der temporären Bereichen und Frequenzwellen verwendet. Außerdem wenn das Lautsignal Mehrfrequenzsignal ist, wird der Prozess DRC-1 mit der Formel beschrieben: M = N 2 ( N   i s   e v e n ) , M = N 1 2 + 1 ( N   i s  odd )
    Figure DE112015003108B4_0001
  • Der zweite Block der Kodierung 302 kann die Kanäle mit herabgesetzter Mischung der Signale M mit der Generierung des Bitstroms verschlüsseln. Wir vermuten: das zweite Block der Kodierung 302 verschlüsselt die Signale mit herabgesetzter Mischung der M-Kanäle. In diesem Fall kann der allgemeine Lautcoder dazu verwendet sein. Zum Beispiel, wenn das zweite Block der Kodierung 302 den ausgedehnten Coder HE-AAC USAC darstellt, so bestehen seine Möglichkeiten und das Ziel in der Kodierung und Sendung der Signale des 24-Kanalsystems.
  • Für den Fall, wenn die Signale des Eingangskanal N unter Anwendung des zweiten Blockes der Kodierung 302 verschlüsselt werden, sind relativ große Bits erforderlich, als für den Fall, wenn die N-Kanaleingangssignale unter Anwendung sowohl des ersten Blockes der Kodierung 301, als auch des zweiten Blockes der Kodierung 302 verschlüsselt werden, weil in diesem Fall die Qualität des Lautes wesentlich verschlimmert wird.
  • Gleichzeitig kann der erste Block der Dekodierung 303 den Bitstrom dekodieren, der vom zweiten Block der Kodierung 302 für den Ausgang der M-Kanalsignale mit herabgesetzter Mischung erzeugt wurde. Der zweite Block der Dekodierung 304 kann die Kanäle mit herabgesetzter Mischung für die Bildung der Ausgangssignale des Kanales N aus den Kanälen M mischen. Der zweite Block der Dekodierung 302 kann die Signale des Ausgangskanales M für die Bildung des Bitstroms dekodieren. Die Ausgangssignale des Kanales N können zwecks der Realisation der Identität der Signale des Eingangskanals N wieder hergestellt sein, die in den Block der Kodierung 301 eingeführt werden.
  • Wir stellen vor, dass der zweite Block der Dekodierung 304 die Signale mit herabgesetzter Mischung der M-Kanäle dekodiert. In diesem Fall kann der allgemeine Lautcoder verwendet werden. Zum Beispiel, wenn der zweite Block der Dekodierung 304 einen ausgedehnten Coder HE-AAC USAC darstellt, so kann er die 24-Kanalsignale mit herabgesetzter Mischung dekodieren.
  • Die ist ein erstes Schema, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
  • Der erste Block der Kodierung 301 kann eine Menge der Informationsblocke 401 einschließen. In diesem Fall können die Signale der Eingangskanäle N, die auf den ersten Block der Kodierung 301 gehen, in einen allgemeinen Informationsblock 401 eingeführt sein. Die Informationsblocke können den Block 2/1 TTO darstellen. Jeder der Informationsblocke 401 kann die Signale eines Kanales (Mono) mit herabgesetzter Mischung mittels der Extraktion der Rauminformationen, zum Beispiel, über das Niveau der Differenz zwischen den Kanälen (CLD), Innenkanalkorrelation / Übereinstimmung (ICC), Innenkanalphase (IPD), Koeffizienten der Kanalprognostizierung (CPC), und Gesamtdifferenz der Phasen (OPD) aus den Signalen von zwei Eingangskanälen mittels herabgesetzter Mischung generieren.
  • Die Informationsblocke 401, die der erste Block der Kodierung 301 aufnehmen, können die parallele Struktur konfigurieren. Zum Beispiel, wenn die Eingangs-N-Kanalsignale auf den Eingang des ersten Blockes der Kodierung 301 gehen, wo N - gerade Zahl, N / 2 TTO - herabsetzende Mischung der 401 Einheiten, jede von denen im Block TTO ist, der für die kombinierte Arbeit mit dem ersten Block der Kodierung 301 gefordert werden kann.
  • Die stellt das zweite Schema dar, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
  • Die illustriert die ausführliche Konfiguration des ersten Blockes der Kodierung 301 anhand vom Beispiel, in dem die Eingangs-N-Kanalsignale auf den Eingang des ersten Blockes der Kodierung 301 gehen, wo N - gerade Zahl. Die illustriert die ausführliche Konfiguration des ersten Blockes der Kodierung 301 im Beispiel, in dem die Eingangs-N-Kanalsignale auf den Eingang des ersten Blockes der Kodierung 301 gehen, wo N - ungerade Zahl.
  • Entsprechend der Verweisung in der kann der erste Block der Kodierung 301 eine Menge der Informationsblocke 501 einschließen. In diesem Fall kann der erste Block der Kodierung 301 (N-1) / 2 Informationsblocke 501 einschließen. Der erste Block der Kodierung 301 kann den Block 502 mit der Verzögerung nach der Bearbeitung eines bleibenden Kanalsignals einschließen.
  • In diesem Fall, die Signale N der Eingangskanäle, die auf den ersten Block der Kodierung 301 gehen, können in einen allgemeinen Informationsblock 501 gebracht sein. Die Informationsblocke 501 können die Blocke TTO darstellen. Jedes der Informationsblocke 501 kann die Signale eines einkanaligen (Mono) Systems mit herabgesetzter Mischung mittels der Extraktion der Rauminformationen, zum Beispiel, über CLD, ICC, IPD, CPC, oder ROP aus zwei Eingangskanälen mittels herabgesetzter Mischung von zwei Kanälen der Stereo-Signale generieren. Die Angaben der Signale vom M-Kanal, ausgegeben aus dem ersten Block der Kodierung 301, können aufgrund der Anzahl der Informationsblocke 501 und Anzahl der Blocke der Verzögerungen 502 bestimmt werden.
  • Der Wert der Verzögerung auf dem Block 502 wird mit demselben Wert, wie vom Informationsblock 501 gereicht. Wenn die Signale der M-Kanäle mit herabgesetzter Mischung, gegangen aus dem ersten Block 301, die Impulscode- und Modulationssignale (PCM) sind, so kann der Wert der Verzögerung entsprechend der Gleichung 2 bestimmt sein. Enc_Delay = delay1 ( QFM-Analyse ) + delay2 ( Hybrid-QFM-Analyse ) + Delay3 ( QFM-Synthese )
    Figure DE112015003108B4_0002
  • In diesem Fall Enc_Delay - Wert der Verzögerung in Bezug auf den Informationsblock 501 und 502. delay1 (QMF-Analysis) -generierter Wert der Verzögerung bei der Realisation des Kaskadenfilters (QMF-Analyse), die auf 64 Wellen MPEG Surround (MPS) geleitet wird. delay2 (Hybrid-QMF-Analyse) - Wert der Verzögerung, generiert in der Hybridanalyse QMF unter Anwendung des 13-Kaskadenfilters, der in 6 * 64 = 384 vergrößert sein kann. In diesem Fall wird das System 64 verwendet, weil die Hybrid-QMF-Analyse gerade für das System 64 verwendet wird.
  • Wenn der M-Kanal mit herabgesetzter Mischung der Signale vom Ausgang des ersten Blockes 301 Kodierung die QMF-Signale vorstellt, kann der Wert der Verzögerung entsprechend der Gleichung 3 bestimmt sein. Enc_Dela = Delay1 ( QFM-Analyse ) + delay2 ( Hybrid-QFM-Analyse )
    Figure DE112015003108B4_0003
  • Die ist ein drittes Schema, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
  • Die stellt das vierte Schema vor, das die Konfiguration des ersten Blockes der Kodierung in der entsprechend der Variante der Realisation detailliert illustriert.
  • Es wird angenommen, dass die Eingangssignale der Kanäle N die Eingangssignale der Kanäle K einschließen, die Eingangssignale der Kanäle N gehen auf den Eingang des ersten Blockes der Kodierung 301, und die Eingangssignale der Kanäle K gehen in den ersten Block der Kodierung 301 nicht.
  • In diesem Fall, M - Anzahl der Kanäle, die den Signalen der Eingangskanäle M mit herabgesetzter Mischung auf dem zweiten Block der Kodierung 302 entsprechen, die entsprechend der Gleichung 4 bestimmt wird. M = N ' 2 + K ( N '   i s   e v e n ) , M = N ' 1 2 + 1 + K ( N '   i s  odd )
    Figure DE112015003108B4_0004
  • In diesem Fall, die illustriert detailliert die Konfiguration des ersten Blockes der Kodierung 301, wenn N - gerade Zahl, und die illustriert detailliert die Konfiguration des ersten Blockes der Kodierung 301, wenn N - ungerade Zahl.
  • Entsprechend der , wenn N - gerade Zahl, und die Signale des Eingangskanals N in einen gesamten Informationsblock 601 gebracht sein können, und die Signale der Eingangskanäle K in den Block der Verzögerung 602 gebracht sein können. In diesem Fall können die Signale des Eingangskanals N in den Informationsblock N'/2 601 gebracht sein, jeder von denen den Block TTO darstellt, und die Signale des Eingangskanals K können in den Block der Verzögerung 602 gebracht sein.
  • Entsprechend der , wenn N - ungerade Zahl, die Signale des Eingangskanals N in einen gesamten Informationsblock 701 und einen Block der Verzögerung 702 gebracht sein können. Die Signale der Eingangskanäle K können in den Block der Verzögerung 702 gebracht sein. In diesem Fall können die Signale der Eingangskanäle N in den Informationsblock N' / 2 701 gebracht sein, jeder von denen den Block TTO darstellt. Die Signale der Eingangskanäle K können in die Blocke der Verzögerung K 702 jeweils gebracht sein.
  • Die ist ein erstes Schema, das die Konfiguration des zweiten Blockes der Dekodierung in der entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend der Verweisung auf die kann der zweite Block der Dekodierung 304 die Signale des Ausgangskanals N mit Hilfe der ausgedehnten Signale mit herabgesetzter Mischung der M-Kanäle generieren, die aus dem ersten Block 303 übertragen werden. Der erste Block der Dekodierung 303 kann die Signale des M-Kanales mit herabgesetzter Mischung dekodieren, der den Bitstrom darstellt. In diesem Fall kann der zweite Block der Dekodierung 304 die Signale der Ausgangskanäle N mittels herabgesetzter Mischung der M-Signale unter Anwendung der Rauminformationen generieren, die vom zweiten Block der Kodierung 301 nach der übergeben werden.
  • Zum Beispiel, wenn N - gerade Zahl der Signale im Ausgangskanal N, der zweite Block der Dekodierung 304 kann eine Menge der Blocke der Dekorrelation 801 und des ausgedehnten Blockes 802 einschließen. Wenn der Wert N - ungerade Zahl, so kann der zweite Block der Dekodierung 304 eine Menge der Blocke der Dekorrelation 801, den ausgedehnten Block 802 mit erhöhter Mischung und den Block der Verzögerung 803 einschließen. Das heißt, wenn N - gerade Zahl, ist die Nutzung des Blockes der Verzögerung 803 (in der ) nicht vorgesehen.
  • In diesem Fall, weil die zusätzliche Verzögerung im Moment der Dekorrelation der Signale im Block der Generierung 801 geschehen kann, kann sich der Wert des Blockes der Verzögerung 803 vom Wert der Verzögerung unterscheiden, die im Coder verwendet wird. Die zeigt, dass der zweite Block der Dekodierung 304 die Signale der Ausgangskanäle N ausgibt, wobei N - ungerade Zahl.
  • Wenn die Signale der Ausgangskanäle N, die aus dem zweiten Block der Kodierung 304 ausgegeben werden, die PCM-Signale sind, so kann der Wert der Verzögerung des Blockes 803 entsprechend der Gleichung 5 bestimmt sein. Dec_Delay = delay1 ( QFM-Analyse ) + delay2 ( Hybrid-QFM-Analyse ) + Delay3 ( QFM-Synthese ) + Delay4 ( Dekorrelator der Filtrierung der Verz gerung )
    Figure DE112015003108B4_0005
  • In diesem Fall Dec_Delay - Wert der Verzögerung auf dem Block 803; DELAY1 - Wert der Verzögerung, der mit Hilfe der Analyse QMF generiert wird; delay2 - Wert der Verzögerung, der mit Hilfe der Hybridanalyse QMF generiert wird; Delay3 - Wert der Verzögerung, der mit Hilfe der QMF-Synthese generiert wird; Delay4 - Wert der Verzögerung, der bei der Dekorrelation der 801 Einheiten unter Anwendung des Dekorrelationsfilters generiert wird.
  • Wenn die Signale der Ausgangskanäle N, die aus dem zweiten Block der Kodierung 304 ausgegeben werden, die QFM-Signale sind, dann kann der Wert der Verzögerung auf dem Block 803 entsprechend der Gleichung 6 bestimmt sein. Dec_Delay = Delay3 ( QFM-Synthese ) + Delay4 ( Dekorrelator der Filtrierung der Verz gerung )
    Figure DE112015003108B4_0006
  • Ursprünglich kann jeder der Blöcke der Dekorrelation 801 dekorrelierte Signale vom Eingangskanal mit herabgesetzter Mischung der M-Signale auf den zweiten Block der Dekodierung 304 generieren. Das dekorrelierte Signal, das von jedem der Blöcke der Dekorrelation 801 gebildet wird, kann in den Block 802 mit erhöhter Mischung eingeführt sein.
  • In diesem Fall, im Unterschied zur MPS Generierung desdekorreleirten Signals, kann eine Menge der Blöcke der Dekorrealtion 801 die dekorrelierten Signale unter Anwendung des Kanales mit herabgesetzter Mischung der M-Signale generieren. Das heißt, wenn die Signale des M-Kanales vom Geber der Generierung der dekorrelierten Signale übertragen werden, wird die Qualität des Lautes gar nicht verschlimmert, besonders bei der Wiedergabe des Lautfeldes der Mehrkanalsignale.
  • Ferner werden die Operationen des Blockes 802 mit erhöhter Mischung beschrieben, die in den zweiten Block 304 der Kodierung aufgenommen ist. Die Signale des M-Kanals mit herabgesetzter Mischung werden auf den Eingang des zweiten Blockes der Dekodierung 304 geführt, bestimmt als:
    • m(n) = [m0,(n),m1 (n),..., mM-1(n)]T. Die Signale des M-Kanals, die unter Anwendung der Informationsblöcke M generiert werden, können als bestimmt sein:
    • d(n) = [dm0,(n),dm1,(n),...,dmM-1 (n)]T. Außerdem werden die Signale der Ausgangskanäle N durch den zweiten Block der Dekodierung 304 ausgegeben, der als bestimmt ist:
    • y(n) = [y0,(n), y1 (n),..., yM-1 (n)]T
  • Die Dekodierung der Ausgangssignale auf dem zweiten Block 304 des Kanals N geschieht entsprechend der Gleichung 7. y ( n ) = M ( n ) × [ m ( n )  d ( n ) ]
    Figure DE112015003108B4_0007
  • In diesem Fall M (n) - Matrix für den erhöhenden Kanal mit herabgesetzter Mischung der M-Signale während der Auswahl n. In diesem Fall kann M (n) durch die Gleichung 8 bestimmt werden [ R 0 ( n ) 0 0 0 R i ( n ) 0 0 0 R M 1 ( n ) ]
    Figure DE112015003108B4_0008
  • In der Gleichung 8, 0 ist eine Nullmatrix 2x2, und kann durch die Gleichung 9 geäußert sein. R i ( n ) = [ H L L i ( n ) H L R i ( n ) H R L i ( n ) H R R i ( n ) ] = [ H L L i ( b ) H L R i ( b ) H R L i ( b ) H R R i ( b ) ] + ( 1 δ ( n ) ) [ H L L i ( b 1 ) H L R i ( b 1 ) H R L i ( b 1 ) H R R i ( b 1 ) ]
    Figure DE112015003108B4_0009
  • In diesem Fall, die Komponente Ri(n) stammt aus dem Raumabdruck, der vom Coder übertragen wird. Die Rauminformationen, die tatsächlich vom Coder übertragen werden, können für jeden Index b bestimmt sein, der den abgesonderten Block darstellt und mit Hilfe des Blockes der Auswahl mittels der Interpolation bestimmt wird. { H L L i ( b ) , H L R i ( b ) , H R L i ( b ) , H R R i ( b ) }
    Figure DE112015003108B4_0010
    kann unter Anwendung der Methode MPS entsprechend der Gleichung 10 bestimmt sein. [ H L L i ( b ) H L R i ( b ) H R L i ( b ) H R R i ( b ) ] = [ c L ( b ) cos ( α ( b ) + β ( b ) ) c L ( b ) sin ( α ( b ) + β ( b ) ) c R ( b ) cos ( β ( b ) α ( b ) ) c L ( b ) sin ( β ( b ) α ( b ) ) ]
    Figure DE112015003108B4_0011
  • In der Gleichung 10, CL,R kann aus CLD erhalten sein; a(b) und β(b) können aus CLD und ICC erhalten sein. Die Gleichung 10 kann entsprechend der Bearbeitungsweise der Rauminformationen, bestimmt in MPS erhalten sein.
  • In der Gleichung 7, der Operator ] - ist ein Operator für die Erzeugung einer neuen Vektorspalte aus allen möglichen Komponentenvektoren. In der Gleichung 7, [m(n) ⌷d(n)] können entsprechend der Gleichung 11 bestimmt sein. v ( n ) = [ m ( n )  d ( n ) ] = [ m 0 ( n ) , d m 0 ( n ) , m 1 ( n ) , d m 1 ( n ) ,...,, m M 1 ( n ) , d m M 1 ( n ) ] T
    Figure DE112015003108B4_0012
  • Entsprechend der obengenannten Weise, kann die Angleichung 7 in Form von der Gleichung 12 vorgestellt sein. [ { y 0 ( n ) y 1 ( n ) } { y 2 i 2 ( n ) y 2 i 1 ( n ) } { y N 2 ( n ) y N 1 ( n ) } ] = [ [ H L L 0 ( n ) H L R 0 ( n ) H R L 0 ( n ) H R R 0 ( n ) ] 0 0 0 [ H L L i ( n ) H L R i ( n ) H R L i ( n ) H R R i ( n ) ] 0 0 0 [ H L L M 1 ( n ) H L R M 1 ( n ) H R L M 1 ( n ) H R R M 1 ( n ) ] ] [ { m 0 ( n ) d m 0 ( n ) } { m 1 ( n ) d m 1 ( n ) } { m M 1 ( n ) d m M 1 ( n ) } ]
    Figure DE112015003108B4_0013
  • In der Gleichung 12 {} werden für die Präzisierung der Prozesse der Bearbeitung der Eingangs- und Ausgangssignale verwendet. Nach der Gleichung 11 verbinden sich die Signale der Kanäle M mit herabgesetzter Mischung mit den dekorrelierten Signalen nach den Eingängen der Matrix mit erhöhter Mischung, wie gezeigt in der Gleichung 12. Das heißt, entsprechend der Gleichung 12, gehen die dekorrelierten Signale in die entsprechenden M-Kanäle mit herabgesetzter Mischung der Signale, auf Minimum der Entstehung der Lautqualität im Laufe der Erhöhung der Mischung und Erzeugung des Lautfeldes mit dem Effekt der maximalen Identität zu den Ausgangssignalen dadurch reduzierend.
  • Die Gleichung 12, die oben beschrieben ist, kann entsprechend der Gleichung 13 auch vorgeführt sein. [ { y 2 i 2 ( n ) y 2 i 1 ( n ) } ] = [ H L L i ( b ) H L R i ( b ) H R L i ( b ) H R R i ( b ) ] [ { m i ( n ) d m i ( n ) } ]
    Figure DE112015003108B4_0014
  • Die ist ein zweites Schema, das die Konfiguration des zweiten Blockes der Dekodierung in der entsprechend der Variante der Realisation detailliert zeigt.
  • Entsprechend der Verweisung auf die , kann der zweite Block der Dekodierung 304 die Ausgangssignale des Kanales N mittels der Dekodierung der Signale des M-Kanales mit herabgesetzter Mischung generieren, übertragen aus dem ersten Block der Dekodierung 303. Wenn die Signale des M-Kanales mit herabgesetzter Mischung die Audiosignale des N'/2 Kanals und des K-Kanals einschließen, leitet der zweite Block der Dekodierung 304 gleichzeitig die Ergebnisse der Bearbeitung des Coders.
  • Wir vermuten, dass der M-Kanal mit herabgesetzter Mischung zwischen den Signalen auf dem Eingang des zweiten Blockes der Dekodierung 304 der Gleichung 4 genügt, der zweite Block der Dekodierung 304 kann eine Menge der Blocke der Verzögerung 903 einschließen, wie in der gezeigt.
  • In diesem Fall, wenn N - ungerade Zahl bezüglich des Kanales mit herabgesetzter Mischung der M-Signale, genügend der Gleichung 4, der zweite Block der Dekodierung 304 die Konfiguration haben kann, die in der gezeigt ist. Wenn N - gerade Zahl bezüglich des Kanales mit herabgesetzter Mischung der M-Signale, genügend der Gleichung 4, der erste Block der Verzögerung 903, der unter dem Block 902 mit erhöhter Mischung gelegen ist, kann aus dem zweiten Block der Dekodierung 304 in der ausgeschlossen sein.
  • Die ist ein drittes Schema, das die Konfiguration des zweiten Blockes der Dekodierung in der entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend der Verweisung auf die , kann der zweite Block der Dekodierung 304 die Ausgangssignale des Kanales N mit Hilfe der Signale mit herabgesetzter Mischung der M-Kanäle generieren, die aus dem ersten Block der Dekodierung 303 übertragen werden. In diesem Fall, in der , kann der Block mit erhöhter Mischung des 1002 Blocks der Dekodierung 304 eine Menge der Blocke der Bearbeitung der Signale 1003 einschließen, jeder von denen das Block 2/1 OTT darstellt.
  • In diesem Fall kann jeder der Blöcke 1003 nach der Signalbearbeitung die Signale von zwei Ausgangskanälen, ein von denen mit herabgesetzter Mischung der M-Signale, und das andere mit den dekorrelierten Signalen generieren, die vom Block der Dekorrelation 1001 generiert werden. Der Block der Signalbearbeitung 1003 ist parallel im Block mit erhöhter Mischung 1002 verbunden, der die Signale des Ausgangskanals N/1 generieren kann.
  • Wenn N - gerade Zahl, so kann das Block der Verzögerung 1004 aus dem zweiten Block der Dekodierung 304 ausgeschlossen sein. Jeweils sind die Blöcke der Signalbearbeitung 1003 parallel im Block mit erhöhter Mischung gelegen, der die Ausgangssignale des Kanales N generiert.
  • Die Blöcke der Signalbearbeitung 1003 können erhöhte Mischung entsprechend den Prozessen leiten, die in der Gleichung 13 nach der Ausführung erhöhter Mischung aller Blöcke der Signalbearbeitung 1003 beschrieben sind, die in Form von einer Matrix erhöhter Mischung entsprechend der Gleichung 12 vorgestellt sein können.
  • Die illustriert das Beispiel der Realisation dieser Weise in der entsprechend der Variante der Realisation.
  • Entsprechend der Verweisung auf die , kann der erste Block der Kodierung 301 eine Menge der Informationsblöcke TTO 1101 und eine Menge der Blöcke der Verzögerung 1102 einschließen. Der zweite Block der Kodierung 302 kann eine Menge der Coder USAC 1103 einschließen. Der erste Block der Dekodierung 303 kann eine Menge der Decoder USAC 1106 einschließen, und der zweite Block der Dekodierung 304 kann die Gesamtheit der Blöcke OTT 304 und Blöcke der Verzögerung 1108 einschließen.
  • Entsprechend der Verweisung auf die , kann der erste Block der Kodierung 301 die M-Signale der Informationsblöcke unter Anwendung der N-Kanaleingangssignale ausgeben. In diesem Fall können die Signale des M-Kanals mit herabgesetzter Mischung auf den zweiten Block der Kodierung 302 gebracht sein. Die Signale des Kanales M mit herabgesetzter Mischung können auf den zweiten Block der Kodierung 302 gebracht sein. In diesem Fall, unter allen Signalen des Kanales M mit herabgesetzter Mischung können Paare Signale mit herabgesetzter Mischung des 1. Kanales, gehend durch den Informationsblock TTO 1101, in die stereophonen Formen mittels der Coder USAC 1103 und des zweiten Blockes der Kodierung 302 verschlüsselt sein.
  • Unter den Signalen des Kanales M mit herabgesetzter Mischung, können die Signale mit herabgesetzter Mischung, gehend durch die Blöcke der Verzögerung 1102, anstelle ihrer Kodierung im Informationsblock 1101 in Mono- oder Stereo-Form mittels der Coder USAC 1103 verschlüsselt sein. Das heißt, was der Signale des Kanales M betrifft, können die gehenden Signale mit herabgesetzter Mischung durch den Block der Verzögerung 1102 in der Mono-Form mittels der Coder USAC 1103 verschlüsselt sein. Unter den Signalen der M-Kanäle mit herabgesetzter Mischung können zwei Signale, die durch zwei Blöcke der Verzögerung 1102 gehen, in der Stereo-Form mittels der Coder USAC 1103 verschlüsselt sein.
  • Die Signale der M-Kanäle können mit Hilfe des zweiten Blockes 302 der Kodierung verschlüsselt sein und auf eine Menge der Bitströme generiert werden. Diese Bitströme können in einen Bitstrom mittels des Multiplexers 1104 umformatiert sein.
  • Der Bitstrom wird vom Multiplexer 1104 generiert und auf den Demultiplexer 1105 übertragen, und der Demultiplexer 1105 seinerseits kann den Bitstrom auf eine Menge der Bitströme umformen, die den Decodern USAC 303 entsprechen, aufgenommen in den ersten Block der Dekodierung 303.
  • Eine Menge der demultiplexierten Bitströme können in die entsprechenden Decoder USAC 1106 im ersten Block der Dekodierung 303 gebracht sein. Mittels der USC-Decoder 303 kann man die Bitströme entsprechend derselben Weise der Kodierung dekodieren, die die Anwendung der Coder USAC 1103 im Block der zweiten Kodierung 302 anordnet. Der erste Block der Dekodierung 303 kann die Signale des M-Kanals mit herabgesetzter Mischung von der Gesamtheit der Bitströme ausgeben.
  • Nachher kann der zweite Block der Dekodierung 304 die Ausgangssignale des N-Kanals unter Anwendung des Kanales mit herabgesetzter Mischung der Signale des M-Kanals ausgeben. In diesem Fall kann der zweite Block der Dekodierung 304 den Teil der Eingangssignale des M-Kanales mit herabgesetzter Mischung mit Hilfe des Kernes des Blockes OTT des ausgedehnten Gerätes 1107 mischen. Detailliert erfolgt die Mischung der Signale des M-Kanales mit herabgesetzter Mischung im ausgedehnten Block 1107, und jeder der ausgedehnten Blocke 1107 kann das Ausgangssignal des Kanales 2 unter Anwendung herabgesetzter Mischung der Signale des Kanales 1 mit nachfolgender Dekorrelation generieren. Zum Beispiel, können die ausgedehnten Blöcke 1107 die Signale von zwei Ausgangskanälen unter Anwendung der Gleichung 13 generieren.
  • Gleichzeitig kann jeder der ausgedehnten Blöcke 1107 erhöhte Mischung M-Male unter Anwendung der Matrix erhöhender Mischung, entsprechend der Gleichung 13 erledigen und jeweils kann der zweite Block der Dekodierung 304 die Ausgangssignale des Kanales N generieren. So ist die Gleichung 12 bei der Ausführung erhöhender Mischung (in der Gleichung 13) M-Male erhalten, doch in der Gleichung 12 kann die Anzahl der Einheiten solch, wie nach der Gleichung 13 sein, das heißt, ist der Block 1107 in den zweiten Block der Dekodierung 304 aufgenommen.
  • Unter den Eingangssignalen des Kanales N können die Mehrkanal-Audiosignale des Kanales K in den Block des M-Kanals mit herabgesetzter Mischung der Signale durch die Blöcke der Verzögerung 1102, und nicht aus dem Informationsblock der Kodierung TTO 1101 aufgenommen sein. In diesem Fall, können die Lautsignale der K-Kanäle mit Hilfe der Blöcke der Verzögerung 1108 im zweiten Block der Dekodierung 304, und nicht durch die ausgedehnten Blöcke OTT 1107 bearbeitet sein. In diesem Fall, die Anzahl der Ausgangssignalkanäle, die durch den Block mit erhöhter Mischung der Blöcke OTT 1107 aufgeführt werden.
  • Die ist eine vereinfachte Version der entsprechend der Variante der Realisation.
  • Entsprechend der Verweisung auf die , können die Signale der Eingangskanäle N in den Informationsblock 1201 gebracht sein, der seinerseits in den ersten Block 301 aufgenommen ist. Alle Blöcke 1201 mit herabgesetzter Mischung können die Blöcke OTT darstellen und die Signale mit herabgesetzter Mischung des Kanales 1 mittels herabgesetzter Mischung der Eingangssignale des Kanales 2 generieren. Der erste Block der Kodierung 301 kann die Signale des M-Kanales mit herabgesetzter Mischung von den Signalen des Eingangskanals N unter Anwendung der Gesamtheit der Informationsblöcke 1201 generieren, die parallel verbunden sind.
  • Der Stereo-Coder USC 1202, der in den zweiten Block der Kodierung 302 aufgenommen ist, kann den Bitstrom mittels der Kodierung der Signale von zwei Informationsblöcken des Kanales 1 generieren, die aus zwei Informationsblöcken 1201 ausgegeben werden.
  • Der stereophone USC-Decoder 1203, der in den ersten Block der Dekodierung 303 aufgenommen ist, kann die Signale von zwei Kanälen 1 mit herabgesetzter Mischung wieder herstellen, die die Signale des Kanales M mit herabgesetzter Mischung des Bitstroms bilden. Zwei Signale mit herabgesetzter Mischung des Kanales 1 können in zwei ausgedehnte Blöcke 1204 gebracht sein, jeder von denen der Block OTT darstellt, der in den zweiten Block der Dekodierung 304 aufgenommen ist. Jeder der ausgedehnten Blöcke 1204 können die Ausgangssignale des 2. Kanales, bildend die Ausgangssignale des Kanales N generieren, die die Signale mit herabgesetzter Mischung vom 1. Kanal und die dekorrelierten Signale aufnehmen.
  • Die illustriert detailliert die Konfiguration des zweiten Blockes der Kodierung und des ersten Blockes der Dekodierung (der ähnlich) entsprechend der Variante der Realisation.
  • In der kann der Coder USC 1302, der in den zweiten Block der Kodierung 302 aufgenommen ist, den Block TTO mit herabgesetzter Mischung 1303 mit der spektralen Replikation (SBR), sowie den Block 1304 und den Block der Kodierung 1305 auch einschließen.
  • Die Informationsblöcke 1301, die in den ersten Block der Kodierung 301 aufgenommen sind, jeder von denen die Blöcke TTO darstellen, können die Signale mit herabgesetzter Mischung des 1. Kanales mit der Bildung der Signale mit herabgesetzter Mischung der M-Kanäle mittels herabgesetzter Mischung der Signale 2 der Eingangskanäle zwischen den Eingangssignalen der N-Kanäle generieren. Die Anzahl der M-Kanäle kann aufgrund der Anzahl der Informationsblöcke 1301 bestimmt sein.
  • Zwei Kanäle 1 mit den Informationssignalen, ausgegeben aus zwei Informationsblöcken 1301, ein von denen - Block der Kodierung 301 aus dem Block TTO 1303 mit herabgesetzter Mischung und der andere - aus dem Coder USAC 1302 ist. Der mischende Block 1303 kann ein Signal mit herabgesetzter Mischung des Kanales 1 mittels herabgesetzter Mischung Paare Kanäle mit herabgesetzter Mischung der Signale generieren, die aus zwei Blöcken der Mischung 1301 ausgegeben werden.
  • Der Block SBR 1304 kann nur den Niederfrequenzbereich der Signale aus dem Hochfrequenzbereich, mit Ausnahme der monophonen Signale für die Kodierung des Parameters der Frequenzen herausziehen, die vom Block mit herabgesetzter Mischung 1301 generiert werden. Der Block der Kodierung 1305 kann den Bitstrom mittels der Kodierung der niedrigen Frequenzen des monophonen Signals, das der Grundfrequenz entspricht generieren.
  • Entsprechend der Variante der Realisation, kann der Prozess mit herabgesetzter Mischung TTO zwecks der Erzeugung des Bitstroms, einschließlich der Eingangssignale des M-Kanales mit herabgesetzter Mischung vom Eingangskanal N konsequent erledigt sein. D.h., der Informationsblock TTO 1301 kann das Niveau der Mischung der stereophonen Signale 2 von den Eingangskanälen unter den Eingangssignalen des Kanales N herabsetzen. Die Ausgangssignale jeweils aus zwei Informationsblöcken 1301 in den Block der Signale des M-Kanals mit herabgesetzter Mischung auf dem Block TTO 1303 gebracht sein. D.h., unter den Eingangssignalen der N-Kanäle können die Signale des 4. Kanales in Form von einem Kanal mit herabgesetzter Mischung mittels konsequenter Mischung im Block TTO aufgeführt sein.
  • Der Bitstrom wird im zweiten Block der Kodierung 302 generiert und kann in den Decoder USAC 1306 des ersten Blocks der Dekodierung 302 eingeführt sein. In der geht der USC-Decoder 1306 in den zweiten Block der Kodierung 302 ein, der den Block der Dekodierung 1307, den Block SBR 1308 und den ausgedehnten Block OTT 1309 einschließt.
  • Der Block der Dekodierung 1307 der Mono-Signale entspricht dem Bereich der niedrigen Frequenzen unter Anwendung des Bitstroms. Der Block SBR 1308 entspricht dem Bereich der niedrigen Frequenzen der monophonen Signale für die Wiederherstellung des Hochfrequenzbereiches auch. Das Gerät 1309 mit erhöhter Mischung kann die Ausgangs-Monosignale aus dem Block SBR 1308 für die Erzeugung des stereophonen Signals mischen, das die Signale der M-Kanäle mit herabgesetzter Mischung bildet.
  • Der Block OTT 1310 ist in den zweiten Block der Dekodierung 304 aufgenommen und kann die Mischung der Mono-Signale erhöhen, die die Stereo-Signale aufnehmen, die im ersten Block der Dekodierung 302 für die nachfolgende Erzeugung der stereophonen Signale generiert werden.
  • Entsprechend der Variante der Realisation, kann der Prozess mit erhöhter Mischung im Block OTT zwecks der Wiederherstellung der Ausgangssignale des Kanales N aus dem Bitstrom konsequent erledigt sein. D.h., der Block mit erhöhter Mischung 1309 OTT kann die Mono-Signale für die nachfolgende Erzeugung der stereophonen Signale mischen. Zwei Mono-Signale, bildend die Ausgangs-Stereosignale aus dem Block 1309 mit erhöhter Mischung, können in den ausgedehnten Block OTT 1310 gebracht sein. Der ausgedehnte Block OTT 1310 kann die monophonen Eingangssignale für die Ausgabe der stereophonen Signale mischen. Das heißt, vier Ausgangssignale des 1. Kanales können mittels konsequenter erhöhter Mischung der monophonen Signale erhalten sein.
  • Die illustriert das Ergebnis der Kombination der ersten und zweiten Blöcke der Kodierung, die in der gezeigt sind, sowie die Vereinigung des ersten oder des zweiten Blockes der Dekodierung, gezeigt in der entsprechend der Variante der Realisation.
  • Die ersten und zweiten Blöcke der Kodierung nach der können in den einheitlichen Block der Kodierung 1401, wie in der gezeigt, vereinigt sein. Außerdem können die beiden diese Blöcke der Dekodierung in der in den einheitlichen Block der Dekodierung 1402, wie wie in der gezeigt, vereinigt sein.
  • Das Gerät der Kodierung 1401 in der kann den Block der Kodierung 1403 einschließen, der den Coder USC einschließt, darunter den Block TTO 1405 mit herabgesetzter Mischung, den Block SBC 1406 und den Block der Kodierung 1407, sowie schließt den Informationsblock TTO 1404 zusätzlich ein. In diesem Fall, kann der Block der Kodierung 1401 die Gesamtheit der Blöcke der Kodierung 1403, die parallel verbunden sind, einschließen. Als Alternative kann der Block der Kodierung 1403 dem Coder USAC entsprechen, der Informationsblock TTO 1404 aufnehmend.
  • Das heißt, entsprechend der Variante der Realisation, kann der Block der Kodierung 1403 TTO herabsetzende Mischung bis zu vier Eingangssignalen verschiedener Kanäle unter den Eingangssignalen der N-Kanäle konsequent verwenden, die monophonen Signale für den Kanal 1 so generierend.
  • So ist der Block der Dekodierung 1402 aufgebaut, laut der kann er der Block der Dekodierung 1410, der den Decoder USC einschließt, der seinerseits den Block der Dekodierung 1411 einschließt, den Block SBR 1412 und den ausgedehnten Block OTT 1413 einschließen, sowie zusätzlich schließt der ausgedehnte Block OTT 1414 ein. Dabei kann der Block der Dekodierung 1402 eine Menge der dekodierenden Blöcke 1410 einschließen, die parallel verbunden sind. Als Alternative kann der Block 1410 der Dekodierung den Decodern USAC entsprechen, darunter ausgedehnter Block OTT 1414.
  • Das heißt, entsprechend der Variante der Realisation kann das Gerät des Blockes der Dekodierung 1410 OTT erhöhende Mischung der monophonen Signale konsequent verwenden, vier Signale des 1. Kanales unter den Ausgangssignalen des N-Kanales so generierend.
  • Die ist eine vereinfachte Version der entsprechend der Variante der Realisation.
  • Der Block der Kodierung 1501 (in der ) kann dem Block der Kodierung 1403 (in der ) entsprechen. Dabei kann der Block 1501 der Kodierung dem abgeänderten Coder USAC entsprechen. Das heißt, der abgeänderte Coder USC kann mittels der Ergänzung des Informationsblockes TTO 1503 mit den originellen Codern USAC, darunter der Block TTO 1504, der Block SBR 1505 mit herabgesetzter Mischung und der Block der Kodierung 1506 konfiguriert.
  • Das Gerät der Dekodierung 1502, laut der , kann dem Block der Dekodierung 1410, laut der entsprechen. Dabei kann der Block der Dekodierung 1502 den abgeänderten Decodern USAC entsprechen. Das heißt, der abgeänderte Decoder USAC kann mittels der Ergänzung des ausgedehnten Blockes OTT 1510 bis zum originellen USAC-Decoder, darunter des Blockes der Dekodierung 1507, des Blockes SBR 1508 und des Blockes mit erhöhter Mischung OTT 1509 konfiguriert.
  • In der ist das Schema gezeigt, das die Bearbeitungsweise des Lautsignals der Struktur N-N / 2-N entsprechend der Variante der Realisation illustriert.
  • Die illustriert die N-N / 2-N abgeänderte Struktur, die in MPEG Surround bestimmt ist (MPS). Wie der Tabelle 1 gezeigt, im Falle MPS, kann die Raumsynthese im Decoder erledigt sein. Die Raumsynthese dient für die Transformation der Eingangssignale des temporären Bereiches der nicht standardmäßigen Domäne bei der Ausführung der Kaskadenanalyse mit dem Quadraturfilter (QFM). In diesem Fall ist der Begriff „ungleichartig“ dem Begriff „hybrid“ identisch.
  • Der Decoder arbeitet im hybriden Unterbereich. Er kann die Ausgangssignale von den Eingangssignalen mit Hilfe der Ausführung der Raumsynthese, die auf die Raumparameter gegründet ist, generieren, die vom Coder übertragen werden. Der Decoder kann die Ausgangssignale vom hybriden Unterbereich zum temporären Bereich unter Anwendung der Hybridsynthese QMF im Gegenteil umwandeln.
    Figure DE112015003108B4_0015
  • Der Prozess der Bearbeitung des lautlichen Mehrkanalsignals durch die Matrix in der Kombination mit der Raumsynthese wird mit Hilfe des Decoders erledigt, seine Beschreibung ist in der vorgestellt. Hauptsächlich, 5-1-5 Struktur, 5-2-5 Struktur, 7-2-7 Struktur und 7-5-7 Struktur werden in MPS bestimmt, während das vorliegende System in NN / 2-N die Struktur anbietet.
  • N-N / 2-N Struktur gewährleistet den Prozess der Transformation der Signale der Eingangskanäle N auf N / 2 Kanal mit herabgesetzter Mischung und Generierung der Ausgangssignale des Kanales N aus N / 2 Kanal. Der Decoder, laut der Variante der Realisation, kann die Signale der Ausgangskanäle N mittels erhöhter Mischung des N / 2 Kanals generieren. Im Prinzip, gibt es keine Beschränkungen auf die Anzahl der N-Kanäle in der Struktur N-N / 2-N, angeboten im vorliegenden Dokument. Das heißt, N-N / 2-N Struktur kann die Struktur des Kanales, die in MPS unterstützt wird, und die Struktur der lautlichen Mehrkanalsignale unterstützen, die in MPS nicht unterstützt.
  • In der NumlnCh - Anzahl der Kanäle mit herabgesetzter Mischung, NumOutCh - Anzahl der Ausgangssignalkanäle. In diesem Fall wird NumlnCh als N / 2 ausgeprägt, und NumOutCh ist durch N gezeigt.
  • In der Abbildung stellen 16 N / 2-Kanalsignale mit herabgesetzter Mischung (X0 durch XNumInch-1) und den restlichen Signalen den Eingangsvektor X dar. Da NumlnCh = N / 2, X0 = XNumlnch-1 auf N / 2 Kanäle mit herabgesetzter Mischung zeigt. Da die Anzahl der Blöcke OTT = N / 2, soll die Anzahl der Ausgangssignale der Kanäle für die Bearbeitung des N / 2 Kanals mit herabgesetzter Mischung der Signale gerade sein.
  • Den Eingangsvektor X muss man auf den Vektor M l n , k
    Figure DE112015003108B4_0016
    multiplizieren, der der Matrix M1 entspricht, der den Vektor zeigt, der N / 2 Kanal mit herabgesetzter Mischung der Signale einschließt. Wenn der Niederfrequenzkanal (LFE) in den Ausgangskanal der Signale N nicht eingeht, ist die Anwendung von N / 2-Dekorrelatoren wie niemals notwendig. Nichtsdestoweniger, wenn die Anzahl N der Kanäle „20“ überschreitet, wird der Filter der Dekorrelatoren nochmalig verwendet.
  • Um die Orthogonalität zwischen den Ausgangssignalen der Dekorrelatoren zu sichern, vorbehaltlich N = 20, soll die Anzahl der zugänglichen Dekorrelatoren mit der bestimmten Anzahl, zum Beispiel, 10 beschränkt sein. Jeweils können die Indexe einiger Dekorrelatoren wiederholt werden. Laut der Variante der Realisation der N-N / 2-H Struktur, soll die Anzahl der N-Kanäle der Ausgangssignale zweimal weniger wegen der begrenzten bestimmten Anzahl (zum Beispiel, N <20) sein. Wenn der Kanal LFE in die Signale der Ausgangskanäle N eingeschlossen wird, soll die Anzahl N so konfiguriert sein, damit es die Anzahl der Kanäle, einschließlich LFE Kanäle (zum Beispiel, N <24) nicht überschreitet.
  • Das Ausgangsergebnis der Dekorrelatoren kann durch das restliche Signal für das konkrete Häufigkeitsgebiet aufgrund des Bitstroms ersetzt sein. Wenn der Kanal der Niederfrequenzeffekte einen der Ausgänge des Blockes OTT darstellt, kann der Dekorrelator für den Block OTT mit erhöhter Mischung nicht verwendet sein.
  • In der , werden die Dekorrelatoren von 1 bis M (zum Beispiel, NumlnCh durch NumLfe) markiert, die Ausgangsergebnisse (dekorrelierte Signale) aus den Dekorrelatoren, sowie die restlichen Signale entsprechen verschiedenen Blöcken OTT. Die dekorrelierten Signale d1 wird durch das Dm mit den entsprechenden Ausgängen der Dekorrelatoren bezeichnet, res1 bezeichnen RESM (die restlichen Signale), entsprechend den Ausgangsergebnissen der Dekorrelatoren D1-DM. Die Dekorrelatoren DI-DM entsprechen verschiedenen Blöcken OTT jeweils.
  • In diesem Fall sollen der Vektor und die Matrizen, die in der Struktur N-N / 2-N verwendet werden weiter bestimmt sein. In der Struktur N-2 / N-N wird das Eingangssignal, das in jeden aus den Dekorrelatoren eingeführt wird, als der Vektor bestimmt.
  • Der Vektor kann nach der Methode je danach, ob er ein temporärer bildender Arbeitsvektor oder nicht ist, wie folgt bestimmt sein:
    1. (1) Als Beispiel, in dem das temporäre bildende Instrument nicht verwendet wird:
  • Wenn das temporäre bildende Instrument nicht verwendet wird, kriegt man den Vektor mit Hilfe des Vektors mit der entsprechenden Matrix M1 entsprechend der Gleichung 14. In diesem Fall bezeichnet die vorliegende Matrix die entsprechende erste Kolonne des Kanales N. v n , k = M l n , k x n , k = M l n , k [ X M 0 n , k X M 1 n , k X M NumInch-1 n , k X res 0 ArtDmx n , k X res 1 ArtDmx n , k X res NumInCh-1 ArtDmx n , k ] = [ v M 0 n , k v M 1 n , k v M NumInch-1 n , k v 0 n , k v 1 n , k v NumInCh-NumLfe-1 n , k ]
    Figure DE112015003108B4_0017
  • In der Gleichung 14kann jedes Element des Vektors in die Matrix M2 anstelle ihrer Einführung in den Block N 2 / der Dekorrelatoren oder des entsprechenden Blockes N / 2 OTT unmittelbar eingesetzt sein. Entsprechend, mit Hilfe dieser Blöcke kann man alle direkten Signale bestimmen. Die übrigen Signale, mit Ausnahme der Anzahl der Elemente des Vektors, können in den Block N / 2 der Dekorrelatoren, entsprechend dem Block N / 2 OTT eingesetzt sein.
  • Der Vektor schließt direkte dekorrelierte Signale im Bereich D1-Dm ein, die aus den Dekorrelatoren abgeleitet werden, und die restlichen Signale res1 - RESM werden aus den Dekorrelatoren auch abgeleitet. Der Vektor kann entsprechend der Gleichung 15 bestimmt sein. w n , k = [ v M 0 n , k v M 1 n , k v M NumInCh-1 n , k δ 0 ( k ) D 0 ( v M 0 n , k ) + ( 1 δ 0 ( k ) ) v r e s 0 n , k δ 1 ( k ) D 1 ( v M 2 n , k ) + ( 1 δ 1 ( k ) ) v r e s 1 n , k δ N u m I n C h N u m L f e 1 ( k ) D N u m I n C h N u m L f e 1 ( v M N u m I n C h N u m L f e 1 n , k ) + ( 1 δ N u m I n C h N u m L f e 1 ( k ) ) ( v res N u m I n C h N u m L f e 1 n , k ) ] = [ w M 0 n , k w M 1 n , k w M NumInch-1 n , k w 1 n , k w 2 n , k w N u m I n C h N u m L f e 1 n , k ]
    Figure DE112015003108B4_0018
  • In der Gleichung 15 δ x ( k ) = { 0 ,0 k max { k s e t } 1 , o t h e r w i s e
    Figure DE112015003108B4_0019
    und kset bezeichnen eine Menge aller befriedigenden K. Außerdem D x ( v x n , k )
    Figure DE112015003108B4_0020
    bezeichnet die Reihe der dekorrelierten Signale, die aus den Dekorrelatoren beim Eingang des Eingangssignals abgeleitet werden. Insbesondere, D x ( v x n , k )
    Figure DE112015003108B4_0021
    bezeichnet das Signal, das aus dem Dekorrelator abgeleitet wird, wenn das Block OTT in OTTx mit den restlichen Signalen umgeformt wird.
  • Der Unterbereich der Ausgangssignale kann je nach allen temporären Intervallen n und Hybrid-Unterbreichen bestimmt sein. Das Ausgangssignal kann aufgrund des Vektors W und der Matrix M2 entsprechend der Gleichung 16 bestimmt sein. y n , k = M 2 n , k w n , k = M 2 n , k [ w M 0 n , k w M 1 n , k w M NumInch-1 n , k w 1 n , k w 2 n , k w N u m I n C h N u m L f e 1 n , k ] = [ y 0 n , k y 1 n , k y N u m I n C h 2 n , k y N u m I n C h 1 n , k ]
    Figure DE112015003108B4_0022
  • In der Gleichung 16 M2 - ist die Matrix, die die Funktion NumOutCh und die Funktionsreihe NumlnCh-NumLfe aufnimmt, die in Bezug auf n so bestimmt werden, wie in der Gleichung 17 gezeigt ist. M 2 n , k = { M 2 l , k α ( n , l ) + ( 1 α ( n , l ) ) M 2 1, k , ,0 n t ( l ) , l = 0 M 2 l , k α ( n , l ) + ( 1 α ( n , l ) ) M 2 l 1, k , , t ( l 1 ) < n t ( l ) ,1 < L }
    Figure DE112015003108B4_0023
  • In der Gleichung 17 α ( n , l ) = { n + 1 t ( l ) + 1 , l = 0 n t ( l 1 ) t ( l ) t ( l 1 ) , o t h e r w i s e
    Figure DE112015003108B4_0024
    können entsprechend der Gleichung 18 geglättet sein. W 2 l , k = { s delta ( l ) R 2 l , κ ( k ) + ( 1 s delta ( l ) ) W 2 l 1, k ,S proc ( l , κ ( k ) ) = 1 R 2 l , κ ( k ) ,S proc ( l , κ ( k ) ) = 0
    Figure DE112015003108B4_0025
  • In der Gleichung 18 κ(k) bezeichnet die Funktion, in der die erste Zeile den Hybridgruppe K darstellt, und die zweite Zeile stellt die Reihe der Bearbeitung dar und entspricht dem letzten Satz der Parameter des vorhergehenden Parameters.
  • Gleichzeitig bezeichnet yn,k den Unterbereich der Hybridsignale, die den temporären Bereich mit Hilfe der Hybridgruppe der Filter der Synthese synthetisieren. In diesem Fall ist die Gruppe der Filter der Hybridsynthese dem Prinzip der Synthese QMF mittels der Synthese Nyquist identisch, und kann aus dem Hybrid-Unterbereich der Domänen durch den temporären Bereich in die Zone der Hybridfilter umgewandelt sein.
  • (2) Als Beispiel, kann man das Beispiel betrachten, in dem das temporäre bildende Instrument verwendet wird:
    • Unter Anwendung des temporären bildenden Instruments kann der Vektor solch sein, wie oben beschrieben, jedoch kann der Vektor auf zwei Arten der Vektoren eingestuft werden, wie in der Gleichung 19 und 20 gezeigt.
    w direct n , k = [ v M 0 n , k v M 1 n , k v M NumInch-1 n , k ( 1 δ 0 ( k ) ) v res 0 n , k ( 1 δ 0 ( k ) ) v res 1 n , k ( 1 δ 2 ( k ) ) v N u m I n C h N u m L f e 1 n , k ] = [ w M 0 n , k w M 1 n , k w M NumInch-1 n , k w 0 n , k w 1 n , k w N u m I n C h N u m L f e 1 n , k ]
    Figure DE112015003108B4_0026
    w difuse n , k = [ v M 0 n , k v M 1 n , k v M NumInCh-1 n , k δ 0 ( k ) D 0 ( v 0 n , k ) δ 1 ( k ) D 1 ( v 1 n , k ) δ N u m I n C h N u m L f e 1 ( k ) D N u m I n C h N u m L f e 1 ( v N u m I n C h N u m L f e 1 n , k ) ] = [ w M 0 n , k w M 1 n , k w M NumInch-1 n , k w 0 n , k w 1 n , k w N u m I n C h N u m L f e 1 n , k ]
    Figure DE112015003108B4_0027
  • In diesem Fall bezeichnet w direct n , k
    Figure DE112015003108B4_0028
    das direkte Signal, das in die Matrix M2 unmittelbar zugeleitet wird und durch den Dekorrelator der restlichen Signale nicht geht, die aus den Dekorrelatoren abgeleitet werden, und stellt das dekorrelierte Signal dar, das vom Dekorrelator geht. Außerdem bezeichnet eine Menge aller K, genügend. Außerdem, δ x ( k ) = { 0 ,0 k max { k set } 1 , o t h e r w i s e
    Figure DE112015003108B4_0029
    bezeichnet das dekorrelierte Eingangssignal, das vom Dekorrelator geht.
  • Und endlich, gehen die Signale auf die bestimmten Ausgänge w direct n , k    , w difuse n , k
    Figure DE112015003108B4_0030
    und, wie in der Gleichung 19 und 20 gezeigt, können auf den Bereich y direct n , k
    Figure DE112015003108B4_0031
    und y difuse n , k
    Figure DE112015003108B4_0032
    gebracht sein. y direct n , k
    Figure DE112015003108B4_0033
    schließt den Bereich der geraden und diffusen Signale ein. D.h., y direct n , k
    Figure DE112015003108B4_0034
    ist ein Ergebnis der Differenzierung vom geraden Signal unmittelbar auf den Eingang der Matrix M2, die nicht durch den Dekorrelator gehen, und ist ein Ergebnis der Differenzierung des diffusen Signals, das aus dem Dekorrelator auf die Einführung der Matrix M2 geht. Außerdem, y direct n , k  und  y difuse n , k
    Figure DE112015003108B4_0035
    kann aufgrund des Falls erhalten sein, in dem der Unterbereich der Domäne der temporären Bearbeitung (STP) zur Struktur NN / 2-N verwendet wird, und im Falle, wenn Guided Envelope Shaping (GES) zu NN / 2 N Struktur verwendet wird. In diesem Fall, y direct n , k
    Figure DE112015003108B4_0036
    und y difuse n , k
    Figure DE112015003108B4_0037
    werden mit der Hilfe bsTempShapeConfig identifiziert, der ein Element Datastream ist.
  • <Anwendungsfall des Parameters STP>
  • Für die Synthese der Parameter mit der Dekorrelation zwischen dem Ausgangssignal der Kanäle wird das diffuse Signal durch den Dekorrelator im Rahmen der Raumsynthese generiert. In diesem Fall kann das erzeugte diffuse Signal mit dem geraden Signal gemischt werden. Und für den allgemeinen Fall entspricht das temporärer bildende diffuse Signal den Parametern des geraden Signals nicht.
  • In diesem Fall wird STP für die Bildung des diffusen Signals jedes Ausgangskanales zwecks des Einstellens der temporären Form des Signals mit Hilfe herabgesetzter Mischung verwendet, übertragen aus dem Coder. Solche Bearbeitung kann mittels der Berechnung des Koeffizienten des bildenden geraden Signals und des diffusen Signals, oder mittels der Einschätzung von Guided Envelope Shaping, wie die Bildung des Oberteiles des Bereiches der diffusen Signale erreicht sein.
  • So kann die temporäre Energie, die bei der entsprechenden Zuleitung des geraden Signals und des entsprechenden diffusen Signals produziert wird, aus dem Ausgangssignal bewertet sein, das mittels erhöhter Mischung gebildet wird. Der bildende Faktor kann nach der Grundlage der Beziehung zwischen dem Wert der temporären Energie und der entsprechenden geraden Signale, sowie der entsprechenden diffusen Signale berechnet sein.
  • STP kann die Funktion bsTempShapeConfig=1 herbeirufen. Wenn die Funktion bsTempShapeEnableChannel(ch)= 1 entsteht, so können die diffusen Ausgangssignale, die mittels erhöhter Mischung gebildet werden, mit Hilfe STP bearbeitet sein.
  • Gleichzeitig, zwecks der Beseitigung der Notwendigkeit der Regulierung der Einstellung der Verzögerung der Ausgangssignale mit herabgesetzter Mischung, übertragen mittels erhöhter Raummischung für die Generierung der Ausgangssignale, kann erhöhte Raummischung als genäherter Wert des übertragenen Ausgangssignals mit herabgesetzter Mischung berechnet sein.
  • Was der Struktur N-N / 2-N betrifft, können die geraden Signale mit herabgesetzter Mischung für die Funktion NumlnCh-NumLfe so bestimmt sein, wie es in der Gleichung 21 gezeigt ist. z ^ direct ,d n , s b = c h c h d z ^ direct ,ch n , s b   ,0 d < ( N u n I n C h N u m L f e )
    Figure DE112015003108B4_0038
  • In der Gleichung 21, chdschließt die Reihe der paarigen Ausgangssignale ein, die dem Kanal D mit den Ausgangssignalen bezüglich der Struktur NN / 2-N entsprechen, und kann in Bezug auf die Struktur NN / 2-N so bestimmt sein, wie es in der Tabelle 2 gezeigt ist. [Tabelle 2]
    Konfiguration chd
    N-N/2-N {ch0,ch1}d=0,{ch2,ch3}d=1,..., {ch2d,ch2d+1'}d=NumlnCh-NumLfe
  • Es geschieht das Konvertieren der breitbandigen Informationsblöcke, dieses Konvertieren kann in Bezug auf die diffusen Signale jedes Kanales mit erhöhter Mischung aufgrund der normalisierten Energie bei der Sendung der geraden Signale entsprechend der Gleichung 22 bewertet sein. E direct n , s b = | z ^ direct n , s b B P s b G F s b | 2
    Figure DE112015003108B4_0039
  • In der Gleichung 22 BPsb - ein Bereichskoeffizient, der den spektralen Koeffizienten der Vergrößerung bezeichnet.
  • In der N-N / 2-N Struktur, weil das gerade Signal NumlnCh-NumLfe anwesend ist, kann die produzierte Energie von der Zuleitung des geraden Signals unter Anwendung derselben Methode, die für die Berechnung in der Struktur 5-1-5 verwendet wird, die in MPS bestimmt worden ist, berechnet sein. Der Untersetzungsfaktor, der mit der endlichen Bearbeitung der Signale verbunden ist, kann so bestimmt sein, wie es in der Gleichung 23 gezeigt ist. s c a l e c h n = E direct_norm ,d n E diffuse_norm ,ch n + ε      , c h { c h 2 d , c h 2 d + 1 } d
    Figure DE112015003108B4_0040
  • In der Gleichung 23 kann der Untersetzungsfaktor nur im Falle der Ausführung der Beziehung zu N-N / 2-N Strukturen bestimmt sein. Den Untersetzungsfaktor der diffusen Ausgangssignale eigentlich verwendend, kann man die temporären bildenden Ausgangssignale mit herabgesetzter Mischung darstellen. Entsprechend, die diffusen Signale werden unter Anwendung des Untersetzungsfaktors in jedem der Kanäle N bearbeitet, die mit den geraden Signalen gemischt werden können. Mit Hilfe dieses Prozesses ist es unkompliziert, den Prozess der Bearbeitung der diffusen Signale unter Anwendung des Untersetzungsfaktors für die Ausgangssignale jedes Kanales zu bestimmen. Wenn bsTempShapeEnableChannel(ch)= 1 , bezeichnet es darauf, dass die diffusen Signale unter Anwendung des Untersetzungsfaktors bearbeitet werden.
  • <Anwendungsfall der Komponente GES>
  • Im Falle der Ausführung der temporären Bildung der diffusen Ausgangssignale geschieht ihre charakteristische Entstellung üblich. Entsprechend, kann GES in diesem Plan temporäre / Raumqualität erhöhen, die Entstehung der Signale verhindernd. Der Decoder kann die geraden und diffusen Ausgangssignale individuell bearbeiten. In diesem Fall, wenn GES verwendet wird, können sich nur die geraden Ausgangssignale mit erhöhter Mischung verändern.
  • Der Parameter GES ist fähig, die breitbandigen synthetisierten Ausgangssignale wieder herzustellen. GES nimmt den abgeänderten Prozess erhöhter Mischung nach der Kompression und Veränderung der Form der Signale in Bezug auf die geraden Signale für jedes der Ausgangssignale auch auf.
  • Die zusätzlichen Informationen über parametrische breitbandige Bildung, die in den Bitstrom aufgenommen ist, können für die Veränderung der Form der Signale verwendet sein. Die zusätzlichen Informationen schließen die Beziehung zwischen gebildeten Ausgangseingangssignalen und gebildeten Signalen mit herabgesetzter Mischung ein. Der Decoder kann als die Beziehung der geformten geraden Signale jedes der temporären Intervalle bestimmt werden, die in die Reihe aller Kanäle mit den Ausgangssignalen aufgenommen sind. Dank dem Parameter GES ändern die diffusen Signale jedes der Kanäle die Qualität nicht.
  • Wenn bsTempShapeConfig=2, kann der Prozess GES erledigt werden. Wenn GES für die Ausführung des Prozesses zugänglich ist, so kann jedes der diffusen und geraden Ausgangssignale unter Anwendung der Matrix der Post-Mischung M2 des abgeänderten Bereiches des Hybrid-Bereiches laut der Gleichung 24 synthetisiert sein. y direct n , k = M 2 n , k w direct n , k      y difuse n , k = M 2 n , k w difuse n , k     0 k < K  und 0 n < n u m S l o t s
    Figure DE112015003108B4_0041
  • In der Gleichung 24 nehmen die geraden Ausgangssignale Y die geraden und restlichen Signale, sowie die diffusen Ausgangssignale Y auf. Insgesamt, unter Anwendung GES kann nur das gerade Signal bearbeitet sein.
  • Das Ergebnis der Bearbeitung GES kann entsprechend der Gleichung 25 bestimmt sein. y g e s n , k = y direct n , k + y difuse n , k
    Figure DE112015003108B4_0042
  • Der Parameter GES kann das Konvertieren mit relativ herabgesetzter Mischung der Signale für die Ausführung der Raumsynthese der Kanäle LFE je nach der baumförmigen Struktur und dem bestimmten Kanal mit den Ausgangssignalen erhöhter Mischung aus dem Signal mit herabgesetzter Mischung mittels des Decoders ausführen.
  • Für die N-N / 2-N Struktur können die Ausgangssignale so bestimmt werden, wie es in der Tabelle 3 gezeigt ist. [Tabelle 3]
    Konfiguration choutput
    N-N/2-N 0≤chout <2(NumInCh-NumLfe)
  • Für die N-N/2-N Struktur können die Eingangssignale chinput so bestimmt werden, wie es in der Tabelle 4 gezeigt ist. [Tabelle 4]
    Konfiguration chinput
    N-N/2-N 0≤chinput < (NumlnCh-NumLfe)
  • Auch für die N-N/2-N Struktur hat das Informationssignal Dch( chouput) so bestimmt werden, wie es in der Tabelle 5 gezeigt ist. [Tabelle 5]
    Konfiguration bsTreeCofigc Dch (chouput )
    N-N/2-N 7 Dch (chouput ) = d , if chouput ∈{ch2d ,ch2d+1}d    with: 0≤d < (NumInCh-NumLfe)
  • Weiter werden die Matrix M1 ( M 1 n , k )
    Figure DE112015003108B4_0043
    und Matrix M2 ( M 2 n , k )
    Figure DE112015003108B4_0044
    )bezüglich aller temporären Intervalle N und aller Hybrid-Unterbereiche (Beschreibung unten) bestimmt. Diese Matrizen sind die interpolierten Versionen der Parameter R 1 l , m G 1 l , m H l ,m R 2 l , m ,
    Figure DE112015003108B4_0045
    die in Bezug auf diese Parameter des temporären Intervalls und des vorgegebenen Bereichs der Bearbeitung aufgrund der Parameter CLD, ICC und CPC bestimmt werden, gültig für den temporären Parameter des Intervalls und dieses Bereichs der Bearbeitung.
  • <Bestimmung der Matrix M1 (Pre-Matrix)>
  • Der Prozess der Signaleingabe mit herabgesetzter Mischung für die Dekorrelatoren, eingesetzt im Decoder der Struktur N-N / 2-N, ist mit den Verweisungen auf die auf die entsprechenden Matrizen M1 beschrieben. Die Matrix M1 kann sich in Form von der vorläufigen Matrix Pre-Matrix ausprägen.
  • Die Höhe der Matrix M1 hängt von der Anzahl der Kanäle mit den Eingangssignalen mit herabgesetzter Mischung in der Matrix M1 und Anzahl der Dekorrelatoren, eingesetzt im Decoder, ab. In diesem Fall können die Elemente der Matrix M1 aus den Parametern CLD und / oder CPC erhalten sein. Die Matrix M1 kann so bestimmt sein, wie es in der Gleichung 26 gezeigt ist. M 1 n , k = { W 1 l , k α ( n , l ) + ( 1 α ( n , l ) ) W 1 1, k ,0 n t ( l ) , l = 0 W 1 l , k α ( n , l ) + ( 1 α ( n , l ) ) W 1 1, k , t ( l 1 ) < n t ( l ) ,1 l < L   für   0 l < L   0 k < K
    Figure DE112015003108B4_0046
  • In der Gleichung 26, α ( n , l ) = { n + 1 t ( l ) + 1 , l = 0 n t ( l 1 ) t ( l ) t ( l 1 ) , o t h e r w i s e
    Figure DE112015003108B4_0047
  • Weil W 1 l , k
    Figure DE112015003108B4_0048
    so ausgeglichen sein kann, wie es in der Gleichung 27 gezeigt ist. W 1 l , k = { s delta ( l ) W konj l , k + ( 1 s delta ( l ) ) W 1 l 1, k , S proc ( l , κ ( k ) ) = 1 W konj l , k , S proc ( l , κ ( k ) ) = 0 W temp l , k = R 1 l , κ ( k ) G 1 l , κ ( k ) H l , κ ( k ) W konj l , k = κ k o n j ( k , W temp l , k )   für   0 κ K ,0 l < L
    Figure DE112015003108B4_0049
  • In der Gleichung 27 stellt die erste funktionale Reihe den Hybrid-Unterbereich dar, die zweite Reihe stellt den Bereich der Bearbeitung dar, und die dritte Reihe stellt die komplexe Kupplung der Funktion x bezüglich eines bestimmten Hybrid-Unterbereich dar. Außerdem stellt er den äußersten Satz der Parameter des vorhergehenden Bereichs dar.
  • Die Matrizen R 1 l , m , G 1 l , m
    Figure DE112015003108B4_0050
    und Hl,m für die Matrix M1 können wie folgt bestimmt sein:
  • Matrix R1:
  • Die Matrix R 1 l , m
    Figure DE112015003108B4_0051
    kontrolliert die Anzahl der Signale für die Einführung in die Dekorrelatoren und kann sich in Form von der Funktion von CLD und CPC ausprägen, weil die dekorrelierten Signale in die Matrizen nicht ergänzt werden.
  • Die Matrix R 1 l , m
    Figure DE112015003108B4_0052
    kann verschieden aufgrund der Struktur des Kanales bestimmt sein. Für die N-N / 2-N Struktur können alle Kanäle mit den Eingangssignalen mit Paaren in den Block OTT zwecks Vorbeugung der Kaskadenfiltrierung des Blockes OTT eingeführt sein. In der Struktur H-H / 2-N ist die Anzahl der Blöcke OTT N / 2 gleich.
  • In diesem Fall hängt die Matrix von der Anzahl der Blöcke OTT ab, die der Größe der Spalte des ganzen Vektors gleich ist, der die Reihe der Eingangssignale einschließt. Nichtsdestoweniger fordert die LFE-Mischung aufgrund des Blockes OTT den Dekorrelator nicht und so wird in der N-N / 2-N Struktur nicht betrachtet. Alle Elemente der Matrix sind entweder 1 oder 0 gleich.
  • In der Struktur H-H/2-N kann die Matrix so bestimmt sein, wie es in der Gleichung 28 gezeigt ist. R 1 l , m = [ I NumInCh I NumInCh-NumLfe ] ,    0 m < M p r o c ,0 l < L
    Figure DE112015003108B4_0053
  • Für die N-N / 2-N Struktur meinen alle Blöcke OTT die parallelen Stadien der Bearbeitung und keine Kaskadenstadien. Jeweils, für die N-N / 2-N Struktur ist kein der Blöcke OTT mit anderen Blöcken OTT verbunden. Die Berechnung der Matrix kann unter Anwendung der einzelnen Matrix erledigt werden. Dabei kann die einzelne Matrix die einzelne Matrix mit der Größe N* N darstellen.
  • Matrix Gl:
  • Für die Bearbeitung der Informationssignale mit herabgesetzter MischungM, zugeleitet aus dem äußerlichen Teil für die MPS-Dekodierung können die Datenströme aufgrund der Abänderungsfaktoren verwendet werden. Die Abänderungsfaktoren können für die Signale mit herabgesetzter Mischung oder mit denselben Signalen, doch zugeleitet von außen aufgrund der Matrix verwendet werden.
  • Die Matrix kann gewährleisten, dass die Ebene des Signals mit herabgesetzter Mischung im Laufe von einer bestimmten Zeit / Frequenz, die vom Parameter vorgestellt ist, der Ebene des Signals mit herabgesetzter Mischung, erhalten bei der Bestimmung des Raumparameters vom Coder, gleich wird.
  • Die Matrizen werden in drei Gruppen eingestuft; (i) Gruppe, in der äußerliche Informationskompensation (bsArbitraryDownmix= 0) fehlt, (ii) Gruppe, in der es parametrierte äußerliche Informationskompensation mit herabgesetzter Mischung (bsArbitraryDownmix =1) gibt, und (iii) Gruppe mit den restlichen kodierten Signalen aufgrund äußerlicher Kompensation mit herabgesetzter Mischung. Wenn bsArbitraryDownmix= 1, d.h., dass der Decoder restliche Kodierung aufgrund der äußerlichen Kompensation mit herabgesetzter Mischung nicht unterstützt.
  • Wenn äußerliche Informationskompensation mit herabgesetzter Mischung für die N-N / 2-N Struktur () nicht verwendet wird, so kann die Matrix für die N-N / 2-H Struktur so bestimmt sein, wie es in der Gleichung 29 gezeigt ist. G 1 l , m = [ I N u m I n C h   | O N u m I n C h ]
    Figure DE112015003108B4_0054
  • In der Gleichung 29, INuminch bezeichnet die einzelne Matrix mit der entsprechenden Größe* und bezeichnet die Nullmatrix, die die Größe* bezeichnet.
  • Und hingegen, wenn äußerliche Kompensation mit herabgesetzter Mischung für die Struktur N-N / 2-N ( bsArbitraryDownmix= 1) verwendet wird, so kann die Matrix für die Struktur N-N / 2-N so bestimmt sein, wie es in der Gleichung 30 gezeigt ist: G 1 l , m = g 0 l , m 0 0 0 0 g 1 l , m 0 0 0 0 0 0 g N u m I n C h 2 l , m 0 0 0 0 g N u m I n C h 1 l , m  O N u m I n C h N u m I n C h × N u m I n C h
    Figure DE112015003108B4_0055
  • Inder Gleichung 30 g X l , m = G ( X , l , m ) ,   0 X < N u m I n C h ,   0 m < M p r o c ,   0 L < L .
    Figure DE112015003108B4_0056
  • Gleichzeitig, wenn die restliche Kodierung auf äußerlicher Kompensation mit herabgesetzter Mischung für die Struktur N-N /2-N (bsArbitraryDownmix = 2) basiert ist, so kann die Matrix so bestimmt sein, wie in der Gleichung 31 gezeigt: G 1 l , m = { α g 0 l , m 0 0 0 0 α g 1 l , m 0 0 0 0 0 0 α g N u m I n C h 2 l , m 0 0 0 0 α g N u m I n C h 1 l , m  I N u m I n C h N u m I n C h × N u m I n C h , m m ArtDmxRes ( i ) [ g 0 l , m 0 0 0 0 g 1 l , m 0 0 0 0 0 0 g N u m I n C h 2 l , m 0 0 0 0 g N u m I n C h 1 l , m  O N u m I n C h N u m I n C h × N u m I n C h ] , o t h e r w i s e
    Figure DE112015003108B4_0057
  • In der Gleichung 31 können die Werte g X l , m = G ( X , l , m ) ,   0 X < N u m I n C h ,   0 m < M p o r c ,   0 l < L
    Figure DE112015003108B4_0058
    und αständig erneuert werden.
  • Matrix H1:
  • In der Struktur H-H / 2-N kann die Anzahl der Kanäle mit herabgesetzter Mischung fünf und sogar mehr gleich sein. Jeweils kann die Umkehrmatrix H die Blockmatrix darstellen, die dieselbe Größe, wie auch die Anzahl der Spalten des Vektors mit den Eingangssignalen bezüglich des ganzen Parametersatzes und des Bearbeitungsbereiches hat.
  • <Bestimmung der Matrix M2 (Post-Matrix)>
  • In der Struktur H-H / 2-N bestimmt die Matrix M2 die Kombination der direkten Signale und der dekorrelierten Signale zwecks der Erzeugung der Ausgangssignale des Mehrkanalsystems. M 2 n , k
    Figure DE112015003108B4_0059
    kann so bestimmt sein, wie es in der Gleichung 32 gezeigt ist: M 2 n , k = { W 2 l , k α ( n , l ) + ( 1 α ( n , l ) ) W 2 1, k ,      ,0 n t ( l ) , l = 0 W 2 l , k α ( n , l ) + ( 1 α ( n , l ) ) W 2 1 l , k ,     ,t ( l 1 ) < n t ( l ) ,1 l < L
    Figure DE112015003108B4_0060
  • In der Gleichung 32 α ( n , l ) = { n + 1 t ( l ) + 1 , l = 0 n t ( l 1 ) t ( l ) t ( l 1 ) , o t h e r w i s e
    Figure DE112015003108B4_0061
  • Gleichzeitig kann W 2 l , k
    Figure DE112015003108B4_0062
    entsprechend der Gleichung 33 ausgeglichen sein. W 2 l , k = { s delta ( l ) R 2 l , k ( k ) + ( 1 s delta ( l ) ) W 2 l 1, k , S proc ( l , k ( k ) ) = 1 R 2 l , k ( k ) , S proc ( l , k ( k ) ) = 0
    Figure DE112015003108B4_0063
  • In der Gleichung 33, für jeden κ(k) und Kkonj(k,x) stellt die erste Reihe den Hybrid-Unterbereich dar, die zweite Reihe stellt den Bearbeitungsbnereich dar, und die dritte Reihe stellt die komplexe Kupplung der Parameter x bezüglich einen bestimmten Hybrid-Unterbereich dar. Außerdem, W 2 1, k
    Figure DE112015003108B4_0064
    bezeichnet den letzten Parametersatz des vorhergehenden Bereichs.
  • Die Elemente der Matrix M2 kann man aus dem äquivalenten Modell der Berechnung des Blockes OTT berechnen. Der Block OTT schließt den Dekorrelator und den Block der Mischung ein. Das Eingangs-Monosignal, das zum Block OTT geh, kann zu jedem von den Dekorrelatoren und Blöcken der Mischung übertragen werden. Der Block der Mischung kann das Ausgangs-Stereosignal, das auf das monophone dekorrelierte Eingangssignal basiert ist, abgeleitet durch den Dekorrelator, sowie CLD und ICC Parameter generieren. In diesem Fall kontrolliert der Parameter CLD die Lokalisation im Stereobereich, sowie der Parameter ICC kontrolliert den Stereobereich der Ausgangssignale.
  • Das Ergebnis der Berechnung eines willkürlichen Blockes OTT kann so bestimmt sein, wie es in der Gleichung 34 gezeigt ist. [ y 0 l , m y 1 l , m ] = H [ x l , m q l , m ] = [ H 11 OTT x l , m H 12 OTT x l , m H 21 OTT x l , m H 22 OTT x l , m ] [ x l , m q l , m ]
    Figure DE112015003108B4_0065
  • Der Block OTT kann wie OTTx bezeichnet sein, wo die Bedingungen 0≤X < numOttBoxes und H 11 OTT x l , m ... H 22 OTT x l , m
    Figure DE112015003108B4_0066
    die Elemente einer willkürlichen Matrix im Zeitslot I und Parameterbereich m bezüglich des Blocks OTT bezeichnen.
  • In diesem Fall kann die Matrix mit den Post-Koeffizienten der Verstärkung so bestimmt sein, wie es in der Gleichung 35 gezeigt ist. [ H 11 OTT x l , m H 12 OTT x l , m H 21 OTT x l , m H 22 OTT x l , m ] = { [ c 1, x l , m cos ( α x l , m + β x l , m ) 1 c 2, x l , m cos ( α x l , m + β x l , m ) 1 ] [ c 1, x l , m cos ( α x l , m + β x l , m ) c 1, x l , m sin ( α x l , m + β x l , m ) c 2, x l , m cos ( α x l , m + β x l , m ) c 2, x l , m sin ( α x l , m + β x l , m ) ] , o t h e r w i s e , m<resBands x
    Figure DE112015003108B4_0067
  • In der Gleichung 35, c 1, x l , m = 10 C L D x l , m 10 1 + 10 C L D x l , m 10 c 2, x l , m = 10 C L D x l , m 10 1 + 10 C L D x l , m 10
    Figure DE112015003108B4_0068
    β x l , m = arctan ( tan ( α x l , m ) c 2, X l , m c 1, X l , m c 2, X l , m + c 1, X l , m ) p x l , m = { max { I C C x l , m , λ 0 ( 10 C L D x l , m 20 + 10 C L D x l , m 20 ) } , m < r e s B a n d s X I C C x l , m , o t h e r w i s e , and α x l , m = 1 2 arccos ( p x l , m )
    Figure DE112015003108B4_0069
  • Während wo λ0 = —11/72 for 0 ≤ m < Mproc, 0 ≤ l < L.
  • Desweiteren gilt Folgendes, r e s B a n d s x = { m resProc ( X ) , b s R e s i d u a l P r e s e n t ( X ) = 1, b s R e s i d u a l C o d i n g = 1 0 , o t h e r w i s e
    Figure DE112015003108B4_0070
  • Hier, für die Struktur N-N/2-N kann R 2 l , m
    Figure DE112015003108B4_0071
    so bestimmt sein, wie es in der Gleichung 36 gezeigt ist. R 2 l , m = [ [ H 11 O T T 0 l , m ( n ) H 12 O T T 0 l , m ( n ) H 21 O T T 0 l , m ( n ) H 22 O T T 0 l , m ( n ) ] O 2 O 2 O 2 [ H 11 O T T 0 l , m ( n ) H 12 O T T 0 l , m ( n ) H 21 O T T 0 l , m ( n ) H 22 O T T 0 l , m ( n ) ] O 2 O 2 O 2 [ H 11 O T T n u m O T T B o x e s 1 l , m ( n ) H 12 n u m O T T B o x e s 1 l , m ( n ) H 21 n u m O T T B o x e s 1 l , m ( n ) H 22 n u m O T T B o x e s 1 l , m ( n ) ] ]
    Figure DE112015003108B4_0072
  • In der Gleichung 36 können die Parameter CLD und ICC so bestimmt sein, wie in der Gleichung 37 gezeigt. C L D X l , m = D CLD ( X , l , m ) I C C X l , m = D I C C ( X , l , m )
    Figure DE112015003108B4_0073
  • In der Gleichung 37 0 X < N u m I n C h ,0 m < M p r o c ,0 l < L .
    Figure DE112015003108B4_0074
  • <Bestimmung des Dekorrelators>
  • Für die Struktur H-H / 2-N kann die Dekorrelation mit Hilfe der Nachhallfilter in der Domäne QFM des Unterbereiches erledigt werden. Die Nachhallfilter können verschiedene Charakteristiken der Filter aufgrund laufender entsprechender Hybrid-Unterbereiche unter allen Hybrid-Unterbereichen vorstellen.
  • Der Nachhallfilter gehört zum Filter der Infrarotdarstellung (IIR). Die IIR-Gitterfilter haben verschiedene Filterfaktoren in Bezug auf verschiedene Dekorrelatoren, und ihr Unterschied besteht in der Erzeugung der gegenseitig dekorreliertenr orthogonalen Signale.
  • Der Prozess der Dekorrelation, ausgeführt durch den Dekorrelator, kann bei der gleichzeitigen Ausführung einer Menge der Prozesse verlaufen. Ursprünglich wird das Ausgangssignal der Matrix M1 in den Dekorrelator für die Phasefilterung eingeführt. Die gefilterten Signale sind die Energieträger. In diesem Fall bezeichnet erhaltene Energie auf die Bildung des Spektrums oder temporäre Bildung, so dass die dekorrelierten Signale mit den zusätzlichen Eingangssignalen kombiniert werden können.
  • Das Eingangssignal am Eingang des willkürlichen Dekorrelators ist ein Teil des ganzen Vektors. Um die Orthogonalität der dekorrelierten Signale zu sichern, die durch die Menge der Dekorrelatoren erhalten sind, hat diese Menge verschiedene Filterfaktoren.
  • Im Zusammenhang mit der ständigen frequenzabhängigen Verzögerung schließt der Dekorrelator der Filterung eine Menge der IIR-Frequenzbereiche ein. Die Achsen der Frequenzen können in verschiedene Bereiche zwecks ihrer Übereinstimmung mit den QFM-Frequenzen geteilt sein. Für jeden Bereich sind die Länge der Verzögerung und die Länge der Vektoren der Filterfaktoren identisch. Der Filterfaktor des Dekorrelator, der die Fraktionsverzögerung wegen der zusätzlichen Phase hat, hängt vom Index des Hybrid-Unterbereiches ab.
  • Wie oben beschrieben, haben die Filter der Dekorrelatoren verschiedene Filterfaktoren, was die Garantie der Orthogonalität zwischen den dekorrelierten Signalen gewährleistet, die aus den Dekorrelatoren abgeleitet werden. Für die NN / 2-N Struktur sind N / 2 Dekorrelatoren obligatorisch gefordert. In diesem Fall, für die Struktur NN / 2-N kann die Anzahl der Dekorrelatoren bis zu 10 beschränkt sein. Für die Struktur NN / 2-N, in der das Regime LFE fehlt, wenn die Anzahl der Blöcke OTT N / 2 „10“ überschreitet, so können die Dekorrelatoren entsprechend der Anzahl der Blöcke OTT, die die Zahl «10» überschreiten, entsprechend der Erfüllung der Bedingung 110 |nochmalig verwendet sein.
  • Die Tabelle 6 zeigt den Index Dekorrelator im Decoder der N-N / 2-N Struktur. Wie in der Tabelle 6 gezeigt, wiederholen sich die Indexe der N / 2 Dekorrelatoren mit dem Wert „10“. Das heißt, Null- und zehnter Dekorrelator haben einen und denselben Index. [Tabelle 6]
    Dekorrelator X=0,..., rem(NI/2 -1,10)
    Konfiguration 0 1 2 ... 9 10 11 N/2-1
    N-N/2-N D 0 O T T ( )
    Figure DE112015003108B4_0075
    D 1 O T T ( )
    Figure DE112015003108B4_0076
    D 3 O T T ( )
    Figure DE112015003108B4_0077
    ... D 9 O T T ( )
    Figure DE112015003108B4_0078
    D 0 O T T ( )
    Figure DE112015003108B4_0079
    D 1 O T T ( )
    Figure DE112015003108B4_0080
    ... D m o d ( N / 2 1,10 ) O T T ( )
    Figure DE112015003108B4_0081
    Die Struktur N-N / 2-N kann aufgrund der Syntax konfiguriert sein, die in der Tabelle 7 gezeigt ist.
    Figure DE112015003108B4_0082
    Figure DE112015003108B4_0083
    Figure DE112015003108B4_0084
  • In diesem Fall kann bsTreeConfig so geäußert sein, wie es in der Tabelle 8 gezeigt ist [Tabelle 8]
    bsTreeConfig Wert
    0,1,2,3,4,5,6 Identischer Wert in der Tabelle 40 in ISO/IEC   20003-1 :2007
    7 N-N/2-N Konfiguration
      numOttBoxes = NumInCh   numTttBoxes = 0   numInChan = NumlnCh   numOutChan = NumOutCh   Ausgangskanal. Anordnung gemäß der Tabelle 9.5
    8...15 Reserve
  • Für die Struktur H-H / 2-N kann die Anzahl von bsNumlnCh Kanälen mit herabgesetzter Mischung so sein, wie in der Tabelle 9 gezeigt. [Tabelle 9]
    bsNumlnCh NumInCh NumOutCh
    0 12 24
    1 7 14
    2 5 10
    3 6 12
    4 8 16
    5 9 18
    6 10 20
    7 11 22
    8 13 26
    9 14 28
    10 15 30
    11 16 32
    12,...,15 Reserve Reserve
  • Für die N-N / 2-N Struktur kann die Anzahl von LFE Kanälen unter den Ausgangssignalen so sein, wie in der Tabelle 10 gezeigt. [Tabelle 10]
    bsNumLFE NumLfe
    0 0
    1 1
    2 2
    3 Reserve
  • Für die Struktur H-H / 2-N kann die Anordnung der Kanäle der Ausgangssignale aufgrund der Anzahl der Kanäle der Ausgangssignale und Anzahl der LFE Kanäle so erledigt sein, wie es in der Tabelle 11 gezeigt ist. [Tabelle 11]
    NumOutCh NumLfe Reihenfolge der Ausgangskanäle
    24 2 Rv,Rb,Lv,Lb,Rs,Rvr,Lsr,Lvr,Rss,Rvss,Lss,Lvss,R c,R, Lc,L,Ts,Cs,Cb,Cvr, C,LFE,Cv,LFE2,
    14 0 L,Ls,R,Rs,Lbs,Lvs,Rbs,Rvs,Lv,Rv, Cv,Ts, C,LFE
    12 1 L,Lv,R,Rv,Lsr,Lvr,Rsr,Rvr,Lss,Rss,C,LFE
    12 2 L,Lv,R,Rv,Ls,Lss,Rs,Rss,C,LFE,Cvr,LFE2
    10 1 L,Lv,R,Rv,Lsr,Lvr,Rsr,Rvr,C,LFE
    Bemerkung 1: Alle Bezeichnungen und Handelsmarken der Lautsprecher sind in der Tabelle 8 entsprechend ISO/IEC 23001-8:2013/FDAMI vorgestellt. Bemerkung 2: die Reihenfolge der Ausgangskanäle für 16,20,22,26,30,32 folgt von 1 bis N, jeweils ohne irgendwelche Bezeichnungen und Handelsmarken der Lautsprecher. Bemerkung 3: die Reihenfolge der Ausgangskanäle für bsHasSpeakerConfig = 1 folgt laut Bedingung von 1 bis N mit den entsprechenden Bezeichnungen der Handelsmarken der Lautsprecher nach der Tabelle 94 ISO/IEC 23008-3:2015.
  • In der Tabelle 7, bsHasSpeakerConfig ist ein Parameter, der auf den existierenden Unterschied von der Handelsmarke, der entsprechenden Anordnung des Kanales in der Tabelle 11 - Schema der Anordnung des Ausgangssignals für die Wiedergabe If bsHasSpeakerConfig == 1 bezeichnet. AudioKanal.Layout ist ein Parameter der Anordnung des Lautsprechers nach der tatsächlichen Wiedergabe.
  • Außerdem bezeichnet Parameter «audioChannel. Layout» die reale Anordnung des Lautsprechers. Wenn der Lautsprecher den Kanal LFE enthält, so soll dieser Kanal zusammen mit allen Parametern (sogar unter der Bedingung, daß einer der Kanäle nicht der LFE-Kanal ist) mit Hilfe des ersten Blockes OTT bearbeitet sein und kann auf der letzten Position in der Kanalliste sein. Zum Beispiel, ist der Kanal LFE auf der letzten Position unter den Parametern L, Lv, R, Rv, Ls, Lss, Rs, Rss, C, LFE, Cvr und LFE2, die in die Kanalliste aufgenommen sind.
  • In der ist das Schema gezeigt, das die N-N / 2-N Struktur in Form von der baumförmigen Struktur entsprechend der Variante der Realisation detailliert illustriert.
  • Die N-N / 2-N Struktur in der kann in Form von der baumförmigen Struktur in der gezeigt sein. In der können alle Blöcke OTT zwei Ausgangskanäle aufgrund der Parameter CLD, ICC, der restlichen und Eingangssignale wieder herstellen. Der Block OTT, die Parameter CLD und ICC können die restlichen und Eingangssignale aufgrund der Ordnung des Bitstroms durchnummeriert sein.
  • Entsprechend der Verweisung in der sind die Blöcke N / 2 OTT verfügbar. In diesem Fall kann der Decoder der Mehrkanalaudioapparatur die Ausgangssignale auf dem Kanal N vom 2. Kanal mit herabgesetzter Mischung N unter Anwendung der Blöcke N / 2 OTT generieren. In diesem Fall werden die Blöcke N / 2 OTT durch die Gesamtheit der Kriterien nicht konfiguriert. Das heißt, die Blöcke OTT können parallele erhöhte Mischung für jeden Kanal N / 2 mit herabgesetzter Mischung erledigen. Das heißt, ein Block OTT ist mit anderem Block OTT auf keine Weise verbunden.
  • Gleichzeitig stellt der linke Teil der den Fall vor, in dem der Niederfrequenzkanal in den Ausgangskanal N nicht eingeht, und im rechten Teil der ist der Fall gezeigt, wenn der Kanal LFE in den Ausgangskkanal der Signale N eingeschlossen wird.
  • Wenn der Kanal LFE in den Ausgangskanal der Signale N nicht eingeht, können die Blöcke N / 2 OTT die Ausgangssignale des Kanales N unter Anwendung der restlichen Signale (RES) und der Signale mit herabgesetzter Mischung (M) generieren. Nichtsdestoweniger, wenn der Kanal LFE in den Ausgangskanal der Signale N nicht eingeht, kann der Block OTT, der aus dem Niederfrequenzkanal unter N / 2 OTT ableitet, nur das Signal mit herabgesetzter Mischung zur Seite der restlichen Signale verwenden.
  • Außerdem, wenn der Kanal LFE in den Ausgangskanal der Signale N eingeht, kann der Block OTT, der in den LFE-Kanal mit den Blöcken N / 2 OTT nicht eingeht, die Signale mit herabgesetzter Mischung mittels der Parameter CLD, ICC und des Blockes OTT mischen, der in den Kanal LFE nicht eingeht, mit herabgesetzter Mischung und Nutzung eines Parameters CLD.
  • Wenn der Kanal LFE in den Ausgangskanal N eingeschlossen wird, geht der Block OTT in den LFE-Kanal mit den Blöcken N / 2 OTT nicht ein, die die dekorrelierten Signale durch den Dekorrelator OTT generieren, der die Niederfrequenzkanäle mittels des Prozesses der Dekorrelation ableitet und schafft die dekorrelierten Signale überhaupt nicht.
  • Die stellt das Schema dar, das den Coder und Decoder für die Vierkanalstruktur (FCE) entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend der Verweisung auf die entspricht FCE dem Gerät, das ein Ausgangssignal des Kanales mittels herabgesetzter Mischung des Vierkanalsystems mit den Eingangssignalen generiert oder die Ausgangssignale des Vierkanalsystems generiert.
  • Der Coder FCE 1801 kann die Signale des Einkanalsystems aus den Ausgangssignalen des Vierkanalsystems unter Anwendung von zwei Blöcken TTO 1803 und 1804 und USC-Coder 1805 generieren.
  • Die Blöcke TTA 1803 und 1804 können die Signale des Einkanalsystems mit herabgesetzter Mischung aus den Ausgangssignalen des Vierkanalsystems mit herabgesetzter Mischung von zwei Eingangssignalen generieren. Der Coder USC 1805 kann die Kodierung im Grundbereich herabgesetzter Mischung der Signale erledigen.
  • Der FCE-Decoder 1802 erledigt die Umkehroperation mittels des Coders FCE 1801 und Decoders FCE 1802, die die Ausgangskanäle des Vierkanalsystems von einem Eingangskanal des Signals unter Anwendung des USC-Decoders und zwei 1806 Blöcke OTT 1807 und 1808 generieren können. Die Blöcke OTT 1807 und 1808 können die Ausgangssignale des Vierkanalsystems mit erhöhter Mischung eines Eingangssignals generieren, das mit Hilfe des Decoders USAC 1806 dekodiert wird. Der OSC-Decoder 1806 kann die Kodierung im Grundbereich FCE mit herabgesetzter Mischung der Signale erledigen.
  • Der FCE-Decoder 1802 kann die Kodierung bei der relativ niedrigen Geschwindigkeit der Sendung zwecks der Versorgung der Arbeit im parametrischen Regime unter Anwendung der Raumsignale, wie CLD, IPD und ICC erledigen. Der Parametertyp kann aufgrund wenigstens eines der Operationsbitströme und der Gesamtzahl der Kanäle mit den Eingangssignalen, Auflösung und Niveau des Quantisierens geändert sein. Der Coder FCE 1801 und Decoder FCE 1802 können für den Bitstrom mit der Geschwindigkeit von 128 kbit und bis 48 kbit breit verwendet werden.
  • Die Anzahl der Ausgangssignale auf dem Decoder FCE 1802 ist «4» gleich, was der Anzahl der Kanäle mit den Eingangssignalen auf dem Coder FCE 1801 gleich ist.
  • Die stellt das Schema dar, das den Coder und Decoder für die Dreikanalstruktur (TCE) entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend der Verweisung auf die entspricht TCE dem Gerät, das die Ausgangssignale des Einkanalsystems aus den Eingangssignalen des Dreikanalsystems generiert oder die Ausgangssignale des Dreikanalsystems generiert.
  • Der Coder TSE 1901 kann einen Block TTO 1903, den einzigen QFM-Umformer 1904 und einen Coder USC 1905 einschließen. In diesem Fall kann der Umformer QFM 1904 den Hybridanalysator / Synthetisator einschließen. Die Eingangssignale des Zweikanalsystems können in den Block TTO 1903 eingeführt sein und sind in die Eingangssignale des Einkanalsystems mittels des Umformers QFM 1904 umgewandelt. Der Block TTO 1903 kann die Signale des Einkanalsystems mittels herabgesetzter Mischung der Signale des Zweikanalsystems generieren. Der Umformer QFM 1904 kann die Eingangssignale des Einkanalsystems der Domäne QFM umwandeln.
  • Das Ausgangsergebnis des Blockes TTO 1903 und des Umformers QFM 1904 kann in den Coder USAC 1905 gebracht sein. Der Coder USC 1905 kann den Grundbereich der Eingangssignale des Zweikanalsystems als Ausgangsergebnis des Blockes TTO 1903 und des Umformers QFM 1904 verschlüsseln.
  • Entsprechend der Verweisung auf die , weil die Anzahl der Kanäle mit den Eingangssignalen „3“ (ungerade Zahl) gleich ist, können nur zwei Kanäle mit den Eingangssignalen in den Block TTO 1903 eingeführt sein, und ein bleibender Kanal mit den Eingangssignalen entgeht dem Block TTO 1903 und geht in den Coder USAC 1905. In diesem Fall, weil der Block TTO 1903 im parametrischen Regime arbeitet, kann TCE Coder 1901 üblich verwendet werden, wenn die Anzahl der Kanäle mit den Eingangssignalen die Werte 11,1 oder 9,0 beträgt.
  • Der Decoder TSE 1902 kann den einzigen USC-Decoder 1906, einen Block OTT 1907 und einen QFM-Sperrumformer 1904 einschließen. Ein Kanal mit den Eingangssignalen vom TCE-Coder 1901 wird im Decoder USAC 1906 dekodiert. In diesem Fall kann der USC-Decoder 1906 die Funktion der Dekodierung in Bezug auf den Grundbereich in einem Eingangskanal erledigen.
  • Zwei Kanäle der Eingangssignale mit dem Ausgang am Decoder USAC 1906 kann in den Block OTT 1907 und den QFM-Sperrumformer 1908 jeweils für die entsprechenden Kanäle eingesetzt sein. Der QFM-Sperrumformer 1908 kann den Hybridanalysator / Synthetisator einschließen. Der Block OTT 1907 kann zwei Kanäle der Ausgangssignale mit Hilfe eines Eingangskanales generieren. Der QFM-Sperrumformer 1908 kann das restliche Eingangssignal auf dem Kanal zwischen dem Ausgang von zwei Eingangssignalen des Kanales durch den Decoder USAC 1906 umwandeln.
  • Die Anzahl der Ausgangssignale der Kanäle des TCE Decoders 1902 beträgt „3“, was der Anzahl der Eingangssignale auf dem Kanal TCE des Coders 190 identisch ist.
  • Die stellt das Schema dar, das den Coder und Decoder für das Achtkanalsystem (ECE) entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend der Verweisung auf die entspricht ECE dem Gerät, das ein Ausgangssignal mittels herabgesetzter Mischung der Eingangssignale des Achtkanalsystems generiert oder die Ausgangssignale des Achtkanalsystems mittels eines Eingangssignals generiert.
  • Der Coder ECE 2001 kann ein Ausgangssignal von den Eingangssignalen des Achtkanalsystems mit Hilfe von sechs Blöcken TTO 2003, 2004, 2005, 2006, 2007 und 2008, sowie durch den USC-Coder 2009 generieren. Die Eingangssignale des Achtkanalsystems gehen von Paaren als Eingangssignale von vier Zweikanalblöcken TTO 2003, 2004, 2005 und 2006 jeweils. In diesem Fall kann jeder von vier Blöcken TTO 2003, 2004, 2005 und 2006 ein Ausgangssignal mittels herabgesetzter Mischung von zwei Kanälen generieren. Das Ausgangsergebnis von vier Blöcken TTO 2003, 2004, 2005 und 2006 kann in zwei konsequente Blöcke TTO 2007 und 2008 eingeführt sein, die an vier Blöcke TTO 2003, 2004, 2005 und 2006 angeschlossen sind.
  • Zwei Blöcke TTO 2007 und 2008 können die Ausgangssignale des Einkanalsystems mit jeder Zusammenführung von zwei Ausgangskanälen der Signale zwischen den Ausgangssignalen von vier TTO Blöcken 2003, 2004, 2005 und 2006 generieren. In diesem Fall können das Ausgangsergebnis von zwei TTO Blöcken 2007 und 2008 in den Coder USAC 2009 eingeführt sein, der zu zwei TTO Blöcken 2007 und 2008 angeschlossen ist. USC Kodierer 2009 kann ein Ausgangssignal des Kanales mittels der Kodierung von zwei Eingangskanälen der Signale generieren.
  • Jeweils kann der Coder ECE 2001 kann ein Ausgangssignal aus acht Kanälen mit den Eingangssignalen unter Anwendung der Blöcke TTO generieren, die in Form von der baumförmigen Struktur verbunden sind. Das heißt, vier Blöcke TTO 2003, 2004, 2005 und2006, und zwei Blöcke TTO 2007 und 2008 können miteinander in der Kaskadenform verbunden sein, und dadurch nach der baumartigen Struktur entsprechen. Wenn wir mit der Struktur des Kanales mit den Eingangssignalen 22,2 oder 14,0 zu tun haben, kann der Coder ECE 2001 bei der Geschwindigkeit des Bitstroms 48 kbit oder sogar 64 kbit verwendet sein.
  • Der Decoder ECE 2002 kann die Ausgangssignale des Achtkanalsystems von einem Eingangskanal unter Anwendung von sechs Blöcken OTT 2011, 2012, 2013, 2014, 2015 und 2016, sowie des Decoders USAC 2010 generieren. Ursprünglich kann das einheitliche Eingangssignal, das vom Coder ECE 2001 generiert wird, in den USAC-Decoder 2010, der in den Decoder ECE 2002 aufgenommen ist, eingeführt sein. Der USC-Decoder 2010 kann zwei Ausgangssignale mittels der Dekodierung des Grundbereiches des einzelnen Eingangskanales generieren. Zwei Kanäle mit den Ausgangssignalen auf dem Decoder 2010 USAC können in die Blöcke OTT 2011 und 2012 für die entsprechenden Kanäle eingeführt sein. Der Block OTT 2011 kann die Ausgangssignale des Zweikanalsystems mit Hilfe eines erhöhenden Eingangskanales generieren. Außerdem kann der Block OTT 2012 die Ausgangssignale des Zweikanalsystems mit Hilfe eines erhöhenden Eingangskanales generieren.
  • Das Ausgangsergebnis der Blöcke OTT 2011 und 2012 kann in jeden der Blöcke OTT 2013, 2014, 2015 und 2016 eingeführt sein, die an die Blöcke OTT 2011 und 2012 angeschlossen sind. Jeder der Blöcke OTT 2013, 2014, 2015 und 2016 kann ein Ausgangssignal zwischen zwei Ausgangssignalen des Kanales, entsprechend dem Ausgangsergebnis auf den Blöcken OTT 2011 und 2012 empfangen und mischen. Das heißt, jeder der Blöcke OTT 2013, 2014, 2015 und 2016 kann zwei Ausgangsignale mit Hilfe eines erhöhenden Eingangskanales generieren. Die Anzahl der Kanäle der Ausgangssignale, die aus vier Blöcken OTT 2013, 2014, 2015 und 2016 erhalten sind, ist 8 gleich.
  • Entsprechend kann der Decoder ECE 2002 die Ausgangssignale des Achtkanalsystems von einem Eingangskanal mit Hilfe der Blöcke OTT generieren, die sich in Form von der baumförmigen Struktur verbinden. Das heißt, vier Blöcke OTT 2013, 2014, 2015 und 2016 und zwei Blöcke OTT 2011 und 2012 können miteinander in der Kaskadenform verbunden sein.
  • Die Anzahl der Ausgangssignale auf dem Decoder ECE 2002 beträgt «8», was der Anzahl der Kanäle mit den Eingangssignalen auf dem Coder ECE 2001 gleich ist.
  • Die stellt das Schema das, das den Coder und Decoder für das Sechskanalsystem (SiCE) entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend der Verweisung auf die entspricht der Block SiCE dem Gerät, der die Ausgangssignale des Einkanalsystems aus sechs Kanälen mit den Eingangssignalen generiert oder sechs Ausgangskanäle von einem Eingangskanal generiert.
  • Der SiCE-Coder 2101 kann vier Blöcke TTO 2103, 2104, 2105 und 2106, und einen Coder USC 2107 einschließen. In diesem Fall können die Eingangssignale des Sechskanalsystems in drei Blöcke TTO 2103, 2104 und 2106 eingeführt sein. Jeder von diesen drei Blöcken TTO 2103, 2104, und 2105 kann ein Ausgangssignal mittels herabgesetzter Mischung von zwei Eingangssignalen unter den Eingangssignalen des Sechskanalsystems generieren. Zwei Blöcke TTO von drei 2103, 2104, und 2105 können zu anderem Block TTO angeschaltet werden. In der ist es gezeigt, dass TTO die Blöcke 2103 und 2104 an das Block TTO 2106 angeschlossen sein können.
  • Das Ausgangsergebnis auf den Blöcken TTO 2103 und 2104 kann in den Block TTO 2106 eingeführt sein. Entsprechend der Verweisung auf die kann der Block TTO 2106 ein Ausgangssignal mittels herabgesetzter Mischung der Eingangssignale des Zweikanalsystems generieren. Gleichzeitig wird das Ausgangsergebnis aus dem Block TTO 2105 in den Block 2106 nicht eingeführt. Das heißt, das Ausgangsergebnis aus dem Block TTO 2105 entgeht dem Block TTO 2106 und wird in den Coder USAC 2107 eingeführt.
  • Der Coder USC 2107 kann einen Ausgangskanal des Signals mittels der Kodierung des Hauptstreifens von zwei Kanälen der Eingangssignale generieren, die dem Ausgangsergebnis TTO des Blocks 2105 und dem Ausgangsergebnis des Blocks TTO 2106 entsprechen.
  • Im Coder SiCE 2101 werden drei Blöcke TTO 2103, 2104 und 2105 und ein Block TTO 2106 in verschiedenen Weisen konfiguriert. Die ungleichartigen Coder ECE 2001, SiCE 2101 und zwei Blöcke TTO 2103 und 2104, sowie drei Blöcke TTO 2103, 2103 und 2105 werden an einen Block TTO 2106 angeschlossen, und ein restlicher Block TTO 2105 entgeht dem Block TTO 2106. Der Coder SiCE 2101 kann die Eingangssignale in der Struktur des Kanales 14.0 mit Geschwindigkeit des Bitstroms 48 kbit und / oder 64 kbit bearbeiten.
  • Der SiCE Decoder 2102kann einen USC-Decoder 2108 und vier Blöcke OTT 2109, 2110, 2111 und 2112 einschließen.
  • Ein Ausgangssignal, das vom Coder SiCE 2101 generiert wird, kann in den Decoder SiCE 2102 eingeführt werden. Der USC-Decoder 2108 und Decoder SiCE 2102 kann zwei Ausgangskanäle mittels der Dekodierung des Grundbereichs des einzelnen Eingangskanales generieren. Ein Ausgangssignal des Kanales zwischen zwei Ausgangskanalsignalen, die aus dem Decoder USAC 2108 generiert werden, wird in den Block OTT 2109 eingeführt, und der andere Ausgangskanal entgeht dem Block OTT 2109 und wird unmittelbar in den Block OTT 2112 eingeführt.
  • Der Block OTT 2109 kann zwei Ausgangskanäle mit Hilfe eines erhöhenden Eingangskanales mit den Signalen generieren, die vom Decoder USAC 2108 übertragen werden. Ein Ausgangssignal des Kanales zwischen zwei Ausgangssignalen, die aus dem Block OTT 2109 generiert werden, kann in den Block OTT 2110 eingeführt sein, und das restliche Ausgangssignal des Kanales kann in den Block OTT 2111 eingeführt sein. Jeder der Blöcke OTT 2110, 2111 und 2112 kann zwei Ausgangskanäle mit den Signalen mit Hilfe eines erhöhenden Eingangskanales generieren.
  • Jeder der Coder, die in der in der Struktur FCE, TCE, ECE, sowie SiCE, gezeigt sind, kann die Ausgangssignale des Einkanalsystems aus N Eingangskanälen unter Anwendung der Gesamtheit der Blöcke TTO generieren. In diesem Fall kann ein Block TTO sogar im Coder USAC anwesend sein, der in jedem der Coder in den Strukturen FCE, TCE, ECE, sowie in der Struktur SiCE enthalten ist.
  • Gleichzeitig, jeder der Coder in der Struktur ECE und SiCE kann unter Anwendung der 2-stufigen Blöcke TTO konfiguriert sein. Außerdem, wenn die Anzahl der Signalkanäle der Eingabe, zum Beispiel, in der Struktur TCE und in der Struktur SiCE ungerade ist, dann wird die Nutzung des Blockes TTO notwendig.
  • Jeder der Decoder in der Struktur FCE, TCE und ECE, sowie in der Struktur SiCE kann N Ausgangskanäle und Signale von einem Eingangskanal unter Anwendung der Gesamtheit der Blöcke OTT generieren. In diesem Fall kann ein Block OTT sogar im Decoder USAC anwesend sein, der in jedem der Decoder in der Struktur FCE, OTK, ECE enthalten ist.
  • Gleichzeitig, jeder der Decoder in der Struktur ECE und SiCE kann unter Anwendung der 2-stufigen Blöcke OTT konfiguriert sein. Außerdem, wenn die Anzahl der Eingangssignalkanäle, zum Beispiel, in der Struktur TCE, ungerade Zahl ist, ist die Anwendung des Blockes OTT notwendig.
  • In der ist das Schema gezeigt, das den Prozess der Bearbeitung der Lautsignale des 24-Kanalsystems aufgrund der Struktur FCE entsprechend der Variante der Realisation detailliert illustriert.
  • In der wird die Struktur des Kanales 22.2 detailiert illustriert, der bei der Geschwindigkeit des Bitstroms 128 kbit und 96 kbit arbeiten kann. Entsprechend der Verweisung auf die können die Eingangssignale des 24-Kanalsystems in sechs FCE-Coder 2201 mit der Formel 4 × 4 eingeführt sein. Wie oben in der beschrieben, kann der Coder FCE 2201 ein Ausgangssignal des Kanales aus vier Kanälen mit den Eingangssignalen generieren. Ein Kanal mit den Ausgangssignalen von jedem aus sechs FCE Codern 2201 kann in Form vom Bitstrom durch den Bitstrom des Decoders abgeleitet werden. Das heißt, der Bitstrom kann sechs Ausgangssignale einschließen.
  • Der Konverter des Bitstroms kann sechs Ausgangssignale aus dem Bitstrom ableiten. Sechs Ausgangssignale können in den Sechskanal-Decoder FCE 2202 jeweils eingeführt sein. Wie oben in der beschrieben, kann der FCE-Decoder 2202 die Ausgangssignale des Vierkanalsystems von einem Ausgangssignal generieren. Im Allgemeinen können die Ausgangssignale des 24-Kanalsystems mit Hilfe von sechs FCE-Decodern 2202 erzeugt sein.
  • In der ist das Schema gezeigt, das den Prozess der Bearbeitung der Lautsignale des 24-Kanalsystems aufgrund der Struktur ECE entsprechend der Variante der Realisation detailliert illustriert.
  • In der wird der Fall illustriert, wenn die 24-Kanaleingangssignale auf den Eingang zugeleitet werden, der ebenso, wie auch die Struktur des Kanals 22,2 in der ist. Nichtsdestoweniger, solches Regime der Arbeit in der meint die Geschwindigkeit des Bitstroms 48 kbit und 64 kbit, es ist weniger, als in der .
  • Entsprechend der Verweisung auf die können die Eingangssignale des 24-Kanalsystems auf drei Coder ECE 2301 8 × 8 gebracht sein. Wie oben in der beschrieben, kann der Coder ECE 2301 ein Ausgangssignal aus acht Kanälen generieren. Ein Ausgangssignal wird von jedem aus drei Codern ECE 2301 generiert, die in Form vom Bitstrom durch den Konverter des Bitstroms abgeleitet werden können. Das heißt, der Bitstrom kann drei Ausgangssignale einschließen.
  • Der Konverter des Bitstroms kann drei Ausgangssignale aus dem Bitstrom ableiten. Drei Ausgangssignale können auf drei Decoder ECE 2302 jeweils gebracht sein. Wie oben beschrieben, entsprechend der Verweisung auf die kann der Decoder ECE 2302 die Achtkanalausgangssignale von einem Eingangskanal generieren. Entsprechend, im Allgemeinen können 24 Ausgangssignale mit Hilfe von drei FCE-Decodern 2302 erzeugt sein.
  • In der ist das Schema gezeigt, das den Prozess der Bearbeitung der lautlichen 14-Kanalsignale aufgrund der Struktur FCE entsprechend der Variante der Realisation illustriert.
  • Die illustriert den Prozess der Bildung der Vierkanalausgangssignale von den Eingangssignalen des 14-Kanalsystems unter Anwendung von drei FCE-Codern 2401 und einem Coder CPE 2402. In diesem Fall ist das Regime der Arbeit (in der ) auf dem relativ hohen Bitbereich, etwa 128 kbit oder 96 kbit.
  • Jeder von drei FCE-Codern 2401 kann ein Ausgangssignal aus vier Eingangskanälen generieren. Ein CPE-Coder 2402 kann ein Ausgangssignal mittels herabgesetzter Mischung von zwei Kanälen erzeugen. Der Konverter des Bitstroms kann den Bitstrom generieren, darunter vier Ausgangssignale von drei FCE-Ausgangscodern 2401 und eines CPE-Ausgangscodern 2402.
  • Gleichzeitig kann der Konverter des Bitstroms vier Ausgangssignale aus dem Bitstrom herausziehen, kann die Ausgangssignale des Dreikanalsystems auf drei FCE-Decodern 2403 jeweils übertragen und können das restliche Ausgangssignal in einem CPE-Decoder 2404 übertragen. Jeder von drei FCE-Decodern 2403 kann die Ausgangssignale des Vierkanalsystems von einem Eingangskanal generieren. Ein CPE-Decoder 2404 kann zwei Kanäle der Asusgangssignale von einem Eingangskanal generieren. Das heißt, im Allgemeinen können 14 Ausgangssignale mit Hilfe von drei FCE-Decodern 2403 und einem CPE-Decoder 2404 erzeugt sein.
  • In der ist das Diagramm vorgestellt, das den Prozess der Bearbeitung der Lautsignale des 14-Kanalsystems aufgrund der Struktur ECE und der Struktur SiCE entsprechend der Variante der Realisation illustriert.
  • Die illustriert detailliert den Prozess der Bearbeitung die Eingangssignale des 14-Kanalsystems unter Anwendung des Coders ECE 2501 und Coders SiCE 2502. Im Unterschied zur , ist es in der sichtbar, dass er zur relativ niedrigen Geschwindigkeit der Sendung, zum Beispiel, 48 kbit oder 96 kbit verwendet wird.
  • Der Coder ECE 2501 kann die Asusgangssignale des Einkanalsystems aus dem Achtkanalsystem zwischen den Eingangssignalen des 14-Kanalsystems generieren. Der Coder 2502 kann die Signale des Einkanalsystems von sechs Eingangs- zwischen den Eingangssignalen des 14-Kanalsystems generieren. Der Konverter des Bitstroms kann den Bitstrom unter Anwendung des Ausgangsergebnisses des Coders ECE 2501 und des Ausgangsergebnisses des Coders SiCE 2502 generieren.
  • Gleichzeitig, der Konverter des Bitstroms kann die Signale des Zweikanalsystems aus dem Bitstrom herausziehen. Zwei Ausgangssignale können in den Decoder ECE 2503 und SiCE-Decoder 2504, entsprechend eingeführt sein. Der Decoder ECE 2503 kann die Ausgangssignale des Achtkanalsystems von einem Eingangskanal generieren, und der Decoder 2504 kann die Ausgangssignale des Sechskanalsystems von einem Eingangskanal generieren. Das heißt, im Allgemeinen können 14 Ausgangssignale mit Hilfe des Decoders ECE 2503 und Decoders SiCE 2504 erzeugt sein.
  • In der ist das Schema gezeigt, das den Prozess der Bearbeitung der Audiosignale des Kanales 11.1 aufgrund der Struktur TCE entsprechend der Variante der Realisation detailliert illustriert.
  • Entsprechend der Verweisung auf die können vier CPE-Coder 2601 und ein TCE-Coder 2602 die Ausgangssignale des Fünfkanalsystems des Kanales von den Eingangssignalen des Kanales 11.1 generieren. In der können die Lautsignale bei der relativ hohen Geschwindigkeit der Sendung, zum Beispiel, 128 kbit und 96 kbit bearbeitet sein. Jeder von vier CPE-Codern 2601 kann die Ausgangssignale des Einkanalsystems aus zwei Eingangskanälen generieren. Gleichzeitig kann ein TCE-Coder 2602 die Ausgangssignale des Einkanalsystems aus drei Eingangskanälen generieren. Das Ausgangsergebnis von vier CPE-Codern 2601 und einem TCE-Coder 2602 kann auf den Konverter des Bitstroms gebracht und dann in Form vom Bitstrom abgeleitet sein. Das heißt, der Bitstrom kann die Ausgangssignale des Fünfkanalsystems einschließen.
  • Gleichzeitig kann der Konverter des Bitstroms die Signale aus dem Fünfkanalsystem des Bitstroms herausziehen. Die Ausgangssignale des Fünfkanalsystems können auf vier CPE-Decoder 2603 und einen TCE-Decoder 2604, entsprechend gebracht sein. Jeder von vier CPE-Decodern 2603 kann die Ausgangskanäle des Zweikanalsystems von einem Eingangskanal generieren. Der TCE-Decoder 2604 kann die Signale des Dreikanalsystems von einem Eingangskanal generieren. Entsprechend können vier CPE-Decoder 2603 und ein TCE-Decoder 2604 die Ausgangskanalsignale generieren.
  • In der ist das Schema gezeigt, das den Prozess der Bearbeitung der Lautsignale des Kanales 11.1 aufgrund der Struktur FCE und entsprechend der Variante der Realisation detailliert illustriert.
  • Im Unterschied zur , in der können die Lautsignale bei der relativ niedrigen Geschwindigkeit der Sendung, zum Beispiel, bei 64 kbit oder 48 kbit bearbeitet sein. Entsprechend der Verweisung auf die können die Signale des Dreikanalsystems aus den Eingangssignalen des 12-Kanalsystems durch drei FCE-Coder 2701 gebildet sein. Ausführlich sagend, kann jeder von drei FCE-Codern 2701 die Ausgangssignale des Einkanalsystems aus den Eingangssignalen des Vierkanal- oder 12-Kanalsystems generieren. Der Konverter des Bitstroms kann den Bitstrom generieren, die Ausgangssignale des Dreikanalsystems verwendend, die aus drei FCE-Codern 2701 jeweils abgeleitet werden.
  • Inzwischen kann der Konverter des Bitstroms die Ausgangssignale des Dreikanalsystems vom Bitstrom ableiten. Die Signale des Dreikanalsystems können auf drei FCE-Decoder 2702 jeweils gebracht sein. Der FCE-Decoder 2702 kann die Signale des Dreikanalsystems von einem Eingangskanal generieren. Entsprechend, im Allgemeinen können die Ausgangssignale des 12-Kanalsystems mit Hilfe von drei FCE-Decodern 2702 erhalten sein.
  • In der ist das Schema gezeigt, das den Prozess der Bearbeitung der Audiosignale 9.0 aufgrund der Struktur TCE entsprechend der Variante der Realisation detailliert illustriert.
  • Die illustriert den Prozess der Bearbeitung der Signale des Neunkanalsystems. In der können die Signale des Neunkanalsystems bei der relativ hohen Bitgeschwindigkeit der Sendung, zum Beispiel, 128 kbit oder 96 kbit bearbeitet sein. In diesem Fall können die Eingangssignale des Neunkanalsystems aufgrund von drei CPE-Codern 2801 und einem Coder TCE 2802 bearbeitet sein, wobei jeder von drei CPE-Codern 2801 ein Ausgangssignal aus zwei Eingangskanälen generieren kann. Gleichzeitig kann ein TCE-Coder 2802 ein Ausgangssignal aus drei Eingangskanälen generieren. Entsprechend, im Allgemeinen können die Signale des Vierkanalsystems auf den Strom des Bitkonverters gebracht sein und in Form vom Bitstrom abgeleitet werden.
  • Der Konverter der Bitströme kann die Signale des Vierkanalsystems, aufgenommen in den Bitstrom, herausziehen. Die Signale des Vierkanalsystems können auf drei CPE-Decoder 2803 und einem TCE-Decoder 2804 jeweils gebracht sein. Jeder von drei CPE-Decodern 2803 kann die Signale des Zweikanalsystems von einem Eingangskanal generieren. Ein TCE-Decoder 2804 kann drei Kanäle der Ausgangssignale von einem Eingangskanal generieren. Entsprechend können neun Ausgangssignale im Allgemeinen erzeugt sein.
  • Die stellt das Diagramm vor, das den Prozess der Bearbeitung der Lautsignale des Kanales 9.0 aufgrund der Struktur FCE entsprechend der Variante der Realisation detailliert illustriert.
  • Die illustriert detailliert den Prozess der Bearbeitung der Signale von 9 Eingangskanälen. In der können die Eingangssignale des 9. Kanales bei der relativ niedrigen Geschwindigkeit der Bitsendung, zum Beispiel, 64 kbit und 48 kbit bearbeitet sein. Dabei können die Eingangssignale des 9. Kanals mit Hilfe von zwei Gebern FCE 2901 und einem Coder SCE 2902 bearbeitet sein. Jeder von zwei FCE Codern 2901 kann einen Ausgangskanal des Signals aus vier Kanälen der Eingangssignale generieren.
  • Ein Coder SCE 2902 kann einen Ausgangskanal des Signals von einem Eingangskanal des Signals generieren. Entsprechend, im Allgemeinen können drei Kanäle der Ausgangssignale in den Bitstrom des Formatters eingeführt sein und in Form vom Bitstrom abgeleitet werden.
  • Der Konverter der Bitströme kann die Signale der Dreikanalsysteme, die in diesen Bitstrom aufgenommen sind, herausziehen. Die Ausgangssignale des Dreikanalsystems können auf zwei FCE Decoder 2903 und einen SCE-Decoder 2904 jeweils gebracht sein. Jeder von zwei FCE Decodern 2903 kann die Signale für das Vierkanalsystem von einem Eingangskanal generieren. Ein SCE Decoder 2904 kann die Signale des Einkanalsystems von einem Eingangskanal generieren. Entsprechend können neun Ausgangssignale im Allgemeinen erzeugt sein.
  • In der Tabelle 12 ist die Konfiguration des Parametersatzes aufgrund der Anzahl der Eingangssignale der Kanäle bei der Ausführung der Raumkodierung vorgeführt. In diesem Fall ist bsFreqRes die Anzahl der Signale der Analyse und Anzahl der USAC-Coder. [Tabelle 12]
    Muster Bitbereich Parameter Konfiguration
    Gesuchter Parameter bsFreqRes # insgesamt
    24-kanalig 128 kbit CLD, ICC, IPD 2 20
    96 kbit CLD, ICC, IPD 4 10
    64 kbit CLD, ICC 4 10
    48 kbit CLD, ICC 5 7
    14, 12-kanalig 128 kbit CLD, ICC, IPD 2 20
    96 kbit CLD, ICC, IPD 2 20
    64 kbit CLD, ICC 4 10
    48 kbit CLD, ICC 4 10
    9-kanalig 128 kbit CLD, ICC, IPD 1 28
    96 kbit CLD, ICC, IPD 2 20
    64 kbit CLD, ICC 4 10
    48 kbit CLD, ICC 4 10
  • Der Coder USC kann die Haupteingangssignale verschlüsseln. Der Coder USC kann eine Menge der Coder aufgrund der Anzahl der Eingangssignale steuern, die Informationen der Abbildung aufgrund der Metadaten und des Objektes verwendend. In diesem Fall führt die Metadaten die Informationen über die Beziehungen zwischen den Elementen des Kanales (CPE und PCE), Objekten und generierten Signalen des Kanales vor. Die Tabelle 13 führt den Bitbereich und die Abtastrate, verwendet für den Coder USAC vor. Der Parameter der Kodierung der Replikation der spektralen Signale (SBR) kann entsprechend aufgrund der Abtastrate der Tabelle 13 korrigiert sein. [Tabelle 13]
    Bitbereich Musterbereich (kHz)
    24 ch 14 ch 12 ch 9 ch
    128 kbit 32 44.1 44.1 44.1
    96 kbit 28.8 35.2 44.1 44.1
    64 kbit 28.8 35.2 32.0 32.0
    48 kbit 28.8 32 28.8 32.0
  • Die Weisen können, entsprechend den Varianten der Realisation, auf einen der ausgelesenen Computerträger aufgezeichnet sein, darunter die Programminstruktionen für die Ausführung verschiedener Operationen, die mit Hilfe des Computers erledigt werden. Die Träger können auch getrennt oder in der Kombination mit den Programminstruktionen, die Dateien der Daten, die Strukturen der Daten und ähnliches einschließen. Die Beispiele der Programmbefehle können für das vorliegende Gerät und bekannte Computersoftware speziell ausgearbeitet und gestimmt sein.
  • Obwohl einige Varianten der Realisation der Erfindung des Gerätes früher schon vorgeführt und beschrieben waren, wird die vorliegende Erfindung von den beschriebenen Varianten der Realisation nicht beschränkt. Für die Fachkräfte auf dem vorliegenden Gebiet der Erfindung der Technik ist es vollkommen klar, dass verschiedene Varianten der Realisation der Erfindung dieses Gerätes erledigt sein können, die ganze Bedeutsamkeit der Prinzipien und des Wesens der vorliegenden Erfindung nicht vermindernd.
  • Entsprechend wird der Umfang der Erfindung von den Varianten der Realisation nicht beschränkt, und im Gegenteil wird von der Formel der Erfindung und ihren Äquivalenten bestimmt.

Claims (20)

  1. Verfahren zur Verarbeitung eines Mehrkanal-Audiosignals, aufweisend die folgenden Verfahrensschritte: Bestimmung eines Restsignals und N/2-Downmix-Signalen erzeugt aus N Kanaleingangssignalen; Anwendung der N/2-Downmix-Signale und des Restsignals auf die eine erste Matrix; Ausgeben eines ersten Signals durch die erste Matrix, welches an jeden von N/2 Dekorrelatoren übergeben wird, welche N/2 Eins-zu-Zwei (OTT)-Blöcken entsprechen, und eines zweiten Ausgangssignals, das einer zweiten Matrix ohne Eingabe in die N/2 Dekorrelatoren übermittelt wird; Ausgabe eines dekorrelierten Signals aus dem ersten Signal durch die N/2 Dekorrelatoren; Anwendung des dekorrelierten Signals und des zweiten Signals auf die zweite Matrix; sowie Generierung von N-Kanal-Ausgangssignalen durch die zweite Matrix.
  2. Verfahren nach Anspruch 1, wobei wenn ein Niederfrequenzverstärkungskanal (LFE) in den N-Kanal-Ausgangssignalen nicht enthalten ist, die N/2 Dekorrelatoren den N/2 Eins-in-Zwei (OTT)-Blöcken entsprechen.
  3. Verfahren nach Anspruch 1, wobei wenn die Anzahl der Dekorrelatoren den Bezugswert einer Modulo-Operation überschreitet, die Indices der Dekorrelatoren basierend auf dem Referenzwert wiederholt verwendet werden.
  4. Verfahren nach Anspruch 1, wobei wenn ein LFE-Kanal in den N Kanalausgangssignalen enthalten ist, die Dekorrelatoren mit der verbleibenden Nummer mit Ausnahme der Anzahl der LFE-Kanäle aus N/2 verwendet werden, und der LFE-Kanal keinen OTT-Block-Dekorrelator verwendet.
  5. Verfahren nach Anspruch 1, wobei wenn kein temporäres shaping tool eingesetzt wird, ein einzelner Vektor, welcher das zweite Signal, das von dem Dekorrelator abgeleitete dekorrelierte Signal und das von dem Dekorrelator abgeleitete Restsignal enthält, der zweiten Matrix eingegeben wird.
  6. Verfahren nach Anspruch 1, wobei wenn ein temporäres shaping tool eingesetzt wird, ein Vektor entsprechend einem direkten Signal einschließlich des zweiten Signals und des von dem Dekorrelator abgeleiteten Restsignals und ein Vektor entsprechend einem diffusen Signal einschließlich des aus dem Dekorrelator abgeleiteten dekorrelierten Signals der zweiten Matrix eingegeben werden.
  7. Verfahren nach Anspruch 6, wobei die Generierung der N-Kanal-Ausgangssignale die Bildung einer zeitlichen Einhüllenden eines Ausgangssignals durch Anwendung eines Skalenfaktors basierend auf dem diffusen Signal und dem direkten Signal auf einen diffusen Signalabschnitt des Ausgangssignals umfasst, wenn eine Subband Domain Time Processing (STP) verwendet wird.
  8. Verfahren nach Anspruch 6, wobei die Generierung der N-Kanal-Ausgangssignale die Abflachung und Umformung einer Einhüllenden entsprechend einem direkten Signalabschnitt für jeden Kanal des N-Kanal-Ausgangssignals umfasst, wenn eine Guided Envelope Shaping (GES) verwendet wird.
  9. Verfahren nach Anspruch 1, wobei die Größe der ersten Matrix anhand der Anzahl der Downmix-Signal-Kanäle und der Anzahl der Dekorrelatoren bestimmt wird, auf welche die erste Matrix angewendet wird, und ein Element der ersten Matrix anhand eines Kanalpegeldifferenz (CLD)-Parameters oder eines Kanalvorhersage (CPC)-Parameters bestimmt wird.
  10. Verfahren zur Verarbeitung eines Mehrkanal-Audiosignals, wobei das Verfahren aufweist: Identifizierung von N/2-Kanal Downmix-Signalen und N/2-Kanal Restsignalen; Generierung von N-Kanal-Ausgangssignalen durch Eingabe der N/2-Kanal Downmix-Signale und der N/2-Kanal Restsignale in N/2 Eins-in-Zwei (OTT)-Blöcke, wobei die N/2 (OTT)-Blöcke parallel angeordnet sind ohne eine Verbindung zueinander, wobei ein OTT-Block zur Ausgabe eines Niedrigfrequenzverstärkungs (LFE)-Kanals unter den N/2 (OTT)-Blöcken ausgebildet ist, um (1) ein Downmix-Signal und kein Restsignal zu empfangen, (2) aus einem Kanalpegeldifferenz (CLD)-Parameter und einem Interkanal-Korrelations/Kohärenz (ICC)-Parameter nur den (CLD)-Parameter zu verwenden, und (3) kein dekorreliertes Signal durch den Dekorrelator auszugeben.
  11. Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals, aufweisend: einen Prozessor eingerichtet zur Ausführung eines Mehrkanal-Audiosignalverarbeitungsverfahrens, wobei das Mehrkanal-Audiosignalverarbeitungsverfahren aufweist: Bestimmung eines Restsignals und N/2-Downmix-Signalen erzeugt aus N Kanaleingangssignalen; Anwendung der N/2-Downmix-Signale und des Restsignals auf eine erste die Matrix; Ausgeben eines ersten Signals durch die erste Matrix, welches an jeden von N/2 Dekorrelatoren übergeben wird, welche N/2 Eins-zu-Zwei (OTT)-Blöcken entsprechen, und eines zweiten Ausgangssignals, das einer zweiten Matrix ohne Eingabe in die N/2 Dekorrelatoren übermittelt wird; Ausgabe eines dekorrelierten Signals aus dem ersten Signal durch die N/2 Dekorrelatoren; Anwendung des dekorrelierten Signals und des zweiten Signals auf die zweite Matrix; sowie Generierung von N-Kanal-Ausgangssignalen durch die zweite Matrix.
  12. Vorrichtung nach Anspruch 11, wobei wenn ein Niederfrequenzverstärkungskanal (LFE) in den N-Kanal-Ausgangssignalen nicht enthalten ist, die N/2 Dekorrelatoren den N/2 Eins-in-Zwei (OTT)-Blöcken entsprechen.
  13. Vorrichtung nach Anspruch 11, wobei wenn die Anzahl der Dekorrelatoren den Bezugswert einer Modulo-Operation überschreitet, die Indices der Dekorrelatoren basierend auf dem Referenzwert wiederholt verwendet werden.
  14. Vorrichtung nach Anspruch 11, wobei wenn ein LFE-Kanal in den N Kanalausgangssignalen enthalten ist, die Dekorrelatoren mit der verbleibenden Nummer mit Ausnahme der Anzahl der LFE-Kanäle aus N/2 verwendet werden, und der LFE-Kanal keinen OTT-Block-Dekorrelator verwendet.
  15. Vorrichtung nach Anspruch 11, wobei wenn kein temporäres shaping tool eingesetzt wird, ein einzelner Vektor, welcher das zweite Signal, das von dem Dekorrelator abgeleitete dekorrelierte Signal und das von dem Dekorrelator abgeleitete Restsignal enthält, der zweiten Matrix eingegeben wird.
  16. Vorrichtung nach Anspruch 11, wobei wenn ein temporäres shaping tool eingesetzt wird, ein Vektor entsprechend einem direkten Signal einschließlich des zweiten Signals und des von dem Dekorrelator abgeleiteten Restsignals und ein Vektor entsprechend einem diffusen Signal einschließlich des aus dem Dekorrelator abgeleiteten dekorrelierten Signals der zweiten Matrix eingegeben werden.
  17. Vorrichtung nach Anspruch 16, wobei die Generierung der N-Kanal-Ausgangssignale die Bildung einer zeitlichen Einhüllenden eines Ausgangssignals durch Anwendung eines Skalenfaktors basierend auf dem diffusen Signal und dem direkten Signal auf einen diffusen Signalabschnitt des Ausgangssignals umfasst, wenn eine Subband Domain Time Processing (STP) verwendet wird.
  18. Vorrichtung nach Anspruch 16, wobei die Generierung der N-Kanal-Ausgangssignale die Abflachung und Umformung einer Einhüllenden entsprechend einem direkten Signalabschnitt für jeden Kanal des N-Kanal-Ausgangssignals umfasst, wenn eine Guided Envelope Shaping (GES) verwendet wird.
  19. Vorrichtung nach Anspruch 11, wobei die Größe der ersten Matrix anhand der Anzahl der Downmix-Signal-Kanäle und der Anzahl der Dekorrelatoren bestimmt wird, auf welche die erste Matrix angewendet wird, und ein Element der ersten Matrix anhand eines Kanalpegeldifferenz (CLD)-Parameters oder eines Kanalvorhersage (CPC)-Parameters bestimmt wird.
  20. Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals, aufweisend: einen Prozessor ausgebildet zur Ausführung eines Mehrkanal-Audiosignalverarbeitungsverfahrens, wobei das Mehrkanal-Audiosignalverarbeitungsverfahren aufweist: Identifizierung von N/2-Kanal Downmix-Signalen und N/2-Kanal Restsignalen; Generierung von N-Kanal-Ausgangssignalen durch Eingabe der N/2-Kanal Downmix-Signale und der N/2-Kanal Restsignale in N/2 Eins-in-Zwei (OTT)-Blöcke, wobei die N/2 (OTT)-Blöcke parallel angeordnet sind ohne eine Verbindung zueinander, wobei ein OTT-Block zur Ausgabe eines Niedrigfrequenzverstärkungs (LFE)-Kanals unter den N/2 (OTT)-Blöcken ausgebildet ist, um (1) ein Downmix-Signal und kein Restsignal zu empfangen, (2) aus einem Kanalpegeldifferenz (CLD)-Parameter und einem Interkanal-Korrelations/Kohärenz (ICC)-Parameter nur den (CLD)-Parameter zu verwenden, und (3) kein dekorreliertes Signal durch den Dekorrelator auszugeben.
DE112015003108.1T 2014-07-01 2015-07-01 Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals Active DE112015003108B4 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20140082030 2014-07-01
KRKR10-2014-0082030 2014-07-01
KRKR10-2015-0094195 2015-07-01
PCT/KR2015/006788 WO2016003206A1 (ko) 2014-07-01 2015-07-01 다채널 오디오 신호 처리 방법 및 장치
KR1020150094195A KR102144332B1 (ko) 2014-07-01 2015-07-01 다채널 오디오 신호 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
DE112015003108T5 DE112015003108T5 (de) 2017-04-13
DE112015003108B4 true DE112015003108B4 (de) 2021-03-04

Family

ID=55169676

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112015003108.1T Active DE112015003108B4 (de) 2014-07-01 2015-07-01 Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals

Country Status (4)

Country Link
US (3) US9883308B2 (de)
KR (1) KR102144332B1 (de)
CN (4) CN110895943B (de)
DE (1) DE112015003108B4 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102144332B1 (ko) 2014-07-01 2020-08-13 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
EP3067885A1 (de) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur verschlüsselung oder entschlüsselung eines mehrkanalsignals
US10008214B2 (en) * 2015-09-11 2018-06-26 Electronics And Telecommunications Research Institute USAC audio signal encoding/decoding apparatus and method for digital radio services
SG11201806256SA (en) * 2016-01-22 2018-08-30 Fraunhofer Ges Forschung Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision
KR20190069192A (ko) 2017-12-11 2019-06-19 한국전자통신연구원 오디오 신호의 채널 파라미터 예측 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007078254A2 (en) * 2006-01-05 2007-07-12 Telefonaktiebolaget Lm Ericsson (Publ) Personalized decoding of multi-channel surround sound

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311809B2 (en) * 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US8126152B2 (en) * 2006-03-28 2012-02-28 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
EP1853092B1 (de) * 2006-05-04 2011-10-05 LG Electronics, Inc. Verbesserung von Stereo-Audiosignalen mittels Neuabmischung
KR100917843B1 (ko) 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
AU2008215231B2 (en) * 2007-02-14 2010-02-18 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
MX2010004138A (es) * 2007-10-17 2010-04-30 Ten Forschung Ev Fraunhofer Codificacion de audio usando conversion de estereo a multicanal.
KR101261677B1 (ko) 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
HUE041788T2 (hu) * 2008-10-06 2019-05-28 Ericsson Telefon Ab L M Eljárás és berendezés igazított többcsatornás hang szállítására
KR101600352B1 (ko) 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
ES2524428T3 (es) * 2009-06-24 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
US9269359B2 (en) * 2009-10-30 2016-02-23 Nokia Technologies Oy Coding of multi-channel signals
PL3779979T3 (pl) * 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
EP2560161A1 (de) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimale Mischmatrizen und Verwendung von Dekorrelatoren in räumlicher Audioverarbeitung
WO2016003206A1 (ko) 2014-07-01 2016-01-07 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
KR102144332B1 (ko) 2014-07-01 2020-08-13 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007078254A2 (en) * 2006-01-05 2007-07-12 Telefonaktiebolaget Lm Ericsson (Publ) Personalized decoding of multi-channel surround sound

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BREEBAART, J.; HERRE, J.; FALLER, C.; RÖDÉN, J.; MYBURG, F.; DISCH, S.; PURNHAGEN, H.; HOTHO, G.; NEUSINGER, M.; KJÖRLING, K.; OOMEN, W.: MPEG spatial audio coding/MPEG surround: Overview and current status. In: Audio Engineering Society Convention paper, 2005, 1 - 17. *

Also Published As

Publication number Publication date
US9883308B2 (en) 2018-01-30
CN106471575B (zh) 2019-12-10
US20180139555A1 (en) 2018-05-17
US10264381B2 (en) 2019-04-16
US20190289413A1 (en) 2019-09-19
CN110970041A (zh) 2020-04-07
CN110895943A (zh) 2020-03-20
CN106471575A (zh) 2017-03-01
CN110895943B (zh) 2023-10-20
CN110970041B (zh) 2023-10-20
KR20160003572A (ko) 2016-01-11
CN110992964A (zh) 2020-04-10
CN110992964B (zh) 2023-10-13
KR102144332B1 (ko) 2020-08-13
DE112015003108T5 (de) 2017-04-13
US10645515B2 (en) 2020-05-05
US20170134873A1 (en) 2017-05-11

Similar Documents

Publication Publication Date Title
DE602005002942T2 (de) Verfahren zur darstellung von mehrkanal-audiosignalen
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE112015003108B4 (de) Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
DE602005002833T2 (de) Kompensation von multikanal-audio energieverlusten
DE602004005020T2 (de) Audiosignalsynthese
DE602004004818T2 (de) Audiosignalcodierung oder -decodierung
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
US8538766B2 (en) Audio decoder, audio object encoder, method for decoding a multi-audio-object signal, multi-audio-object encoding method, and non-transitory computer-readable medium therefor
DE102013223201B3 (de) Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
EP2143101B1 (de) Verfahren und vorrichtungen zur kodierung und dekodierung von mehrobjekt-tonsigalen mit mehrkanal
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
CN102037507A (zh) 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
EP3061088B1 (de) Dekorrelatorstruktur zur parametrischen rekonstruktion von audiosignalen
DE112021005087T5 (de) Kodierung und dekodierung für higher-order-ambisonics
KR20160101692A (ko) 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final