DE69700837T2 - System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignals - Google Patents
System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignalsInfo
- Publication number
- DE69700837T2 DE69700837T2 DE69700837T DE69700837T DE69700837T2 DE 69700837 T2 DE69700837 T2 DE 69700837T2 DE 69700837 T DE69700837 T DE 69700837T DE 69700837 T DE69700837 T DE 69700837T DE 69700837 T2 DE69700837 T2 DE 69700837T2
- Authority
- DE
- Germany
- Prior art keywords
- primary
- coding
- flow
- filter bank
- raster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title description 5
- 239000012634 fragment Substances 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die vorliegende Erfindung betrifft ein System zur Kodierung und Dekodierung eines Signals, insbesondere eines audionumerischen Signals. Diese Systeme finden Anwendung bei der Übertragung einer geringen Durchgangsmenge an Lautsignalen mit einer möglichst geringen erforderlichen Zeit für die Kodierung/Dekodierung, die beispielsweise durch die Rücksendung einer Kontrollstimme vorgegeben wird.
- Bei der Übertragung von numerischen Signalen, werden diese numerisch in einem Sender kodiert und sodann dekodiert, um in einem Empfänger wiederhergestellt zu werden. Die vorliegende Erfindung ist betroffen von dem Gegensatz zwischen einerseits der Suche nach einer Qualität der Übertragung, die im allgemeinen für eine festgelegte Durchgangsmenge eine relativ lange Zeit für die Kodierung und Dekodierung nach sich zieht, und andererseits der Zeit für die Kodierung/Dekodierung, die bei gewissen Anwendungen kurz sein soll.
- In der vorliegenden Beschreibung wird als Zeit für die Kondierung/Dekodierung die Zeitdauer bezeichnet, die zwischen dem Eintritt eines Musters in den Kodierer und dem Austritt des entsprechenden Musters aus dem Dekoder liegt. Um den besonderen Einsatz des Kodierverfahrens und/oder die Struktur der Schaltungen, die diese Kodierung ermöglichen, nicht berücksichtigen zu müssen, wird angenommen, dass die bei diesen Verfahren durchgeführten Berechnungen unendlich schnell sind, sowohl im Kodierer als auch im Dekoder. Bei der Berechnung der Zeit für die Kodierung/Dekodierung werden somit nur solche Parameter berücksichtigt, wie beispielsweise die Zeit für die Übernahme der numerischen Signalraster, die von einer Filterbank geforderte Zeit und/oder die Zeitdauer, die einem Mustermultiplexing entspricht.
- Im Falle eines Kodierers mit Transformierter ist diese Zeit grösser als die Zeitdauer eines kodierten Rasters, der zu der Verzögerung hinzugerechnet wird, die von der Transformierten erzeugt wird. Im Falle eines Kodierers geringer Verzögerung vom Typ LD-CELP, wie jenem, der von J. H. Chen et al. in dem Artikel mit dem Titel "A low delay CELP coder for the CCITT 16 kb/s speech coding standard" erschienen in IEEE J. Sel. Areas Commun., Band 10, Seiten 830-849, beschrieben wird, ist die Kodierzeit mit den fünf Mustern verbunden, die einen Basisraster bilden. Es ist anzumerken, dass ein Kodierschema eine Kodierzeit, ausgedrückt in Anzahl von Mustern, besitzt. Um davon einen zeitlichen Wert abzuleiten, muss die Frequenz der Musternahme berücksichtigt werden, mit der der Kodierer betrieben wird, nach dem Verhältnis:
- Zeitdauer = Kodierzeit in Mustern/Frequenz der Musternahme
- Was die Kodierqualität betrifft, ist diese ein schwer zu definierender Parameter, da der Endempfänger, d. h. das Ohr des Zuhörers, keine genauen quantitativen Ergebnisse angeben kann. Überdies sind die Messungen, wie jene des Signal- Lärm-Verhältnisses nicht stichhaltig, da sie nicht die Eigenschaften der psychoakustischen Überdeckung des auditiven Systems berücksichtigen. Statistische Techniken, wie jene, die durch das Gutachten ITU-R-BS-1116 empfohlen werden, ermöglichen es, verschiedene Kodieralgorithmen im Hinblick auf die Kodierqualität zu bestimmen.
- Es ist allerdings anzumerken, dass es eine Verbesserung des Signal-Lärm-Verhältnisses, die an der Gesamtheit der Frequenzen des Lautsignals vorgenommen wird, ermöglicht, eine Verbesserung der wahrgenommenen Qualität zu erreichen.
- Die Kodiersysteme von übergeordneten audionumerischen Signalen, d. h. ohne Annahme über die Art der Erzeugung dieser Signale, haben bisher nur wenige den Aspekt der Wiederherstellungszeit des Signals als zwingend angesehen. Eine Ausnahme wird allerdings durch das Verfahren aufgezeigt, das von F. Rumseyi in einem Artikel mit dem Titel "Hearing both sides-stereo sound for TV in the UK", erschienen in IEE rev., Band 36, Nr. 5, Seiten 173-176, beschrieben wird. Jedoch bei diesem Verfahren ermöglichen es die erreichten Kompressionen nicht, mit den herkömmlichen Kodierern mit Transformierter zu konkurrieren.
- Unter den Algorithmen, die nach ISO (ISO/IEC 13818-3) genormt sind, reichen die Mindestzeiten für die Wiederherstellung von 18 ms für den einfachsten - und somit am wenigsten wirksamen - Kodierer bis über 100 ms für den umfassendsten Kodierer. Weitere Kodierverfahren, die nicht nach ISO genormt sind, wie beispielsweise das sogenannte AC3-Verfahren, das von C. Todd et al. beschrieben wird, wie auch das sogenannte ASPEC-Verfahren (Adaptative Spectral Perceptual Entropy Coding), das von K. Brandeburg et al. beschrieben wird, oder das sogenannte ATRAC-Verfahren (Adaptative Transform Acoustic Coding), das von K. Tsutsui beschrieben wird, weisen typischerweise Kodier- /Dekodierzeiten von ungefähr hundert Millisekunden auf.
- Die Wirksamkeit von Kodiersystemen hängt mit der Grösse der Filterbanken, die im allgemeinen verwendet werden, mit der langfristigen Berücksichtigung der Redundanzen in den zu kodierenden Signalen, mit der optimalen Verteilung der Binärzuteilungen auf eine grössere Zeitdauer als der Raster, usw. zusammen. Die Berücksichtigung dieser Elemente zum Zeitpunkt der Kodierung führt zu einer Erhöhung der Kodier-/Dekodierzeit des Systems.
- Es ist anzumerken, dass die Kodierer geringer Verzögerung oft mit der Kodierung der Sprache für Duplextelefonverbin dungen beispielsweise oder für die Verbindung mit Echounterdrückern zusammenhängen. Sie sind meistens für Bemusterungsfrequenzen von 8 kHz bis 16 kHz ausgeführt, und ihr Qualitätsniveau reicht nicht aus, um übergeordnete audionumerische Signale ursprungsgetreu zu kodieren.
- Ziel der Erfindung ist es, in diesem Zusammenhang ein Kodiersystem und das zugehörige Dekodiersystem vorzuschlagen, das es auf der Empfängerseite ermöglicht, sowohl ein qualitativ hochwertiges audionumerisches Signal als auch ein audionumerisches Signal minderer Qualität wiederherzustellen, dessen Kodier-/Dekodierzeit allerdings möglichst gering ist.
- Ein solches Kodier--/Dekodiersystem ist bereits bekannt, und es ist der Vorabdruck 4132 der 99. Konvention AES von Oktober 1995 in New York zu nennen, in dem Bernhard Grill et al. hierarchische audionumerische Kodiersysteme beschreiben, d. h. deren Ausgangsbitfluss eine Bituntereinheit umfasst, die eine Dekodierung und eine Wiederherstellung eines bezeichnenden oder stichhaltigen Lautsignals ermöglichen kann, das jedoch eine geringe Qualität verglichen mit jener aufweist, die durch Dekodierung und Wiederherstellung aus einem Gesamtbitfluss erzielt wird.
- Solche Kodiersysteme umfassen einen Kodierer, um ein Lautsignal hoher Qualität zu kodieren, dessen Ausgang mit dem Eingang eines Dekoders verbunden ist, und eine Differenzschaltung, die die Differenz zwischen dem am Ausgang des Dekoders erhaltenen Signal und dem ursprünglichen Signal herstellt. Das Differenzsignal wird selbst in einer zweiten Stufe analogen Behandlungen des Kodierens, Dekodierens und der Differenzberechnung unterzogen. Die dritte Stufe kodiert das Restdifferenzsignal. Die aus den Kodierern der drei Stufen kommenden Signale werden nun gemultiplext, um einen hierarchischen numerischen Fluss zu bilden. Mehrere Ausführungsarten werden dargestellt, von denen eine an führt, dass in der ersten Stufe der Kodierer ein Kodierer mit geringer Bitdurchgangsmenge ist, der eine relativ kurze Kodierzeit aufweist. Der Kodierer der zweiten Stufe ist hingegen ein Kodierer mit längerer Kodierzeit.
- Mit einem solchen System sind somit drei gemultiplexte Flüsse in einem einzigen Ausgangsfluss vorhanden, wobei einer dieser Flüsse, der von dem Kodierer geringer Verzögerung erzeugt wird, eine geringe Kodierzeit und eine mindere Qualität aufweist, während die beiden anderen längere Kodierzeiten aufweisen, allerdings den Fluss von erforderlichen Informationen für eine Wiederherstellung guter Qualität liefern.
- Jedoch bei den von Bernhard Grill vorgestellten Systemen wird in Wirklichkeit jeder Kodierer von einer unterbemusterten Filterbank und einem Kodierer gebildet. Ebenso wird jeder Dekoder in Wirklichkeit von einem Dekoder und einer Filterbank gebildet, die mit der Filterbank des Kodierers verbunden ist und eine Überbemusterung durchführt. Es konnte festgestellt werden, dass die Verwendung solcher Kodierer und Dekoder in dieser besonderen Struktur zu einer noch relativ hohen Kodier-/Dekodierzeit für den Fluss geringer Qualität führt.
- Ziel der Erfindung ist es, ein Kodiersystem vorzuschlagen, das eine Kodier-/Dekodierzeit für den Fluss geringer Qualität aufweist, die kürzer ist als die des oben beschriebenen Systems.
- Zu diesem Zweck ist ein erfindungsgemässes Kodiersystem dadurch gekennzeichnet, dass es eine Filterbank, die dazu vorgesehen ist, den zu kodierenden eingehenden Fluss zu empfangen und Signale jeweils in unterschiedlichen Unterbändern der Kodierer, Primärkodierer genannt, zu erzeugen, um die Signale in Unterbändern zu kodieren und auf diese Weise Primärflüsse zu bilden, wobei Dekoder die Primär flüsse empfangen und diese Flüsse dekodieren, Subtrahierglieder, von denen jedes dazu vorgesehen ist, die Differenz zwischen den von der Filterbank in jedem Unterband gelieferten Signalen und den von dem entsprechenden Dekoder gelieferten Signalen zu erstellen, einen Kodierer, genannt Sekundärkodierer, um die Kodierung der von den Subtrahiergliedern gekommenen Signale durchzuführen und auf diese Weise einen Sekundärfluss zu erzeugen, und einen Multiplexer umfasst, um in einem einzigen Gesamtfluss die Primärflüsse, die von den Primärkodierern gekommen sind, und den Sekundärfluss, der von dem Sekundärkodierer gekommen ist, zu multiplexen.
- Es umfasst ferner eine zweite Filterbank, genannt Sekundärfilterbank, die an jedem ihrer Eingänge das Differenzsignal empfängt, das von jedem Subtrahierglied ausgegangen ist, und die einen gefilterten Fluss an den Eingang des Sekundärkodierers liefert. Die Sekundärfilterbank umfasst vorzugsweise für jedes Unterband einen Eingang, um den Primärfluss, der von dem Primärkodierer gekommen ist und von dem entsprechenden Dekoder dekodiert wurde, zu empfangen, um mit Hilfe eines psychoakustischen Modells die maximalen Lärmniveaus zu bestimmen, die in jedes der Unterbänder eingeleitet werden können, wobei der Sekundärkodierer ein Wahrnehmungskodierer ist, dessen Kodierung auf der psychoakustischen Analyse beruht, die von der Sekundärfilterbank durchgeführt wurde.
- Nach einer Ausführungsvariante der Erfindung umfasst die Sekundärfilterbank für jedes Unterband einen Eingang, um das Unterbandsignal, das von der Primärfilterbank gekommen ist, zu empfangen, um mit Hilfe eines psychoakustischen Modells die maximalen Lärmniveaus zu bestimmen, die in jedes der Unterbänder eingeleitet werden können, wobei der Sekundärkodierer ein Wahrnehmungskodierer ist, dessen Kodierung auf der psychoakustischen Analyse beruht, die von der Sekundärfilterbank durchgeführt wurde.
- Vorzugsweise ist jeder Primärkodierer ein bezüglich der Durchgangsmenge rekonfigurierbarer Kodierer.
- Die vorliegende Erfindung betrifft auch ein Mulitplexing- Verfahren eines Primärrasters mit einem Sekundärraster, die durch ein Kodiersystem eines zu kodierenden Signals erzeugt werden, das einen Gesamtfluss liefert, der von einem Primärfluss, der einer Kodierung des eingehenden Flusses, genannt Primärkodierung, entspricht, und einem Sekundärfluss gebildet wird, der einer Sekundärkodierung entspricht.
- Es besteht darin, einen Raster, genannt Gesamtraster, zu bilden, der von der Aneinanderkettung einer Mehrzahl von Primärrastern und einer Mehrzahl von Fragmenten von mindestens einem Sekundärraster gebildet wird, wobei ein Primärraster mit einem Sekundärrasterfragment abwechselt, wobei die Bitanzahl eines Sekundärrasterfragments gleich der dem Sekundärfluss zugeteilten Durchflussmenge ist, multipliziert mit der Emissionszeit eines Primärrasters. Die Emission der Gesamtraster erfolgt vorzugsweise während aller Zeitdauern der Primärraster. Ebenso ist die Dauer eines Gesamtrasters gleich der Emissionsdauer eines Primärrasters, multipliziert mit der Anzahl von Primärrastern.
- Die vorliegende Erfindung betrifft auch ein Dekodiersystem für einen durch ein Kodiersystem, wie oben beschrieben, kodierten Fluss. Es umfasst einen Flussmultiplexer, der eine Mehrzahl von Primärflüssen und einen Sekundärfluss liefert, eine Mehrzahl von Primärdekodern zur Dekodierung der Primärflüsse, wobei der Ausgang jedes Dekoders mit einem entsprechenden Eingang einer Primärfilterbank verbunden ist, die nun einen dekodierten Fluss geringer Verzögerung liefert, wobei der Ausgang jedes Dekoders ebenfalls mit einem Eingang einer entsprechenden Verzögerungsleitung verbunden ist, deren Ausgang mit dem ersten Eingang eines Summators verbunden ist, wobei ein Sekundärdekoder einen dekodierten Sekundärfluss liefert, der an einen zweiten Eingang jedes Summators geliefert wird, wobei der Ausgang jedes Summators mit dem Eingang einer zweiten Primärfilterbank verbunden ist, um einen dekodierten Fluss hoher Qualität zu liefern. Es umfasst ferner eine Sekundärfilterbank.
- Die oben erwähnten Merkmale der Erfindung, wie auch andere, gehen deutlicher aus der Studie der nachfolgenden Beschreibung eines Ausführungsbeispiels hervor, wobei sich die Beschreibung auf die beiliegenden Zeichnungen bezieht, wobei:
- Fig. 1 eine schematische Ansicht eines erfindungsgemässen Kodiersystems ist,
- Fig. 2 das Multiplexing-Verfahren darstellt, das in einem erfindungsgemässen Kodiersystem eingesetzt wird,
- Fig. 3 eine schematische Ansicht eines erfindungsgemässen Dekodiersystems ist.
- Das in Fig. 1 dargestellte Kodiersystem wird von einer Filterbank 10 gebildet, deren Eingag einen eingehenden, zu kodierenden audionumerischen Fluss FE empfängt. Die Filterbank 10 liefert mehrere Signale, die sich in unterschiedlichen Unterbändern, genannt Primärunterbänder, befinden. Diese Signale werden jeweils an die Eingänge von Primärkodierern geringer Durchflussmenge 20&sub1; bis 20&sub4; geliefert, von denen hier vier vorhanden sind, die aber auch in einer beliebigen Anzahl n grösser als zwei vorhanden sein können. Der Ausgang jedes Primärkodierers 20i (i = 1 bis n) ist einerseits mit einem entsprechenden Eingang eines Multiplexers 30 und andererseits mit dem Eingang eines Primärdekoders geringer Verzögerung 40i (i = 1 bis n) verbunden. Der Ausgang jedes Dekoders 40i ist mit einem ersten Eingang eines Subtrahiergliedes 50i verbunden, dessen anderer Eingang das Signal des entsprechenden Primärunterbandes empfängt, das von der Filterbank 10 geliefert wird. Das Differenzsignal, das von dem Subtrahierglied 5% gekommen ist, wird an den Eingang einer Sekundärfilterbank 60 geliefert, deren Ausgang mit einem Kodierer 70 verbunden ist. Der Ausgang des Kodierers 70 ist mit einem entsprechenden Eingang des Multiplexers 30 verbunden.
- Der Multiplexer 30 führt die Verflechtung der Primär- und Sekundärflüsse, die von den Kodierern 20 bzw. 70 gekommen sind, durch. Fig. 2 stellt das Verflechtungsverfahren dar.
- Es sind zwei Zeitachsen dargestellt, von denen eine in bezug auf die andere erweitert ist, wobei punktierte Linien die zeitliche Entsprechung zwischen diesen Achsen darstellen. Auf der ersten Achse sind Segmente dargestellt, deren Länge der Dauer für die Erstellung t eines Primärrasters entspricht, der durch Verbindung der vier Primärflüsse erhalten wird, die von den Kodierern 20&sub1; bis 20&sub4; gekommen sind. Auf der anderen Achse ist ein Gesamtraster TG dargestellt, der von einem Eingang H, von vier Primärrastern TP und vier Fragmenten eines Sekundärrasters FTS gebildet wird, wobei die Sekundärrasterfragmente FTS mit den Primärrastern TP abwechseln. Die Sekundärrasterfragmente FTS sind das Ergebnis einer Fragmentierung des Sekundärrasters TS, der von dem Sekundärkodierer 70 geliefert wird. Die Bitanzahl eines Fragments FTS ist gleich der Durchflussmenge, die dem Sekundärfluss zugeteilt wird, multipliziert mit der Emissionsdauer t der Primärkodierer.
- Es ist festzustellen, dass die Dauer Tt des Gesamtrasters TG ein ganzes Vielfaches der Dauer t des oben erwähnten Primärrasters ist (hier vier). Ebenso ist die Dauer Tt des Gesamtrasters TG ein ganzes Vielfaches der Dauer T des Sekundärrasters TS. Vorzugsweise ist die Dauer des Gesamtrasters Tt gleich der Dauer T eines Sekundärrasters TS. In diesem Fall befindet sich ein einziger Sekundärraster TS in dem Gesamtraster TG eingeschlossen, wie dies in Fig. 2 der Fall ist.
- Es ist anzumerken, dass die Anzahl von Primärrastern TP und die Anzahl von Sekundärrasterfragmenten TS des Gesamtrasters ungleich vier sein könnte, ohne das Konzept der Erfindung grundlegend zu verändern. Insbesondere ist diese Anzahl nicht mit der Anzahl von Unterbändern verbunden, die in einem Primärraster enthalten sind.
- Um die Kodier-/Dekodierzeit des Primärflusses zu verringern, erfolgt die Emission des Gesamtflusses auf alle Zeitdauern der Primärraster TP. Genauer entsprechen jeder Emission die Informationen eines Primärrasters TP und des nachfolgenden Sekundärrasterfragments FTS.
- Über die Dauer Tt des Gesamtrasters ist die binäre Durchflussmenge, die jedem Primärkodierer 20i zugeteilt wird, unterschiedlich. Diese Zuteilung ist für das Kodiersystem und für das Dekodiersystem bekannt. Beispielsweise kann die Zuteilung nach der Energie in jedem primären Unterband erfolgen.
- Die Kopfzeile H enthält ein Synchronisationswort, um das Dekodiersystem zu blockieren und die Zuteilungen der verschiedenen Primärkodierer 20i zu liefern. Diese Zuteilungen der Rasterkopfzeile, die von dem Kodiersystem ausgesandt werden, dienen nun zur Initialisierung des Dekodiersystems und zur Vermeidung möglicher Übertragungsfehler.
- Für jedes Unterband der Filterbank 10 umfasst die Filterbank 60 einen Eingang, um das betreffende Unterband zu empfangen, das von der Primärfilterbank 10 geliefert wird. Ausgehend von diesem Signal bestimmt ein geeignetes psychoakustisches Modell, beispielsweise das erste Modell, das von der Norm ISO/IEC 13818-3 vorgeschlagen wird, die maxi malen Lärmniveaus, die unhörbar in jedes der Sekundärunterbänder eingeleitet werden können.
- Der Kodierer 70 ist ein Wahrnehmungskodierer, dessen Kodierung auf der psychoakustischen Analyse basiert, die von der Filterbank 60 geliefert wird.
- Wenn der Fluss des Primärkodierers 2% über eine ausreichende Bitanzahl verfügt, beispielsweise über 2,5 Bits pro Muster, ist es vorzuziehen, das ursprüngliche Signal am Eingang der Filterbank für seine Bearbeitung nach dem psychoakustischen Modell in seiner kodierten und sodann dekodierten Form, die von dem Dekoder 4% in das betreffende Pirmärunterband geliefert wird, zu ersetzen. Der Vorteil besteht darin, dass der Sekundärdekoder des Dekodiersystems, das mit dem vorliegenden Kodiersystem verbunden und somit mit dem selben psychoakustischen Modell wie die Filterbank 60 versehen ist, die feinen Zuteilungsniveaus ableiten kann, die von dem Sekundärkodierer 70 berechnet wurden. Dies ermöglicht somit Einsparungen bei den Übertragungskosten.
- Die Primärfilterbank kann eine Filterbank der Familie der QMF (Quadrature Mirror Filterbank) oder Filterbänke vom Typ MOT (Modulated Orthogonal Transforms) mit einer ausreichend geringen Anzahl an Unterbändern sein, um keine zu grosse Verzögerungsfrist zu erzeugen. Eine Bank von zu Unterbändern ungleicher Breiten modulierten Filtern oder eine Bank von kaskadenartigen Filtern vom Typ mit Wellen oder sonstige sind auch möglich, unter der Voraussetzung, dass die Wahl mit der erforderlichen Zeit vereinbart ist. Eine Filterbank mit acht modulierten Unterbändern aus einem Filter mit einer Länge von zweiunddreissig, wie beispielsweise die von H. S. Malvar in einem Artikel mit dem Titel "Extended Lapped Transforms: Porperties, Applications, and Fast Algorithms", erschienen in IEEE Transactions on signal processing, Band 40, Nr. 11, Seiten 2703-2714 von Novem ber 1992 beschrieben, ist ein gutes Beispiel für eine Filterbank, die an das erfindungsgemässe System angepasst ist.
- Jeder Kodierer geringer Verzögerung 20i kann ein hinsichtlich der Durchflussmenge rekonfigurierbarer Kodierer sein, damit die mit jedem Unterband verbundene Durchflussmenge variabel ist. Jeder Kodierer 20i erzeugt einen Fluss an einer geringen Anzahl von zusammengefassten Mustern, die eine konstante, von dem Unterband unabhängige Zeitdauer darstellen. Diese Zeitdauer wird in der Folge Primärdauer genannt.
- Beispielsweise kann ein Kodierer vom Typ LD-CELP (Low Delay - Code Excited Linear Prediction) gewählt werden, wie beispielsweise jener, der von J. H. Chen et al. in einem Artikel mit dem Titel "A low delay CELP coder for the CCITT 16 kb/s speech coding standard", erschienen in IEEE J. Sel. Areas Commun., Band 10, Seiten 830-849 von Juni 1992 beschrieben wird. Dieser LD-CELP-Kodierer kann eine Auswahl von Wörterbüchern unterschiedlicher Grössen enthalten.
- Was jeden Dekoder 40i betrifft, ist anzumerken, dass er in den zugehörigen Kodierer 20i eingeschlossen sein könnte.
- Was die Sekundärfilterbank 60 betrifft, ist ihre Wahl viel freier als für die Primärfilterbank 10, insofern als keinerlei Erfordernis hinsichtlich der Verzögerung, die sie einleitet, geltend gemacht wird. Eine solche Filterbank kann eine variable Anzahl von Unterbändern pro Primärunterband liefern, und zwar je nach dem stationären Zustand des Signals im Unterband. Ferner ist es, um die Spektrenüberdeckungen der Primärfilterbank nicht berücksichtigen zu müssen, interessant, Aliasingreduktionsklappen zu verwenden, wie jene, die von B. Tang et al. in einem Artikel mit dem Titel "Spectral analysis of subband filtered signals", erschienen in ICAASP, Band 2, Seiten 1324-1327, 1995 beschrieben werden.
- Beispielsweise kann im Falle einer Primärfilterbank 10 mit acht Unterbändern für jedes der vier ersten Primärunterbänder eine Filterbank vom Typ MOT (Modulated Orthogonal Transforms) mit Mitteln, die je nach dem stationären Zustand des Signals die Umwandlung eines Längenfensters 128 oder 32, das 64 bzw. 16 Unterbänder erzeugt ermöglichen, und für die vier anderen Primärunterbänder eine Filterbank vom Typ MOT in 32 Unterbändern mit einer Länge 64 ausgewählt werden.
- Die für den Sekundärkodierer 70 verfügbare Durchflussmenge wird berechnet, indem die von den Primärkodierern geringe Verzögerung 20i verwendete Durchflussmenge von der Gesamtdurchflussmenge abgezogen wird. Beispielsweise können für eine Gesamtdurchflussmenge von 64 kbits/s 32 kbits/s der Gesamtheit der Primärkodierer 20&sub1; bis 20&sub4; und 32 kbits/s dem Sekundärkodierer 70 zugeteilt werden.
- Das in Fig. 3 dargestellte Dekodiersystem wird von Elementen gebildet, deren Bezugszeichen zwischen 110 und 180 liegen. Jedes Element ist das Paar eines Elements des in Fig. 1 dargestellten Kodiersystems, mit Ausnahme der Elemente 180i. Sein Bezugszeichen ist somit dasselbe, vergrössert um hundert. Als Beispiel ist der Demultiplexer 130 das Paar des Multiplexers 30.
- In der vorliegenden Beschreibung ist ein Element das Paar eines anderen Elements, wenn es dazu vorgesehen ist, die umgekehrte Funktion zu diesem ersten zu erfüllen.
- Das in Fig. 3 dargestellte Dekodiersystem wird von einem Demultiplexer 130 gebildet, dessen Ausgänge mit den Eingängen von Primärdekodern 120&sub1; bis 120&sub4; bzw. einem Sekundärkodierer 170 verbunden sind.
- Der Ausgang jedes Primärdekoders 120&sub1; bis 120&sub4; ist einerseits mit einer zugehörigen Verzögerungsleitung 180&sub1; bis 180&sub4; und andererseits mit einem Eingang einer ersten Primärfilterbank 110 verbunden. Der Ausgang der Filterbank 110 liefert den dekodierten Primärfluss Fd. Der dekodierte Primärfluss Fd ist der Fluss minderer Qualität, der jedoch eine geringere Kodier-/Dekodierzeit aufweist.
- Der Ausgang jeder Verzögerungsleitung 180&sub1; bis 180&sub4; ist mit einem ersten Eingang eines entsprechenden Summators 150&sub1; bis 150&sub4; verbunden.
- Der Ausgang des Sekundärdekoders 170 ist mit dem Eingang einer Filterbank 160 verbunden, deren Ausgänge jeweils mit den zweiten Eingängen der Summatoren 150&sub1; bis 150&sub4; sind.
- Schliesslich sind die Ausgänge der Summatoren 150&sub1; bis 150&sub4; jeweils mit den entsprechenden Eingängen einer Filterbank 110' verbunden, deren Ausgang den dekodierten Fluss hoher Qualität Fdhq liefert.
- Eine Verbindung zwischen jeder Verzögerungsleitung 1801 und dem Dekoder 170 ist derart vorgesehen, dass an letztgenannten zum gewünschten Zeitpunkt die Zuteilungsinformationen geliefert werden, die in dem Primärfluss vorhanden sind, der von dem entsprechenden Dekoder 120i kommt.
- Der Demultiplexer 130 des Dekodiersystems führt die Trennung des Gesamtrasters TG in Primärraster TP und in einen Sekundärraster durch, die abwechselnd an die Primärdekoder 120&sub1; bis 120&sub4; und an den Sekundärdekoder 170 geliefert werden. Der Ausgang geringer Verzögerung des Dekodiersystems wird erhalten durch Dekodieren der Primärraster in Unterbänder in den Primärdekodern 120i, sodann durch Überleitung in die reziproke Filterbank 110 der Filterbank mit geringer Verzögerung 10. In jedem der Unterbänder werden der Primärfluss, der von dem Primärdekoder 120i gekommen ist, sowie die Zuteilungsinformationen, die er enthält, in die entsprechende Verzögerungsleitung 180i geschickt, um den Teil hoher Qualität zu versorgen. Die Zuteilungsinformationen, die von den Verzögerungsleitungen gekommen sind, werden für jeden Primärfluss an den Sekundärdekoder 170 übertragen, der nun eine Dekodierung des Sekundärrasters durchführt. Sodann werden die reziproken Aliasingreduktionsklappen der Kodierklappen, sodann die Sekundärfilterbank 160 angelegt. Nun werden die von den Primärdekodern 120i gekommenen Signale über die Verzögerungsleitungen 180i angelegt, um die Primärfilterbank 110' zu versorgen. Am Ausgang wird das Signal hoher Qualität Fdhq erhalten.
Claims (10)
1. System zur Kodierung eines zu kodierenden Signals,
welches einen Gesamtfluß liefert, der von einem
primären Fluß, der einer Kodierung eines eingehenden
Flusses, Primärkodierung genannt, entspricht, und von
einem sekundären Fluß gebildet wird, der einer
Sekundärkodierung entspricht, wobei die Kodierzeit der
Primärkodierung kleiner ist als die der
Sekundärkodierung, dadurch gekennzeichnet, daß es eine Filterbank
(10), die dazu vorgesehen ist, den zu kodierenden
eingehenden Fluß (FE) zu empfangen und Signale jeweils in
unterschiedlichen Unterbändern der Kodierer,
Primärkodierer (20&sub1; bis 20&sub4;) genannt, zu erzeugen, um die
Signale in Unterbändern zu kodieren und auf diese
Weise Primärflüsse (TP) zu bilden, wobei Dekoder (40&sub1;
bis 40&sub4;) die Primärflüsse (TP) empfangen und diese
Flüsse dekodieren, Subtrahierglieder (50&sub1; bis 50&sub4;),
von denen jedes dazu vorgesehen ist, die Differenz
zwischen den von der Filterbank (10) in jedem
Unterband gelieferten Signalen und den von dem
entsprechenden Dekoder (40&sub1; bis 40&sub4;) gelieferten Signalen zu
erstellen, einen Kodierer (70), genannt
Sekundärkodierer, um die Kodierung der von den Subtrahiergliedern
(50&sub1; bis 50&sub4;) gekommenen Signale durchzuführen und auf
diese Weise einen Sekundärfluß (TS) zu erzeugen, und
einen Multiplexer (30) umfaßt, um in einem einzigen
Gesamtfluß (TG) die Primärflüsse (TP), die von den
Primärkodierern (20&sub1; bis 20&sub4;) gekommen sind, und den
Sekundärfluß (TS), der von dem Sekundärkodierer (70)
gekommen ist, zu multiplexen.
2. Kodiersystem nach Anspruch 1, dadurch gekennzeichnet,
daß es eine zweite Filterbank (60), genannt
Sekundärfilterbank, umfaßt, die an jedem ihrer Eingänge das
Differenzsignal empfängt, das von jedem
Subtrahierglied (50&sub1; bis 50&sub4;) ausgegangen ist, und die einen
gefilterten Fluß an den Eingang des Sekundärkodierers
(70) liefert.
3. Kodiersystem nach Anspruch 2, dadurch gekennzeichnet,
daß die Sekundärfilterbank (60) für jedes Unterband
einen Eingang umfaßt, um den Primärfluß (TP), der von
dem Primärkodierer (20&sub1; bis 20&sub4;) gekommen ist und von
dem entsprechenden Dekoder (40&sub1; bis 40&sub4;) dekodiert
wurde, zu empfangen, um mit Hilfe eines
psychoakustischen Modells die maximalen Lärmniveaus zu bestimmen,
die in jedes der Unterbänder eingeleitet werden
können, wobei der Sekundärkodierer (70) ein
Wahrnehmungskodierer ist, dessen Kodierung auf der
psychoakustischen Analyse beruht, die von der Sekundärfilterbank
(60) durchgeführt wurde.
4. Kodiersystem nach Anspruch 2, dadurch gekennzeichnet,
daß die Sekundärfilterbank (60) für jedes Unterband
einen Eingang umfaßt, um das Unterbandsignal, das von
der Primärfilterbank (10) gekommen ist, zu empfangen,
um mit Hilfe eines psychoakustischen Modells die
maximalen Lärmniveaus zu bestimmen, die in jedes der
Unterbänder eingeleitet werden können, wobei der
Sekundärkodierer (70) ein Wahrnehmungskodierer ist,
dessen Kodierung auf der psychoakustischen Analyse
beruht, die von der Sekundärfilterbank (60)
durchgeführt wurde.
5. Kodiersystem nach einem der vorhergehenden Ansprüche,
dadurch gekennzeichnet, daß jeder Primärkodierer (20&sub1;
bis 20&sub4;) ein bezüglich der Durchgangsmenge
rekonfigurierbarer Kodierer ist.
6. Multiplexing-Verfahren eines Primärrasters (TP) mit
einem Sekundärraster (TS), die durch ein Kodiersystem
eines zu kodierenden Signals erzeugt werden, das einen
Gesamtfluß liefert, der von einem Primärfluß, der
einer Kodierung des eingehenden Flusses, genannt
Primärkodierung, entspricht, und einem Sekundärfluß
gebildet wird, der einer Sekundärkodierung entspricht,
dadurch gekennzeichnet, daß es darin besteht, einen
Raster, genannt Gesamtraster (TG), zu bilden, der von
der Aneinanderkettung einer Mehrzahl von Primärrastern
(TP) und einer Mehrzahl von Fragmenten (FTS) von
mindestens einem Sekundärraster (TS) gebildet wird, wobei
ein Primärraster (TP) mit einem Sekundärrasterfragment
(FTS) abwechselt, wobei die Bitanzahl eines
Sekundärrasterfragments (FTS) gleich der dem Sekundärfluß (TS)
zugeteilten Durchflußmenge ist, multipliziert mit der
Emissionszeit eines Primärrasters (TP).
7. Multiplexing-Verfahren nach Anspruch 6, dadurch
gekennzeichnet, daß die Emission der Gesamtraster (TG)
während aller Zeitdauern der Primärraster (TP)
erfolgt.
8. Multiplexing-Verfahren nach Anspruch 6 oder 7, dadurch
gekennzeichnet, daß die Dauer eines Gesamtrasters (TG)
gleich der Emissionsdauer eines Primärrasters (TP),
multipliziert mit der Anzahl von Primärrastern (TP)
ist.
9. Dekodiersystem für einen durch ein Kodiersystem nach
einem der Ansprüche 1 bis 5 kodierten Fluß, dadurch
gekennzeichnet, daß es einen Flußdemultiplexer (130)
umfaßt, der eine Mehrzahl von Primärflüssen und
Sekundärflüssen liefert, und eine Mehrzahl von
Pirmärdekodern (120&sub1; bis 120&sub4;) zur Dekodierung der Primärflüsse
umfaßt, wobei der Ausgang jedes Dekoders (120&sub1; bis
120&sub4;) mit einem entsprechenden Eingang einer
Pirmärfilterbank (110) verbunden ist, die nun einen
dekodierten Fluß geringer Verzögerung (Fd) liefert, wobei
der Ausgang jedes Dekoders (120&sub1; bis 120&sub4;) ebenfalls
mit einem Eingang einer entsprechenden
Verzögerungs
leitung (180&sub1; bis 180&sub4;) verbunden ist, deren Ausgang
mit dem ersten Eingang eines Summators (150&sub1; bis 150&sub4;)
verbunden ist, wobei ein Sekundärdekoder (170) einen
dekodierten Sekundärfluß liefert, der an einen zweiten
Eingang jedes Summators (150&sub1; bis 150&sub4;) geliefert
wird, wobei der Ausgang jedes Summators (150&sub1; bis
150&sub4;) mit dem Eingang einer zweiten Primärfilterbank
(110') verbunden ist, um einen dekodierten Fluß hoher
Qualität (Fdqh) zu liefern.
10. Dekodiersystem nach Anspruch 9, dadurch
gekennzeichnet, daß es ferner eine Sekundärfilterbank (160)
umfaßt.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9604483A FR2747225B1 (fr) | 1996-04-03 | 1996-04-03 | Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique |
PCT/FR1997/000582 WO1997038417A1 (fr) | 1996-04-03 | 1997-04-02 | Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69700837D1 DE69700837D1 (de) | 1999-12-30 |
DE69700837T2 true DE69700837T2 (de) | 2000-07-20 |
Family
ID=9491074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69700837T Expired - Lifetime DE69700837T2 (de) | 1996-04-03 | 1997-04-02 | System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignals |
Country Status (5)
Country | Link |
---|---|
US (1) | US6058361A (de) |
EP (1) | EP0891617B1 (de) |
DE (1) | DE69700837T2 (de) |
FR (1) | FR2747225B1 (de) |
WO (1) | WO1997038417A1 (de) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6728344B1 (en) * | 1999-07-16 | 2004-04-27 | Agere Systems Inc. | Efficient compression of VROM messages for telephone answering devices |
DE60209888T2 (de) * | 2001-05-08 | 2006-11-23 | Koninklijke Philips Electronics N.V. | Kodieren eines audiosignals |
JP3855827B2 (ja) * | 2002-04-05 | 2006-12-13 | ソニー株式会社 | 2次元サブバンド符号化装置 |
US8352248B2 (en) * | 2003-01-03 | 2013-01-08 | Marvell International Ltd. | Speech compression method and apparatus |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
FI20065010A0 (fi) * | 2006-01-09 | 2006-01-09 | Nokia Corp | Häiriönvaimennuksen yhdistäminen tietoliikennejärjestelmässä |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4956871A (en) * | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
US5495552A (en) * | 1992-04-20 | 1996-02-27 | Mitsubishi Denki Kabushiki Kaisha | Methods of efficiently recording an audio signal in semiconductor memory |
-
1996
- 1996-04-03 FR FR9604483A patent/FR2747225B1/fr not_active Expired - Fee Related
-
1997
- 1997-04-02 US US09/155,168 patent/US6058361A/en not_active Expired - Lifetime
- 1997-04-02 WO PCT/FR1997/000582 patent/WO1997038417A1/fr active IP Right Grant
- 1997-04-02 DE DE69700837T patent/DE69700837T2/de not_active Expired - Lifetime
- 1997-04-02 EP EP97919457A patent/EP0891617B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0891617A1 (de) | 1999-01-20 |
US6058361A (en) | 2000-05-02 |
EP0891617B1 (de) | 1999-11-24 |
DE69700837D1 (de) | 1999-12-30 |
FR2747225B1 (fr) | 1998-04-30 |
WO1997038417A1 (fr) | 1997-10-16 |
FR2747225A1 (fr) | 1997-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0910928B1 (de) | Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion | |
DE19730129C2 (de) | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals | |
EP1025646B1 (de) | Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms | |
DE19549621B4 (de) | Vorrichtung zum Codieren von Audiosignalen | |
EP0290581B1 (de) | Verfahren zum übertragen digitalisierter tonsignale | |
DE19730130C2 (de) | Verfahren zum Codieren eines Audiosignals | |
DE69429499T2 (de) | Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium | |
DE69833834T2 (de) | Skalierbares Audiokodier-und Dekodierverfahren und Gerät | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE602004005846T2 (de) | Audiosignalgenerierung | |
DE4320990B4 (de) | Verfahren zur Redundanzreduktion | |
DE60206390T2 (de) | Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate | |
DE602004010188T2 (de) | Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal | |
DE60117471T2 (de) | Breitband-signalübertragungssystem | |
DE69533500T2 (de) | Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten | |
EP1230827B1 (de) | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals | |
DE60319590T2 (de) | Verfahren zur codierung und decodierung von audio mit variabler rate | |
EP1016319B1 (de) | Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals | |
DE3115859A1 (de) | Codierverfahren und -vorrichtung fuer adpcm | |
EP0611516B1 (de) | Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle | |
DE102004043521A1 (de) | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes | |
EP0642719B1 (de) | Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer voneinander abhängiger kanäle | |
EP1023777B1 (de) | Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms | |
DE102006055737A1 (de) | Verfahren zur skalierbaren Codierung von Stereo-Signalen | |
DE69028434T2 (de) | System zur Codierung von Breitbandaudiosignalen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |