DE69116476T2 - Digitaler Signalverschlüssler - Google Patents

Digitaler Signalverschlüssler

Info

Publication number
DE69116476T2
DE69116476T2 DE69116476T DE69116476T DE69116476T2 DE 69116476 T2 DE69116476 T2 DE 69116476T2 DE 69116476 T DE69116476 T DE 69116476T DE 69116476 T DE69116476 T DE 69116476T DE 69116476 T2 DE69116476 T2 DE 69116476T2
Authority
DE
Germany
Prior art keywords
frequency
noise level
encoder according
band
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69116476T
Other languages
English (en)
Other versions
DE69116476D1 (de
Inventor
Kenzo Akagiri
Kyoya Tsutsui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of DE69116476D1 publication Critical patent/DE69116476D1/de
Publication of DE69116476T2 publication Critical patent/DE69116476T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3053Block-companding PCM systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf digitale Signalcodierer. Um wirksam Audiosignale oder dergleichen zu codieren, gibt es Codierungsverfahren, die auf einer Bitzuordnung basieren, wobei ein Eingangsaudiosignal in Signalkomponenten von mehreren Kanälen über der Zeitachse oder der Frequenzachse aufgeteilt und wobei die Anzahl der Bits adaptiv den entsprechenden Kanälen zugeteilt wird. Beispielsweise gibt es ein Codierungsverfahren, beispielsweise eine Bandteilungscodierung (Sub-Band-Codierung: SBC), um ein Audiosignal über der Zeitachse in Signalkomponenten in mehrere Frequenzbänder aufzuteilen, um ihre Codierung durchzuführen; eine adaptive Transformations-Codierung (ATC), um ein Signal über der Zeitachse in ein Signal über der Frequenzachse zu transformieren (Orthogonal-Transformation), um dadurch dieses Signal adaptiv in Signalkomponenten in mehrere Frequenzbänder aufzuteilen, um eine Codierung in den jeweiligen Bändern auszuführen; eine adaptive Bitzuteilung (APC-AB), bei der die SBC- und die adaptive vorhersagecodierung (APC) miteinander kombiniert werden, um ein Signal über der Zeitachse in Signalkomponenten in mehrere Bändern aufzuteilen, um Signalkomponenten in entsprechenden Bändern in ein Basisband (Niederfrequenzband) zu transformieren, um anschließend eine Reihen- vorhersageanalyse auszuführen; und dergleichen.
  • Es sind wirksame Codierungsverfahren angestrebt worden, bei denen die verdeckungseigenschaft des Gehörs eines Menschen in Erwägung gezogen wurden. Der verdeckungseffekt ist das Phänomen, daß ein Signal durch ein anderes Signal verdeckt wird, so daß es nicht gehört werden kann. Der verdeckungseffekt kann über der Zeitachse oder über der Frequenzachse auftreten.
  • Das Verdeckungs-Phänomen über der Frequenzachse be steht in dem Effekt, daß eine Signalkomponente in einem Freguenzband durch eine Signalkomponente in dem anderen Frequenzband überdeckt wird, so daß die frühere Signalkomponente nicht gehört werden kann. Als verdeckungseffekt über der Zeitachse gibt es den zeitlichen Verdeckungseffekt und den gleichzeitigen Verdeckungseffekt. Der gleichzeitige Verdeckungseffekt ist der Effekt, daß ein leiser Ton, der gleichzeitig mit einem lauten Ton auftritt, durch den lauten Ton übergedeckt wird, so daß er nicht gehört werden kann. Der zeitliche Verdeckungseffekt ist der Effekt, daß leise Töne, die einem lauten Ton vorhergehen oder diesem folgen, durch den lauten Ton überdeckt werden, so daß sie nicht gehört werden können. Das zeitlich rückwärtige Verdecken durch den lauten Ton wird als Vorwärtsverdeckung bezeichnet, und das zeitlich voreilende Verdecken durch den lauten Ton wird als Rückwärtsverdeckung bezeichnet. Bei der zeitlichen Verdeckung ist vom Standpunkt des menschlichen Gehörs der Effekt der Vorwärtsverdeckung eine lange Zeit wirksam (beispielsweise ungefähr 100 ms), während der Effekt der Rückwärtsverdeckung für eine kurze Zeit wirksam ist (beispielsweise ungefähr 5 ms). Außerdem beträgt der Pegel des Verdeckungseffekts ungefähr 20 dB für die Vorwärtsverdeckung, und er beträgt ungefähr 30 dB für die Rückwärtsverdeckung. Wie oben festgestellt wurde, kann, da der Ton, der einer Verdeckung unterworfen wurde, nicht gehört werden kann, sogar wenn die Anzahl der Bits, die für die Quantisierung einer verdeckten Signalkomponente zugeteilt werden, bei einer Quantisierung eines Audiosignais reduziert wird, eine wahrgenommene Störung vernachlässigt werden.
  • Aus der EP-A 0 193 143 ist ein digitaler Signalcodierer bekannt, bei dem das Audiosignal durch eine Analog-Digital-Umwandlung verarbeitet wird, in Fenster eingeteilt wird, d.h., Abtasten von 20 ms-Blöcken, Vorverarbeitung durch schnelle Fourier-Transformationsanalyse des Frequenzspektrums, und Codieren entsprechend von psycho-akustischen Gesichtspunkten, d.h., irrelevante Frequenzkomponenten werden entsprechend gewichtet oder mittels eines Computers ausgeschieden.
  • Für ein wirksameres Codieren muß die Bitkompressionsrate vergrößert werden. Um jedoch allgemein eine Bitkompression durchzuführen, bei der von dem Verdeckungseffekt Gebrauch gemacht wird, kann nur der Verdeckungseffekt bei Signalen über der Frequenzachse oder der Verdeckungseffekt bei Signalen über der Zeitachse verwendet werden.
  • Um weiter die Bitrate im Hinblick auf den Verdeckungseffekt auf der Zeitachse zu reduzieren, ist es wünschenswert, den Verdeckungseffekt auf der Zeitachse effektiv zu verwenden, damit die Verarbeitungszeit-Blocklänge lang werden kann. Damit wird jedoch eine Sofortverarbeitung schwierig.
  • Erfindungsgemäß wird ein digitaler Signalcodierer bereitgestellt, mit:
  • einer ersten Frequenzanalyseeinrichtung vom Nicht- Block-Typus, um eine Frequenzanalyse eines digitalen Eingangssignals durchzuführen;
  • einer zweiten Frequenzanalyseeinrichtung vom Blocktypus, um weiter eine Frequenzanalyse von Frequenzkomponenten durchzuführen, die durch die erste Frequenzanalyseeinrichtung analysiert wurden;
  • einer ersten Rauschpegel-Einstelleinrichtung, um einen ersten zulässigen Rauschpegel auf der Basis der Energie von jeder Frequenzkomponente innerhalb einer vorgegebenen Zeitperiode von Ausgangssignalen der zweiten Frequenzanalyseeinrichtung einzustellen;
  • einer zweiten Rauschpegel-Einstelleinrichtung, um einen zweiten zulässigen Rauschpegel jeder Frequenzkomponente innerhalb der vorgegebenen Zeitperiode auf der Basis der Energie von zumindest einem der Datenwörter, die zeitlich vorhergehen, und von Daten, die zeitlich folgen, von Ausgangssignalen von der zweiten Frequenzanalyseeinrichtung einzustellen; und
  • einer Quantisierungseinrichtung, um ein Ausgangssignal von der zweiten Frequenzanalyseeinrichtung zu quantisieren;
  • wobei die Quantisierungscharakteristik der Quantisierungseinrichtung auf der Basis der Ausgangssignale von der ersten und zweiten Rauschpegel-Einstelleinrichtung eingestellt wird.
  • Durch die Ausführungsformen der Erfindung wird ein digitaler Signalcodierer bereitgestellt, mit dem eine Sofortverarbeitung durchgeführt werden kann, wobei die Störung bezüglich der Tonqualität klein ist, wobei wirksam sowohl der Verdeckungseffekt in bezug auf die Signale über der Frequenzachse als auch der Verdeckungseffekt in bezug auf die Signale über der Zeitachse verwendet wird, so daß die Bitrate vermindert werden kann.
  • Die Erfindung wird nun durch ein Ausführungsbeispiel unter Bezugnahme auf die Zeichnungen beschrieben, wobei gleiche Teile durchwegs mit den gleichen Bezugszeichen versehen sind, und bei denen:
  • Fig. 1 ein Diagramm eines digitalen Signalcodierers nach der Erfindung ist;
  • Fig. 2 eine Blockschaltung einer Filterbank ist;
  • Fig. 3 eine graphische Darstellung ist, um Blöcke und vorgegebene Zeitperioden bei der Ausführungsform zu erklären;
  • Fig. 4 eine graphische Darstellung ist, die das Randspektrum zeigt;
  • Fig. 5 eine Schaltungsanordnung ist, die eine Filterschaltung zeigt;
  • Fig. 6 eine graphische Darstellung ist, die ein Verdeckungsspektrum zeigt; und
  • Fig. 7 eine graphische Darstellung ist, bei der die minimale hörbare Kurve und das Verdeckungsspektrum durch Synthese hergestellt sind.
  • Eine Ausführungsform eines digitalen Signalcodierers weist, wie in Fig. 1 gezeigt ist, eine Filterbank 10 auf, die als erste Frequenzanalyseeinrichtung vom Nicht-Block-Typus dient, um die Frequenzanalyse eines digitalen Eingangssignals durchzuführen, das zu einem Eingangsanschluß 1 geliefert wird, schnelle Fourier-Transformationsschaltungen (FFT) 20, und 60, die als zweite Frequenzanalyseeinrichtung vom Block-Typus dienen, um weiter die Frequenzanalyse der Frequenzkomponenten durchzuführen, die durch die Filterbank 10 analysiert wurden, und Quantisierungsschaltungen 29, 49 und 69, um entsprechende Ausgangssignale (FFT-Koeffizientendaten) von den FFT-Schaltungen 20, 40, 60 zu quantisieren. Eine Verdeckungsspektrum-Berechnungsschaltung 75 dient als erste Rauschpegel-Einstelleinrichtung, um einen ersten zulässigen Rauschpegel auf der Basis der Energie der entsprechenden Frequenzkomponenten innerhalb vorgegebener Zeitperioden (beispielsweise von Zeitperioden B1 bis B3... von Fig. 31 die später beschrieben werden) der Ausgangssignale der FFT-Schaltungen 20, 40 und 60 einzustellen; und Zeitperiodenverzögerungsschaltungen 23, 43 und 63, Syntheseschaltungen 50 und 70, eine 5-ms-Verzögerungsschaltung (DL) 51, 2,5-ms-Verzögerungsschaltungen 71, 72 und 73, eine Auswahlschaltung 52, eine Synthese/Auswahlschaltung 74, und Wichtungssyntheseschaltungen 24, 44 und 64 dienen als zweite Rauschpegel-Einstelleinrichtungen, um zweite zulässige Rauschpegel von entsprechenden Frequenzkomponenten für die bestimmte Zeitperioden auf der Basis einer Energie von zumindest einer der Daten einzustellen, die zeitlich vorhergehen, und von Daten, die zeitlich nach der vorgegebenen Zeitperiode liegen, um somit die Quantisierungsschaltungen 29, 49 und 69 auf der Basis der Ausgangssignale der ersten und zweiten Rauschpegel- Einstelleinrichtung einzustellen. Die Filterbank 10 enthält eine Bandteilungseinrichtung, um das digitale Eingangssignal in Signalkomponenten in mehrere Frequenzbänder aufzuteilen (bei dieser Ausführungsform drei Frequenzbänder), wobei sie zumindest ein Filter aufweist (beispielsweise ein Spiegelfilter, das als sogenanntes QMF bezeichnet wird). Die FFT-Schaltungen 20, 40 und 60 führen die schnelle Fourier-Transformation der Signale blockweise durch. Die Bandteilungseinrichtung (Filterbank 10) führt eine Teilung so aus, daß die Bandbreite größer wird, wenn sich das Frequenzband zu einer höheren Frequenz verschiebt. Die FFT-Schaltungen 20, 40 und 60 führen eine Verarbeitung derart durch, daß die Blockzeitlänge, wo die schnelle Fourier-Transformationsverarbeitung durchgeführt wird, kleiner wird, wenn sich das Frequenzband zu einer höheren Frequenz verschiebt. Somit wird zumindest ein Datenwort in der zweiten Rauschpegel-Einstelleinrichtung zu Daten, die zeitlich vorher liegen. Außerdem setzt die zweite Rauschpegel-Einstelleinrichtung den zweiten Rauschpegel auf der Basis der Datenenergie, die die gleiche hinsichtlich der Frequenzkomponenten ist, für Perioden, die zeitlich verschieden sind. Ein Ausgangssignal vom Codierer wird von einem Ausgangsanschluß 2 hergeleitet.
  • Ein digitales Eingangsaudiosignal von 0 (DC) bis 22 khz, das durch Abtasten erhalten wird, beispielsweise mit einer Abtastfrequenz fs = 44,1 khz, wird zum Eingangsanschluß 1 und anschließend zur Filterbank 10 geliefert. Die Filterbank 10 besitzt, wie in Fig. 2 gezeigt ist, zwei QMF-Stufen 11 und 12, die kaskadenförmig miteinander verbunden sind. Das digitale Eingangsaudiosignal wird zum QMF 11 geliefert, das dieses in Signalkomponenten in zwei Frequenzbänder aufteilt, die sich bei 11 kHz treffen. Somit werden Ausgangssignale in den Frequenzbändern von 0 bis 11 kHz und von 11 bis 22 khz vom QMF 11 bereitgestellt. Das Ausgangssignal von 11 bis 22 kHz wird zur FFT-Schaltung 60 über einen Anschluß 13 gehefert. Andererseits wird das Ausgangssignal von 0 bis 11 khz zum QMF 12 geliefert, welches ein Eingangssignal in Signalkomponenten in zwei Frequenzbänder aufteilt, die sich bei 5,5 kHz treffen. Folglich werden Ausgangssignale in den Frequenzbändern von 0 bis 5,5 kHz und von 5,5 bis 11 kHz vom QMF 12 bereitgestellt. Das Signal von 5,5 bis 11 kHz wird zur FFT- Schaltung 40 über einen Anschluß 14 geliefert, und das Signal von 0 bis 5,5 kHz wird zur FFT-Schaltung 20 über einen Anschluß 15 geliefert. Somit wird in der Filterbank 10, die als erste Frequenzanalyseeinrichtung dient, ein digitales Toneingangssignal in Signalkomponenten in drei Frequenzbänder nicht blockweise aufgeteilt, so daß die Bandbreite größer wird, wenn das Frequenzband sich zu einer höheren Frequenz verschiebt. Es wird festgestellt, daß, obwohl das Filter mehrere QMFs im Beispiel von Fig. 2 aufweist, ein Aufbau verwendet werden kann, bei dem Bandfilter verwendet können.
  • In der FFT-Schaltung 20, die mit einem Signal im Freguenzband von 0 bis 5,5 kHz von der Filterbank 10 beliefert wird, wird das Signal in Signalkomponenten in Form von Blökken von jeweils 10 ms geteilt, um die FFT-Verarbeitung blockweise auszuführen. In der FFT-Schaltung 40, die mit einem Signal im Frequenzband 5,5 bis 11 kHz beliefert wird, wird die FFT-Verarbeitung blockweise alle 5 ms ausgetührt. In der FFT-Schaltung 60, die mit einem Signal im Frequenzband 11 bis 22 kHz beliefert wird, wird die FFT-Verarbeitung blockweise alle 2,5 ms durchgeführt. Somit wird in den FFT-Schaltungen 20, 40 und 60, die als zweite Frequenzanalyseeinrichtung dienen, die Verarbeitung so durchgeführt, daß die Blocklänge, die der FFT-Schaltung unterworfen wird, kleiner wird, wenn das Frequenzband sich zu einer höheren Frequenz verschiebt. Wie oben ausgeführt ist bei dieser Ausführungsform bei der Bildung von Blöcken in den jeweiligen FFT-Schaltungen 20, 40 und 60 die Blockzeitlänge kleiner in einem höheren Frequenzband, wodurch die Zeitauflösung im höheren Frequenzband hoch und die Zeitauflösung im niedrigeren Frequenzband niedrig sein kann, um die Anzahl der Abtastung innerhalb eines Blocks zu steigern, damit die Frequenzauflösung hoch sein kann. Da weiter übliche Audiosignale kurze bleibende Perioden im hohen Frequenzband besitzen, ist es zweckmäßig, daß die Zeitauflösung in einem Hochfrequenzband hoch ist, wie oben beschrieben wurde. Da weiter die Frequenzauflösung des menschlichen Gehörs im allgemeinen hoch in einem Niederfrequenzband ist, ist es weiter zweckmäßig, daß die Frequenzauflösung in einem Niederfrequenzband hoch wird, wie oben beschrieben wurde.
  • Der Verarbeitungs-Zeitblock durch die Filterbank 10 und der entsprechenden FFT-Schaltungen 20, 40 und 60 ist in Fig. 3 gezeigt. Folglich ist in Fig. 3 die Bandteilung und die entsprechenden Verarbeitungseinheiten (Blöcke) der FFT usw. gezeigt, und die entsprechenden Blöcke sind mit drei Parametern p, q und r bezeichnet, die durch b (p, g, r) in der Figur gezeigt sind, wobei p die abgelaufene Zeit darstellt, q ein Band darstellt und r einen Zeitblock darstellt. In Fig. 3 ist angedeutet, daß ein Zeitblock in jedem Band eine Zeitdauer (Zeitauflösung) von 10 ms im Niederfrequenzband von 0 bis 5,5 kHz hat. Es ist weiter angedeutet, daß eine Blockzeitlänge von 5 ms im Mittelfrequenzband von 5,5 bis 11 kHz vorhanden ist, und daß eine Blockzeitlänge von 2,5 ins im Hochfrequenzband von 11 bis 22 kHz vorhanden ist.
  • Die FFT-Koeffizientendaten von jedem Band, die durch FFT-Verarbeitung in den FFT-Schaltungen 20, 40 und 60 erhalten werden, werden zu Quantisierungsschaltungen 29, 49 und 69 geliefert, wo sie quantisiert werden. Dabei wird beispielsweise in jeder entsprechenden vorgegebenen Zeitperiode B1 bis B3 von Fig. 3 eine Quantisierungsverarbeitung durchgeführt. Bei dieser Quantisierung wird eine adaptive Quantisierung durchgeführt, bei der die Quantisierungscharakteristik (Bitzuteilung) der Quantisierung auf der Basis der Ausgangssignale von der ersten und zweiten Rauschpegel-Einrichtung geändert wird, die bei der Betrachtung des Verdeckungseffekts in bezug auf die Signale über der Frequenzachse erhalten werden, und des Verdeckungseffekts in bezug auf die Signale über der Zeitachse, was später beschrieben wird. Es sei hier angemerkt, daß die entsprechenden vorgegebenen Zeitperioden B1 bis B3... auf 10 ms eingestellt werden, welches die Mmimaleinheit zur Verarbeitung in der FFT-Schaltung 20 ist.
  • Der erste und zweite zulässige Rauschpegel zur Durchführung einer derartigen adaptiven Quantisierung wird in der Praxis wie folgt festgelegt.
  • Ausgangsdaten der FFT-Schaltungen 20, 40 und 60 werden weiter in Daten in sogenannte Grenzbänder aufgeteilt. Das Grenzband, das hier erwähnt wurde, ist ein Band, bei dem das menschliche Gehör in Betracht gezogen wird. Insbesondere, wenn ein reiner Ton durch ein nahes Bandrauschen überdeckt wird, der die gleiche Intensität hat, einschließlich einer Höhe des reinen Tons, bezieht sich das Grenzband auf ein Bandrauschen derart, daß die Bandbreite breiter wird, wenn sich das Frequenzband zu einer höheren Frequenz verschiebt. Bei dieser Ausführungsform wird eine solche Grenzbandteilung dadurch ausgeführt, um es zu gestatten, daß die Bandbreite breiter wird, wenn sich das Frequenzband zu einer höheren Frequenz verschiebt, um somit das in Betracht gezogene Band beispielsweise in 25 Bänder zu unterteilen. Um dies auszuführen, werden Ausgangsdaten (Frequenzband 0 bis 5,5 kHz) von der Ausgangsschaltung 20 weiter in Daten in beispielsweise 20 Bändern auf der Seite des Niederfrequenzbandes des Grenzbandes durch die Grenzband-Teilungsschaltung 21 aufgeteilt. Darüber hinaus werden die Ausgangsdaten (5,5 11 kHz) von der FFT-Schaltung 40 weiter in Daten in beispielsweise drei Bändern in einem Mittelfrequenzband des Grenzbandes durch die Grenzband-Teilungsschaltung 41 unterteilt. Außerdem werden die Ausgangsdaten (11 bis 22 kHz) von der FFT-Schaltung 60 außerdem in Daten beispielsweise in zwei Bänder in einem Hochfrequenzband des Grenzbandes durch die Grenzband-Teilungsschaltung 61 unterteilt.
  • Die Ausgangssignale von den Grenzband-Teilungsschaltungen 21, 41 und 61 werden zu Energieermittlungsschaltungen 22, 42 bzw. 62 geliefert. In den jeweiligen Energieermittlungsschaltungen 22, 42 und 62 wird die Energie (Spektrumsintensität in den entsprechenden Bändern) der Daten für jeden entsprechenden Zeitblock und die entsprechenden Grenzbänder in den FFT-Schaltungen 20, 40 und 60 bestimmt, indem beispielsweise eine Gesamtsumme von Amplitudenwerten in den entsprechenden Bändern genommen wird (die Spitze oder der Durchschnitt des Amplitudenwerts, oder die Gesamtenergie). Die Ausgangssignale von den Energieermittlungsschaltung 22, 42 und 62, d.h., das Spektrum der Gesamtsumme für jedes entsprechende Grenzband wird allgemein als Randspektrum bezeichnet. Das Randspektrum SB in jedem Band ist beispielsweise in Fig. 4 gezeigt. Es sei angemerkt, daß das oben erwähnte Grenzband durch 12 Bänder dargestellt wurde, um die Erklärung in Fig. 4 abzukürzen.
  • Damit man den Einfluß des Verdeckens über der Frequenzachse des Randspektrums SB erkennt, wird eine vorgegebene Wichtungsfunktion auf das Bandspektrum SB gefaltet. Um dies zu realisieren, werden die Ausgangssignale von der Energieermittlungsschaltung 22, 42 und 46, d.h., die entsprechenden Werte des Randspektrums SB zur Verdeckungsspektrum-Berechnungsschaltung 75 geliefert, die als erste Rauschpegel- Einstelleinrichtung dient. Die Verdeckungsspektrums-Ermitt lungsschaltung 75 enthält eine Filterschaltung 76, eine Funktionserzeugungsschaltung 77, einen Subtrahierer 78 und eine Teilungseinrichtung 79, die den Energieermittlungsschaltungen 22, 42 und 62 jeweils entsprechen. Demnach werden die Ausgangssignale von den Energieermittlungsschaltungen 22, 42 und 62 zur Filterschaltung 76 geliefert. Die Filterschaltung 76 besteht, wie in Fig. 5 gezeigt ist, beispielsweise aus Verzögerungselementen (Z&supmin;¹) ... 101m-3 bis 101m+3..., um die Eingangsdaten der Reihe nach zu verzögern, aus Multiplizierern ...102m-3 bis 102m+3 .., um die Ausgangssignale aus den entsprechenden Verzögerungselementen mit einem Filterkoeffizienten (Wichtungsfunktion) zu multiplizieren, sowie einem Gesamtsummenaddierer 104. Dabei wird in den jeweiligen Multiplizierern 102m-3 bis 102m+3 die Faltungsverarbeitung des Randspektrums SB wie folgt durchgeführt. Beispielsweise werden im Multiplizierer 102m-3 die Ausgangssignale von den entsprechenden Verzögerungselementen mit dem Filterkoeffizienten von 0,0000086 multipliziert; im Multiplizierer 102m-2 werden diese Ausgangssignale mit dem Filterkoeffizienten 0,0019 multipliziert; im Multiplizierer 102m-1 werden diese Ausgangssignale mit dem Filterkoeffizienten von 0,15 multipliziert; im Multiplizierer 102m werden diese Ausgangssignale mit dem Filterkoeffizienten 1 multipliziert; im Multiplizie rer 102m-1 werden diese Ausgangssignale mit dem Filterkoeffizienten von 0,4 multipliziert; im Multiplizierer 102m+2 werden diese Ausgangssignale mit dem Filterkoeffizienten von 0,06 multipliziert und im Multiplizierer 102m+3 werden diese Ausgangssignale mit dem Filterkoeffizienten von 0,007 multipliziert. Durch oben erwähnte Faltungsverarbeitung wird die Gesamtsumme der Bereiche, die durch die gestrichelten Linien in Fig. 4 angedeutet sind, die durch den Addierer 104 addiert werden, genommen. Die somit bereitgestellte Gesamtsumme wird am Ausgangsanschluß 105 abgegeben.
  • In der Zwischenzeit wird bei einem Pegel a, der dem ersten zulässigen Rauschen beim Berechnen des Verdeckungsspektrums des Randspektrums SB (zulässiges Rauschspektrum) entspricht, wenn der Pegel a klein ist, das Verdeckungsspektrum (Verdeckungskurve) in bezug auf Signale auf der Frequenzbasis abgesenkt. Als Folge davon muß die Anzahl der Bits, die einer Quantisierung in den Quantisierungsschaltungen 29, 49 und 69 zugeteilt wurden, erhöht werden. Wenn im Gegensatz dazu der oben erwähnte Pegel a groß ist, wird das Verdeckungsspektrum erhöht. Als Folge davon kann die Anzahl der Bits, die einer Quantisierung zugeteilt werden, verringert werden. Es sei darauf hingewiesen, daß der Pegel a, der dem ersten zulässigen Rauschpegel entspricht, sich auf einen solchen Pegel bezieht, der einen ersten zulässigen Rauschpegel in jedem Band des kritischen Bandes zur Folge hat, wobei die Auseinanderfaltungsverarbeitung wie später beschrieben durchgeführt wird. Darüber hinaus ist allgemein bei Audiosignalen usw. die Spektrumsintensität (Energie) im hohen Frequenzbandbereich klein. Folglich wird bei dieser Ausführungsform ein Verfahren aufgegriffen, das die obigen Umstände in Betracht zieht, wobei es dem Pegel a erlaubt wird, daß er größer wird, wenn das Frequenzband sich zu einer höheren Frequenz verschiebt, wo die Energie klein ist, um somit die Anzahl der Bits zu verringern, die im Hochfrequenzbandbereich zugeteilt werden. Vom obigen Standpunkt aus wird in der Verdeckungsspektrums-Berechnungsschaltung 75 der oben erwähnte Pegel a in bezug auf die gleiche Energie auf einen höheren Wert eingestellt, wenn die Frequenz höher wird.
  • Somit wird beim Codierer nach dieser Ausführungsform die Annäherung verwendet, den Pegel a zu berechnen, der einem ersten zulässigen Rauschpegel entspricht, um eine Steuerung derart auszuführen, daß der Pegel a hoch wird, wenn das Frequenzband sich zu einer höheren Frequenz verschiebt. Um dieses zu realisieren wird ein Ausgangssignal von der Filterschaltung 76 zum Subtrahierer 78 geliefert, der dazu dient, den Pegel a im gefalteten Bereich zu bestimmen. Hier wird eine zulassige Funktion (eine Funktion, die den Verdeckungspegel darstellt) zur Festlegung des Pegels a zum Subtrahierer 78 geliefert. Durch Erhöhen oder Erniedrigen der zulässigen Funktion wird die Steuerung des Pegels a durchgeführt. Diese zulässige Funktion wird von der Funktionserzeugungsfunktionsbaugruppe 77 geliefert.
  • Wenn die Zahl, die nacheinander vom Niederfrequenzband des kritischen Bandes gegeben wird, als 1 angenommen wird, kann der Pegel a entsprechend dem zulässigen Rauschpegel mit der folgenden Gleichung (1) bestimmt werden:
  • a = S - (n -ai) .....(1)
  • In der Gleichung (1) sind n bzw. a Konstanten, wobei a > 0 ist, S ist die Intensität des faltungsverarbeiteten Randspektrums, und (n -ai) ist eine zulässige Funktion. Da hier wie oben beschrieben ein Verfahren zur Abnahme der Anzahl der Bits vom Hochfrequenzband, die eine niedrigere Energie haben, zweckmäßig ist, um die Gesamtzahl der Bits zu reduzieren, wird n auf 38 gesetzt und a wird bei dieser Ausführungsform auf 1 gesetzt. Es gibt dann keine Störung bezüglich der Tonqualität, und es kann eine zufriedenstellende Codierung durchgeführt werden.
  • Auf diese Weise wird der oben erwähnte Pegel a bestimmt. Diese Daten werden zur Teilungseinrichtung 79 übertragen, welche eine Auseinanderfaltung des Pegels a im oben erwähnten faltungsverarbeiteten Bereich ausführt. Folglich kann durch Ausführung der Auseinanderfaltungsverarbeitung ein Verdeckungsspektrum vom Pegel a bereitgestellt werden. Dieses Verdeckungsspektrum kann folglich vom Pegel a bereitgestellt werden. Folglich wird dieses Verdeckungsspektrum ein zulässiges Rauschspektrum, das für jedes Band bestimmt wird. Es sei angemerkt, daß, da die oben erwähnte Auseinanderfaltungsverarbeitung eine komplizierte Berechnung erforderlich macht, eine vereinfachte Teilungseinrichtung 79 bei dieser Ausführungsform verwendet wird, um die Auseinanderfaltung durchzuführen.
  • Bei diesem Codierer wird die Anzahl der Bits, die einer Quantisierung zugeteilt werden, bei der die oben beschriebene Verdeckung auf Grundlage der Frequenz in Betracht gezogen wird, bestimmt, und ein zweiter zulässiger Rauschpegel jeder Frequenzkomponente für eine vorgegebene Zeitperiode wird auf der Basis einer Energie zumindest eines Datenworts gesetzt, das zeitlich vorhergeht, und der Daten, die zeitlich eine vorgegebene Periode lang den Ausgangssignalen von den FFT-Schaltungen 20, 40 und 60 vorangehen. Wenn man somit annimmt, daß die oben erwähnte Periode von Fig. 3 B2 ist, werden die Daten, die zeitlich vorhergehen, Daten eine vorgegebene Zeitperiode lang B1, und die Daten, die zeitlich folgen, werden Daten eine vorgegebene Zeitperiode lang B3. Auf der Basis von zumindest eines der Datenwörter für diese vorgegebenen Perioden B1 und B3 wird ein zulässiger Rauschpegel (Verdeckungspegel) in bezug auf jede Frequenzkomponente innerhalb der vorgegebenen Periode B2 gesetzt. Außerdem wird bewirkt, daß zumindest ein Datenwort in der zweiten Rauschpegel-Einstelleinrichtung ein Datenwort wird, das zeitlich vorhergeht. Wenn man nämlich die Vorwärtsverdeckung in Betracht zieht, bei der die Zeit des Verdeckungseffekts bei der zeitlichen Verdeckung lang ist, wird auf der Basis der Daten für die vorgegebene Zeitperiode B1, die zeitlich vorhergeht, ein zulässiger Rauschpegel fur eine vorgegebene Zeitperiode B2 bestimmt. Außerdem setzt die zweite Rauschpegel-Einstelleinrichtung den zweiten zulässigen Rauschpegel auf der Basis der Datenenergien, die gleich sind hinsichtlich der Frequenzkomponenten für Perioden, die zeitlich unterschiedlich sind. Der zweite zulässige Rauschpegel wird nämlich auf der Basis der Energien der Daten gesetzt, die zeitlich vorher oder nachher im gleichen Frequenzband des Grenzbandes liegen.
  • Anders ausgedrückt wird bei der zweiten Rauschpegel- Einstelleinrichtung, wobei man die temporäre Verdeckung durch Signale, die (für vorhergehende und nachfolgende vorgegebene Zeitperioden B1 und B3) zeitlich benachbart zu einem Signal in einem laufenden Zeitpunkt (beispielsweise eine vorgegebene Zeit B2) eines beliebigen Bandes zeitlich vorhergehen oder nachfolgen, wo der erste zulässige Rauschpegel durch die Verdeckungsspektrums-Rechenschaltung 75 in bezug auf das Signal in dem laufenden Zeitpunkt (der vorgegebenen Zeit B2) des beliebigen Bandes gesetzt wird, ein zulässiger Rauschpegel (zweiter zulässiger Rauschpegel) für ein beliebiges Band im laufenden Zeitpunkt (vorgegebene Zeit B2) gesetzt. Um dies zu realisieren, wird jedes Ausgangssignal von den Energieermittlungsschaltungen 22, 42 und 62 zu den Zeitperiodenverzögerungsschaltungen 23, 43, 63 sowie zur 5 ms-Verzögerungsschaltung 51 und zur 2,5-ms-Verzögerungsschaltung 71 der zweiten Rauschpegel-Einstelleinrichtung geliefert.
  • Hier dienen die Periodenverzögerungsschaltungen 23, 43 und 63 dazu, die Daten zu verzögern, die jeweils an sie jede Zeitperiode von beispielsweise 10 ms geliefert werden, was die Verarbeitungseinheit für die vorgegebene Zeitperiode ist. Außerdem werden Ausgangssignale von den Periodenverzögerungsschaltungen 43 und 63 zu Syntheseschaltungen 50 bzw. 70 geliefert. Die Syntheseschaltungen 50 und 70 stellen synthetisch Daten der Zeitblöcke (5 ms, 2,5 ms-Blöcke) in den FFT- Schaltungen 40 und 60 her, so daß sie den Daten von 10 ms entsprechen. Außerdem führt die 5 ms-Verzögerungsschaltung 51 eine Verzögerung für jeden 5-ms-Block durch. Die Auswahlschaltung 52 führt eine Schaltauswahl durch, so daß, wenn dahin gelieferte Daten von einem 5 ms-Block die Vorwärts- Blockdaten innerhalb einer vorgegebenen Zeitperiode sind, die zu verarbeiten sind, solche Daten durchgelassen, und in dem Fall, wo dorthin gelieferte Daten des 5 ms-Blocks die rückwärtigen Blockdaten innerhalb einer vorhergehenden Zeitperiode der vorgegebenen Zeitperiode sind, diese Daten nicht durchgelassen werden. Wenn man somit annimmt, daß die vorgegebene zu verarbeitende Periode die Periode B2 von Fig. 3 ist, führt die Auswahlschaltung 52 eine Auswahl derart durch, daß, wenn dorthin gelieferte 5 ms-Blockdaten den Block b (2, 2, 1) in Fig. 3 bilden, diese Schaltung eingeschaltet wird, und wenn die obigen Daten der Block b (1, 2, 2) sind, diese Schaltung abgeschaltet wird. Die 2,5 ms-Verzögerungsschaltung 71 führt die Verzögerung für jeden Block von 2,5 ms durch. Ausgangssignale von 2,5 ms-Verzögerungsschaltung 71 werden nacheinander an die 2,5 ms-Verzögerungsschaltung 72 und 73 geliefert. Alle Ausgangssignale von den 2,5 ms-Verzögerungsschaltungen 71, 72 und 73 werden zur Synthese/Auswahl-Schaltung 74 geliefert. Die Synthese/Auswahlschaltung 74 führt eine Schaltauswahl durch, so daß in dem Fall, wo gelieferte 2,5 ms-Blockdaten der hintere Block b (1, 3, 4) innerhalb einer vorhergehenden vorgegebenen Zeitperiode von beispielsweise der vorgegebenen Periode 82 ist, diese Schaltung ausgeschaltet wird, und in dem Fall, wo diese Daten die Blöcke b (2, 3, 1), b (2, 3, 2) und b (2, 3, 3) innerhalb der vorgegebenen Zeitperiode 82 sind, diese Schaltung eingeschaltet wird. In dem gleichen Zeitpunkt, wenn beispielsweise Daten des Blockes b (2, 3, 2) zur Synthese/Auswahl-Schaltung 74 geliefert werden, stellt die Synthese/Auswahl-Schaltung 74 diesen Block und den Vorwärtsblock (2, 3, 1) durch Synthese her; wenn Daten des Blocks b (2, 3, 3) zur Synthese/Auswahl- Schaltung 74 geliefert werden, stellt diese diesen Block und die beiden vorderen Blöcke b (2, 3, 1) und b (2, 31 2) durch Synthese her; und wenn Daten des Blocks b (2, 3, 4) zur Synthese/Auswahl-Schaltung 74 geliefert werden, stellt diese diesen Block und die vorderen drei Blöcke b (2, 3, 1), b (2, 3, 2) und b (2, 3, 2) durch Synthese her.
  • Ein Ausgangssignal von der Zeitperiodenverzögerungsschaltung 23 wird zur Wichtungs-Synthese-Schaltung 24 gehefert, die Ausgangssignale von der Synthese-Schaltung 50 und der Auswahlschaltung 52 werden zur Wichtungs-Syntheseschaltung 44 geliefert, und die Ausgangssignale von der Synthese- Schaltung 70 und der Synthese/Auswahl-Schaltung 74 werden zur Wichtungs-Synthese-Schaltung 64 geliefert. Außerdem werden Daten von der Verdeckungsspektrums-Berechnungsschaltung 75 ebenfalls zu den jeweiligen Wichtungs-Synthese-Schaltungen 24, 44 und 64 geliefert. Hier stellen die entsprechenden Wichtungs-Synthese-Schaltungen 24, 44 und 64 Wichtungskoeffizienten künstlich her, bei denen die Verdeckungseffekte frequenzmäßig und zeitmäßig in bezug auf die Daten, die dahin geliefert werden, in Betracht gezogen werden. Diese Wichtungskoeffizienten sind nämlich Koeffizienten, die eingestellt werden, wobei der Verdeckungseffekt in Betracht gezogen wird. In dem Fall beispielsweise, wo ein Signal für eine vorgegebene Zeitperiode und Zeitblöcke, die einem Signal für eine laufende vorgegebene Periode und entsprechenden Zeitblöcken vorhergehen oder nachfolgen, normiert wird, so daß es einen Wert 1 annimmt, wird ein Wichtungskoeffizient, der einem Pegel entspricht, der auf das Signal für die laufende vorgegebene Zeitperiode und die Zeitblöcke auf der Basis der Verdeckung (Verdeckung und zeitliche Verdeckung in bezug auf ein Signal auf der Frequenzbasis oder dergleichen) auf der Frequenzachse und der Zeitachse durch das Signal der vorhergehenden oder folgenden vorgegebenen Zeitperiode und der Zeitblöcke angewandt wird, in bezug auf das Signal für die vorhergehende oder nachfolgende vorgegebene Zeitperiode oder Zeitblöcke gewichtet. Damit kann der zulässige Rauschpegel (Verdeckungsspektrum), bei dem die Verdeckungseffekte über der Frequenzachse und der Zeitachse verwendet werden, gesetzt werden.
  • Es sei darauf hingewiesen, daß, während das oben erwähnte Verdeckungsspektrum, bei dem der Verdeckungseffekt in Betracht gezogen wird, innerhalb des gleichen Grenzbandes bestimmt wird, dieses Spektrum ein Spektrum sein darf, bei dem eine Verdeckung zwischen anderen Grenzbändern in Betracht gezogen wird.
  • Die Ausgangssignale von den Wichtungs-Synthese-Schaltungen 24, 44 und 64 werden außerdem über Synthese-Schaltungen 25, 45 und 65 zu Subtrahierern 27, 47 bzw. 67 geliefert. Zu diesen Subtrahierern 27, 47 und 67 werden außerdem die Ausgangssignale von den jeweiligen Energieermittlungsschaltungen 22, 42 und 62, d.h., das oben beschriebene Randspektrum SB, über die Verzögerungsschaltungen 31, 56 bzw. 81 geliefert. Wenn folglich Subtraktionsberechnungen zwischen dein Verdeckungsspektrum und dem Randspektrum SB des ersten und zweiten zulassigen Rauschpegels in den Subtrahierern 27, 47 und 67 durchgeführt wird, werden die Bereiche des Randspektrums SB unter dem Pegel, der durch jeden Pegel des Verdeckungsspektrums MS angedeutet ist, überdeckt, wie in Fig. 6 gezeigt ist.
  • Die Ausgangssignale von den Subtrahierern 27, 47 und 67 werden zu Quantisierungsschaltungen 29, 49 und 69 über ROMs 28, 48 bzw. 68 geliefert. Die ROMs 28, 48 und 68 speichern die Zuteilungsbitzahlinformation zur Quantisierung in den Quantisierungsschaltungen 29, 49 und 69, um eine Zuteilungsbitzahlinformation entsprechend den Ausgangssignalen von den Subtrahierern 27, 47 bzw. 67 auszugeben. Somit quantisieren die Quantisierungsschaltungen 29, 49 und 69 FFT-Koeffizientendaten, die über die Verzögerungsschaltung 30, 55 und 80 geliefert werden, wobei Bitzahlen entsprechend den Ausgangssignalen von den entsprechenden Subtrahierern 27, 47 und 67 zugeteilt werden. In anderen Worten ausgedrückt quantisieren die Quantisierungsschaltungen 29, 49 und 69 Komponenten von entsprechenden Bändern durch die Anzahl der Bits, die in Abhängigkeit von Pegeldifferenzen zwischen Energien in jedem Band von zulässigen Rauschpegeln des Grenzbands zugeteilt werden, in denen die Verdeckungseffekte über der Frequenzachse und der Zeitachse in Betracht gezogen werden. Es sei angemerkt, daß diese Bitzuteilung nicht für die vorgegebene Zeitperiode ausgeführt wird, und daß die Anzahl der Bits, die für die entsprechenden Zeitperioden verwendet wird, vorher bestimmt wird. Folglich wird die Bitzuteilung innerhalb einer vorgegebenen Zeitperiode durchgeführt. Hier sind die Verzögerungsschaltungen 30, 55 und 80 vorgesehen, wobei das Verzögerungsmaß in entsprechenden Schaltungen, die auf die Grenzband-Teilungsschaltungen 21, 41 und 61 folgen, in Betracht gezogen werden. Außerdem sind die Verzögerungsschaltungen 31, 56 und 81 dazu vorgesehen, um das Verzögerungsmaß in den entsprechenden Schaltungen, die auf die Zeitperiodenverzögerungsschaltungen 23, 43 und 63, die 5 ms-Verzögerungsschaltung, die 2,5 ms-Verzögerungsschaltung 71 und die Verdeckungsspektrums-Berechnungsschaltung 75 folgen, in Betracht zu ziehen.
  • Bei der Synthese in den Verzögerungsschaltungen 25, und 65 ist es möglich, Daten durch Synthese herzustellen, die die sogenannte minimale hörbare Kurve (Gleich-Lautstärkenkurve) RC des menschlichen Gehörs zeigen, wie in Fig. 7 gezeigt ist, die von den Minimal-Hörbarkeitskurven-Erzeugungsschaltungen 26, 46 und 66 und dem oben erwähnten Verdeckungsspektrum geliefert werden. Demnach kann, wenn sowohl die Minimal-Hörbarkeitskurve RC als auch das Verdeckungsspektrum MS durch Synthese herstellt, der zulässige Rauschpegel unten sein im Bereich, der durch schrägen Linien in Figur angedeutet ist. Damit kann die Anzahl der Bits, die dem Bereich, der durch die schrägen Linien in der Figur angedeutet ist, zugeteilt ist, quantisierungsmäßig reduziert werden. Fig. 7 zeigt außerdem ein Signalspektrum SS im gleichen Zeitpunkt. Weiter kann bei dieser Ausführungsform ein solcher Aufbau verwendet werden, bei dem die oben beschriebene Synthese-Verarbeitung der Minimal-Hörbarkeitskurve nicht durchgeführt wird. In diesem Fall werden die Minimal-Hörbarkeitskurven-Erzeugungsschaltungen 26, 46 und 66 und die Synthese- Schaltungen 25, 45 und 65 beim Aufbau von Fig. 1 nicht notwendig.
  • Entsprechende Ausgangssignale von den Quantisierungsschaltungen 29, 49 und 69, die durch die adaptiv zugeteilte Bitzahl auf diese Weise quantisiert wurden, werden in einer Synthese-Schaltung 90 durch Synthese hergestellt, und ein derart durch Synthese hergestelltes Ausgangssignal wird dann als codiertes Ausgangssignal am Ausgangsanschluß 2 ausgegeben.
  • Wie oben beschrieben besteht der Effekt bei der Ausführungform darin, daß die Zeitauflösung in einem höheren Frequenzband verbessert wird, und daß die Frequenzauflösung in einem niedrigeren Frequenzband verbessert wird. Somit kann eine Verarbeitung durchgeführt werden, die für ein menschliches Gehör geeignet ist. Außerdem ist zumindest ein Datenwort in der zweiten Rauschpegel-Einstelleinrichtung das Datenwort, das zeitlich vorhergeht, und die zweite Rauschpegel-Einstelleinrichtung setzt jeden zulässigen Rauschpegel auf der Basis der Energien der Daten, die hinsichtlich der Frequenzkompomenten für Perioden gleich sind, die zeitlich unterschiedlich sind. Somit kann eine Verarbeitung in einer kurzen Zeit durchgeführt werden.

Claims (16)

1. Digitaler Signalcodierer, mit:
einer ersten Frequenzanalyseeinrichtung (10) vom Nicht-Block-Typus, um eine Frequenzanalyse eines digitalen Eingangssignals durchzuführen;
einer zweiten Frequenzanalyseeinrichtung (20, 40, 60) vom Blocktypus, um weiter eine Frequenzanalyse von Frequenzkomponenten durchzuführen, die durch die erste Frequenzanalyseeinrichtung (10) analysiert wurden;
einer ersten Rauschpegel-Einstelleinrichtung (75), um einen ersten zulässigen Rauschpegel auf der Basis der Energie von jeder Frequenzkomponente innerhalb einer vorgegebenen Zeitperiode von Ausgangssignalen der zweiten Frequenzanalyseeinrichtung (20, 40, 60) einzustellen;
einer zweiten Rauschpegel-Einstelleinrichtung (23, 43, 63, 50, 70, 51, 71, 72, 73, 52, 74, 22, 44, 64), um einen zweiten zulässigen Rauschpegel jeder Frequenzkomponente innerhalb der vorgegebenen Zeitperiode auf der Basis der Energie von zumindest einem der Datenwörter, die zeitlich vorhergehen, und von Daten, die zeitlich folgen, von Ausgangssignalen von der zweiten Frequenzanalyseeinrichtung (20, 40, 60) einzustellen; und
einer Quantisierungseinrichtung (29, 49, 69), um ein Ausgangssignal von der zweiten Frequenzanalyseeinrichtung (20, 40, 60) zu quantisieren;
wobei die Quantisierungscharakteristik der Quantisierungseinrichtung auf der Basis der Ausgangssignale von der ersten und zweiten Rauschpegel-Einstelleinrichtung (75, 23, usw.) eingestellt wird.
2. Codierer nach Anspruch 1, wobei die erste Frequenzanalyseeinrichtung (10) eine Bandteilungseinrichtung aufweist, um das digitale Eingangssignal in Signalkomponenten in mehrere Frequenzbänder zu unterteilen, wobei sie zumindest ein Filter (11, 12) aufweist, und wobei die zweite Frequenzanalyseeinrichtung (20, 40, 60) eine schnelle Fourier-Transformationseinrichtung aufweist, um die schnelle Fourier- Transformation von Signalkomponenten blockweise durchzuführen.
3. Codierer nach Anspruch 2, wobei die Bandteilungseinrichtung eine Teilung derart durchführt, daß die Bandbreite groß wird, wenn sich das Frequenzband zu einer höheren Frequenz verschiebt, wobei die schnelle Fourier-Transformationseinrichtung eine Verarbeitung derart ausführt, daß die Blockzeitlänge, in der die schnelle Fourier-Transformationsverarbeitung durchgeführt wird, klein wird, wenn sich das Frequenzband zu einer höheren Frequenz verschiebt.
4. Codierer nach Anspruch 1, 2 oder 3, wobei zumindest das eine Datenwort in der zweiten Rauschpegel-Einstelleinrichtung (23, usw.) Daten sind, die zeitlich vorhergehen.
5. Codierer nach einem der vorhergehenden Ansprüche, wobei die zweite Rauschpegel-Einstelleinrichtung (23, usw.) den zweiten zulassigen Rauschpegel auf der Basis der Energien von Daten einstellt, die gleich sind in Hinblick auf Frequenzkomponenten für Perioden, die zeitlich unterschiedlich sind.
6. Codierer nach einem der vorhergehenden Ansprüche, der eine Grenzband-Teilungsschaltung (21, 41, 61) aufweist, um außerdem ein Ausgangssignal von der zweiten Frequenzanalyseeinrichtung (20, 40, 60) in Signalkomponenten in Grenzbändem als Ganzes zu teilen.
7. Codierer nach Anspruch 6, wobei die erste Rauschpegel-Einstelleinrichtung (23, usw.) den ersten zulässigen Rauschpegel auf der Basis einer Energie einstellt, die durch eine Gesamtsumme der Amplitudenwerte in entsprechenden Bändern der Grenzbänder bestimmt wird.
8. Codierer nach Anspruch 6, wobei die zweite Rauschpegel-Einstelleinrichtung (23, usw.) den zweiten zulässigen Rauschpegel in jedem Grenzband einstellt.
9. Codierer nach Anspruch 6, wobei der zweite zulässige Rauschpegel in einem beliebigen Band der Grenzbänder auf der Basis des zweiten zulässigen Rauschpegels in einem anderen der Grenzbänder eingestellt wird.
10. Codierer nach Anspruch 8, wobei die Quantisierungscharakteristik der Quantisierungseinrichtung (29, 49, 69) in Abhängigkeit von Pegelunterschieden zwischen Energien in jedem Band der Grenzbänder und dem ersten und zweiten zulässigen Rauschpegel eingestellt wird.
11. Codierer nach einem der vorhergehenden Ansprüche, wobei die Quantisierungscharakteristik der Quantisierungseinrichtung (29, 49, 69) derart ist, daß, wenn sich das Frequenzband zu einer höheren Frequenz verschiebt, die Anzahl der zugeteilten Bits kleiner wird.
12. Codierer nach einem der vorhergehenden Ansprüche, wobei der erste zulässige Rauschpegel ein Verdeckungspegel über der Frequenzachse ist, der auf menschlichem Hören basiert.
13. Codierer nach einem der vorhergehenden Ansprüche, wobei der zweite zulässige Rauschpegel ein Verdeckungspegel über der Zeitachse ist, der auf menschlichem Hören basiert.
14. Codierer nach Anspruch 12 und 13, wobei der erste und zweite zulässige Rauschpegel durch Synthese von Verdeckungspegeln auf der Grundlage der Frequenz und Zeit und einer auf menschlichem Hören basierenden Minimal-Hörbarkeitskurve erhalten wird.
15. Codierer nach einem der vorhergehenden Ansprüche, wobei zumindest ein Filter der ersten Frequenanalyseeinrichtung (20, 40, 60) ein Spiegelfilter ist.
16. Codierer nach einem der Ansprüche 1 bis 14, wobei zumindest ein Filter der Frequenzanalyseeinrichtung (20, 40, 60) ein Bandpaßfilter ist.
DE69116476T 1990-08-24 1991-08-22 Digitaler Signalverschlüssler Expired - Lifetime DE69116476T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2221366A JP3033156B2 (ja) 1990-08-24 1990-08-24 ディジタル信号符号化装置

Publications (2)

Publication Number Publication Date
DE69116476D1 DE69116476D1 (de) 1996-02-29
DE69116476T2 true DE69116476T2 (de) 1996-06-05

Family

ID=16765671

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69116476T Expired - Lifetime DE69116476T2 (de) 1990-08-24 1991-08-22 Digitaler Signalverschlüssler

Country Status (7)

Country Link
US (1) US5260980A (de)
EP (1) EP0473367B1 (de)
JP (1) JP3033156B2 (de)
KR (1) KR100221892B1 (de)
CA (1) CA2049786C (de)
DE (1) DE69116476T2 (de)
SG (1) SG76469A1 (de)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
EP0535889B1 (de) * 1991-09-30 1998-11-11 Sony Corporation Verfahren und Anordnung zur Audiodatenkompression
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JP3186290B2 (ja) * 1993-01-20 2001-07-11 ソニー株式会社 符号化方法、符号化装置、復号化装置及び記録媒体
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3188013B2 (ja) * 1993-02-19 2001-07-16 松下電器産業株式会社 変換符号化装置のビット配分方法
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
KR100330290B1 (ko) * 1993-11-04 2002-08-27 소니 가부시끼 가이샤 신호부호화장치,신호복호화장치,및신호부호화방법
CN1111959C (zh) * 1993-11-09 2003-06-18 索尼公司 量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置和高效率解码装置
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
EP0707761B1 (de) * 1994-05-19 2001-09-26 Koninklijke Philips Electronics N.V. Vorrichtung zur bestimmung des signalspektrums eines digitalen breitbandsignals und zur ableitung einer bitzuweisungsinformation
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
WO1996014695A1 (en) * 1994-11-04 1996-05-17 Philips Electronics N.V. Encoding and decoding of a wideband digital information signal
JP2776277B2 (ja) * 1994-12-08 1998-07-16 日本電気株式会社 音声符号化装置
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JP2776775B2 (ja) * 1995-10-25 1998-07-16 日本電気アイシーマイコンシステム株式会社 音声符号化装置及び音声復号化装置
US6167241A (en) * 1996-10-28 2000-12-26 Int Labs, Inc. Technique for performing amplitude modulation without cheating side-bands
DE19647399C1 (de) 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
GB2349054A (en) * 1999-04-16 2000-10-18 Nds Ltd Digital audio signal encoders
JP2002135122A (ja) * 2000-10-19 2002-05-10 Nec Corp オーディオ信号符号化装置
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7716712B2 (en) * 2003-06-18 2010-05-11 General Instrument Corporation Narrowband interference and identification and digital processing for cable television return path performance enhancement
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004028694B3 (de) * 2004-06-14 2005-12-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen eines Informationssignals in eine Spektraldarstellung mit variabler Auflösung
US8225392B2 (en) * 2005-07-15 2012-07-17 Microsoft Corporation Immunizing HTML browsers and extensions from known vulnerabilities
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
KR20080072224A (ko) * 2007-02-01 2008-08-06 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US9749021B2 (en) * 2012-12-18 2017-08-29 Motorola Solutions, Inc. Method and apparatus for mitigating feedback in a digital radio receiver
EP4365890A1 (de) * 2022-11-07 2024-05-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur adaptiven, harmonischen sprachmaskierschallerzeugung

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3167257D1 (en) * 1981-02-27 1985-01-03 Ibm Transmission methods and apparatus for implementing the method
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
DE3506912A1 (de) * 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JPH02309820A (ja) * 1989-05-25 1990-12-25 Sony Corp デイジタル信号処理装置
US5150387A (en) * 1989-12-21 1992-09-22 Kabushiki Kaisha Toshiba Variable rate encoding and communicating apparatus

Also Published As

Publication number Publication date
EP0473367A1 (de) 1992-03-04
EP0473367B1 (de) 1996-01-17
US5260980A (en) 1993-11-09
CA2049786C (en) 2003-04-08
CA2049786A1 (en) 1992-02-25
JPH04104617A (ja) 1992-04-07
KR100221892B1 (ko) 1999-09-15
SG76469A1 (en) 2000-11-21
JP3033156B2 (ja) 2000-04-17
KR920005507A (ko) 1992-03-28
DE69116476D1 (de) 1996-02-29

Similar Documents

Publication Publication Date Title
DE69116476T2 (de) Digitaler Signalverschlüssler
DE69122306T2 (de) Digitales Teilbandsignalkodiergerät
DE69331428T2 (de) Kodierung und Dekodierung digitaler Signale
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
DE69225524T2 (de) Einrichtung zur Orthogonaltransformationskodierung eines digitalen Audiosignals
DE69319494T2 (de) Kodierungsvorrichtung für Audiosignalen und Verfahren dazu
DE69225100T2 (de) Reduzierung der Zusaztinformation bei Teilbandkodierungsverfahren
DE69121606T2 (de) Gerät zur Kodierung digitaler Signale
DE69023604T2 (de) Digitalsignalkodiergerät.
DE69332057T2 (de) Digitalsignaldekodierungsvorrichtung
DE69326492T2 (de) Verfahren zur Auswahl des Codier Modus für Stereo Audio-Signale unter Benutzung von Hörbarkeitsmodellen
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE69525836T2 (de) Kodierung und dekodierung eines breitbandigen digitalen informationssignals
DE69122648T2 (de) Digitale Teilbandkodierungsvorrichtung
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE69028675T2 (de) Wahrnehmungsgebundene Kodierung von Audiosignalen
DE69323106T2 (de) Verfahren und Vorrichtung für perceptuelles Kodieren von Audio-Signalen
DE69515907T2 (de) Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE2818052C2 (de) Quantisierung eines Signals mit einem sich über ein gegebenes Frequenzband erstreckendem Spetkrum
DE69429499T2 (de) Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
DE69431025T2 (de) Signalkodier- oder -dekodiergerät und Aufzeichnungsmedium
DE4320990B4 (de) Verfahren zur Redundanzreduktion
DE69325312T2 (de) Kompressionskodierung und -dekodierung digitaler Audiosignale
DE69320872T2 (de) Kompression und Dehnung von digitalen Signalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition