DE69023604T2 - Digitalsignalkodiergerät. - Google Patents

Digitalsignalkodiergerät.

Info

Publication number
DE69023604T2
DE69023604T2 DE69023604T DE69023604T DE69023604T2 DE 69023604 T2 DE69023604 T2 DE 69023604T2 DE 69023604 T DE69023604 T DE 69023604T DE 69023604 T DE69023604 T DE 69023604T DE 69023604 T2 DE69023604 T2 DE 69023604T2
Authority
DE
Germany
Prior art keywords
frequency
signals
coding
bands
frequency bands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69023604T
Other languages
English (en)
Other versions
DE69023604D1 (de
Inventor
Kenzo Akagiri
Makoto Akune
Yoshihito Fujiwara
Naoto Iwahashi
Masayuki Nishiguchi
Tomoko Umezawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP1249835A external-priority patent/JP2906477B2/ja
Priority claimed from JP1278207A external-priority patent/JP2906483B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of DE69023604D1 publication Critical patent/DE69023604D1/de
Publication of DE69023604T2 publication Critical patent/DE69023604T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf eine digitale Signalcodiervorrichtung zur Codierung von digitalen Eingangssignalen.
  • Als Verfahren zur hochwirksamen Codierung von Eingangssignalen sind Codierverfahren, die als sogenannte Bitzuteilung bezeichnet werden, bekannt, nach denen Eingangssignale in mehrere Kanäle auf der Zeit- oder Frequenzachse aufgeteilt werden und bestimmte Anzahlen von Bits adaptiv den entsprechenden Kanälen (Bitzuteilung) zugeteilt werden. Unter den oben erwähnten Codierverfahren mittels Bitzuteilung sind zu erwähnen ein sogenanntes Subband-Codierverfahren (SBC), bei denen Sprachsignale auf der Zeitachse in Signale mehrere Frequenzbänder aufgeteilt werden, um sie mittels einer sogenannten adaptiven Transformationscodierung (ATC) zu codieren, bei der Sprachsignale auf der Zeitachse in Signale auf der Frequenzachse durch orthogonale Transformation transformiert werden und die sich ergebenden Signale in Signale mehrerer Frequenzbänder für eine adaptive Codierung für jedes Frequenzband geteilt werden, und eine sogenannte adaptive Bitzuteilung (APC-AB), die eine Kombination des oben erwähnten SBC-Verfahrens und einer sogenannten adaptiven Vorhersagecodierung APC ist, bei der die Sprachsignale auf der Zeitachse in Signale mehrerer Frequenzbänder aufgeteilt werden und die Signale der entsprechenden Bänder in Basisband- oder Niedrigbereichsignale konvertiert werden, wonach lineare Vorhersageanalysen einer höheren Ordnung für das Vorhersagecodieren durchgeführt werden.
  • Das Subband-Codieren wird beispielsweise durch eine in Fig. 1 gezeigte Schaltung durchgeführt. In dieser Figur werden digitale Sprachsignale, die zu einem Eingangsanschluß 110 eines Codierers 130 geliefert werden, zu Frequenzteilungsfiltern 131&sub1; bis 131n geliefert, die beispielsweise Spiegelfilter sein können, beispielsweise Quadratur-Spiegelfilter (QMFs), so daß diese Signale im Frequenzbereich begrenzt und auf niedrigere Frequenzseiten verschoben werden. Das heißt, daß die eingegebenen digitalen Sprachsignale in diesen Frequenzteilungsfiltern 131&sub1; bis 131n in separate Frequenzbänder durch Bandpaßfilter oder BPFs geteilt werden und nachfolgend durch Tiefpaßfilter laufen, damit sie auf die Niederfrequenzseiten um Beträge verschoben zu werden, die den Mittenfrequenzen der Bandpäße der Tiefpaßfilter entsprechen. Die Signale von den Filtern werden dann zu Quantisierern (A/D-Umsetzer) 134&sub1; bis 134n geliefert, wo sie einer Herunter-Abtastung mit einer geeigneten Abtastfrequenz unterzogen werden. Es sei angemerkt, daß eine höhere Abtastfrequenz für ein breiteres Frequenzband verwendet werden sollte. Die Signale, in denen die Daten durch Requantisierung in dieser Weise komprimiert wurden, werden am Anschluß 138 über einen Multiplexer 136 ausgegeben. Die Ausgangssignale werden dann über einen Übertragungskanal zu einem Anschluß 148 eines Decodierers 140 und dann zu Dequantisierern 144&sub1; bis 144n über einen Demultiplexer 149 zwecks Decodierung übertragen. Die decodierten Signale werden durch die Frequenzkonverter 142&sub1; bis 142n in Signale der Frequenzbänder auf der Zeitachse konvertiert, wonach sie am Anschluß 150 als decodierte Sprachsignale ausgegeben werden.
  • Bei der Signaldatenkompression durch den Codierer 130 werden die Quantisierungsbits adaptiv den entsprechen Frequenzbändern zugeteilt, um Rauscheffekte minimal zu halten, die bei der Datenkomprimierung bei den Sprachsignalen erzeugt werden, um die Qualität zu verbessern. Der Decodierer 140 erhält außerdem die Bitzuteilungsinformation über eine oder eine zweite Einrichtung, um die Decodierung durchzuführen.
  • Die konventionelle Praxis zum Erhalt der Bitzuteilungsinformation bestand darin, die Energiewertinformation jedes Frequenzbandes als Seiteninformation zusätzlich zu den Signalen der entsprechenden Bänder zu übertragen. Dabei werden die Energiewerte der Signale der entsprechenden Bänder in Energieermittlungseinrichtungen 133&sub1; bis 133n aus den Signalen berechnet, die auf die Frequenzbänder durch die Frequenzteilungsfilter 131&sub1; bis 131n des Codierers 130 aufgeteilt sind, und auf der Basis der berechneten Werte werden die optimalen Anzahlen der Bitzuteilung und die Quantisierungsschritte im Zeitpunkt der Quantisierung der Signale der entsprechenden Bänder in einer Zuteilungsschritt-Berechnungseinheit 135 gefunden. Die in der Berechnungseinheit 135 erhaltenen Ergebnisse werden zur Requantisierung der Signale der entsprechenden Bänder in Quantisierern 134&sub1; bis 134n verwendet. Die Ausgangssignale, das heißt, die Hilfs- oder Seiteninformation von der Zuteilungsschritt-Berechnungseinheit 135 werden zu einer Zuteilungsschritt-Berechnungseinheit 145 des Decodierers 140 übertragen, und die Daten von der Einheit 145 werden zu Dequantisierern 144&sub1; bis 144n übertragen, wo ein inverser Betrieb gegenüber dem, der in den Quantisierern 134&sub1; bis 134n durchgeführt wurde, durchgeführt wird, um eine Signaldecodierung durchzuführen.
  • Bei der oben beschriebenen Frequenzteilung und Codierung kann eine Formung des Rauschens oder dergleichen in Betracht gezogen werden, die der menschlichen Hörkennlinie folgt, und es kann mehr Information diesen Frequenzbändern zugeteilt werden, in denen die Sprachenergien konzentriert sind oder die mehr zur subjektiven Sprachqualität beispielsweise zur Deutlichkeit beitragen. Die Signalquantisierung und die Dequantisierung für die entsprechenden Frequenzbänder wird mit der zugeteilten Anzahl von Bits durchgeführt, um das Ausmaß einer Hörstörung durch das Quantisierungsrauschen zu reduzieren, um damit die Anzahl der Bits insgesamt zu reduzieren. Die oben erwähnte Frequenzteilung und Codierung hat eine Erzeugung von Quantisierungsrauschen nur in dem betroffenen Frequenzband zur Folge, ohne die verbleibenden Bänder zu beeinträchtigen. Wenn die Energiewertinformation als Hilfsdaten übertragen wird, wie oben beschrieben wurde, können die Energiewerte der Signale der entsprechenden Bänder zweckmäßigerweise wie Quantisierungsschrittbreiten oder Normierungsfaktoren der entsprechenden Frequenzbandsignale verwendet werden.
  • Sollte die Frequenzteilung und Codierung für Musik- oder Sprachsignale verwendet werden, wird die Frequenzbandteilung üblicherweise in einer Weise durchgeführt, daß, um die Frequenzanalysefähigkeit an den menschlichen Hörsinn anzupassen, eine engere Bandbreite bzw. eine breitere Bandbreite für den unteren Frequenzbereich bzw. hohen Frequenzbereich ausgewählt wird.
  • Bei einer derartigen Frequenzbandaufteilung, die zur Frequenzanalysefähigkeit des menschlichen Hörsinns paßt, wird, wenn die Definition der zeitlichen Analysen für die entsprechenden Frequenzbänder, das heißt die Zeitbreite als Einheit der Analysen entlang der Zeitachse die gleiche sein sollte, die Größe eines analytischen Blocks für jeden Frequenzbereich, das heißt die Anzahl der Abtastungen oder Daten von einem Frequenzbereich zum anderen unterschiedlich sein, und zwar wegen des Unterschiedes in den Bandbreiten der Frequenzbänder, mit dem Ergebnis, daß die Effektivität der analytischen Verarbeitung und daher die Effektivität der Codierung schlechter wird. Andererseits stellt man sich vor, daß die konstante Amplitudenperiode für das untere bzw. das obere Frequenzsignal länger bzw. kürzer ist, so daß eine wirksame Codierung, die sich mit der konstanten Amplitudenperiode verträgt, nicht durchgeführt werden kann.
  • Ein Artikel "On the Design of Sub-band Coders for Low-Bit Rate Speech Communication" von R.E. Crochiere, der im Bell System Technical Journal, Vol. 56, Nr. 5, Seite 747 bis 769 erschienen ist, beschreibt Subband-Codierer, bei denen ein Eingangssprachsignal in Subbänder unterteilt wird, wobei Bandpaßfilter verwendet werden. Dabei vergrößert sich die Bandbreite der Subbänder, wenn die Subbandfrequenz ansteigt. Jedes Subband wird tiefpaß-übersetzt, wird mit seiner Nyquistrate abgetastet und digital codiert. Das Codierungssignal, das für jedes Subband angelegt wird ist, ist an die Erfordernisse des Subbandes angepaßt, um ein subjektiv verbessertes Codieren zu erzielen (das heißt ein reproduziertes Signal mit einer guten Qualität nach Beurteilung durch einen Hörer).
  • Die EP-A 0 084 125 beschreibt eine Vorrichtung zum Multiplexen einer Vielzahl von Sprach- oder Datensignalen. Die zu multiplexenden Signale sind in Subbänder mittels einer Filterbank aufgeteilt, und der Leistungspegel jedes Subbandes wird gemessen. Die erhältliche Bitrate des Multiplexers wird adaptiv an eine Vielzahl von Quantisierern aufgeteilt, die auf den verschiedenen Subbändern arbeiten, wobei die Verteilung der Bits an die Quantisierer abhängig ist von den relativen Leistungspegeln, die in den Subbändern ermittelt werden.
  • Es ist daher eine Aufgabe der vorliegenden Erfindung, eine digitale Signalcodiervorrichtung bereitzustellen, bei der beim Codieren von Sprachsignalen, die in mehrere Frequenzbänder unterteilt sind, um die Frequenzanalysefähigkeit des menschlichen Hörsinnes anzupassen, eine wirksamere Codierung, die sich mit den Eigenschaften der Sprachsignale verträgt, erzielt werden kann.
  • Eine andere Aufgabe der vorliegenden Erfindung besteht darin, eine digitale Signalcodiervorrichtung bereitzustellen, bei der eine höhere Leistung einer Frequenzauflösung für einen niedrigen Frequenzbereich und eine höhere Leistung einer zeitlichen Auflösung für den höheren Frequenzbereich erzielt wird, wo die Dauer des konstanten Amplitudenzustands kürzer ist.
  • Gemäß der vorliegenden Erfindung ist eine digitale Signalcodiervorrichtung vorgesehen, die aufweist:
  • eine Einrichtung zum Aufteilen von digitalen Eingangssignalen auf mehrere Frequenzbänder, die so eingestellt sind, daß die Bänder mit höheren Frequenzen breitere Bandbreiten haben werden, und
  • eine Einrichtung zur künstlichen Erzeugung und Ausgabe von codierten Signalen an jedes der Frequenzbänder,
  • die dadurch gekennzeichnet ist, daß vorgesehen ist
  • eine Einrichtung zur Ermittlung - durch Spektralanalyse - von Eigenschaften der Frequenzkomponenten der Frequenzbänder, wobei die Periode der Spektralanalysen, welche die Zeitbreite als eine Einheit der Analysen entlang der Zeitachse ist, so ausgewählt wird, daß sie länger für niedrigere Frequenzen ist, und zur Ausgabe eines entsprechenden Ausgangssignals; und
  • eine Einrichtung zum Steuern des künstlichen Erzeugens und der Codierung als eine Funktion des Ermittlungsausgangssignals.
  • Folglich wird erfindungsgemäß die Genauigkeit der Analysen entlang der Zeitachse als Funktion der Bandbreiten der entsprechenden Frequenzbänder geändert, um ein optimales Zeitintervall für Analysen für jedes Frequenzband zu realisieren.
  • Fig. 1 ist ein Blockdiagramm, das ein Beispiel der konventionellen Frequenzteilung und Codierung zeigt;
  • Fig. 2 ist ein Blockdiagramm, das eine erste Ausführungsform der vorliegenden Erfindung zeigt;
  • Fig. 3 ist eine schematische Ansicht, die den Betrieb der Ausführungsform von Fig. 2 zeigt;
  • Fig. 4 ist ein Blockdiagramm, das eine zweite Ausführungsform der vorliegenden Erfindung zeigt;
  • Fig. 5 ist eine schematische Ansicht, die den Betrieb der zweiten in Fig. 4 gezeigten Ausführungsform zeigt;
  • Fig. 6 ist ein Blockdiagramm, das die Filterbank von Fig. 4 ausführlich zeigt;
  • Fig. 7 ist ein Blockdiagramm, das einen Decodierer nach der Ausführungsform von Fig. 4 zeigt;
  • Fig. 8 und 9 sind Diagramme, die den Betrieb der in Fig. 4 gezeigten Ausführungsform zeigen.
  • Mit Hilfe der Zeichnungen werden nun bestimmte bevorzugte Ausführungsformen der vorliegenden Erfindung ausführlich erklärt.
  • Fig. 2 zeigt schematisch den Aufbau einer digitalen Signalcodiervorrichtung entsprechend der ersten Ausführungsform der vorliegenden Erfindung, wo der Frequenzbereich in vier Bänder unterteilt ist, wie in Fig. 3 gezeigt ist.
  • In Fig. 2 werden Sprachsignale beispielsweise als digitale Eingangssignale an einen Eingangsanschluß 1 der digitalen Signalcodiervorrichtung geliefert. Diese Sprachsignale werden zuerst zu Bandpaßfiltern (BPF) 11 bis 14 geliefert. Diese Bandpaßfilter teilen den Frequenzbereich der Sprachsignale in mehrere Frequenzbänder so auf, daß die Bandbreite für die höheren Frequenzbänder breiter wird, um damit die Frequenzunterscheidungsfähigkeit des menschlichen Hörsinnes anzupassen. In den Bandpaßfiltern 11 bis 14 sind Tiefpaßfilter gebildet, so daß die Signale in Richtung auf die tiefen Frequenzseiten um Beträge verschoben werden, die den Mittenfrequenzen der Durchlaßbänder der Bandpaßfilter 11 bis 14 entsprechen.
  • Die Sprachsignale, die folglich in mehrere Frequenzbänder aufgeteilt und zu den unteren Frequenzseiten der Bandpaßfilter 11 bis 14 verschoben sind, werden in Frequenzbänder B1, B2, B3 und B4 durch die Bandpaßfilter 1, 12, 13 und 14, wie in Fig. 3 gezeigt ist, aufgeteilt. Diese Frequenzbänder B1 bis B4 werden so ausgewählt, daß die Bandbreiten breiter werden, die höher die Frequenzen werden, wie vorher erwähnt wurde.
  • Die Signale der entsprechenden Frequenzbänder werden durch die Quantisierer 41 bis 44 quantisiert. Während einer solchen Quantisierung wird die Frequenzkennlinie der Frequenzkomponenten der entsprechenden Bänder ermittelt, und die Quantisierung wird als Funktion des ermittelten Ausgangssignals gesteuert. Das heißt, daß mit der vorliegenden Codiervorrichtung die Anzahlen der zugeteilten Bits im Zeitpunkt der Quantisierung auf der Basis der Ergebnisse der Signalspektralanalysen für die entsprechenden Frequenzbänder bestimmt werden, und daß die Quantisierung in den Quantisierern 41 bis 44 auf der Basis der so bestimmten Anzahlen der Bitzuteilung bestimmt wird.
  • Folglich werden die Signale der entsprechenden Frequenzbänder von den Bandpaßfiltern 11 bis 14 jeweils zu den Spektralanalyseschaltungen 21 bis 24 übertragen, wo Spektralanalysen für die entsprechenden Frequenzbänder durchgeführt werden. Die Ergebnisse der Analysen werden zu Bitzuteilungsanzahlentscheidungsschaltungen 31 bis 34 übertragen, die die Anzahl der Bits im Zeitpunkt der Quantisierung zuteilen, so daß die Bitzuteilungsanzahlen in den Schaltungen 31 bis 34 auf der Basis der Ergebnisse der Analysen bestimmt werden. Quantisierungen werden in den Quantisierern 41 bis 44 auf der Basis der so bestimmten Bitzuteilungsanzahlen durchgeführt. Die Quantisierungsausgangssignale der Quantisierer 41 bis 44 werden durch einen Multiplexer 6 künstlich hergestellt, und sie werden an einem Ausgangsanschluß 7 der digitalen Signalcodiervorrichtung der vorliegenden Erfindung ausgegeben.
  • Es sei angemerkt, daß beim Quantisieren der Sprachsignale, die vorher in mehrere Frequenzbänder aufgeteilt wurden, die an die Frequenzanalysefähigkeit des menschlichen Hörsinnes angepaßt sind, die Blockgrößen, da die Bandbreiten der entsprechenden Frequenzbänder von einem Frequenzband sich zum anderen unterscheiden, der Spektralanalysen, das heißt die Breiten entlang der Zeitachse der analytischen Blöcke von einem Frequenzband zum anderen um die gleiche angenommene Genauigkeit der Analysen entlang der Zeitachse der Frequenzbänder sich unterscheiden werden, mit dem Ergebnis, daß die Wirksamkeit der Spektralanalysen und daher die Quantisierungswirksamkeit vermindert werden. Da man im allgemeinen annimmt, daß der konstante Amplitudenbereich des unteren Frequenzbereichssignals länger und der hohe Frequenzsignalbereich kürzer ist, kann eine wirksame Codierung, die eine solche Differenz bezüglich der Länge des konstanten Amplitudenbereichs heranzieht, nicht realisiert werden.
  • Aus dieser Sicht gesehen wird die zeitliche analytische Genauigkeit, das heißt die analytische Genauigkeit entlang der Zeitachse, so ausgewählt, daß sie höher bzw. niedriger für den hohen bzw. niedrigen Frequenzbereich ist, um eine wirksamere Quantisierung zu realisieren. In anderen Worten ausgedrückt werden die Zeitdauern der Spektralanalysen so ausgewählt, daß sie kürzer bzw. länger für die hohen bzw. niedrigen Frequenzbereiche sind.
  • Das heißt, daß für Spektralanalysen durch die Spektralanalyseschaltungen 21 bis 24 die Zeitdauer der Analysen, die das Ermittlungszeitintervall oder die Zeitbreite als Einheit der Analysen entlang der Zeitachse ist, so gewählt, daß sie länger ist, je niedriger die Frequenz ist. Die Auswahl der Ermittlungszeitintervalle für Spektralanalysen als Funktion der Frequenzen kann auf der Basis jedes der Taktsignale gemacht werden, die beim Aufteilen der Taktfrequenz der Taktsignale, die in den Sprachsignalen enthalten sind, erzielt wird.
  • Folglich werden bei der vorliegenden Ausführungsform die Taktsignalkomponenten in den Sprachsignalen, die zum Eingangsanschluß 1 geliefert werden, in einer Takttrennungsschaltung 2 getrennt. Die so getrennten Taktsignale CK werden nacheinander über 1/2-Frequenzteiler 3, 4 und 5 übertragen, um frequenzgeteilte Taktsignale (1/2) CK, die auf eine Hälfte der ursprünglichen Taktfrequenz CK aufgeteilt sind, um frequenzgeteilte Taktsignale (1/4) CK, die auf ein 1/4 der ursprünglichen Taktfrequenz CK aufgeteilt sind und freguenzgeteilte Taktsignale (1/8) CK, die auf ein 1/8 der ursprünglichen Taktfrequenz CK aufgeteilt sind, zu erzeugen. Von den so erzeugten Signalen werden die Taktsignale CK zur Spektralanalyseschaltung 24 und einer Bitzuteilungsanzahlentscheidungsschaltung 34 übertragen, die frequenzgeteilten Taktsignale (1/2) CK werden zu einer Spektralanalyseschaltung 23 und einer Bitzuteilungsanzahlentscheidungsschaltung 33 übertragen, die frequenzgeteilten Taktsignale (1/4) CK werden zu einer Spektralanalyseschaltung 22 und einer Bitzuteilungsanzahlentscheidungsschaltung 32 übertragen, und die frequenzgeteilten Taktsignale (1/8) CK werden zu einer Spektralanalyseschaltung 21 und einer Bitzuteilungsanzahlentscheidungsschaltung 31 übertragen.
  • Folglich wird die Ermittlungszeitdauer der Spektralanalysen, das heißt, die Einheitszeitbreite für die Analysen in der Spektralanalyseschaltung 21 maximal, während sie fortschreitend kürzer in der Spektralanalyseschaltung 22 und 23 und am kürzesten in der Spektralanalyseschaltung 24 wird.
  • Durch Ändern der Ermittlungszeitintervalle für die Spektralanalysen auf diese Weise wird es möglich, wirksame Spektralanalysen zu realisieren, und folglich eine wirksame Quantisierung im Zeitpunkt der Quantisierung der Sprachsignale, die in mehrere Frequenzbänder aufgeteilt sind, um die Frequenzanalysefähigkeit des menschlichen Hörsinnes anzupassen. Mit dem derart geänderten Ermittlungszeitintervall kann man sich das Spektrum für jedes Frequenzband so vorstellen, daß es in jedem Block des Bandes konstant ist, so daß die Werte der Spektralanalysen für den Langzeitblock im unteren Frequenzbereich als Ersatz für die Kurzzeitspektralschwingungsform verwendet werden können.
  • Das Teilungsverhältnis des Frequenzbandes braucht nicht notwendigerweise umgekehrt proportional zu den Zeitdauern für die Spektralanalysen sein, das heißt, den Zeitdauern mit den Verhältnissen von 8:4:2:1 zur Frequenz der Taktsignale CK. Die relative Größe der Teilungsrate wird jedoch vorzugsweise in der oben beschriebenen Weise ausgewählt. Eine solche relative Größe ist derart, daß sie der Richtung folgt, in welcher die Blockgröße der Spektralanalysen, das heißt die Breite des analytischen Blocks entlang der Zeitachse, gleich gemacht werden kann, so daß die Wirksamkeit nicht vermindert wird.
  • Das heißt, daß bei der oben beschriebenen ersten Ausführungsform der digitalen Signalcodiervorrichtung der vorliegenden Erfindung das Codieren in Abhängigkeit vom Ermittlungsausgangssignal der Kennlinien der Komponenten der Frequenzbänder gesteuert wird, während das Ermittlungszeitintervall so ausgewählt wird, daß es für die unteren Frequenzen länger wird, mit dem Ergebnis, daß die Ermittlungswirksamkeit nicht vermindert wird, und daher ein wirksames Codieren, das zur Art der digitalen Eingangssignale paßt, erzielt werden kann.
  • Eine zweite Ausführungsform der vorliegenden Erfindung wird nun mit Hilfe von Fig. 4 und den weiteren Figuren erklärt.
  • Fig. 4 zeigt schematisch einen typischen Aufbau einer hochwirksamen Codiervorrichtung für digitale Daten entsprechend der zweiten Ausführungsform.
  • Nach Fig. 4 besteht die hochwirksame Codiervorrichtung für digitale Daten nach der vorliegenden Ausführungsform aus einer Filterbank 104, die aus Spiegelfiltern besteht, beispielsweise Quadratur-Spiegelfilter, wie die Frequenzteilungsfilter, orthogonale Transformierungsschaltungen 105&sub1; bis 105&sub5;, um eine orthogonale Transformierung durchzuführen, das heißt, eine Transformierung der Zeitachse in die Frequenzachse, beispielsweise eine schnelle Fourier-Transformation, und eine Bitzuteilungsanzahlentscheidungsschaltung 106, um die Bitanzahlen zu bestimmen, die den entsprechenden Frequenzbändern zugeteilt werden.
  • An dem Eingangsanschluß 101 werden digitale Eingangsdaten von 0 bis 16 kHz geliefert, die beim Abtasten von Audiosignalen mit der Abtastfrequenz fs = 32 kHz erhalten werden. Diese Eingangsdaten werden zur Filterbank 104 übertragen, durch die die Eingangsdaten in n Frequenzbänder-hier 5- unterteilt werden, so daß die Bandbreite für die höheren Frequenzen breiter werden. Somit werden die digitalen Eingangsdaten grob in 5 Kanäle aufgeteilt, das heißt einen Kanal CH1 mit dem Frequenzband von 0 bis 1 kHz, einen Kanal CH2 mit dem Frequenzband 1 bis 2 kHz, einen Kanal CH3 mit dem Frequenzband von 2 bis 4 kHz, einen Kanal CH4 mit dem Frequenzband von 4 bis kHz und einen Kanal CH5 mit dem Frequenzband von 8 bis 16 kHz. Eine derartige Frequenzteilung, in welcher die Bandbreite für die höheren Frequenzen breiter wird, ist eine Frequenzteilungstechnik, die die menschliche Hörkennlinie berücksichtigt, ähnlich dem sogenannten kritischen Band. Das kritische Band, das die menschliche Hörkennlinie berücksichtigt, ist das Band, das durch ein schmalbandiges Rauschen belegt ist, das einen reinen Ton oder Klang verdeckt, wobei das Rauschen die gleiche Amplitude hat und den Pegel oder die Tonhöhe des reinen Tons oder Klangs umfaßt, wobei gilt, daß je höher die Frequenz wird, desto breiter die Bandbreite des kritischen Bandes wird. Für jeden dieser fünf Kanäle werden Blöcke, die jeweils aus mehreren Abtastungen bestehen, das heißt, ein Einheitszeitblock, durch die orthogonalen Transformationsschaltungen 105&sub1; bis 105&sub5; gebildet, und die orthogonale Transformation, beispielsweise eine schnelle Fourier-Transformation, wird für jeden Einheitsblock eines jeden Kanals durchgeführt, um Koeffizientendaten durch die orthogonale Transformierung zu erzeugen, beispielsweise die FFT-Koeffizientendaten für FFT. Die Koeffizientendaten der entsprechenden Kanäle werden zur Bitzuteilungsanzahlentscheidungsschaltung 106 übertragen, wo die Bitzuteilungsanzahldaten für die entsprechenden Kanäle gebildet werden, und die Koeffizientendaten für die entsprechenden Kanäle werden quantisiert. Das Codierausgangssignal wird an einem Ausgangsanschluß 102 ausgegeben, während die Bitzuteilungsanzahldaten an einem Ausgangsanschluß 103 ausgegeben werden.
  • Auf die gleiche Weise wird durch Ersetzen der Einheitszeitblöcke aus den Kanaldaten, die breitere Bandbreiten für höhere Frequenzen haben, die Anzahl der Abtastungen in dem Einheitszeitblock kleiner für die unteren Frequenzkanäle der engeren Bandbreiten, während sie größer für die hohen Frequenzkanäle der breiteren Bandbreiten wird. Anders ausgedrückt wird die Frequenzauflösung für den unteren bzw. höheren Frequenzbereich niedriger bzw. höher. Durch Durchführen der orthogonalen Transformierung von jedem der Zeitblöcke der entsprechenden Kanäle können die Koeffizientendaten durch die orthogonale Transformierung in jedem Kanal über den ganzen Frequenzbereich in einem gleichen Intervall auf der Frequenzachse erhalten werden, so daß die gleiche hohe Frequenzauflösung sowohl auf der hohen als auch auf der niederen Frequenzseite realisiert werden kann.
  • Wenn man die menschliche Hörkennlinie betrachtet, wo die Frequenzauflösungsleistung im unteren Frequenzbereich hoch sein soll, braucht sie im Hochfrequenzbereich nicht so hoch zu sein. Aus diesem Grund besteht bei den vorliegenden Ausführungsformen der Einheitszeitblock, in welchem die orthogonale Transformierung durchgeführt wird, aus der gleichen Anzahl von Abtastdaten für jedes Band oder jeden Kanal. In anderen Worten ausgedrückt hat der Einheitszeitblock verschiedene Blocklängen von einem Kanal zum anderen in einer Weise, daß der untere Bereich eine längere Blocklänge hat und der hohe Bereich eine kürzere Blocklänge. Das heißt, daß die Leistung der Frequenzauflösung auf einem hohen Wert für den unteren Frequenzbereich gehalten wird, während sie so eingestellt wird, daß sie nicht höher als notwendig für den höheren Frequenzbereich ist, und die Leistung der zeitlichen Auflösung wird so eingestellt, daß sie für den höheren Frequenzbereich hoch ist.
  • Es sei angemerkt, daß bei der vorliegenden Ausführungsform die Blöcke mit der gleichen Anzahl von Abtastungen der orthogonalen Transformierung für die Kanäle CH1 bis CH5 unterworfen werden, so daß die gleiche Anzahl der Koeffizientendaten, beispielsweise 64-Punkt (pt)- Koeffizientendaten in den entsprechenden Kanälen erhalten werden können. In diesem Fall beträgt die Kanalblocklänge 32 ms für den Kanal CH1, 32 ms für den CH2, 16 ms für den Kanal CH3, 8 ms für den Kanal CH4 und 4 ms für den Kanal CH5. Wenn die schnelle Fourier- Transformation durch die oben erwähnte orthogonale Transformierung durchgeführt wird, ist nach dem Beispiel von Fig. 5 die Menge der Verarbeitung gleich 64 log&sub2; 64 für die Kanäle CH1 und CH2, 64 log&sub2; 64x2 für den Kanal CH3, 64 log&sub2; 64x4 für den Kanal CH4 und 64 log&sub2; 64x8 für den Kanal CH5. Bei der schnellen Fourier-Transformation für den ganzen Frequenzbereich ist die Menge der Verarbeitung gleich 1024 log&sub2; 1024=1024x10 für die Abtastfrequenz fs = 32 kHz und die Koeffizientendaten sind 1024 pt für die Blocklänge gleich 32 ms.
  • Mit dem oben beschriebenen Aufbau der vorliegenden Ausführungsform kann eine höhere Leistung der Frequenzauflösung im unteren Frequenzbereich erhalten werden, der für den menschlichen Hörsinn kritisch ist, während das Erfordernis für eine höhere vorübergehende Auflösung, die notwendig bei transienten Signalen ist, die reich an hohen Frequenzkomponenten sind, wie in Fig. 8 gezeigt ist, ebenfalls erfüllt werden kann. Die Filterbank, die orthogonalen Transformationsschaltungen oder dergleichen können derart sein, wie sie üblicherweise verwendet werden, so daß der Aufbau einfach und preiswert sein kann, und die Verzögerungszeit in jeder Schaltung der Vorrichtung vermindert werden kann.
  • Fig. 6 zeigt einen konkreten Aufbau der Filterbank 104. In dieser Figur werden die 0 bis 16 kHz - Eingangsdigitaldaten mit der Abtastfrequenz fs = 32 kHz zu einem Eingangsanschluß 140 der Filterbank 104 geliefert. Diese digitalen Eingangsdaten werden zuerst zu einem Filter QMF 141 geliefert, wo die 0 bis 16 kHz - Eingangsdigitaldaten in 0 bis 8 kHz - Ausgangsdaten und 8 bis 16 kHz - Ausgangsdaten geteilt werden, wobei die 8 bis 16 kHz - Ausgangsdaten zu einer Niederbereichsumwandlungsschaltung 145&sub5; geliefert werden. Die 8 bis 16 kHz - Daten werden einer Abwärts-Abtastung in der Niederbereichsumwandlungsschaltung 145&sub5; unterzogen, um 0 bis 8 kHz - Daten zu erzeugen, die am Ausgangsanschluß 149&sub5; ausgegeben werden. Die 0 bis 8 kHz - Ausgangsdaten vom QMF 141 werden zu einem Filter QMF 142 übertragen, wo sie in ähnlicher Weise in ein 4 bis 8 kHz - Ausgangssignal geteilt werden, das zu einer Niederbereichsumwandlungsschaltung 145&sub4; übertragen wird, und ein 0 bis 4 kHz Ausgangssignal, das zu einem QMF 143 übertragen wird. Die 0 bis 4 kHz Daten, die in die Basisbanddaten konvertiert wurden, werden in der Niederbereichsumwandlungsschaltung 145&sub4; erhalten, so daß sie am Ausgangsanschluß 149&sub4; ausgegeben werden. Auf ähnliche Weise wird ein 0 bis 2 kHz - Ausgangssignal und 2 bis 4 kHz Ausgangssignal im Filter QMF 143 erzeugt, während ein 0 bis 1 kHz - Ausgangssignal und 1 bis 2 kHz - Ausgangssignal im Filter QMF 144 erzeugt wird, um dann in Niederbereichssignale in Niederbereichsumwandlungsschaltungen 145&sub3; bis 145&sub1; konvertiert werden, bevor sie an den Ausgangsanschlüssen 149&sub3; bis 149&sub1; ausgegeben werden. Diese Ausgangssignale werden über Kanäle CH1 bis CH5 zu den orthogonalen Transformationsschaltungen 105&sub1; bis 105&sub5; übertragen, wobei die Niederfrequenzumwandlungsschaltung 145&sub1; weggelassen werden kann, wenn dies gewünscht wird.
  • Fig. 7 zeigt den Aufbau eines Decodierers. In dieser Figur wird das oben erwähnte Codierausgangssignal zu einem Eingangsanschluß 122 geliefert, während die oben erwähnte Bitzuteilungszahlinformation zu einem Eingangsanschluß 123 geliefert wird. Diese Daten werden zu einem Kanalinformationsgenerator 127 geliefert, wo die Daten des Codierausgangssignals in Koeffizientendaten der entsprechenden Kanäle auf der Basis der Bitzuteilungsanzahlinformation wiederhergestellt werden. Diese wiederhergestellten Koeffizientendaten werden zu Umkehrorthogonalumwandlungsschaltungen 125&sub1; bis 125&sub5; übertragen, wo ein Umkehrbetrieb gegenüber dem in den orthogonalen Umwandlungsschaltungen 105&sub1; bis 105&sub5; durchgeführt wird, um Daten zu erzeugen, bei denen die Frequenzachse in die Zeitachse konvertiert ist. Die Daten der entsprechenden Kanäle auf der Zeitachse werden durch ein Synthesefilter 124 decodiert, bevor sie als Codierausgangsdaten am Ausgangsanschluß 121 ausgegeben werden.
  • Bei der Bildung der Bitzuteilungsinformation für jeden Kanal in der Bitzuteilungsanzahlentscheidungsschaltung 106 von Fig. 4 wird der zulässige Signalrauschpegel eingestellt und der Verdeckungseffekt wird in diesem Zeitpunkt in Betracht gezogen, so daß der zulässige Geräuschpegel für die höhere Bandfrequenz für den gleichen Energiewert höher sein wird, um die Bitanzahl für jedes Band zu bestimmen. Die Verdeckung bedeutet Maßnahmen sowohl für die Verdeckungsmaßnahmen für Signale auf der Zeitachse als auch für Signale auf der Frequenzachse. Damit kann durch den Verdeckungseffekt ein Rauschen in den verdeckten Signalen, wenn solches vorhanden sind, nicht gehört werden. Folglich ist bei den tatsächlichen Audiosignalen jegliches Rauschen in den verdeckten Signalen auf der Frequenzachse zulässiges Rauschen, so daß während der Quantisierung der Audiodaten es möglich wird, die Anzahl der zugeteilten Bits entsprechend dem zulässigen Rauschpegel zu vermindern.
  • Bei der oben beschriebenen zweiten Ausführungsform der hochwirksamen Codierung für digitale Daten werden die digitalen Eingangsdaten in mehrere Bänder aufgeteilt, so daß die Bandbreite für den höheren Frequenzbereich höher wird, wobei Blöcke, die jeweils aus mehreren Abtastungen bestehen, für jedes Band gebildet werden, und die orthogonale Transformation für jeden der Blöcke wird durchgeführt, um die Koeffizientendaten zu erzeugen, um ein Codieren mit einer höheren Frequenzauflösungsleistung zu realisieren. Der orthogonale Transformationsblock besteht aus der gleichen Anzahl von Abtastdaten für jedes Band, so daß eine höhere Leistung der Frequenzauflösung, die für den unteren Frequenzbereich erforderlich ist, realisiert werden kann, während das Erfordernis nach einer hohen Leistung einer zeitweiligen Auflösung für transiente Signale, die viele hohe Frequenzkomponenten enthalten, ebenfalls erfüllt werden kann.
  • Auf diese Weise kann eine hochwirksame Codierung, die zur menschlichen Hörkennlinie paßt, erzielt werden. Der Aufbau des Codierers der vorliegenden Ausführungsform kann einfach und kostengünstig sein, da die verwendeten Komponenten herkömmlicher Art sein können.

Claims (2)

1. Digitale Signalcodiervorrichtung, die aufweist:
eine Einrichtung zum Aufteilen von digitalen Eingangssignalen auf mehrere Frequenzbänder (B1 bis B4), die so eingestellt sind, daß die Bänder mit höheren Frequenzen (B3, B4) breitere Bandbreiten haben werden, und
eine Einrichtung (6) zur künstlichen Erzeugung und Ausgabe von codierten Signalen an jedes der Frequenzbänder,
dadurch gekennzeichnet, daß vorgesehen ist
eine Einrichtung (21-24/105) zur Ermittlung - durch Spektralanalyse - von Eigenschaften der Frequenzkomponenten der Frequenzbänder, wobei die Periode der Spektralanalysen, welche die Zeitbreite als eine Einheit der Analysen entlang der Zeitachse ist, so ausgewählt wird, daß sie länger für niedrigere Frequenzen ist, und zur Ausgabe eines entsprechenden Ausgangssignals; und
eine Einrichtung (31-34/106) zum Steuern des künstlichen Erzeugens und der Codierung als eine Funktion des Ermittlungsausgangssignals.
2. Digitale Signalcodiervorrichtung nach Anspruch 1, bei der die eingegebenen digitalen Signale eine bestimmte Abtastrate haben, die durch ein Taktsignal bestimmt wird, und bei der die Ermittlungseinrichtung eine Einrichtung (3 - 5) aufweist, um Taktsignale aus dem Abtastratentaktsignal herzuleiten, wobei die entsprechenden Frequenzen dieser Taktsignale bei der Spektralanalyse verwendet werden, die so ausgewählt werden, daß sie für die unteren Frequenzbänder niedriger sind.
DE69023604T 1989-09-26 1990-09-25 Digitalsignalkodiergerät. Expired - Lifetime DE69023604T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1249835A JP2906477B2 (ja) 1989-09-26 1989-09-26 ディジタル信号符号化方法
JP1278207A JP2906483B2 (ja) 1989-10-25 1989-10-25 ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置

Publications (2)

Publication Number Publication Date
DE69023604D1 DE69023604D1 (de) 1995-12-21
DE69023604T2 true DE69023604T2 (de) 1996-04-18

Family

ID=26539517

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69023604T Expired - Lifetime DE69023604T2 (de) 1989-09-26 1990-09-25 Digitalsignalkodiergerät.

Country Status (4)

Country Link
US (2) US5115240A (de)
EP (1) EP0420745B1 (de)
KR (1) KR100242864B1 (de)
DE (1) DE69023604T2 (de)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5502789A (en) * 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5365553A (en) * 1990-11-30 1994-11-15 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal
JP3158458B2 (ja) * 1991-01-31 2001-04-23 日本電気株式会社 階層表現された信号の符号化方式
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
DE4124493C1 (de) * 1991-07-24 1993-02-11 Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De
ES2164640T3 (es) * 1991-08-02 2002-03-01 Sony Corp Codificador digital con asignacion dinamica de bits de cuantificacion.
DE4225434A1 (de) * 1991-08-02 1993-02-04 Sony Corp Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0786874B1 (de) * 1991-09-30 2000-08-16 Sony Corporation Verfahren und Einrichtung zur Audiodatenkompression
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
US5304994A (en) * 1992-06-09 1994-04-19 Hewlett Packard Company Minimal delay leading one detector with result bias control
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3233234B2 (ja) * 1992-09-07 2001-11-26 ソニー株式会社 ディスク記録装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
JP3185413B2 (ja) * 1992-11-25 2001-07-09 ソニー株式会社 直交変換演算並びに逆直交変換演算方法及びその装置、ディジタル信号符号化及び/又は復号化装置
JPH06202285A (ja) * 1992-12-28 1994-07-22 Sony Corp 映写フィルム
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
US5392044A (en) * 1993-03-08 1995-02-21 Motorola, Inc. Method and apparatus for digitizing a wide frequency bandwidth signal
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
EP0653846B1 (de) * 1993-05-31 2001-12-19 Sony Corporation Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
EP0632597B1 (de) * 1993-06-29 2002-08-28 Sony Corporation Gerät und Verfahren zur Tonsignalübertragung
PL173718B1 (pl) * 1993-06-30 1998-04-30 Sony Corp Sposób i urządzenie do kodowania sygnałów cyfrowych
TW272341B (de) * 1993-07-16 1996-03-11 Sony Co Ltd
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
US5737720A (en) * 1993-10-26 1998-04-07 Sony Corporation Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation
KR100330290B1 (ko) * 1993-11-04 2002-08-27 소니 가부시끼 가이샤 신호부호화장치,신호복호화장치,및신호부호화방법
US5774844A (en) * 1993-11-09 1998-06-30 Sony Corporation Methods and apparatus for quantizing, encoding and decoding and recording media therefor
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
TW295747B (de) * 1994-06-13 1997-01-11 Sony Co Ltd
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
US5893065A (en) * 1994-08-05 1999-04-06 Nippon Steel Corporation Apparatus for compressing audio data
JP3536996B2 (ja) * 1994-09-13 2004-06-14 ソニー株式会社 パラメータ変換方法及び音声合成方法
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH1084284A (ja) * 1996-09-06 1998-03-31 Sony Corp 信号再生方法および装置
JP4121578B2 (ja) * 1996-10-18 2008-07-23 ソニー株式会社 音声分析方法、音声符号化方法および装置
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
US6476735B2 (en) * 2000-12-02 2002-11-05 Daniel David Lang Method of encoding bits using a plurality of frequencies
GB0108080D0 (en) * 2001-03-30 2001-05-23 Univ Bath Audio compression
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4657570B2 (ja) * 2002-11-13 2011-03-23 ソニー株式会社 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US9319028B2 (en) 2005-02-23 2016-04-19 Vios Medical Singapore Pte. Ltd. Signal decomposition, analysis and reconstruction using high-resolution filter banks and component tracking
US7706992B2 (en) * 2005-02-23 2010-04-27 Digital Intelligence, L.L.C. System and method for signal decomposition, analysis and reconstruction
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
DE102008015435B4 (de) * 2008-03-22 2010-05-27 Fette Gmbh Konusrändelwerkzeug
US8666753B2 (en) 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
US11602311B2 (en) 2019-01-29 2023-03-14 Murata Vios, Inc. Pulse oximetry system
CN110111800B (zh) * 2019-04-04 2021-05-07 深圳信息职业技术学院 一种电子耳蜗的频带划分方法、装置及电子耳蜗设备
US11095999B1 (en) * 2020-03-19 2021-08-17 Lisnr Channel-based control of audio transmissions

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3349183A (en) * 1963-10-29 1967-10-24 Melpar Inc Speech compression system transmitting only coefficients of polynomial representations of phonemes
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
JPS55125511A (en) * 1979-03-20 1980-09-27 Olympus Optical Co Ltd Method and device for channel division recording and reproduction
CH645501GA3 (de) * 1981-07-24 1984-10-15
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPH07118159B2 (ja) * 1982-12-06 1995-12-18 ソニー株式会社 Pcm信号記録方法
DE3314384A1 (de) * 1983-04-21 1984-10-25 Siemens AG, 1000 Berlin und 8000 München Uebertragungssystem
JPH07118160B2 (ja) * 1983-06-18 1995-12-18 ソニー株式会社 ディジタル情報信号の記録方法
US4516241A (en) * 1983-07-11 1985-05-07 At&T Bell Laboratories Bit compression coding with embedded signaling
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
JPS61107818A (ja) * 1984-10-30 1986-05-26 Nec Corp エントロピ−符号化方式とその装置
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4748579A (en) * 1985-08-14 1988-05-31 Gte Laboratories Incorporated Method and circuit for performing discrete transforms
EP0267344B1 (de) * 1986-10-30 1993-09-01 International Business Machines Corporation Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens
US4851906A (en) * 1986-11-04 1989-07-25 Nec Corporation Data compression using orthogonal transform and vector quantization
AU604807B2 (en) * 1986-12-19 1991-01-03 Sony Corporation Data recorder and method
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4882754A (en) * 1987-08-25 1989-11-21 Digideck, Inc. Data compression system and method with buffer control
JPH0213135A (ja) * 1988-06-30 1990-01-17 Sony Corp ディジタル信号伝送装置
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
US5384891A (en) * 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
EP0610975B1 (de) * 1989-01-27 1998-09-02 Dolby Laboratories Licensing Corporation Formatierung eines kodierten Signals für Kodierer und Dekodierer eines Audiosystems hoher Qualität
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5016107A (en) * 1989-05-09 1991-05-14 Eastman Kodak Company Electronic still camera utilizing image compression and digital storage
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
DE3925937A1 (de) * 1989-08-03 1991-02-14 Mannesmann Ag Motorischer antrieb mit einem mehrgaengigen getriebe fuer eine aussenhuelse
FR2653280B1 (fr) * 1989-10-13 1992-01-10 France Etat Dispositif d'allocation de bits pour signal audio-numerique transforme, a quantification adaptative sur critere psycho-auditif.
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5150387A (en) * 1989-12-21 1992-09-22 Kabushiki Kaisha Toshiba Variable rate encoding and communicating apparatus
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
JP3185214B2 (ja) * 1990-06-12 2001-07-09 日本電気株式会社 改良dctの順変換計算装置および逆変換計算装置
JPH0472909A (ja) * 1990-07-13 1992-03-06 Sony Corp オーディオ信号の量子化誤差低減装置
JP3141241B2 (ja) * 1990-08-24 2001-03-05 ソニー株式会社 ディスク記録装置及びディスク再生装置
JP3033156B2 (ja) * 1990-08-24 2000-04-17 ソニー株式会社 ディジタル信号符号化装置
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
EP0506394A2 (de) * 1991-03-29 1992-09-30 Sony Corporation Einrichtung zur Kodierung von digitalen Signalen
KR100312664B1 (ko) * 1991-03-29 2002-12-26 소니 가부시끼 가이샤 디지탈신호부호화방법
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
DE4225434A1 (de) * 1991-08-02 1993-02-04 Sony Corp Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
JP3198550B2 (ja) * 1991-09-03 2001-08-13 ソニー株式会社 圧縮データ記録方法及び圧縮データ記録再生装置
JP3158556B2 (ja) * 1991-09-27 2001-04-23 ソニー株式会社 ディスク記録装置及びディスク再生装置
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置

Also Published As

Publication number Publication date
USRE36559E (en) 2000-02-08
EP0420745B1 (de) 1995-11-15
KR100242864B1 (ko) 2000-02-01
US5115240A (en) 1992-05-19
EP0420745A3 (en) 1992-08-19
KR910007293A (ko) 1991-04-30
EP0420745A2 (de) 1991-04-03
DE69023604D1 (de) 1995-12-21

Similar Documents

Publication Publication Date Title
DE69023604T2 (de) Digitalsignalkodiergerät.
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE69116476T2 (de) Digitaler Signalverschlüssler
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
DE3878017T2 (de) System zur teilbandkodierung eines digitalen audiosignals.
DE69122306T2 (de) Digitales Teilbandsignalkodiergerät
DE69310990T2 (de) Verfahren zum Einfügen digitaler Daten in ein Audiosignal vor der Kanalkodierung
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE3784120T2 (de) Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate.
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE69534140T2 (de) Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren
EP0193143B1 (de) Verfahren zur Übertragung eines Audiosignals
DE69534273T2 (de) Verfahren und vorrichtung zum signalkodieren, signalubertragungsverfahren und verfahren und vorrichtung zur signaldekodierung
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE69401512T2 (de) Hybride adaptive bitzuteilung für audiokoder und -dekoder
DE3688980T2 (de) Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
DE69121606T2 (de) Gerät zur Kodierung digitaler Signale
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
EP0938831B1 (de) Gehörangepasste qualitätsbeurteilung von audiosignalen
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
EP0962015B1 (de) Verfahren und vorrichtungen zum codieren von diskreten signalen bzw. zum decodieren von codierten diskreten signalen
EP0414838A1 (de) Verfahren zur übertragung eines signals.
DE69533259T2 (de) Nichtlineares quantisieren eines informationssignales

Legal Events

Date Code Title Description
8364 No opposition during term of opposition