DE69333394T2 - Hochwirksames Kodierverfahren und -gerät - Google Patents

Hochwirksames Kodierverfahren und -gerät Download PDF

Info

Publication number
DE69333394T2
DE69333394T2 DE69333394T DE69333394T DE69333394T2 DE 69333394 T2 DE69333394 T2 DE 69333394T2 DE 69333394 T DE69333394 T DE 69333394T DE 69333394 T DE69333394 T DE 69333394T DE 69333394 T2 DE69333394 T2 DE 69333394T2
Authority
DE
Germany
Prior art keywords
correlation
input signals
highly efficient
efficient coding
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69333394T
Other languages
English (en)
Other versions
DE69333394D1 (de
Inventor
Hiroshi Suzuki
Makoto Akune
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of DE69333394D1 publication Critical patent/DE69333394D1/de
Publication of DE69333394T2 publication Critical patent/DE69333394T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die Erfindung betrifft ein hocheffizientes Kodierverfahren und -gerät zum Komprimieren und Quantisieren von Eingangssignalen, insbesondere ein hocheffizientes Kodierverfahren und -gerät zum simultanen Komprimieren von Eingangssignalen mehrerer Kanäle und zu ihrer Quantisierung.
  • Es sind vielfältige Verfahren für die hocheffiziente Kodierung von Audiosignalen oder Sprachsignalen bekannt. So ist z. B. in M. A. Kransner MIT, "The critical band coder – digital encoding of the perceptual requirements of the auditory system", ICASSP 1980, ein Verfahren mit fester Bitzuteilung bekannt, bei dem der Verdeckungseffekt des Gehörsinns ausgenutzt wird, um die erforderlichen Signal-Rauschverhältnisse für eine Anzahl von Frequenzbändern zu liefern. Da bei diesen Verfahren die Bitzuteilung für den Fall, daß die Eigenschaften mit einem sinusförmigen Eingangssignal gemessen werden, jedoch fest ist, ist es nicht möglich, gute Kennwerte zu erzielen.
  • Zur Lösung dieses Problems wird ein hocheffizientes Kodiergerät vorgeschlagen, bei dem alle für die Bitzuteilung nutzbaren Bits aufgeteilt werden in Bits für ein festes Bitzuteilungsmusters, das für jeden aus einer Anzahl von kleinen Datenblöcken im voraus festgelegt wird, und in Bits für eine von den Magnituden der Signale in den betreffenden Blöcken abhängige Bitzuteilung, so daß das Aufteilungsverhältnis von einem auf ein Eingangssignal bezogenes Signal abhängig gemacht werden kann und so das Aufteilungsverhältnis für das feste Bitzuteilungsmuster größer sein kann, wenn das Spektrum des Signals glatter wird.
  • Wenn die Signalenergie bei einer spezifischen Spektralkomponente konzentriert ist, wie dies bei einem sinusförmigen Eingangssignal der Fall ist, kann läßt sich bei diesem Verfahren durch Zuteilung einer größeren Bitzahl zu einem Block, der diese Spektralkomponente enthält, das gesamte Signal-/Rauschverhalten markant verbessern. Im allgemeinen ist der menschliche Gehörsinn extrem empfindlich für ein Signal, das eine steil ansteigende Spektralkomponente aufweist. Deshalb führt die Verbesserung in dem Signal-/Rauschverhalten durch ein solches Verfahren nicht nur zu einer Verbesserung der gemessenen numerischen Werte, sondern bewirkt auch vom Standpunkt des Gehörsinns eine Verbesserung der Tonqualität.
  • Wenn die Bitzuteilung in Abhängigkeit von den Eingangssignalen jedoch einfach auf der Basis einer Verbesserung des Signal-/Rauschverhaltens durchgeführt wird und versucht wird, ein Signal, das wie z. B. der Klang eines Triangels, das eine große Zahl von steil ansteigenden Spektralkomponenten enthält, mit einer niedrigen Bitrate zu komprimieren, können den den betreffenden Spektralkomponenten entsprechenen Blöcken nicht genügend viele Bits zugeteilt werden, so daß vom Standpunkt des Gehörsinns keine ausreichend gute Tonqualität erreichbar ist.
  • Im Hinblick auf die obigen Ausführungen hat die Inhaberin der vorliegenden Anmeldung in der US-Patentanmeldung S. N. 08/011 376, eingereicht am 29. Januar 1993, ein Verfahren vorgeschlagen, bei dem alle für die Bitzuteilung verfügbaren Bits für die Benutzung aufgeteilt werden in Bits eines festen Bitzuteilungsmusters, das für ein kurzes Zeitintervall im voraus festgelegt wird, und Bits für eine Bitzuteilung in Abhängigkeit von den Magnituden der Signale der betreffenden Blöcke, so daß die Bitzuteilung in der Weise erfolgt, daß für die von den Magnituden der Signale der betreffenden Blöcke abhängige Bitzuteilung eine Gewichtung nach Maßgabe der entsprechenden Blockbänder sowie der festen Bitzuteilungsmuster vorgenommen wird.
  • Bei allen oben beschriebenen Verfahren wird die Quantisierung allerdings nur für Eingangssignale des jeweiligen Kanals durchgeführt. Wenn die obigen Verfahren jedoch auf ein Gerät mit mehreren Kanälen angewendet wird, die die gleiche Kompressionsrate haben wie im Fall eines einzelnen Kanals, erhält man folgende Ergebnisse. Während gute Ergebnisse erreicht werden können, wenn die Eingangssignale der betreffenden Kanäle stark korreliert sind, können zwischen Kanälen, in denen die Signale schwach korreliert sind, Differenzen in den Quantisierungsfehlern auftreten, so daß die stationäre Qualität des Klangbilds beeinträchtigt wird.
  • ICASSP '89, Band 3, Mai 1989, NY, USA, Seiten 1993–1996, Johnston "Perceptual Transform Coding of Wideband Stereo Signals" beschreibt einen Stereosignal-Kodierer, in dem die Eingangssignale der Kanäle L und R in L + R- und L – R-Signale umgewandelt werden, die dann gefenstert, einer Fourier-Transformation unterzogen und quantisiert werden. Die L + R-und L – R-Signale werden jeweils unter Anwendung der gleichen Wahrnehmungsschwelle quantisiert.
  • Im Hinblick auf diesen Stand der Technik ist es ein Ziel der vorliegenden Erfindung, ein hocheffizientes Kodierverfahren und -gerät zur Verfügung zu stellen, bei dem die Größe des Quantisierungsgeräuschs zwischen den Kanälen gesteuert wird, wenn den mehreren Kanälen Eingangssignale zugeführt werden, und dadurch eine optimale stationäre Qualität des Klangbilds verwirklicht wird.
  • Nach einem Aspekt der Erfindung ist ein hocheffizientes Kodierverfahren vorgesehen zum Komprimieren und Quantisieren von Eingangssignalen aus mehreren Kanälen, wobei das Verfahren umfaßt:
    Durchführen einer Quantisierung mit einer Bitzuteilung, die unter Berücksichtigung der Korrelation der Eingangssignale während der Komprimierung der Eingangssignale der jeweiligen Kanäle bestimmt wird,
    und dadurch gekennzeichnet ist,
    daß das Verfahren ferner den Verfahrensschritt umfaßt, daß die Korrelation angepaßt wird, um eine Modifizierung der spektralen Leistung herbeizuführen, um optimale Korrelation auf der Basis der spektralen Daten auf der Frequenzachse der jeweiligen Kanäle aufrechtzuerhalten.
  • Ein zweiter Aspekt der Erfindung sieht ein hocheffizientes Kodierverfahren nach dem ersten Aspekt vor, bei dem die Eingangssignale Sprachsignale sind und das Verfahren die Eigenschaften des menschlichen Gehörsinns ausnutzt.
  • Ein dritter Aspekt der Erfindung sieht eine hocheffiziente Kodiervorrichtung vor zum Komprimieren und Quantisieren von Eingangssignalen aus mehreren Kanälen, wobei die Vorrichtung aufweist:
    eine Einrichtung zur Durchführung einer Quantisierung mit einer Bitzuteilung, die unter Berücksichtigung der Korrelation der Eingangssignale während der Komprimierung der Eingangssignale der jeweiligen Kanäle bestimmt wird,
    und dadurch gekennzeichnet ist,
    daß die Vorrichtung ferner eine Einrichtung aufweist zum Anpassen der Korrelation, um eine Modifizierung der spektralen Leistung herbeizuführen, um optimale Korrelation auf der Basis der spektralen Daten auf der Frequenzachse der jeweiligen Kanäle aufrechtzuerhalten.
  • Ein vierter Aspekt der Erfindung sieht ein hocheffizientes Kodiergerät nach dem dritten Aspekt vor, bei dem die Eingangssignale Sprachsignale sind und das Gerät die Eigenschaften des menschlichen Gehörsinns ausnutzt.
  • Die Korrelation zwischen den Kanälen, die bei dieser Bitzuteilung ausgenutzt wird, ist vorzugsweise als numerischer Wert gegeben, der von den Eingangssignalen abhängig ist. Die Korrelation kann jedoch auch einen festen Wert annehmen oder einen Wert, der unter Berücksichtigung eines von den Eingangssignalen abhängigen Werts und des festen Werts in einem konstanten oder einem variablen Verhältnis erzeugt wird. Außerdem können auch gute Ergebnisse auch erzielt werden, indem die betreffenden Koeffizienten für eine Bitzuteilung geändert werden.
  • Die Korrelation, die bei dieser Koeffizientenänderung benutzt wird, kann aus Spektraldaten auf der Frequenzachse des Eingangssignals oder aus Koeffizientendaten bei der orthogonalen Transformation ermittelt werden, oder sie kann aus der Floating-Information als Teil der Quantisierungsergebnisse ermittelt werden.
  • Gemäß vorliegender Erfindung kann bei der Realisierung einer effizienten Bitzuteilung unter Berücksichtigung des Gehörsinns bei der Kodierung von Eingangssignalen mehrerer Kanäle eine Verschlechterung der stationären Qualität des Tonbilds aufgrund der Differenz der Quantisierungsfehler zwischen den betreffenden Kanälen reduziert oder vermieden werden. Außerdem können wegen der Tendenz, daß das erzeugte Quantisierungsgeräusch an einer Position konzentriert ist, in der auch die stationäre Qualität des Klangbilds konzentriert ist, Maskiereffekte effizienter genutzt werden als zuvor. Es ist dementsprechend möglich, mit niedrigerer Bitrate Musiksignale mit hoher Qualität zu kodieren.
  • Die Erfindung wird unter Bezugnahme auf die anliegenden Zeichnungen an einem Ausführungsbeispiel näher erläutert.
  • 1 zeigt ein Blockschaltungsdiagramm eines Ausführungsbeispiels eines hocheffizienten Kodiergeräts gemäß der Erfindung,
  • 2 zeigt eine Ansicht, aus der die Frequenz- und Zeitteilung eines Signals in dem Gerät hervorgeht,
  • 3 zeigt ein Beispiel für den Algorithmus einer Korrelationsanpassungsschaltung in dem Gerät,
  • 4 zeigt ein Beispiel für eine für jeden Kanal getrennt berechnete Bitzuteilung zur Erläuterung der Funktion der Korrelationsanpassungsschaltung des Geräts,
  • 5 zeigt ein Beispiel für eine unter Berücksichtigung der Korrelationsinformation zwischen den Kanälen berechnete Bitzuteilung zur Erläuterung der Funktion der Korrelationsanpassungsschaltung des Geräts.
  • Im folgenden wird anhand der anliegenden Zeichnungen ein bevorzugtes Ausführungsbeispiel des hocheffizienten Kodierverfahrens und -geräts gemäß der Erfindung beschrieben. Zunächst wird anhand von 1 ein Verfahren zur hocheffizienten Kodierung von digitalen Eingangssignalen, wie PCM-Audiosignalen, unter Verwendung von Verfahren mit sogenannter Subband-Kodierung (SBC), adaptiver Transformationskodierung (ATC) und adaptiver Bitzuteilung (APC-AB) erläutert.
  • In dem hocheffizienten Kodiergerät gemäß der Erfindung wird bei der simultanen Komprimierung von PCM-Eingangsaudiosignalen mehrerer Kanäle eine Quantisierung durchgeführt, die die Korrelation zwischen den betreffenden Kanälen berücksichtigt. Die Korrelation zwischen den betreffenden Kanälen kann ermittelt werden, indem sie konstant aus den Eingangssignalen berechnet wird, oder sie kann aus Spektraldaten der Eingangssignale auf der Zeitachse oder aus Koeffizientendaten bei der orthogonalen Transformation ermittelt werden, oder sie kann aus der Floating-Information eines anderen Kanals ermittelt werden. Die Quantisierung kann auch ohne Berücksichtigung der Eingangssignale auf der Basis einer konstanten Korrelation durchgeführt werden. Außerdem kann die Quantisierung durchgeführt werden, indem die von den Eingangssignalen abhängige Korrelation und die konstante Korrelation in einem variablen Verhältnis berücksichtigt werden.
  • Bei dem in 1 konkret dargestellten hocheffizienten Kodiergerät wird ein digitales Eingangssignal frequenzmäßig mit Hilfe von Filtern in mehrere Frequenzbänder unterteilt, und für jedes der betreffenden Frequenzbänder wird eine orthogonale Transformation durchgeführt, wobei eine adaptive Bitzuteilung erfolgt und die resultierenden spektralen Daten auf der Frequenzachse für jedes sogenannte kritische Band kodiert werden, wie dies weiter unten beschrieben wird, wobei die Eigenschaften des menschlichen Gehörsinns berücksichtigt werden. Natürlich kann die Frequenzband-Unterteilungsbreite einer blockfreien Unterteilung mit Hilfe von Filtern eine gleichförmige Unterteilungsbreite sein.
  • Bei dem Ausführungsbeispiel der Erfindung wird außerdem die Blockgröße (Blocklänge) in Abhängigkeit von dem Eingangssignal vor der orthogonalen Transformation adaptiv geändert, und für jedes kritische Band oder für jeden Block, der durch weitere Unterteilung des kritischen Bandes in dem höheren Frequenzbereich gebildet wird, wird eine Floating-Verarbeitung durchgeführt. Das kritische Band ist ein Frequenzband, das unter Berücksichtigung der Eigenschaften des menschlichen Gehörsinns unterteilt ist, d. h., ein Band mit Schmalbandrauschen, wenn ein reiner Ton durch dieses Rauschen maskiert wird, das in der Nähe der Frequenz des reinen Tons die gleiche Intensität hat wie dieser. In diesem kritischen Band wird die Bandbreite in Richtung auf höhere Frequenzen größer, und das gesamte Audiofrequenzband von 0~20 kHz ist z. B. in 25 kritische Bänder unterteilt.
  • In der Anordnung von 1 wird einem Eingang 10 z. B. ein PCM-Audiosignal mit 0~20 kHz zugeführt. Dieses Eingangssignal wird mit Hilfe eines Bandteilungsfilters 11, z. B. eines sogenannten QMF-Filters frequenzmäßig in ein Frequenzband von 0~10 kHz und ein Frequenzband von 10 kHz~20 kHz unterteilt, und das Signal in dem Frequenzband von 0~10 kHz wird mit Hilfe eines Frequenzteilungsfilters 12, z. B. eines sog. QMF-Filters, weiter unterteilt in ein Frequenzband von 0~5 kHz und ein Frequenzband von 5 kHz~10 kHz. Das Signal in dem Frequenzband von 10 kHz~20 kHz aus dem Frequenzbandfilter 11 wird einer Schaltung zur modifizierten diskreten Cosinustransformation (MDTC-Schaltung) 13 zugeführt, die ein Beispiel für eine orthogonale Transformationsschaltung darstellt, und das Signal in dem Frequenzband von 5 kHz~10 kHz aus dem Frequenzteilungsfilter 12 wird einer MDCT-Schaltung 14 zugeführt, während das Signal in dem Frequenzband von 0~5 kHz aus dem Frequenzteilungsfilter 12 einer MDCT-Schaltung 15 zugeführt wird. Auf diese Weise werden diese Signale jeweils individuell einer MDCT-Verarbeitung unterzogen. Ein konkretes Beispiel für Blockgrößen der betreffenden MDCT-Schaltungen 13, 14, 15 ist in 2 dargestellt. In dem konkreten Beispiel von 2 wird auf der Seite höherer Frequenzen des Spektrums die Frequenzbandbreite vergrößert und die zeitliche Auflösung verbessert (die Blocklänge wird verkürzt.
  • Das heißt, in dem Beispiel von 2 wird die MDCT-Verarbeitung für Blöcke bH1, bH2 des Signals in dem Frequenzband von 10 kHz~20 kHz auf der Seite höherer Frequenzen insgesamt zweimal durchgeführt, während die MDCT-Verarbeitung für einen Block bL eines Signals im Frequenzband von 0~5 kHz auf der Seite niedrigerer Frequenzen und für einen Block bM eines Signals in dem Frequenzband von 5 kHz~10 kHz in dem mittleren Frequenzbereich durchgeführt wird. Auf diese Weise wird die Zahl der Block-Abtastproben der orthogonalen Transformation in den betreffenden Bändern gleich groß gemacht und das Gerät dadurch vereinfacht, und gleichzeitig wird auf der Seite niedrigerer Frequenzen, wo die kritische Bandbreite klein ist, die Frequenzauflösung verbessert, während auf der Seite höherer Frequenzen, wo zahlreiche Komponenten enthalten sind, die über einem transienten Signal liegen, die zeitliche Auflösung verbessert wird. Außerdem können bei der vorliegenden Erfindung die betreffenden Bänder adaptiv in zwei Blöcke oder vier Blöcke unterteilt werden, wenn die zeitliche Änderung des Signals groß ist.
  • Es sei noch einmal auf 1 Bezug genommen. Die Spektraldaten oder die MDCT-Koeffizientendaten auf der Frequenzachse, die durch die MDCT-Verarbeitung in den betreffenden MDCT-Schaltungen 13, 14, 15 erzeugt werden, werden für jedes kritische Band oder für jedes der durch weitere Unterteilung des kritischen Bandes gebildeten Bänder kombiniert. Die so kombinierten Daten werden Pegelkorrekturschaltungen 22, 23, 24, Korrelationsanpassungsschaltungen 28, 29, 30 und einer Schaltung 31 für die Übertragung zu anderen Kanälen zugeführt. Die Korrelationsanpassungsschaltungen 28, 29, 30 führen eine Modifizierung durch, um auf der Basis der über einen Eingang 38 gewonnenen Spektraldaten auf der Frequenzachse des anderen Kanals und der MDCT-Koeffizientendaten eine gewünschte Korrelation aufrechtzuerhalten, und übertragen sie dann zu den Schaltungen 16, 17, 18 zur adaptiven Bitzuteilung. Für diese Modifizierung kann die dem Eingangssignal entsprechende Korrelation oder ein festes Muster benutzt werden.
  • Die Schaltung 31 zur Übertragung zu anderen Kanälen gibt an einem Ausgang 39 die Spektraldaten auf der Frequenzachse jedes Bandes oder die MDCT-Koeffizientendaten als Korrelationsinformation entsprechend einem Datenformat für die Verwendung in den Korrelati onsanpassungsschaltungen und für die zeitliche Abstimmung aus. Der Ausgang 39 ist mit dem Eingang 38 des anderen Kanals verbunden. Die zu dem anderen Kanal zu übertragende Korrelationsinformation kann auf der Basis der an den Ausgängen 35, 36, 37 ausgegebenen Floating-Information erzeugt werden. Die Schaltungen 16, 17, 18 zur adaptiven Bitzuteilung teilen die Bitzahl zu, um die Bitrate zu erzeugen, die für jedes kritische Band benötigt wird oder für jedes Band, das auf der Seite höherer Frequenzen durch weitere Unterteilung des kritischen Bands gebildet wird, und übertragen die Daten zu den Pegelkorrekturschaltungen 22, 23, 24 und Kodierschaltungen. In den Pegelkorrekturschaltungen werden aus der von den Schaltungen zur adaptiven Bitzuteilung zugeteilen Bitzahl die Quantisierungsfehler ermittelt, und dementsprechend werden die Spektraldaten auf der Frequenzachse oder die Koeffizientendaten fehlerkorrigiert und zu den Kodierschaltungen übertragen.
  • Die Kodierschaltungen requantisieren die pegelkorrigierten Spektraldaten auf der Frequenzachse oder die MDCT-Koeffizientendaten entsprechend der von den Schaltungen zur adaptiven Bitzuteilung zugeteilten Bitzahl. Die so kodierten Daten werden an Ausgängen 32, 33, 34 ausgegeben. Gleichzeitig werden die Floating-Information, die angibt, für welche Magnitude des Signals die Normierung durchgeführt wird, und die Bitlängeninformation, die angibt, mit welcher Bitlänge die Quantisierung durchgeführt wird, simultan über die Ausgänge 35, 36, 37 übertragen. Die Ausgangssignale der in 1 dargestellten MDCT-Schaltungen 13, 14, 15 werden über den in 3 dargestellten Eingang 302 einer Schaltung 304 zur Berechnung der Korrelationsinformation zugeführt. Die dem in 1 dargestellten Eingang 38 zugeführte Information wird über den in 3 dargestellten Eingang 301 der Schaltung 304 zur Berechnung der Korrelationsinformation zugeführt. Die Schaltung 304 zur Berechnung der Korrelationsinformation berechnet die dem Eingangssignal entsprechende Korrelationsinformation aus dem Signal an dem Eingang 301 und einem Koeffizienten, der von einer Koeffiziententabelle 306 geliefert wird. Es wird ein Beispiel für die Berechnung erläutert, wobei von einem normalen Zweikanal-Stereosignal ausgegangen wird. Wenn die n-te Spektralleistung des linken Kanals und die n-te Spektralleistung des rechten Kanals durch Pl(n) bzw. Pr(n) dargestellt werden, wobei beide in logarithmischem Maßstab angegeben sind, und der von der Koeffiziententabelle 306 gelieferte, der n-ten Spektralleistung entsprechende Koeffizient durch K(n) dargestellt wird, kann die Korrelationsinformation der betreffenden Kanäle ΔPl(n), ΔPr(n) nach den folgenden Gleichungen ermittelt werden: (1) ΔPl(n) = (Pr(n) – Pl(n)) × K(n) (2) ΔPr(n) = (Pl(n) – Pr(n)) × K(n)
  • Wie aus den Gleichungen (1) und (2) hervorgeht, zeigt die Korrelationsinformation, daß 0 die stärkste Korrelation ausdrückt und ein größerer Absolutwert des numerischen Werts eine schwächere Korrelation ausdrückt. Es wird davon ausgegangen, daß der Koeffizient K(n) auf den Eigenschaften des menschlichen Gehörsinns basiert, z. B. den Eigenschaften, die die Richtungswahrnehmung betreffen, die über eine lange Zeit erforscht wurden, und als deren Faktoren die Intensitätsdifferenz, die Phasendifferenz und die zeitliche Differenz bei der Ausbreitung eines Schalls zu den beiden Ohren betrachtet werden, wie dies in Dave, E. E. Jr., Gutman, N. und v. Bergeijk, W. A.: J. Acoust. Soc. Am., 31, Seiten 774–784, (1959) beschrieben ist. Zusätzlich zu diesen Faktoren werden Anderungen beobachtet, die auf die Frequenz und Schalldruckpegel zurückzuführen sind. Außerdem ist es aus der alltäglichen Erfahrung bekannt, daß der Ort eine Schallquelle eines ultratiefen oder ultrahohen Tons schwer zu identifizieren ist. Auf diese Weise ändert sich die menschliche Richtungswahrnehmung in Abhängigkeit von der Frequenz und dem Schalldruck des Tons. Deshalb ist es trotz eines einzelnen Spektralleistungsverhältnisses erforderlich, eine der Frequenz und dem Schalldruck entsprechende Korrektur durchzuführen. In diesem Fall kann bei der Berechnung die Korrelationsinformation für alle Spektraldaten auf der Frequenzachse ermittelt werden, oder sie kann für jedes Floating-Band bei der Quantisierung ermittelt werden. Es ist außerdem offensichtlich, daß die gleichen Ergebnisse durch die Verwendung der Koeffizienten für das Floating anstelle der Spektralleistungen gewonnen werden können.
  • Die von der Schaltung 304 zur Berechnung der Korrelationsinformation ermittelte Korrelationsinformation wird einer Schaltung 305 zur Festlegung der Korrelationsinformation zugeführt. Die Schaltung 305 zur Festlegung der Korrelationsinformation synthetisiert die feste Korrelationsinformation, die durch eine feste Korrelationsinformationstabelle 307 gewonnen wird, und die von den Eingangssignalen abhängige Korrelation, die aus der Schaltung 304 zur Berechnung der Korrelationsinformation gewonnen wird, in einem konstanten oder einem variablen Verhältnis und führt die synthetisierte Korrelationsinformation der Leistungsjustierschaltung 308 zu. Wenn die feste Korrelationsinformation mit Pfix(n) und das Synthetisierverhältnis mit R(n) bezeichnet wird, wobei 0 ≤ R(n) ≤ 1,0, können die Ausgangssignale Cl(n), Cr(n) der Schaltung 305 zur Festlegung der Korrelation durch die folgenden Gleichungen ausgedrückt werden: (3) Cl(n) = ΔPl(n) × R(n) + Pfix(n) × (I – R(n)) (4) Cr(n) = ΔPr(n) × R(n) + Pfix(n) × (I – R(n))
  • In diesem Fall bedeutet die feste Korrelationsinformation eine spezielle Korrelationsinformation, die in einem Anwendungsbeispiel prädiziert werden kann, z. B. die Eigenschaft, daß für einen Abschnitt mit relativ niedriger Frequenz eine starke Korrelation angezeigt wird, wenn ein Hauptkanal und ein ultratiefer Tonkanal benutzt wird. Dementsprechend kann die feste Korrelation zwischen Kanälen je nach Anwendungsbeispiel unvorhersagbar sein. In diesem Fall ist R(n) = 1,0, d. h. zu dem oben erwähnten Fall äquivalent, in welchem die Schaltung 305 zur Festlegung der Korrelationsinformation und die feste Korrelationsinformationstabelle 307 weggelassen sind. Wenn die Korrelation hingegen klar im voraus bestimmt wird, ist R(n) = 0, d. h. äquivalent zu dem Fall, in welchem die Schaltung 304 zur Berechnung der Korrelationsinformation und die Koeffiziententabelle 306 weggelassen sind. Auch das Syntheti sierverhältnis R(n) kann konstant oder in Abhängigkeit von den Eingangssignalen, z. B. der Magnitude der Spektralleistung und der Frequenz, variabel sein.
  • Die Leistungsjustierschaltung 308 justiert die bei der Bitzuteilung benutzte Spektralleistungsinformation auf der Basis des Ausgangssignals der Schaltung 305 zur Festlegung der Korrelationsinformation und überträgt die justierte Spektralleistungsinformation als Ausgangssignal 308 zu den in 1 dargestellten adaptiven Bitzuteilungsschaltungen 16, 17, 18. Wenn die Informationen aus dem Eingang 302 mit Pil, Pir und die Information an dem Ausgang 309 mit Pol(n), Por(n) bezeichnet werden, kann die Operation in der Leistungsjustierschaltung 308 durch die folgenden Gleichungen ausgedrückt werden: (5) Pol(n) = (Cl(n) + 1,0) × Pil(n) (6) Por(n) = (Cr(n) + 1,0) × Pir(n)
  • Durch diese Operation wird das Spektrum von stark korrelierten Signalen zwischen Kanälen einer nur geringfügigen Justierung unterzogen, während das Spektrum von schwach korrelierten Signalen einer umfangreichen Justierung unterzogen wird.
  • In 4 und 5 ist die Funktion der Korrelationsanpassungsschaltung in vereinfachten Modellen dargestellt, wobei die Zahl der Quantisierungsbänder gleich 4, die Zahl der Kanäle gleich 2 und die Differenz zwischen den Kanälen nur das Quantisierungsband ist. Im Falle einer separaten Berechnung der Bitzuteilungen, wie sie in 4 dargestellt ist, unterscheidet sich die Spektralleistung eines Eingangssignals auf der Frequenzachse nur in dem dritten Quantisierungsband zwischen dem ersten Kanal und dem zweiten Kanal, die somit unterschiedlich starkes Quantisierungsgeräusch aufweisen. Wenn in diesem Zustand die beiden Kanäle erweitert und z. B. als Zweikanal-Stereo wiedergegeben werden, besteht die Möglichkeit, daß Abschnitte mit unterschiedlichem Quantisierungsgeräusch die stationäre Qualität beeinträchtigen. Die Korrelationsanpassungsschaltung berücksichtigt die Korrelation zwischen dem ersten Kanal und dem zweiten Kanal wie in dem Fall, in dem die Korrelation berücksichtigt wird, wie dies in 5 dargestellt ist. Die Korrelationsanpassungsschaltung arbeitet dann so, daß sie die Stärke des Quantisierungsgeräuschs in dem dritten Quantisierungsband steuert und mit hoher stationärer Qualität reproduziert.

Claims (14)

  1. Hocheffizientes Kodierverfahren zum Komprimieren und Quantisieren von Eingangssignalen aus mehreren Kanälen, wobei das Verfahren umfaßt: Durchführen einer Quantisierung mit einer Bitzuteilung, die unter Berücksichtigung der Korrelation der Eingangssignale während der Komprimierung der Eingangssignale der jeweiligen Kanäle bestimmt wird, dadurch gekennzeichnet, daß das Verfahren ferner den Verfahrensschritt umfaßt, daß die Korrelation durch Justieren der spektralen Leistung zur Aufrechterhaltung optimaler Korrelation auf der Basis der spektralen Daten auf der Frequenzachse der jeweiligen Kanäle angepaßt wird.
  2. Hocheffizientes Kodierverfahren nach Anspruch 1, bei dem die Eingangssignale Sprachsignale sind und das Verfahren die Eigenschaften des menschlichen Gehörsinns ausnutzt.
  3. Hocheffizientes Kodierverfahren nach Anspruch 1 oder 2, bei dem die Korrelation zwischen den jeweiligen Kanälen dadurch bestimmt wird, daß die Berechnung aus den Eingangssignalen konstant durchgeführt wird.
  4. Hocheffizientes Kodierverfahren nach Anspruch 1 oder 2, bei dem die Korrelation zwischen den jeweiligen Kanälen aus den spektralen Daten auf einer Zeitachse der Eingangssignale oder aus Koeffizientendaten bestimmt wird, die durch orthogonale Transformation erzeugt werden.
  5. Hocheffizientes Kodierverfahren nach Anspruch 1 oder 2, bei dem die Korrelation zwischen den jeweiligen Kanälen aus einer fließenden Information anderer Kanäle bestimmt wird.
  6. Hocheffizientes Kodierverfahren nach Anspruch 1 oder 2, bei dem die Quantisierung auf der Basis konstanter Korrelation ohne Berücksichtigung der Eingangssignale durchgeführt wird.
  7. Hocheffizientes Kodierverfahren nach einem der Ansprüche 1 bis 6, bei dem die Quantisierung unter Berücksichtigung eines variablen Verhältnisses (i) der von den Eingangssignalen abhängigen Korrelation und (ii) einer von den Eingangssignalen unabhängigen konstanten Korrelation durchgeführt wird.
  8. Hocheffiziente Kodiervorrichtung zum Komprimieren und Quantisieren von Eingangssignalen aus mehreren Kanälen, wobei die Vorrichtung aufweist: eine Einrichtung (16, 17, 18, 25, 26, 27) zur Durchführung einer Quantisierung mit einer Bitzuteilung, die unter Berücksichtigung der Korrelation der Eingangssignale während der Komprimierung der Eingangssignale der jeweiligen Kanäle bestimmt wird, dadurch gekennzeichnet, daß die Vorrichtung ferner eine Einrichtung (28, 29, 30) aufweist zum Anpassen der Korrelation durch Justieren der spektralen Leistung zur Aufrechterhaltung optimaler Korrelation auf der Basis der spektralen Daten auf der Frequenzachse der jeweiligen Kanäle.
  9. Hocheffiziente Kodiervorrichtung nach Anspruch 8, bei der die Eingangssignale Sprachsignale sind und das Verfahren die Eigenschaften des menschlichen Gehörsinns ausnutzt.
  10. Hocheffiziente Kodiervorrichtung nach Anspruch 8 oder 9, bei der die Korrelation zwischen den jeweiligen Kanälen dadurch bestimmt wird, daß die Berechnung aus den Eingangssignalen konstant durchgeführt wird.
  11. Hocheffiziente Kodiervorrichtung nach Anspruch 8 oder 9, bei der die Korrelation zwischen den jeweiligen Kanälen aus den spektralen Daten auf einer Zeitachse der Eingangssignale oder aus Koeffizientendaten bestimmt wird, die durch orthogonale Transformation erzeugt werden.
  12. Hocheffiziente Kodiervorrichtung nach Anspruch 8 oder 9, bei der die Korrelation zwischen den jeweiligen Kanälen aus einer fließenden Information anderer Kanäle bestimmt wird.
  13. Hocheffiziente Kodiervorrichtung nach Anspruch 8 oder 9, bei der die Quantisierung auf der Basis konstanter Korrelation ohne Berücksichtigung der Eingangssignale durchgeführt wird.
  14. Hocheffiziente Kodiervorrichtung nach einem der Ansprüche 8 bis 13, bei der die Quantisierung unter Berücksichtigung eines variablen Verhältnisses (i) der von den Eingangssignalen abhängigen Korrelation und (ii) einer von den Eingangssignalen unabhängigen konstanten Korrelation durchgeführt wird.
DE69333394T 1992-11-11 1993-11-08 Hochwirksames Kodierverfahren und -gerät Expired - Fee Related DE69333394T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP30094792 1992-11-11
JP30094792A JP3343962B2 (ja) 1992-11-11 1992-11-11 高能率符号化方法及び装置

Publications (2)

Publication Number Publication Date
DE69333394D1 DE69333394D1 (de) 2004-02-26
DE69333394T2 true DE69333394T2 (de) 2004-11-04

Family

ID=17891010

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69333394T Expired - Fee Related DE69333394T2 (de) 1992-11-11 1993-11-08 Hochwirksames Kodierverfahren und -gerät

Country Status (4)

Country Link
US (1) US5684923A (de)
EP (1) EP0597649B1 (de)
JP (1) JP3343962B2 (de)
DE (1) DE69333394T2 (de)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
ATE211326T1 (de) * 1993-05-31 2002-01-15 Sony Corp Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
BR9405445A (pt) * 1993-06-30 1999-09-08 Sony Corp Aparelho codificador e decodificador de sinal apropriado para codificar um sinal de entrada e decodificar um sinal codificado, suporte de gravação onde sinais codificados são gravados, e processo de codificação e de decodificação de sinal para codificar um sinal de entrada e decodificar um sinal codificado.
TW272341B (de) * 1993-07-16 1996-03-11 Sony Co Ltd
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
CN1045852C (zh) * 1993-10-08 1999-10-20 索尼公司 数字信号处理装置和数字信号处理方法
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JP3371590B2 (ja) * 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
AU2003281128A1 (en) * 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
JP4922427B2 (ja) * 2010-04-19 2012-04-25 株式会社東芝 信号補正装置
JP6267860B2 (ja) 2011-11-28 2018-01-24 三星電子株式会社Samsung Electronics Co.,Ltd. 音声信号送信装置、音声信号受信装置及びその方法
JP6303435B2 (ja) 2013-11-22 2018-04-04 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4002841A (en) * 1976-01-21 1977-01-11 Bell Telephone Laboratories, Incorporated Data compression using nearly instantaneous companding in a digital speech interpolation system
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CH645501GA3 (de) * 1981-07-24 1984-10-15
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPS59223032A (ja) * 1983-06-01 1984-12-14 Sony Corp ディジタル信号伝送装置
US4516241A (en) * 1983-07-11 1985-05-07 At&T Bell Laboratories Bit compression coding with embedded signaling
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
JPH0734291B2 (ja) * 1986-07-28 1995-04-12 株式会社日立製作所 デイジタル信号記録再生システム
US4870685A (en) * 1986-10-26 1989-09-26 Ricoh Company, Ltd. Voice signal coding method
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
US4872132A (en) * 1987-03-13 1989-10-03 Zoran Corporation Method and means for block floating point arithmetic
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4991213A (en) * 1988-05-26 1991-02-05 Pacific Communication Sciences, Inc. Speech specific adaptive transform coder
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE59008047D1 (de) * 1989-03-06 1995-02-02 Bosch Gmbh Robert Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale.
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
DE69031517T2 (de) * 1989-06-30 1998-02-26 Nippon Electric Co Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
FR2653280B1 (fr) * 1989-10-13 1992-01-10 France Etat Dispositif d'allocation de bits pour signal audio-numerique transforme, a quantification adaptative sur critere psycho-auditif.
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
US5049992A (en) * 1990-08-27 1991-09-17 Zenith Electronics Corporation HDTV system with receivers operable at different levels of resolution
US5134475A (en) * 1990-12-11 1992-07-28 At&T Bell Laboratories Adaptive leak hdtv encoder
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法

Also Published As

Publication number Publication date
JPH06149292A (ja) 1994-05-27
EP0597649A2 (de) 1994-05-18
EP0597649A3 (de) 1995-01-25
US5684923A (en) 1997-11-04
DE69333394D1 (de) 2004-02-26
EP0597649B1 (de) 2004-01-21
JP3343962B2 (ja) 2002-11-11

Similar Documents

Publication Publication Date Title
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE60303689T2 (de) Audiodecodierungsvorrichtung und -verfahren
DE69023604T2 (de) Digitalsignalkodiergerät.
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE69116476T2 (de) Digitaler Signalverschlüssler
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE69401512T2 (de) Hybride adaptive bitzuteilung für audiokoder und -dekoder
EP0193143B1 (de) Verfahren zur Übertragung eines Audiosignals
DE602004010188T2 (de) Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60318835T2 (de) Parametrische darstellung von raumklang
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
DE69210064T2 (de) Teilbandkodierer und Sender unter Verwendung dieses Kodierers
DE4320990B4 (de) Verfahren zur Redundanzreduktion
EP0910927B1 (de) Verfahren zum codieren und decodieren von stereoaudiospektralwerten
EP0910928B1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
DE3878017T2 (de) System zur teilbandkodierung eines digitalen audiosignals.
DE19959156C2 (de) Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals
DE69924431T2 (de) Vorrichtung und Verfahren zur dynamischen Bitverteilung für Audiokodierung
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
EP1145227A1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee