DE60038279T2 - Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils - Google Patents

Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils Download PDF

Info

Publication number
DE60038279T2
DE60038279T2 DE60038279T DE60038279T DE60038279T2 DE 60038279 T2 DE60038279 T2 DE 60038279T2 DE 60038279 T DE60038279 T DE 60038279T DE 60038279 T DE60038279 T DE 60038279T DE 60038279 T2 DE60038279 T2 DE 60038279T2
Authority
DE
Germany
Prior art keywords
subband
signals
band
encoder
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60038279T
Other languages
English (en)
Other versions
DE60038279D1 (de
Inventor
Erdal Richardson Parsoy
V Alan Dallas McCree
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of DE60038279D1 publication Critical patent/DE60038279D1/de
Application granted granted Critical
Publication of DE60038279T2 publication Critical patent/DE60038279T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Treatment Devices (AREA)

Description

  • Gebiet der Erfindung
  • Diese Erfindung bezieht sich auf einen Sprachcodierer, der auf einer Codierung mit code-erregter linearer Prädiktion (CELP) basiert, und insbesondere auf einen Unterband-Sprachcodierer.
  • Hintergrund der Erfindung
  • Die Kompression von Sprachsignalen ist ein grundlegender Teil digitaler Kommunikationssysteme. In einem herkömmlichen Telephonnetz ist das Sprachsignal ein Schmalbandsignal, das auf 4 kHz bandlimitiert ist. Viele der neu entstehenden Anwendungen erfordern keine Begrenzung der Sprachsignalbandbreite. Folglich werden Breitbandsignale mit einer Signalbandbreite von 50 bis 7000 Hz, die zu einer als höher wahrgenommenen Qualität führt, schnell für neue Anwendungen, wie etwa das Voice-over-Internet-Protokoll oder drahtlose Dienste der dritten Generation, interessanter. Folglich wird die digitale Codierung von Breitbandsprachsignalen zunehmend wichtig.
  • Die code-erregte lineare Prädiktion (CELP) ist eine allgemein bekannte Klasse von Sprachcodierungs-Algorithmen für Schmalbandsprachsignale mit guter Leistungsfähigkeit bei niedrigen bis mittleren Bitraten (4 bis 16 kb/s). Siehe den Artikel von B. S. Atal und M. Schroeder mit dem Titel "Stochastic Coding of Speech Signals at Very Low Bit Rates", IEEE International conference an Acoustics, Speech and Signal Processing, Mai 1984. Für Breitbandsprachsignale kann mit einem gewissen Erfolg der gleiche Algorithmus über die gesamte Eingangsbandbreite verwendet werden. Alternativ kann das Eingangssignal in zwei oder mehr Unterbänder unterteilt werden, die unabhängig codiert werden. Bei diesen Unterband-Codierern wird das Signal dezimiert, codiert und wieder einem Upsampling unterzogen. In herkömmlichen Unterband-Codierern wird das Signal einem kritischen Subsampling unterzogen. Einige Anti-Aliasing-Filter mit Bändern mit einem von null verschiedenen Übergang, die in praktischen Anwendungen verwendet werden, führen zwischen den Bändern einen gewissen Verlust ein, der zuweilen hörbare Aliasing-Verzerrungen hervorruft. Quadraturspiegel-Filter (QMF), bei denen das Aliasing während der Neusynthese beseitigt wird, können im Fall einer Unterteilung in gleichen Unterbänder verwendet werden. Im allge meinen Fall ungleicher Unterbänder führt ein kritisches Subsampling ein Aliasing ein.
  • In T. Nomura u. a., "A Bitrate and Bandwidth Scalable CELP Coder", IEEE ICASSP 1998, 12.-15. Mai 1998, ist ein CELP-Sprachcodierer mit Bitraten- und Bandbreiten-Skalierbarkeiten offenbart. Der Codierer beruht auf einer mehrfachimpuls-basierten CELP-Codierung und besteht aus einem bitraten-skalierbaren Basisband-Codierer und einem Hilfsmittel zur Bandbreitenerweiterung. Der Codierer verwendet eine einfache Abtastratenveränderung um einen Faktor 2, was Unterbändern mit gleicher Größe entspricht.
  • Zusammenfassung der Erfindung
  • Gemäß der vorliegenden Erfindung werden ein Breitband-Codierer, ein Codierungssystem und ein Codierungsverfahren nach den Ansprüchen 1, 10 und 23 geschaffen, wobei die Bandbreite in Unterbänder unterteilt ist, die ungleich sein können. Das niedrigere Unterband wird dezimiert und unter Verwendung eines CELP-Codierers codiert. Ein höheres Unterband wird nicht dezimiert, sondern wird über den gesamten Frequenzbereich berechnet und bandpassgefiltert, um das niedrigere Band zu komplementieren. Ferner werden ein Decodierersystem und ein Decodierungsverfahren nach den Ansprüchen 16 und 24 zum Verarbeiten der codierten Signale geschaffen.
  • Weitere Aspekte und Ausführungsformen der vorliegenden Erfindung sind in den beigefügten Ansprüchen dargelegt.
  • Beschreibung der Zeichnungen
  • Die vorliegende Erfindung wird nun beispielhaft mit Bezug auf die beispielhaften Ausführungsformen weiter beschrieben, die in den beigefügten Zeichnungen veranschaulicht sind, in der:
  • 1 ein Blockschaltplan des Codierungssystems in Übereinstimmung mit einer beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 2 ein Blockschaltplan eines Zufallsrauschen-Generator-Decodierers ist;
  • 3 ein Blockschaltplan eines mit dem Verstärkungsfaktor erregten LPC-Decodierers ist;
  • 4 ein Blockschaltplan eines an den Verstärkungsfaktor angepassten Synthese-Decodierers ist; und
  • 5 ein Blockschaltplan eines Impulserregungs-Decodierers ist.
  • Beschreibung der bevorzugten Ausführungsform der vorliegenden Erfindung
  • In 1 ist ein Unterband-Codierersystem in Übereinstimmung mit einer beispielhaften Ausführungsform der vorliegenden Erfindung veranschaulicht. CELP-Codierer arbeiten mit Segmenten mit unveränderter Länge der aufgerufenen Eingangsrahmen. Der Codierer umfasst ein Codierer/Decodierer-Paar. Der Decodierer verarbeitet jeden Rahmen von Sprachsignalen durch Berechnen eines Satzes von Parametern, die er codiert und zu einem Decodierer sendet. Der Decodierer empfängt diese Informationen und synthetisiert eine Approximation dieses Eingangssprachsignals, die als codiertes Sprachsignal bezeichnet wird.
  • Das Eingangssprachsignal wird in einem A/D-(Analog-zu-digital-)Umsetzer 11 mit einer Abtastfrequenz fs (beispielsweise 16 kHz) abgetastet und hat eine Signalbandbreite von fs/2 (8 kHz). Zu Zwecken der Codierung wird diese Bandbreite in zwei ggf. ungleiche Unterbänder unterteilt. Als Beispiel wird ein Breitband-Sprachcodierer betrachtet, der bei 16 kHz mit einer brauchbaren Signalbandbreite von 50 bis 7000 Hz arbeitet. Eine sinnvolle Niedrigband-Bandbreite kann 0 bis 5,33 kHz betragen (veranschaulicht in 2), die erhalten wird durch Upsampling mit 2 (nfs) im Upsampler 13 (32 kHz), Tiefpassfilterung mit einem Tiefpassfilter 15 mit einem Übergangsband zwischen beispielsweise 5 und 5,33 kHz sowie Dezimierung durch 3 (nfs/m) im Downsampler 17, was zu einem abgetasteten Niedrigbandsignal mit 10,67 kHz führt. Das dezimierte Signal (mit 10,67 kHz) im niedrigeren Band wird mit Hilfe eines CELP-Codierers 18 codiert. Die Niedrigband-Parameter aus dem LPC-Codierer umfassen Koeffizienten der linearen Prädiktion (LPC), die ein zeitlich veränderliches Gesamtpol-Filter (LPC-Filter) und Erregungsparameter spezifizieren. Die Erregungsparameter spezifizieren eine Zeitbereichssignalform, die als Erregungssignal bezeichnet wird und adaptive sowie unveränderte Erregungsbeiträge und entsprechende Verstär kungsfaktoren (Verstärkung, LPC, adaptiven Codebuch-Index und unveränderten Codebuch-Index) umfasst.
  • Das Hochbandsignal wird aus dem ursprünglichen Signal einfach durch dessen Bandpass- oder Hochpassfilterung erhalten, bevor es in einen Hochband-Codierer 20 eingegeben wird. Eine geeignete Bandbreite kann zwischen fs1 und fs2, wie etwa 5,33 kHz und 7 kHz, liegen. Der 16-kHz-Eingang wird beispielsweise zwischen 5,33 kHz und 7 kHz bandpassgefiltert, um das Hochbandsignal zu erhalten. Das Übergangsband dieses Filters muss zwischen 5 und 5,33 kHz liegen und so konzipiert sein, dass es das Niedrigband-Tiefpassfilter komplementieren kann. Der bandpassgefilterte Ausgang wird in einem Hochband-Codierer 20 codiert. Es gibt mehrere mögliche Arten, den Hochband-Erregungscodierer 20 zu erzeugen, wie etwa Zufallsrauschen, rausch-erregte LPC, an den Verstärkungsfaktor angepasste Analyse durch Synthese, Mehrfachimpulscodierung oder eine Kombination hiervon.
  • Das codierte Signal wird über ein Übertragungsmedium wie etwa ein Kabel- oder ein drahtloses Netz zum Decodierer gesendet. Im Decodierer wird das Niedrigband-Erregungssignal mit der Niedrigbandrate von 10,67 kHz (2fs/3) rekonstruiert und in den CELP-Decodierer (LPC-Synthesefilter) 21 eingegeben. Der Ausgang des CELP-Decodierer 21 wird im Upsampler 23 einem Upsampling (um 3) zu 2fs (32 kHz) unterzogen und im Filter 25 bei 5,33 kHz tiefpassgefiltert sowie durch den Downsampler 26 bei 16 kHz zu fs dezimiert (um 2 dezimiert), um das niedrigband-codierte Signal zu erzeugen. Das Hochbandsignal mit fs (16 kHz) wird im Hochbandpass-Decodierer 27 mit der ursprünglichen Abtastrate erzeugt und im Bandpassfilter 29 bandpassgefiltert, um das hochband-codierte Signal mit fs (16 kHz) zu erhalten. Das 16-kHz-Signal wird zwischen 5,33 kHz und 8 kHz bandpassgefiltert, um das Hochbandsignal zu erhalten. Der Übergang dieses Filters liegt zwischen 5 und 5,33 kHz und ist so konzipiert, dass er das Niedrigband-Tiefpassfilter komplementieren kann. Die Hochband- und die Niedrigbandbeiträge werden im Addierer 30 addiert, um das codierte Sprachsignal zu erhalten.
  • Wie oben besprochen, gibt es mehrere Verfahren für die Hochband-Erregungscodierung.
  • Das einfachste Modell ist ein mit dem Verstärkungsfaktor skalierter Zufallsrauschen-Generator, wie er in 2 veranschaulicht ist. In diesem Fall stellen die Bits einen quantifizierten Wert des Verstärkungsfaktors dar und werden für einen Skalierfaktor verwendet. Der Ausgang des Zufallsrauschen-Generators 31 wird im Multiplizierer 32 mit diesem Skalierfaktor multipliziert und im Filter 35 bandpassgefiltert, um das Hochbandsignal zu approximieren. Eine zweite Hochband-Decodierung ist in 3 veranschaulicht, wobei das resultierende Signal – nach dem Rauschen-Generator 37 und dem Verstärkungsfaktor-Multiplizierer 38, der durch den Verstärkungsfaktor-Wert aus einer von den Eingangsbits aufgerufenen Nachschlagetabelle gesteuert wird – durch ein LPC-Synthesefilter 39 geführt wird, das von den Eingangsbits gesteuert wird (und sich von dem unterscheidet, das im Niedrigband verwendet wird). Die Ordnung dieses Filters und die Größe des LPC-Synthesefilter-Codebuchs können gering sein. Der Zweck ist es, auf das Hochbandrauschen eine Frequenzformung anzuwenden. Der Ausgang wird durch das Bandpassfilter 40 gefiltert.
  • Bei der an den Verstärkungsfaktor angepassten Analyse durch Synthese wird der Zufallsrauschen-Generator durch ein Codebuch 41 ersetzt, das zulässige Erregungsvektoren enthält, auf die von den Eingangsbits zugriffen wird. Der Erregungsvektor, der den Fehler zwischen dem synthetischen Signal und dem Eingang minimiert, wird unter der Einschränkung ausgewählt, dass der Ausgangs-Verstärkungsfaktor mit dem Eingangs-Verstärkungsfaktor übereinstimmt. Die ausgewählten Vektoren werden im Multiplizierer 43 durch Eingangsbits skaliert oder mit dem Verstärkungsfaktor gesteuert, und der resultierende Ausgang wird durch ein LPC-Synthesefilter 45 geführt, das durch die Eingangsbits gesteuert wird. Der Ausgang des LPC-Synthesefilters 45 wird in ein Bandpassfilter 47 eingegeben. Dies wird ausführlicher erläutert von E. Paksoy, A. McCree und V. Viswanathan in "A Variable-Rate Multimodal Speech Coder With Gain-Matched Analysis by Synthesis", IEEE International Conference an Acoustics, Speech and Signal Processing, April 1997.
  • Eine weitere Möglichkeit besteht darin, einfach eine Codierung ternärer Impulse zu verwenden, wie es in 5 im Hochband veranschaulicht ist, wobei das Hochbandsignal durch eine (im Impulserregungs-Generator 51 erzeugte) Signalform approximiert wird, die größtenteils aus Null-Elementen besteht, abgesehen von einigen, die eine Amplitude von +1 oder –1 haben. Diese Erregungssig nalform wird im Multiplizierer 53 mit dem Verstärkungsfaktor skaliert und durch ein LPC-Synthesefilter 55 sowie das Hochband-Bandpassfilter 56 gefiltert, um das codierte Hochbandsignal zu erzeugen. Die Suche nach dem Erregungs- und dem Verstärkungsfaktor wird mittels eines Analyse-durch-Synthese-Mechanismus ausgeführt, der in CELP-Codierern üblich ist. Der Hochband-Codierer 20 führt das Komplement der Decodierung aus.
  • In einem derartigen Unterband-Codierer kann auch eine Kombination der oben erwähnten Verfahren angewendet werden. Zudem ist anzumerken, dass das Unterband-Codierungsschema auch auf mehr als zwei Unterbänder erweitert werden kann.
  • Es wurde ein Unterband-Codierer beschrieben, bei dem das Hochband keinem Subsampling unterzogen wird. Das Filterungs- und Abtastratenumwandlungs-Schema ist relativ einfach und hat die Vorteile verringerter Komplexität und verminderter Aliasing-Probleme im Falle ungleicher Unterbänder. Außerdem wurden mehrere Verfahren zur Hochband-Codierung vorgeschlagen, und es wurden eine Bandpass-Zufallsrauschen-Erzeugung, eine LPC-Spektralformung, eine an den Verstärkungsfaktor angepasste Analyse durch Synthese sowie eine Codierung ternärer Impulse besprochen.

Claims (24)

  1. Breitband-Sprachsignalcodierer, mit: Mitteln zum Unterteilen von Signalen auf einer Bandbreite in ein Signal in einem niedrigeren Unterband und in ein Signal in einem höheren Unterband; einem Downsampler (17) zum Dezimieren des Signals im niedrigeren Unterband, einem Niedrigband-Sprachcodierer, der mit dem Downsampler gekoppelt ist, um das dezimierte Signal im niedrigeren Unterband zu codieren, und einem Hochband-Codierer (20) zum Codieren des Signals im höheren Unterband ohne Dezimierung und einem Kombinierer zum Kombinieren des Signals im höheren Unterband und des Signals im niedrigeren Unterband.
  2. Codierer nach Anspruch 1, wobei der Kombinierer umfasst: ein Bandpassfilter (19), das mit dem Hochband-Codierer gekoppelt ist, um auf das Signal im höheren Unterband eine Bandpassfilterung anzuwenden, um das niedrigere Unterband zu komplementieren.
  3. Codierer nach Anspruch 1 oder Anspruch 2, der umfasst: Mittel (13) zum Upsampling der codierten Signale im niedrigeren Unterband.
  4. Codierer nach einem der Ansprüche 1 bis 3, wobei der Niedrigband-Sprachcodierer einen CELP-Codierer (18) enthält.
  5. Codierer nach einem der Ansprüche 1 bis 4, wobei der Hochband-Codierer einen LPC-Codierer (39) enthält.
  6. Codierer nach einem der Ansprüche 1 bis 4, wobei der Hochband-Codierer einen Zufallsrauschen-Generator (31) enthält.
  7. Codierer nach einem der Ansprüche 1 bis 5, wobei der Hochband-Codierer einen rauscherregten LPC (45) enthält.
  8. Codierer nach einem der Ansprüche 1 bis 7, wobei der Hochband-Codierer so beschaffen ist, dass er eine an den Verstärkungsfaktor angepasste Analyse durch Synthese ausführt.
  9. Codierer nach einem der Ansprüche 1 bis 8, wobei der Hochband-Codierer so beschaffen ist, dass er eine Mehrfachimpulscodierung ausführt.
  10. Breitband-Sprachcodierungssystem, das umfasst: Mittel zum Unterteilen von Signalen auf einer Bandbreite in ein niedrigeres Unterband und ein höheres Unterband, einen Downsampler (17) zum Dezimieren der Signale im niedrigeren Unterband, einen Niedrigband-Sprachcodierer, der mit dem Downsampler gekoppelt ist, um die dezimierten Signale im niedrigeren Unterband zu codieren, einen Hochband-Codierer (20) zum Codieren des Signals im höheren Unterband ohne Dezimierung; ein Bandpassfilter (19), das mit dem Hochband-Codierer gekoppelt ist, um auf das Signal im höheren Unterband einer Bandpassfilterung anzuwenden, um das niedrigere Unterband zu komplementieren; einen ersten Decodierer (21) zum Decodieren der codierten Signale im niedrigeren Unterband; Mittel zum Upsampling und Tiefpassfiltern (23, 25) der Signale im niedrigeren Unterband auf die gleiche Rate wie die Signale im höheren Band; einen zweiten Decodierer zum Decodieren der Signale im höheren Unterband und zum Bandpassfiltern (27, 29) der Signale im höheren Unterband; und einen Addierer (30) zum Summieren der Signale im niedrigeren Unterband und der Signale im höheren Unterband.
  11. System nach Anspruch 10, wobei der Niedrigband-Codierer einen CELP-Codierer (18) enthält.
  12. System nach Anspruch 10 oder Anspruch 11, wobei der Hochband-Codierer ein Zufallsrauschen enthält und der Hochband-Decodierer einen mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator (31, 32) enthält.
  13. System nach einem der Ansprüche 10 bis 12, wobei der Hochband-Codierer ein rauscherregter LPC-Codierer ist und der Decodierer einen mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator (37, 38) enthält und der Ausgang in ein LPC-Synthesefilter (39) eingegeben wird.
  14. System nach einem der Ansprüche 10 bis 13, wobei der Hochband-Codierer einen durch Synthese an den Verstärkungsfaktor angepassten Codierer enthält und der Hochband-Decodierer ein Codebuch (41) mit zulässigen Erregungsvektoren, einen Multiplizierer (43) und ein LPC-Filter (45) enthält.
  15. System nach einem der Ansprüche 10 bis 14, wobei der Codierer ein Mehrfachimpuls-Codierer ist und der Decodierer das Skalieren mit dem Verstärkungsfaktor einer Approximationssignalform, die mit dem Verstärkungsfaktor skaliert ist (53) und durch ein LPC-Synthesefilter (55) gefiltert ist, enthält.
  16. Breitband-Sprachdecodierersystem, das umfasst: einen ersten Decodierer (21) zum Decodieren codierter Signale im niedrigeren Unterband, um Signale im niedrigeren Unterband mit einer Abtastrate flower auszugeben; einen zweiten Decodierer (27) zum Decodieren von Signalen im höheren Unterband, um Signale im höheren Unterband mit einer Abtastrate fhigher = (m/n) flower auszugeben, wobei m und n ganze Zahlen sind, wobei m größer als n ist und wobei n größer als 1 ist; einen Umsetzer zum Umsetzen der Signale im niedrigeren Unterband mit der Abtastrate flower auf die Abtastrate fhigher, wobei die Abtastratenumsetzung in dem Verhältnis m/n erfolgt; und einen Addierer (30) zum Summieren der umgesetzten Signale im niedrigeren Unterband und der Signale im höheren Unterband.
  17. Decodierersystem nach Anspruch 16, wobei der zweite Decodierer einen mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator (31, 32) enthält.
  18. Decodierersystem nach Anspruch 17, wobei ein Ausgang des mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator in ein LPC-Synthesefilter (39) eingegeben wird.
  19. Decodierersystem nach einem der Ansprüche 16 bis 18, wobei der zweite Decodierer ein Codebuch (41) mit zulässigen Erregungsvektoren, einen Multiplizierer (43) und ein LPC-Filter (45) enthält.
  20. Decodierersystem nach einem der Ansprüche 16 bis 19, wobei der zweite Decodierer eine Mehrfachimpuls-Signalform enthält, die mit dem Verstärkungsfaktor skaliert (53) und durch ein LPC-Synthesefilter (55) gefiltert ist.
  21. Verfahren zur Breitband-Sprachsignalcodierung, das die folgenden Schritte umfasst: Unterteilen von Signalen auf einer Bandbreite in ein Signal im niedrigeren Unterband und ein Signal im höheren Unterband; Downsampling des Signals im niedrigeren Unterband; Codieren des dezimierten Signals im niedrigeren Unterband; Codieren des Signals im höheren Unterband ohne Dezimierung; und Kombinieren des Signals im höheren Unterband und des Signals im niedrigeren Unterband.
  22. Verfahren nach Anspruch 21, das ferner den folgenden Schritt umfasst: Upsampling der codierten Signale im niedrigeren Unterband.
  23. Verfahren zur Breitband-Sprachcodierung, das die folgenden Schritte umfasst: Unterteilen von Signalen auf einer Bandbreite in ein niedrigeres Unterband und ein höheres Unterband; Downsampling der Signale im niedrigeren Unterband; Codieren der dezimierten Signale im niedrigeren Unterband; Codieren des Signals im höheren Unterband ohne Dezimierung; Anwenden einer Bandpassfilterung auf das Signal im höheren Unterband, um das niedrigere Unterband zu komplementieren; Decodieren der codierten Signale im niedrigeren Unterband; Upsampling und Tiefpassfiltern der Signale im niedrigeren Unterband auf die gleiche Rate wie die Signale im höheren Band; Decodieren der Signale im höheren Unterband und Anwenden einer Bandpassfilterung auf die Signale im höheren Unterband; und Summieren der Signale im niedrigeren Unterband und der Signale im höheren Unterband.
  24. Verfahren zur Breitband-Sprachdecodierung, das die folgenden Schritte umfasst: Decodieren codierter Signale im niedrigeren Unterband, um Signale im niedrigeren Unterband auszugeben, mit einer Abtastrate flower; Decodieren von Signalen im höheren Unterband, um Signale im höheren Unterband auszugeben, mit einer Abtastrate fhigher = (m/n)flower, wobei m und n ganze Zahlen sind, wobei m größer als n ist und wobei n größer als 1 ist; Umsetzen des Signals im niedrigeren Unterband mit der Abtastrate flower zu der Abtastrate fhigher wobei die Abtastraten-Umsetzung mit dem Verhältnis m/n erfolgt; und Summieren der umgesetzten Signale im niedrigeren Unterband und der Signale im höheren Unterband.
DE60038279T 1999-12-21 2000-12-13 Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils Expired - Lifetime DE60038279T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17139399P 1999-12-21 1999-12-21
US171393P 1999-12-21

Publications (2)

Publication Number Publication Date
DE60038279D1 DE60038279D1 (de) 2008-04-24
DE60038279T2 true DE60038279T2 (de) 2009-03-12

Family

ID=22623577

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60038279T Expired - Lifetime DE60038279T2 (de) 1999-12-21 2000-12-13 Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils

Country Status (5)

Country Link
US (1) US7260523B2 (de)
EP (1) EP1111589B1 (de)
JP (1) JP2001215999A (de)
AT (1) ATE389227T1 (de)
DE (1) DE60038279T2 (de)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US8463334B2 (en) * 2002-03-13 2013-06-11 Qualcomm Incorporated Apparatus and system for providing wideband voice quality in a wireless telephone
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
US8879432B2 (en) 2002-09-27 2014-11-04 Broadcom Corporation Splitter and combiner for multiple data rate communication system
EP1408615B1 (de) * 2002-09-27 2011-02-09 Broadcom Corporation Splitter und Kombinierer in einem Kommunikationssystem mit mehrfachen Datenraten
US7406096B2 (en) * 2002-12-06 2008-07-29 Qualcomm Incorporated Tandem-free intersystem voice communication
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7443978B2 (en) * 2003-09-04 2008-10-28 Kabushiki Kaisha Toshiba Method and apparatus for audio coding with noise suppression
CN1303584C (zh) * 2003-09-29 2007-03-07 摩托罗拉公司 联接式语音合成的声音目录编码方法和装置
EP1683133B1 (de) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audiosignalcodierung oder -decodierung
CN1887025A (zh) * 2003-12-01 2006-12-27 皇家飞利浦电子股份有限公司 选择性音频信号增强
US20080243496A1 (en) * 2005-01-21 2008-10-02 Matsushita Electric Industrial Co., Ltd. Band Division Noise Suppressor and Band Division Noise Suppressing Method
JP2006201622A (ja) * 2005-01-21 2006-08-03 Matsushita Electric Ind Co Ltd 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法
JP5129115B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 高帯域バーストの抑制のためのシステム、方法、および装置
TWI324336B (en) * 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
KR101411780B1 (ko) 2009-10-20 2014-06-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 이전의 디코딩된 스펙트럼 값들의 그룹의 검출을 이용하는 오디오 인코더, 오디오 디코더, 오디오 정보를 인코딩하기 위한 방법, 오디오 정보를 디코딩하기 위한 방법 및 컴퓨터 프로그램
JP5773502B2 (ja) 2010-01-12 2015-09-02 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム
CA2984936C (en) * 2011-02-18 2019-10-29 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
WO2013136109A1 (en) * 2012-03-15 2013-09-19 Telefonaktiebolaget Lm Ericsson (Publ) Method of transmitting data samples with reduced bandwidth
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
WO2014138539A1 (en) * 2013-03-08 2014-09-12 Motorola Mobility Llc Conversion of linear predictive coefficients using auto-regressive extension of correlation coefficients in sub-band audio codecs
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0351479B1 (de) * 1988-07-18 1994-10-19 International Business Machines Corporation Verfahren und Einrichtung zur Sprachkodierung mit niedriger Bitrate
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
JPH06180948A (ja) * 1992-12-11 1994-06-28 Sony Corp ディジタル信号処理装置又は方法、及び記録媒体
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JPH06284392A (ja) * 1993-03-30 1994-10-07 Toshiba Corp 映像信号送受信装置
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
WO1995034883A1 (fr) * 1994-06-15 1995-12-21 Sony Corporation Processeur de signaux et dispositif de reproduction sonore
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
JP3325772B2 (ja) * 1996-05-15 2002-09-17 パイオニア株式会社 帯域分割信号処理システム
US6904404B1 (en) * 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
DE69924922T2 (de) * 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
US6182031B1 (en) * 1998-09-15 2001-01-30 Intel Corp. Scalable audio coding system
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders

Also Published As

Publication number Publication date
US20020072899A1 (en) 2002-06-13
EP1111589B1 (de) 2008-03-12
ATE389227T1 (de) 2008-03-15
DE60038279D1 (de) 2008-04-24
US7260523B2 (en) 2007-08-21
JP2001215999A (ja) 2001-08-10
EP1111589A1 (de) 2001-06-27

Similar Documents

Publication Publication Date Title
DE60038279T2 (de) Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils
DE60011051T2 (de) Celp-transkodierung
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE69631728T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE69910058T2 (de) Verbesserung der periodizität eines breitbandsignals
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE69926821T2 (de) Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
DE69333786T2 (de) Verfahren zum Kodieren und Dekodieren von Audiodaten
DE69816810T2 (de) Systeme und verfahren zur audio-kodierung
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE60100813T2 (de) Verbesserte spektrale übersetzung/faltung im subband-bereich
DE602004007786T2 (de) Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE60133757T2 (de) Verfahren und vorrichtung zur kodierung von stimmloser sprache
DE60012760T2 (de) Multimodaler sprachkodierer
DE60128479T2 (de) Verfahren und vorrichtung zur bestimmung eines synthetischen höheren bandsignals in einem sprachkodierer
DE602004004950T2 (de) Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
DE112010005020T5 (de) Sprachsignal-Wiederherstellungsvorrichtung und Sprachsignal-Wiederherstellungsverfahren
DE60124079T2 (de) Sprachverarbeitung
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
DE19706516C1 (de) Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition