DE60038279T2 - Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils - Google Patents
Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils Download PDFInfo
- Publication number
- DE60038279T2 DE60038279T2 DE60038279T DE60038279T DE60038279T2 DE 60038279 T2 DE60038279 T2 DE 60038279T2 DE 60038279 T DE60038279 T DE 60038279T DE 60038279 T DE60038279 T DE 60038279T DE 60038279 T2 DE60038279 T2 DE 60038279T2
- Authority
- DE
- Germany
- Prior art keywords
- subband
- signals
- band
- encoder
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 230000005284 excitation Effects 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Magnetic Treatment Devices (AREA)
Description
- Gebiet der Erfindung
- Diese Erfindung bezieht sich auf einen Sprachcodierer, der auf einer Codierung mit code-erregter linearer Prädiktion (CELP) basiert, und insbesondere auf einen Unterband-Sprachcodierer.
- Hintergrund der Erfindung
- Die Kompression von Sprachsignalen ist ein grundlegender Teil digitaler Kommunikationssysteme. In einem herkömmlichen Telephonnetz ist das Sprachsignal ein Schmalbandsignal, das auf 4 kHz bandlimitiert ist. Viele der neu entstehenden Anwendungen erfordern keine Begrenzung der Sprachsignalbandbreite. Folglich werden Breitbandsignale mit einer Signalbandbreite von 50 bis 7000 Hz, die zu einer als höher wahrgenommenen Qualität führt, schnell für neue Anwendungen, wie etwa das Voice-over-Internet-Protokoll oder drahtlose Dienste der dritten Generation, interessanter. Folglich wird die digitale Codierung von Breitbandsprachsignalen zunehmend wichtig.
- Die code-erregte lineare Prädiktion (CELP) ist eine allgemein bekannte Klasse von Sprachcodierungs-Algorithmen für Schmalbandsprachsignale mit guter Leistungsfähigkeit bei niedrigen bis mittleren Bitraten (4 bis 16 kb/s). Siehe den Artikel von B. S. Atal und M. Schroeder mit dem Titel "Stochastic Coding of Speech Signals at Very Low Bit Rates", IEEE International conference an Acoustics, Speech and Signal Processing, Mai 1984. Für Breitbandsprachsignale kann mit einem gewissen Erfolg der gleiche Algorithmus über die gesamte Eingangsbandbreite verwendet werden. Alternativ kann das Eingangssignal in zwei oder mehr Unterbänder unterteilt werden, die unabhängig codiert werden. Bei diesen Unterband-Codierern wird das Signal dezimiert, codiert und wieder einem Upsampling unterzogen. In herkömmlichen Unterband-Codierern wird das Signal einem kritischen Subsampling unterzogen. Einige Anti-Aliasing-Filter mit Bändern mit einem von null verschiedenen Übergang, die in praktischen Anwendungen verwendet werden, führen zwischen den Bändern einen gewissen Verlust ein, der zuweilen hörbare Aliasing-Verzerrungen hervorruft. Quadraturspiegel-Filter (QMF), bei denen das Aliasing während der Neusynthese beseitigt wird, können im Fall einer Unterteilung in gleichen Unterbänder verwendet werden. Im allge meinen Fall ungleicher Unterbänder führt ein kritisches Subsampling ein Aliasing ein.
- In T. Nomura u. a., "A Bitrate and Bandwidth Scalable CELP Coder", IEEE ICASSP 1998, 12.-15. Mai 1998, ist ein CELP-Sprachcodierer mit Bitraten- und Bandbreiten-Skalierbarkeiten offenbart. Der Codierer beruht auf einer mehrfachimpuls-basierten CELP-Codierung und besteht aus einem bitraten-skalierbaren Basisband-Codierer und einem Hilfsmittel zur Bandbreitenerweiterung. Der Codierer verwendet eine einfache Abtastratenveränderung um einen Faktor 2, was Unterbändern mit gleicher Größe entspricht.
- Zusammenfassung der Erfindung
- Gemäß der vorliegenden Erfindung werden ein Breitband-Codierer, ein Codierungssystem und ein Codierungsverfahren nach den Ansprüchen 1, 10 und 23 geschaffen, wobei die Bandbreite in Unterbänder unterteilt ist, die ungleich sein können. Das niedrigere Unterband wird dezimiert und unter Verwendung eines CELP-Codierers codiert. Ein höheres Unterband wird nicht dezimiert, sondern wird über den gesamten Frequenzbereich berechnet und bandpassgefiltert, um das niedrigere Band zu komplementieren. Ferner werden ein Decodierersystem und ein Decodierungsverfahren nach den Ansprüchen 16 und 24 zum Verarbeiten der codierten Signale geschaffen.
- Weitere Aspekte und Ausführungsformen der vorliegenden Erfindung sind in den beigefügten Ansprüchen dargelegt.
- Beschreibung der Zeichnungen
- Die vorliegende Erfindung wird nun beispielhaft mit Bezug auf die beispielhaften Ausführungsformen weiter beschrieben, die in den beigefügten Zeichnungen veranschaulicht sind, in der:
-
1 ein Blockschaltplan des Codierungssystems in Übereinstimmung mit einer beispielhaften Ausführungsform der vorliegenden Erfindung ist; -
2 ein Blockschaltplan eines Zufallsrauschen-Generator-Decodierers ist; -
3 ein Blockschaltplan eines mit dem Verstärkungsfaktor erregten LPC-Decodierers ist; -
4 ein Blockschaltplan eines an den Verstärkungsfaktor angepassten Synthese-Decodierers ist; und -
5 ein Blockschaltplan eines Impulserregungs-Decodierers ist. - Beschreibung der bevorzugten Ausführungsform der vorliegenden Erfindung
- In
1 ist ein Unterband-Codierersystem in Übereinstimmung mit einer beispielhaften Ausführungsform der vorliegenden Erfindung veranschaulicht. CELP-Codierer arbeiten mit Segmenten mit unveränderter Länge der aufgerufenen Eingangsrahmen. Der Codierer umfasst ein Codierer/Decodierer-Paar. Der Decodierer verarbeitet jeden Rahmen von Sprachsignalen durch Berechnen eines Satzes von Parametern, die er codiert und zu einem Decodierer sendet. Der Decodierer empfängt diese Informationen und synthetisiert eine Approximation dieses Eingangssprachsignals, die als codiertes Sprachsignal bezeichnet wird. - Das Eingangssprachsignal wird in einem A/D-(Analog-zu-digital-)Umsetzer
11 mit einer Abtastfrequenz fs (beispielsweise 16 kHz) abgetastet und hat eine Signalbandbreite von fs/2 (8 kHz). Zu Zwecken der Codierung wird diese Bandbreite in zwei ggf. ungleiche Unterbänder unterteilt. Als Beispiel wird ein Breitband-Sprachcodierer betrachtet, der bei 16 kHz mit einer brauchbaren Signalbandbreite von 50 bis 7000 Hz arbeitet. Eine sinnvolle Niedrigband-Bandbreite kann 0 bis 5,33 kHz betragen (veranschaulicht in2 ), die erhalten wird durch Upsampling mit 2 (nfs) im Upsampler13 (32 kHz), Tiefpassfilterung mit einem Tiefpassfilter15 mit einem Übergangsband zwischen beispielsweise 5 und 5,33 kHz sowie Dezimierung durch 3 (nfs/m) im Downsampler17 , was zu einem abgetasteten Niedrigbandsignal mit 10,67 kHz führt. Das dezimierte Signal (mit 10,67 kHz) im niedrigeren Band wird mit Hilfe eines CELP-Codierers18 codiert. Die Niedrigband-Parameter aus dem LPC-Codierer umfassen Koeffizienten der linearen Prädiktion (LPC), die ein zeitlich veränderliches Gesamtpol-Filter (LPC-Filter) und Erregungsparameter spezifizieren. Die Erregungsparameter spezifizieren eine Zeitbereichssignalform, die als Erregungssignal bezeichnet wird und adaptive sowie unveränderte Erregungsbeiträge und entsprechende Verstär kungsfaktoren (Verstärkung, LPC, adaptiven Codebuch-Index und unveränderten Codebuch-Index) umfasst. - Das Hochbandsignal wird aus dem ursprünglichen Signal einfach durch dessen Bandpass- oder Hochpassfilterung erhalten, bevor es in einen Hochband-Codierer
20 eingegeben wird. Eine geeignete Bandbreite kann zwischen fs1 und fs2, wie etwa 5,33 kHz und 7 kHz, liegen. Der 16-kHz-Eingang wird beispielsweise zwischen 5,33 kHz und 7 kHz bandpassgefiltert, um das Hochbandsignal zu erhalten. Das Übergangsband dieses Filters muss zwischen 5 und 5,33 kHz liegen und so konzipiert sein, dass es das Niedrigband-Tiefpassfilter komplementieren kann. Der bandpassgefilterte Ausgang wird in einem Hochband-Codierer20 codiert. Es gibt mehrere mögliche Arten, den Hochband-Erregungscodierer20 zu erzeugen, wie etwa Zufallsrauschen, rausch-erregte LPC, an den Verstärkungsfaktor angepasste Analyse durch Synthese, Mehrfachimpulscodierung oder eine Kombination hiervon. - Das codierte Signal wird über ein Übertragungsmedium wie etwa ein Kabel- oder ein drahtloses Netz zum Decodierer gesendet. Im Decodierer wird das Niedrigband-Erregungssignal mit der Niedrigbandrate von 10,67 kHz (2fs/3) rekonstruiert und in den CELP-Decodierer (LPC-Synthesefilter)
21 eingegeben. Der Ausgang des CELP-Decodierer21 wird im Upsampler23 einem Upsampling (um 3) zu 2fs (32 kHz) unterzogen und im Filter25 bei 5,33 kHz tiefpassgefiltert sowie durch den Downsampler26 bei 16 kHz zu fs dezimiert (um 2 dezimiert), um das niedrigband-codierte Signal zu erzeugen. Das Hochbandsignal mit fs (16 kHz) wird im Hochbandpass-Decodierer27 mit der ursprünglichen Abtastrate erzeugt und im Bandpassfilter29 bandpassgefiltert, um das hochband-codierte Signal mit fs (16 kHz) zu erhalten. Das 16-kHz-Signal wird zwischen 5,33 kHz und 8 kHz bandpassgefiltert, um das Hochbandsignal zu erhalten. Der Übergang dieses Filters liegt zwischen 5 und 5,33 kHz und ist so konzipiert, dass er das Niedrigband-Tiefpassfilter komplementieren kann. Die Hochband- und die Niedrigbandbeiträge werden im Addierer30 addiert, um das codierte Sprachsignal zu erhalten. - Wie oben besprochen, gibt es mehrere Verfahren für die Hochband-Erregungscodierung.
- Das einfachste Modell ist ein mit dem Verstärkungsfaktor skalierter Zufallsrauschen-Generator, wie er in
2 veranschaulicht ist. In diesem Fall stellen die Bits einen quantifizierten Wert des Verstärkungsfaktors dar und werden für einen Skalierfaktor verwendet. Der Ausgang des Zufallsrauschen-Generators31 wird im Multiplizierer32 mit diesem Skalierfaktor multipliziert und im Filter35 bandpassgefiltert, um das Hochbandsignal zu approximieren. Eine zweite Hochband-Decodierung ist in3 veranschaulicht, wobei das resultierende Signal – nach dem Rauschen-Generator37 und dem Verstärkungsfaktor-Multiplizierer38 , der durch den Verstärkungsfaktor-Wert aus einer von den Eingangsbits aufgerufenen Nachschlagetabelle gesteuert wird – durch ein LPC-Synthesefilter39 geführt wird, das von den Eingangsbits gesteuert wird (und sich von dem unterscheidet, das im Niedrigband verwendet wird). Die Ordnung dieses Filters und die Größe des LPC-Synthesefilter-Codebuchs können gering sein. Der Zweck ist es, auf das Hochbandrauschen eine Frequenzformung anzuwenden. Der Ausgang wird durch das Bandpassfilter40 gefiltert. - Bei der an den Verstärkungsfaktor angepassten Analyse durch Synthese wird der Zufallsrauschen-Generator durch ein Codebuch
41 ersetzt, das zulässige Erregungsvektoren enthält, auf die von den Eingangsbits zugriffen wird. Der Erregungsvektor, der den Fehler zwischen dem synthetischen Signal und dem Eingang minimiert, wird unter der Einschränkung ausgewählt, dass der Ausgangs-Verstärkungsfaktor mit dem Eingangs-Verstärkungsfaktor übereinstimmt. Die ausgewählten Vektoren werden im Multiplizierer43 durch Eingangsbits skaliert oder mit dem Verstärkungsfaktor gesteuert, und der resultierende Ausgang wird durch ein LPC-Synthesefilter45 geführt, das durch die Eingangsbits gesteuert wird. Der Ausgang des LPC-Synthesefilters45 wird in ein Bandpassfilter47 eingegeben. Dies wird ausführlicher erläutert von E. Paksoy, A. McCree und V. Viswanathan in "A Variable-Rate Multimodal Speech Coder With Gain-Matched Analysis by Synthesis", IEEE International Conference an Acoustics, Speech and Signal Processing, April 1997. - Eine weitere Möglichkeit besteht darin, einfach eine Codierung ternärer Impulse zu verwenden, wie es in
5 im Hochband veranschaulicht ist, wobei das Hochbandsignal durch eine (im Impulserregungs-Generator51 erzeugte) Signalform approximiert wird, die größtenteils aus Null-Elementen besteht, abgesehen von einigen, die eine Amplitude von +1 oder –1 haben. Diese Erregungssig nalform wird im Multiplizierer53 mit dem Verstärkungsfaktor skaliert und durch ein LPC-Synthesefilter55 sowie das Hochband-Bandpassfilter56 gefiltert, um das codierte Hochbandsignal zu erzeugen. Die Suche nach dem Erregungs- und dem Verstärkungsfaktor wird mittels eines Analyse-durch-Synthese-Mechanismus ausgeführt, der in CELP-Codierern üblich ist. Der Hochband-Codierer20 führt das Komplement der Decodierung aus. - In einem derartigen Unterband-Codierer kann auch eine Kombination der oben erwähnten Verfahren angewendet werden. Zudem ist anzumerken, dass das Unterband-Codierungsschema auch auf mehr als zwei Unterbänder erweitert werden kann.
- Es wurde ein Unterband-Codierer beschrieben, bei dem das Hochband keinem Subsampling unterzogen wird. Das Filterungs- und Abtastratenumwandlungs-Schema ist relativ einfach und hat die Vorteile verringerter Komplexität und verminderter Aliasing-Probleme im Falle ungleicher Unterbänder. Außerdem wurden mehrere Verfahren zur Hochband-Codierung vorgeschlagen, und es wurden eine Bandpass-Zufallsrauschen-Erzeugung, eine LPC-Spektralformung, eine an den Verstärkungsfaktor angepasste Analyse durch Synthese sowie eine Codierung ternärer Impulse besprochen.
Claims (24)
- Breitband-Sprachsignalcodierer, mit: Mitteln zum Unterteilen von Signalen auf einer Bandbreite in ein Signal in einem niedrigeren Unterband und in ein Signal in einem höheren Unterband; einem Downsampler (
17 ) zum Dezimieren des Signals im niedrigeren Unterband, einem Niedrigband-Sprachcodierer, der mit dem Downsampler gekoppelt ist, um das dezimierte Signal im niedrigeren Unterband zu codieren, und einem Hochband-Codierer (20 ) zum Codieren des Signals im höheren Unterband ohne Dezimierung und einem Kombinierer zum Kombinieren des Signals im höheren Unterband und des Signals im niedrigeren Unterband. - Codierer nach Anspruch 1, wobei der Kombinierer umfasst: ein Bandpassfilter (
19 ), das mit dem Hochband-Codierer gekoppelt ist, um auf das Signal im höheren Unterband eine Bandpassfilterung anzuwenden, um das niedrigere Unterband zu komplementieren. - Codierer nach Anspruch 1 oder Anspruch 2, der umfasst: Mittel (
13 ) zum Upsampling der codierten Signale im niedrigeren Unterband. - Codierer nach einem der Ansprüche 1 bis 3, wobei der Niedrigband-Sprachcodierer einen CELP-Codierer (
18 ) enthält. - Codierer nach einem der Ansprüche 1 bis 4, wobei der Hochband-Codierer einen LPC-Codierer (
39 ) enthält. - Codierer nach einem der Ansprüche 1 bis 4, wobei der Hochband-Codierer einen Zufallsrauschen-Generator (
31 ) enthält. - Codierer nach einem der Ansprüche 1 bis 5, wobei der Hochband-Codierer einen rauscherregten LPC (
45 ) enthält. - Codierer nach einem der Ansprüche 1 bis 7, wobei der Hochband-Codierer so beschaffen ist, dass er eine an den Verstärkungsfaktor angepasste Analyse durch Synthese ausführt.
- Codierer nach einem der Ansprüche 1 bis 8, wobei der Hochband-Codierer so beschaffen ist, dass er eine Mehrfachimpulscodierung ausführt.
- Breitband-Sprachcodierungssystem, das umfasst: Mittel zum Unterteilen von Signalen auf einer Bandbreite in ein niedrigeres Unterband und ein höheres Unterband, einen Downsampler (
17 ) zum Dezimieren der Signale im niedrigeren Unterband, einen Niedrigband-Sprachcodierer, der mit dem Downsampler gekoppelt ist, um die dezimierten Signale im niedrigeren Unterband zu codieren, einen Hochband-Codierer (20 ) zum Codieren des Signals im höheren Unterband ohne Dezimierung; ein Bandpassfilter (19 ), das mit dem Hochband-Codierer gekoppelt ist, um auf das Signal im höheren Unterband einer Bandpassfilterung anzuwenden, um das niedrigere Unterband zu komplementieren; einen ersten Decodierer (21 ) zum Decodieren der codierten Signale im niedrigeren Unterband; Mittel zum Upsampling und Tiefpassfiltern (23 ,25 ) der Signale im niedrigeren Unterband auf die gleiche Rate wie die Signale im höheren Band; einen zweiten Decodierer zum Decodieren der Signale im höheren Unterband und zum Bandpassfiltern (27 ,29 ) der Signale im höheren Unterband; und einen Addierer (30 ) zum Summieren der Signale im niedrigeren Unterband und der Signale im höheren Unterband. - System nach Anspruch 10, wobei der Niedrigband-Codierer einen CELP-Codierer (
18 ) enthält. - System nach Anspruch 10 oder Anspruch 11, wobei der Hochband-Codierer ein Zufallsrauschen enthält und der Hochband-Decodierer einen mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator (
31 ,32 ) enthält. - System nach einem der Ansprüche 10 bis 12, wobei der Hochband-Codierer ein rauscherregter LPC-Codierer ist und der Decodierer einen mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator (
37 ,38 ) enthält und der Ausgang in ein LPC-Synthesefilter (39 ) eingegeben wird. - System nach einem der Ansprüche 10 bis 13, wobei der Hochband-Codierer einen durch Synthese an den Verstärkungsfaktor angepassten Codierer enthält und der Hochband-Decodierer ein Codebuch (
41 ) mit zulässigen Erregungsvektoren, einen Multiplizierer (43 ) und ein LPC-Filter (45 ) enthält. - System nach einem der Ansprüche 10 bis 14, wobei der Codierer ein Mehrfachimpuls-Codierer ist und der Decodierer das Skalieren mit dem Verstärkungsfaktor einer Approximationssignalform, die mit dem Verstärkungsfaktor skaliert ist (
53 ) und durch ein LPC-Synthesefilter (55 ) gefiltert ist, enthält. - Breitband-Sprachdecodierersystem, das umfasst: einen ersten Decodierer (
21 ) zum Decodieren codierter Signale im niedrigeren Unterband, um Signale im niedrigeren Unterband mit einer Abtastrate flower auszugeben; einen zweiten Decodierer (27 ) zum Decodieren von Signalen im höheren Unterband, um Signale im höheren Unterband mit einer Abtastrate fhigher = (m/n) flower auszugeben, wobei m und n ganze Zahlen sind, wobei m größer als n ist und wobei n größer als 1 ist; einen Umsetzer zum Umsetzen der Signale im niedrigeren Unterband mit der Abtastrate flower auf die Abtastrate fhigher, wobei die Abtastratenumsetzung in dem Verhältnis m/n erfolgt; und einen Addierer (30 ) zum Summieren der umgesetzten Signale im niedrigeren Unterband und der Signale im höheren Unterband. - Decodierersystem nach Anspruch 16, wobei der zweite Decodierer einen mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator (
31 ,32 ) enthält. - Decodierersystem nach Anspruch 17, wobei ein Ausgang des mit dem Verstärkungsfaktor skalierten Zufallsrauschen-Generator in ein LPC-Synthesefilter (
39 ) eingegeben wird. - Decodierersystem nach einem der Ansprüche 16 bis 18, wobei der zweite Decodierer ein Codebuch (
41 ) mit zulässigen Erregungsvektoren, einen Multiplizierer (43 ) und ein LPC-Filter (45 ) enthält. - Decodierersystem nach einem der Ansprüche 16 bis 19, wobei der zweite Decodierer eine Mehrfachimpuls-Signalform enthält, die mit dem Verstärkungsfaktor skaliert (
53 ) und durch ein LPC-Synthesefilter (55 ) gefiltert ist. - Verfahren zur Breitband-Sprachsignalcodierung, das die folgenden Schritte umfasst: Unterteilen von Signalen auf einer Bandbreite in ein Signal im niedrigeren Unterband und ein Signal im höheren Unterband; Downsampling des Signals im niedrigeren Unterband; Codieren des dezimierten Signals im niedrigeren Unterband; Codieren des Signals im höheren Unterband ohne Dezimierung; und Kombinieren des Signals im höheren Unterband und des Signals im niedrigeren Unterband.
- Verfahren nach Anspruch 21, das ferner den folgenden Schritt umfasst: Upsampling der codierten Signale im niedrigeren Unterband.
- Verfahren zur Breitband-Sprachcodierung, das die folgenden Schritte umfasst: Unterteilen von Signalen auf einer Bandbreite in ein niedrigeres Unterband und ein höheres Unterband; Downsampling der Signale im niedrigeren Unterband; Codieren der dezimierten Signale im niedrigeren Unterband; Codieren des Signals im höheren Unterband ohne Dezimierung; Anwenden einer Bandpassfilterung auf das Signal im höheren Unterband, um das niedrigere Unterband zu komplementieren; Decodieren der codierten Signale im niedrigeren Unterband; Upsampling und Tiefpassfiltern der Signale im niedrigeren Unterband auf die gleiche Rate wie die Signale im höheren Band; Decodieren der Signale im höheren Unterband und Anwenden einer Bandpassfilterung auf die Signale im höheren Unterband; und Summieren der Signale im niedrigeren Unterband und der Signale im höheren Unterband.
- Verfahren zur Breitband-Sprachdecodierung, das die folgenden Schritte umfasst: Decodieren codierter Signale im niedrigeren Unterband, um Signale im niedrigeren Unterband auszugeben, mit einer Abtastrate flower; Decodieren von Signalen im höheren Unterband, um Signale im höheren Unterband auszugeben, mit einer Abtastrate fhigher = (m/n)flower, wobei m und n ganze Zahlen sind, wobei m größer als n ist und wobei n größer als 1 ist; Umsetzen des Signals im niedrigeren Unterband mit der Abtastrate flower zu der Abtastrate fhigher wobei die Abtastraten-Umsetzung mit dem Verhältnis m/n erfolgt; und Summieren der umgesetzten Signale im niedrigeren Unterband und der Signale im höheren Unterband.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17139399P | 1999-12-21 | 1999-12-21 | |
US171393P | 1999-12-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE60038279D1 DE60038279D1 (de) | 2008-04-24 |
DE60038279T2 true DE60038279T2 (de) | 2009-03-12 |
Family
ID=22623577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE60038279T Expired - Lifetime DE60038279T2 (de) | 1999-12-21 | 2000-12-13 | Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils |
Country Status (5)
Country | Link |
---|---|
US (1) | US7260523B2 (de) |
EP (1) | EP1111589B1 (de) |
JP (1) | JP2001215999A (de) |
AT (1) | ATE389227T1 (de) |
DE (1) | DE60038279T2 (de) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
US8463334B2 (en) * | 2002-03-13 | 2013-06-11 | Qualcomm Incorporated | Apparatus and system for providing wideband voice quality in a wireless telephone |
US7987095B2 (en) * | 2002-09-27 | 2011-07-26 | Broadcom Corporation | Method and system for dual mode subband acoustic echo canceller with integrated noise suppression |
US8879432B2 (en) | 2002-09-27 | 2014-11-04 | Broadcom Corporation | Splitter and combiner for multiple data rate communication system |
EP1408615B1 (de) * | 2002-09-27 | 2011-02-09 | Broadcom Corporation | Splitter und Kombinierer in einem Kommunikationssystem mit mehrfachen Datenraten |
US7406096B2 (en) * | 2002-12-06 | 2008-07-29 | Qualcomm Incorporated | Tandem-free intersystem voice communication |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7443978B2 (en) * | 2003-09-04 | 2008-10-28 | Kabushiki Kaisha Toshiba | Method and apparatus for audio coding with noise suppression |
CN1303584C (zh) * | 2003-09-29 | 2007-03-07 | 摩托罗拉公司 | 联接式语音合成的声音目录编码方法和装置 |
EP1683133B1 (de) * | 2003-10-30 | 2007-02-14 | Koninklijke Philips Electronics N.V. | Audiosignalcodierung oder -decodierung |
CN1887025A (zh) * | 2003-12-01 | 2006-12-27 | 皇家飞利浦电子股份有限公司 | 选择性音频信号增强 |
US20080243496A1 (en) * | 2005-01-21 | 2008-10-02 | Matsushita Electric Industrial Co., Ltd. | Band Division Noise Suppressor and Band Division Noise Suppressing Method |
JP2006201622A (ja) * | 2005-01-21 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法 |
JP5129115B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 高帯域バーストの抑制のためのシステム、方法、および装置 |
TWI324336B (en) * | 2005-04-22 | 2010-05-01 | Qualcomm Inc | Method of signal processing and apparatus for gain factor smoothing |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
KR101411780B1 (ko) | 2009-10-20 | 2014-06-24 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 이전의 디코딩된 스펙트럼 값들의 그룹의 검출을 이용하는 오디오 인코더, 오디오 디코더, 오디오 정보를 인코딩하기 위한 방법, 오디오 정보를 디코딩하기 위한 방법 및 컴퓨터 프로그램 |
JP5773502B2 (ja) | 2010-01-12 | 2015-09-02 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム |
CA2984936C (en) * | 2011-02-18 | 2019-10-29 | Ntt Docomo, Inc. | Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program |
WO2013136109A1 (en) * | 2012-03-15 | 2013-09-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Method of transmitting data samples with reduced bandwidth |
CN105976830B (zh) | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
WO2014138539A1 (en) * | 2013-03-08 | 2014-09-12 | Motorola Mobility Llc | Conversion of linear predictive coefficients using auto-regressive extension of correlation coefficients in sub-band audio codecs |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0351479B1 (de) * | 1988-07-18 | 1994-10-19 | International Business Machines Corporation | Verfahren und Einrichtung zur Sprachkodierung mit niedriger Bitrate |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
JPH06180948A (ja) * | 1992-12-11 | 1994-06-28 | Sony Corp | ディジタル信号処理装置又は方法、及び記録媒体 |
JP3123286B2 (ja) * | 1993-02-18 | 2001-01-09 | ソニー株式会社 | ディジタル信号処理装置又は方法、及び記録媒体 |
JPH06284392A (ja) * | 1993-03-30 | 1994-10-07 | Toshiba Corp | 映像信号送受信装置 |
BE1007617A3 (nl) * | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
WO1995034883A1 (fr) * | 1994-06-15 | 1995-12-21 | Sony Corporation | Processeur de signaux et dispositif de reproduction sonore |
US5926791A (en) * | 1995-10-26 | 1999-07-20 | Sony Corporation | Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding |
JP3325772B2 (ja) * | 1996-05-15 | 2002-09-17 | パイオニア株式会社 | 帯域分割信号処理システム |
US6904404B1 (en) * | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
DE69924922T2 (de) * | 1998-06-15 | 2006-12-21 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiokodierungsmethode und Audiokodierungsvorrichtung |
US6182031B1 (en) * | 1998-09-15 | 2001-01-30 | Intel Corp. | Scalable audio coding system |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6324505B1 (en) * | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Amplitude quantization scheme for low-bit-rate speech coders |
-
2000
- 2000-12-07 US US09/732,337 patent/US7260523B2/en not_active Expired - Lifetime
- 2000-12-13 EP EP00204481A patent/EP1111589B1/de not_active Expired - Lifetime
- 2000-12-13 DE DE60038279T patent/DE60038279T2/de not_active Expired - Lifetime
- 2000-12-13 AT AT00204481T patent/ATE389227T1/de not_active IP Right Cessation
- 2000-12-20 JP JP2000387532A patent/JP2001215999A/ja not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20020072899A1 (en) | 2002-06-13 |
EP1111589B1 (de) | 2008-03-12 |
ATE389227T1 (de) | 2008-03-15 |
DE60038279D1 (de) | 2008-04-24 |
US7260523B2 (en) | 2007-08-21 |
JP2001215999A (ja) | 2001-08-10 |
EP1111589A1 (de) | 2001-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60038279T2 (de) | Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils | |
DE60011051T2 (de) | Celp-transkodierung | |
EP1979901B1 (de) | Verfahren und anordnungen zur audiosignalkodierung | |
DE69631728T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
DE60029990T2 (de) | Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer | |
DE69910058T2 (de) | Verbesserung der periodizität eines breitbandsignals | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE69926821T2 (de) | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen | |
DE69916321T2 (de) | Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
DE60202881T2 (de) | Wiederherstellung von hochfrequenzkomponenten | |
DE69333786T2 (de) | Verfahren zum Kodieren und Dekodieren von Audiodaten | |
DE69816810T2 (de) | Systeme und verfahren zur audio-kodierung | |
DE60024501T2 (de) | Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution | |
DE60100813T2 (de) | Verbesserte spektrale übersetzung/faltung im subband-bereich | |
DE602004007786T2 (de) | Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate | |
DE60006271T2 (de) | Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung | |
DE60133757T2 (de) | Verfahren und vorrichtung zur kodierung von stimmloser sprache | |
DE60012760T2 (de) | Multimodaler sprachkodierer | |
DE60128479T2 (de) | Verfahren und vorrichtung zur bestimmung eines synthetischen höheren bandsignals in einem sprachkodierer | |
DE602004004950T2 (de) | Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren | |
DE112010005020T5 (de) | Sprachsignal-Wiederherstellungsvorrichtung und Sprachsignal-Wiederherstellungsverfahren | |
DE60124079T2 (de) | Sprachverarbeitung | |
DE69820362T2 (de) | Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen | |
DE19706516C1 (de) | Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |