DE69910240T2 - Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals - Google Patents

Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals Download PDF

Info

Publication number
DE69910240T2
DE69910240T2 DE69910240T DE69910240T DE69910240T2 DE 69910240 T2 DE69910240 T2 DE 69910240T2 DE 69910240 T DE69910240 T DE 69910240T DE 69910240 T DE69910240 T DE 69910240T DE 69910240 T2 DE69910240 T2 DE 69910240T2
Authority
DE
Germany
Prior art keywords
sequence
signal
white noise
synthesized
scaled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69910240T
Other languages
English (en)
Other versions
DE69910240D1 (de
Inventor
Bruno Bessette
Redwan Salami
Roch Lefebvre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VoiceAge Corp
Original Assignee
VoiceAge Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4162966&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69910240(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by VoiceAge Corp filed Critical VoiceAge Corp
Application granted granted Critical
Publication of DE69910240D1 publication Critical patent/DE69910240D1/de
Publication of DE69910240T2 publication Critical patent/DE69910240T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Dc Digital Transmission (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)
  • Error Detection And Correction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Inorganic Insulating Materials (AREA)
  • Parts Printed On Printed Circuit Boards (AREA)
  • Coils Or Transformers For Communication (AREA)
  • Package Frames And Binding Bands (AREA)
  • Installation Of Indoor Wiring (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Image Processing (AREA)
  • Optical Communication System (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Preliminary Treatment Of Fibers (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Networks Using Active Elements (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Television Systems (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung:
  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Wiederherstellung eines Hochfrequenzanteils eines vorher abwärts abgetasteten Breitbandsignals und zur Einspeisung dieses Hochfrequenzanteils in eine überabgetastete synthetisierte Version des abwärts abgetasteten Breitbandsignals, um ein syntetisiertes Breitbandsignal mit vollem Spektrum zu erzeugen.
  • 2. Kurze Beschreibung des Standes der Technik
  • Die Nachfrage nach effizienten digitalen Sprach/Ton-Breitbandcodiertechniken mit einem guten Kompromiß in der subjektiven Qualität/Bitrate nimmt für zahlreiche Anwendungen, wie z. B. Audio/Video-Konferenz-, Multimedia- und Rundfunkanwendungen sowie auch Internet- und Paketnetzanwendungen, zu. Bis vor kurzem wurden im Bereich von 200–3400 Hz gefilterte Telefonbandbreiten hauptsächlich bei Sprachcodieranwendungen benutzt. Es besteht jedoch ein zunehmender Bedarf an Breitbandsprachanwendungen, um die Verständlichkeit und Natürlichkeit der Sprachsignale zu erhöhen. Eine Bandbreite im Bereich von 50– 7000 Hz hat sich als ausreichend für die Übermittlung einer Face-to-Face-Sprachqualität herausgestellt. Für Audiosignale gibt dieser Bereich eine akzeptable Audioqualität, aber noch geringer als die CD-Qualität, die im Bereich 20–20000 Hz wirksam ist.
  • Ein Sprachcodierer wandelt ein Sprachsignal in einen digitalen Bitfluß um, der über einen Kommunikationskanal gesendet (oder in einem Speichermedium gespeichert) wird. Das Sprachsignal wird digitalisiert (gewöhnlich mit 16 Bit pro Abtastung abgetastet und quantisiert) und der Sprachcodierer hat die Rolle, diese digitalen Abtastwerte mit einer kleineren Bitzahl darzustellen, während eine gute subjektive Sprachqualität beibehalten wird. Der Sprachdecodierer oder -synthetisierer ist auf dem gesendeten oder gespeicherten Bitstrom wirksam und wandelt ihn wieder in ein Schallsignal um.
  • Im Stand der Technik offenbart das Dokument US-A-5 455 888 eine Methode der Sprachbandbreitenausdehnung unter Verwendung einer LPC-Analyse.
  • Eine der besten Techniken des Standes der Technik, mit der ein guter Kompromiß in der Qualität/Bitrate erzielbar ist, ist die sogenannte Code-Excited-Linear-Prediction (CELP)- Technik. Gemäß dieser Technik wird das abgetastete Sprachsignal in aufeinanderfolgenden Blöcken von L Abtastungen verarbeitet, die gewöhnlich als Rahmen bezeichnet werden, wobei L irgendeine vorbestimmte Zahl (entsprechend 10–30 ms Sprache) ist. In CELP wird ein lineares Prädiktions (LP)- Synthesefilter berechnet und jeden Rahmen gesendet. Der L-Abtastungsrahmen wird dann in kleinere Blöcke unterteilt, sogenannte Unterrahmen mit der Größe von N Abtastwerten, wobei L = kN und k die Unterrahmenzahl in einem Rahmen ist (N entspricht gewöhnlich 4–10 ms Sprache). In jedem Unterrahmen wird ein Anregungssignal bestimmt, das gewöhnlich aus zwei Komponenten besteht: einer aus der letzten Anregung (auch bezeichnet als Tonhöhenbeitrag oder adaptives Codebuch) und die andere aus einem innovativen Codebuch (auch bezeichnet als festes Codebuch). Dieses Anregungssignal wird gesendet und beim Decodierer als die Eingabe des LP-Synthesefilters verwendet, um die synthetisierte Sprache zu erhalten.
  • Im Zusammenhang mit CELP ist ein innovatives Codebuch ein indizierter Satz von N-Abtastungen langen Sequenzen, auf die als N-dimensionale Codevektoren Bezug genommen wird. Jede Codebuchsequenz wird durch eine ganze Zahl k indiziert, die im Be reich von 1 bis M liegt, wobei M die Größe des Codebuchs darstellt, häufig ausgedrückt als eine Bitzahl b, wobei M = 2b.
  • Zur Synthetisierung von Sprache gemäß der CELP-Technik wird jeder Block von N Abtastungen synthetisiert, indem ein geeigneter Codevektor aus einem Codebuch durch zeitvariierende Filter gefiltert wird, die die spektralen Eigenschaften des Sprachsignals modellieren. Am Codiererende wird die Syntheseausgabe insgesamt oder ein Teilsatz der Codevektoren aus dem Codebuch (Codebuchsuche) berechnet. Der festgehaltene Codevektor ist derjenige, der die Syntheseausgabe am nahesten zum Originalsprachsignal gemäß einem wahrnehmungsmäßig gewichteten Verzerrungsmaß erzeugt. Diese Wahrnehmungsgewichtung wird unter Verwendung eines sogenannten Wahrnehmungsgewichtungsfilters ausgeführt, das gewöhnlich von dem LP-Synthesefilter abgeleitet ist.
  • Das CELP-Modell war bei der Codierung von Telefonbandschallsignalen sehr erfolgreich, und es gibt mehrere CELP-basierte Standards in einem großen Anwendungsbereich, insbesondere bei digitalen zellularen Anwendungen. Im Telefonband ist das Schallsignal im Band begrenzt auf 200–3400 Hz und wird mit 8000 Abtastungen/s abgetastet. Bei Breitband-Sprach/Tonanwendungen ist das Schallsignal auf 50–7000 Hz Band-begrenzt und wird mit 16000 Abtastungen/s abgetastet.
  • Einige Schwierigkeiten treten auf, wenn das Telefonband-optimierte CELP-Modell auf Breitbandsignale angewendet wird, und es müssen zusätzliche Merkmale zu dem Modell hinzugefügt werden, um Breitbandsignale mit hoher Qualität zu erhalten. Breitbandsignale zeigen einen viel größeren dynamischen Bereich im Vergleich zu Telefonbandsignalen, was zu Genauigkeitsproblemen führt, wenn eine Festpunktimplementierung des Algorithmus benötigt wird (was bei drahtlosen Anwendungen wesentlich ist). Weiter verbraucht das CELP-Modell häufig die meisten Codierbits beim Niederfrequenzbereich, der gewöhnlich höhere Energieinhalte hat, was zu einem Tiefpaßausgangssignal führt. Zur Überwindung dieses Problems muß das Wahrnehmungsgewichtungsfilter modifiziert werden, so daß es auf Breitbandsignale paßt, und Vorverzerrungstechniken, die die Hochfrequenzbereiche verstärken, werden zur Verringerung des dynamischen Bereichs, was zu einer einfacheren Festpunktimplementierung führt, und zur Sicherstellung einer besseren Codierung der Anteile des Signals mit höherer Frequenz wichtig. Weiter erstrecken sich die Tonhöheninhalte im Spektrum von stimmhaften Segmenten in Breitbandsignalen nicht über den gesamten Bereich des Spektrums und die Sprachmenge zeigt eine größere Variation im Vergleich zu Schmalbandsignalen. So ist es wichtig, die Tonhöhenanalyse mit geschlossener Schleife zu verbessern, um die Variationen in der Stimmhöhe besser zu erfassen.
  • Einige Schwierigkeiten treten auf, wenn das Telefonband-optimierte CELP-Modell auf Breitbandsignale angewendet wird, und es müssen zusätzliche Merkmale zu dem Modell hinzugefügt werden, um Breitbandsignale mit hoher Qualität zu erhalten.
  • Um den Codierungswirkungsgrad zu verbessern und die Kompliziertheit im Algorithmus des Breitbandcodieralgorithmus zu reduzieren, wird beispielsweise das eingegebene Breitbandsignal von 16 kHz auf etwa 12,8 kHz abwärts abgetastet. Dies reduziert die Zahl von Abtastungen in einem Rahmen, die Verarbeitungszeit und die Signalbandbreite unter 7000 Hz, um hierdurch eine Reduktion der Bitrate herab auf 12 kBit/s zu ermöglichen, während das decodierte Schallsignal mit sehr hoher Qualität beibehalten wird. Die Kompliziertheit wird auch aufgrund der kleineren Zahl von Abtastungen pro Sprachrahmen reduziert. Beim Decodierer müssen die Hochfrequenzinhalte des Signals wieder eingeführt werden, um die Tiefpaßfilterwirkung aus dem decodierten synthetisierten Signal zu entfernen und die natürliche Klangqualität der Breitbandsignale wiederzugewinnen. Zu diesem Zweck wird eine wirksame Technik für die Wiederherstellung des Hochfrequenzanteils des Breitbandsignals benötigt, um hierdurch ein synthetisiertes Breitbandsignal mit vollem Spektrum zu erzeugen, während eine Qualität nahe dem Ausgangssignal beibehalten wird.
  • AUFGABE DER ERFINDUNG
  • Eine Aufgabe der Erfindung ist es daher, eine solche wirksame Wiedergewinnungstechnik für den Hochfrequenzanteil zur Verfügung zu stellen.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Mehr im einzelnen, gemäß der vorliegenden Erfindung ist ein Verfahren zur Wiederherstellung eines Hochfrequenzanteils eines vorher abwärts abgetasteten Breitbandsignals und zur Einspeisung des Hochfrequenzanteils in eine überabgetastete synthetisierte Version des Breitbandsignals zur Verfügung gestellt, um ein synthetisiertes Breitbandsignal mit vollem Spektrum zu erzeugen. Dieses Verfahren zur Wiederherstellung des Hochfrequenzanteils umfaßt: Erzeugung einer Rauschsequenz; Spektralformung der Rauschsequenz in bezug auf Formparameter, die das abwärts abgetastete Breitbandsignal darstellen; und Einspeisung der spektralgeformten Rauschsequenz in die überabgetastete synthetisierte Signalversion, um hierdurch das synthetisierte Breitbandsignal mit vollem Spektrum zu erzeugen.
  • Die vorliegende Erfindung betrifft weiter eine Vorrichtung zur Wiederherstellung eines Hochfrequenzanteils eines vorher abwärts abgetasteten Breitbandsignals und zur Einspeisung dieses Hochfrequenzanteils in eine überabgetastete synthetisierte Version des Breitbandsignals, um ein synthetisiertes Breitbandsignal mit vollem Spektrum zu erzeugen. Diese Vorrichtung zur Wiederherstellung des Hochfrequenzanteils umfaßt einen Rauschgenerator zur Erzeugung einer Rauschsequenz, eine spektrale Formeinheit zur Formung der Rauschsequenz in bezug auf Formparameter, die das abwärts abgetastete Breitbandsignal darstellen, und einen Signaleinspeisekreis zur Einspeisung der spektralgeformten Rauschsequenz in die überabgetastete synthetisierte Signalversion, um hierdurch das synthetisierte Breitbandsignal mit vollem Spektrum zu erzeugen.
  • Gemäß einem bevorzugten Ausführungsbeispiel ist die Rauschsequenz eine Sequenz weißen Rauschens.
  • Vorzugsweise umfaßt die spektrale Formung der Rauschsequenz: Erzeugung einer skalierten Sequenz weißen Rauschens ansprechend auf die Sequenz weißen Rauschens und eines ersten Teilsatzes der Formparameter; Filtern der skalierten Sequenz weißen Rauschens in bezug auf einen zweiten Teilsatz der Formparameter, umfassend in der Bandbreite auf geweitete Synthesefilterkoeffizienten, um eine gefilterte skalierte Sequenz weißen Rauschens zu erzeugen, gekennzeichnet durch eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten synthetisierten Signalversion; und Bandpaßfiltern der gefilterten, skalierten Sequenz weißen Rauschens, um eine bandpaßgefilterte, skalierte Sequenz weißen Rauschens für eine anschließende Einspeisung in die überabgetastete synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens zu erzeugen.
  • Gemäß der vorliegenden Erfindung ist noch ein Decodierer zur Erzeugung eines synthetisierten Breitbandsignals geschaffen worden, umfassend:
    • a) eine Signalfragmentierungsvorrichtung zur Aufnahme einer codierten Version eines vorher während der Codierung abwärts abgetasteten Breitbandsignals und Extrahierung wenigstens von Tonhöhen-Codebuchparametern, innovativen Codebuchparametern und Synthesefilterkoeffizienten aus der codierten Breitbandsignalversion;
    • b) ein Tonhöhen-Codebuch ansprechend auf die Tonhöhen-Codebuchparameter zur Erzeugung eines Tonhöhen-Codevektors;
    • c) ein innovatives Codebuch ansprechend auf die innovativen Codebuchparameter zur Erzeugung eines innovativen Codevektors;
    • d) einen Kombinatorkreis zum Kombinieren des Tonhöhen-Code vektors und des innovativen Codevektors, um hierdurch ein Erregungssignal zu erzeugen;
    • e) eine Signalsynthesevorrichtung, die ein Synthesefilter zum Filtern des Erregungssignals in bezug auf die Synthesefilterkoeffizienten enthält, um hierdurch ein synthetisiertes Breitbandsignal zu erzeugen, und eine auf das synthetisierte Breitbandsignal ansprechende Überabtasteinrichtung zur Erzeugung einer überabgetasteten Signalversion des synthetisierten Breitbandsignals; und
    • f) eine Vorrichtung zur Wiederherstellung des Hochfrequenzanteils, wie oben beschrieben, zur Wiederherstellung eines Hochfrequenzanteils des Breitbandsignals und zur Einspeisung des Hochfrequenzanteils in die überabgetastete Signalversion für die Erzeugung des synthetisierten Breitbandsignals mit vollem Spektrum.
  • Gemäß einem bevorzugten Ausführungsbeispiel umfaßt der Decodierer weiter:
    • a) einen Stimmfaktorgenerator ansprechend auf die adaptiven und innovativen Codevektoren zur Berechnung eines Stimmfaktors für die Übertragung zu dem Verstärkungseinstellmodul;
    • b) ein Energieberechnungsmodul ansprechend auf das Erregungssignal zur Berechnung einer Erregungsenergie für die Übertragung zu dem Verstärkungseinstellmodul; und
    • c) einen spektralen Dachschrägenrechner ansprechend auf das synthetisierte Signal zur Berechnung eines Dachschrägenskalierungsfaktors für die Übertragung zu dem Verstärkungseinstellmodul. Der erste Teilsatz der Formparameter umfaßt den Stimmfaktor, den Energieskalierungsfaktor und den Dachschrägenskalierungsfaktor und der zweite Teilsatz der Formparameter enthält lineare Prädiktionskoeffizienten.
  • Gemäß den anderen bevorzugten Ausführungsbeispielen des Decodierers:
    • – berechnet der Stimmfaktorgenerator den Stimmfaktor rv unter Verwendung der Relation: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie des verstärkungsskalierten Tonhöhen-Codevektors ist und Ec die Energie des verstärkungsskalierten innovativen Codevektors ist;
    • – berechnet die Verstärkungseinstelleinheit einen Energieskalierungsfaktor unter Verwendung der Relation:
      Figure 00080001
      wobei w' die Sequenz weißen Rauschens ist und u' ein von dem Erregungssignal abgeleitetes verstärktes Erregungsignal ist;
    • – berechnet der spektrale Dachschrägenrechner den Dachschrägenskalierungsfaktor gt unter Verwendung der Relation: gt = 1 – Tilt begrenzt durch 0 , 2 ≤ gt ≤ 1, 0 wobei
      Figure 00080002
      bedingt durch tilt ≥ 0 und tilt ≥ rv, oder der Relation: gt = 10–0,6tilt begrenzt durch 0, 2 ≤ gt ≤ 1, 0 wobei
      Figure 00080003
      bedingt durch tilt ≥ 0 und tilt ≥ rv.
  • Vorzugsweise hat das Bandpaßfilter eine Frequenzbandbreite, die zwischen 5,6 kHz und 7,2 kHz liegt.
  • Auch gemäß der vorliegenden Erfindung, in einem Decodierer zur Erzeugung eines synthetisierten Breitbandsignals, umfassend:
    • a) eine Signalfragmentierungsvorrichtung zur Aufnahme einer codierten Version eines Breitbandsignals, das vorher während der Codierung und Extrahierung aus der codierten Breitbandsignalversion wenigstens von Tonhöhen-Codebuchparamentern, innovativen Codebuchparametern und Synthesefilterkoeffizienten abwärts abgetastet wurde;
    • b) ein Tonhöhen-Codebuch ansprechend auf die Tonhöhen-Codebuchparameter zur Erzeugung eines Tonhöhen-Codevektors;
    • c) ein innovatives Codebuch ansprechend auf die innovativen Codebuchparameter zur Erzeugung eines innovativen Codevektors;
    • d) einen Kombinatorkreis zur Kombination des Tonhöhen-Codevektors und des innovativen Codevektors, um hierdurch ein Erregungssignal zu erzeugen; und
    • e) eine Signalsynthesevorrichtung, die ein Synthesefilter zum Filtern des Erregungssignals in bezug auf die Synthesefilterkoeffizienten enthält, um hierdurch ein synthetisiertes Breitbandsignal zu erzeugen, und eine Überabtasteinrichtung ansprechend auf das synthetisierte Breitbandsignal zur Erzeugung einer überabgetasteten Signalversion des synthetisierten Breitbandsignals; umfaßt dabei die Verbesserung eine Vorrichtung zur Wiederherstellung des Hochfrequenzanteils, wie sie obenstehend beschrieben wurde, um einen Hochfrequenzanteil des Breitbandsignals wiederherzustellen und um den Hochfrequenzanteil in die überabgetastete Signalversion einzuspeisen, um das synthetisierte Breitbandsignal mit vollem Spektrum zu erzeugen.
  • Die vorliegende Erfindung umfaßt schließlich ein zellulares Kommunikationssystem, eine zellulare mobile Sender/Empfänger einheit, ein zellulares Netzwerkelement und ein bidirektionales, drahtloses Kommunikationsteilsystem, das den oben beschriebenen Decodierer umfaßt.
  • Die Ziele, Vorteile und weitere Merkmale der vorliegenden Erfindung gehen beim Lesen der nachfolgenden, nicht einschränkenden Beschreibung eines bevorzugten Ausführungsbeispiels weiter hervor, das lediglich zu Beispielszwecken gegeben wird, mit Bezugnahme auf die begleitenden Zeichnungen.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • In den beigefügten Zeichnungen:
  • 1 ist ein schematisches Blockdiagramm eines bevorzugten Ausführungsbeispiels einer Breitbandcodiervorrichtung;
  • 2 ist ein schematisches Blockdiagramm eines bevorzugten Ausführungsbeispiels einer Breitbanddecodiervorrichtung;
  • 3 ist ein schematisches Blockdiagramm eines bevorzugten Ausführungsbeispiels einer Tonhöhenanalysevorrichtung; und
  • 4 ist ein vereinfachtes, schematisches Blockdiagramm eines zellularen Kommunikationssystems, bei dem die Breitbandcodiervorrichtung von 1 und die Breitbanddecodiervorrichtung von 2 verwendet werden können.
  • DETAILLIERTE BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS
  • Wie den Fachleuten wohlbekannt ist, liefert ein zellulares Kommunikationssystem wie 401 (siehe 4) einen Telekommunikationsdienst über einen großen geographischen Bereich, indem dieser große geographische Bereich in eine Anzahl C kleinerer Zellen unterteilt wird. Die C kleineren Zellen werden mittels entsprechender zellularer Basisstationen 4021 , 4022 ... 402c versorgt, um jeder Zelle Funksignalisierungs-, Audio- und Datenkanäle zu liefern.
  • Funksignalisierungskanäle werden dazu verwendet, mobile Funktelefone (mobile Sender/Empfängereinheiten) wie 403 innerhalb der Grenzen des erfaßten Gebiets (Zelle) der zellularen Basisstation 402 auszurufen und Anrufe zu anderen Funktelefonen 403, die sich entweder innerhalb oder außerhalb der Zelle der Basisstation befinden, oder zu einem anderen Netzwerk wie dem öffentlichen Fernsprechwählnetz (PSTN) 404 zu legen.
  • Sobald ein Funktelefon 403 erfolgreich einen Anruf plaziert der empfangen hat, wird ein Audio- oder Datenkanal zwischen diesem Funktelefon 403 und der zellularen Basisstation 402 entsprechend der Zelle eingerichtet, in der sich das Funktelefon 403 befindet, und es wird eine Kommunikation zwischen der Basisstation 402 und dem Funktelefon 403 über diesen Audio- oder Datenkanal geführt. Das Funktelefon 403 kann auch eine Kontroll- oder Taktinformation über einen Signalisierungskanal erhalten, während ein Anruf im Gange ist.
  • Wenn ein Funktelefon 403 eine Zelle verläßt und in eine andere benachbarte Zelle eintritt, während ein Anruf im Gange ist, übergibt das Funktelefon 403 den Anruf an einen verfügbaren Audio- oder Datenkanal der neuen Zellenbasisstation 402. Wenn ein Funktelefon 403 eine Zelle verläßt und in eine andere benachbarte Zelle eintritt, während kein Anruf im Gange ist, sendet das Funktelefon 403 eine Kontrollmeldung über den Signalisierungskanal, um sich in die Basisstation 402 der neuen Zelle einzuloggen. Auf diese Weise ist eine mobile Kommunikation über einen großen geographischen Bereich möglich.
  • Das zellulare Kommunikationssystem 401 umfaßt weiter eine Leitstation 405, um die Kommunikation zwischen den zellularen Basisstationen 402 und dem PSTN 404 beispielsweise während einer Kommunikation zwischen einem Funktelefon 403 und dem PSTN 404 oder zwischen einem Funktelefon 403, das sich in einer ersten Zelle befindet, und einem Funktelefon 403, das sich in einer zweiten Zelle befindet, zu steuern.
  • Selbstverständlich wird ein bidirektionales drahtloses Funkkommunikationsteilsystem benötigt, um einen Audio- oder Datenkanal zwischen einer Basisstation 402 einer Zelle und einem sich in dieser Zelle befindenden Funktelefon 403 einzurichten. Wie in sehr vereinfachter Form in 4 veranschaulicht ist, umfaßt ein bidirektionales drahtloses Funkkommunikationsteilsystem typischerweise im Funktelefon 403:
    • – einen Sender 406, der enthält:
    • – einen Codierer 407 zum Codieren des Sprachsignals; und
    • – einen Sendekreis 408 zum Senden des codierten Sprachsignals von dem Codierer 407 aus durch eine Antenne wie 409; und
    • – einen Empfänger 410, der enhält:
    • – einen Empfängerkreis 411 zum Empfangen eines gesendeten, codierten Sprachsignals gewöhnlich durch dieselbe Antenne 409; und
    • – einen Decodierer 412 zum Decodieren des empfangenen codierten Sprachsignals aus dem Empfängerkreis 411.
  • Das Funktelefon umfaßt weiter andere herkömmliche Funktelefonkreise 413, mit denen der Codierer 407 und der Decodierer 412 verbunden sind, und zum Verarbeiten von Signalen aus diesen, welche Kreise 413 den Fachleuten wohlbekannt sind und demgemäß in der vorliegenden Beschreibung nicht weiter beschrieben werden.
  • Auch umfaßt ein derartiges bidirektionales, drahtloses Funkkommunikationsteilsystem typischerweise in der Basisstation 402:
    • – einen Sender 414, der enthält:
    • – einen Codierer 415 zum Codieren des Sprachsignals; und
    • – einen Sendekreis 416 zum Senden des codierten Sprachsignals aus dem Codierer 415 durch eine Antenne wie 417; und
    • – einen Empfänger 418, der enthält:
    • – einen Empfängerkreis 419 zum Empfangen eines gesendeten codierten Sprachsignals durch dieselbe Antenne 417 oder durch eine andere (nicht gezeigte) Antenne; und
    • – einen Decodierer 420 zum Decodieren des empfangenen codierten Sprachsignals aus dem Empfängerkreis 419.
  • Die Basisstation 402 umfaßt weiter typischerweise eine Basisstationskontrolleinheit 421 zusammen mit der zugeordneten Datenbasis 422, um die Kommunikation zwischen der Leitstation 405 und dem Sender 414 und dem Empfänger 418 zu steuern.
  • Wie den Fachleuten wohlbekannt ist, wird eine Sprachcodierung benötigt, um die für das Senden eines Tonsignals, beispielsweise eines Stimmsignals wie Sprache, über das bidirektionale, drahtlose Funkkommunikationsteilsystem, d. h. zwischen einem Funktelefon 403 und einer Basisstation 402, benötigte Bandbreite zu reduzieren.
  • Bei LP-Sprachcodierern (wie 415 und 407), die typischerweise bei 13 kBit/Sekunde arbeiten, und darunter, wie Code-Excited-Linear-Prediction (CELP)- Codierern wird typischerweise ein LP-Synthesefilter verwendet, um die spektrale Kurzzeitumhüllende des Sprachsignals zu modellieren. Die LP-Information wird typischerweise alle 10 oder 20 ms zu dem Decodierer (wie 420 und 412) gesendet und wird am Decodiererende extrahiert.
  • Die in der vorliegenden Beschreibung offenbarten neuen Techniken können auf verschiedene LP-basierte Codiersysteme angewendet werden. Jedoch wird bei dem bevorzugten Ausführungsbeispiel ein Codiersystem vom CELP-Typ verwendet zu dem Zweck, eine nicht einschränkende Veranschaulichung dieser Techniken zu präsentieren. Auf dieselbe Weise können derartige Techniken bei Schallsignalen verschieden von Stimme und Sprache sowie bei anderen Typen von Breitbandsignalen verwendet werden.
  • 1 zeigt ein allgemeines Blockdiagramm einer Sprachcodiervorrichtung 100 vom CELP-Typ, die modifiziert worden ist, um eine bessere Anpassung für Breitbandsignale vorzusehen.
  • Das abgetastete eingebene Sprachsignal 114 wird in aufeinanderfolgende L-Abtastblöcke unterteilt, die als "Rahmen" bezeichnet werden. In jedem Rahmen werden das Sprachsignal in dem Rahmen darstellende, unterschiedliche Parameter berechnet, codiert und gesendet. Die das L-Synthesefilter darstellenden LP-Parameter werden gewöhnlich jeden Rahmen einmal berechnet. Der Rahmen wird weiter in kleinere Blöcke von N Abtastungen (Blöcke der Länge N) unterteilt, in welchen Anregungsparameter (Tonhöhe und Innovation) bestimmt werden. In der CELP-Literatur werden diese Blöcke mit Länge N als "Unterrahmen" bezeichnet und auf die N-Abtastungssignale in den Unterrahmen wird als "N-dimensionale Vektoren" Bezug genommen. Bei diesem bevorzugten Ausführungsbeispiel entspricht die Länge N 5 ms, während die Länge L 20 ms entspricht, was bedeutet, daß ein Rahmen vier Unterrahmen enthält (N = 80 bei der Abtastrate von 16 kHz und 64 nach dem Abwärtsabtasten auf 12,8 kHz). Zahlreiche N-dimensionale Vektoren treten bei der Codierprozedur auf. Eine Liste der Vektoren, die in 1 und 2 erscheinen, sowie eine Liste von gesendeten Parametern wird untenstehend gegeben:
  • Liste der wichtigsten N-dimensionalen Vektoren
  • s
    Breitbandsignaleingangssprachvektor (nach Abwärtsabtastung, Vorverarbeitung und Vorverzerrung);
    sw
    Gewichteter Sprachvektor;
    so
    Null-Eingabe-Antwort des gewichteten Synthesefilters;
    sp
    Abwärts abgetastetes vorverarbeitetes Signal; Überabgetastetes synthetisiertes Sprachsignal;
    s'
    Synthesesignal vor Nachentzerrung;
    sd
    Nachentzerrtes Synthesesignal;
    sh
    Synthesesignal nach Nachentzerrung und Nachverarbeitung;
    x
    Zielvektor für Tonhöhensuche;
    x'
    Zielvektor für Innovationssuche;
    h
    Gewichtete Synthesefilterimpulsantwort;
    vT
    Adaptiver (Tonhöhen-) Codebuchvektor bei Verzögerung T;
    yT
    Gefilterter Tonhöhen-Codevektor (vT gefaltet mit h);
    ck
    Innovativer Codevektor bei Index k (k-ter Eintrag aus dem Innovationscodebuch);
    cf
    Verstärkter skalierter Innovationscodevektor;
    u
    Anregungssignal (skalierte Innovations- und Tonhöhen-Codevektoren);
    u'
    Verstärkte Anregung;
    z
    Bandpaßrauschsequenz;
    w'
    Sequenz weißen Rauschens; und
    w
    Skalierte Rauschsequenz.
  • Liste gesendeter Parameter
  • STP
    Kurzzeit-Prädiktionsparameter (definierend A(z));
    T
    Tonhöhenverzögerung (oder Tonhöhen-Codebuchindex);
    b
    Tonhöhenverstärkung (oder Tonhöhen-Codebuchverstärkung);
    j
    Index des bei dem Tonhöhen-Codevektor verwendeten Tiefpaßfilters;
    k
    Codevektorindex (Innovationscodebucheintrag); und
    g
    Innovationscodebuchverstärkung.
  • Bei diesem bevorzugten Ausführungsbeispiel werden die STP-Parameter einmal pro Rahmen gesendet und der Rest der Parameter wird viermal pro Rahmen (jeden Unterrahmen) gesendet.
  • CODIERERSEITE
  • Das abgetastete Sprachsignal wird auf einer Block-zu-Block-Basis durch die Codiervorrichtung 100 von 1 codiert, die in elf Module aufgeteilt ist, die von 101 bis 111 numeriert sind.
  • Die eingegebene Sprache wird zu den oben erwähnten L-Abtastungsblöcken verarbeitet, die als Rahmen bezeichnet werden.
  • Wobei auf 1 Bezug genommen wird, das abgetastete eingegebene Sprachsignal 114 wird in einem Abwärtsabtastmodul 101 abwärts abgetastet. Beispielsweise wird das Signal von 16 kHz auf 12 kHz abwärts abgetastet, wobei für die Fachleute wohlbekannte Techniken verwendet werden. Das Abwärtsabtasten auf eine andere Frequenz kann selbstverständlich in Betracht gezogen werden. Das Abwärtsabtasten steigert die Codiereffizienz, da eine kleinere Frequenzbandbreite codiert wird. Dies setzt auch die Kompliziertheit des Algorithmus herab, da die Zahl von Abtastungen in einem Rahmen verringert ist. Die Verwendung der Abwärtsabtastung wird bedeutsam, wenn die Bitrate auf unter 16 kBit/s herabgesetzt ist, obwohl eine Abwärtsabtastung oberhalb von 16 kBit/s nicht wesentlich ist.
  • Nach dem Abwärtsabtasten wird der 320-Abtastungsrahmen von 20 ms auf einen 256-Abtastungsrahmen reduziert (Abwärtsabtastungsverhältnis 4/5).
  • Der eingegebene Rahmen wird dann dem fakultativen Vorverarbeitungsblock 102 zugeführt. Der Vorverarbeitungsblock 102 kann aus einem Hochpaßfilter mit einer Abschneidefrequenz von 50 Hz bestehen. Das Hochpaßfilter 102 entfernt die ungewünschten Schallfrequenzen unterhalb von 50 Hz.
  • Das abwärts abgetastete, vorverarbeitete Signal ist mit sP(n), n = 0, 1, 2, ..., L-1 bezeichnet, wobei L die Länge des Rahmens (256 bei einer Abtastfrequenz von 12,8 kHz) ist. Bei einem bevorzugten Ausführungsbeispiel des Vorverzerrungsfilters 103 wird das Signal sP(n) unter Verwendung eines Filters vorverzerrt, der die folgende Übertragungsfunktion aufweist: P (z) = 1 – μz–1 wobei μ ein Vorverzerrungsfaktor mit einem Wert ist, der zwischen 0 und 1 liegt (ein typischer Wert ist μ = 0,7). Es könnte auch ein Filter höherer Ordnung verwendet werden. Es sollte darauf hingewiesen werden, daß das Hochpaßfilter 102 und das Vorverzerrungsfilter 103 ausgetauscht werden können, um wirksamere Festpunkt-Implementierungen zu erhalten.
  • Die Funktion des Vorverzerrungsfilters 103 besteht darin, die Hochfrequenzanteile des Eingangssignals zu verstärken. Es setzt auch den dynamischen Bereich des eingegebenen Sprachsignals herab, was es für eine Festpunktimplentierung geeigneter macht. Ohne Vorverzerrung ist es schwierig, die LP-Analyse mit Festpunkt unter Verwendung einer Arithmetik mit einfacher Genauigkeit zu implementieren.
  • Die Vorverzerrung spielt auch eine wichtige Rolle bei der Erlangung einer geeigneten Gesamtwahrnehmungsgewichtung des Quantisierungsfehlers, welche zu einer verbesserten Tonqualität beiträgt. Dies wird untenstehend mehr im einzelnen erläutert.
  • Die Ausgabe des Vorverzerrungsfilters 103 ist mit s(n) bezeichnet. Dieses Signal wird dazu verwendet, die LP-Analyse im Rechnermodul 104 auszuführen. Die LP-Analyse ist eine Technik, die den Fachleuten wohlbekannt ist. Bei diesem bevorzugten Ausführungsbeispiel wird eine Autokorrelationsnäherung verwendet. Bei der Autokorrelationsnäherung wird das Signal s(n) als erstes unter Verwendung eines Hamming-Fensters (das gewöhnlich eine Länge in der Größe von 30–40 ms aufweist) mit Fenstertechnik bearbeitet. Die Autokorrelationen werden aus dem mit Fenstertechnik bearbeiteten Signal berechnet und es wird die Levinson-Durbin-Rekursion verwendet, um die LP-Filterkoeffizienten aj zu berechnen, wobei j = 1, ..., p ist und wobei p die LP-Ordnung ist, die gewöhnlich bei der Breitbandcodierung 16 ist. Die Parameter aj sind die Koeffizienten der Übertragungsfunktion des LP-Filters, die durch die folgende Relation gegeben ist:
  • Figure 00170001
  • Die LP-Analyse wird im Rechnermodul 104 ausgeführt, das auch die Quantisierung und Interpolation der LP-Filterkoeffizienten ausführt. Die LP-Filterkoeffizienten werden als erstes in einen anderen äquivalenten Bereich transformiert, der für Quantisierungs- und Interpolationszwecke geeigneter ist. Die Linienspektralpaar (LSP)- und Immitanzspektralpaar (ISP)-Bereiche sind zwei Bereiche, in denen die Quantisierung und Interpolation wirksam ausgeführt werden können. Die 16 LP-Filterkoeffizienten aj können in der Größe von 30 bis 50 Bit quantisiert werden, wobei eine gespaltene oder Mehrstufenquantisierung oder eine Kombination davon verwendet werden. Der Zweck der Interpolation besteht darin, es zu ermöglichen, die LP-Filterkoeffizienten jeden Unterrahmen zu aktualisieren, während sie einmal pro Rahmen gesendet werden, was die Codiererleistung verbessert, ohne die Bitrate zu vergrößern. Es wird angenommen, daß die Quantisierung und Interpolation der LP-Filterkoeffizienten im übrigen den Fachleuten bekannt ist, und demgemäß werden sie in der vorliegenden Beschreibung nicht weiter beschrieben.
  • Die folgenden Absätze beschreiben den Rest der Codieroperationen, die auf einer Unterrahmenbasis ausgeführt werden. In der folgenden Beschreibung bezeichnet das Filter A(z) das nicht quantisierte, interpolierte LP-Filter des Unterrahmens, und das Filter Â(z) bezeichnet das quantisierte, interpolierte LP-Filter des Unterrahmens.
  • Wahrnehmungsgewichtungs:
  • Bei Analyse-zu-Analyse-Codierern werden die optimalen Tonhöhen- und Innovationsparameter gesucht, indem der statistische Gesamtfehler zwischen der eingegebenen Sprache und der synthetisierten Sprache in einem wahrnehmungsgewichteten Bereich auf ein Minimum herabgesetzt wird. Dies ist dazu äquivalent, den Fehler zwischen der gewichteten eingegebenen Sprache und der gewichteten Synthesesprache auf ein Minimum herabzusetzen.
  • Das gewichtete Signal sw(n) wird in einem Wahrnehmungsgewichtungsfilter 105 berechnet. Traditionell wird das gewichtete Signal sw(n) mittels eines Gewichtungsfilters berechnet, das eine Übertragungsfunktion W(z) in der Form aufweist: W(z) = A(z/γ1)/A(z/γ2) wobei 0 < γ2 < γ1 ≤ 1
  • Wie den Fachleuten wohlbekannt ist, zeigt die Analyse bei Analyse-zu-Synthese (AbS)- Codierern gemäß Stand der Technik, daß der Quantisierungsfehler über eine Übertragungsfunktion W–1(z) gewichtet wird, die invers zur Übertragungsfunktion des Wahrnehmungsgewichtungsfilters 105 ist. Das Ergebnis wird von B. S. Atal und M. R. Schroeder in "Predictive coding of speech and. subjective error criteria", IEEE Transaction ASSP, Bd. 27, Nr. 3, Seiten 247–254, Juni 1979 gut beschrieben. Die Übertragungsfunktion W–1(z) zeigt einiges von der Formantenstruktur des eingegebenen Sprachsignals. Somit wird die Maskiereigenschaft des menschlichen Ohrs dadurch ausgenutzt, daß der Quantisierungsfehler so geformt wird, daß er in den Formantenbereichen mehr Energie hat, wo er dann durch die in diesen Bereichen vorhandene starke Signalenergie maskiert wird. Der Gewichtungsbetrag wird durch die Faktoren γ1 und γ2 kontrolliert.
  • Das obige herkömmliche Wahrnehmungsgewichtungsfilter 105 arbeitet bei Telefonbandsignalen gut. Es hat sich jedoch herausgestellt, daß dieses herkömmliche Wahrnehmungsgewichtungsfilter 105 für eine effiziente Wahrnehmungsgewichtung von Breitbandsignalen nicht geeignet ist. Es hat sich auch herausgestellt, daß das herkömmliche Wahrnehmungsgewichtungsfilter 105 inhärente Begrenzungen bei der Modellierung der Formantenstruktur und zugleich der erforderlichen spektralen Dachschrä ge aufweist. Die spektrale Dachschräge ist bei Breitbandsignalen aufgrund des breiten dynamischen Bereichs zwischen niedrigen und hohen Frequenzen stärker ausgeprägt. Der Stand der Technik hat angeregt, ein Dachschrägenfilter in W(z) hinzuzufügen, um die Dachschräge und Formantengewichtung des eingegebenen Breitbandsignals separat zu steuern.
  • Eine neue Lösung dieses Problems besteht gemäß der vorliegenden Erfindung darin, das Vorverzerrungsfilter 103 am Eingang einzuführen, das LP-Filter A(z) basierend auf der vorverzerrten Sprache s(n) zu berechnen und ein modifieziertes Filter W(z) zu benutzen, indem dessen Nenner festgelegt wird.
  • Im Modul 104 wird am vorverzerrten Signal s(n) eine LP-Analyse ausgeführt, um das LP-Filter A(z) zu erhalten. Auch wird ein neues Wahrnehmungsgewichtungsfilter 105 mit festgelegtem Nenner verwendet. Ein Beispiel der Übertragungsfunktion für das Wahrnehmungsgewichtungsfilter 104 ist durch die folgende Relation gegeben: W(z) = A(z/γ1)/(1-γ2z–1) wobei 0 < γ2 < γ1 ≤ 1
  • Beim Nenner kann eine höhere Ordnung verwendet werden. Diese Struktur entkoppelt die Formantengewichtung im wesentlichen von der Dachschräge.
  • Es sei festgestellt, daß, da A(z) basierend auf dem vorverzerrten Sprachsignal s(n) berechnet wird, die Dachschräge des Filters 1/A(z/γ1) weniger ausgeprägt im Vergleich zu dem Fall ist, wenn A(z) basierend auf der Originalsprache berechnet wird. Da am Decodiererende eine Nachentzerrung unter Verwendung eines Filters ausgeführt wird, das die Übertragungsfunktion aufweist: P–1(z) = 1/(1 – μz–1)wird das Quantisierungsfehlerspektrum durch ein Filter mit einer Übertragungsfunktion W–1(z) P–1(z) geformt. Wenn γ2 auf gleich μ festgelegt wird, was typischerweise der Fall ist, wird das Spektrum des Quantisierungsfehlers durch ein Filter geformt, dessen Übertragungsfunktion 1/A(z/γ1) ist, wobei A(z) basierend auf dem vorverzerrten Sprachsignal berechnet wird. Ein subjektives Zuhören zeigte, daß diese Struktur zur Erzielung der Fehlerformung mittels einer Kombination von Vorverzerrung und modifizierter Gewichtungsfilterung sehr effizient zur Codierung von Breitbandsignalen ist, zusätzlich zu den Vorteilen einer einfachen algorithmischen Festpunkt-Implementierung.
  • Tonhöhenanalyse:
  • Zur Vereinfachung der Tonhöhenanalyse wird als erstes eine Tonhöhenverzögerung mit offener Schleife TOL in dem Tonhöhensuchmodul 106 mit offener Schleife unter Verwendung des gewichteten Sprachsignals sw(n) geschätzt. Dann wird die Tonhöhenanalyse mit geschlossener Schleife, die in dem Tonhöhensuchmodul 107 mit geschlossener Schleife auf einer Unterrahmenbasis ausgeführt wird, um die Tonhöhenverzögerung mit offener Schleife TOL herum eingeschränkt, was die Kompliziertheit der Suche der LTP-Parameter T und b (Tonhöhenverzögerung und Tonhöhenverstärkung) signifikant herabsetzt. Gewöhnlich wird die Tonhöhenanalyse mit offener Schleife im Modul 106 alle 10 ms einmal (zwei Unterrahmen) unter Verwendung von den Fachleuten wohlbekannten Techniken ausgeführt.
  • Der Zielvektor x für die LTP (Langzeitprädiktions)- Analyse wird als erstes berechnet. Diese erfolgt gewöhnlich durch Subtrahieren der Null-Eingabe-Antwort so des gewichteten Synthesefilters W(z)/Â(z) aus dem gewichteten Sprachsignal sw(n). Diese Null-Eingabe-Antwort so wird durch einen Null-Eingabe-Antwortrechner 108 berechnet. Mehr im einzelnen, der Zielvektor x wird unter Verwendung der folgenden Relation berechnet: x = sw – so wobei x der N-dimensionale Zielvektor, sw der gewichtete Sprachvektor im Unterrahmen und so die Null-Eingabe-Antwort des Filters W(z)/Â(z) ist, welche die Ausgabe des kombinierten Filters W(z)/Â(z) aufgrund von dessen Anfangszuständen ist. Der Null-Eingabe-Anwortrechner 108 spricht auf das quantisierte interpolierte LP-Filter Â(z) aus dem LP-Analyse, Quantisierungs- und Interpolationsrechner 104 und auf die Anfangszustände des gewichteten Synthesefilters W(z)/Â(z) an, gespeichert im Speichermodul 111, um die Null-Eingabe-Antwort so (den Teil der Antwort aufgrund der Anfangszustände, wie bestimmt durch Festsetzen der Eingänge gleich Null) des Filters W(z)/Â(z) zu berechnen. Diese Operation ist den Fachleuten wohlbekannt und wird demgemäß nicht weiter beschrieben.
  • Selbstverständlich können alternative, aber mathematisch äquivalente Näherungen verwendet werden, um den Zielvektor x zu berechnen.
  • Im Impulsantwortgenerator 109 wird ein N-dimensionaler Impulsantwortvektor h des gewichteten Synthesefilters W(z)/Â(z) unter Verwendung der LP-Filterkoeffizienten A(z) und Â(z) aus dem Modul 104 berechnet. Wieder ist diese Operation den Fachleuten wohlbekannt und wird demgemäß in der vorliegenden Beschreibung nicht weiter beschrieben.
  • Die Tonhöhen- (oder Tonhöhen-Codebuch-) Parameter mit geschlossener Schleife b, T und j werden in dem Tonhöhensuchmodul 107 mit geschlossener Schleife berechnet, das den Zielvektor x, den Impulsantwortvektor h und die Tonhöhenverzögerung mit offener Schleife TOL als Eingaben verwendet. Herkömmlich wurde die Tonhöhenprädiktion mittels eines Tonhöhenfilters dargestellt, das die folgende Übertragungsfunktion aufweist: 1/(1 – bz–T)wobei b die Tonhöhenverstärkung und T die Tonhöhenverzögerung oder deren Nacheilen ist. In diesem Fall ist der Tonhöhenbeitrag zu dem Anregungssignal u(n) gegeben durch bu(n-T), wobei die Gesamtanregung gegeben ist durch u(n) = bu(n-T) + gckk(n)wobei g die innovative Codebuchverstärkung und ck(n) der innovative Codevektor beim Index k ist.
  • Diese Darstellung hat Grenzen, wenn die Tonhöhenverzögerung T kürzer als die Unterrahmenlänge N ist. In einer anderen Darstellung kann der Tonhöhenbeitrag gesehen werden als Tonhöhen-Codebuch, das das vergangene Anregungssignal enthält. Allgemein ist jeder Vektor im Tonhöhen-Codebuch eine um Eins verschobene Version des vorhergehenden Vektors (wobei eine Abtastung aufgegeben und eine neue Abtastung hinzugefügt wird). Für Tonhöhenverzögerungen T > N ist das Tonhöhen-Codebuch äquivalent zur Filterstruktur (1/(1 – bz–T) und ein Tonhöhen-Codebuchvektor vT(n) bei der Tonhöhenverzögerung T ist gegeben durch vT(n) = u(n-T), n = 0, ..., N-1.
  • Für Tonhöhenverzögerungen T kürzer als N wird ein Vektor vT(n) aufgebaut, indem die verfügbaren Abtastungen aus der letzten Anregung wiederholt werden, bis der Vektor vervollständigt ist (dies ist nicht zur Filterstruktur äquivalent).
  • Bei früheren Codierern wird eine höhere Tonhöhenauflösung verwendet, was die Qualität von stimmhaften Tonsegmenten signifikant verbessert. Dies wird bewirkt, indem das letzte Anregungssignal unter Verwendung von Mehrphaseninterpolationsfiltern überabgetastet wird. In diesem Fall entspricht der Vektor vT(n) gewöhnlich einer interpolierten Version der letzten Anregung, wobei die Tonhöhenverzögerung T eine nicht ganzzahlige Verzögerung (z. B. 50,25) ist.
  • Die Tonhöhensuche besteht darin, die beste Tonhöhenverzögerung T und Verstärkung b zu finden, die den mittleren gewichteten Fehler E zwischen dem Zielvektor x und der skalierten gefilterten vergangenen Anregung auf ein Minimum herabsetzen. Der Fehler E wird dabei ausgedrückt als: E = ∥x – byT2 wobei yT der gefilterte Tonhöhen-Codebuchvektor bei der Tonhöhenverzögerung T ist:
  • Figure 00240001
  • Es kann gezeigt werden, daß der Fehler E dadurch auf ein Minimum herabgesetzt wird, daß das Suchkriterium
    Figure 00240002
    auf ein Maximum gebracht wird, wobei t die Vektortransponierte bezeichnet.
  • Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird eine Unterabtastungstonhöhenauflösung von 1/3 verwendet, und die Tonhöhen (Tonhöhen-Codebuch)- Suche besteht aus drei Stufen.
  • In der ersten Stufe wird eine Tonhöhenverzögerung mit offener Schleife TOL in dem Tonhöhensuchmodul 106 mit offener Schleife in Antwort auf das gewichtete Sprachsignal sw(n) geschätzt. Wie in der vorstehenden Beschreibung angegeben wurde, wird diese Tonhöhenanalyse mit offener Schleife gewöhnlich einmal alle 10 ms (zwei Unterrahmen) unter Verwendung von den Fachleuten wohlbekannten Techniken ausgeführt.
  • In der zweiten Stufe wird das Suchkriterium C in dem Tonhöhen suchmodul 107 mit geschlossener Schleife nach ganzzahligen Tonhöhenverzögerungen um die geschätzte Tonhöhenverzögerung mit offener Schleife TOL herum (gewöhnlich ±5) gesucht, was die Suchprozedur signifikant vereinfacht. Es wird eine einfache Prozedur zur Aktualisierung des gefilterten Codevektors yT ohne die Notwendigkeit verwendet, die Faltung für jede Tonhöhenverzögerung zu berechnen.
  • Sobald in der zweiten Stufe eine optimale ganzzahlige Tonhöhenverzögerung gefunden wird, prüft eine dritte Stufe der Suche (Modul 107) die Bruchteile um diese optimale ganzzahlige Tonhöhenverzögerung herum.
  • Wenn der Tonhöhenprädiktor dargestellt ist durch ein Filter in der Form von 1/(1 – bz–T), was eine gültige Annahme für Tonhöhenverzögerungen T > N ist, zeigt das Spektrum des Tonhöhenfilters eine harmonische Struktur über den gesamten Frequenzbereich mit einer harmonischen Frequenz bezogen auf 1/T. Im Fall von Breitbandsignalen ist dieser Aufbau nicht sehr effizient, da die harmonische Struktur in Breitbandsignalen nicht das gesamte ausgedehnte Spektrum überdeckt. Die harmonische Struktur ist lediglich bis zu einer bestimmten Frequenz vorhanden, abhängig vom Sprachsegment. Um eine wirksame Darstellung des Tonhöhenbeitrags in stimmhaften Segmenten von Breitbandsprache zu erzielen, muß somit das Tonhöhenprädiktionsfilter die Flexibilität haben, daß der Periodizitätsumfang über das Breitbandspektrum variiert wird.
  • In der vorliegenden Beschreibung ist ein neues Verfahren offenbart, das eine effiziente Modellierung der harmonischen Struktur des Sprachspektrums von Breitbandsignalen erzielt, wodurch mehrere Formen von Tiefpaßfiltern auf die letzte Anregung angewendet werden und das Tiefpaßfilter mit der höheren Prädiktionsverstärkung ausgewählt wird.
  • Wenn die Unterabtastungstonhöhenauflösung verwendet wird, können die Tiefpaßfilter in die Interpolationsfilter eingearbei tet werden, die dazu verwendet werden, die höhere Tonhöhenauflösung zu erhalten. In diesem Fall wird die dritte Stufe der Tonhöhensuche, bei der die Bruchteile um die gewählte ganzzahlige Tonhöhenverzögerung geprüft werden, für die mehreren Interpolationsfilter mit unterschiedlichen Tiefpaßkennlinien wiederholt, und der Bruchteil- und Filterindex werden gewählt, die das Suchkriterium C auf ein Maximum bringen.
  • Eine einfachere Näherung besteht darin, die Suche in den oben beschriebenen drei Stufen abzuschließen, um die optimale Bruchteiltonhöhenverzögerung zu bestimmen, wobei lediglich ein Interpolationsfilter mit einem bestimmten Frequenzansprechen verwendet wird und die optimale Tiefpaßfilterform am Ende gewählt wird, indem die verschiedenen vorbestimmten Tiefpaßfilter auf den gewählten Tonhöhen-Codebuchvektor vT angewendet werden und das Tiefpaßfilter ausgewählt wird, das den Tonhöhenprädiktionsfehler auf ein Minimum herabsetzt. Diese Näherung wird im einzelnen untenstehend erörtert.
  • 3 veranschaulicht ein schematisches Blockdiagramm eines bevorzugten Ausführungsbeispiels der vorgeschlagenen Näherung.
  • Im Speichermodul 303 ist das letzte Anregungssignal u(n), n < 0, gespeichert. Das Tonhöhen-Codebuchsuchmodul 301 spricht auf den Zielvektor x, auf die Tonhöhenverzögerung mit offener Schleife TOL und auf das letzte Anregungssignal u(n), n < 0, aus dem Speichermodul 303 an, um eine Tonhöhen (Tonhöhen-Codebuch)- Suche auszuführen, wobei das oben definierte Suchkriterium C auf ein Minimum herabgesetzt wird. Aus dem Ergebnis der im Modul 301 ausgeführten Suche erzeugt das Modul 302 den optimalen Tonhöhen-Codebuchvektor vT. Es sei festgestellt, daß, da eine Unterabtastungstonhöhenauflösung (Teiltonhöhe) verwendet wird, das letzte Anregungssignal u(n), n < 0, interpoliert wird, und der Tonhöhen-Codebuchvektor vT entspricht dem interpolierten letzten Anregungssignal. Bei diesem bevorzugtem Ausführungsbeispiel weist das Interpolationsfilter (im Modul 301, aber nicht gezeigt) eine Tiefpaßfiltercharakteristik auf, die Frequenzanteile oberhalb von 7000 Hz entfernt.
  • Bei einem bevorzugten Ausführungsbeispiel werden K Filtercharakteristiken verwendet; diese Filtercharakteristiken könnten Tiefpaß- oder Bandpaßfiltercharakteristiken sein. Wenn der optimale Codevektor vT bestimmt und durch den Tonhöhen-Codevektorgenerator 302 zugeführt wird, werden K gefilterte Versionen von vT jeweils unter Verwendung von K unterschiedlichen Frequenzformfiltern wie 305(j) berechnet, wobei j = 1, 2,..., K. Diese gefilterten Versionen werden bezeichnet mit v(j)f, wobei j = 1, 2, ..., K. Die verschiedenen Vektoren vf(j)f werden in entsprechenden Modulen 304(j) , wobei j = 0, 1, 2, ..., K, mit der Impulsantwort h gefaltet, um die Vektoren y(j) zu erhalten, wobei j = 0, 1, 2, ..., K. Um den mittleren Tonhöhenprädiktionsfehler für jeden Vektor y(j) zu berechnen, wird der Wert y(j) mit der Verstärkung b mittels eines entsprechenden Verstärkers 307(j) multipliziert und der Wert by(j) wird von dem Zielvektor x mittels eines entsprechenden Subtrahierglieds 308(j) subtrahiert. Der Selektor 309 wählt das Frequenzformfilter 305(j) aus, das den mittleren Tonhöhenprädiktionsfehler e(j) = ∥x – b(j)y(j)2 j = 1, 2, ..., Kauf ein Minimum herabsetzt.
  • Zur Berechnung des mittleren Tonhöhenprädiktionsfehlers e(j) für jeden Wert von y(j) wird der Wert y(j) mit der Verstärkung b mittels eines entsprechenden Verstärkers 307(j) multipliziert und der Wert b(j)y(j) wird von dem Zielvektor x mittels Subtrahiergliedern 308(j) subtrahiert. Jede Verstärkung b(j) wird in einem entsprechenden Verstärkungsrechner 306(j) in Zuordnung zu dem Frequenzformfilter bei dem Index j berechnet unter Verwendung der folgenden Beziehung: b(j) = xty(j)∥y(j)2
  • Im Selektor 309 werden die Parameter b, T und j basierend auf vT oder v(j)f gewählt, was den mittleren Tonhöhenprädiktionsfehler e auf ein Minimum herabsetzt.
  • Wobei nun zu 1 zurückgekehrt wird, der Tonhöhen-Codebuchindex T wird codiert und zum Multiplexer 112 übertragen. Die Tonhöhenverstärkung b wird quantisiert und zum Multiplexer 112 übertragen. Mit dieser neuen Näherung wird Extrainformation benötigt, um den Index j des gewählten Frequenzformfilters im Multiplexer 112 zu codieren. Wenn beispielsweise drei Filter verwendet werden (j = 0, 1, 2, 3), werden dann zwei Bit benötigt, um diese Information darzustellen. Die Filterindexinformation j kann auch zusammen mit der Tonhöhenverstärkung b codiert werden.
  • Innovative Codebuchsuche:
  • Sobald die Tonhöhen- oder LTP (Langzeitprädiktions)- Parameter b, T und j bestimmt worden sind, besteht der nächste Schritt darin, die optimale innovative Anregung mittels des Suchmoduls 110 von 1 zu suchen. Als erstes wird der Zielvektor x durch Subtrahieren des LTP-Beitrags aktualisiert: x' = x – byT wobei b die Tonhöhenverstärkung und yT der gefilterte Tonhöhen-Codebuchvektor (die letzte Anregung bei Verzögerung T, gefiltert mit dem ausgewählten Tiefpaßfilter und gefaltet mit der Impulsantwort h, wie mit Bezugnahme auf 3 beschrieben) ist.
  • Die Suchprozedur in CELP wird ausgeführt, indem der optimale Anregungscodevektor ck und die Verstärkung g gefunden werden, die den mittleren Fehler zwischen dem Zielvektor und dem skalierten gefilterten Codevektor E = ∥x' – gHck2 auf ein Minimum herabsetzen, wobei H eine untere Dreieckfaltungsmatrix ist, abgeleitet von dem Impulsantwortvektor h.
  • Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird die innovative Codebuchsuche im Modul 110 mittels eines algebraischen Codebuchs ausgeführt, wie beschrieben in den US-Patenten Nr.: 5 444 816 (Adoul et al.), ausgegeben am 22. August 1995; 5 699 482, erteilt für Adoul et al. am 17. Dezember 1997; 5 754 976, erteilt für Adoul et al. am 19. Mai 1998; und 5 701 392 (Adoul et al.), datiert 23. Dezember 1997.
  • Sobald der optimale Anregungscodevektor ck und dessen Verstärkung g durch das Modul 110 gewählt worden sind, werden der Codebuchindex k und die Verstärkung g codiert und zum Multiplexer 112 übertragen.
  • Wobei nun auf 1 Bezug genommen wird, die Parameter b, T, j, Â(z), k und g werden durch den Multiplexer 112 gemultiplext, bevor sie durch einen Kommunikationskanal übertragen werden.
  • Speicheraktualisierung:
  • Im Speichermodul 111 (1) werden die Zustände des Gewichtungssynthesefilters W(z)/Â(z) aktualisiert, indem das Anregungssignal u = gck + bvT durch das Gewichtungssynthesfilter gefiltert werden. Nach diesem Filtervorgang werden die Zustände des Filters gespeichert und im nächsten Unterrahmen als Anfangszustände zur Berechnung der Null-Eingabe-Antwort im Rechnermodul 108 verwendet.
  • Wie im Fall des Zielvektors x können andere alternative, aber mathematisch äquivalente Näherungen zur Aktualisierung der Filterzustände verwendet werden, die den Fachleuten wohlbekannt sind.
  • DECODIERERSEITE
  • Die Sprachdecodiervorrichtung 200 von 2 veranschaulicht die verschiedenen Schritte, die zwischen der digitalen Eingabe 222 (Eingangsstrom zum Demultiplexer 217) und der ausgegebenen abgetasteten Sprache 223 (Ausgabe des Addierers 221) ausgeführt werden.
  • Der Demultiplexer 217 extrahiert die Synthesemodellparameter aus der von einem digitalen Eingangskanal empfangenen binären Information. Die extrahierten Parameter aus jedem empfangenen binären Rahmen extrahierten Parameter sind:
    • – die Kurzzeitprädiktionsparameter (STP) Â(z) (einmal pro Rahmen);
    • – die Kurzzeitprädiktions (LTP)- Parameter T, b und j (für jeden Unterrahmen); und
    • – der Innovationscodebuchindex k und die Verstärkung g (für jeden Unterrahmen).
  • Das aktuelle Sprachsignal wird basierend auf diesen Parametern synthetisiert, wie untenstehend erläutert wird.
  • Das innovative Codebuch 218 spricht auf den Index k an, um den Innovationscodevektor ck zu erzeugen, der durch den decodierten Verstärkungsfaktor g über einen Verstärker 224 skaliert wird. Beim bevorzugten Ausführungsbeispiel wird ein innovatives Codebuch 218, wie es in den oben erwähnten US-Patenten mit den Nummern 5 444 816; 5 699 482; 5 754 976; und 5 701 392 beschrieben wird, verwendet, um den innovativen Codevektor ck darzustellen.
  • Der erzeugte skalierte Codevektor gck am Ausgang des Verstärkers 224 wird durch ein Innovationsfilter 205 verarbeitet.
  • Periodizitätserweiterung:
  • Der erzeugte skalierte Codevektor am Ausgang des Verstärkers 224 wird durch einen frequenzabhängigen Tonhöhenvergrößerer 205 verarbeitet.
  • Die Vergrößerung der Periodizität des Anregungssignals u verbessert die Qualität im Fall von stimmhaften Segmenten. Dies erfolgte in der Vergangenheit durch Filtern des Innovationsvektors aus dem innovativen Codebuch (festen Codebuch) 218 durch ein Filter in der Form 1/(1 – ∊bz–T), wobei ∊ ein Faktor unter 0,5 ist, der die Größe der eingeführten Periodizität kontrolliert. Diese Näherung ist weniger effizient im Fall von Breitbandsignalen, da sie die Periodizität über das gesamte Spektrum einführt. Eine neue alternative Näherung, die Teil der vorliegenden Erfindung ist, ist offenbart, durch welche die Periodizitätserweiterung erzielt wird, indem der innovative Codevektor ck aus dem innovativen (festen) Codebuch durch ein Innovationsfilter 205 (F(z)) gefiltert wird, dessen Frequenzantwort die höheren Frequenzen mehr als die niedrigeren Frequenzen anhebt. Die Koeffizienten von F(z) sind auf das Periodizitätsmaß im Anregungssignal u bezogen.
  • Den Fachleuten sind viele Verfahren zum Erhalten gültiger Periodizitätskoeffizienten bekannt. Beispielsweise liefert der Wert der Verstärkung b eine Periodizitätsangabe. D. h. wenn die Verstärkung b nahe 1 ist, ist die Periodizität des Anregungssignals u hoch, und wenn die Verstärkung b kleiner als 0,5 ist, ist dann die Peridizität niedrig.
  • Eine weitere wirksame Weise zur Ableitung der verwendeten Filter F(z)- Koeffizienten ist bei einem bevorzugten Ausführungsbeispiel deren Beziehung auf die Größe des Tonhöhenbeitrags im gesamten Anregungssignal u. Dies führt zu einer Frequenzantwort abhängig von der Unterrahmenperiodizität, wo höhere Frequenzen für höhere Tonhöhenverstärkungen stärker angehoben sind (stärkere Gesamtsteigung). Das Innovationsfilter 205 hat die Wirkung, die Energie des innovativen Codevektors ck bei niedrigen Frequenzen abzusenken, wenn das Anregungssignal u periodischer ist, was die Periodizität des Anregungssignals u bei niedrigeren Frequenzen mehr als bei höheren Frequenzen erweitert. Vorgeschlagene Formen für Innovationsfilter 205 sind (1) F (z) = 1 – σz–1 oder (2) F(z) = –αz + 1 – αz–1 wobei σ oder α aus dem Periodizitätspegel des Anregungssignals u abgeleitete Periodizitätsfaktoren sind.
  • Die zweite Drei-Term-Form von F(z) wird bei einem bevorzugten Ausführungsbeispiel verwendet. Der Periodizitätsfaktor α wird im Stimmfaktorgenerator 204 berechnet. Es können verschiedene Verfahren verwendet werden, um den Periodizitätsfaktor α basierend auf der Periodizität des Anregungssignals u abzuleiten. Unten werden zwei Verfahren dargestellt.
  • Verfahren 1:
  • Das Verhältnis des Tonhöhenbeitrags zum gesamten Anregungssignal u wird als erstes im Stimmfaktorgenerator 204 berechnet durch
    Figure 00320001
    wobei vT der Tonhöhen-Codebuchvektor, b die Tonhöhenverstärkung und u das Anregungssignal u sind, gegeben am Ausgang des Ad dierers 219 durch u = gck + bvT
  • Es sei festgestellt, daß der Term bvT seine Quelle im Tonhöhen-Codebuch (Tonhöhen-Codebuch) 201 in Antwort auf die Tonhöhenverzögerung T und den im Speicher 203 gespeicherten letzten Wert u hat. Der Tonhöhen-Codevektor vT aus dem Tonhöhen-Codebuch 201 wird dann durch ein Tiefpassfilter 202 verarbeitet, dessen Abschneidefrequenz mittels des Index j aus dem Demultiplexer 217 eingestellt ist. Der resultierende Codevektor vT wird dann mit der Verstärkung b aus dem Demultiplexer 217 durch einen Verstärker 226 multipliziert, um das Signal bvT zu erhalten.
  • Der Faktor α wird im Stimmfaktorgenerator 204 berechnet durch α = qRp begrenzt durch α < qwobei q ein Faktor ist, der den Vergrößerungsbetrag steuert (q ist im bevorzugten Ausführungsbeispiel auf 0,25 festgesetzt).
  • Verfahren 2:
  • Ein bei einem bevorzugten Ausführungsbeispiel der Erfindung verwendetes weiteres Verfahren zur Berechnung des Periodizitätsfaktors α wird untenstehend erörtert.
  • Als erstes wird im Stimmfaktorgenerator 204 ein Stimmfaktor rv berechnet durch rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie des skalierten Tonhöhen-Codevektors bvT ist und Ec die Energie des skalierten innovativen Codevektors gck ist. Das heißt
  • Figure 00340001
  • Es sei festgestellt, daß der Wert von rv zwischen –1 und 1 liegt (1 entspricht rein stimmhaften Signalen und –1 entspricht rein nichtstimmhaften Signalen).
  • Bei diesem bevorzugten Ausführungsbeispiel wird der Faktor α dann im Stimmfaktorgenerator 204 berechnet durch α = 0, 125 (1 + rv)was einem Wert 0 für rein nichtstimmhafte Signale und 0,25 für rein stimmhafte Signale entspricht.
  • In der ersten Zwei-Term-Form von F(z) kann der Periodizitätsfaktor σ durch Verwendung von σ = 2α bei den obigen Verfahren 1 und 2 angenähert werden. In einem solchen Fall wird der Periodizitätsfaktor σ bei dem obigen Verfahren 1 wie folgt berechnet: σ = 2gRp begrenzt durch σ < 2q.
  • Bei dem Verfahren 2 wird der Periodizitätsfaktor σ wie folgt berechnet: σ = 0, 25 (1 + rv).
  • Das verstärkte Signal cf wird daher durch Filtern des skalier ten innovativen Codevektors gck durch das Innovationsfilter 205 (F(z)) berechnet.
  • Das verstärkte Anregungssignal u' wird durch den Addierer 220 berechnet als: u' = cf + bvT
  • Es sei festgestellt, daß dieser Prozeß nicht beim Codierer 100 ausgeführt wird. Somit ist es wesentlich, den Inhalt des Tonhöhen-Codebuchs 201 unter Verwendung des Anregungssignals u ohne Erweiterung zu aktualisieren, um zwischen dem Codierer 100 und dem Decodierer 200 eine Synchronität beizubehalten. Daher wird das Anregungssignal u dazu verwendet den Speicher 203 des Tonhöhen-Codebuchs 201 zu aktualisieren und das erweiterte Anregungssignal u' wird am Eingang des LP-Synthesefilters 206 verwendet.
  • Synthese und Nachentzerrung
  • Das synthetisierte Signal s' wird durch Filtern des erweiterten Anregungssignals u' durch das LP-Synthesefilter 206 berechnet, das die Form 1/Â(z) aufweist, wo Â(z) das interpolierte LP-Filter im aktuellen Unterrahmen ist. Wie aus 2 ersichtlich ist, werden die quantisierten LP-Koeffizienten Â(z) auf der Leitung 225 vom Demultiplexer 217 zum LP-Synthesefilter 206 zugeführt, um die Parameter des LP-Synthesefilters 206 entsprechend einzustellen. Das Nachentzerrungsfilter 207 ist invers zum Vorverzerrungsfilter 103 von 1. Die Übertragungsfunktion des Nachentzerrungsfilters 207 ist gegeben durch D (z) = 1/(1 – μz–1)wobei μ ein Vorverzerrungsfaktor mit einem Wert ist, der zwischen 0 und 1 liegt (ein typischer Wert ist μ = 0,7). Es könnte auch ein Filter höherer Ordnung verwendet werden.
  • Der Vektor s' wird durch das Nachentzerrungsfilter D(z) (Modul 207) gefiltert, um den Vektor sd zu erhalten, der dann durch das Hochpaßfilter 208 geführt wird, um die ungewünschten Frequenzen unterhalb von 50 Hz zu entfernen und weiter sh zu erhalten.
  • Überabtastung und Hochfrequenzregenerierung
  • Das Überabtastmodul 209 führt den inversen Prozeß zu dem Abwärtsabtastmodul 101 von 1 aus. Bei diesem bevorzugten Ausführungsbeispiel wandelt die Überabtastung aus der 12,8 kHz-Abtastrate zur ursprünglichen 16 kHz-Abtastrate unter Verwendung von den Fachleuten wohlbekannten Techniken um. Das überabgetastete Synthesesignal ist bezeichnet mit S ^. Es wird auch auf das Signal S ^ als das synthetisierte Breitbandzwischensignal Bezug genommen.
  • Das überabgetastete Synthesesignal S ^ enthält nicht die Komponenten mit höherer Frequenz, die beim Abwärtabtastprozeß (Modul 101 von 1) beim Codierer 100 verloren gingen. Dies gibt eine Tiefpaßwahrnehmung für das synthetisierte Sprachsignal. Zur Wiederherstellung des vollen Bandes des ursprünglichen Signals ist eine Hochfrequenzerzeugungsprozedur offenbart. Diese Prozedur wird in Modulen 210 bis 216 und Addierer 221 ausgeführt und benötigt eine Eingabe vom Stimmfaktorgenerator 204 (2).
  • Bei dieser neuen Näherung werden die Hochfrequenzinhalte erzeugt, indem der obere Teil des Spektrums mit einem geeignet im Anregungsbereich skalierten weißen Rauschen gefüllt, dann in den Sprachbereich umgewandelt, vorzugsweise durch Formen mit demselben LP-Synthesefilter, wie es für die Synthetisierung des abwärts abgetasteten Signals S ^ verwendet wurde.
  • Die Hochfrequenzerzeugungsprozedur gemäß der vorliegenden Erfindung wird untenstehend beschrieben.
  • Der Rauschgenerator 213 erzeugt eine Sequenz weißen Rauschens w' mit einem flachen Spektrum über die gesamte Frequenzbandbreite unter Verwendung von den Fachleuten wohlbekannten Techniken. Die erzeugte Sequenz hat die Länge N', welche die Unterrahmenlänge im ursprünglichen Bereich ist. Es sei festgestellt, daß N die Unterrahmenlänge im abwärts abgestasteten Bereich ist. Bei diesem bevorzugten Ausführungsbeispiel ist N = 64 und N' = 80, was 5 ms entspricht.
  • Die Sequenz weißen Rauschens wird in dem Verstärkungseinstellmodul 214 geeignet skaliert. Die Verstärkungseinstellung umfaßt die folgenden Schritte. Als erstes wird die Energie der erzeugten Rauschsequenz w' gleich der Energie des erweiterten Anregungssignals u' gesetzt, berechnet durch ein Energieberechnungsmodul 210, und die resultierende skalierte Rauschsequenz ist gegeben durch
    Figure 00370001
  • Der zweite Schritt bei der Verstärkungskalierung besteht darin, die Hochfrequenzanteile des synthetisierten Signals am Ausgang des Stimmfaktorgenerators 204 zu berücksichtigen, um die Energie des erzeugten Rauschens im Fall von stimmhaften Segmenten zu reduzieren (wo weniger Energie bei hohen Frequenzen im Vergleich zu nicht stimmhaften Sequenzen vorliegt). Bei diesem bevorzugten Ausführungsbeispiel wird das Messen der Hochfrequenzanteile durch Messen der Dachschräge des Synthesesignals durch einen spektralen Dachschrägenrechner 212 und entsprechende Herabsetzung der Energie implementiert. Andere Messungen wie Nulldurchgangsmessungen können ebenfalls verwendet werden. Wenn die Dachschräge sehr stark ist, was stimmhaften Segmenten entspricht, wird die Rauschenergie weiter herabgesetzt. Der Dachschrägenfaktor wird im Modul 212 als der erste Korrelationskoeffizient des Synthesesignals sh berechnet und ist gegeben durch
    Figure 00380001
    bedingt tilt ≥ 0 und tilt ≥ rv, wobei der Stimmfaktor rv gegeben ist durch rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie des skalierten Tonhöhen-Codevektors bvT ist und Ec die Energie des skalierten innovativen Codevektors gck ist, wie früher beschrieben wurde. Der Stimmfaktor rv ist häufig kleiner als tilt, aber diese Bedingung wurde als Vorsichtsmaßregel gegen Hochfrequenztöne eingeführt, wo der Dachschrägenwert negativ ist und der Wert von rv hoch ist. Daher setzt diese Bedingung die Rauschenergie für derartige Tonsignale herab.
  • Der Dachschrägenwert ist 0 im Fall eines flachen Spektrums und 1 im Fall von stark stimmhaften Signalen, und ist negativ im Fall von nicht stimmhaften Signalen, wo bei hohen Frequenzen mehr Energie vorliegt.
  • Es können verschiedene Verfahren dazu verwendet werden, den Skalierungsfaktor gt aus der Größe der Hochfrequenzanteile abzuleiten. Bei dieser Erfindung werden zwei Verfahren basierend auf der Dachschräge des oben beschriebenen Signals gegeben.
  • Verfahren 1:
  • Der Skalierungsfaktor gt wird aus der Dachschräge abgeleitet durch gt = 1 – tylt,
    begrenzt durch 0,2 ≤ gt ≤ 1,0
  • Für ein stark stimmhaftes Signal, bei dem die Dachschräge sich 1 annähert, ist gt 0,2 und für stark nicht stimmhafte Signale wird gt 1,0.
  • Verfahren 2:
  • Der Dachschrägenfaktor gt wird als erstes beschränkt, so daß er größer oder gleich Null ist, dann wird der Skalierungsfaktor aus der Dachschräge abgeleitet durch gt = 10–0,6tilt
  • Die skalierte Rauschsequenz wg, die im Verstärkungseinstellmodul 214 erzeugt wird, ist daher gegeben durch wg = gt w.
  • Wenn die Dachschräge nahe Null ist, ist der Skalierungsfaktor gt nahe 1, was nicht zu einer Energiereduktion führt. Wenn der Dachschrägenwert 1 ist, führt der Skalierungsfaktor gt zu einer Reduktion um 12 dB in der Energie des erzeugten Rauschens.
  • Sobald das Rauschen geeignet skaliert ist (wg), wird es unter Verwendung des Spektralformers 215 in den Sprachbereich gebracht. Beim bevorzugten Ausführungsbeispiel wird dies erzielt, indem das Rauschen wg durch eine in der Bandbreite aufgeweitete Version desselben LP-Synthesefilters gefiltert wird, das in dem abwärts abtasteten Bereich (1/Â(z/0,8)) verwendet wurde. Die entsprechenden bandbreitenaufgeweiteten LP-Filterkoeffizienten werden im Spektralformer 215 berechnet.
  • Die gefilterte skalierte Rauschsequenz wf wird dann zum erforderlichen Frequenzbereich zur Wiederherstellung unter Verwendung des Bandpaßfilters 216 bandpaßgefiltert. Beim bevorzugten Ausführungsbeispiel beschränkt das Bandpaßfilter 216 die Rauschsequenz auf dem Frequenzbereich 5,6–7,2 kHz. Die resultierende bandpaßgefilterte Rauschsequenz z wird im Addierer 221 zum überabgetasteten synthetisierten Sprachsignal s ^ addiert, um das rekonstruierte Tonendsignal sout am Ausgang 223 zu erhalten.
  • Obwohl die vorliegende Erfindung obenstehend mittels eines bevorzugten Ausführungsbeispiels beschrieben worden ist, kann dieses Ausführungsbeispiel nach Belieben im Umfang der beigefügten Ansprüche modifiziert werden. Selbst obwohl das bevorzugte Ausführungsbeispiel die Verwendung von Breitbandsprachsignalen erörtert, ist es für Fachleute offensichtlich, daß die hier vorliegende Erfindung auch auf andere Ausführungsbeispiele mit Verwendung von Breitbandsignalen allgemein gerichtet ist, und daß sie nicht notwendigerweise auf Sprachanwendungen beschränkt ist.

Claims (59)

  1. Vorrichtung zur Wiederherstellung eines Hochfrequenzanteils eines vorher abwärts abgetasteten Breitbandsignals und zur Einspeisung des Hochfrequenzanteils in eine überabgetastete synthetisierte Version des Breitbandsignals, um ein synthetisiertes Breitbandsignal mit vollem Spektrum zu erzeugen, wobei die Vorrichtung zur Wiederherstellung des Hochfrequenzanteils umfaßt: a) einen Rauschzufallsgenerator (213) zur Erzeugung einer Rauschsequenz mit einem gegebenen Spektrum; b) eine spektrale Formeinheit (215) zur Formung des Spektrums der Rauschsequenz in bezug auf lineare Prädiktionsfilterkoeffizienten, die mit dem abwärts abgetasteten Breitbandsignal verknüpft sind; c) einen Signaleinspeisekreis (221) zur Einspeisung der spektralgeformten Rauschsequenz in die überabgetastete, synthetisierte Signalversion, um hierdurch das synthetisierte Breitbandsignal mit vollem Spektrum (223) zu erzeugen.
  2. Vorrichtung nach Anspruch 1, bei der der Rauschzufallsgenerator ein Zufallsgenerator für weißes Rauschen ist, um eine Sequenz weißen Rauschens zu erzeugen, die über die gesamte Frequenzbandbreite des Breitbandsignals ein flaches Spektrum aufweist, wodurch die spektrale Formeinheit eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  3. Vorrichtung nach Anspruch 2, bei der die spektrale Formeinheit umfaßt: a) ein Verstärkungseinstellmodul, das auf die Sequenz weißen Rauschens ansprechend ist, und einen Satz von Verstärkungseinstellparametern zur Erzeugung einer skalierten Sequenz weißen Rauschens; b) einen Spektralformer zur Filterung der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite erweiterte Version der linearen Prädiktionsfilterkoeffizienten, um eine gefilterte, skalierte Sequenz weißen Rauschens zu erzeugen, umfassend eine Frequenzbandbreite, die allgemein höher als eine Frequnzbandbreite der überabgetasteten, synthetisierten Signalversion ist; und c) ein Bandpaßfilter, das ansprechend auf die gefilterte, skalierte Sequenz weißen Rauschens ist, um eine bandpaßgefilterte, skalierte Sequenz weißen Rauschens für eine anschließende Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens zu erzeugen.
  4. Verfahren zur Wiederherstellung eines Hochfrequenzanteils eines vorher abwärts abgetasteten Breitbandsignals und zur Einspeisung des Hochfrequenzanteils in eine überabgetastete, synthetisierte Version des Breitbandsignals, um ein synthetisiertes Breitbandsignal mit vollem Spektrum zu erzeugen, wobei das Verfahren zur Wiederherstellung des Hochfrequenzanteils umfaßt: a) die zufällige Erzeugung einer Rauschsequenz mit einem gegebenen Spektrum; b) eine Spektralformung der Rauschsequenz in bezug auf lineare Prädiktionsfilterkoeffizienten, die mit dem abwärts abgetasteten Breitbandsignal verknüpft sind; und c) Einspeisung der spektralgeformten Rauschsequenz in die überabgetastete, synthetisierte Signalversion, um hierdurch das synthetisierte Breitbandsignal mit vollem Spektrum zu erzeugen.
  5. Verfahren nach Anspruch 4, bei dem die Erzeugung der Rauschsequenz umfaßt, das zufällig eine Sequenz weißen Rauschens erzeugt wird, wodurch die spektrale Formung der Rauschsequenz eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  6. Verfahren nach Anspruch 5, bei dem die spektrale Formung der Rauschsequenz umfaßt: a) Erzeugung einer skalierten Sequenz weißen Rauschens ansprechend auf die Sequenz weißen Rauschens und eines Satzes von Verstärkungseinstellparametern; b) Filtern der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite auf geweitete Version der linearen Prädiktionsfilterkoeffizienten, um eine gefilterte, skalierte Sequenz weißen Rauschens zu erzeugen, umfassend eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten, synthetisierten Signalversion; und c) Bandpaßfiltern der gefilterten, skalierten Sequenz weißen Rauschens, um eine bandpaßgefilterte, skalierte Sequenz weißen Rauschens für eine anschließende Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens zu erzeugen.
  7. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals, umfassend: a) eine Signalfragmentierungsvorrichtung zur Aufnahme einer codierten Version eines vorher während der Codierung abwärts abgetasteten Breitbandsignals und Extrahierung wenigstens von Tonhöhen-Codebuchparametern, innovativen Codebuchparametern und linearen Prädiktionsfilterkoeffizienten aus der codierten Breitbandsignalversion; b) ein Tonhöhen-Codebuch ansprechend auf die Tonhöhen-Codebuchparameter zur Erzeugung eines Tonhöhen-Codevektors; c) ein innovatives Codebuch ansprechend auf die innovativen Codebuchparameter zur Erzeugung eines innovativen Codevektors; d) einen Kombinatorkreis zum Kombinieren des Tonhöhen-Codevektors und des innovativen Codevektors, um hierdurch ein Erregungssignal zu erzeugen; e) eine Signalsynthesevorrichtung, die ein lineares Prädiktionsfilter zum Filtern des Erregungssignals in bezug auf die linearen Prädiktionsfilterkoeffizienten enthält, um hierdurch ein synthetisiertes Breitbandsignal zu erzeugen, und eine auf das synthetisierte Breitbandsignal ansprechende Überabtasteinrichtung zur Erzeugung einer überabgetasteten Signalversion des synthetisierten Breitbandsignals; und f) eine Vorrichtung zur Wiederherstellung des Hochfrequenzanteils, wie aufgeführt in Anspruch 1, zur Wiederherstellung eines Hochfrequenzanteils des Breitbandsignals und zur Einspeisung des Hochfrequenzanteils in die überabgetastete Sigalversion zur Erzeugung des synthetisierten Breitbandsignals mit vollem Spektrum.
  8. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 7, bei dem der Rauschzufallsgenerator einen Zufallsgenerator für weißes Rauschen zur Erzeugung einer Sequenz weißen Rauschens umfaßt, wodurch die spektrale Formeinheit eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  9. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 8, bei dem die spektrale Formeinheit umfaßt a) ein Verstärkungseinstellmodul ansprechend auf die Sequenz weißen Rauschens und einen Satz von Verstärkungseinstellparametern zur Erzeugung einer skalierten Sequenz weißen Rauschens; b) einen Spektralformer zur Filterung der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite aufgeweitete Version der linearen Prädiktionsfilterkoeffizienten, um eine gefilterte, skalierte Sequenz weißen Rauschens zu erzeugen, umfassend eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten, synthetisierten Signalversion; und c) ein Bandpaßfilter ansprechend auf die gefilterte, skalierte Sequenz weißen Rauschens zur Erzeugung einer bandpaßgefilterten, skalierten Sequenz weißen Rauschens für die anschließende Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens.
  10. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 9, weiter umfassend: a) einen Stimmfaktorgenerator ansprechend auf die adaptiven und innovativen Codevektoren zur Berechnung eines Stimmfaktors für die Übertragung zu dem Verstärkungseinstellmodul; b) ein Energieberechnungsmodul ansprechend auf das Erregungssignal zur Berechnung einer Erregungsenergie für die Übertragung zu dem Verstärkungseinstellmodul; c) einen spektralen Dachschrägenrechner ansprechend auf das synthetisierte Signal zur Berechnung eines Dachschrägenskalierungsfaktors für die Übertragung zu dem Verstärkungseinstellmodul; wobei der Satz der Verstärkungseinstellparameter den Stimmfaktor, die Erregungsenergie und den Dachschrägenkalierungsfaktor umfaßt.
  11. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 10, bei dem der Stimmfaktorgenerator ein Mittel zur Berechnung des Stimmfaktors rv unter Verwendung der Relation umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie einer verstärkungsskalierten Version des Tonhöhen-Codevektors ist und Ec die Energie einer verstärkungsskalierten Version des innovativen Codevektors ist.
  12. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 10, bei dem die Verstärkungseinstelleinheit ein Mittel zur Berechnung eines Energieskalierungsfaktors unter Verwendung der Relation umfaßt:
    Figure 00450001
    wobei w' die Sequenz weißen Rauschens ist und u' ein von dem Erregungssignal abgeleitetes verstärktes Erregungssignal ist. 13. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 10, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter der Verwendung der Relation umfaßt: gt = 1 – tilt begrenzt durch 0 , 2 ≤ gt ≤ 1, 0 wobei
    Figure 00460001
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  13. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 10, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenkalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 10–0,6tilt begrenzt durch 0, 2 ≤ gt ≤ 1, 0 wobei
    Figure 00460002
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  14. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 9, bei dem das Tiefpaßfilter eine Frequenzbandbreite umfaßt, die zwischen 5,6 kHz und 7,2 kHz liegt.
  15. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals, umfassend: a) eine Signalfragmentierungsvorrichtung zur Aufnahme einer codierten Version eines Breitbandsignals, das vorher während der Codierung und der Extrahierung wenigstens von Dachschrägen-Codebuchparametern, innovativen Codebuchparametern und linearen Prädiktionsfilterkoeffizienten aus der codierten Breitbandsignalversion abwärts abgetastet wurde; b) ein Dachschrägen-Codebuch ansprechend auf die Dachschrägen-Codebuchparameter zur Erzeugung eines Dachschrägen-Codevektors; c) ein innovatives Codebuch ansprechend auf die innovativen Codebuchparameter zur Erzeugung eines innovativen Codevektors; d) einen Kombinatorkreis zur Kombination des Dachschrägen-Codevektors und des innovativen Codevektors, um hierdurch ein Erregungssignal zu erzeugen; und e) eine Signalsynthesevorrichtung, die ein lineares Prädiktionsfilter zum Filtern des Erregungssignals in bezug auf die linearen Prädiktionsfilterkoeffizienten, um hierdurch ein synthetisiertes Breitbandsignal zu erzeugen, und eine Überabtasteinrichtung ansprechend auf das synthetisierte Breitbandsignal zur Erzeugung einer überabgetasteten Signalversion des synthetisierten Breitbandsignals enthält; wobei der Decodierer eine Vorrichtung zur Wiederherstellung des Hochfrequenzanteils, wie aufgeführt in Anspruch 1, umfaßt, um einen Hochfrequenzanteil des Breitbandsignals wiederherzustellen und um den Hochfrequenzanteil in die überabgetastete Signalversion einzuspeisen, um das synthetisierte Breitbandsignal mit vollem Spektrum zu erzeugen.
  16. Decodierer zur Erzeugung eines synthetisierten Breit bandsignals nach Anspruch 16, bei dem der Rauschzufallsgenerator einen Zufallsgenerator für weißes Rauschen umfaßt, um eine Sequenz weißen Rauschens zu erzeugen, wodurch die spektrale Formeinheit eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  17. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 17, bei dem die spektrale Formeinheit umfaßt: a) ein Verstärkungseinstellmodul ansprechend auf die Sequenz weißen Rauschens und einen Satz von Verstärkungseinstellparametern zur Erzeugung einer skalierten Sequenz weißen Rauschens; b) einen Spektralformer zum Filtern der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite aufgeweitete Version der linearen Prädiktionsfilterkoeffizienten zur Erzeugung einer gefilterten, skalierten Sequenz weißen Rauschens, umfassend eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten, synthetisierten Signalversion; und c) ein Bandpaßfilter ansprechend auf die gefilterte, skalierte Sequenz weißen Rauschens zur Erzeugung einer bandpaßgefilterten, skalierten Sequenz weißen Rauschens für die anschließende Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens.
  18. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 18, weiter umfassend: a) einen Stimmfaktorgenerator ansprechend auf die adaptiven und innovativen Codevektoren zur Berechnung eines Stimmfaktors für die Übertragung zu dem Verstärkungseinstellmodul; b) ein Energieberechnungsmodul ansprechend auf das Erregungssignal zur Berechnung einer Erregungsenergie für die Übertragung zu dem Verstärkungseinstellmodul; und c) einen spektralen Dachschrägenrechner ansprechend auf das synthetisierte Signal zur Berechnung eines Dachschrägenskalierungsfaktors für die Übertragung zu dem Verstärkungseinstellmodul; wobei der Satz der Verstärkungseinstellparametern den Stimmfaktor, den Energieskalierungsfaktor und den Dachschrägenskalierungsfaktor umfaßt.
  19. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 19, bei dem der Stimmfaktorgenerator ein Mittel zur Berechnung des Stimmfaktors rv unter Verwendung der Relation umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie einer verstärkungsskalierten Version des Tonhöhen-Codevektors ist und Ec die Energie einer verstärkungsskalierten Version des innovativen Codevektors ist.
  20. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 19, bei dem die Verstärkungseinstelleinheit ein Mittel zur Berechnung eines Energieskalierungsfaktors unter Verwendung der Relation umfaßt:
    Figure 00490001
    wobei w' die Sequenz weißen Rauschens ist und u' ein von dem Erregungssignal abgeleitetes verstärktes Erregungssignal ist.
  21. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 19, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 1 – tilt begrenzt durch 0 , 2 ≤ gt ≤ 1, 0 wobei
    Figure 00500001
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  22. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 19, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 10–0,6tilt begrenzt durch 0 , 2 ≤ gt ≤ 1, 0 wobei
    Figure 00500002
    begrenzt durch tilt ≥ 0 und tilt ≥ rv.
  23. Decodierer zur Erzeugung eines synthetisierten Breitbandsignals nach Anspruch 18, bei dem das Bandpaßfilter eine Frequenzbandbreite umfaßt, die zwischen 5,6 kHz und 7,2 kHz liegt.
  24. Zellulares Kommunikationssystem zur Versorgung eines großen geographischen Bereichs, der in eine Vielzahl von Zellen unterteilt ist, umfassend: a) mobile Sender/Empfängereinheiten; b) zellulare Basisstationen, die sich jeweils in den Zellen befinden; c) eine Leitstation zur Steuerung der Kommunikation zwischen den zellularen Basisstationen; d) ein bidirektionales, drahtloses Kommunikationsteilsystem zwischen jeder in einer Zelle befindlichen mobilen Einheit und der zellularen Basisstation der einen Zelle, wobei das bidirektionale, drahtlose Kommunikationsteilsystem in der mobilen Einheit und auch in der zellularen Basisstation umfaßt i) einen Sender, der einen Codierer zur Codierung eines Breitbandsignals und einen Sendekreis zum Senden des codierten Breitbandsignals enthält; und ii) einen Empfänger, der einen Empfängerkreis zum Empfangen eines gesendeten, codierten Breitbandsignals und einen Decodierer, wie in Anspruch 7 aufgeführt, zum Decodieren des empfangenen, codierten Breitbandsignals enthält.
  25. Zellulares Kommunikationssystem nach Anspruch 25, bei dem der Rauschzufallsgenerator einen Zufallsgenerator für weißes Rauschen umfaßt, um eine Sequenz weißen Rauschens zu erzeugen, wodurch die spektrale Formeinheit eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  26. Zellulares Kommunikationssystem nach Anspruch 26, bei dem die spektrale Formeinheit umfaßt: a) ein Verstärkungseinstellmodul ansprechend auf die Sequenz weißen Rauschens und einen Satz von Verstärkungseinstellparametern zur Erzeugung einer skalierten Sequenz weißen Rauschens; b) einen Spektralformer zum Filtern der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite aufgeweitete Version der linearen Prädiktionsfilterkoeffizien ten zur Erzeugung einer gefilterten, skalierten Sequenz weißen Rauschens, umfassend eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten, synthetisierten Signalversion; und c) ein Bandpaßfilter ansprechend auf die gefilterte, skalierte Sequenz weißen Rauschens zur Erzeugung einer bandpaßgefilterten, skalierten Sequenz weißen Rauschens für die anschließende Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens.
  27. Zellulares Kommunikationssystem nach Anspruch 27, weiter umfassend: a) einen Stimmfaktorgenerator ansprechend auf die adaptiven und innovativen Codevektoren zur Berechnung eines Stimmfaktors für die Übertragung zu dem Verstärkungseinstellmodul; b) ein Energieberechnungsmodul ansprechend auf das Erregungssignal zur Berechnung einer Erregungsenergie für die Übertragung zu dem Verstärkungseinstellmodul; und c) einen spektralen Dachschrägenrechner ansprechend auf das synthetisierte Signal zur Berechnung eines Dachschrägenskalierungsfaktors für die Übertragung an das Verstärkungseinstellmodul; wobei der Satz von Verstärkungseinstellparametern den Stimmfaktor, die Erregungsenergie und den Dachschrägenskalierungsfaktor umfaßt.
  28. Zellulares Kommunikationssystem nach Anspruch 28, bei dem der Stimmfaktorgenerator ein Mittel zur Berechnung des Stimmfaktors rv unter Verwendung der Relation umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie einer verstärkungskalierten Version des Tonhöhen-Codevektors ist und Ec die Energie einer verstärkungsskalierten Version des innovativen Codevektors ist.
  29. Zellulares Kommunikationssystem nach Anspruch 28, bei dem die Verstärkungseinstelleinheit ein Mittel zur Berechnung eines Energieskalierungsfaktors unter Verwendung der Relation umfaßt:
    Figure 00530001
    wobei w' die Sequenz weißen Rauschens ist und u' ein aus dem Erregungssignal abgeleitetes verstärktes Erregungssignal ist.
  30. Zellulares Kommunikationssystem nach Anspruch 28, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 1 – tilt begrenzt durch 0,2 ≤ gt ≤ 1,0 wobei
    Figure 00530002
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  31. Zellulares Kommunikationssystem nach Anspruch 28, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 10–0,6tilt begrenzt durch 0, 2 = ≤ gt s 1,0 wobei
    Figure 00540001
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  32. Zellulares Kommunikationssystem nach Anspruch 27, bei dem das Bandpaßfilter eine Frequenzbandbreite umfaßt, die zwischen 5,6 kHz und 7,2 kHz liegt.
  33. Zellulare mobile Sender/Empfängereinheit umfassend: a) einen Sender, der einen Codierer zur Codierung eines Breitbandsignals und einen Sendekreis zum Senden des codierten Breitbandsignals enthält; und b) einen Empfänger, der einen Empfängerkreis zum Empfangen eines gesendeten, codierten Breitbandsignals und einen Decodierer, wie in nach Anspruch 7 aufgeführt, zum Decodieren des empfangenen, codierten Breitbandsignals enthält.
  34. Zellulare mobile Sender/Empfängereinheit nach Anspruch 34, bei der der Rauschzufallsgenerator einen Zufallsgenerator für weißes Rauschen umfaßt, um eine Sequenz weißen Rauschens zu erzeugen, wodurch die spektrale Formeinheit eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  35. Zellulare mobile Sender/Empfängereinheit nach Anspruch 35, wobei die spektrale Formeinheit umfaßt: a) ein Verstärkungseinstellmodul, das auf die Sequenz weißen Rauschens ansprechend ist, und einen Satz von Verstärkungeinstellparametern, um eine skalierte Sequenz weißen Rauschens zu erzeugen; b) einen Spektralformer zum Filtern der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite aufgeweitete Version der linearen Prädiktionsfilterkoeffizienten, um eine gefilterte, skalierte Sequenz weißen Rauschens zu erzeugen, umfassend eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten, synthetisierten Signalversion; und c) ein Bandpaßfilter ansprechend auf die gefilterte, skalierte Sequenz weißen Rauschens zur Erzeugung einer bandpaßgefilterten, skalierten Sequenz weißen Rauschens für die anschließenden Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens.
  36. Zellulare mobile Sender/Empfängereinheit nach Anspruch 36, weiter umfassend: a) einen Stimmfaktorgenerator ansprechend auf die adaptiven und innovativen Codevektoren zur Berechnung eines Stimmfaktors für die Übertragung zu dem Verstärkungseinstellmodul; b) ein Energieberechnungsmodul ansprechend auf das Erregungssignal zur Berechnung einer Erregungsenergie für die Übertragung zu dem Verstärkungseinstellmodul; und c) einen spektralen Dachschrägenrechner ansprechend auf das synthetisierte Signal zur Berechnung eines Dachschrägenskalierungsfaktors für die Übertragung zu dem Verstärkungseinstellmodul; wobei der Satz von Verstärkungseinstellparametern den Stimmfaktor, die Erregungsenergie und den Dachschrägenskalierungsfaktor umfaßt.
  37. Zellulare mobile Sender/Empfängereinheit nach Anspruch 37, bei der der Stimmfaktorgenerator ein Mittel zur Berechnung des Stimmfaktors rv unter Verwendung der Relation umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie einer verstärkungsskalierten Version des Tonhöhen-Codevektors ist und Ec die Energie einer verstärkungsskalierten Version des innovativen Codevektors ist.
  38. Zellulare mobile Sender/Empfängereinheit nach Anspruch 37, bei der die Verstärkungseinstelleinheit ein Mittel zur Berechnung eines Energieskalierungsfaktors unter Verwendung der Relation umfaßt:
    Figure 00560001
    wobei w' die Sequenz weißen Rauschens ist und u' ein aus dem Erregungssignal abgeleitetes verstärktes Erregungssignal ist.
  39. Zellulare mobile Sender/Empfängereinheit nach Anspruch 37, bei der der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 1 – tilt begrenzt durch 0,2 ≤ gt ≤ 1,0 wobei
    Figure 00570001
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  40. Zellulare mobile Sender/Empfängereinheit nach Anspruch 37, bei der der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 10–0,6tilt begrenzt durch 0,2 ≤ gt ≤ 1,0 wobei
    Figure 00570002
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  41. Zellulare mobile Sender/Empfängereinheit nach Anspruch 36, bei der das Bandpaßfilter eine Frequenzbandbreite umfaßt, die zwischen 5,6 kHz und 7,2 kHz liegt.
  42. Zellulares Netzwerkelement, umfassend: a) einen Sender, der einen Codierer zur Codierung ei nes Breitbandsignals und einen Sendekreis zum Senden des codierten Breitbandsignals enthält; und b) einen Empfänger, der einen Empfängerkreis zum Empfangen eines gesendeten codierten Breitbandsignals und einen Decodierer, wie in Anspruch 7 aufgeführt, zum Decodieren des empfangenen, codierten Breitbandsignals enthält.
  43. Zellulares Netzwerkelement nach Anspruch 43, bei dem der Rauschzufallsgenerator einen Zufallsgenerator für weißes Rauschen umfaßt, um eine Sequenz weißen Rauschens zu erzeugen, wodurch die spektrale Formeinheit eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  44. Zellulares Nettwerkelement nach Anspruch 44, bei dem die spektrale Formeinheit umfaßt: a) ein Verstärkungseinstellmodul, das auf die Sequenz weißen Rauschens ansprechend ist, und einen Satz von Verstärkungseinstellparametern zur Erzeugung einer skalierten Sequenz weißen Rauschens; b) einen Spektralformer zum Filtern der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite aufgeweitete Version der linearen Prädiktionsfilterkoeffizienten zur Erzeugung einer gefilterten, skalierten Sequenz weißen Rauschens, umfassend eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten synthetisierten Signalversion; und c) ein Bandpaßfilter ansprechend auf die gefilterte, skalierte Sequenz weißen Rauschens zur Erzeugung einer bandpaßgefilterten, skalierten Sequenz weißen Rauschens für die anschließende Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens.
  45. Zellulares Netzwerkelement nach Anspruch 45, weiter umfassend: a) einen Stimmfaktorgenerator ansprechend auf die adaptiven und innovativen Codevektoren zur Berechnung eines Stimmfaktors für die Übertragung zu dem Verstärkungseinstellmodul; b) ein Energieberechnungsmodul ansprechend auf das Erregungssignal zur Berechnung einer Erregungsenergie für die Übertragung zu dem Verstärkungseinstellmodul; und c) einen spektralen Dachschrägenrechner ansprechend auf das synthetisierte Signal zur Berechnung eines Dachschrägenskalierungsfaktors für die Übertragung zu dem Verstärkungseinstellmodul; wobei der Satz von Verstärkungseinstellparametern den Stimmfaktor, die Erregungsenergie und den Dachschrägenskalierungsfaktor umfaßt.
  46. Zellulares Netzwerkelement nach Anspruch 46, bei dem der Stimmfaktorgenerator ein Mittel zur Berechnung des Stimmfaktors rv unter Verwendung der Relation umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie einer verstärkungsskalierten Version des innovativen Codevektors ist.
  47. Zellulares Netzwerkelement nach Anspruch 46, bei dem die Verstärkungseinstelleinheit ein Mittel zur Berechnung eines Energieskalierungsfaktors unter Verwendung der Relation umfaßt
    Figure 00590001
    wobei w' die Sequenz weißen Rauschens ist und u' ein aus dem Erregungssignal abgeleitetes verstärktes Erregungssignal ist.
  48. Zellulares Netzwerkelement nach Anspruch 46, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 1 – tilt begrenzt durch 0,2 ≤ gt ≤ 1,0 wobei
    Figure 00600001
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  49. Zellulares Netzwerkelement nach Anspruch 46, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 10–0,6tilt begrenzt durch 0,2 ≤ gt ≤ 1, 0 wobei
    Figure 00600002
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  50. Zellulares Netzwerkelement nach Anspruch 45, bei dem das Bandpaßfilter eine Frequenzbandbreite umfaßt, die zwischen 5,6 kHz und 7,2 kHz liegt.
  51. Zellulares Kommunikationssystem zur Versorgung eines großen geographischen Bereichs, der in eine Vielzahl von Zellen unterteilt ist, umfassend: mobile Sender/Empfängereinheiten; zellulare Basisstationen, die sich jeweils in den Zellen befinden; und eine Leitstation zum Steuern der Kommunikation zwischen den zellularen Basisstationen: ein bidirektionales, drahtloses Kommunikationsteilsystem zwischen jeder in einer Zelle befindlichen mobilen Einheit und der zellularen Basisstation der besagten einen Zelle, wobei das bidirektionale, drahtlose Kommunikationsteilsystem in der mobilen Einheit und auch in der zellularen Basisstation umfaßt: a) einen Sender, der einen Codierer zur Codierung eines Breitbandsignals und einen Sendekreis zum Senden des codierten Breitbandsignals enthält; und b) einen Empfänger, der einen Empfängerkreis zum Empfangen eines gesendeten, codierten Breitbandsignals und einen Decodierer, wie in Anspruch 7 aufgeführt, zum Decodieren des empfangenen, codierten Breitbandsignals enthält.
  52. Bidirektionales drahtloses Kommunikationsteilsystem nach Anspruch 52, bei dem der Rauschzufallsgenerator einen Zufallsgenerator für weißes Rauschen zur Erzeugung einer Sequenz weißen Rauschens umfaßt, wodurch die spektrale Formeinheit eine spektralgeformte Sequenz weißen Rauschens erzeugt.
  53. Bidirektionales, drahtloses Kommunikationsteilsystem nach Anspruch 53, bei dem die spektrale Formeinheit umfaßt: a) ein Verstärkungseinstellmodul, das auf die Sequenz weißen Rauschens ansprechend ist, und einen Satz von Verstärkungseinstellparametern zur Erzeugung einer skalierten Sequenz weißen Rauschens; b) einen Spektralformer zum Filtern der skalierten Sequenz weißen Rauschens in bezug auf eine in der Bandbreite aufgeweitete Version der linearen Prädiktionsfilterkoeffizienten zur Erzeugung einer gefilterten, skalierten Sequenz weißen Rauschens, umfassend eine Frequenzbandbreite allgemein höher als eine Frequenzbandbreite der überabgetasteten synthetisierten Signalversion; und c) ein Bandpaßfilter ansprechend auf die gefilterte, skalierte Sequenz weißen Rauschens zur Erzeugung einer bandpaßgefilterten, skalierten Sequenz weißen Rauschens zur anschließenden Einspeisung in die überabgetastete, synthetisierte Signalversion als spektralgeformte Sequenz weißen Rauschens.
  54. Bidirektionales drahtloses Kommunikationsteilsystem nach Anspruch 54, weiter umfassend: a) einen Stimmfaktorgenerator ansprechend auf die adaptiven und innovativen Codevektoren zur Berechnung eines Stimmfaktors für die Übertragung zu dem Verstärkungseinstellmodul; b) ein Energieberechnungsmodul ansprechend auf das Erregungssignal zur Berechnung einer Erregungsenergie für die Übertragung zu dem Verstärkungseinstellmodul; und c) einen spektralen Dachschrägenrechner ansprechend auf das synthetisierte Signal zur Berechnung eines Dachschrägenskalierungsfaktors für die Übertragung zu dem Verstärkungseinstellmodul; wobei der Satz von Verstärkungseinstellparametern den Stimmfaktor, die Erregungsenergie und den Dachschrägenskalierungsfaktor umfaßt.
  55. Bidirektionales, drahtloses Kommunikationsteilsystem nach Anspruch 55, bei dem der Stimmfaktorgenerator ein Mittel zur Berechnung des Stimmfaktors rv unter Verwendung der Relation umfaßt rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie einer verstärkungskalierten Version des Dachschrägen-Codevektors ist und Ec die Energie einer verstärkungskalierten Version des innovativen Codevektors ist.
  56. Bidirektionales, drahtloses Kommunikationsteilsystem nach Anspruch 55, bei dem die Verstärkungseinstelleinheit ein Mittel zur Berechnung eines Energieskalierungsfaktors unter Verwendung der Gleichung umfaßt:
    Figure 00630001
    wobei w' die Sequenz weißen Rauschens ist und u' ein aus dem Erregungssignal abgeleitetes verstärktes Erregungssignal ist.
  57. Bidirektionales, drahtloses Kommunikationsteilsystem nach Anspruch 55, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 1 – tilt begrenzt durch 0,2 ≤ gt ≤ 1, 0 wobei
    Figure 00630002
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  58. Bidirektionales, drahtloses Kommunikationsteilsystem nach Anspruch 55, bei dem der spektrale Dachschrägenrechner ein Mittel zur Berechnung des Dachschrägenskalierungsfaktors gt unter Verwendung der Relation umfaßt: gt = 10–0,6tilt begrenzt durch 0,2 ≤ gt ≤ 1,0 wobei
    Figure 00640001
    bedingt durch tilt ≥ 0 und tilt ≥ rv.
  59. Bidirektionales, drahtloses Kommunikationsteilsystem nach Anspruch 54, bei dem das Bandpaßfilter eine Frequenzbandbreite umfaßt, die zwischen 5,6 kHz und 7,2 kHz liegt.
DE69910240T 1998-10-27 1999-10-27 Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals Expired - Lifetime DE69910240T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA002252170A CA2252170A1 (en) 1998-10-27 1998-10-27 A method and device for high quality coding of wideband speech and audio signals
CA2252170 1998-10-27
PCT/CA1999/000990 WO2000025305A1 (en) 1998-10-27 1999-10-27 High frequency content recovering method and device for over-sampled synthesized wideband signal

Publications (2)

Publication Number Publication Date
DE69910240D1 DE69910240D1 (de) 2003-09-11
DE69910240T2 true DE69910240T2 (de) 2004-06-24

Family

ID=4162966

Family Applications (4)

Application Number Title Priority Date Filing Date
DE69910058T Expired - Lifetime DE69910058T2 (de) 1998-10-27 1999-10-27 Verbesserung der periodizität eines breitbandsignals
DE69910240T Expired - Lifetime DE69910240T2 (de) 1998-10-27 1999-10-27 Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE69913724T Expired - Lifetime DE69913724T2 (de) 1998-10-27 1999-10-27 Vorrichtung zur rauschmaskierung und verfahren zur effizienten kodierung von breitbandsignalen
DE69910239T Expired - Lifetime DE69910239T2 (de) 1998-10-27 1999-10-27 Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69910058T Expired - Lifetime DE69910058T2 (de) 1998-10-27 1999-10-27 Verbesserung der periodizität eines breitbandsignals

Family Applications After (2)

Application Number Title Priority Date Filing Date
DE69913724T Expired - Lifetime DE69913724T2 (de) 1998-10-27 1999-10-27 Vorrichtung zur rauschmaskierung und verfahren zur effizienten kodierung von breitbandsignalen
DE69910239T Expired - Lifetime DE69910239T2 (de) 1998-10-27 1999-10-27 Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale

Country Status (20)

Country Link
US (8) US6807524B1 (de)
EP (4) EP1125285B1 (de)
JP (4) JP3869211B2 (de)
KR (3) KR100417836B1 (de)
CN (4) CN1172292C (de)
AT (4) ATE246389T1 (de)
AU (4) AU6457099A (de)
BR (2) BR9914890B1 (de)
CA (5) CA2252170A1 (de)
DE (4) DE69910058T2 (de)
DK (4) DK1125284T3 (de)
ES (4) ES2212642T3 (de)
HK (1) HK1043234B (de)
MX (2) MXPA01004137A (de)
NO (4) NO317603B1 (de)
NZ (1) NZ511163A (de)
PT (4) PT1125276E (de)
RU (2) RU2219507C2 (de)
WO (4) WO2000025303A1 (de)
ZA (2) ZA200103367B (de)

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6704701B1 (en) * 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
CN1432176A (zh) * 2000-04-24 2003-07-23 高通股份有限公司 用于预测量化有声语音的方法和设备
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
KR100393899B1 (ko) * 2001-07-27 2003-08-09 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
WO2003019533A1 (fr) * 2001-08-24 2003-03-06 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation adaptive de composantes de frequence d'un signal
KR100648760B1 (ko) 2001-11-29 2006-11-23 코딩 테크놀러지스 에이비 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
US8463334B2 (en) * 2002-03-13 2013-06-11 Qualcomm Incorporated Apparatus and system for providing wideband voice quality in a wireless telephone
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN100531259C (zh) * 2002-12-27 2009-08-19 冲电气工业株式会社 语音通信设备
US7039222B2 (en) * 2003-02-28 2006-05-02 Eastman Kodak Company Method and system for enhancing portrait images that are processed in a batch mode
US6947449B2 (en) * 2003-06-20 2005-09-20 Nokia Corporation Apparatus, and associated method, for communication system exhibiting time-varying communication conditions
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
CN101783141B (zh) * 2003-09-16 2012-06-20 松下电器产业株式会社 编码装置和译码装置
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4810422B2 (ja) * 2004-05-14 2011-11-09 パナソニック株式会社 符号化装置、復号化装置、およびこれらの方法
CN1954363B (zh) * 2004-05-19 2011-10-12 松下电器产业株式会社 编码装置和编码方法
KR20070051878A (ko) 2004-09-06 2007-05-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
DE102005000828A1 (de) * 2005-01-05 2006-07-13 Siemens Ag Verfahren zum Codieren eines analogen Signals
EP2107557A3 (de) * 2005-01-14 2010-08-25 Panasonic Corporation Audioumschaltungsvorrichtung und Audioumschaltungsverfahren
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
US8145478B2 (en) 2005-06-08 2012-03-27 Panasonic Corporation Apparatus and method for widening audio signal band
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
FR2889017A1 (fr) * 2005-07-19 2007-01-26 France Telecom Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants
US8417185B2 (en) 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
CN101467203A (zh) * 2006-04-24 2009-06-24 尼禄股份公司 先进音频编码装置
EP2038884A2 (de) * 2006-06-29 2009-03-25 Nxp B.V. Geräuschsynthese
US8358987B2 (en) * 2006-09-28 2013-01-22 Mediatek Inc. Re-quantization in downlink receiver bit rate processor
US7966175B2 (en) * 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
CN101192410B (zh) * 2006-12-01 2010-05-19 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
US20100292986A1 (en) * 2007-03-16 2010-11-18 Nokia Corporation encoder
US20110022924A1 (en) * 2007-06-14 2011-01-27 Vladimir Malenovsky Device and Method for Frame Erasure Concealment in a PCM Codec Interoperable with the ITU-T Recommendation G. 711
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5388849B2 (ja) * 2007-07-27 2014-01-15 パナソニック株式会社 音声符号化装置および音声符号化方法
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
ATE522901T1 (de) * 2008-07-11 2011-09-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zur berechnung von bandbreitenerweiterungsdaten mit hilfe eines spektralneigungs-steuerungsrahmens
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR20100057307A (ko) * 2008-11-21 2010-05-31 삼성전자주식회사 노래점수 평가방법 및 이를 이용한 가라오케 장치
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101770778B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 一种预加重滤波器、感知加权滤波方法及系统
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
JP5511785B2 (ja) * 2009-02-26 2014-06-04 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JPWO2010098130A1 (ja) * 2009-02-27 2012-08-30 パナソニック株式会社 トーン判定装置およびトーン判定方法
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
WO2011048810A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
RU2510974C2 (ru) * 2010-01-08 2014-04-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
CN101854236B (zh) 2010-04-05 2015-04-01 中兴通讯股份有限公司 一种信道信息反馈方法和系统
DK2559028T3 (en) * 2010-04-14 2015-11-09 Voiceage Corp FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder
JP5749136B2 (ja) 2011-10-21 2015-07-15 矢崎総業株式会社 端子圧着電線
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103928029B (zh) * 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
RU2618919C2 (ru) 2013-01-29 2017-05-12 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
PL3058569T3 (pl) 2013-10-18 2021-06-14 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Koncepcja kodowania sygnału audio i dekodowania sygnału audio z wykorzystaniem informacji deterministycznych i podobnych do szumu
WO2015055531A1 (en) * 2013-10-18 2015-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
CN105745706B (zh) * 2013-11-29 2019-09-24 索尼公司 用于扩展频带的装置、方法和程序
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
CN105047201A (zh) * 2015-06-15 2015-11-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于分段扩展的宽带激励信号合成方法
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN113324546B (zh) * 2021-05-24 2022-12-13 哈尔滨工程大学 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法
US20230318881A1 (en) * 2022-04-05 2023-10-05 Qualcomm Incorporated Beam selection using oversampled beamforming codebooks and channel estimates

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
EP0331858B1 (de) * 1988-03-08 1993-08-25 International Business Machines Corporation Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
JP2621376B2 (ja) 1988-06-30 1997-06-18 日本電気株式会社 マルチパルス符号化装置
JP2900431B2 (ja) 1989-09-29 1999-06-02 日本電気株式会社 音声信号符号化装置
JPH03123113A (ja) 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US6134373A (en) * 1990-08-17 2000-10-17 Samsung Electronics Co., Ltd. System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium
US5113262A (en) * 1990-08-17 1992-05-12 Samsung Electronics Co., Ltd. Video signal recording system enabling limited bandwidth recording and playback
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
US5392284A (en) * 1990-09-20 1995-02-21 Canon Kabushiki Kaisha Multi-media communication device
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
JP3089769B2 (ja) 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
GB9218864D0 (en) * 1992-09-05 1992-10-21 Philips Electronics Uk Ltd A method of,and system for,transmitting data over a communications channel
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
IT1257431B (it) 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
DE4343366C2 (de) * 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5956624A (en) * 1994-07-12 1999-09-21 Usa Digital Radio Partners Lp Method and system for simultaneously broadcasting and receiving digital and analog signals
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
FR2729247A1 (fr) 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
AU696092B2 (en) 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
EP0732687B2 (de) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur Erweiterung der Sprachbandbreite
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
EP0763818B1 (de) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Verfahren und Filter zur Hervorbebung von Formanten
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals

Also Published As

Publication number Publication date
US6795805B1 (en) 2004-09-21
CA2347667C (en) 2006-02-14
CN1328684A (zh) 2001-12-26
EP1125286A1 (de) 2001-08-22
BR9914890B1 (pt) 2013-09-24
JP3490685B2 (ja) 2004-01-26
AU752229B2 (en) 2002-09-12
CA2347667A1 (en) 2000-05-04
BR9914889A (pt) 2001-07-17
CA2347735C (en) 2008-01-08
US20050108005A1 (en) 2005-05-19
PT1125276E (pt) 2003-12-31
JP3869211B2 (ja) 2007-01-17
AU6457099A (en) 2000-05-15
KR20010099764A (ko) 2001-11-09
JP3566652B2 (ja) 2004-09-15
US6807524B1 (en) 2004-10-19
ATE246836T1 (de) 2003-08-15
ES2212642T3 (es) 2004-07-16
CA2347668A1 (en) 2000-05-04
CN1127055C (zh) 2003-11-05
WO2000025304A1 (en) 2000-05-04
NO317603B1 (no) 2004-11-22
EP1125276A1 (de) 2001-08-22
NO20045257L (no) 2001-06-27
PT1125284E (pt) 2003-12-31
EP1125276B1 (de) 2003-08-06
US20050108007A1 (en) 2005-05-19
NO20012067L (no) 2001-06-27
NO20012066D0 (no) 2001-04-26
EP1125284B1 (de) 2003-08-06
ES2205891T3 (es) 2004-05-01
KR20010090803A (ko) 2001-10-19
DK1125285T3 (da) 2003-11-10
WO2000025305A1 (en) 2000-05-04
BR9914889B1 (pt) 2013-07-30
US20100174536A1 (en) 2010-07-08
ES2205892T3 (es) 2004-05-01
ATE246389T1 (de) 2003-08-15
DE69910058D1 (de) 2003-09-04
DE69913724D1 (de) 2004-01-29
PT1125285E (pt) 2003-12-31
CA2347743C (en) 2005-09-27
EP1125285B1 (de) 2003-07-30
ES2207968T3 (es) 2004-06-01
RU2219507C2 (ru) 2003-12-20
AU6456999A (en) 2000-05-15
CA2347743A1 (en) 2000-05-04
CA2347668C (en) 2006-02-14
CA2347735A1 (en) 2000-05-04
AU6455599A (en) 2000-05-15
AU6457199A (en) 2000-05-15
KR100417634B1 (ko) 2004-02-05
BR9914890A (pt) 2001-07-17
ZA200103366B (en) 2002-05-27
KR20010099763A (ko) 2001-11-09
NO20012067D0 (no) 2001-04-26
WO2000025303A1 (en) 2000-05-04
JP2002528776A (ja) 2002-09-03
NO20012068D0 (no) 2001-04-26
ATE246834T1 (de) 2003-08-15
RU2217718C2 (ru) 2003-11-27
NO318627B1 (no) 2005-04-18
CN1328682A (zh) 2001-12-26
MXPA01004137A (es) 2002-06-04
DE69910058T2 (de) 2004-05-19
EP1125285A1 (de) 2001-08-22
NO319181B1 (no) 2005-06-27
KR100417836B1 (ko) 2004-02-05
US7151802B1 (en) 2006-12-19
JP2002528775A (ja) 2002-09-03
NO20012068L (no) 2001-06-27
DK1125286T3 (da) 2004-04-19
CN1165891C (zh) 2004-09-08
JP3936139B2 (ja) 2007-06-27
CN1165892C (zh) 2004-09-08
CN1328683A (zh) 2001-12-26
US7260521B1 (en) 2007-08-21
PT1125286E (pt) 2004-05-31
CN1172292C (zh) 2004-10-20
DE69910239D1 (de) 2003-09-11
EP1125286B1 (de) 2003-12-17
AU763471B2 (en) 2003-07-24
KR100417635B1 (ko) 2004-02-05
NO20012066L (no) 2001-06-27
WO2000025298A1 (en) 2000-05-04
US8036885B2 (en) 2011-10-11
DK1125276T3 (da) 2003-11-17
NZ511163A (en) 2003-07-25
JP2002528777A (ja) 2002-09-03
DE69910239T2 (de) 2004-06-24
DE69913724T2 (de) 2004-10-07
HK1043234B (zh) 2004-07-16
HK1043234A1 (en) 2002-09-06
JP2002528983A (ja) 2002-09-03
DK1125284T3 (da) 2003-12-01
CN1328681A (zh) 2001-12-26
DE69910240D1 (de) 2003-09-11
EP1125284A1 (de) 2001-08-22
ATE256910T1 (de) 2004-01-15
US20060277036A1 (en) 2006-12-07
CA2252170A1 (en) 2000-04-27
US7672837B2 (en) 2010-03-02
MXPA01004181A (es) 2003-06-06
ZA200103367B (en) 2002-05-27

Similar Documents

Publication Publication Date Title
DE69910240T2 (de) Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE69615839T2 (de) Sprachkodierer
DE69625874T2 (de) Verfahren und Vorrichtung zur Wiedergabe von Sprachsignalen, zur Dekodierung, zur Sprachsynthese und tragbares Funkendgerät
DE60219351T2 (de) Signaländerungsverfahren zur effizienten kodierung von sprachsignalen
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69618422T2 (de) Verfahren zur Sprachdekodierung und tragbares Endgerät
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE60011051T2 (de) Celp-transkodierung
DE69614782T2 (de) Verfahren und Einrichtung zur Wiedergabe von Sprachsignalen und Verfahren zu seiner Übertragung
DE69531642T2 (de) Synthese eines Anregungssignals bei Ausfall von Datenrahmen oder Verlust von Datenpaketen
DE69814517T2 (de) Sprachkodierung
DE60012760T2 (de) Multimodaler sprachkodierer
DE60101148T2 (de) Vorrichtung und verfahren zur sprachsignalmodifizierung
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE602004007786T2 (de) Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
DE69727895T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69317958T2 (de) Kodierer von Audiosignalen mit niedriger Verzögerung, unter Verwendung von Analyse-durch-Synthese-Techniken
DE69731588T2 (de) Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE69911169T2 (de) Verfahren zur dekodierung eines audiosignals mit korrektur von übertragungsfehlern
DE60128479T2 (de) Verfahren und vorrichtung zur bestimmung eines synthetischen höheren bandsignals in einem sprachkodierer
DE602005003358T2 (de) Audiokodierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: KOENIG, B., DIPL.-PHYS. DR.RER.NAT., PAT.-ANW., 80