DE69724739T2 - Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung - Google Patents

Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung Download PDF

Info

Publication number
DE69724739T2
DE69724739T2 DE69724739T DE69724739T DE69724739T2 DE 69724739 T2 DE69724739 T2 DE 69724739T2 DE 69724739 T DE69724739 T DE 69724739T DE 69724739 T DE69724739 T DE 69724739T DE 69724739 T2 DE69724739 T2 DE 69724739T2
Authority
DE
Germany
Prior art keywords
parameters
speech coding
frame
averaging period
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69724739T
Other languages
English (en)
Other versions
DE69724739D1 (de
Inventor
Kari Jarvinen
Pekka Kapanen
Vesa Ruoppila
Jani Rotola-Pukkila
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of DE69724739D1 publication Critical patent/DE69724739D1/de
Application granted granted Critical
Publication of DE69724739T2 publication Critical patent/DE69724739T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Description

  • Die Erfindung betrifft allgemein das Gebiet der Sprachkommunikation, und spezieller betrifft sie diskontinuierliche Übertragung (DTX) und die Verbesserung der Qualität von Hintergrund-Beruhigungsrauschen (CN = comfort noise) während diskontinuierlicher Übertragung.
  • Diskontinuierliche Übertragung wird in Mobilkommunikationssystemen dazu verwendet, den Funkübertrager während Sprechpausen abzuschalten. Die Verwendung von DTX spart in der Mobilstation Energie ein, und es wird die Zeit erhöht, die zwischen Batterie-Neuladevorgängen benötigt wird. Es wird auch der allgemeine Störsignalpegel verringert und dadurch die Übertragungsqualität verbessert.
  • Jedoch verschwindet in Sprachpausen das Hintergrundrauschen, wie es mit der Sprache übertragen wird, ebenfalls, wenn der Kanal vollständig abgeschaltet wird. Das Ergebnis ist ein unnatürlich klingendes Audiosignal (Ruhe) am Empfangsende der Kommunikation.
  • In der Technik ist es bekannt, anstatt die Übertragung während Sprechpausen vollständig abzuschalten, Parameter zu erzeugen, die das Hintergrundrauschen charakterisieren und diese Parameter in Silence-Descriptor(SID)-Rahmen mit niedriger Rate über die Luftschnittstelle zu senden. Diese Parameter werden auf der Empfangsseite dazu verwendet, Hintergrundrauschen zu regenerieren, das, so gut wie möglich, den spektralen und zeitlichen Inhalt des Hintergrundrauschens auf der Sendeseite widerspiegelt. Diese das Hintergrundrauschen kennzeichnenden Parameter werden als Parameter für Hintergrund-Beruhigungsrauschen (CN) bezeichnet. Die Parameter für Hintergrund-Beruhigungsrauschen beinhalten typischerweise eine Untergruppe von Sprachcodierparametern: insbesondere Synthesefilterkoeffizienten und Verstärkungsparameter.
  • Es ist jedoch zu beachten, dass bei einigen Bewertungsschemas für Hintergrund-Beruhigungsrauschen bei einigen Sprachcodecs ein Teil der Parameter des Hintergrund-Beruhigungsrauschens aus Sprachcodierparametern hergeleitet wird, während andere Parameter des Hintergrund-Beruhigungsrauschens z. B. aus Signalen hergeleitet werden, die im Sprachcodierer verfügbar sind, jedoch nicht über die Luftschnittstelle übertragen werden.
  • Bei bekannten DTX-Systemen wird angenommen, dass die Erregung ausreichend gut spektral flaches Rauschen (d. h. weißes Rauschen) angenähert werden kann. Bei bekannten DTX-Systemen wird das Hintergrund-Beruhigungsrauschen dadurch erzeugt, dass örtlich erzeugtes, spektral flaches Rauschen durch ein Sprachcodierer-Synthesefilter geschickt wird. Jedoch können derartige Sequenzen mit weißem Rauschen kein Hintergrund-Beruhigungsrauschen hoher Qualität erzeugen. Dies, da die optimalen Erregungssequenzen nicht spektral flach sind, sondern sie können über eine spektrale Verkippung oder noch eine größere Abweichung von flachen Spektralcharakteristiken zeigen. Abhängig vom Typ des Hintergrundrauschens können die Spektren der optimalen Erregungssequenzen z. B. über Tiefpass- oder Hochpasscharakteristik verfügen. Wegen dieser Fehlanpassung zwischen zufälliger Erregung und korrekter oder optimaler Erregung hört sich das auf der Empfangsseite erzeugte Hintergrund-Beruhigungsrauschen anders als das Hintergrundrauschen auf der Sendeseite an. Das erzeugte Hintergrund-Beruhigungsrauschen kann z. B. deutlich "heller" oder "dunkler" klingen, als es der Fall sein sollte. Während DTX ändert sich so der spektrale Inhalt des Hintergrundrauschens zwischen aktiver Sprache (d. h. Sprachcodierung ein) und Sprachpausen (d. h. Erzeugung von Hintergrund-Beruhigungsrauschen ein). Dieser hörbare Unterschied im Hintergrund-Beruhigungsrauschen führt zu einer Verringerung der Übertragungsqualität, die vom Benutzer wahrgenommen werden kann.
  • In Sprachcodiersystemen, wie den Sprachkanälen mit voller Rate (FR), halber Rate (HR) und angehobener voller Rate (EFR) im GSM-System, werden die Parameter für Hintergrund-Beruhigungsrauschen mit niedriger Rate übertragen. Z. B. beträgt in den FR- und EFR-Kanälen diese Rate nur einmal pro jeweils 24 Rahmen (d. h. alle 480 Millisekunden). Dies bedeutet, dass Parameter zum Hintergrund-Beruhigungsrauschen nur ungefähr zweimal pro Sekunde aktualisiert werden. Diese niedrige Übertragungsrate kann die spektralen und zeitlichen Eigenschaften des Hintergrundrauschens nicht genau repräsentieren, und daher ist während DTX eine gewisse Beeinträchtigung in der Qualität des Hintergrundrauschens unvermeidlich.
  • Ein weiteres Problem, wie es während DTX in digitalen Zellensystemen, wie GSM, auftritt, steht mit der Überhangsperiode einiger weniger Sprachrahmen in Zusammenhang, die nach einem Sprachburst und vor dem tatsächlichen Über tragungsende eingeführt wird. Wenn der Sprachburst unter einer gewissen Schwellendauer liegt, kann er als Spitze im Hintergrundrauschen interpretiert werden, und in diesem Fall folgt dem Sprachburst keine Überhangsperiode. Die Überhangsperiode wird dazu verwendet, einen Schätzwert für die Charakteristik des Hintergrundrauschens auf der Sendeseite abzuschätzen, wie sie in einer Parametermeldung für das Hintergrund-Beruhigungsrauschen (oder einem Silence-Descriptor(SID)-Rahmen) auf die Empfangsseite zu senden ist, bevor der Sendevorgang endet. Wie oben beschrieben, wird der gesendete Schätzwert für das Hintergrundrauschen auf der Empfangsseite dazu verwendet, Hintergrund-Beruhigungsrauschen mit einer Charakteristik ähnlich dem des Hintergrundrauschens auf der Sendeseite zum Zeitpunkt, zu dem der Sendevorgang endet, zu erzeugen.
  • Bei bekannten Typen von DTX-Mechanismen, die denen von FR und HR bei GSM ähnlich sind, werden vorhersagende Quantisierungsschemas für Hintergrund-Beruhigungsrauschen verwendet. Dadurch muss die Empfangsseite nicht wissen, ob am Ende eines Sprachbursts eine Überhangsperiode existiert. Jedoch werden bei EFR in GSM effiziente vorhersagende Quantisierungsschemas für Hintergrund-Beruhigungsrauschen verwendet, und die Existenz einer Überhangsperiode wird auf der Empfangsseite lokal ausgewertet, um zur Unterstützung bei der Entquantisierung des Hintergrund-Beruhigungsrauschens beizutragen. Dies beinhaltet eine kleine Rechenbelastung und eine Anzahl auszuführender Programmanweisungen.
  • Ein anderes Problem tritt dann auf, wenn das Hintergrundrauschen auf der Sendeseite nicht stationär ist sondern beträchtlich variiert. In diesem Fall kann ein einzelner Rahmen oder eine kleine Anzahl von Rahmen innerhalb einer Mittelungsperiode existieren, für die einige oder alle der Sprachcodierparameter eine schlechte Charakterisierung des typischen Hintergrundrauschens liefern. Eine ähnliche Situation kann dann auftreten, wenn ein Sprachaktivitätserkennungs(Voice Activity Detection)- oder VAD-Algorithmus das Ende ohne Sprache von einer Periode aktiver Sprache als "keine Sprache" interpretiert oder das stationäre Hintergrundrauschen starke Rauschsignalbursts vom Impulstyp enthält. Wegen der kurzen Dauer der Mittelungsperioden bei bekannten Typen von DTX-Systemen können derartige schlecht aufbereite Sprachcodierparameter das Ergebnis der Mittelung ausreichend deutlich dafür ändern, dass die sich ergebenden gemittelten CN-Parameter das Hintergrundrauschen nicht genau charakterisieren. Dies führt zu einer Fehlanpassung entweder im Pegel oder im Spektrum, oder beiden, zwischen dem Hintergrundrauschen und dem Hintergrund-Beruhigungsrauschen. So wird die Übertragungs qualität beeinträchtigt, wenn das Hintergrundrauschen für den Benutzer abhängig davon verschieden klingt, ob es während Sprache (normale Sprachcodierung von Sprache und Hintergrundrauschen) oder während Sprachpausen (durch die Erzeugung von Hintergrund-Beruhigungsrauschen gebildet) empfangen wird.
  • Genauer gesagt, werden während der DTX-Überhangsperiode alle Rahmen, die vom VAD-Algorithmus als Rahmen "ohne Sprache" erklärt werden, über die Luftschnittstelle gesendet, und die Sprachcodierparameter werden gepuffert, um die Parameter des Hintergrund-Beruhigungsrauschens für einen ersten SID-Rahmen auswerten zu können. Der erste SID-Rahmen wird unmittelbar nach dem Ende der DTX-Überhangsperiode gesendet. Die Länge der DTX-Überhangsperiode ist so durch die Länge der Mittelungsperiode bestimmt. Daher sollte, um die Kanalaktivität des Systems zu minimieren, die Mittelungsperiode auf eine relativ kurze Länge fixiert werden.
  • Bevor die Erfindung beschrieben wird, ist es informativ, herkömmliche Schaltungen und Verfahren zum Erzeugen von Parametern für Hintergrund-Beruhigungsrauschen auf der Sendeseite und zum Erzeugen von Hintergrund-Beruhigungsrauschen auf der Empfangsseite durchzusehen. Diesbezüglich wird als Erstes auf die 1a1d Bezug genommen.
  • Gemäß der 1a werden Kurzzeit-Spektralparameter 102 in einem Analysierblock 101 für lineare, vorhersagende Codierung (LPC = Linear Predictive Coding) aus einem Sprachsignal 100 berechnet. LPC ist ein im Stand der Technik gut bekanntes Verfahren. Der Einfachheit halber wird hier nur der Fall erörtert, bei dem das Synthesefilter nur ein Kurzzeit-Synthesefilter enthält, das in den meisten bekannten Systemen, wie bei FR-, HR- und EFR-Codierern im GSM, realisiert ist, wobei das Synthesefilter als Kaskade eines Kurzzeit- und eines Langzeit-Synthesefilters konstruiert ist. Jedoch ist zu Zwecken dieser Beschreibung eine Erörterung des Langzeit-Synthesefilters nicht erforderlich. Ferner wird das Langzeit-Synthesefilter während der Erzeugung von Hintergrund-Beruhigungsrauschen bei bekannten DTX-Systemen typischerweise abgeschaltet.
  • Die LPC-Analyse erzeugt einmal pro Senderahmen einen Satz von Kurzzeit-Spektralparametern 102. Die Rahmendauer hängt vom System ab. In allen GSM-Kanälen ist z. B. die Rahmengröße auf 20 Millisekunden eingestellt.
  • Das Sprachsignal wird über ein Umkehrfilter 103 geliefert, um ein Restsig nal 104 zu erzeugen. Das Umkehrfilter ist von der Form
  • Figure 00050001
  • Die Filterkoeffizienten a(i), i = 1, ..., M werden bei der LPC-Analyse erzeugt, und sie werden einmal pro Rahmen aktualisiert. Im Umkehrfilter 103 kann eine Interpolation, wie sie bei der bekannten Sprachcodierung bekannt ist, ausgeführt werden, um eine gleichmäßige Änderung der Filterparameter zwischen Rahmen zu erzielen. Das Umkehrfilter 103 erzeugt den Rest 104, der das optimale Erregungssignal ist und ein exaktes Sprachsignal 100 erzeugt, wenn es durch Synthesefilter 1/A(z) 112 auf der Empfangsseite (siehe die 1b) geschickt wird. Es wird die Energie der Erregungssequenz gemessen, und für jeden Senderahmen wird in einem Erregungsverstärkungs-Berechnungsblock 105 eine Skalierungsverstärkung 106 berechnet.
  • Die Erregungsverstärkung 106 und die Kurzzeit-Spektralkoeffizienten 102 werden über mehrere Senderahmen gemittelt, um eine Charakterisierung für den mittleren spektralen und zeitlichen Inhalt des Hintergrundrauschen zu erhalten. Die Mittelung wird typischerweise über vier Rahmen, für den FR-Kanal in GSM, bis zu acht Rahmen, wie für den EFR-Kanal im GSM, ausgeführt. Die zu mittelnden Parameter werden für die Dauer der Mittelungsperiode in Blöcken 107a und 108a gepuffert (siehe die 1d). Der Mittelungsprozess wird in Blöcken 107 und 108 ausgeführt, und so werden die das Hintergrundrauschen charakterisierenden Mittelungsparameter erzeugt. Dies sind die gemittelte Erregungsverstärkung gmean und die gemittelten Kurzzeit-Spektralkoeffizienten. Bei modernen Sprachcodecs existieren typischerweise zehn Kurzzeit-Spektralkoeffizienten (M = 10), die im EFR-DTX-System in GSM im Allgemeinen als Leitungsspektralpaar(LSP = Line Spectral Pair)-Koeffizienten fmean(i), i = 1, ..., M repräsentiert sind. Obwohl diese Parameter typischerweise vor der Übertragung quantisiert werden, wird in dieser Beschreibung die Quantisierung der Einfachheit halber ignoriert, da die genaue Art der ausgeführten Quantisierung für ein Verständnis des Betriebs der unten beschriebenen Erfindung irrelevant ist.
  • Es wird kurz auf die 1d Bezug genommen, in der die Mittelungsblöcke 107 und 108 dargestellt, die jeweils über Puffer 107a bzw. 108a verfügen, die gepufferte Signale 107b bzw. 108b an die Mittelungsblöcke ausgeben. Unten wird den Puffern 107a und 108a mehr Aufmerksamkeit geschenkt, wenn die in den 4 und 5 dargestellten Ausführungsformen der Erfindung be schrieben werden.
  • Die Berechnung und die Mittelung der Parameter des Hintergrund-Beruhigungsrauschens ist im Einzelnen in der folgenden GSM-Empfehlung erläutert: GSM 06.62 "Comfort noise aspects for Enhanced Full Rate (EFR) speech traffic channels". Auch ist z. B. diskontinuierliche Übertragung in der folgenden GSM-Empfehlung erläutert: GSM 06.81 "Discontinuous Transmission (DTX) for Enhanced Full Rate (EFR) for speech traffic channels", und Sprachaktivitätserkennung (VAD = Voice Activity Detection) ist in der folgenden GSM-Empfehlung erläutert: GSM 06.82 "Voice Activity Detection (VAD) for Enhanced Full Rate (EFR) speech channels". Infolgedessen werden Einzelheiten dieser verschiedenen Funktionen hier nicht weiter erörtert.
  • Es wird auf die 1b Bezug genommen, in der ein Blockdiagramm eines herkömmlichen Decodierers auf der Empfangsseite dargestellt ist, der dazu verwendet wird, beim bekannten Sprachkommunikationssystem Hintergrund-Beruhigungsrauschen zu erzeugen. Der Decodierer empfängt die zwei Parameter des Hintergrund-Beruhigungsrauschens, nämlich die gemittelte Erregungsverstärkung gmean und den Satz gemittelter Kurzzeit-Spektralkoeffizienten fmean (i), i = 1, ..., M, und auf Grundlage dieser Parameter erzeugt der Decodierer das Hintergrund-Beruhigungsrauschen. Die Erzeugungsoperation für das Hintergrund-Beruhigungsrauschen ist auf der Empfangsseite ähnlich wie bei der Sprachdecodierung, mit der Ausnahme, dass die Parameter mit deutlich geringerer Rate (z. B. einmal alle 480 Millisekunden, wie in den Kanälen FR und EFR in GSM) verwendet werden und vom Sprachcodierer kein Erregungssignal empfangen wird. Während der Sprachdecodierung wird die Erregung auf der Empfangsseite aus einem Codebuch erhalten, das eine Anzahl möglicher Erregungssequenzen enthält, und gemeinsam mit den anderen Sprachcodierparametern wird ein Index auf den speziellen Erregungsvektor im Codebuch gesendet. Für eine detaillierte Beschreibung der Sprachdecodierung und der Verwendung von Codebüchern kann z. B. auf das US-Patent Nr. 5,327,519, mit dem Titel "Pulse Pattern Excited Linear Prediction Voice Coder" von Jari Hagqvist, Kari Järvinen, Kari-Pekka Estola und Jukka Ranta Bezug genommen werden, das in Zusammenhang mit diesem Dokument zu lesen ist.
  • Während der Erzeugung von Hintergrund-Beruhigungsrauschen wird jedoch kein Index auf das Codebuch übertragen, und die Erregung wird statt dessen von einem Zufallszahl- oder Erregungs(RE)generator 110 erhalten. Der RE-Generator 110 erzeugt Erregungsvektoren 114 mit flachem Spektrum. Dann werden die Erregungsvektoren 114 in einer Skalierungseinheit 115 durch die gemittelte Erregungsverstärkung gmean so skaliert, dass ihre Energie der mittleren Verstärkung der Erregung 104 auf der Sendeseite entspricht. Die sich ergebende skalierte Zufallserregungssequenz 111 wird dann in das Sprachsynthesefilter 112 eingegeben, um das Ausgangssignal 113 für Hintergrund-Beruhigungsrauschen zu erzeugen. Die gemittelten Kurzzeit-Spektralkoeffizienten fmean(i) werden im Sprachsynthesefilter 112 verwendet.
  • Die 1c zeigt das Spektrum in Zusammenhang mit dem Signal in verschiedenen Teilen des bekannten Decodierers der 1b. Der RE-Generator 110 erzeugt die Zufallszahl-Erregungssequenzen 114 (und die skalierte Erregung 111) mit flachem Spektrum. Dieses Spektrum ist durch eine Kurve A dargestellt. Dann modifiziert das Sprachsynthesefilter 112 die Erregung, um ein nicht-flaches Spektrum zu erzeugen, wie es in einer Kurve B dargestellt ist.
  • Wie oben erörtert, existiert eine Anzahl von Problemen hinsichtlich herkömmlicher Erzeugungstechniken für Hintergrund-Beruhigungsrauschen. Zu diesen Problemen gehört die Fehlanpassung zwischen der Zufallserregung und der korrekten oder optimalen Erregung, was dazu führt, dass das auf der Empfangsseite erzeugte Hintergrund-Beruhigungsrauschen vom tatsächlichen Hintergrundrauschen auf der Sendeseite verschieden ist. Es ist das Ziel dieser Erfindung, diese Probleme zu verringern oder zu beseitigen. Diese Erfindung spricht das Problem der Erzeugung von Hintergrund-Beruhigungsrauschen während diskontinuierlicher Übertragung an, um Verluste der Signalqualität durch die Verwendung diskontinuierlicher Übertragung zu minimieren.
  • Gemäß der Erfindung sind ein Verfahren, wie es im Anspruch 1 dargelegt ist, und eine Vorrichtung, wie sie im Anspruch 21 dargelegt ist, geschaffen.
  • Ausführungsformen der Erfindung sorgen für Erzeugungsverfahren für Hintergrund-Beruhigungsrauschen, die dazu in der Lage sind, Hintergrundrauschen besser zu charakterisieren und die ferner für verbesserte Qualität des Hintergrund-Beruhigungsrauschens und verbesserte Übertragungsqualität während diskontinuierlicher Übertragung sorgen.
  • Ausführungsformen der Erfindung geben eine Erzeugungstechnik für Hintergrund-Beruhigungsrauschen an, die die Erzeugung nicht-repräsentativen Hintergrund-Beruhigungsrauschens beseitigt oder minimiert und die eine verringerte Mittelungszeit verwendet.
  • Gemäß einer bevorzugten Ausführungsform der Erfindung werden alle oder eine vorbestimmte Anzahl schlecht aufbereiteter Sprachcodierparameter innerhalb einer Mittelungsperiode dadurch entfernt oder ersetzt, dass ein Medians-Ersetzverfahren angewandt wird, wenn die Parameter gemittelt werden. Bei dieser Ausführungsform der Erfindung werden die folgenden Schritte ausgeführt: Messen der Abstände der Sprachcodierparameter voneinander zwischen einzelnen Rahmen innerhalb einer Mittelungsperiode, Ordnen dieser Parameter entsprechend den gemessenen Abständen, Auffinden derjenigen Parameter, die die größten Abstände zu den anderen Parametern innerhalb der Mittelungsperiode aufweisen, und, wenn die Abstände einen vorbestimmten Schwellenwert überschreiten, Ersetzen dieser Parameter durch den Parameter mit dem kleinsten gemessenen Abstand (d. h. einen Medianswert) zu den anderen Parametern innerhalb der Mittelungsperiode. Es wird davon ausgegangen, dass der als Median bewertete Parameter einen Wert aufweist, der die getreueste Repräsentation der Charakteristik des Hintergrundrauschens unter den Parametern innerhalb der Mittelungsperiode liefert. Nach dieser Prozedur kann die Mittelung der Sprachcodierparameter auf jede gewünschte Weise ausgeführt werden. Ferner ändert die Lehre dieser Ausführungsform der Erfindung nicht die Art, gemäß der die CN-Parameter auf der Empfangsseite des DTX-Systems empfangen und genutzt werden.
  • Zusätzlich zum Entfernen schlecht aufbereiteter CN-Parameter aus der Mittelungsperiode, um dadurch die Qualität des Hintergrund-Beruhigungsrauschens zu verbessern, sorgt diese Ausführungsform der Erfindung für andere Vorteile. Z. B. muss bei bekannten DTX-Systemen eine längere Mittelungsperiode verwendet werden, um den Effekt schlecht aufbereiteter Parameter bei der Mittelung zu verringern. Die Verwendung der Erfindung erlaubt in vorteilhafter Weise die Verwendung einer kürzeren Mittelungsperiode als bei bekannten DTX-Systemen, da die Auswirkung schlecht aufbereiteter Parameter auf den Mittelungsvorgang verringert ist. Auch ist bei den bekannten DTX-Systemen aufgrund der längeren Mittelungsperiode eine längere Überhangsperiode erforderlich, was die Kanalaktivität erhöht. Die durch diese Ausführungsform der Erfindung ermöglichte kürzere Mittelungsperiode ermöglicht es, auch die DTX-Überhangsperiode zu verkürzen und dadurch die Kanalaktivität zu verringern. Ferner ist bei den bekannten DTX-Systemen wegen der verwendeten längeren Mittelungsperiode ein deutlicher Umfang an statischem Speicher für den CN-Mittelungsalgorithmus erforderlich. Ein weiterer Vorteil der durch die Erfindung erzielten kürzeren Mittelungsperiode besteht in einer Verringerung des Umfangs an statischem Speicher, der vom CN-Mitte lungsalgorithmus benötigt wird.
  • Nachfolgend werden beispielhafte Ausführungsformen der Erfindung unter Bezugnahme auf die beigefügten Zeichnungen beschrieben.
  • 1a ist ein Blockdiagramm einer herkömmlichen Schaltungsanordnung zum Erzeugen von Parametern für Hintergrund-Beruhigungsrauschen auf der Sendeseite.
  • 1b ist ein Blockdiagramm eines herkömmlichen Decodierers auf der Empfangsseite, der dazu verwendet wird, Hintergrund-Beruhigungsrauschen zu erzeugen.
  • 1c veranschaulicht das Spektrum in Zusammenhang mit dem Signal in verschiedenen Teilen des bekannten Decodierers der 1b.
  • 1d veranschaulicht die in der 1a dargestellten Mittelungsblöcke detaillierter.
  • 2a ist ein Blockdiagramm einer Schaltungsanordnung zum Erzeugen von Parametern für Hintergrund-Beruhigungsrauschen auf der Sendeseite.
  • 2b ist ein Blockdiagramm eines Decodierers auf der Empfangsseite, der zum Erzeugen von Hintergrund-Beruhigungsrauschen verwendet wird.
  • 2c veranschaulicht das Spektrum in Zusammenhang mit dem Decodierer der 2b.
  • 3a ist ein Blockdiagramm einer zweiten Ausführungsform einer Schaltungsanordnung zum Erzeugen von Parametern für Hintergrund-Beruhigungsrauschen auf der Sendeseite.
  • 3b ist ein Blockdiagramm einer zweiten Ausführungsform des Decodierers auf der Empfangsseite.
  • 4 und 5 sind jeweils ein Blockdiagramm einer Schaltungsanordnung zum Auswerten von Parametern für Hintergrund-Beruhigungsrauschen auf der Sendeseite eines digitalen DTX-Kommunikationssystems gemäß Ausführungsformen der Erfindung.
  • 6 ist ein Blockdiagramm eines herkömmlichen Sprachcodierers, die 7 und 8 sind Timingdiagramme zum Veranschaulichen des Ausgangssignals des herkömmlichen Sprachcodierers der 6, und die 9 ist ein Blockdiagramm eines herkömmlichen Sprachcodierers, wobei alle diese Figuren zur Erläuterung des in der 10 dargestellten Sprachcodierers von Nutzen sind, der eine weitere Ausführungsform der Erfindung veranschaulicht.
  • 11a11g veranschaulichen beispielhafte Frequenzantworten des RESC-Filters.
  • 12 veranschaulicht eine zum Realisieren der Erfindung geeignete Mobilstation, während die 13 die Mobilstation in Verbindung mit einer Basisstation eines drahtlosen Kommunikationssystems zeigt, das ebenfalls zum Realisieren der Erfindung geeignet ist.
  • 14 ist ein Timingdiagramm zum Veranschaulichen einer normalen Überhangsprozedur, wobei Nelapsed die Anzahl verstrichener Rahmen seit dem letzten Auftreten aktualisierter Parameter für das Hintergrund-Beruhigungsrauschen (CN = comfort noise) zeigt, wobei dieser Wert 24 oder größer ist.
  • 15 ist ein Timingdiagramm zum Veranschaulichen der Handhabung kurzer Sprachbursts, wobei Nelapsed kleiner als 24 ist.
  • Es erfolgte bereits eine Beschreibung zu einer herkömmlichen Technik sowohl zum Codieren als auch zum Decodieren von Hintergrund-Beruhigungsrauschen. Nun wird auf die 2a2c Bezug genommen, um eine erste Ausführungsform einer Schaltungsanordnung und eines Verfahrens gemäß der Erfindung zu zeigen. In den 2a und 2b sind diejenigen Elemente, die auch in den 1a und 1b auftreten, entsprechend nummeriert.
  • Es wird als Erstes darauf hingewiesen, dass "SID-Mittelungsperiode" ein GSM-bezogener Ausdruck ist, während "Mittelungsperiode für das Hintergrund-Beruhigungsrauschen" oder "CN-Mittelungsperiode" ein Ausdruck gemäß IS-641, Rev. A ist. Zu Zwecken der Erfindung können diese zwei Ausdrücke in der folgenden Beschreibung austauschbar verwendet werden. In ähnlicher Weise können die Ausdrücke "SID-Rahmen" und "Parametermeldung für Hintergrund-Beruhigungsrauschen" oder "CN-Parametermeldung" austauschbar verwendet werden.
  • In der 2a ist ein Blockdiagramm einer Vorrichtung zum Erzeugen von Parametern für Hintergrund-Beruhigungsrauschen auf der Sendeseite dargestellt. Die neuartigen Operationen in diesem Vorrichtungsblockdiagramm sind von den aus dem Stand der Technik bekannten durch eine gestrichelte Linie 204 abgetrennt.
  • Das vom Umkehrfilter 103 ausgegebene Restsignal 104 wird einer weiteren Analyse (wie einer LPC-Analyse) unterzogen, um einen anderen Satz von Filterkoeffizienten zu erzeugen. Die zweite Analyse, die hier als Zufallserregungs(AE)-LPC-Analyse 200 bezeichnet wird, ist typischerweise von niedrigerem Grad als die im Block 101 ausgeführte LPC-Analyse. Die Parameter rmean(i), i = 1, ..., R der Zufallserregungs-Spektralkontrolle (RESC = random excitation spectral control) werden durch Mitteln der Spektralparameter 201 vom RE-LPC-Analyseblock 200 über mehrere aufeinanderfolgende Rahmen im Mittelungsblock 203 erhalten. Die RESC-Parameter kennzeichnen das Spektrum der Erregung.
  • Es ist zu beachten, dass die RESC-Parameter keine Untergruppe der Sprachcodierparameter bilden, sondern dass sie nur während der Erzeugung von Hintergrund-Beruhigungsrauschen erzeugt und genutzt werden. Die Erfinder haben herausgefunden, dass eine LPC-Analyse erster oder zweiter Ordnung ausreicht, um die RESC-Parameter zu erzeugen (R = 1 oder 2). Jedoch können auch andere Spektralmodelle als das alle Polemodell der LPC-Technik verwendet werden. Die Mittelung kann alternativ durch den RE-LPC-Analyseblock 200 dadurch ausgeführt werden, dass die Autokorrelationskoeffizienten innerhalb der LPC-Parameterberechnung gemittelt werden, oder durch irgend eine andere geeignete Mittelungstechnik innerhalb der Berechnung der LPC-Koeffizienten. Die Mittelungsperiode für die RESC-Parameter kann dieselbe sein, wie sie für andere CN-Parameter verwendet wird, und es besteht keine Beschränkung auf nur dieselbe Mittelungsperiode. Z. B. wurde herausgefunden, dass eine längere Mittelung als diejenige, die für herkömmliche CN-Parameter verwendet wird, von Vorteil sein kann. So kann, anstatt dass eine Mittelungsperiode von sieben Rahmen verwendet wird, eine längere Mittelungsperiode bevorzugt werden (z. B. 10–12 Rahmen).
  • Vor dem Berechnen der Erregungsverstärkung wird der LPC-Rest 104 über ein zweites Umkehrfilter HRESC(z) 202 geschickt. Dieses Filter erzeugt einen spektral kontrollierten Rest 205, der im Allgemeinen ein flacheres Spektrum als der LPC-Rest 104 zeigt. Das Umkehrfilter HRESC(z) für die Zufallserregungs-Spektralkontrolle (RESC) kann in Form eines Filters mit lauter Nullen vorliegen (wobei jedoch keine Beschränkung nur auf diese Form besteht):
  • Figure 00120001
  • Die Erregungsverstärkung wird aus dem spektral abgeflachten Rest 205 berechnet. Ansonsten sind die Operationen in der 2a denen ähnlich, die oben hinsichtlich der 1a beschrieben sind.
  • Es wird nun auf die 2b Bezug genommen, in der ein Blockdiagramm eines Decodierers auf der Empfangsseite dargestellt ist, der dazu verwendet wird, Hintergrund-Beruhigungsrauschen gemäß der Erfindung zu erzeugen. Im Decodierer wird die Erregung 212 dadurch erzeugt, dass als Erstes eine Erregungssequenz 114 in Form weißen Rauschens durch den Zufallserregungsgenerator 110 erzeugt wird, die dann mit gmean im Skalierungsblock 115 skaliert wird.
  • Dann wird die spektral flache Rauschsignalsequenz 111 in einem Filter 211 für Zufallserregungs-Spektralkontrolle (RESC) verarbeitet, das eine Erregung mit korrektem spektralem Inhalt erzeugt. Das RE-Spektralkontrollfilter 211 führt die Umkehroperation zum im Codierer der 2a verwendeten RESC-Umkehrfilter 202 aus. Unter Verwendung des RESC-Umkehrfilters für die Gleichung (2) auf der Sendeseite ist das auf der Empfangsseite verwendete RE-Spektralkontrollfilter 211 von folgender Form:
  • Figure 00120002
  • Die RESC-Parameter rmean(i), i = 1, ..., R, die die Filterkoeffizienten b(i), i = 1, ..., R definieren, werden als Teil der CN-Parameter auf die Empfangsseite übertragen, und sie werden im RE-Spektralkontrollfilter 211 verwendet, so dass die Erregung für das Synthesefilter 112 geeignet spektral gewichtet wird, und demgemäß im Allgemeinen nicht spektral flach ist. Die RESC-Parameter rmean(i), i = 1, ..., R können mit den Filterkoeffizienten b(i), i = 1, ..., R übereinstimmen, oder sie können von irgendeiner anderen Parameterrepräsentation sein, die effiziente Quantisierung für den Sendevorgang ermöglicht, wie LSP-Koeffizienten. Die 11a11g veranschaulichen beispielhafte Frequenzantworten des RESC-Filters 211.
  • Im Überblick gesehen, erzeugt der CN-Erregungsgenerator 210 im RE-Generator 110 eine spektral flache Zufallserregung. Die spektral flache Erregung wird dann durch die Skaliereinrichtung 115 mit Mittelungsverstärkung geeignet skaliert. Um das korrekte Spektrum für das Hintergrund-Beruhigungsrauschen zu erzeugen und um eine Fehlanpassung zwischen dem Spektrum desselben und dem des Hintergrundrauschens zu vermeiden, wird die Zufallserregung über das RE-Spektralkontrollfilter 211 geschickt. Dann wird die spektral kontrollierte Erregung 211 im Sprachsynthesefilter 112 dazu verwendet, Hintergrund-Beruhigungsrauschen zu erzeugen, das eine verbesserte Anpassung an das Spektrum des tatsächlichen Hintergrundrauschens zeigt, wie es auf der Sendeseite vorhanden ist.
  • Die RESC-Parameter bilden keine Untergruppe der Sprachcodierparameter, wie sie während der Sprachsignalverarbeitung verwendet werden, sondern sie werden statt dessen nur während der Berechnung des Hintergrund-Beruhigungsrauschens verwendet. Die RESC-Parameter werden nur dazu berechnet und übertragen, um eine verbesserte Erregung für Hintergrund-Beruhigungsrauschen während Sprachpausen zu erzeugen. Das RESC-Umkehrfilter 202 im Codierer und das RESC-Filter 211 im Decodierer werden nur dazu verwendet, das Spektrum der Zufallserregung zu kontrollieren.
  • Die 2c veranschaulicht das Spektrum bestimmter Signale innerhalb des Decodierers der 2b während der Erzeugung von Hintergrund-Beruhigungsrauschen. Der RE-Generator 110 erzeugt Zufallszahlsequenzen mit dem in der Kurve A dargestellten flachen Spektrum. Dieses Spektrum ist mit dem in der Kurve A der 1c dargestellten identisch. Die Signale 114 und 111 verfügen beide über dieses flache Spektrum, wobei darauf hingewiesen wird, dass die im Block 115 erfolgende Verstärkungsskalierung die Form des Spektrums nicht beeinflusst. Die Sequenz 111 weißen Rauschens wird dann über das RE-Spektrumskontrollfilter 211 geschickt, um die Erregung 212 für das LPC-Synthesefilter zu erzeugen. Die verbesserte Erregungssequenz 212 zeigt im Wesentlichen ein nicht-flaches Spektrum (Kurve C), und der Effekt dieses nicht-flachen Spektrums zeigt sich im Spektrum des Ausgangssignals 113 des Synthesefilters 112 (Kurve D). Die Erregungssequenz 212 kann vom Tiefpass- oder vom Hochpasstyp sein, oder sie kann einen ausgeklügelteren Frequenzinhalt zeigen (abhängig von der Ordnung des RESC-Filters). Die Spektrumskontrolle wird durch die RESC-Parameter bestimmt, die auf der Sendeseite berechnet werden und als Teil des Hintergrund-Beruhigungsrauschens auf die Empfangsseite übertragen werden, wie es oben beschrieben wurde.
  • Aus der 3a kann im Gegensatz zur 2a wahrgenommen werden, dass die Berechnung der Erregungsverstärkung aus dem LPC-Rest 104 und nicht aus dem Rest des RESC-Umkehrfilters 202 ausgeführt wird. So ist das RESC-Umkehrfilter 202 in der 3a nicht erforderlich, und es kann weggelassen werden. Der Decodierer auf der Empfangsseite zur Verwendung mit dem Codierer der 3a ist in der 3b dargestellt. Im Vergleich mit der 2b ist erkennbar, dass die Skalierung (Block 115) der Erregung auf die Ausgangsseite des RE-Spektrumskontrollfilters 211 verschoben ist. Ansonsten sind die Betriebsweisen des Codierers und des Decodierers der 3a und 3b ähnlich dem, was in den 2a und 2b dargestellt ist.
  • Es wird nun auf die 4 Bezug genommen, in der ein Blockdiagramm einer Schaltungsanordnung zum Auswerten von Parametern für Hintergrund-Beruhigungsrauschen auf der Sendeseite entsprechend einer Ausführungsform der Erfindung dargestellt ist. Diese Ausführungsform wendet sich den oben genannten Problemen zu, wie sie auftreten, wenn innerhalb einer Mittelungsperiode, für die einige oder alle Sprachcodierparameter eine schlechte Charakterisierung des typischen Hintergrundrauschens liefern, ein einzelner Rahmen oder eine kleine Anzahl von Rahmen existiert. Die Operationen gemäß dieser Ausführungsform der Erfindung sind von denen, wie sie aus dem Stand der Technik bekannt sind, durch gestrichelte Linie 300 und 310 abgeteilt. Gemäß dieser Ausführungsform der Erfindung werden die im Block 107a und 108a gepufferten Sprachcodierparameter einem Ersetzungsprozess durch einen einer Schwellenwertbeurteilung unterzogenen Median unterzogen, bevor sie an die Mittelungsblöcke 107 und 108 zum Berechnen der gemittelten Erregungsverstärkung gmean und der gemittelten Kurzzeit-Spektralkoeffizienten fmean(i) geliefert werden. Bei diesem Prozess werden die Parameter innerhalb der Mittelungsperiode mit nicht-typischen Werten für das Hintergrundrauschen durch solche Parameterwerte ersetzt, wenn spezielle Bedingungen erfüllt sind, die für das aktuelle Hintergrundrauschen als typisch angesehen werden, d. h. durch die Medianswerte.
  • Als Erstes werden die im Block 300 gekennzeichneten Operationen erörtert, die an den skalar bewerteten Erregungsverstärkungs-Parametern vor der Mittelung im Block 107 ausgeführt werden. Der im Block 107a über die Mittelungsperiode gepufferte Satz von Erregungsverstärkungswerten 107b wird an einen Block 301 weitergeleitet, in dem sie entsprechend ihren Werten geordnet werden. Jeder der Erregungsverstärkungswerte hat seinen eigenen Index innerhalb des Satzes. Der geordnete Satz von Verstärkungsparametern 302 wird an einen Medianswert-Ersetzungsblock 303 geliefert, in den diejenigen L Erregungsverstärkungswerte, die sich am meisten vom Medianswert unterscheiden, während die Differenz einen vorbestimmten Schwellenwert über schreitet, durch den Medianswert des Parametersatzes ersetzt. Die Differenzen zwischen jedem einzelnen Parameterwert und dem Medianswert werden in einem Block 304 berechnet, und die Indizes der Erregungsverstärkungswerte für die der Absolutwert dieser berechneten Differenz einen Schwellenwert überschreitet, werden als Signal 305 an den Medianswert-Ersetzungsblock 303 mitgeteilt.
  • Die Länge N der Mittelungsperiode ist vorzugsweise eine ungerade Zahl. In diesem Fall ist der Median des geordneten Satzes das Element ((N + 1)/2). Die Variable L, die die Anzahl ersetzter Parameter bestimmt, kann einen Wert zwischen 0 und N – 1 einnehmen. L kann auch ein vorbestimmter Wert (d. h. eine Konstante) sein.
  • Wenn einzelne Erregungsverstärkungswerte in solcher Weise existieren, dass die Differenz zwischen dem Erregungsverstärkungswert und dem Medianswert den vorbestimmten Schwellenwert überschreitet, wird der Selektor 307 auf die Position umgeschaltet, in der die Erregungsverstärkungswerte 309 für den Mittelungsblock 107 vom Medianswert-Ersetzungsblock 303 als Signal 308 erhalten werden. Wenn jedoch für jeden der Erregungsverstärkungswerte die Differenz zwischen dem Verstärkungswert und dem Medianswert den vorbestimmten Schwellenwert nicht überschreitet, wird der Selektor 307 so umgeschaltet, dass die in den Mittelungsblock 107 eingegebenen Parameter 309 direkt vom Pufferblock 107a erhalten werden.
  • Der Umschaltzustand des Selektors 307 wird durch den Schwellenwertblock 304 mit einem Signal 306 gesteuert.
  • Als Nächstes werden die Operationen des Blocks 310 hinsichtlich der LSP-Koeffizienten f(k), k = 1, ..., M vor der Mittelung im Block 108 erörtert. Der im Block 108a über die Mittelungsperiode gepufferte Satz von LSP-Koeffizienten 108b wird an einen Block 311 weitergeleitet. Der spektrale Abstand der LSP-Koeffizienten fi(k) des Rahmens i in der Mittelungsperiode zu den LSP-Koeffizienten fj(k) des Rahmens j in der Mittelungsperiode wird entsprechend der folgenden Gleichung angenähert:
    Figure 00150001
    wobei M der Grad des LPC-Modells ist und fi(k) der k-te LSP-Parameter des Rahmens i in der Mittelungsperiode ist.
  • Um den spektralen Abstand ΔSi der LSP-Koeffizienten fi(k) des Rahmens i zu den LSP-Koeffizienten aller anderen Rahmen j = 1, ..., N, i ≠ j innerhalb der Mittelungsperiode der Länge N aufzufinden, wird die Summe der spektralen Abstände ΔRij wie folgt:
  • Figure 00160001
  • Für alle i = 1, ..., N(ΔRi,j = 0; d. h., der Abstand eines Parameters von sich selbst ist null) berechnet. Die in den Gleichungen (4) und (5) wiedergegebenen Operationen werden im Block 311 ausgeführt.
  • Der spektrale Abstand kann unter Verwendung einer Anzahl anderer Repräsentationen eines LPC-Filters angenähert werden, siehe z. B. A. H. Gray, Jr. und J. D. Markel, "Distance measures for speech processing", IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. 24, S. 380–391, 1976. Auch können als Leitungsspektralpaare z. B. "Immittance spectral pairs (ISP) verwendet werden, siehe z. B. Y. Bistritz ans S. Peller, "Immittance spectral pairs (ISP) for speech encoding", in Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, Minneapolis, Minnesota, vol. 2, S. 9–12, 27.–30. April 1993.
  • Nachdem die spektralen Abstände ΔSi im Block 311 für alle LSP-Vektoren fi innerhalb der Mittelungsperiode aufgefunden wurde, werden diese Abstände 312 an einen Block 313 weitergeleitet. Im Ordnungsblock 313 werden die spektralen Abstände entsprechend ihren Werten geordnet. Jeder der Spektralabstandswerte wird durch einen Index mit einem LSP-Vektor innerhalb der Mittelungsperiode in Beziehung gesetzt. Der Vektor fi mit dem kleinsten Abstand ΔSi innerhalb der Mittelungsperiode i = 1, 2, ..., N wird als Mediansvektor fmed der Mittelungsperiode angesehen. Dieser Abstand wird als ΔSmed bezeichnet.
  • Der Satz von LSP-Koeffizientenvektoren fi innerhalb der Mittelungsperiode wird im Block 313 entsprechend der für die spektralen Abstände aufgefundenen Reihenfolge geordnet. Dieser vom Block 313 erhaltene geordnete Satz von LSP-Vektoren 314 wird an den Medianswert-Ersetzungsblock 315 weitergeleitet. Im Block 315 werden P(0 ≤ P ≤ N – 1) LSP-Vektoren fi durch den Median fmed ersetzt. Die Indizes dieser P Vektoren werden dadurch bestimmt, dass ΔSi für i = 1, 2, ..., N im Block 316 durch den Median ΔSmed verglichen wird.
  • Demgemäß werden die Indizes betreffend fi, für die ΔSi – ΔSmed größer als ein Schwellenwert ist, durch das Signal 317 an den Medianswert-Ersetzungsblock 315 mitgeteilt.
  • Wenn die Differenz ΔSi – ΔSmed für einige i = 1, 2, ..., N größer als ein Schwellenwert ist, wird der Selektor 319 auf eine solche Position umgeschaltet, dass der Mittelungsblock 108 die Parameter 321 als Signal 320 vom Medianswert-Ersetzungsblock 315 empfängt. Wenn jedoch ΔSi – ΔSmed für alle i = 1, 2, ..., N kleiner als ein Schwellenwert ist, wird der Selektor 319 auf die Position umgeschaltet, in der das Eingangssignal 321 für den Mittelungsblock 108 direkt mittels des Signals 108(b) vom Pufferblock 108(a) erhalten wird.
  • Der Selektor 319 wird durch das Signal 318 vom Schwellenwertblock 316 gesteuert.
  • Die 5 zeigt eine andere Ausführungsform der Erfindung. Bei dieser Ausführungsform sind die Operationen entsprechend der Erfindung von denen, die aus dem Stand der Technik bekannt sind, durch die gestrichelte Linie 400 unterschieden. Während bei der in der 4 dargestellten Ausführungsform, wie sie oben beschrieben ist, die Mediansoperationen unabhängig für die Erregungsverstärkungswerte g und die LSP-Vektoren fi ausgeführt werden, werden bei der Ausführungsform der 5 diese zwei Parametersätze wie folgt gemeinsam gehandhabt.
  • Wenn ermittelt wird, dass die Parameter in einem einzelnen Rahmen durch die Medianswerte zu ersetzen sind, werden sowohl der Erregungsverstärkungswert g als auch die LSP-Vektoren fi dieses Rahmens durch die jeweiligen Parameter des die Mediansparameter enthaltenden Rahmen ersetzt.
  • Um die Reihenfolge der Rahmen für die Mediansersetzung aufzufinden, wird die Gleichung (4) für den angenäherten Abstand ΔRij zwischen den Parametern des Rahmens i und des Rahmens j in der Mittelungsperiode so revidiert, dass sowohl der Erregungsverstärkungswert g als auch der LSP-Vektor fi wie folgt berücksichtigt werden:
    Figure 00170001
    wobei M der Grad des LPC-Modells ist, fi(k) der k-te LSP-Parameter des Rahmens i der Mittelungsperiode ist und gi der Erregungsverstärkungswert des Rahmens i ist.
  • Um den Abstand ΔSi der Parameter für den Rahmen i für alle i = 1, ..., N zu den Parametern aller anderen Rahmen j = 1, ..., N, i ≠ j innerhalb der Mittelungsperiode der Länge N aufzufinden, wird die Gleichung (5) nach dem Berechnen von ΔTij angewandt. Dann wird der Abstand ΔTij anstelle des Abstands ΔRij in der Gleichung (5) verwendet. Die durch die Gleichungen (5) und (6) wiedergegebenen Prozeduren werden im Block 401 ausgeführt. Der Gewichtungsfaktor w wird so gewählt, dass ein subjektiv bevorzugter Kompromiss zwischen dem Ausführen der Mediansersetzung entsprechend den Erregungsverstärkungswerten oder entsprechend den spektralen Abständen erzielt wird. Der subjektiv bevorzugte Kompromiss wird dadurch aufgefunden, dass Versuche mit typischen Benutzern ausgeführt werden.
  • Nachdem die Abstände ΔSi für jeden der Rahmen innerhalb der Mittelungsperiode im Block 401 aufgefunden wurden, werden diese Abstände 402 an den Ordnungsblock 403 weitergeleitet. Im Ordnungsblock 403 werden die Abstände entsprechend ihren Werten geordnet. Jeder der Abstände wird durch einen Index mit einem Rahmen innerhalb der Mittelungsperiode in Beziehung gesetzt. Der Rahmen mit dem kleinsten Abstand ΔSi innerhalb der Mittelungsperiode i = 1, 2, ..., N wird als Mediansrahmen der Mittelungsperiode, mit den Parametern gmed und fmed, angesehen. Der zugehörige Abstand wird als ΔSmed bezeichnet.
  • Die im Block 403 zu ordnenden Erregungsverstärkungswerte werden durch das Signal 107b vom Puffer 107a weitergeleitet, und die LSP-Koeffizienten werden durch das Signal 108b vom Puffer 108a weitergeleitet. Wie oben ausgeführt, wird der Satz von Parametern innerhalb der Mittelungsperiode im Block 403 entsprechend der für ihre spektralen Abstände ΔSi aufgefundenen Reihenfolge geordnet. Der geordnete, vom Block 403 erhaltene Satz von Parametern wird als Signale 404 und 405 an den Medianswert-Ersetzungsblock 406 weitergeleitet. Im Block 406 werden die Parameter gi und fi für L (0 ≤ L ≤ N – 1) Rahmen durch die Parameter gmed und fmed des Mediansrahmens ersetzt. Die Indizes dieser L Vektoren werden durch Vergleichen von ΔSi für i = 1, 2, ..., N mit dem Median ΔSmed im Block 407 bestimmt, und sie werden als Signal 408 an den Medianswert-Ersetzungsblock 406 mitgeteilt. Wenn die Differenz ΔSi – ΔSmed im Block 407 größer als ein Schwellenwert ist, werden die Parameter gi und fi im Medianswert-Ersetzungsblock 406 durch gmed und fmed ersetzt. Der Wert von L kann durch vorbestimmte Minimal- und Maximalwerte begrenzt sein.
  • Wenn die Differenz ΔSi – ΔSmed für einige i = 1, 2, ..., N größer als ein Schwellenwert ist, wird der Selektor 410 so umgeschaltet, dass der Mittelungsblock 108 die Parameter 321 als Signal 411 vom Medianswert-Ersetzungsblock 406 empfängt und der Mittelungsblock 107 die Parameter 309 vom Medianswert-Ersetzungsblock 406 als Signal 412 empfängt. Wenn jedoch ΔSi – ΔSmed für alle i = 1, 2, ..., N kleiner als ein Schwellenwert ist, wird der Selektor 410 so umgeschaltet, dass das Eingangssignal 321 an den Mittelungsblock 104 über ein Signal 108b direkt vom Pufferblock 108a erhalten wird und das Eingangssignal 309 in den Mittelungsblock 107 über ein Signal 107b direkt vom Pufferblock 107a erhalten wird. Der Selektor 410 wird durch das Signal 409 durch den Schwellenwertblock 407 gesteuert.
  • Zusätzlich zum Subtrahieren des Mediansabstand von einem individuellen Abstand (durch Berechnen von ΔSi – ΔSmed) kann in den Blöcken 316 und 407 die Differenz zwischen jedem Einzelabstand und dem Mediansabstand z. B. dadurch berechnet werden, dass der Einzelabstand durch den Mediansabstand geteilt wird (d. h. durch Berechnen von ΔSi/ΔSmed). Dies kann in den meisten Fällen ein bevorzugtes Verfahren sein, da es eine relative, oder normierte, Abweichung einer Einzelabstand vom Mediansabstand, unabhängig von den Absolutwerten der Abstände ΔSi und ΔSmed auffindet.
  • Bevor nun eine weitere Ausführungsform der Erfindung beschrieben wird, wird auf die 6 Bezug genommen, die ein vereinfachtes Blockdiagramm des sendeseitigen (TX) Sprachcodierer-DTX-Systems ist. Das von einem Analog/Digital-Wandler eingehende Signal 601 wird Rahmen für Rahmen im Sprachcodierer 602 verarbeitet. Wie zuvor beträgt die Länge des Rahmens typischerweise 20 ms. Die Abtastfrequenz des Sprachsignals 601 beträgt im Allgemeinen 8 kHz. Der Sprachcodierer 602 codiert die eingehende Sprache Rahmen für Rahmen in einen Satz von Parametern 603, die an das Funkuntersystem 611 der digitalen Mobilfunkeinheit geliefert werden, um zur Empfangsseite (RX) gesendet zu werden.
  • Der Betrieb des DTX-Mechanismus wird durch eine auf der TX-Seite ausgeführte Sprachaktivitätserkennung (VAD) indirekt gesteuert. Die Grundfunktion der VAD 604 besteht darin, zwischen Rauschen bei vorhandender Sprache und Rauschen ohne vorhandene Sprache zu unterscheiden. Die VAD 604 arbeitet kontinuierlich, um auszuwerten, ob das Eingangssignal Sprache enthält oder nicht. Der Betrieb der VAD 604 beruht auf dem Sprachcodierer 602 und ihren internen Variablen 605. Das Ausgangssignal der VAD 604 ist ein binäres VAD-Flag 606, das den Wert 1 hat, wenn Sprache vorhanden ist, und das null entspricht, wenn keine Sprache vorhanden ist. Die VAD 604 arbeitet auf rahmenbezogener Basis, wie es z. B. durch GSM 06.82 spezifiziert ist.
  • Der Sprachcodierer-DTX-Handler 612 lässt kontinuierlich Verkehrsrahmen, die durch ein binäres SP-Flag 607 einzeln markiert werden, kontinuierlich an das Funkuntersystem 611 durch. Das SP-Flag 607 zeigt dem Funkuntersystem 611 an, ob der vom DTX-Handler 612 durchgelassene Verkehrsrahmen ein Sprachrahmen (SP-Flag = "1") oder ein sogenannter Silence-Descriptor(SID)-Rahmen ist (oder eine Parametermeldung für Hintergrund-Beruhigungsrauschen; SP-Flag = "0"). Das Funkuntersystem 611 steuert die Zeitplanung der Rahmen für Übertragung über die Luftschnittstelle auf Grundlage des Zustands des SP-Flags 607.
  • Ein Grundproblem in Zusammenhang mit der vorstehend genannten Verwendung von DTX besteht darin, dass akustisches Hintergrundrauschen, das gemeinsam mit der Sprache übertragen wird, verschwinden kann, wenn die Übertragung über die Luftschnittstelle endet, was zu einer Diskontinuität des Hintergrundrauschens auf der RX-Seite führt. Da das DTX-Schalten schnell auftreten kann, hat sich herausgestellt, dass dieser Effekt für den Hörer unangenehm sein kann. Dies gilt insbesondere in Umgebungen mit hohem Pegel des Hintergrundrauschens, wie in einem Fahrzeug. Im schlimmsten Fall kann dieser Effekt dazu führen, dass die Sprache nicht mehr erkennbar ist.
  • Eine derzeit bevorzugte Lösung für dieses Problem besteht darin, auf der RX-Seite synthetisches Rauschen (d. h. Hintergrund-Beruhigungsrauschen) ähnlich dem Hintergrundrauschen auf der TX-Seite zu erzeugen, wenn die Übertragung beendet wird. Wie oben beschrieben, werden die erforderlichen Parameter für die Erzeugung von Hintergrund-Beruhigungsrauschen im Sprachcodierer auf der TX-Seite (Block 608 in der 6) ausgewertet und in SID-Rahmen an die RX-Seite gesendet, bevor die Funkübertragung abgeschaltet wird, und danach mit einer niedrigen Wiederholungsrate. Dies erlaubt es, das während Sprachinaktivität auf der RX-Seite erzeugte Hintergrund-Beruhigungsrauschen an Änderungen des Hintergrundrauschens auf der TX-Seite anzupassen.
  • Es hat sich gezeigt, dass Hintergrund-Beruhigungsrauschen guter subjektiver Qualität auf der RX-Seite erzeugt werden kann, wenn die auf der TX-Seite bewerteten Parameter für das Hintergrund-Beruhigungsrauschen den Pegel und die Spektraleinhüllende des akustischen Hintergrundrauschens geeignet repräsentieren. Diese Eigenschaften des Hintergrundrauschens variieren zeitabhängig auf geringe Weise, und um daher eine gute Repräsentation zu erzielen, müssen die Parameter des Sprachcodierers, die den Pegel und die Spektraleinhüllende des Hintergrundrauschens beschreiben, über einige wenige Sprachrahmen gemittelt werden. In den DTX-Systemen mit voller Rate innerhalb GSM und in Sprachcodierern mit erweiteter voller Rate (siehe GSM 06.31 und GSM 06.81) beträgt die Länge der SID-Mittelungsperiode vier Sprachrahmen bzw. acht Sprachrahmen von 20 Millisekunden Dauer.
  • Um den ersten SID-Rahmen, der Parameter für das Hintergrund-Beruhigungsrauschen enthält, auszuwerten und am Ende eines Sprachbursts an die RX-Seite zu senden, bevor die Übertragung abgeschaltet wird, wird die oben genannte Überhangsperiode eingeführt. Diese Überhangsperiode ist eine Periode, während der von der VAD 604 Sprachinaktivität erkannt wurde (d. h. VAD-Flag 606 "0"), jedoch die Übertragung der Sprachrahmen noch nicht abgeschaltet wurde (d. h. SP-Flag 607 = "1"). Diesbezüglich kann ebenfalls auf die 7 Bezug genommen werden. Während der Überhangsperiode ist garantiert, da die VAD 604 Sprachinaktivität erkannt hat, dass die Sprachrahmen nur rauschen (und keine Sprache) enthalten, und so können diese Überhangsrahmen für die Mittelung der Sprachcodierparameter verwendet werden, um die Parameter für Hintergrund-Beruhigungsrauschen auszuwerten.
  • Die Länge der Überhangsperiode ist durch die Länge der SID-Mittelungsperiode bestimmt, d. h., dass die Länge der Überhangsperiode ausreichend lang sein muss, um die Mittelung der Parameter abzuschließen, bevor die sich ergebenden Parameter für das Hintergrund-Beruhigungsrauschen in einen SID-Rahmen zu übertragen sind. Im DTX-System mit einem Vollrate-Sprachcodierer in GSM entspricht die Länge der Überhangsperiode vier Rahmen (der Länge der SID-Mittelungsperiode), da die Auswertetechnik für Hintergrund-Beruhigungsrauschen nur Parameter aus den vorigen Rahmen verwendet, um einen aktualisierten SID-Rahmen verfügbar zu machen. Im DTX-System mit Sprachcodierer mit erweiteter voller Rate in GSM entspricht die Länge der Überhangsperiode sieben Rahmen (der Länge der SID-Mittelungsperiode minus eins), da die Parameter des achten Rahmens der SID-Mittelungsperiode vom Sprachcodierer erhalten werden können, während der erste SID-Rahmen verarbeitet wird. Die 7 veranschaulicht die Konzepte der Überhangsperiode und der SID-Mittelungsperioden im DTX-System für den Sprachcodierer mit erweiteter Vollrate in GSM.
  • Am Ende der Überhangsperiode wird der erste SID-Rahmen gesendet, und der Auswertungsalgorithmus für Hintergrund-Beruhigungsrauschen fährt damit fort, die Eigenschaften des Hintergrundrauschens auszuwerten, und er leitet die aktualisierten SID-Rahmen Rahmen für Rahmen an das Funkuntersystem 611 weiter, solange die VAD 604 damit fortfährt, Sprachinaktivität zu erkennen. Der TX-DTX-Handler 612 informiert den Auswertungsalgorithmus 608 für Hintergrund-Beruhigungsrauschen unter Verwendung eines Flags 609 über den Abschluss einer SID-Mittelungsperiode. Das Flag 609 ist normalerweise auf "0" rückgesetzt, und es wird immer dann auf "1" gesetzt, wenn ein aktualisierter SID-Rahmen an das Funkuntersystem 611 weiterzuleiten ist. Wenn das Flag 609 gesetzt ist, führt der Auswertungsalgorithmus 608 für Hintergrund-Beruhigungsrauschen die Mittelung von Parametern aus, um einen aktualisierten SID-Rahmen für das Funkuntersystem 611 verfügbar zu machen. Die aktualisierten SID-Rahmen werden an das Funkuntersystem 611 geliefert, und sie werden auch in einen SID-Speicherblock 610 eingeschrieben, der den jüngsten SID-Rahmen für späteren Gebrauch speichert.
  • Wenn, zu Ende des Sprachbursts, weniger als 24 Rahmen verstrichen sind, seit der letzte SID-Rahmen berechnet und an das Funkuntersystem weitergeleitet wurde, wird der letzte SID-Rahmen wiederholt aus dem SID-Speicher 610 abgerufen und an das Funkuntersystem 611 weitergeleitet. Dies erfolgt, bis ein neuer aktualisierter SID-Rahmen verfügbar ist, d. h., dass dieser Prozess andauert, bis die SID-Mittelungsperiode erneut abgeschlossen ist. Diese Technik reduziert die Sendeaktivität in Fällen, in denen kurze Spitzen im Hintergrundrauschen als Sprache interpretiert werden, da es nicht erforderlich ist, die Überhangsperiode am Ende des Sprachbursts einzufügen, um dazu in der Lage zu sein, einen neuen SID-Rahmen zu berechnen.
  • Die 8 zeigt als Beispiel den längstmöglichen Sprachburst ohne Überhang. Das Binärflag 613 wird dazu verwendet, dem SID-Speicher 610 mitzuteilen, wann ein neuer, aktualisierter SID-Rahmen in ihn einzuspeichern ist und wann der zuletzt aktualisierte SID-Rahmen vom SID-Speicher 610 an das Funkuntersystem 611 zu liefern ist. Der SID-Speicher 610 bestimmt, ob der SID-Rahmen während jedes Rahmens zu speichern oder zu senden, wenn das SP-Flag 607 auf "0" steht.
  • Das Binärflag 614 ist im DTX-System eines Sprachcodierers mit erweiterter Vollrate in GSM auch dazu erforderlich, den Rauschen-Bewertungsalgorithmus über das Ende der Überhangsperiode zu informieren. Das Flag 614 ist normalerweise auf "0" rückgesetzt, und es wird für die Dauer eines Rahmens auf "1" gesetzt, wenn der erste SID-Rahmen nach einem Sprachburst zu senden ist, wenn ihm eine Überhangsperiode vorangeht.
  • Die 9 ist ein Blockdiagramm des Sprachdecodierers auf der Empfangs(RX)seite des DTX-Systems. Der eingehende Satz von Sprachcodierparametern 701 vom Funkuntersystem 700 der digitalen Mobilfunkeinheit wird Rahmen für Rahmen im Sprachdecodierer 702 verarbeitet, um ein Sprachsignal 703 zu synthetisieren, das an einen Digital/Analog-Wandler 704 geliefert wird. Der Digital/Analog-Wandler 704 erzeugt ein Audiosignal für den zuhörenden Benutzer.
  • Das RX-DTX-System empfängt das binäre SP-F1ag 705 vom Funkuntersystem, das die Funktion des SP-Flags auf der TX-Seite widerspiegelt, d. h., es gilt SP-Flag = "1", wenn ein Sprachrahmen empfangen wird und SP-Flag = "0", wenn entweder ein SID-Rahmen empfangen wird oder die Übertragung beendet wird. Das ebenfalls vom Funkuntersystem 700 empfangene Binärflag 706 informiert den Erzeugungsalgorithmus 707 für Hintergrund-Beruhigungsrauschen über die Existenz eines neu empfangenen SID-Rahmens, d. h., dass das Flag normalerweise auf "0" rückgesetzt ist, und dass es immer dann auf "1" gesetzt wird, wenn das SP-Flag 705 "0" ist und ein neues SID-Rahmen empfangen wird.
  • Wenn das SP-Flag 705 = "0" ist, d. h., wenn diskontinuierliche Übertragung aktiv ist, erzeugt der Erzeugungsblock 707 für Hintergrund-Beruhigungsrauschen im Sprachdecodierer 702 Hintergrund-Beruhigungsrauschen auf Grundlage der Repräsentation der Eigenschaften des Hintergrundrauschens auf der TX-Seite, wie in den SID-Rahmen empfangen. Aktualisierte SID-Rahmen werden mit der niedrigen Wiederholungsrate während diskontinuierlicher Übertragung empfangen, und die decodierten Parameter für Hintergrund-Beruhigungsrauschen werden zwischen den aktualisierten SID-Rahmen interpoliert, um für gleichmäßige Übergänge hinsichtlich der Eigenschaften des Hintergrund-Beruhigungsrauschens zu sorgen.
  • Beim DTX-System mit einem Vollrate-Sprachcodierer in GSM werden immer dann, wenn neuer, aktualisierter SID-Rahmen zu berechnen ist und an das Funkuntersystem 611 (6) zu liefern ist, die die Eigenschaften (den Pegel und das Spektrum) des Hintergrundrauschens beschreibenden Parameter über die SID-Mittelungsperiode gemittelt und skalar unter Verwendung derselben Quantisierungsschemas quantisiert, die zum Quantisieren im normalen Sprachcodiermodus verwendet werden. In ähnlicher Weise werden, wenn im Vollrate-Sprachcodierer 702 in GSM ein SID-Rahmen eintrifft, die Silence-Descriptor- Mittelungsperiode unter Verwendung derselben Entquantisierungsschemas decodiert, wie sie im normalen Sprachdecodiermodus verwendet werden (siehe z. B. GSM 06.12).
  • Im DTX-System werden bei einem Sprachcodierer mit erweiterter Vollrate in GSM die das Spektrum des Hintergrundrauschens beschreibenden Parameter (die LSP-Parameter) über die SID-Mittelungsperiode gemittelt, wenn ein neuer SID-Rahmen zu berechnen ist, und sie werden unter Verwendung vorhersagender Quantisierungstabellen, wie sie ebenfalls zur Quantisierung dieser Parameter im normalen Sprachcodiermodus verwendet werden, Vektor-quantisiert. Im Decodierer 702 werden diese Spektralparameter unter Verwendung derselben vorhersagenden Entquantisierungstabellen entquantisiert, wie sie im normalen Sprachdecodiermodus verwendet werden. Die den Pegel des Hintergrundrauschens beschreibenden Parameter (die feste Codebuch-Verstärkung) werden über die SID-Mittelungsperiode gemittelt, wenn ein neuer SID-Rahmen zu berechnen ist, und sie werden unter Verwendung der skalar-vorhersagenden Quantisierungstabelle quantisiert, die auch zur Quantisierung dieser Parameter im normalen Sprachcodiermodus verwendet wird. Im Decodier werden diese Verstärkungsparameter unter Verwendung derselben vorhersagenden Entquantisierungstabelle entquantisiert, die im normalen Sprachdecodiermodus verwendet wird (siehe GSM 06.62).
  • Jedoch erschwert es die Adaptivität vorhersagender Quantisierer, diesen Typ eines Quantisierungsschemas zum Quantisieren von Parametern für Hintergrund-Beruhigungsrauschen zu verwenden, die in SID-Rahmen zu liefern sind. Da die Übertragung während Sprachinaktivität beendet wird, existiert keine Art, die Vorhersageeinrichtungen im Quantisierer und Entquantisierers des Codierers bzw. Decodierers, mit Synchronisation auf rahmenbezogener Basis, aufrecht zu erhalten. Jedoch können die Vorhersageeinrichtungswerte für die Quantisierer lokal im Codierer und Decodierer wie folgt auf dieselbe Weise ausgewertet werden. Die quantisierten LSP-Parameter und die festen Codebuch-Verstärkungsparameter der sieben jüngsten Sprachrahmen werden lokal sowohl im Codierer 602 als auch im Decodierer 702 gespeichert. Wenn die Überhangsperiode am Ende eines Sprachbursts geendet hat, werden diese abgespeicherten Parameter gemittelt. Die erhaltenen gemittelten Parameter, die der Bezugs-LSP-Parametervektor fref und die Bezugs-Codebuch-Festverstärkung gc ref sind, haben dann sowohl im Codierer 602 als auch im Decodierer 702 dieselben Werte, da wegen der Quantisierung während des normalen Sprachcodiermodus in beiden derselbe quantisierte LSP-Wert und feste Codebuch-Verstärkungswert verfügbar sind (wenn fehlerfreie Übertragung angenommen wird). Die gemittelten Werte des Bezugs-LSP-Parametervektors fref und der Bezugs-Codebuch-Festverstärkung gc ref werden dann eingefroren, bis das nächste Mal eine Überhangsperiode nach einem Sprachburst auftritt, und sie werden anstelle der normalen Vorhersagewerte in den Quantisierungsalgorithmen zum Quantisieren der Parameter für Hintergrund-Beruhigungsrauschen verwendet.
  • Es wird erneut auf die 9 Bezug genommen, gemäß der ein RX-DTX-Handler 708 das SP-Flag 705 als Eingangssignal empfängt und das Binärflag 709 ausgibt, das normalerweise auf "0" rückgesetzt ist und das dann für die Dauer eines Rahmens auf "1" gesetzt wird, wenn eine Überhangsperiode nach einem Sprachburst aufgetreten ist. Das Flag 709 wird im DTX-System des Sprachcodierers 702 mit erweiterter Vollrate in GSM dazu benötigt, den Erzeugungsalgorithmus 707 für Hintergrund-Beruhigungsrauschen zu informieren, wann eine Mittelung zum Aktualisieren des Bezugs-LSP-Parametervektors fref und der Bezugs-Codebuch-Festverstärkung gc ref auszuführen ist (siehe GSM 06.62). Ein Verfahren zum Bestimmen des Werts des Flags 709 ist in der früher eingereichten finnischen Patentanmeldung FI953252 und in der entsprechenden, am 28. Juni 1996 eingereichten US-Patentanmeldung mit der Seriennummer 08/672,932 und in der PCT-Anmeldung "PCT/FI96/00369", die in Verbindung mit diesem Dokument studiert werden sollten, beschrieben.
  • Zusammengefasst gesagt, werden in vielen modernen Sprachcodierern die Sprachcodierparameter unter Verwendung vorhersagender Verfahren quantisiert. Dies beinhaltet, dass im Quantisierer ein Versuch unternommen wird, den zu quantisierenden Wert so gut wie möglich vorherzusagen. Bei diesen Typen vorhersagender Quantisierer wird typischerweise die Differenz oder der Quotient zwischen dem tatsächlichen Parameterwert und dem vorhergesagten Parameterwert quantisiert und an die Empfangsseite geliefert. Auf der Empfangsseite verfügt der entsprechende Entquantisierer über eine ähnliche Vorhersageeinrichtung wie der Quantisierer. Infolgedessen kann der auf der TX-Seite quantisierte Parameterwert durch Addieren oder Multiplizieren des empfangenen Differenz- bzw. Quotientenwerts mit dem Vorhersagewert reproduziert werden.
  • Bei derartigen vorhersagenden Quantisierer ist die Vorhersageeinrichtung typischerweise adaptiv ausgebildet, so dass das Quantisierungsergebnis dazu verwendet wird, die Vorhersageeinrichtung nach jeder Quantisierung zu aktualisieren. Die Vorhersageeinrichtungen des Quantisierers und des Entquantisierers werden beide unter Verwendung des reproduzierten, quantisierten Parameterwerts aktualisiert, um die Vorhersageeinrichtungen synchronisiert zu halten.
  • Das Adaptionsvermögen der vorhersagenden Quantisierer erschwert es, diesen Typ eines Quantisierungsschemas zum Quantisieren von Parametern für Hintergrund-Beruhigungsrauschen, die in SID-Rahmen gesendet werden, zu verwenden. Da die Übertragung während Sprachinaktivität beendet wird, existiert kein Weg, die Vorhersageeinrichtungen im Quantisierer und Entquantisierer des Codierers 602 und des Decodierers 702 auf rahmenbezogener Basis synchronisiert zu halten.
  • Jedoch wäre es wünschenswert, zur Quantisierung von Parametern für Hintergrund-Beruhigungsrauschen dieselben Quantisierungstabellen zu verwenden, wie sie durch die vorhersagenden Quantisierer im normalen Sprachcodiermodus verwendet werden. Dies würde es erforderlich machen, die Vorhersage während diskontinuierlicher Übertragung auf nicht-adaptive Weise auszuführen. Die Vorhersageeinrichtungen sollten über Werte verfügen, die so nahe wie möglich bei den gemittelten Parameterwerten des aktuellen Hintergrundrauschens liegen, damit die Quantisierer dazu in der Lage sind, die Schwankungen in den Parameterwerten aufgrund von Änderungen in den Eigenschaften des Hintergrundrauschens zu codieren. Dieselben vorhersagten Werte sollten, vorzugsweise, im Quantisierer und im Entquantisierer verfügbar sein.
  • Wie bereits angegeben, besteht eine Technik zum Erhalten guter Vorhersagewerte zum Quantisieren des in SID-Rahmen zu liefernden Hintergrund-Beruhigungsrauschens darin, die quantisierten Parameterwerte im normalen Sprachcodiermodus während der Überhangsperiode zu speichern und am Ende derselben einen Mittelwert der gespeicherten, quantisierten Parameterwerte zu berechnen. Dann werden die gemittelten Werte für die Vorhersageeinrichtung eingefroren, bis die nächste Überhangsperiode auftritt. Jedoch besteht ein Problem bei diesem Verfahren darin, dass der Sprachdecodierer 702, hinsichtlich derjenigen DTX-Techniken, die denen beim GSM ähnlich sind, nicht weiß, wann am Ende eines Sprachbursts eine Überhangsperiode existiert.
  • So besteht ein Gesichtspunkt der Erfindung darin, eine Technik zum Informieren des Sprachdecodierers 702 über die Existenz einer Überhangsperiode am Ende eines Sprachbursts zu schaffen. Dies wird vorzugsweise dadurch bewerkstelligt, dass die Information zur Überhangsperiode als Nebeninformation im SID-Rahmen (oder in der Parametermeldung zum Hintergrund-Beruhigungsrauschen) vom Sprachcodierer 602 an den Sprachdecodierer 702 geliefert wird.
  • Um das Verfahren gemäß diesem Gesichtspunkt der Erfindung zu veranschaulichen, wird auf die 10 Bezug genommen. In der 10 wird das Binärflag 709 nicht mehr vom RX-DTX-Handler erzeugt, sondern statt dessen wird es vom Codierer 602 gesendet und im ersten SID-Rahmen vom Sendekanal empfangen. Der RX-DTX-Handlerblock 708 ist nicht mehr zu Zwecken einer Entquantisierung unter Verwendung der in dieser Erfindung beschriebenen Vorhersageverfahren erforderlich, da das Flag 709 nicht mehr lokal im Decodierer 702 erzeugt werden muss. Gemäß dieser Erscheinungsform der Erfindung wird das Flag 709 im ersten SID-Rahmen auf "1" gesetzt, wenn diesem eine Überhangsperiode vorangeht. Wenn dem ersten SID-Rahmen keine Überhangsperiode vorangeht, wird das Flag 709 im ersten SID-Rahmen auf "0" rückgesetzt. Im zweiten und weiteren SID-Rahmen der Einfügeperiode mit Hintergrund-Beruhigungsrauschen ist das Flag 709 immer auf "0" rückgesetzt.
  • Ein Vorteil dieser Erscheinungsform der Erfindung besteht darin, dass es für den DTX-Handler 708 im Sprachcodierer nicht erforderlich ist, lokal die Existenz einer Überhangsperiode am Ende eines Sprachbursts zu bestimmen. Dies beseitigt einen Teil der Rechenbelastung vom Sprachdecodierer 702 und verringert die Anzahl der vom RX-DTX-Handler 708 verwendeten Programmanweisungen.
  • Ein weiterer Vorteil davon, dass dem Decodierer 702 die Information betreffend die Existenz einer Überhangsperiode bereitgestellt wird, besteht darin, dass es nun möglich ist, die Pseudorauschen-Erregungsgeneratoren im Codierer 602 und im Decodierer 702 jedesmal dann, wenn eine Überhangsperiode endet, synchron neu zu initialisieren.
  • Ein anderer Vorteil damit, dass dem Decodierer 702 die Information betreffend die Existenz der Überhangsperiode bereitgestellt wird, besteht darin, dass die Interpolation der empfangenen Parameter zum Hintergrund-Beruhigungsrauschen auf verschiedene Arten abhängig davon ausgeführt werden kann, ob eine Überhangsperiode am Ende eines Sprachbursts vorhanden ist oder nicht, um wahrgenommene stufenförmige Änderungen im Pegel oder Spektrum des Hintergrund-Beruhigungsrauschens zu verringern, wenn kurze Sprachbursts auftreten.
  • Bevor die Funktion der Erfindung weiter detailliert beschrieben wird, wird auf die 12 und 13 Bezug genommen, um ein drahtloses Benutzerterminal oder eine Mobilstation 10 zu veranschaulichen, wie sie zum Realisieren der Erfindung geeignet sind, wobei jedoch keine Beschränkung auf ein Zellenfunktelefon oder eine persönliche Kommunikationseinrichtung besteht. Die Mobilstation 10 verfügt über eine Antenne 12 zum Senden von Signalen an eine Basisstelle oder eine Basisstation 30 und zum Empfangen von Signalen von dieser. Die Basisstation 30 ist Teil eines Zellennetzwerks, das über eine Basisstations/Mobilvermittlungszentrale/Zusammenarbeitsfunktion (BMI = Base Station/Mobile Switching Center/Interworking function) 32 mit einer Mobilvermittlungszentrale (MSC) 34 verfügen kann. Die MSC 34 sorgt für eine Verbindung zu landgebundenen Weitverkehrssystemen, wenn die Mobilstation 10 an einem Anruf beteiligt ist. In Zusammenhang mit dieser Offenbarung kann die Mobilstation 10 als Sendeseite und die Basisstation als Empfangsseite bezeichnet werden. Es wird davon ausgegangen, dass die Basisstation 30 geeignete Empfänger und Sprachdecodierer zum Empfangen und Verarbeiten codierter Sprachparameter und auch von DTX-Parametern für Hintergrund-Beruhigungsrauschen, wie unten beschrieben, enthält.
  • Die Mobilstation enthält einen Modulator (MOD) 14A, einen Sender 14, einen Empfänger 16, einen Demodulator (DEMOD) 16A und eine Steuerung 18, die Signale an den Sender 14 und den Empfänger 16 liefert und von diesen empfängt. Zu diesen Signalen gehören Signalgabeinformation entsprechend dem Luftschnittstellenstandard des angewendeten Zellensystems sowie Benutzersprachdaten und/oder vom Benutzer erzeugte Daten. Es wird davon ausgegangen, dass der Luftschnittstellenstandard für diese Erfindung eine physikalische und eine logische Rahmenstruktur enthält, wobei jedoch die Lehre dieser Erfindung auf keinerlei spezielle Struktur oder auf den Gebrauch alleine bei einer IS-136 oder einer ähnlichen kompatiblen Mobilstation oder nur zur Verwendung bei Systemen vom TDMA-Typ beschränkt sein soll. Es wird auch davon ausgegangen, dass der Luftschnittstellenstandard einen DTX-Betriebsmodus unterstützt.
  • Es ist zu beachten, dass die Steuerung 18 auch die Schaltungsanordnung enthält, die dazu erforderlich ist, die Audio- und Logikfunktionen der Mobilstation zu implementieren. Z. B. kann die Steuerung 18 aus einem digitalen Signalprozessor, einem Mikroprozessor und verschiedenen Analog/Digital-Wandlern, Digital/Analog-Wandlern und anderen Hilfsschaltungen bestehen. Die Steuerungs- und Signalverarbeitungsfunktionen der Mobilstation werden zwischen diesen Einrichtungen entsprechend ihren jeweiligen Fähigkeiten zugewiesen. Für die Zwecke dieser Offenbarung wird davon ausgegangen, dass die Steuerung 18 die erforderlichen Sprachcodierer- und andere Funktionen zum Implementieren der verbesserten Erzeugung von Hintergrund-Beruhigungsrauschen sowie die DTX-Verfahren und die DTX-Vorrichtung gemäß dieser Erfindung beinhaltet. Diese Funktionen können ganz in Software, ganz in Hardware oder mit einer Mischung von Hardware und Software implementiert werden.
  • Eine Benutzerschnittstelle beinhaltet einen herkömmlichen Ohrhörer oder einen Lautsprecher 17, einen Sprachwandler wie ein herkömmliches Mikrofon 19 in Kombination mit einem A/D-Wandler und einem Sprachcodierer, ein Display 20 und ein Benutzereingabegerät, typischerweise eine Tastatur 20, die alle mit der Steuerung 18 verbunden sind. Die Tastatur 22 beinhaltet die herkömmlichen numerischen (0–9) und einschlägigen Tasten (#, *) 22a sowie andere Tasten 22b, die zum Bedienen der Mobilstation 10 verwendet werden. Zu diesen anderen Tasten 22b können z. B. eine Taste SENDEN, verschiedene Menüdurchroll- und programmierbare Tasten sowie eine Spannungseinschalttaste PWR gehören. Die Mobilstation 10 beinhaltet auch eine Batterie 26 zum Versorgen der verschiedenen Schaltkreise, die zum Betreiben der Mobilstation erforderlich sind, mit Spannung.
  • Die Mobilstation 10 verfügt auch über verschiedene Speicher, die gemeinsam als Speicher 24 dargestellt sind, in denen eine Anzahl von Konstante und Variablen gespeichert sind, die von der Steuerung 18 während des Betriebs der Mobilstation genutzt werden. Z. B. speichert der Speicher 24 die Werte verschiedener Parameter des Zellensystems sowie das Nummernzuweisungsmodul (NAM = number assignment module). Im Speicher 24 (typischerweise einem ROM) ist auch ein Betriebssystem zum Steuern des Betriebs der Steuerung 18 gespeichert. Der Speicher 24 kann auch Daten, einschließlich Benutzermeldungen, speichern, wie sie von der BMI 32 empfangen werden, bevor die Meldungen dem Benutzer angezeigt werden. Der Speicher 24 beinhaltet auch Routinen zum Implementieren der unten beschriebenen Verfahren hinsichtlich der Übertragung von Parametern zu Hintergrund-Beruhigungsrauschen während DTX-Betriebs.
  • Es ist zu beachten, dass die Mobilstation 10 in einem Fahrzeug angebracht sein kann oder ein Handgerät sein kann. Ferner ist zu beachten, dass die Mobilstation 10 mit einem oder mehreren Luftschnittstellenstandards, Modulationstypen und Zugriffstypen arbeiten kann. Z. B. kann die Mobilstation dazu in der Lage sein, mit einer beliebigen Anzahl anderer Standards neben IS-136, wie GSM, zu arbeiten. So sollte es deutlich sein, dass die Lehre der Erfindung nicht dahingehend auszulegen ist, dass sie auf irgendeinen speziellen Typ einer Mobilstation oder eines Schnittstellenstandards beschränkt wäre.
  • Obwohl die Erfindung nachfolgend speziell in Zusammenhang mit einer IS-136-Ausführungsform beschrieben wird, sei erneut darauf hingewiesen, dass die Lehre der Erfindung nicht nur auf diesen einen Schnittstellenstandard beschränkt ist.
  • Hinsichtlich DTX auf einem digitalen Verkehrskanal (IS-136.1, Rev. A, Section 2.3.11.2) strahlt der Sender 14, wenn er sich im hohen DTX-Zustand befindet, einen Leistungspegel ab, der durch den zuletzt von der Mobilstation 10 empfangenen Leistungseinstellbefehl angegeben ist (Initial Traffic Channel Designation message, Digital Traffic Channel (DTC) Designation message, Handoff message, Dedicated DTC Handoff message, oder Physical Layer Control message).
  • Im niedrigen DTX-Zustand bleibt der Sender 14 ausgeschaltet. Das Signal CDVCC wird mit Ausnahme der Übertragung von FACCH (Fast Associated Control Channel)-Meldungen nicht gesendet. Alle SACCH(Slow Associated Control Channel)-Meldungen, wie sie durch die Mobilstation 10 zu senden sind, während der niedrige DTX-Zustand vorliegt, werden als FACCH-Meldung gesendet, woraufhin der Sender 14 erneut in den ausgeschalteten Zustand zurückkehrt, solange nicht diskontinuierliche Übertragung (DTX) auf andere Weise gesperrt wurde.
  • Wenn es die Mobilstation 10 wünscht, vom hohen in den niedrigen DTX-Zustand umzuschalten, kann sie alle ablaufenden SACCH-Meldungen im hohen DTX-Zustand abschließen oder die Übertragung von SACCH-Meldungen beenden und die unterbrochenen SACCH-Meldungen, in ihrer Gesamtheit, als FACCH-Meldungen im niedrigen DTX-Zustand erneut senden.
  • Wenn eine Mobilstation vom hohen in den niedrigen DTX-Zustand umschaltet, muss sie einen Übergangszustand durchlaufen, in dem sich die Sendeleistung auf dem hohen DTX-Pegel befindet, bis alle anhängigen FACCH-Meldungen vollständig gesendet wurden.
  • Bei der bevorzugten Ausführungsform der Erfindung verbleibt die Mobilstation 10 im Übergangszustand, bis ein Block zu Hintergrund-Beruhigungsrauschen (aus sechs DTX-Überhangsschlitzen und der einschlägigen Parametermeldung zum Hintergrund-Beruhigungsrauschen) vollständig gesendet wurde. Der Block zum Hintergrund-Beruhigungsrauschen wird ohne Unterbrechung gesendet. Wenn irgendwelche anderen FACCH-Meldungsschlitze mit dem Senden des Blocks zum Hintergrund-Beruhigungsrauschen zusammenfallen, verzögert die Mobilstation 10 das Senden entweder der FACCH-Meldung oder des Blocks zum Hintergrund-Beruhigungsrauschen, um das eine vor dem anderen zu senden, wobei jedoch in jedem Fall die FACCH-Meldungen effektiv so gruppiert oder abgesondert werden, dass sie die für das Senden des Blocks zum Hintergrund-Beruhigungsrauschen verwendeten Schlitze nicht unterbrechen oder stehlen. Dies gewährleistet die bestverfügbare Qualität an Hintergrund-Beruhigungsrauschen, wie sie von einem Decodierer für Sprache/Hintergrund-Beruhigungsrauschen in einer Basisstation erzeugt wird.
  • Diesbezüglich wird auf die am 25. September 1997 mit dem Titel "Tansmission of Comfort Noise Parameters During Discontinuous Transmission" von Seppo Alanärä und Pekka Kapanen eingereichte, ebenfalls anhängige US-Patentanmeldung mit der Seriennummer 08/936,755, mit derselben Rechtsnachfolgerin, Bezug genommen.
  • Gemäß einer speziellen Ausführungsform wird die unten in der Tabelle 1 angegebene Parametermeldung zum Hintergrund-Beruhigungsrauschen (CN) auf dem digitalen Rück-Verkehrskanal (RDTC = reverse digital traffic channel), speziell dem logischen FACCH-Kanal, gesendet, und sie enthält 38 Bits, von denen 26 Bits einen LSF-Restvektor enthalten, der unter Verwendung desselben auf Split-Vektor-Quantisierungs(SVQ)-Codebuchs quantisiert wird, wie es im Sprachcodec gemäß IS-641 verwendet wird. Die Quantisierungs/Entquantisierungsalgorithmen des Sprachcodecs werden modifiziert, um es zu ermöglichen, dieses Codebuch zu verwenden. Die LSP-Parameter liefern einen Schätzwert für die Spektraleinhüllende des Hintergrundrauschens auf der Sendeseite, unter, vorzugsweiser, Verwendung eines LPC-Modells zehnter Ordnung für das Spektrum.
  • Die nächsten 8 Bits enthalten einen Quantisierungsindex für die Energie des Hintergrund-Beruhigungsrauschens, der die Energie des Hintergrundrauschens auf der Sendeseite beschreibt. Die restlichen 4 Bits in der Meldung werden zum Senden eines RESC(Random Excitation Spectral Control)-Informationselements verwendet.
  • Tabelle 1 Meldungsformat
    Figure 00320001
  • Zusammengefasst gesagt, werden die im Abschnitt "Hintergrund" dieser Patentanmeldung erörterten Probleme dadurch berücksichtigt, dass, auf der Empfangsseite, synthetisches Rauschen erzeugt wird, das dem Hintergrundrauschen auf der Sendeseite ähnlich ist. Die Parameter für Hintergrund-Beruhigungsrauschen (CN) werden auf der Sendeseite abgeschätzt und an die Empfangsseite übertragen, bevor die Funkübertragung abgeschaltet wird, und danach mit regelmäßiger niedriger Rate. Dies erlaubt es, das Hintergrund-Beruhigungsrauschen an die Änderungen des Rauschens auf der Sendeseite anzupassen. Der DTX-Mechanismus gemäß dieser Erfindung nutzt das Folgende: eine Sprachaktivitätsdetektor(VAD)-Funktion 21 (12) auf der Sendeseite; eine Bewertung in der Steuerung 18 zum akustischen Hintergrundrauschen auf der Sendeseite, um Charakteristikparameter an die Empfangsseite zu senden; und eine Erzeugung ähnlichen Rauschens, das als Hintergrund-Beruhigungsrauschen bezeichnet wird, während Perioden, in denen die Funkübertragung ausgeschaltet ist, auf der Empfangsseite.
  • Zusätzlich zu diesen Funktionen wird, wenn sich zeigt, dass die auf der Empfangsseite eintreffenden Parameter durch Fehler ernsthaft zerstört sind, die Sprache oder das Hintergrund-Beruhigungsrauschen statt dessen aus substituierten Daten erzeugt, um es zu vermeiden, für den Hörer störende Audioeffekte zu erzeugen.
  • Die sendeseitige DTX-Funktion leitet kontinuierlich Rahmen, die jeweils mit einem SP-Flag markiert sind, an den Funksender 14 weiter, wobei das SP-Flag = "1" einen Sprachrahmen anzeigt und das SP-F1ag = "0" einen codierten Satz von Parametern für Hintergrund-Beruhigungsrauschen anzeigt. Die zeitliche Planung der Rahmen zur Übertragung über die Luftschnittstelle wird durch den Funksender 14 auf Grundlage des SP-Flags gesteuert.
  • Bei einer bevorzugten Ausführungsform der Erfindung, und um eine genaue Verifizierung der sendeseitigen DTX-Funktionen zu erlauben, werden alle Rahmen vor dem Rücksetzen der Mobilstation 10 so behandelt, als wären sie Sprachrahmen für eine unendlich lange Zeit. Daher werden die ersten sechs Rahmen nach jedem nach jedem Rücksetzen immer mit dem SP-Flag = "1" markiert, selbst dann, wenn VAD-Flag = "0" (Überhangsperiode siehe die 14) gilt.
  • Der Sprachaktivitätsdetektor (VAD) 21 arbeitet kontinuierlich, um zu ermitteln, um zu ermitteln, ob das Eingangssignal vom Mikrofon 19 Sprache enthält. Das Ausgangssignal ist ein Binärflag (VAD-Flag = "1" bzw. VAD-Flag = "0") auf rahmenbezogener Basis.
  • Das VAD-Flag steuert indirekt, über die unten beschriebenen sendeseitigen DTX-Handleroperationen, den gesamten DTX-Betrieb auf der Sendeseite.
  • Immer dann, wenn VAD-Flag = "1" gilt, wird der sprachcodierte Ausgangsrahmen direkt an den Funksender 14 weitergeleitet, markiert mit dem SP-Flag = "1".
  • Am Ende eines Sprachbursts (Übergang vom VAD-Flag = "1" auf das VAD-Flag = "0") sind sieben aufeinanderfolgende Rahmen dazu erforderlich, einen neu aktualisierten Satz von CN-Parametern verfügbar zu machen. Normalerweise werden die ersten sechs Sprachcodierer-Ausgangsrahmen nach dem Ende eines Sprachbursts direkt an den Funksender 14 weitergeleitet, markiert mit dem SP-Flag = "1", um dadurch die "Überhangsperiode" zu erzeugen. Der erste neue Satz von CN-Parametern wird dann als siebter Rahmen nach dem Ende des Sprachbursts an den Funksender 14 weitergeleitet, markiert mit dem SP-Flag = "0" (siehe die 14).
  • Wenn jedoch, am Ende des Sprachbursts, weniger als 24 Rahmen verstrichen sind, seit der letzte Satz von CN-Parametern berechnet und an den Funksender 14 weitergeleitet wurde, wird der letzte Satz von CN-Parametern wiederholt an den Funksender 14 weitergeleitet, bis ein neu aktualisierter Satz von CN-Parametern verfügbar ist (sieben aufeinanderfolgende Rahmen, die mit dem VAD-Flag = "0" markiert sind). Dies verringert die Aktivität auf der Luftschnittstelle in Fällen, in denen kurze Spitzen von Hintergrundrauschen als Sprache interpretiert werden, in dem der "Überhang" vermieden wird, der auf die Berechnung der CN-Parameter wartet. Die 15 zeigt ein Beispiel für den längstmöglichen Sprachburst ohne Überhang.
  • Wenn einmal der erste Satz von CN-Parametern nach dem Ende eines Sprachbursts berechnet und an den Funksender 14 weitergeleitet wurde, fährt der sendeseitige DTX-Handler mit dem Berechnen und Weiterleiten aktualisierter Sätze von CN-Parametern an die Funkschnittstelle 14, markiert mit dem SP-Flag = "0", fort, solange VAD-Flag = "0" gilt.
  • Der Sprachcodierer wird in einem normalen Sprachcodiermodus betrieben, wenn SP-Flag = "1" gilt, und in einem vereinfachten Modus, wenn SP-Flag = "0" gilt, da nicht alle Codiererfunktionen zur Auswertung von CN-Parametern erforderlich sind.
  • Im Funksender 14 werden die folgenden Verkehrsrahmen für den Sendevorgang zeitlich geplant. Alle mit dem SP-F1ag = "1" markierten Rahmen; der erste mit dem SP-F1ag = "0" markierte Rahmen nach einem oder mehreren Rahmen mit SP-Flag = "1"; die mit SP = "0" markierten Rahmen, die zur Übertragung von Aktualisierungsmeldungen für CN-Parameter geplant sind.
  • Dies hat den Gesamteffekt eines Übergangs in den niedrigen DTX-Zustand nach dem Senden einer CN-Parametermeldung, wenn der Sprecher zu sprechen aufhört. Während Sprachpausen wird der Sendevorgang mit, z. B., regelmäßigen Intervallen zur Übertragung einer CN-Parametermeldung aufgenommen, oder zum Aktualisieren des erzeugten Hintergrund-Beruhigungsrauschens auf der Empfangsseite.
  • Der Auswertungsalgorithmus für das Hintergrund-Beruhigungsrauschen nutzt die unquantisierten und quantisierten (z. B.) Linearvorhersage(LP)-Parameter des Sprachcodierers unter Verwendung der LSP(Line Spectral Pair)-Repräsentation, wobei der unquantisierte LSF(Line Spectral Frequency)-Vektor durch ft = [f1f2 ... f10] gegeben ist und der quantisierte LSF-Vektor durch ft = (f1f2 ... f10) gegeben ist, wobei t die Transponierte bezeichnet. Der Algorithmus nutzt auch das LP-Restsignal r(n) jedes Unterrahmens zum Berechnen des Parameters der Zufallserregungsverstärkung und des RESC(Random Excitation Spectral Control)-Parameters.
  • Der Algorithmus berechnet die folgenden Parameter zur Unterstützung bei der Erzeugung von Hintergrund-Beruhigungsrauschen: Den Bezugs-LSF-Parametervektor fref (Mittelwert der quantisierten LSF-Parameter der Überhangsperiode); den gemittelten LSF-Parametervektor fmean (Mittelwert der LSF-Parameter der sieben jüngsten Rahmen); die gemittelte Zufallserregungsverstärkung gcn mean (Mittelwert der Zufalls-Erregungsverstärkungswerte der sieben jüngsten Rahmen); die Zufallserregungsverstärkung gcn und die RESC-Parameter Λ.
  • Diese Parameter liefern Information zum Spektrum (f, f ^, f ^ ref, fmean, Λ) und zum Pegel (gcn, gcn mean) des Hintergrundrauschens.
  • Drei (fmean, Λ und gcn mean) der ausgewerteten Parameter zum Hintergrund-Beruhigungsrauschen werden in eine spezielle FACCH-Meldung, die hier als Parametermeldung für Hintergrund-Beruhigungsrauschen (CN) bezeichnet wird, zum Senden an die Empfangsseite codiert. Da der Bezugs-LSF-Parametervektor f ^ ref auf dem Codierer und im Decodierer auf dieselbe Weise ausgewertet werden kann, wie unten beschrieben, ist keine Übertragung dieses Parametervektors erforderlich.
  • Die CN-Parametermeldung dient auch zum Starten der Erzeugung von Hintergrund-Beruhigungsrauschen auf der Empfangsseite, da eine CN-Parametermeldung immer am Ende eines Sprachbursts gesendet wird, d. h. vor dem Beenden der Funkübertragung.
  • Oben wurde unter Bezugnahmen auf die 7 und 8 die zeitliche Planung von CN-Parametermeldungen oder Sprachrahmen auf der Funkübertragungsstrecke beschrieben.
  • Zur Bewertung des Hintergrundrauschens gehört die Berechnung dreier Arten gemittelter Parameter: Der LSF-Parameter, des Zufallserregungs-Parameters und der RESC-Parameter. Die Parameter zum Hintergrund-Beruhigungsrauschen, die in eine Parametermeldung zum Hintergrund-Beruhigungsrauschen zu codieren sind, werden über die CN-Mittelungsperiode von N = 7 aufeinanderfolgenden, mit VAD = "0" markierten Rahmen berechnet, wie unten detaillierter beschrieben.
  • Vor dem Mitteln der LSF-Parameter über die CN-Mittelungsperiode wird am Satz der zu mittelnden LSF-Parameter eine Mediansersetzung ausgeführt, um die Parameter, die für das Hintergrundrauschen auf der Sendeseite nicht charakteristisch sind, zu entfernen. Als Erstes werden die spektralen Abstände jedes der LSF-Parametervektoren f(i) zu den anderen LSF-Parametervektoren f(j), i = 0 ... 6, j = 0 ... 6, i ≠ j innerhalb der CN-Mittelungsperiode gemäß der folgenden Gleichung angenähert:
    Figure 00360001
    wobei fi(k) der k-te LSF-Parameter des LSF-Parametervektors f(i) im Rahmen i ist.
  • Um den spektralen Abstand ΔSi des LSF-Parametervektors f(i) zu den LSF-Parametervektoren f(j) aller anderen Rahmen j = 0 ... 6, j ≠ i innerhalb der CN-Mittelungsperiode aufzufinden, wird die Summe der spektralen Abstände ΔRij wie folgt berechnet:
    Figure 00360002
    was für alle i = 0 ... 6, i ≠ j erfolgt.
  • Der LSF-Parametervektor f(i) mit dem kleinsten spektralen Abstand ΔSi aller LSF-Parametervektoren innerhalb der CN-Mittelungsperiode wird als Medians-LSF-Parametervektor fmed der Mittelungsperiode angesehen, und sein spektraler Abstand wird mit ΔSmed bezeichnet. Es wird davon ausgegangen, dass der Medians-LSF-Parametervektor die beste Repräsentation der spektralen Kurzzeiteinzelheiten des Hintergrundrauschens aller LSF-Parametervektoren innerhalb der Mittelungsperiode darstellt. Wenn innerhalb der CN-Mittelungsperiode LSF-Parametervektoren f(j) mit ΔSi/Δsmed > THmed (6)existieren, wobei THmed = 2,25 der Schwellenwert für die Mediansersetzung ist, werden höchstens zwei dieser LSF-Vektoren (diejenigen LSF-Parametervektoren, die für das größte Überschreiten von THmed sorgen), durch den Medians-LSF-Parametervektor ersetzt, bevor der gemittelte LSF-Parametervektor fmean berechnet wird.
  • Der als Ergebnis der Mediansersetzung erhaltene Satz von LSF-Parametervektoren wird als f'(n – i) bezeichnet, wobei n der Index des aktuellen Rahmens ist und i der Index der Mittelungsperiode ist (i = 0 ... 6).
  • Wenn die Mediansersetzung am Ende der Überhangsperiode (erste CN-Aktualisierung) ausgeführt wird, weisen alle LSF-Parametervektoren f(n – i) der sechs vorigen Rahmen (der Überhangsperiode i = 1 ... 6) quantisierte Werte auf, während der LSF-Parametervektor f(n) für den jüngsten Rahmen unquantisierte Werte aufweist. Bei der folgenden CN-Aktualisierung weisen die LSF-Parametervektoren der CN-Mittelungsperiode in denjenigen Rahmen, die mit der Überhangsperiode überlappen, quantisierte Werte auf, während die Parametervektoren der jüngsten Rahmen der CN-Mittelungsperiode unquantisierte Werte aufweisen. Wenn die Periode der sieben jüngsten Rahmen nicht mit der Überhangsperiode überlappt, wird die Mediansersetzung von LSF-Parametern unter Verwendung nur unquantisierter Parameterwerte ausgeführt.
  • Der gemittelte LSF-Parametervektor fmean(n) für den Rahmen n wird gemäß der folgenden Gleichung berechnet:
    Figure 00370001
    wobei f'(n – i) der LSF-Parametervektor eines der sieben jüngsten Rahmen (i = 0 ... 6) nach dem Ausführen der Mediansersetzung ist, i der Index der Mittelungsperiode ist und n der Rahmenindex ist.
  • Der gemittelte LSF-Parametervektor fmean(n) für den Rahmen n wird vorzugsweise unter Verwendung derselben Quantisierungstabellen quantisiert, die vom Sprachcodierer auch für die Quantisierung der nicht-gemittelten LSF-Parametervektoren im normalen Sprachcodiermodus verwendet werden, jedoch wird der Quantisierungsalgorithmus modifiziert, um die Quantisierung von Hintergrund-Beruhigungsrauschen zu unterstützen. Der zu quantisierende LSF-Vorhersagerest wird gemäß der folgenden Gleichung erhalten: r(n) = fmean(n) – f ^ref (8)wobei fmean(n) der gemittelte LSF-Parametervektor für den Rahmen n ist, f ^ ref der Bezugs-LSF-Parametervektor ist, r(n) der berechnete LSF-Vorhersagerestvektor für den Rahmen n ist und n der Rahmenindex ist.
  • Die Berechnung des Bezugs-LSF-Parametervektors fref erfolgt auf Grundlage der quantisierten LSF-Parameters durch Mitteln dieser Parameter über die Überhangsperiode von sechs Rahmen entsprechend der folgenden Gleichung:
    Figure 00370002
    wobei f ^(n – i) der quantisierte LSF-Parametervektor eines der Rahmen der Überhangsperiode ist (i = 1 ... 6), i der Rahmenindex in der Überhangsperiode ist und n der Rahmenindex ist. Es ist zu beachten, dass die quantisierten LSF-Parametervektoren f(n – i), wie sie zur Berechnung von f ^ ref verwendet werden, keiner Mediansersetzung vor der Mittelung unterzogen werden.
  • Für jede CN-Erzeugungsperiode erfolgt die Berechnung des Bezugs-LSF-Parametervektors f ^ ref nur einmal am Ende der Überhangsperiode, und für den Rest der CN-Erzeugungsperiode wird f ^ ref eingefroren. Der Bezugs-LSF-Parametervektor f ^ ref wird im Decoder auf dieselbe Weise wie im Codierer ausgewertet, da während der Überhangsperiode im Codierer und im Decodierer dieselben LSF-Parametervektoren f ^ verfügbar sind. Eine Ausnahme dazu sind die Fälle, in denen Übertragungsfehler ausreichend schwer sind, um dafür zu sorgen, dass die Parameter unbrauchbar werden, und wenn eine Rahmenersetzungsprozedur aktiviert wird. In diesen Fällen werden die aus der Rahmenersetzungsprozedur erhaltenen modifizierten Parameter anstelle der empfangenen Parameter verwendet.
  • Die Zufallserregungsverstärkung wird für jeden Unterrahmen auf Grundlage der Energie des LP-Restsignals des Unterrahmens gemäß der folgenden Gleichung berechnet:
    Figure 00380001
    wobei gcn(j) die berechnete Zufallserregungsverstärkung für den Unterrahmen j ist, r(1) der 1-te Abtastwert des LP-Rests im Unterrahmen j ist und 1 der Abtastindex ist (1 = 0 ... 39). Der Skalierungsfaktor von 1,286 wird dazu verwendet, dass der Pegel des Hintergrund-Beruhigungsrauschens mit dem des durch den Sprachcodec codierten Hintergrundrauschens übereinstimmt. Die Verwendung dieses speziellen Skalierungsfaktors ist nicht als Beschränkung bei im Realisieren der Erfindung zu verstehen.
  • Die berechnete Energie des LP-Restsignals wird durch den Wert 10 geteilt, um die Energie für einen Zufallserregungsimpuls zu liefern, da während der Erzeugung des Hintergrund-Beruhigungsrauschens das Unterrahmen-Erregungssignal (Pseudorauschen) 10 von 0 verschiedene Abtastwerte aufweist, deren Amplituden Werte von +1 oder –1 einnehmen können.
  • Die berechneten Zufalls-Erregungsverstärkungswerte werden im ersten Unterrahmen jedes mit SP = "0" markierten Rahmens n gemittelt und aktualisiert, wenn ein aktualisierter Satz von CN-Parametern benötigt wird, was entsprechend der folgenden Gleichung erfolgt:
    Figure 00390001
    wobei gcn(n)(1) die berechnete Zufallserregungsverstärkung im ersten Unterrahmen des Rahmens n ist, gcn(n – i)(j) die berechnete Zufallserregungsverstärkung im Unterrahmen j eines der vergangenen Rahmen (i = 1 ... 6) ist und n der Rahmenindex ist. Da die Zufallserregungsverstärkung alleine des ersten Unterrahmens des aktuellen Rahmens bei der Mittelung verwendet wird, ist es möglich, den aktualisierten Satz von CN-Parameter zur Übertragung verfügbar zu machen, nachdem der erste Unterrahmen des aktuellen Rahmens verarbeitet wurde.
  • Die gemittelte Zufallserregungsverstärkung ist durch gcn mean ≤ 4.032,0 begrenzt, und sie wird durch einen 8-Bit-Quantisierer mit ungleichmäßigem Algorithmus in der Logarithmusdomäne quantisiert, so dass keine Speicherung einer Quantisierungstabelle erforderlich ist.
  • Hinsichtlich der Berechnung der RESC-Parameter ergeben sich, da der LP-Rest r(n) etwas von einer flachen Spektralcharakteristik abweicht, einige Verluste hinsichtlich der Qualität des Hintergrund-Beruhigungsrauschens (spektrale Fehlanpassung zwischen dem Hintergrundrauschen und dem Hintergrund-Beruhigungsrauschen), wenn eine spektral flache Zufallserregung dazu verwendet wird, Hintergrund-Beruhigungsrauschen auf der Empfangsseite zu synthetisieren. Um für verbesserte spektrale Anpassung zu sorgen, wird für das LP-Restsignal eine LP-Analyse zweiter Ordnung über die CN-Mittelungsperiode ausgeführt, und die sich ergebenden gemittelten LP-Koeffizienten werden in der CN-Parametermeldung, wie sie bei der Erzeugung von Hintergrund-Beruhigungsrauschen zu verwenden ist, an die Empfangsseite übertragen. Dieses Verfahren wird als spektrale Steuerung der Zufallserregung (RESC = random excitation spectral control) bezeichnet, und die erhaltenen LP-Koeffizienten werden als RESC-Parameter Λ bezeichnet.
  • Die LP-Restsignale r(n) jedes Unterrahmens in einem Rahmen werden verkettet, um die Autokorrelationen rres(k), k = 0 ... 2 des LP-Restsignals des Rahmens von 20 ms entsprechend der folgenden Gleichung zu berechnen:
  • Figure 00400001
  • Nach dem Berechnen der Autokorrelationen gemäß der vorstehenden Gleichung werden dieselben normiert, um die normierten Autokorrelationen r'res(k) zu erhalten.
  • Für den jüngsten Rahmen der CN-Mittelungsperiode werden die Autokorrelationen nur aus dem ersten Unterrahmen zur Mittelung verwendet, um es zu ermöglichen, den aktualisierten Satz von CN-Parametern zur Übertragung zu erstellen, nachdem der erste Unterrahmen des aktuellen Rahmens verarbeitet wurde.
  • Die berechneten, normierten Autokorrelationen werden im ersten Unterrahmen jedes mit SP = "0" markierten Rahmens n gemittelt und aktualisiert, wenn ein aktualisierter Satz von CN-Parametern benötigt wird, was entsprechend der folgenden Gleichung erfolgt:
    Figure 00400002
    wobei r'res(n)(1) die normierten Autokorrelationen im ersten Unterrahmen des Rahmens n sind, r'res(n – i) die normierten Autokorrelationen eines der vergangenen Rahmen (i = 1 ... 6) sind und n der Rahmenindex ist.
  • Die berechneten, gemittelten Autokorrelationen rref mean werden in einen Schur-Rekursionsalgorithmus eingegeben, um die zwei ersten Reflexionskoeffizienten zu berechnen, d. h. die RESC-Parameter Λ oder λ(i), i = 1, 2. Jeder der zwei RESC-Mittelungsperiode wird unter Verwendung eines 2-Bit-Skalarquantisierers codiert.
  • Die Modifizierung des Sprachcodieralgorithmus während DTX-Betrieb ist die Folgende. Wenn das SP-Flag den Wert "0" hat, wird der Sprachcodieralgorithmus auf die folgende Weise modifiziert. Die nicht-gemittelten LP-Parameter, die zum Herleiten der Filterkoeffizienten des Kurzzeit-Synthesefilters H(z) des Sprachcodierers verwendet werden, werden nicht quantisiert und der Speicher des Gewichtungsfilters W(z) wird nicht aktualisiert sondern vielmehr auf null gesetzt. Es wird eine Suche nach der Periodennacheilung in der offenen Schleife ausgeführt, jedoch wird die Suche nach der Periodennacheilung in der geschlossenen Schleife deaktiviert und die adaptive Verstärkung aus dem Codebuch wird auf null gesetzt. Wenn die VAD-Implementie rung den Verzögerungsparameter des adaptiven Codebuchs zum Treffen der VAD-Entscheidung nicht verwendet, kann die Suche nach der Periodenverzögerung in der offenen Schleife auch abgeschaltet werden. Es wird keine Suche im festen Codebuch ausgeführt. In jedem Unterrahmen wird der feste Erregungsvektor aus dem Codebuch für den normalen Sprachdecodierer durch einen Zufalls-Erregungsvektor ersetzt, der zehn von null abweichende Impulse enthält. Der Zufalls-Erregungserzeugungsalgorithmus ist unten definiert. Die Zufallserregung wird durch das RESC-Synthesefilter gefiltert, wie oben beschrieben, um den Inhalt des letzten Erregungspuffers sowohl im Codierer als auch im Decodierer so nahe wie möglich gleich zu halten, um einen schnellen Start der adaptiven Codebuchsuche zu ermöglichen, wenn nach einer Erzeugungsperiode für Hintergrund-Beruhigungsrauschen Sprachaktivität beginnt. Der Quantisierungsalgorithmus für den LP-Parameter im Sprachcodiermodus wird deaktiviert. Am Ende der Überhangsperiode wird der Bezugs-LSF-Parametervektor f ^ ref auf die oben definierte Weise berechnet. Für den Rest der Einsetzperiode für das Hintergrund-Beruhigungsrauschen wird f ^ ref eingefroren. Der gemittelte LSF-Parametervektor fmean wird jedesmal dann berechnet, wenn ein neuer Satz von CN-Parametern zu erstellen ist. Dieser Parametervektor wird in die oben definierte CN-Parametermeldung codiert. Der Erregungsverstärkungs-Quantisierungsalgorithmus des Sprachcodiermodus wird ebenfalls deaktiviert. Der gemittelte Zufalls-Erregungsverstärkungswert gcn mean wird jedesmal dann berechnet, wenn ein neuer Satz von CN-Parametern zu erstellen ist. Dieser Verstärkungswert wird in die bereits definierte CN-Parametermeldung codiert. Die Berechnung der Zufalls-Erregungsverstärkung wird auf Grundlage der Energie des LP-Restsignals, wie oben definiert, ausgeführt. Die Speicher der Vorhersageeinrichtung für die Algorithmen zur normalen LP-Parameterquantisierung und zur festen Codebuch-Verstärkungsquantisierung werden rückgesetzt, wenn SP-Flag = "0" gilt, so dass die Quantisierer ausgehend von ihren Anfangszuständen starten, wenn erneut Sprachaktivität beginnt. Schließlich erfolgt die Berechnung der RESC-Parameter auf Grundlage des spektralen Inhalts des LP-Restsignals, wie oben definiert. Die RESC-Parameter werden jedesmal dann berechnet, wenn ein neuer Satz von CN-Parametern zu erstellen ist.
  • Der Codieralgorithmus für Hintergrund-Beruhigungsrauschen erzeugt für jede CN-Parametermeldung 38 Bits, wie es in der Tabelle 2 dargestellt ist. Diese Bits werden als Vektor cn[0 ... 37] bezeichnet. Die Bits cn[0 ... 37] für das Hintergrund-Beruhigungsrauschen werden in der in der Tabelle 2 angegebenen Ordnung an den FACCH-Kanalcodierer geliefert (d. h., es wird keine Ordnung entsprechend der subjektiven Bedeutung der Bits ausgeführt).
  • Tabelle 2 Detaillierte Bitzuordnung der Parameter des Hintergrund-Beruhigungsrauschens
    Figure 00420001
  • Unabhängig von ihrem Kontext (Sprache, CN-Parametermeldung, andere FACCH-Meldungen oder nichts) leitet der Funkempfänger der Basisstation 30 die empfangenen Verkehrsrahmen kontinuierlich an den empfangsseitigen DTX-Handler weiter, wobei diese durch verschiedene Vorverarbeitungsfunktionen mit drei Flags individuell markiert sind. Diese sind das Flag zum Anzeigen eines schlechten Sprachrahmens (BFI = speech frame Bad Frame Indicator), das Flag zum Anzeigen eines schlechten Rahmens mit Parametern zum Hintergrund-Beruhigungsrauschen (BFI_CN = comfort noise parameter Bad Frame Indicator) und das unten und in der Tabelle 3 angegebene Flag betreffend die Aktualisierung von Hintergrund-Beruhigungsrauschen (CNU = comfort noise Update). Diese Flags dienen zum Klassifizieren der Verkehrsrahmen entsprechend ihrem Zweck. Diese Klassifizierung, die in der Tabelle 3 zusammengefasst ist, erlaubt es, dem empfangsseitigen DTX-Handler, auf einfache Weise zu bestimmen, wie der empfangene Rahmen zu verarbeiten ist.
  • Tabelle 3 Klassifizieren von Verkehrsrahmen
    Figure 00430001
  • Die Flags BFI und BFI_CN zeigen an, ob der Verkehrsrahmen als solcher anzusehen ist, der bedeutungsvolle Informationsbits (BFI-Flag = "0" und BFI_CN-Flag = "1" oder BFI-Flag = "1" und BFI_CN-Flag = "0") oder nicht (BFI-Flag = "1" und BFI_CN-Flag = "1" oder BFI-Flag = "0" und BFI_CN-Flag = "0"). Im Zusammenhang mit dieser Offenbarung wird davon ausgegangen, dass ein FACCH-Rahmen keine bedeutungsvollen Bits enthält, solange er nicht eine CN-Parametermeldung enthält und demgemäß mit BFI_SP-Flag = "1" und BFI_CN-Flag = "1" markiert ist.
  • Das binäre CNU-Flag markiert diejenigen Verkehrsrahmen mit CNU = "1", die mit den Übertragungsinstanzen der über den FACCH gelieferten Kanalqualitätsinformation ausgerichtet sind.
  • Der empfangsseitige DTX-Handler ist für den gesamten DTX-Betrieb auf der Empfangsseite zuständig. Der DTX-Betrieb auf der Empfangsseite ist der Folgende: immer dann, wenn ein guter Sprachrahmen erkannt wird, leitet der DTX-Handler ihn direkt an den Sprachdecodierer weiter; wenn verlorene Sprachrahmen oder verlorene CN-Parametermeldungen erkannt werden, wird die Ersetzungs- und Stummschaltprozedur angewandt; gültige CN-Parametermeldungen führen zur Erzeugung von Hintergrund-Beruhigungsrauschen, bis die nächste CN-Parametermeldung erwartet wird (CNU = "1") oder gute Sprachrahmen erkannt werden. Während dieser Periode ignoriert der empfangsseitige DTX-Handler alle vom Funkempfänger gelieferten unbrauchbaren Rahmen. Die zwei folgenden Operationen sind wahlfrei: die Parameter der ersten verlorenen CN-Parametermeldung werden durch diejenigen der letzten gültigen CN-Parametermeldung ersetzt und es wird die Prozedur für die CN-Parameter angewandt; außerdem wird bei Empfang einer zweiten verlorenen CN-Parametermeldung Stummschaltung angewandt.
  • Hinsichtlich der Mittelung und Decodierung der LP-Parameter werden, wenn vom Decodierer Sprachrahmen empfangen werden, die LP-Parameter der letzten sechs Sprachrahmen im Speicher aufbewahrt. Der Decodierer zählt die Anzahl der Rahmen, die verstrichen sind, seit der letzte Satz von CN-Parametern durch den Codierer aktualisiert wurde und an den Funksender weitergeleitet wurde. Auf Grundlage dieses Zählwerts bestimmt der Decodierer, ob am Ende des Sprachbursts eine Überhangsperiode existiert oder nicht (wenn mindestens 30 Rahmen seit der letzten CN-Parameteraktualisierung verstrichen sind und die erste CN-Parametermeldung nach einem Sprachburst eintrifft, wird ermittelt, dass eine Überhangsperiode am Ende des Sprachbursts existierte).
  • Sobald eine CN-Parametermeldung empfangen wird und eine Überhangsperiode am Ende des Sprachbursts erkannt wird, werden die gespeicherten LP-Parameter gemittelt, um den Bezugs-LSF-Parametervektor f ^ ref zu erhalten. Der Bezugs-LSF-Parametervektor wird eingefroren und für die aktuelle Erzeugungsperiode für Hintergrund-Beruhigungsrauschen verwendet.
  • Die Mittelungsprozedur zum Erhalten der Bezugsparameter ist die Folgende.
  • Wenn ein Sprachrahmen empfangen wird, werden die LSF-Parameter decodiert und in den Speicher eingespeichert. wenn die erste CN-Parametermeldung empfangen wird und eine Überhangsperiode am Ende des Sprachbursts erkannt wird, werden die gespeicherten LSF-Parameter auf dieselbe Weise wie im Sprachcodierer wie folgt gemittelt:
    Figure 00440001
    wobei f ^(n – i) der quantisierte LSF-Parametervektor eines der Rahmen der Überhangsperiode (i = 1 ... 6) ist und n der Rahmenindex ist.
  • Wenn einmal der Bezugs-LSF-Parametervektor berechnet wurde, kann der gemittelte LSF-Parametervektor f ^ mean (n) für den Rahmen n (in der CN-Parametermeldung codiert) jedesmal dann, wenn eine CN-Aktualisierungsmeldung empfangen wird, im Decodierer gemäß der folgenden Gleichung reproduziert werden: f ^mean(n) = r(n) + f ^ref (15)wobei f ^ mean(n) der quantisierte, gemittelte LSF-Parametervektor für den Rahmen n ist, f ^ ref der Bezugs-LSF-Parametervektor ist, r(n) der empfangene, quantisierte LSF-Vorhersagerestvektor für den Rahmen n ist und n der Rahmenindex ist.
  • In jedem Unterrahmen wird der feste Codebuch-Erregungsvektor des normalen Sprachcodierers, der vier von null abweichende Impulse enthält, während Sprachaktivität durch einen Zufalls-Erregungsvektor ersetzt, der zehn von null abweichende Impulse enthält. Die Impulspositionen und die Vorzeichen der Zufallserregung werden unter Verwendung gleichmäßig verteilter Pseudozufallszahlen lokal erzeugt. Die Erregungsimpulse nehmen im Zufalls-Erregungsvektor die Werte +1 und –1 ein. Der Zufallserregungs-Erzeugungsalgorithmus arbeitet entsprechend dem folgenden Pseudocode. Pseudocode:
    Figure 00450001
    wobei Code [0 ... 39] der feste Codebuch-Erregungspuffer ist und Zufallszahl (k) ganzzahlige Pseudozufallswerte erzeugt, die über den Bereich (0 ... k – 1) gleichmäßig verteilt sind.
  • Die empfangenen RESC-Parameterindizes werden decodiert, um die empfangenen RESC-Parameter λ(i), i = 1, 2 zu erhalten. Nachdem die Zufallserregung erzeugt wurde, wird sie durch das RESC-Synthesefilter, das wie folgt definiert ist, gefiltert:
  • Figure 00450002
  • Das RESC-Synthesefilter wird vorzugsweise unter Verwendung eines Gitterfilterverfahrens implementiert. Nach der RESC-Synthesefilterung wird Zufallserregung einer Skalierung und LP-Synthesefilterung unterzogen.
  • Die Erzeugungsprozedur für Hintergrund-Beruhigungsrauschen verwendet den Sprachdecodiereralgorithmus mit den folgenden Modifizierungen. Die festen Codebuch-Verstärkungswerte werden durch den in der CN-Parametermeldung empfangenen Zufalls-Erregungsverstärkungswert ersetzt, und die feste Codebucherregung wird durch die lokal erzeugte Zufallserregung, wie oben beschrieben, ersetzt. Die Zufallserregung wird durch das RESC-Synthesefilter, wie ebenfalls oben beschrieben, gefiltert. Der adaptive Codebuch-Verstärkungswert in jedem Unterrahmen wird auf null gesetzt. Der Periodenverzögerungswert in jedem Unterrahmen wird z. B. auf 60 gesetzt. Die verwendeten LP-Filterparameter sind diejenigen, die in der CN-Parametermeldung empfangen werden. Die Speicher in der Vorhersageeinrichtung für den normalen LP-Parameter und die Quantisierungsalgorithmen für feste Codebuchverstärkung werden rückgesetzt, wenn SP-Flag = "0" gilt, so dass die Quantisierer aus den von ihren Anfangszuständen starten, wenn erneut Sprachaktivität beginnt. Mit diesen Parametern führt der Sprachdecodierer nun seine Standardoperationen aus und synthetisiert Hintergrund-Beruhigungsrauschen. Das Aktualisieren der Parameter für Hintergrund-Beruhigungsrauschen (Zufalls-Erregungsverstärkung, RESC-Parameter und LP-Filterparameter) erfolgt jedesmal dann, wenn eine gültige CN-Parametermeldung empfangen wird, wie oben beschrieben. Wenn das Hintergrund-Beruhigungsrauschen aktualisiert wird, werden die vorstehenden Parameter über die CN-Aktualisierungsperiode interpoliert, um gleichmäßige Übergänge zu erzielen.
  • Eine verlorene CN-Parametermeldung wird als unbrauchbarer Rahmen definiert, wie er empfangen wird, wenn der empfangsseitige DTX-Handler Hintergrund-Beruhigungsrauschen erzeugt und eine CN-Parametermeldung erwartet wird (Aktualisierungsflag für Hintergrund-Beruhigungsrauschen, CNU = "1").
  • Die Parameter einer einzelnen verlorenen CN-Parametermeldung werden durch die Parameter der letzten gültigen CN-Parametermeldung ersetzt und es wird die Prozedur für gültige CN-Parameter angewandt. Für eine zweite verlorene CN-Parametermeldung wird eine Stummschaltungstechnik für das Hintergrund-Beruhigungsrauschen verwendet, die den Ausgangspegel allmählich absenkt (–3 dB/Rahmen), was zu einem schließlichen Stummschalten des Ausgangs des Decodierers führt. Die Stammschaltung erfolgt durch Absenken der Zufalls-Erregungsverstärkung mit einem konstanten Wert von –3 dB in einem Rahmen bis herunter zum Minimalwert 0. Dieser Wert wird aufrecht erhalten, wenn zusätzliche verlorene CN-Parametermeldungen auftreten.
  • Obwohl eine Anzahl derzeit bevorzugter Ausführungsformen der Erfindung hinsichtlich spezieller Werte von Rahmen dauern, Rahmenanzahlen, speziellen Meldungstypen (z. B. FACCH) und dergleichen beschrieben wurde, ist zu beachten, dass die Anzahl der Rahmen, die Dauer der Rahmen, die Dauer der Überhangsperiode, die Dauer der Mittelungsperiode, die Meldungstypen usw. entsprechend Spezifikationen und Erfordernissen verschiedener Typen digitaler Mobilkommunikationssysteme variiert werden können. Ferner wurde zwar die Erfindung in Zusammenhang mit Schaltungsblockdiagrammen beschrieben, wie denen, die in den 2a, 2b, 3a, 3b, 4, 5 und 10 dargestellt sind, jedoch ist zu beachten, dass einige der dargestellten Schaltungsblöcke durch einen geeignet programmierten digitalen Datenprozessor (z. B. die Steuerung 18 der 12) implementiert werden, der einen Teil des digitalen Zellentelefons 10 bildet. Nur beispielsweise können die Selektoren 307, 319 und 410 in den 4 und 5, die zwar als Schalter dargestellt sind, insgesamt in Software implementiert sein.
  • Auch wird darauf hingewiesen, dass bei einigen Systemen Erzeugungsschemas für Hintergrund-Beruhigungsrauschen bestehen, bei denen in der CN-Parametermeldung (oder im SID-Rahmen) keine Ersatzbits verfügbar sind, um die RESC-Parameter von der Sende- zur Empfangsseite zu übertragen. In diesen Fällen könnte das RESC-Filter durch ein Synthesefilter mit festen Koeffizienten ersetzt werden. Die festen Filterkoeffizienten werden dann so optimiert, dass dafür gesorgt wird, dass die Frequenz an Bord des Synthesefilters eine mittlere Antwort des normalen RESC-Filters mit übertragenen Koeffizienten zeigt. Die Filterkoeffizienten könnten auch so ausgewählt werden, dass sich eine Filterantwort ergibt, die eine wahrnehmungsmäßig (subjektiv) bevorzugte Qualität des Hintergrund-Beruhigungsrauschens erzeugt.
  • So wurde zwar die Erfindung im Hinblick auf bevorzugte Ausführungsformen derselben speziell dargestellt und beschrieben, jedoch erkennt der Fachmann daran Änderung hinsichtlich der Form und Einzelheiten vorgenommen werden können, ohne vom Schutzumfang der durch die beigefügten Ansprüche definierten Erfindung abzuweichen.
  • Übersetzung der alphabetisch geordneten Figurenbeschriftung
    • Averaging//Mittelwertbildung
    • Buffer//Puffer
    • CN Averaging Period//CN-Mittelungsperiode
    • Comfort Noise Evaluation//Auswertung des Hintergrund-Beruhigungsrauschens
    • Controller//Steuerung
    • Distance Computation//Abstandsberechnung
    • End Of Speech Burst//Ende des Sprachbursts
    • Excitation Gain Calculation//Berechnung der Erregungsverstärkung
    • First 'Pause' Frame//erster 'Pausen'rahmen
    • Frame//Rahmen
    • Frames To RSS//Rahmen zu RSS
    • Frame Type//Rahmentyp
    • Frequency//Frequenz
    • Gain//Verstärkung
    • Hangover Period//Überhangsperiode
    • Improved CN Excitation Generator//verbesserter CN-Erregungsgenerator
    • Keypad//Tastatur
    • Last 'Speech' Frame//letzter 'Sprach'rahmen
    • LPC-Analysis//LPC-Analyse
    • Median Replacement//Mediansersetzung
    • Memory//Speicher
    • Microphone//Mikrofon
    • New (Updated) CN Parameters//neue (aktualisierte) CN-Parameter
    • New (Updated) SID//neue (aktualisierte) SID
    • Ordering//Erstellen einer Reihenfolge
    • Prior Art//Stand der Technik
    • Receiver//Empfänger
    • Regenerator//Regenierungseinrichtung
    • Repeat Previous CN Parameters//vorige CN-Parameter wiederholen
    • Repeat Previous SID//vorige SID wiederholen
    • RE Spectrum Control Filter//RE-Spektrumskontrollfilter
    • RX DTX Handler//Empfangs-DTX-Handler
    • SID Averaging Periods//SID-Mittelungsperioden
    • SID Memory//SID-Speicher
    • Speaker//Lautsprecher
    • Speech//Sprache
    • Speech Decoder//Sprachdecodierer
    • Speech Encoder//Sprachcodierer
    • Transmitter//Sender
    • TX DTX Handler//Sende-DTX-Handler
    • Voice Activity Detection//Erkennung von Sprachaktivität
    • Threshold//Schwellenwert

Claims (25)

  1. Verfahren zum Erzeugen von Hintergrund-Beruhigungsrauschen (CN) in einem digitalen Mobilterminal unter Verwendung diskontinuierlicher Übertragung, mit den folgenden Schritten: – Puffern, in Reaktion auf eine Sprechpause, eines Satzes von Sprachcodierparametern; – Ersetzen, innerhalb einer Mittelungsperiode, von Sprachcodierparametern des Satzes, die nicht für Hintergrundrauschen repräsentativ sind, durch Sprachcodierparameter, die für Hintergrundrauschen repräsentativ sind; und – Mitteln des Satzes von Sprachcodierparametern.
  2. Verfahren nach Anspruch 1, bei dem der Ersetzungsschritt die folgenden Schritte beinhaltet: – Messen von Abständen der Sprachcodierparameter voneinander zwischen einzelnen Rahmen innerhalb der Mittelungsperiode; – Identifizieren derjenigen Sprachcodierparameter mit den größten Abständen zu den anderen Parametern innerhalb der Mittelungsperiode; und – Ersetzen, wenn die Abstände einen vorbestimmten Schwellenwert überschreiten, eines identifizierten Sprachcodierparameters durch denjenigen mit dem kleinsten gemessenen Abstand zu den anderen Sprachcodierparametern innerhalb der Mittelungsperiode.
  3. Verfahren nach Anspruch 1, bei dem der Ersetzungsschritt die folgenden Schritte beinhaltet: – Messen von Abständen der Sprachcodierparameter voneinander zwischen einzelnen Rahmen innerhalb der Mittelungsperiode; – Identifizieren derjenigen Sprachcodierparameter mit den größten Abständen zu den anderen Parametern innerhalb der Mittelungsperiode; und – Ersetzen, wenn die Abstände einen vorbestimmten Schwellenwert überschreiten, eines identifizierten Sprachcodierparameters durch einen Sprachcodierparameter durch den Medianswert.
  4. Verfahren nach Anspruch 1, bei dem der Mittelungsschritt einen Schritt des Berechnens einer mittleren Erregungsverstärkung gmean und mittlerer Kurzzeit-Spektralkoeffizienten fmean(i) beinhaltet.
  5. Verfahren nach Anspruch 1, bei dem der Ersetzungsschritt die folgenden Schritte beinhaltet: – Erzeugen eines Satzes gepufferter Erregungsverstärkungswerte über die Mittelungsperiode; – Ordnen des Satzes gepufferter Erregungsverstärkungswerte; und – Ausführen einer Mediansersetzungsoperation, bei der diejenigen L Erregungsverstärkungswerte, die sich am meisten vom Medianswert unterscheiden, wobei die Differenz einen vorbestimmten Schwellenwert überschreitet, durch den Medianswert des Satzes ersetzt werden.
  6. Verfahren nach Anspruch 5, bei dem die Länge N der Mittelungsperiode eine ungerade Zahl ist und der Median des geordneten Satzes das Element ((N + 1)/2) des Satzes ist.
  7. Verfahren nach Anspruch 1, ferner mit dem folgenden Schritt: – Erzeugen eines Satzes gepufferter LSP(Line Spectral Pair)-Koeffizienten f(k), k = 1, ..., M über die Mittelungsperiode; und – Bestimmen des spektralen Abstands der LSP-Koeffizienten fi(k) des Rahmens i in der Mittelungsperiode zu den LSP-Koeffizienten fj(k) des Rahmens j in der Mittelungsperiode.
  8. Verfahren nach Anspruch 7, bei dem der Schritt des Bestimmens des spektralen Abstands gemäß der folgenden Gleichung ausgeführt wird:
    Figure 00510001
    wobei M der Grad des LPC-Modells ist und fi(k) der k-te LSP-Parameter des Rahmens i in der Mittelungsperiode ist.
  9. Verfahren nach Anspruch 7, ferner mit dem Schritt des Bestimmens des spektralen Abstands ΔSi der LSP-Koeffizienten fi(k) des Rahmens i zu den LSP-Koeffizienten aller anderen Rahmen j = 1, ..., N, i ≠ j, innerhalb der Mittelungsperiode der Länge N.
  10. Verfahren nach Anspruch 9, bei dem der Schritt des Bestimmens des spektralen Abstands dadurch ausgeführt wird, dass die Summe der spektralen Abstände ΔRij gemäß
    Figure 00510002
    für alle i = 1, ..., N erfolgt.
  11. Verfahren nach Anspruch 9, ferner mit dem folgenden Schritt: – Ordnen, nachdem die spektralen Abstände ΔSi für jeden der LSP-Vektoren fi innerhalb der Mittelungsperiode aufgefunden wurden, derselben entsprechend ihren Werten; – Verwenden des Vektors fi mit dem kleinsten Abstand ΔSi innerhalb der Mittelungsperiode i = 1, 2, ..., N als Mediansvektor fmed der Mittelungsperiode mit einem als ΔSmed bezeichneten Abstand; und – Ausführen einer Mediansersetzung von P (0 ≤ P ≤ N1 – 1) LSP-Vektoren fj durch den Mediansvektor fmed.
  12. Verfahren nach Anspruch 2, bei dem die Schritte des Identifizierens und Ersetzens für Erregungsverstärkungswerte g und LSP(Line Spectral Pair)-Vektoren fi unabhängig ausgeführt werden.
  13. Verfahren nach Anspruch 2, bei dem die Schritte des Identifizierens und Ersetzens für Erregungsverstärkungswerte g und LSP (LIne Spectral Pair)-Vektor fi miteinander kombiniert werden.
  14. Verfahren nach Anspruch 13, mit dem folgenden Schritt: – Ersetzen, in Reaktion auf die Ermittlung, dass die Sprachcodierparameter in einem individuellen Rahmen durch Medianswerte der Parameter zu ersetzen sind, sowohl des Erregungsverstärkungswerts g als auch des LSP-Vektors fi dieses Rahmens durch die jeweiligen Parameter des Rahmens, der die Mediansparameter enthält.
  15. Verfahren nach Anspruch 14, mit den folgenden Anfangsschritten: – Bestimmen des Abstands ΔTij zwischen den Parametern des Rahmens i und des Rahmens j der Mittelungsperiode gemäß dem folgenden Ausdruck
    Figure 00520001
    wobei M der Grad des LPC-Modells ist, fi(k) der k-te LSP-Parameter des Rahmens i der Mittelungsperiode ist und gi der Erregungsverstärkungswert des Rahmens i ist.
  16. Verfahren nach Anspruch 15, ferner mit dem folgenden Schritt: – Bestimmen des Abstands ΔSi der Sprachcodierparameter des Rahmens i für alle i – 1, ..., N mit den Sprachcodierparametern aller anderen Rahmen j = 1, ..., N, i ≠ j, innerhalb der Mittelungsperiode der Länge N gemäß
    Figure 00530001
    für alle i = 1, ..., N.
  17. Verfahren nach Anspruch 16, ferner mit den folgenden Schritten nach dem Bestimmen der Abstände ΔSi für jeden der Rahmen innerhalb der Mittelungsperiode: – Ordnen der Abstände entsprechend ihren Werten und – Verwenden des Rahmens mit dem kleinsten Abstand ΔSi innerhalb der Mittelungsperiode i = 1, 2, ..., N als Mediansrahmen, mit dem Abstand ΔSmed der Mittelungsperiode, wobei der Mediansrahmen über Sprachcodierparameter gmed und fmed verfügt.
  18. Verfahren nach Anspruch 17, mit dem Schritt des Ausführens einer Mediansersetzung an den Sprachcodierparameter-Rahmen innerhalb der Mittelungsperiode i = 1, 2, ..., N, wobei die Parameter gi und fi von L(0 ≤ L ≤ N – 1) Rahmen durch die Parameter gmed und fmed des Mediansrahmens ersetzt werden.
  19. Verfahren nach Anspruch 17, bei dem die Abstände zwischen jedem individuellen Abstand und dem Mediansabstand dadurch bestimmt werden, dass ein individueller Abstand gemäß ΔSi/ΔSmed durch den Mediansabstand geteilt wird.
  20. Verfahren nach Anspruch 11, bei dem die Abstände zwischen jedem individuellen Abstand und dem Mediansabstand dadurch bestimmt werden, dass ein individueller Abstand gemäß ΔSi/ΔSmed durch den Mediansabstand geteilt wird.
  21. Vorrichtung zum Erzeugen von Hintergrund-Beruhigungsrauschen (CN) in einem System mit einem digitalen Mobilterminal unter Verwendung diskontinuierlicher Übertragung an ein Netzwerk, mit: – einer Datenverarbeitungseinrichtung im digitalen Mobilterminal, die auf eine Sprechpause reagiert, um einen Satz von Sprachcodierparametern zu puffern und um, innerhalb einer Mittelungsperiode, Sprachcodierparameter des Satzes, die nicht für Hintergrundrauschen repräsentativ sind, durch Sprachcodierparameter zu ersetzen, die für Hintergrundrauschen repräsentativ sind, wobei die Datenverarbeitungseinrichtung den Satz von Sprachco dierparametern mittelt und den gemittelten Satz von Sprachcodierparametern an das Netzwerk überträgt.
  22. Vorrichtung nach Anspruch 21, bei der der Datenprozessor Sprachcodierparameter des Satzes durch Ordnen des Satzes und durch Messen der Abstände der Sprachcodierparameter voneinander zwischen individuellen Rahmen innerhalb der Mittelungsperiode ersetzt, wobei diejenigen Sprachcodierparameter identifiziert werden, die innerhalb der Mittelungsperiode die größten Abstände zu den anderen Parametern zeigen; und wobei, wenn die Abstände einen vorbestimmten Schwellenwert überschreiten, die identifizierten Sprachcodierparameter durch denjenigen Sprachcodierparameter ersetzt werden, der innerhalb der Mittelungsperiode den kleinsten gemessenen Abstand zu den anderen Sprachcodierparametern aufweist.
  23. Vorrichtung nach Anspruch 21, bei der der Datenprozessor Sprachcodierparameter des Satzes dadurch ersetzt, dass er den Satz ordnet und Abstände der Sprachcodierparameter voneinander zwischen individuellen Rahmen innerhalb der Mittelungsperiode misst; wobei diejenigen Sprachcodierparameter identifiziert werden, die innerhalb der Mittelungsperiode die größten Abstände zu den anderen Parametern aufweisen; und wobei, wenn die Abstände einen vorbestimmten Schwellenwert überschreiten, ein identifizierter Sprachcodierparameter durch einen solchen mit einem Medianswert ersetzt wird.
  24. Vorrichtung nach Anspruch 21, bei der die Datenverarbeitungseinrichtung Sprachcodierparameter für Erregungsverstärkungswerte g und einen LSP(-Line Spectral Pair)-Vektor fi unabhängig identifiziert und ersetzt.
  25. Vorrichtung nach Anspruch 21, bei der die Datenverarbeitungseinrichtung Sprachcodierparameter für Erregungsverstärkungswerte g und einen LSP(-Line Spectral Pair)-Vektor fi gemeinsam identifiziert und ersetzt.
DE69724739T 1996-11-15 1997-11-14 Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung Expired - Lifetime DE69724739T2 (de)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US3104796P 1996-11-15 1996-11-15
US31047P 1996-11-15
US3132196P 1996-11-19 1996-11-19
US31321P 1996-11-19
US965303 1997-11-06
US08/965,303 US5960389A (en) 1996-11-15 1997-11-06 Methods for generating comfort noise during discontinuous transmission

Publications (2)

Publication Number Publication Date
DE69724739D1 DE69724739D1 (de) 2003-10-16
DE69724739T2 true DE69724739T2 (de) 2004-07-22

Family

ID=27363777

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69724739T Expired - Lifetime DE69724739T2 (de) 1996-11-15 1997-11-14 Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung

Country Status (8)

Country Link
US (2) US5960389A (de)
EP (1) EP0843301B1 (de)
CN (1) CN100350807C (de)
AR (1) AR010612A1 (de)
AT (1) ATE249671T1 (de)
BR (1) BR9705747B1 (de)
DE (1) DE69724739T2 (de)
ES (1) ES2206667T3 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004063290A1 (de) * 2004-12-29 2006-07-13 Siemens Ag Verfahren zur Anpassung von Comfort Noise Generation Parametern

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
FI104872B (fi) * 1997-04-11 2000-04-14 Nokia Networks Oy Menetelmä matkaviestinjärjestelmän kuormituksen hallitsemiseksi
US6286122B1 (en) * 1997-07-03 2001-09-04 Nokia Mobile Phones Limited Method and apparatus for transmitting DTX—low state information from mobile station to base station
EP0925655A1 (de) * 1997-07-14 1999-06-30 Hughes Electronics Corporation Signalisierungswartung für diskontinuierliche nachrichtenübertragung
US6347081B1 (en) * 1997-08-25 2002-02-12 Telefonaktiebolaget L M Ericsson (Publ) Method for power reduced transmission of speech inactivity
US6269093B1 (en) * 1997-12-16 2001-07-31 Nokia Mobile Phones Limited Adaptive removal of disturbance in TDMA acoustic peripheral devices
FI116642B (fi) * 1998-02-09 2006-01-13 Nokia Corp Puheparametrien käsittelymenetelmä, puhekoodauksen käsittely-yksikkö ja verkkoelementti
TW376611B (en) 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6122531A (en) * 1998-07-31 2000-09-19 Motorola, Inc. Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6275798B1 (en) * 1998-09-16 2001-08-14 Telefonaktiebolaget L M Ericsson Speech coding with improved background noise reproduction
SE9803698L (sv) 1998-10-26 2000-04-27 Ericsson Telefon Ab L M Metoder och anordningar i ett telekommunikationssystem
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
EP1133886B1 (de) * 1998-11-24 2008-03-12 Telefonaktiebolaget LM Ericsson (publ) Effiziente inband-signalisierung für diskontinuierliche übertragung und konfigurationsänderungen in kommunikationssystemen mit adaptiver mehrfachrate
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
IL129752A (en) * 1999-05-04 2003-01-12 Eci Telecom Ltd Telecommunication method and system for using same
GB2350532B (en) * 1999-05-28 2001-08-08 Mitel Corp Method to generate telephone comfort noise during silence in a packetized voice communication system
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP4464484B2 (ja) * 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6782361B1 (en) 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
FI991605A (fi) * 1999-07-14 2001-01-15 Nokia Networks Oy Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti
JP3417362B2 (ja) * 1999-09-10 2003-06-16 日本電気株式会社 音声信号復号方法及び音声信号符号化復号方法
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6708024B1 (en) * 1999-09-22 2004-03-16 Legerity, Inc. Method and apparatus for generating comfort noise
JP3478209B2 (ja) * 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
GB2356538A (en) 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
AU777595B2 (en) * 2000-03-13 2004-10-21 Sony Corporation Content supplying apparatus and method, and recording medium
EP1139337A1 (de) * 2000-03-31 2001-10-04 Telefonaktiebolaget L M Ericsson (Publ) Verfahren zur Übertragung von Sprachinformationen und elektronische Fernmeldevorrichtung dafür
WO2001075863A1 (en) * 2000-03-31 2001-10-11 Telefonaktiebolaget Lm Ericsson (Publ) A method of transmitting voice information and an electronic communications device for transmission of voice information
DE10017646A1 (de) * 2000-04-08 2001-10-11 Alcatel Sa Geräuschunterdrückung im Zeitbereich
US7075907B1 (en) 2000-06-06 2006-07-11 Nokia Corporation Method for signalling DTX periods and allocation of new channels in a statistical multiplexed radio interface
US7146176B2 (en) 2000-06-13 2006-12-05 Shared Spectrum Company System and method for reuse of communications spectrum for fixed and mobile applications with efficient method to mitigate interference
JP3670217B2 (ja) * 2000-09-06 2005-07-13 国立大学法人名古屋大学 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
US6829577B1 (en) * 2000-11-03 2004-12-07 International Business Machines Corporation Generating non-stationary additive noise for addition to synthesized speech
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US7505594B2 (en) * 2000-12-19 2009-03-17 Qualcomm Incorporated Discontinuous transmission (DTX) controller system and method
US7012901B2 (en) * 2001-02-28 2006-03-14 Cisco Systems, Inc. Devices, software and methods for generating aggregate comfort noise in teleconferencing over VoIP networks
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US20020198708A1 (en) * 2001-06-21 2002-12-26 Zak Robert A. Vocoder for a mobile terminal using discontinuous transmission
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US7177801B2 (en) * 2001-12-21 2007-02-13 Texas Instruments Incorporated Speech transfer over packet networks using very low digital data bandwidths
GB2384946B (en) 2002-01-31 2005-11-09 Samsung Electronics Co Ltd Communications terminal
ATE322732T1 (de) * 2002-07-02 2006-04-15 Teltronic S A U Verfahren zur erzeugung von komfortgeräusch- rahmen (cnf)
ATE322733T1 (de) * 2002-07-02 2006-04-15 Teltronic S A U Verfahren zur synthese von komfortgeräusch-rahmen
KR100556831B1 (ko) * 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
US7243065B2 (en) * 2003-04-08 2007-07-10 Freescale Semiconductor, Inc Low-complexity comfort noise generator
US7379473B2 (en) * 2003-06-03 2008-05-27 Motorola, Inc. Method and system for providing integrated data services to increase spectrum efficiency
US7409010B2 (en) 2003-06-10 2008-08-05 Shared Spectrum Company Method and system for transmitting signals with reduced spurious emissions
US7570937B2 (en) * 2003-08-21 2009-08-04 Acoustic Technologies, Inc. Comfort noise generator
US20050078629A1 (en) * 2003-10-14 2005-04-14 Hao Bi Channel allocation extension in wireless communications networks and methods
US7465413B2 (en) * 2004-05-11 2008-12-16 Panasonic Corporation Phosphor and plasma display panel using the same
JP4698593B2 (ja) * 2004-07-20 2011-06-08 パナソニック株式会社 音声復号化装置および音声復号化方法
JPWO2006008932A1 (ja) * 2004-07-23 2008-05-01 松下電器産業株式会社 音声符号化装置および音声符号化方法
US7917356B2 (en) * 2004-09-16 2011-03-29 At&T Corporation Operating method for voice activity detection/silence suppression system
US8265929B2 (en) * 2004-12-08 2012-09-11 Electronics And Telecommunications Research Institute Embedded code-excited linear prediction speech coding and decoding apparatus and method
FR2881867A1 (fr) * 2005-02-04 2006-08-11 France Telecom Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole
WO2006104576A2 (en) * 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
DE602005010127D1 (de) * 2005-06-20 2008-11-13 Telecom Italia Spa Verfahren und vorrichtung zum senden von sprachdaten zu einer fernen einrichtung in einem verteilten spracherkennungssystem
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US20070136055A1 (en) * 2005-12-13 2007-06-14 Hetherington Phillip A System for data communication over voice band robust to noise
US7599430B1 (en) * 2006-02-10 2009-10-06 Xilinx, Inc. Fading channel modeling
US7831420B2 (en) * 2006-04-04 2010-11-09 Qualcomm Incorporated Voice modifier for speech processing systems
US8155649B2 (en) 2006-05-12 2012-04-10 Shared Spectrum Company Method and system for classifying communication signals in a dynamic spectrum access system
US8027249B2 (en) 2006-10-18 2011-09-27 Shared Spectrum Company Methods for using a detector to monitor and detect channel occupancy
US8184653B2 (en) * 2007-08-15 2012-05-22 Shared Spectrum Company Systems and methods for a cognitive radio having adaptable characteristics
US8997170B2 (en) * 2006-12-29 2015-03-31 Shared Spectrum Company Method and device for policy-based control of radio
US9538388B2 (en) 2006-05-12 2017-01-03 Shared Spectrum Company Method and system for dynamic spectrum access
US8055204B2 (en) 2007-08-15 2011-11-08 Shared Spectrum Company Methods for detecting and classifying signals transmitted over a radio frequency spectrum
US7564816B2 (en) * 2006-05-12 2009-07-21 Shared Spectrum Company Method and system for determining spectrum availability within a network
US8326313B2 (en) 2006-05-12 2012-12-04 Shared Spectrum Company Method and system for dynamic spectrum access using detection periods
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
EP3629328A1 (de) * 2007-03-05 2020-04-01 Telefonaktiebolaget LM Ericsson (publ) Verfahren und anordnung zur glättung von stationärem hintergrundrauschen
US20100106490A1 (en) * 2007-03-29 2010-04-29 Jonas Svedberg Method and Speech Encoder with Length Adjustment of DTX Hangover Period
US8412209B2 (en) 2007-06-18 2013-04-02 Motorola Mobility Llc Use of the physical uplink control channel in a 3rd generation partnership project communication system
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
CN101335003B (zh) * 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
US8600740B2 (en) * 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
DE102008009719A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN100550133C (zh) * 2008-03-20 2009-10-14 华为技术有限公司 一种语音信号处理方法及装置
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
ES2642906T3 (es) * 2008-07-11 2017-11-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
US8818283B2 (en) 2008-08-19 2014-08-26 Shared Spectrum Company Method and system for dynamic spectrum access using specialty detectors and improved networking
US8688045B2 (en) * 2008-11-19 2014-04-01 Qualcomm Incorporated FM transmitter and non-FM receiver integrated on single chip
BR112013020587B1 (pt) 2011-02-14 2021-03-09 Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral
ES2681429T3 (es) * 2011-02-14 2018-09-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de ruido en códecs de audio
PT2866228T (pt) * 2011-02-14 2016-08-31 Fraunhofer Ges Forschung Descodificador de áudio que compreende um estimador de ruído de fundo
EP2676270B1 (de) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines teils eines audiosignals anhand einer transientendetektion und eines qualitätsergebnisses
JP5969513B2 (ja) * 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
WO2012110415A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
WO2012110478A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
EP2676265B1 (de) 2011-02-14 2019-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zum codieren eines audiosignals unter verwendung eines ausgerichteten look-ahead-teils
JP6019969B2 (ja) * 2011-11-22 2016-11-02 ヤマハ株式会社 音響処理装置
EP2927905B1 (de) 2012-09-11 2017-07-12 Telefonaktiebolaget LM Ericsson (publ) Erzeugung angenehmer geräusche
CN106169297B (zh) * 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
CN104978970B (zh) * 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统
US9666204B2 (en) 2014-04-30 2017-05-30 Qualcomm Incorporated Voice profile management and speech signal generation
US9775110B2 (en) * 2014-05-30 2017-09-26 Apple Inc. Power save for volte during silence periods
EP2980790A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Komfortgeräuscherzeugungs-Modusauswahl
EP2980796A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zur Verarbeitung eines Audiosignals, Audiodecodierer und Audiocodierer
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
US10332520B2 (en) 2017-02-13 2019-06-25 Qualcomm Incorporated Enhanced speech generation
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods
US10855841B1 (en) * 2019-10-24 2020-12-01 Qualcomm Incorporated Selective call notification for a communication device

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
FI99066C (fi) * 1995-01-31 1997-09-25 Nokia Mobile Phones Ltd Tiedonsiirtomenetelmä
SE9500858L (sv) * 1995-03-10 1996-09-11 Ericsson Telefon Ab L M Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning
WO1996034382A1 (en) * 1995-04-28 1996-10-31 Northern Telecom Limited Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
FR2739995B1 (fr) 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US5794199A (en) 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004063290A1 (de) * 2004-12-29 2006-07-13 Siemens Ag Verfahren zur Anpassung von Comfort Noise Generation Parametern

Also Published As

Publication number Publication date
ES2206667T3 (es) 2004-05-16
AR010612A1 (es) 2000-06-28
US6606593B1 (en) 2003-08-12
CN100350807C (zh) 2007-11-21
BR9705747A (pt) 1999-03-30
DE69724739D1 (de) 2003-10-16
BR9705747B1 (pt) 2011-11-01
EP0843301B1 (de) 2003-09-10
US5960389A (en) 1999-09-28
CN1200000A (zh) 1998-11-25
ATE249671T1 (de) 2003-09-15
EP0843301A3 (de) 1999-05-06
EP0843301A2 (de) 1998-05-20

Similar Documents

Publication Publication Date Title
DE69724739T2 (de) Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung
DE69727895T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE19617630B4 (de) Verfahren zum Herleiten der Nachwirkperiode in einem Sprachdecodierer bei diskontinuierlicher Übertragung, sowie Sprachcodierer und Sender-Empfänger
DE60124274T2 (de) Codebuchstruktur und suchverfahren für die sprachkodierung
DE69535723T2 (de) Verfahren und vorrichtung zur sprachkodierung mit reduzierter, variabler bitrate
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE69534285T3 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE60032797T2 (de) Geräuschunterdrückung
DE60029147T2 (de) Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
DE69814517T2 (de) Sprachkodierung
DE69915830T2 (de) Verbesserte verfahren zur rückgewinnung verlorener datenrahmen für ein lpc-basiertes, parametrisches sprachkodierungsystem.
DE60120734T2 (de) Vorrichtung zur erweiterung der bandbreite eines audiosignals
DE60128677T2 (de) Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
DE69926821T2 (de) Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
DE69910058T2 (de) Verbesserung der periodizität eines breitbandsignals
DE69917677T2 (de) SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT
DE10041512B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE60129544T2 (de) Kompensationsverfahren bei rahmenauslöschung in einem sprachkodierer mit veränderlicher datenrate
DE60220485T2 (de) Verfahren und Vorrichtung zur Verschleierung von Rahmenausfall von prädiktionskodierter Sprache unter Verwendung von Extrapolation der Wellenform
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
DE69925168T2 (de) Erkennung der aktivität komplexer signale für verbesserte sprach-/rauschklassifizierung von einem audiosignal
DE60117144T2 (de) Sprachübertragungssystem und verfahren zur behandlung verlorener datenrahmen
DE60012760T2 (de) Multimodaler sprachkodierer
DE60128711T2 (de) Mehrkanal-signalcodierung und -decodierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: BECKER, KURIG, STRAUS, 80336 MUENCHEN