DE69621613T2 - Anordnung und verfahren zur sprachübertragung und eine derartige anordnung enthaltende fernsprechanlage - Google Patents

Anordnung und verfahren zur sprachübertragung und eine derartige anordnung enthaltende fernsprechanlage

Info

Publication number
DE69621613T2
DE69621613T2 DE69621613T DE69621613T DE69621613T2 DE 69621613 T2 DE69621613 T2 DE 69621613T2 DE 69621613 T DE69621613 T DE 69621613T DE 69621613 T DE69621613 T DE 69621613T DE 69621613 T2 DE69621613 T2 DE 69621613T2
Authority
DE
Germany
Prior art keywords
frames
speech
frame
lost
background noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69621613T
Other languages
English (en)
Other versions
DE69621613D1 (de
Inventor
Johan Andersson
Peter Galyas
Per Hallkvist
Stefan Jung
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of DE69621613D1 publication Critical patent/DE69621613D1/de
Publication of DE69621613T2 publication Critical patent/DE69621613T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Anordnung und ein Verfahren für ein Sprachübertragungssystem, in dem die übertragenen Signale in eine Rahmenstruktur eingeteilt werden. Die Erfindung betrifft ferner Telekommunikationssysteme, die eine die Sprachübertragung betreffende Anordnung umfassen.
  • In digitalen Telekommunikationssystemen wird beinahe immer eine Rahmenstruktur verwendet und die Sprache wird in Sprach- (Verkehrs-)Rahmen übertragen. Ein Rahmen betrifft hier einen Informationsblock, der eine vorgegebene Anzahl digitaler Informations-Bits aufweist. Bei Sprachübertragung gibt es keine geradlinige Lösung, da einerseits Sprache und Hintergrundrauschen vorhanden sein kann, die sich stark ändern können, und andererseits ein Sprecher, ein Mensch, normalerweise nicht ununterbrochen spricht, sondern dann und wann Pausen macht und still ist. Des weiteren können Rahmen oder Sprachrahmen schlecht sein, d. h., sie können verlorengegangen sein oder sie können während der Übertragung beschädigt worden sein.
  • Wenn ein übertragener Rahmen von schlechter Qualität ist oder verlorengegangen ist, wird er im allgemeinen ersetzt, da ein normales Decodieren solcher Rahmen Rauscheffekte hervorbringt, die sehr störend für einen Zuhörer sind.
  • Die GSM Recommendations GSM 06.11, October 1992, "Substitution and Muting of Lost Frames for Full-Rate Speech Channels" betreffen die Stummschaltung, wenn die Full-Rate- Sprachcodierung angewendet wird, d. h., sie geben vor, dass von der Empfangsseite her eine Rahmenersatz- und Stummschaltungsprozedur angewendet wird, wenn eine oder mehrere verlorengegangene Sprachrahmen oder SID-Rahmen empfangen werden.
  • Wenn Sprachrahmen verlorengegangen sind, wird die Sprachlautstärke verringert. Es ist eine Stummschaltungstechnik offenbart, mit deren Hilfe der Ausgabepegel allmählich herabgesetzt wird, wodurch nach maximal 320 ms das Ausgangssignal still ist. Das bedeutet, dass nach maximal 320 ms Stille empfangen wird, was sich als sehr störend auswirken kann, da es sich um einen abrupten Wechsel von Sprache plus Hintergrundgeräusch zu Stille handelt. Oft wird in der Praxis ein Zeitraum verwendet, der kürzer als 320 ms ist, was noch störender sein kann.
  • Wenn eine Toninformation sowohl Sprache als auch Hintergrundgeräusch enthält, führt eine Stummschaltung in Richtung Stille zu einem unangenehmen Knistern. Somit schnellt in einer Reihe bekannter Stummschaltungsalgorithmen, die bei gestörten Sprachcodierungsparametern angewandt werden, das Hintergrundgeräusch zur Stille hinunter, und das kann mehr als einmal in der Sekunde vorkommen. Des weiteren werden in bekannten Lösungen nicht solche Situationen berücksichtigt, in denen Hintergrundgeräusche, wie beispielsweise Stimmengewirr, Autogeräusche etc., vorhanden sind, wobei es sich aber um Fälle realistischen Verkehrs handelt.
  • Ein Problem der Sprachübertragung ist es, dass die Schallinformation (Ton) Sprache oder Hintergrundgeräusch enthalten kann oder Sprache und Hintergrundgeräusch gemischt enthalten kann. Im letzteren Falle und wenn eine Stummschaltung zur Stille hin erfolgt, wenn Rahmen verlorengegangen sind oder während der Übertragung beschädigt worden sind, wird ein unangenehmes Knistern induziert. Der Grund hierfür ist der Wechsel zwischen vollständiger Stille und Sprache oder Geräusch.
  • Aufgabe der vorliegenden Erfindung ist es, eine Anordnung bzw. ein Verfahren für ein Sprachübertragungssystem anzugeben, in dem die unangenehmen Effekte, die durch während der Übertragung verlorengegangene oder beschädigte Rahmen entstanden sind, auf ein Minimum reduziert sind.
  • Es ist insbesondere eine Aufgabe der Erfindung, eine Anordnung bzw. ein Verfahren anzugeben, durch die die unangenehmen Effekte minimiert oder vermieden werden können, wenn zwei oder mehr aufeinanderfolgende Sprachrahmen verlorengegangen sind.
  • Es ist eine weitere Aufgabe der vorliegenden Erfindung, eine Anordnung bzw. ein Verfahren anzugeben, die verwendet bzw. das unabhängig davon eingesetzt werden kann, ob die Übertragung diskontinuierlich oder kontinuierlich erfolgt.
  • Es ist allgemein eine Aufgabe der Erfindung, eine Anordnung bzw. ein Verfahren anzugeben, die/das flexibel ist, in unterschiedlichen Systemen mit unterschiedlichen Anforderungen in Bezug auf Energieeinsparung etc. verwendet werden kann und zuverlässig und effizient ist und einfach angewendet werden kann.
  • Es ist ferner eine Aufgabe der vorliegenden Erfindung, ein Telekommunikationssystem anzugeben, das eine Anordnung in einem Sprachübertragungssystem umfaßt, das die obengenannten Aufgaben erfüllt.
  • Diese und weitere Aufgaben werden mit Anordnungen und mit einem Verfahren gemäß den kennzeichnenden Teilen der Ansprüche 1, 10 bzw. 11 erzielt.
  • Auf der Empfangsseite muß mindestens ein Hintergrundgeräuschrahmen verfügbar sein. In einer speziellen Ausführungsform wird die DTX-Funktion (unterbrochene Übertragung) (beschrieben in: GSM Recommendations GSM 06.31, "Discontinuous Transmission (DTX) for Full-Rate Speech Channels") angewendet und SID-Rahmen werden verwendet, die von der DTX-Funktion vorgegeben werden, die am Übertragungsende erzeugt werden.
  • In einer weiteren Ausführungsform werden SID-Rahmen am Übertragungsende erzeugt und in Perioden übertragen, in denen keine Sprache vorhanden ist, obwohl kein DTX verwendet wird. In einer weiteren Ausführungsform werden Rahmen auf der Empfangsseite erzeugt, die Hintergrundgeräusch (z. B. SID- Rahmen) darstellen. In einer weiteren alternativen Ausführungsform ist ein Vorgabe-SID-Rahmen (Default-SID- Rahmen) auf der Empfangsseite verwendet, der verwendet wird, wenn DTX nicht aktiviert ist oder nicht verwendet wird.
  • Die Geräuscherzeugung erfolgt auf verschiedene Arten und wird als bekannt vorausgesetzt.
  • Auch das Anzeigemittel für schlechte Rahmen kann jedes geeignete Anzeigemittel für schlechte Rahmen sein.
  • In einer speziellen Ausführungsform der Erfindung wird das Problem behandelt, wenn gelegentlich Rahmen, die nicht schlecht sind, in Zeitintervallen erhalten werden, in denen die schlechten Rahmen überwiegen. Dann kann eine Änderung vom Rahmen für künstliches Geräusch zum Sprachrahmen mit voller Sprachlautstärke störend sein.
  • Daher schlägt die vorliegende Erfindung Lösungen vor, in denen ein Abfallen oder ein Abfallen und ein Ansteigen oder nur ein Ansteigen vorgesehen ist.
  • Im letzteren Fall steht für eine Sprachübertragung eine Anordnung zur Verfügung, in der Signale in eine Rahmenstruktur eingeteilt werden, die ein Mittel zur Erfassung, ob ein Signal Sprachinformationen enthält, und ein Mittel zur Erfassung aufweist, ob Rahmen schlecht sind oder nicht. Wenn ein Sprachrahmen korrekt bzw. richtig empfangen wurde, wird untersucht, ob eine vorgegebene Anzahl von Rahmen schlecht ist, die direkt vor dem empfangenen Rahmen liegen, und wenn das so ist, werden die korrekt empfangenen Sprachrahmen durch einen Rahmen ersetzt, der eine Kombination von Hintergrundgeräusch und einem richtig empfangenen Sprachrahmen darstellt.
  • Wenn insbesondere einer vorgegebenen Anzahl aufeinanderfolgender nicht schlechter Rahmen eine vorgegebene Anzahl schlechter Rahmen vorausging, werden die nicht schlechten Rahmen durch Rahmen ersetzt, die Kombinationen von Sprachrahmen und Hintergrundgeräuschrahmen sind, um sich allmählich der Sprache anzunähern.
  • Besondere Ausführungsformen der Erfindung betreffen das GSM- System. Für diese Ausführungsformen finden die GSM Recommendations Anwendung, auf die in der Anmeldung Bezug genommen ist, und geben eine Reihe von Funktonen etc. vor.
  • Wenn von einer Empfangsseite bzw. einer Übertragungsseite beispielsweise in einem mobilen Kommunikationssystem die Rede ist, kann es sich beispielsweise um eine Funkbasisstation sowohl als Sender, der an eine mobile Station sendet (eine Abwärtsstrecken- bzw. Downlink-Verbindung), als auch um eine Funkbasisstation als Empfangsanordnung handeln, wobei eine mobile Station die Sendeanordnung (eine Aufwärtsstrecken- bzw. Uplink-Verbindung) ist.
  • Es ist ein Vorteil der Erfindung, dass, wenn Rahmen während der Übertragung verloren gehen oder beschädigt werden, die daraus resultierenden Auswirkungen gegenüber den bisher bekannten Systemen wesentlich verringert werden.
  • Die große Flexibilität bei der Anwendbarkeit der Erfindung ist ebenfalls ein großer Vorteil und sie kann generell in jedem digitalen Telekommunikationssystem für die Sprachübertragung eingesetzt werden. Die Erfindung ist hauptsächlich auf digitale Systeme konzentriert, die auf Rahmenstrukturen beruhen, wie im Stand der Technik ausgeführt ist.
  • Die Erfindung kann aber auch in analogen Systemen eingesetzt werden, wofür allerdings zusätzliche Installationen erforderlich sind, wie in der detaillierten Beschreibung der Erfindung beschrieben ist.
  • Die Erfindung ist im folgenden in einer nicht einschränkenden Art und Weise unter Bezug auf die begleitenden Zeichnungen beschrieben, in denen zeigen:
  • Fig. 1 ein Blockdiagramm, das die Übertragungsseite in einer ersten Ausführungsform der Erfindung illustriert;
  • Fig. 2 ein Blockdiagramm, das die Empfangsseite gemäß der ersten Ausführungsform von Fig. 1 zeigt;
  • Fig. 3 ein Flussdiagramm der erfindungsgemäßen Stummschaltung;
  • Fig. 4 eine Tabelle, die die Stummschaltungsprozedur im Einzelnen beschreibt;
  • Fig. 5 eine weitere Ausführungsform der Erfindung, in der angenommen ist, dass SID-Rahmen nicht übertragen werden sollen, und
  • Fig. 6 die Anwendung der Erfindung auf ein analoges System;
  • Fig. 7 ein Flussdiagramm wie in Fig. 3, das sich auf eine alternative Ausführungsform der Erfindung bezieht, die einen stufenweisen Anstieg umfaßt;
  • Fig. 8 eine alternative Ausführungsform, die ebenfalls einen stufenweisen Anstieg betrifft.
  • Die Erfindung wird zunächst weiter in Bezug auf die Full- Rate-Sprachcodierungseinrichtung des GSM-Systems beschrieben, wobei anzumerken ist, dass sich die Erfindung keineswegs hierauf beschränkt. In einer alternativen Ausführungsform (die nicht näher beschrieben ist) wird eine Halb-Rate-Sprach- Umcodierung auf Halb-Rate-Sprachkanälen angewandt. Die Anordnung umfaßt ein Mittel zur Erfassung, ob eine Sprechaktivität vorhanden ist oder nicht, d. h. Rahmen, die Sprache enthalten, werden von Rahmen unterschieden, die Sprechpausen oder nur Hintergrundgeräusch enthalten. Diese Sprechaktivitätserkennungs-Einrichtungen werden generell Sprechaktivitäts-Detektor VAD (voice activity detector) genannt. Der VAD-Algorithmus ist in den GSM Recommendations GSM 06.32, "Voice Activity Detection" definiert.
  • Im folgenden ist eine erste Ausführungsform unter Bezug auf Fig. 1 beschrieben, die sich auf das GSM-System bezieht, das in einem diskontinuierlichen Modus arbeitet, der in den GSM Recommendations GSM 06.31, "Discontinuous Transmission (DTX)for Full-Rate Speech Traffic Channels" definiert ist. Die diskontinuierliche Übertragung DTX ist ein Mechanismus der es ermöglicht, dass ein Funksender die meiste Zeit ausgeschaltet ist, wenn keine Sprache vorhanden ist, d. h. während der Sprechpausen. Es gibt zwei Gründe dafür, nämlich, Strom zu sparen und den Gesamtstörpegel in der Atmosphäre zu verringern. Dann wird das Hintergrundgeräusch durch einen Algorithums geschätzt, indem die Sprachparameter in vier aufeinanderfolgenden Sprachrahmen gemittelt werden, und ein Sprachaktivitäts-Detektor (VAD), wie oben beschrieben, bestimmt, ob ein ankommendes Signal Sprachinformation enthält oder nicht.
  • In den Zeiten, in denen der Sprachaktivitäts-Detektor keine Sprache anzeigt, wird in regelmäßigen Zeitintervallen ein SID-Rahmen gesendet. In den Zeiten zwischen diesen Aktualisierungen kann der Sender abgeschaltet werden.
  • Das GSM-System offenbart einen Full-Rate- Sprachcodierungsalgorithmus, der eine Kompression der ankommenden Sprachbeispiele durchführt und die Bitrate um etwa 90% reduziert.
  • Die GSM-Full-Rate-Sprachcodierung ist in den GSM Recommendations 06.10, Januar 1990, "GSM Full-Rate Speech Transcoding" beschrieben. Wenn diese jedoch generell angewendet wird, ist der Sprachkanal weniger robust gegenüber induzierten Bitfehlern.
  • Fig. 1 zeigt die Senderseite. Die Sprache der ankommenden Sprachbeispiele wird codiert, um die Bitrate zu reduzieren. In jeder Sekunde wird vom Sprachencoder eine vorgegebene Anzahl von Sprachrahmen ausgegeben.
  • Der Sprechaktivitätsdetektor weist ein Ausgangssignal-VAD- Flag auf, das angibt, ob der vorliegende Rahmen Sprachinformation enthält oder nicht.
  • Wenn eine Anzahl aufeinanderfolgender Rahmen erfasst wurde, die keine Sprachinformation enthalten, berechnet ein SID- Rahmengenerator einen SID-Rahmen auf der Grundlage des gegenwärtigen Rahmens und einer vorgegebenen Anzahl alter Rahmen. In Zeiträumen ohne Sprachaktivität können auf der Empfangsseite SID-Rahmen verwendet werden, um über einen längeren Zeitraum, als es einem gewöhnlichen Sprachrahmen entspricht, Hintergrundgeräusch zu erzeugen.
  • Durch den SID-Rahmengenerator SFG werden die Kennwerte des Hintergrundgeräuschs in Fällen ohne Sprache gemessen und ein SID-Rahmen (der Parameter enthält, die Hintergrundgeräusch beschreiben) wird erzeugt;
  • Die DTX-Steuerung und der DTX-Betrieb weisen zwei Ausgangssignale auf. Informationsbits sind normalerweise die Sprachrahmen vom Sprachencoder, und das Flag "Sender Ein" wird auf wahr eingestellt.
  • Im Fall von mehreren Sprachrahmen, die mit "Kein VAD" markiert sind, d. h. mindestens so vielen, wie erforderlich sind, um einen SID-Rahmen auf der Grundlage der gerade mit "Kein VAD" markierten Rahmen zu erzeugen, werden die Informationsbits als die SID-Rahmen eingestellt.
  • In Zeiträumen, in denen die Informationsbits als SID-Rahmen eingestellt sind, wird mit Ausnahme einiger regelmäßiger Aktualisierungen das Flag "Sender Ein" auf "falsch" gesetzt.
  • Fig. 2 zeigt die Empfangsseite. Das erste Eingangssignal sind die von einem beschädigten Kanal erhaltenen Informationsbits. Das zweite Eingangssignal ist das Flag BFI (Anzeige Schlechter Rahmen), das von einer Kanaldecodierungs- oder Ausgleichsvorrichtung erhalten wurde, die die schlechten Rahmen markiert. Ein Rahmen kann aus zwei Gründen als schlecht markiert werden, nämlich aus dem einen Grunde, dass befürchtet wird, dass einige Informationsbits fehlerhaft sind, oder aus dem anderen Grunde, dass kein Rahmen erhalten wurde, weil möglicherweise der Sender abgeschaltet ist.
  • Es ist jedoch anzumerken, dass sich die vorliegende Erfindung nur auf Rahmen bezieht, die schlecht in dem Sinne sind, dass sie während der Übertragung verlorengegangen oder beschädigt worden sind. Die vorliegende Erfindung befasst sich also nicht mit einer gezielten Übertragung von Pausen infolge des Einsatzes einer DTX.
  • Die DTX-Steuerungs- und Betriebseinheit bestimmt, ob die erhaltenen Informationsbits einen SID-Rahmen oder einen Sprachrahmen enthalten.
  • In Falle eines Sprachrahmens handelt es sich um decodierte Sprache, die Sprachabtastwerte erzeugt. Im Falle eines SID- Rahmens erzeugt der Generator für künstliches Geräusch einen Rahmen, der Hintergrundgeräusch beschreibt.
  • Bei einem Rahmen mit BFI-Markierung stellt die Sprachrahmen- Ersatzeinheit einen Sprachrahmen, der dem Sprachdecoder gesendet wird, oder einen SID-Rahmen her, der dem Generator für künstliches Geräusch gesendet wird. Der erzeugte Rahmen beruht in diesem Falle auf (1) zuvor erhaltenen Sprachrahmen, (2) einem zuvor erhaltenen SID-Rahmen und (3) dem gegenwärtig empfangenen schlechten Rahmen.
  • Im folgenden ist die unterbrochene Übertragung (DTX) kurz beschrieben. Die DTX-Funktion benötigt einen Sprechaktivitäts-Detektor VAD auf der Senderseite, eine Bewertung des Hintergrundgeräuschs auf der Empfangsseite zur Übertragung charakteristischer Parameter zur Empfangsseite und die Erzeugung von künstlichem Geräusch ähnlich dem Geräusch auf der Empfangsseite, wenn die Funkübertragung ausgeschaltet ist.
  • Hierfür findet sich in den GSM Recommendations 06.31 eine weitere Beschreibung. Der DTX-Betriebsmodus gibt an, dass die Sender nur solange angeschaltet sind, als die Rahmen nützliche Informationen enthalten. Der DTX-Mechanismus ist in den DTX-Treibern sowohl auf der Senderseite als auch auf der Empfangsseite implementiert und umfaßt einen Sprechaktivitäts-Detektor auf der Senderseite, wie oben beschrieben, eine Einheit zur Auswertung des Hintergrundgeräuschs auf der Senderseite, um die charakteristischen Parameter zur Empfangsseite zu übertragen, und eine Einheit zur Erzeugung eines künstlichen Geräuschs auf der Empfangsseite in den Zeiträumen, in denen die Funkübertragung ausgeschaltet ist. Durch den Sprechaktivitäts-Detektor wird bestimmt, ob ein spezieller Block von 20 ms vom Sprachencoder Sprache enthält oder nicht. Infolge der Änderungen sowohl beim Geräuschpegel als auch beim Geräuschspektrum in einer mobilen Umgebung muß der Sprechaktivitäts-Detektor generell fortwährend darauf eingestellt werden. Der Sprechaktivitäts-Detektor ist ein Energiedetektor, in dem die Energie eines gefilterten Signals mit einem Schwellenwert verglichen und Sprache angezeigt wird, wenn der Schwellenwert überschritten wird.
  • Im folgenden ist die Einfügung von künstlichem Geräusch kurz beschrieben. Wenn eine Übertragung vonstatten geht, wird das Hintergrundgeräusch zusammen mit der Sprache übertragen. Ist ein Sprechzeitraum beendet, wird die Verbindung abgeschaltet und das empfundene Geräusch sinkt auf einen sehr niedrigen Pegel ab. Das würde eine stufenartige Modulation von Geräusch erzeugen, was als störend empfunden werden würde und auch die Präzision der Sprache verringern könnte, wenn das Ganze ohne Modifizierung einem Hörer präsentiert werden würde. Es wird Geräuschkontrasteffekt genannt und dieser wird durch die Einführung von künstlichem Geräusch am Empfangsende, wenn keine Sprache vorhanden ist, verringert. Die Parameter, die zur Erzeugung des künstlichen Geräuschs erforderlich sind, werden als Hintergrundgeräuschparameter, bevor die Übertragung abgeschaltet wird, und danach an vorgeplanten Stellen gesendet. Die Rahmen, die dieses Hintergrundgeräusch enthalten, sind die oben angegebenen SID-Rahmen. Das bezieht sich jedoch nicht auf Rahmen, die während der Übertragung verlorengegangen/beschädigt sind.
  • Sprachrahmen können aus verschiedenen Gründen verlorengehen oder schlecht sein. Es können zum Beispiel im Empfänger Rahmen durch Übertragungsfehler oder durch Rahmenstehlen für den FACCH (Fast Associated Control Channel) verloren gehen. Rahmen können auch bei der Übergabe bzw. dem Handover verlorengehen. Zur Verringerung der Folgen eines einzigen verlorenen Rahmens kann ein Schema verwendet werden, nach dem der verlorengegangene Sprachrahmen durch einen auf der Grundlage des früheren Rahmens vorhergesagten Rahmen ersetzt wird. Bei mehreren aufeinanderfolgenden verlorenengegangenen Rahmen muß jedoch eine Stummschaltung erfolgen. Vorteilhafte Verfahrensweisen hierzu werden nun im einzelnen beschrieben.
  • In der in den Fig. 1 und 2 illustrierten Ausführungsform, die sich auf den Fall einer Full-Rate-Umcodierung bezieht, kann die Ausgabe des Sprachdecodierers ein Block von 260 Bit alle 20 ms sein, was eine Bitrate von 13 kBit/s ergibt. Es kann ein bekanntes Codierungsschema, beispielsweise das in den GSM Recommendations 06.10 beschriebene, verwendet werden. Die codierte Sprache am Ausgang des Sprachencoders wird an die Kanalcodierungsfunktionen geliefert und es wird ein codierter Block erzeugt. Für den in Fig. 2 gezeigten Empfangsteil finden die entsprechenden umgekehrten Operationen statt.
  • Im folgenden ist die Stummschaltung bezüglich des Hintergrundgeräuschs im Einzelnen, bezogen auf den Stummschaltungsalgorithmus, beschrieben.
  • Fig. 3 zeigt ein Flußdiagramm des Stummschaltungsalgorithmus und die Wahl der Ausgabevorrichtung der Sprachabtastwerte. Es ist ein regelbarer "Zähler der schlechten Rahmen" (CBF) eingeführt. Die "Stummschaltungsperiode" MP ist eine Konstante, die mit der Länge in der in Fig. 4 gezeigten Stummschaltungstabelle gekoppelt ist.
  • Wenn ein Rahmen erhalten wird, zeigt die Anzeige für schlechte Rahmen an, ob es sich um einen schlechten Rahmen oder nicht handelt. Wenn die Einstellung erfolgt ist, dass es sich nicht um einen schlechten Rahmen handelt, wird die Anzahl der schlechten Rahmen, die erhalten wurde und mit der CBF-Zahl bezeichnet ist, zurückgesetzt auf 0 und der richtig erhaltene Sprachrahmen wird als Ausgangsdaten geliefert und es wird somit ein Sprachrahmen ausgegeben. Wenn andererseits die Anzeige für schlechte Rahmen anzeigt, dass der Rahmen schlecht ist, wird die Variable CBF, die die Anzahl der aufeinanderfolgenden schlechten Rahmen anzeigt, die erhalten worden sind, um 1 erhöht. Es wird dann geprüft, ob die Anzahl der aufeinanderfolgenden erhaltenen schlechten Rahmen (CBF) die Länge der Stummschaltungsperiode in Rahmen (MP) übersteigt. Die Länge der Stummschaltungsperiode MP ist eine gegebene Konstante, die die Anzahl der Rahmen anzeigt, bei denen eine Stummschaltung bewirkt werden soll. Wenn somit die Anzahl der aufeinanderfolgend erhaltenen schlechten Rahmen CBF die Länge der Stummschaltungsperiode MP übersteigt, wird der vorige richtig erhaltene SID-Rahmen für die Erzeugung des künstlichen Geräuschs verwendet. Daraufhin wird ein SID- Rahmen als Ausgangsdaten geliefert. (Die Stummschaltungsperiode MP wird beispielsweise auf 4 geschaltet). Wenn andererseits die Anzahl der aufeinanderfolgend erhaltenen schlechten Rahmen CBF zwischen 1 und MP ist, wird ein Stummschaltungsalgorithmus angewendet, um eine Anzahl von Parametern zu berechnen, die vom Sprachdecodierer verwendet werden. Für GSM sind die vom Sprachdecodierer verwendeten Parameter in GSM 06.10, 06.11 und 06.12 definiert. In der beispielhaften Ausführungsform sind die Parameter GAIN[N] und XMAX[N] durch den in den Fig. 3 und 4 beschriebenen Stummschaltungsalgorithmus gegeben. CBF = (1-4) ist eine Beschreibung, wie die Parameter der verschiedenen verfügbaren Rahmen zu kombinieren sind. CBF> = 5 zeigt, wie einfache SID-Rahmen zum Generator für künstliches Geräusch gesandt werden.
  • Wie in Fig. 3 beschrieben, ist der Übergang vom künstlichen Geräusch zu nicht stumm-geschalteter Sprache innerhalb eines Rahmens, wenn ein guter Rahmen erhalten wurde, für Störbedingungen, wie gelegentlicher Schwund oder Interferenzen, relevant.
  • Unter für eine Funkübertragung sehr schlechten Bedingungen tritt jedoch in Perioden, wo das Erhalten von BFI-markierten Rahmen (Anzeige: Schlechter Rahmen) vorherrschend ist, ein Problem mit dem gelegentlichen Empfang von Rahmen auf, die nicht schlecht sind. Der Wechsel vom künstlichen Geräusch zum Sprachrahmen mit voller Sprachlautstärke und die Stummschaltung wieder zum künstlichen Geräusch könnte sowohl beim Pegel als auch beim Spektrum einen störenden Übergangseffekt hervorrufen.
  • In einer bevorzugten Ausführungsform wird damit so umgegangen, wie im Flussdiagramm von Fig. 7 schematisch gezeigt ist.
  • Wenn ein Rahmen erhalten wurde, zeigt BFI (Anzeige: Schlechter Rahmen) an, ob es sich um einen schlechten Rahmen handelt oder nicht. Wird der Rahmen als schlecht angesehen, wird die gleiche Stummschaltungsprozedur angewendet, wie oben beschrieben. Wenn andererseits BFI anzeigt, dass der Rahmen nicht schlecht ist, wird geprüft, ob der vorherige Rahmen ohne eine Manipulation sprachdecodiert war, d. h., ob der Zähler der schlechten Rahmen (CBF) auf null steht oder nicht. Ist CBF gleich null, wird der Rahmen ohne eine Manipulation an den Sprachdecodierer geliefert. Ist CBF größer null, wird geprüft, ob er sich im Zustand der Erzeugung eines künstlichen Geräuschs oder in der Stummschaltungsperiode befindet, d. h., ob CBF > MP ist. Ist er im Zustand der Erzeugung eines künstlichen Geräuschs, wird CBF auf Stummschaltungsperiode (MP) gesetzt. Wenn er sich andererseits in der Stummschaltungsperiode CBF befindet, wird CBF um eins verringert. Dann kann die in Fig. 4 angegebene Tabelle wieder für den Anstieg der Sprache verwendet werden.
  • Schließlich werden die Parameter für kombinierte Sprache und künstliches Geräusch an den Sprachdecodierer weitergegeben.
  • In einer weiteren Ausführungsform kann der Zähler CBF auf Werte bis zu und einschließlich MP + 1 beschränkt werden.
  • Ein Anstieg/Abstieg zwischen Sprachrahmen kann dann so erfolgen, wie in Fig. 8 gezeigt ist. Beispielsweise kann die Tabelle der Fig. 4 verwendet werden, um die Ausgangsrahmen zu berechnen.
  • Das Full-Rate-Sprachcodierungschema von GSM bei 13 kBit/s wird RPE-LTP genannt (Regelmäßige Pulsanregung - Langzeitvorhersage).
  • Zunächst schneidet der Sprachencoder die Sprache, bei der es sich um lineare Pulscodemodulations-Abtastwerte (PCM) von 13 Bit handelt und die bei einer Rate von 8 kHz abgetastet wurden, in Stücke von 20 ms, die Rahmen genannt werden. Solch ein Rahmen von 160 Abtastwerten wird dann vorverarbeitet und es wird ein Offset-frei-Signal erzeugt, das dann mit einem Präemphase-Filter erster Ordnung bearbeitet wird. Die sich ergebenden 160 Abtastwerte werden dann analysiert, um die Koeffizienten für das Kurzzeitanalysefilter zu bestimmen, das dann zur Analyse zur Modellierung der Gesamtspektrums- Hüllkurve verwendet wird. Das erfolgt unter Anwendung der Analyse Lineare Vorhersagen-Codierung (LPC), d. h., um die Energie des Signals zu minimieren, das durch Filtern der 160 Abtastwerte durch das Umkehr-LPC-Filter erhalten wurde. Diese Parameter werden dann zum Filtern der gleichen 160 Abtastwerte verwendet. Es werden 160 Muster des Kurzzeit- Restsignals erhalten. Die Filterparameter, die Reflexionskoeffizienten genannt werden, werden vor der Übertragung zu logarithmischen Flächen-Verhältnissen (LAR) umgeformt.
  • Das Kurzzeit-Restsignal wird dann in vier Unterrahmen mit je 40 Abtastwerten aufgeteilt.
  • Vor der Verarbeitung jedes Unterblocks werden die Bewertungen der Parameter des Langzeitanalysefilters auf der Grundlage von gespeicherten rekonstruierten Kurzzeit-Restsignalen von den drei letzten Unterrahmen zusammen mit dem gegenwärtigen Rahmen aktualisiert. Das Langzeit-Analysefilter ist so ausgeführt, dass es die Ähnlichkeit aufeinanderfolgender Perioden von Sprachsegmenten beschreibt. Die Parameter sind als LTP-Nacheilung (lag) und LTP-Gewinn (gain) bezeichnet, und LTP bedeutet Langzeitvorhersage. Die LTP-Nacheilung gibt einen Index der Periodizität an, und der LTP-Gewinn gibt einen Wert der Korrelationsenergie, d. h. der Ähnlichkeit der Unterblöcke an.
  • Das LTP-Filter macht eine Vorhersage über die 40 Kurzzeit- Restabtastwerte des Unterrahmens. Von den 40 Kurzzeit- Restabtastwerte abgezogen, wird ein Block von 40 Langzeit- Restabtastwerten für den Unterrahmen erhalten. Diese Prozedur wird dann für alle Unterrahmen wiederholt.
  • Diese Langzeit-Restabtastwerte werden dann weiter durch die RPE-Analyse, die regelmäßige Pulsanregungsanalyse, komprimiert. Das Ergebnis ist ein Satz von RPE-Parametern, bei denen der Parameter Xmax die geschätzte Unterblock- Amplitude angibt.
  • Die obige Beschreibung bezieht sich auf eine besondere Ausführungsform, natürlich kann die Tabelle viele andere Formen annehmen, d. h., der Ausgangsrahmen muß nicht in Übereinstimmung mit dem hier angegebenen Muster, sondern kann in Übereinstimmung mit einem beliebigen anderen Muster variieren und die Stummschaltungsperiode muß nicht den Wert 4, sondern sie kann auch andere Werte haben.
  • In einer bevorzugten Ausführungsform können ein oder mehrere Rahmen, die ein Hintergrundgeräusch repräsentieren, entweder permanent oder temporär im System gespeichert werden. Unabhängig davon, ob es in einer mobilen Station oder einer Basisstation oder in einem anderen Teil des Systems gespeichert ist, kann es darin nach seiner Herstellung oder mit der Programmierung gespeichert werden. Ebenso kann es temporär für einen Anruf oder für einen beliebigen Zeitraum gespeichert werden.
  • Ein Betreiber eines Netzwerks hat die Möglichkeit, das Netzwerk derart zu konfigurieren, dass die DTX-Funktion nicht verwendet wird. Der Betreiber des Netzwerks hat ebenfalls die Möglichkeit, den einzelnen Benutzern die Wahl zu überlassen, die dann wählen können, ob sie die DTX-Funktion verwenden wollen oder nicht.
  • Wenn aber die DTX-Funktion verwendet wird, kommen SID-Rahmen mit einer vorgegebenen Regelmäßigkeit an und beschreiben das Hintergrundgeräusch während der Zeiträume ohne Sprache. Wenn ein SID-Rahmen gültig ist, sollte er gespeichert werden. Der SID-Rahmen-Generator und der Generator für künstliches Geräusch, die im System angeordnet sind, um die DTX-Leistung zu liefern, werden verwendet, um den Zugang zum geeigneten Hintergrundgeräusch auf der Empfangseite zu ermöglichen.
  • Fig. 5 bezieht sich auf die Empfangseite einer weiteren Ausführungsform ohne DTX-Funktionalität. Die empfangenen Informationsbits werden dann immer Sprachrahmen sein. Ein SID-Rahmen-Generator ist eingeführt, der auf der Grundlage der erhaltenen Sprachrahmen SID-Rahmen generiert. Ferner ist ein Sprechaktivitäts-Detektor (VAD) implementiert. Wenn während einer bestimmten Zahl von Rahmen keine Sprechaktivität vorhanden ist, wird der SID-Rahmen-Generator in der Sprachrahmen-Ersatzeinheit für einen möglichen späteren Gebrauch gespeichert. Wird ein Rahmen mit BFI- Markierung (Anzeige Schlechter Rahmen) erhalten, erfolgt ein Sprachrahmen-Ersatz in Übereinstimmung mit dem in den Fig. 3 und 4 beschriebenen Algorithmus. Es kann hier selbstverständlich aber auch ein Anstieg angewendet werden, wie er in den Fig. 7 und 8 beschrieben ist.
  • Gemäß einer weiteren Ausführungsform der Erfindung, die sich auf Fig. 1 und 2 bezieht, kann ein System, das nicht DTX verwendet, in Zeiträumen ohne Sprache SID-Rahmen erzwingen. Die SID-Rahmen können auf der Empfangsseite von der Sprachrahmen-Ersatzeinheit verwendet werden. In einer speziellen Ausführungsform können diese SID-Rahmen beispielsweise einmal pro Sekunde gesendet werden, wenn der Sprechaktivitäts-Detektor für eine vorgegebene Anzahl von Rahmen keine Sprache angibt. Sie können auf verschiedene Arten berechnet werden.
  • Diese Modifizierung bedeutet für den Benutzer keine merkbare Änderung, wenn die Kanalbedingungen gut sind. Ferner werden die "erzwungenen" SID-Rahmen in den Zeiträumen zwischen die Sprachrahmen gepackt, wenn keine Sprechaktivität erfasst ist.
  • Die Empfangsseite speichert, falls erforderlich, den letzten angenommenen (nicht BFI-markierten) SID-Rahmen für den Gebrauch. Beim Empfang eines BFI-markierten Rahmens wird der Sprachrahmen in Übereinstimmung mit einem Algorithmus ersetzt, wie in Fig. 3 und 4 beschrieben. Hier kann ebenfalls, wie oben beschrieben, ein stufenweiser Anstieg vorgesehen sein.
  • Fig. 6 zeigt eine weitere Ausführungsform, die zeigt, wie das Konzept der vorliegenden Erfindung in einem analogen System verwendet werden kann. Zunächst wird das analoge Sprachsignal in einer Analog-Digital-Vorrichtung abgetastet und dann, nach erfolgter Maßnahme zur Unterdrückung der schlechten Sprache, wird zur Analogverarbeitung zurückgekehrt. Die gesamte Einheit kann auch auf der Empfangsseite angeordnet sein. In diesem Fall ist keine Anzeige eines schlechten Rahmens (BFI) verfügbar. Für den Betrieb ist somit ein Signal zur Anzeige eines schlechten Kanals (BCI) erforderlich, das (einer Anordnung 10, die derart sein kann, wie in Fig. 5 gezeigt ist) anzeigt, in welchen Zeiträumen das empfangene Analogsignal schlecht ist.

Claims (14)

1. Anordnung für ein Sprachübertragungssystem, in dem Sprachübertragungssystemsignale in eine Rahmenstruktur eingeteilt werden, wobei die Anordnung Mittel zum Erfassen, ob ein Signal Sprachinformation enthält, und Mittel zum Erfassen, ob Rahmen verloren oder beschädigt sind oder nicht, umfasst,
dadurch gekennzeichnet,
dass die Anordnung weiter umfasst: Mittel zum Zählen einer Anzahl von Rahmen und Mittel, um zumindest die Anzahl verlorener oder beschädigter Rahmen zu bestimmen, dass, wenn ein Sprachrahmen richtig empfangen wird, untersucht wird, ob eine gegebene Anzahl von Rahmen, die dem empfangenen Rahmen direkt vorangehen, verloren oder beschädigt sind, und wenn ja, der richtig empfangene Sprachrahmen durch einen Rahmen, der eine Kombination von Hintergrundgeräusch und einem richtig empfangenen Sprachrahmen darstellt, ersetzt wird, oder dass, wenn eine Anzahl von richtig empfangenen Sprachrahmen nach einer Anzahl von schlecht empfangenen Sprachrahmen folgt, die ersten richtig empfangenen Sprachrahmen durch die Kombination ersetzt werden.
2. Anordnung nach Anspruch 1,
dadurch gekennzeichnet,
dass verlorene und beschädigte Rahmen durch einen geeigneten Rahmen ersetzt werden, und dass der geeignete Rahmen eine Kombination von Hintergrundgeräusch-Rahmen und Sprachrahmen ist, die auf eine derartige Weise erzeugt werden, dass sie sich allmählich dem Hintergrundgeräusch annähern.
3. Anordnung nach einem beliebigen der Ansprüche 1 oder 2,
dadurch gekennzeichnet,
dass das Sprachübertragungssystem diskontinuierliche Übertragung verwendet.
4. Anordnung nach einem beliebigen der Ansprüche 1 bis 3,
dadurch gekennzeichnet,
dass Rahmen, die ein Hintergrundgeräusch darstellen (SID- Rahmen), an dem Übertragungsende während Sprachpausen erzeugt und in der Austauschprozedur am Empfangsende verwendet werden.
5. Anordnung nach einem beliebigen der Ansprüche 1 bis 4,
dadurch gekennzeichnet,
dass Rahmen, die Hintergrundgeräusch darstellen, am Empfangsende erzeugt werden.
6. Anordnung nach einem beliebigen der Ansprüche 1 bis 3,
dadurch gekennzeichnet,
dass mindestens ein Rahmen, der Hintergrundgeräusch darstellt, zeitweilig oder permanent im System gespeichert wird.
7. Anordnung nach Anspruch 1,
dadurch gekennzeichnet,
dass sich die Ausgaberahmen allmählich reinen Sprachrahmen annähern.
8. Anordnung nach Anspruch 1,
dadurch gekennzeichnet,
dass die verlorenen oder beschädigten Rahmen ersetzt werden, wenn die Anzahl empfangener aufeinanderfolgender verlorener oder beschädigter Rahmen einen vorbestimmten Wert überschreitet.
9. Anordnung nach Anspruch 1 oder 8,
dadurch gekennzeichnet,
dass die ersten Rahmen durch Rahmen, die Kombinationen aus Sprachrahmen und Hintergrundgeräusch-Rahmen sind, derart ersetzt werden, dass eine allmähliche Annäherung an Sprache erfolgt, wenn einer gegebenen Anzahl aufeinanderfolgender erster Rahmen, die nicht verloren oder beschädigt sind, eine gegebene Anzahl verlorener oder beschädigter zweiter Rahmen vorausgeht.
10. Telekommunikationssystem, das eine Anordnung gemäß einem beliebigen der Ansprüche 1 bis 9 umfasst.
11. Verfahren zum Verbessern von Sprachqualität für ein Sprachübertragungssystem, wobei die Sprachsignale in eine Rahmenstruktur unterteilt werden, die Schritte umfassend:
- Erfassen, ob ein Sprachrahmen während einer Übertragung verloren oder beschädigt wurde, und
- Ersetzen eines verlorenen oder beschädigten Rahmens durch einen Rahmen, der hauptsächlich Hintergrundgeräusch darstellt, oder zumindest eines derartigen Rahmens in Kombination mit mindestens einem richtig empfangenen Sprachrahmen, und
- wobei, wenn eine Anzahl von richtig empfangenen Sprachrahmen nach einer Anzahl von schlecht empfangenen Sprachrahmen folgt, die ersten richtig empfangenen Sprachrahmen durch Rahmen ersetzt werden, die Kombinationen von richtig empfangenen Sprachrahmen und mindestens einem Rahmen sind, der Hintergrundgeräusch darstellt.
12. Verfahren nach Anspruch 11,
dadurch gekennzeichnet,
dass, wenn mindestens zwei aufeinanderfolgende Rahmen während einer Übertragung verlorengehen oder beschädigt werden, jene Rahmen durch Rahmen, die Kombinationen von Hintergrundgeräusch-Rahmen und Sprachrahmen sind, auf eine derartige Weise ersetzt werden, dass eine allmähliche Annäherung an das Hintergrundgeräusch erfolgt.
13. Verfahren nach Anspruch 11,
dadurch gekennzeichnet,
dass, wenn der Rahmen nicht verloren oder beschädigt ist, eine Überprüfung vorgenommen wird, um zu erkennen, ob der vorherige Rahmen ohne Manipulation sprachdekodiert war, d. h., wenn der Zählerwert der Anfangswert ist und wenn ein Zählerwert gleich dem Anfangswert ist, wird der Rahmen ohne jedwede Manipulation an den Sprachdecoder gegeben.
14. Verfahren nach Anspruch 13,
dadurch gekennzeichnet,
dass das Verfahren weiterhin die Schritte umfasst:
- Bestimmen, ob der Zählerwert größer als der Anfangswert ist,
- Untersuchen, ob der Zustand zur Erzeugung eines künstlichen Geräusches oder eine Stummschaltungsperiode vorliegt,
- liegt der Zustand künstlichen Geräusches vor, erfolgt die Einstellung des Zählwerts auf einen Stummschaltungswert, liegt der Zustand Stummschaltungsperiode vor, wird der Zählwert verringert,
- stufenweiser Anstieg der Sprache und
- Ausgeben der kombinierten Parameter für Sprache und künstliches Geräusch an einen Sprachdecoder, der in dem System angeordnet ist.
DE69621613T 1995-03-10 1996-03-11 Anordnung und verfahren zur sprachübertragung und eine derartige anordnung enthaltende fernsprechanlage Expired - Lifetime DE69621613T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9500858A SE9500858L (sv) 1995-03-10 1995-03-10 Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning
PCT/SE1996/000311 WO1996028809A1 (en) 1995-03-10 1996-03-11 Arrangement and method relating to speech transmission and a telecommunications system comprising such arrangement

Publications (2)

Publication Number Publication Date
DE69621613D1 DE69621613D1 (de) 2002-07-11
DE69621613T2 true DE69621613T2 (de) 2003-01-30

Family

ID=20397500

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69621613T Expired - Lifetime DE69621613T2 (de) 1995-03-10 1996-03-11 Anordnung und verfahren zur sprachübertragung und eine derartige anordnung enthaltende fernsprechanlage

Country Status (6)

Country Link
US (1) US6055497A (de)
EP (1) EP0819302B1 (de)
AU (1) AU5018196A (de)
DE (1) DE69621613T2 (de)
SE (1) SE9500858L (de)
WO (1) WO1996028809A1 (de)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US20020044570A1 (en) * 1996-12-06 2002-04-18 Philips Electronics North America Corp. Method and apparatus for improved communication for cable tv telephony and data transport
JPH10327089A (ja) * 1997-05-23 1998-12-08 Matsushita Electric Ind Co Ltd 携帯電話装置
EP0924866A1 (de) * 1997-12-15 1999-06-23 Koninklijke Philips Electronics N.V. Übertragungssystem mit wenigstens einer Basisstation und einer sekundären Station, die Station mit Verfahren zur Korrektur von Sprachberichten und Vorrichtung zur Sprachqualitätsverbesserung
GB2332598B (en) * 1997-12-20 2002-12-04 Motorola Ltd Method and apparatus for discontinuous transmission
US6122611A (en) * 1998-05-11 2000-09-19 Conexant Systems, Inc. Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
FI106906B (fi) * 1998-09-09 2001-04-30 Nokia Networks Oy Lähetysmenetelmä ja radiojärjestelmä
JP3599581B2 (ja) * 1998-11-25 2004-12-08 キヤノン株式会社 電子装置及びコンピュータ読み取り可能な記憶媒体
SE9901381L (sv) * 1999-04-19 2000-10-20 Telia Ab Metod och anordning i ett digitalt kommunikationsnät
US6381568B1 (en) * 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
SE514635C2 (sv) * 1999-07-02 2001-03-26 Ericsson Telefon Ab L M Förfaranden och medel för att överföra och mottaga paketdataenheter i ett cellulärt radiokommunikationssystem
US6480472B1 (en) 1999-07-21 2002-11-12 Qualcomm Incorporated Mobile station supervision of the forward dedicated control channel when in the discontinuous transmission mode
US6708024B1 (en) * 1999-09-22 2004-03-16 Legerity, Inc. Method and apparatus for generating comfort noise
US6621834B1 (en) * 1999-11-05 2003-09-16 Raindance Communications, Inc. System and method for voice transmission over network protocols
WO2001037522A1 (en) * 1999-11-19 2001-05-25 Siemens Information And Communication Mobile Llc System and method for wireless communication incorporating error concealment
US6577862B1 (en) 1999-12-23 2003-06-10 Ericsson Inc. System and method for providing comfort noise in a mobile communication network
FI20010235A (fi) * 2001-02-08 2002-08-09 Nokia Corp Menetelmä informaatiokehysten prosessoimiseksi
DE10142102A1 (de) * 2001-08-30 2003-03-27 Schleifring Und Appbau Gmbh Vorrichtung zur störarmen Signalübertragung
GB2381702B (en) * 2001-11-02 2004-01-07 Motorola Inc Communication system, user equipment and method of performing a conference call therefor
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
EP1458145A4 (de) * 2001-11-15 2005-11-30 Matsushita Electric Ind Co Ltd Fehlerverbergungsvorrichtung und -verfahren
US20030101049A1 (en) * 2001-11-26 2003-05-29 Nokia Corporation Method for stealing speech data frames for signalling purposes
US6915246B2 (en) * 2001-12-17 2005-07-05 International Business Machines Corporation Employing speech recognition and capturing customer speech to improve customer service
US7058565B2 (en) * 2001-12-17 2006-06-06 International Business Machines Corporation Employing speech recognition and key words to improve customer service
US6721712B1 (en) * 2002-01-24 2004-04-13 Mindspeed Technologies, Inc. Conversion scheme for use between DTX and non-DTX speech coding systems
FI116258B (fi) * 2003-02-14 2005-10-14 Nokia Corp Menetelmä tiedonsiirtokapasiteetin riittävyyden varmistamiseksi, menetelmää hyödyntävä päätelaite sekä ohjelmalliset välineet menetelmän toteuttamiseksi
DE602005016916D1 (de) * 2004-06-02 2009-11-12 Panasonic Corp Vorrichtung und verfahren zum empfangen von audiodaten
KR100640476B1 (ko) * 2004-11-24 2006-10-30 삼성전자주식회사 비동기식 오디오 스트림 처리 방법 및 장치
US7395202B2 (en) * 2005-06-09 2008-07-01 Motorola, Inc. Method and apparatus to facilitate vocoder erasure processing
JP2007150737A (ja) * 2005-11-28 2007-06-14 Sony Corp 音声信号ノイズ低減装置及び方法
CN101346759B (zh) * 2005-12-21 2011-09-07 日本电气株式会社 代码转换装置、用于代码转换装置的代码转换方法及程序
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
CN101226744B (zh) * 2007-01-19 2011-04-13 华为技术有限公司 语音解码器中实现语音解码的方法及装置
GB0703795D0 (en) * 2007-02-27 2007-04-04 Sepura Ltd Speech encoding and decoding in communications systems
US7826872B2 (en) * 2007-02-28 2010-11-02 Sony Ericsson Mobile Communications Ab Audio nickname tag associated with PTT user
CN101321033B (zh) * 2007-06-10 2011-08-10 华为技术有限公司 帧补偿方法及系统
US20090048827A1 (en) * 2007-08-17 2009-02-19 Manoj Kumar Method and system for audio frame estimation
ATE456130T1 (de) * 2007-10-29 2010-02-15 Harman Becker Automotive Sys Partielle sprachrekonstruktion
CN100550133C (zh) * 2008-03-20 2009-10-14 华为技术有限公司 一种语音信号处理方法及装置
CN101339767B (zh) * 2008-03-21 2010-05-12 华为技术有限公司 一种背景噪声激励信号的生成方法及装置
ES2635027T3 (es) 2013-06-21 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para el desvanecimiento de señales mejorado para sistemas de codificación de audio cambiados durante el ocultamiento de errores
US20150023230A1 (en) * 2013-07-19 2015-01-22 Qualcomm Incorporated Dual sim dual active subscriber identification module with a single transmit chain and dual or single receive chain
WO2016016724A2 (ko) * 2014-07-28 2016-02-04 삼성전자 주식회사 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
WO2018164165A1 (ja) * 2017-03-10 2018-09-13 株式会社Bonx 通信システム、通信システムに用いられるapiサーバ、ヘッドセット、及び携帯通信端末

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5938912A (ja) * 1982-08-27 1984-03-03 Nec Corp Pcmオ−デイオエラ−補正回路
US4829523A (en) * 1987-11-18 1989-05-09 Zenith Electronics Corporation Error masking in digital signal transmission
JPH02288520A (ja) * 1989-04-28 1990-11-28 Hitachi Ltd 背景音再生機能付き音声符号復号方式
GB2256351B (en) * 1991-05-25 1995-07-05 Motorola Inc Enhancement of echo return loss
JP3167385B2 (ja) * 1991-10-28 2001-05-21 日本電信電話株式会社 音声信号伝送方法
US5309443A (en) * 1992-06-04 1994-05-03 Motorola, Inc. Dynamic muting method for ADPCM coded speech
CA2110090C (en) * 1992-11-27 1998-09-15 Toshihiro Hayata Voice encoder
SE502244C2 (sv) * 1993-06-11 1995-09-25 Ericsson Telefon Ab L M Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation
US5491719A (en) * 1993-07-02 1996-02-13 Telefonaktiebolaget Lm Ericsson System for handling data errors on a cellular communications system PCM link
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
FR2718589B1 (fr) * 1994-04-11 1996-05-31 Alcatel Mobile Comm France Dispositif de traitement en réception, notamment pour système de radiocommunication numérique avec des mobiles.
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures

Also Published As

Publication number Publication date
WO1996028809A1 (en) 1996-09-19
SE9500858L (sv) 1996-09-11
AU5018196A (en) 1996-10-02
DE69621613D1 (de) 2002-07-11
EP0819302B1 (de) 2002-06-05
US6055497A (en) 2000-04-25
SE9500858D0 (sv) 1995-03-10
EP0819302A1 (de) 1998-01-21

Similar Documents

Publication Publication Date Title
DE69621613T2 (de) Anordnung und verfahren zur sprachübertragung und eine derartige anordnung enthaltende fernsprechanlage
DE69535723T2 (de) Verfahren und vorrichtung zur sprachkodierung mit reduzierter, variabler bitrate
DE69518174T2 (de) Rauschkorrektur durch Feststellung der Anwesenheit von Sprachsignalen
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE69925168T2 (de) Erkennung der aktivität komplexer signale für verbesserte sprach-/rauschklassifizierung von einem audiosignal
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE69535709T2 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate bei einem Vokoder mit variabler Rate
DE69429917T2 (de) Verfahren und vorrichtung zur gruppenkodierung von signalen
DE69324213T2 (de) Sprachkodierer und Verfahren zur Sprachkodierung
DE602004008676T2 (de) Audiocodierung mit verschiedenen codierungsmodellen
DE60118631T2 (de) Verfahren zum ersetzen verfälschter audiodaten
EP1869671B1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
EP0659002B1 (de) Verfahren und Schaltungsanordnung zur Übertragung von Sprachsignalen
DE69738476T2 (de) Verfahren und Gerät für Anrufregistrierung in einem Speicher
EP0251028B1 (de) Verfahren zur Übertragung eines Audiosignales
DE69531977T2 (de) Mobilkommunikationssystem
EP2245620B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
DE69431520T2 (de) Verfahren und vorrichtung zur verminderung von audiosignalverschlechterungen in einem kommunikationssystem
DE4211945C1 (de)
DE69714640T2 (de) Signalquantisierer für die Sprachkodierung
DE4430864A1 (de) Verfahren zum unbemerktem Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines quellencodierten, datenreduzierten Audiosignals
EP0658874A1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
DE10252070B4 (de) Kommunikationsendgerät mit parametrierter Bandbreitenerweiterung und Verfahren zur Bandbreitenerweiterung dafür
DE60027140T2 (de) Sprachsynthetisierer auf der basis von sprachkodierung mit veränderlicher bit-rate
DE102006062774B4 (de) Vorrichtung und Verfahren zur Detektion von Audio-Signalrahmen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition