AT410876B - Übertragungssystem zur übertragung von sprachinformation - Google Patents

Übertragungssystem zur übertragung von sprachinformation Download PDF

Info

Publication number
AT410876B
AT410876B AT198598A AT198598A AT410876B AT 410876 B AT410876 B AT 410876B AT 198598 A AT198598 A AT 198598A AT 198598 A AT198598 A AT 198598A AT 410876 B AT410876 B AT 410876B
Authority
AT
Austria
Prior art keywords
data packets
time
transmission
network
delay time
Prior art date
Application number
AT198598A
Other languages
English (en)
Other versions
ATA198598A (de
Inventor
Gerhard Dipl Ing Dr Zimmermann
Original Assignee
Ericsson Entpr Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Entpr Gmbh filed Critical Ericsson Entpr Gmbh
Priority to AT198598A priority Critical patent/AT410876B/de
Priority to AU15000/00A priority patent/AU1500000A/en
Priority to PCT/AT1999/000290 priority patent/WO2000033520A1/de
Publication of ATA198598A publication Critical patent/ATA198598A/de
Application granted granted Critical
Publication of AT410876B publication Critical patent/AT410876B/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/062Synchronisation of signals having the same nominal but fluctuating bit rates, e.g. using buffers
    • H04J3/0632Synchronisation of packets and cells, e.g. transmission of voice via a packet network, circuit emulation service [CES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description


   <Desc/Clms Page number 1> 
 



   Die Erfindung betrifft ein Verfahren zur Übertragung von Sprachinformation innerhalb zumin- dest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzwerkes, z. B. LAN, Intranet, 
Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z. B. Internet-Protokolls, erfolgt, wobei die an einen Teilnehmer übertra- genen Datenpakete beim Teilnehmer empfangen und zunächst zwischengespeichert werden, worauf sie zeitlich verzögert in ein, vorzugsweise analoges, Sprachsignal umgewandelt werden, wobei die Verzögerungszeit der Datenübertragung des zumindest einen Netzwerkes laufend ermittelt wird und die Sprachinformation der Datenpakete in Abhängigkeit von der aktuellen Netz- werks-Verzögerungszeit verändert wird. 



   In Netzwerken, wie z B LAN, Intranet, Internet o.ä., die auf einem standardisierten Protokoll, z B dem Internet-Protokoll basieren, ist jedem Netzteilnehmer eine Adresse zugeordnet, von der 
Daten an andere Teilnehmer gesendet bzw. an der von anderen Teilnehmern abgeschickte Daten empfangen werden können. Da auch Sprache in Form von digitalen Daten übertragbar ist, können solche Netze auch zur Sprachübertragung herangezogen werden. Die Art des Netzwerks und des Übertragungsprotokolls ist im Rahmen der Erfindung nicht auf die vorstehend genannten bekann- ten Bezeichnungen eingeschränkt, die Erfindung lässt sich auch auf alle möglichen miteinander vernetzten Netzwerke anwenden, die an bestimmten Punkten über Transformationseinheiten (Gateways) miteinander verknüpft sein können. 



   Bei bisher bekannten Sprachübertragungssystemen der eingangs genannten Art erfolgt die 
Sprachübertragung in definierten Paketen, die von der Sendestelle an einen Empfänger ausge- sendet und von diesem in Empfang genommen werden. Die Pakete werden zu diesem Zweck in nacheinanderfolgender Reihenfolge aus den digitalisierten Abtastwerten des zu sendenden 
Sprachsignals zusammengesetzt und können für die Übertragung auf der Sendeseite entspre- chend kodiert und nach ihrem Empfang auf der Empfängerseite dekodiert werden. Die empfange- nen Abtastwerte werden wieder zu einem Sprachsignal zusammengesetzt, wobei unter Sprachsig- nal alle im hörbaren Bereich gelegenen, akustischen Schwingungen verstanden wird.

   Im Unter- schied zur Übertragung über Telephonleitungen besteht die Besonderheit der Sprachübertragung in Datenübertragungsnetzen darin, dass die Übertragungsbandbreite vom Netzanbieter nicht immer garantiert wird. Ebenso erfolgen an verschiedenen Knoten je nach Vorliegen von freien Leitungen ständige Änderungen des vermittelten Pfades, über den die Übertragung der Datenpakete vorge- nommen wird. Aufgrund der unterschiedlichen Laufzeiten oder unterschiedlichen Datenwege können später ausgesendete Datenpakete beim Empfänger früher ankommen als vor diesen ausgesendete Datenpakete. Durch derartige Verzögerungseffekte kann es geschehen, dass einzel- ne Datenpakete nicht zum richtigen Zeitpunkt beim Empfänger eintreffen und daher nicht rechtzei- tig verfügbar sind. Weiters können die Datenpakete durch Übertragungsfehler verloren gehen. 



   Bei grösseren Netzen, wie zum Beispiel im Internet, sind die Schwankungen der Übertragungs- verzögerungen deutlich merkbar und hängen von der jeweiligen gerade vorhandenen Belastung durch die verschiedenen Teilnehmer ab. Neben tageszeitenbedingten Änderungen können durch bestimmte Ereignisse hervorgerufene Verlangsamungen auftreten, die in keiner Weise vorherseh- bar sind. 



   Ein System zur Vermittlung und Übertragung von Sprachsignalen über ein paketvermittelndes Netzwerk, insbesondere über das Internet, und ein herkömmliches Telephon-Netzwerk ist z.B. in der WO-A-97/14238 beschrieben. Mit diesem ist eine Telephonverbindung von einem Telephon- Endgerät zu einem mit dem Internet verbundenen Rechner möglich. 



   Bei reinen Datenübertragungen kann der Empfänger die Verzögerungen durch längere Warte- zeiten ohne merkbare Nachteile ausgleichen, während Sprachübertragungen bei längeren Verzö- gerungen nicht möglich sind. 



   Um eine akzeptable Wiedergabequalität zu erzielen, werden daher jeweils immer einige Datenpakete durch Zwischenspeicherung bereitgehalten, um die auftretenden Verzögerungen oder Verluste ersetzen zu können, indem beispielsweise das jeweils vorhergehende Datenpaket wiederholt wird. Schliesslich können die verlorengegangenen Datenpakete auch durch ein Rausch- signal ersetzt werden. 



   Eine hohe Übertragungsqualität lässt sich dann erreichen, wenn die übertragenen und gewan- delten Datenpakete erst nach einer z.B durch Zwischenspeicherung der Datenpakete bestimmten Verweilzeit als wieder zusammengesetztes Sprachsignal beim Empfänger ausgegeben werden, da 

 <Desc/Clms Page number 2> 

 es dadurch möglich ist, die auf dem Übertragungsweg auftretende Verzögerung entsprechend auszugleichen. Dafur definierte Standards legen maximale Übertragungs-Laufzeiten von z.B. 



  400 ms (Tiphon Class A) und 600 ms (Tiphon Glass B) fest. Eine noch höhere Verzögerung würde für einen fliessenden Dialog als störend empfunden werden. Bei 0,4 s Laufzeit entsteht beim sen- denden Teilnehmer bedingt durch die Zeitverschiebung bei der Hin-Übertragung der Sprachinfor- mation und die darauf erfolgende Antwort des Empfängers eine Reaktionszeit von 0,8 s, wodurch der Gesprächsfluss noch gut aufrechterhalten werden kann. Der Tiphon Class B-Standard erlaubt eine Laufzeit von 0,6s pro Übertragungsrichtung, die Reaktionszeit beträgt aber bereits 1,2 s, wodurch Gesprächsbehinderungen deutlich zutage treten. Der dabei auftretende Walkie-Talkie- 
Effekt erzwingt ein bewusstes Abwarten der Antwort des anderen Gesprächsteilnehmers. 



   Bisher bekannte Implementierungen arbeiten mit konstanten Verzögerungen, wobei die Verweilzeiten kleiner als 400 ms betragen, und benutzen dabei gegebenenfalls z. B. aus der Mobil- funktechnik bekannte Verfahren, um verlorengegangene oder verspätete Sprachdatenpakete zu ersetzen. Im Falle fehlender Datenpakete wird die entstehende Pause entweder durch eine Null- wertausgabe der Sprachsignale (Stille) oder wiederholte, auch modifizierte Sprach-Datenpakete überbrückt. Sollten verzögerte Datenpakete verspätet eintreffen, werden diese verworfen. Diese Vorgangsweise führt im Falle von länger andauernden Verzögerungen entweder zu abgehackter oder verzerrter bzw. verrauschter Wiedergabe und ergibt eine schlechte Übertragungsqualität. 



   Aus Montgomery, Warren A., "Techniques for Packet Voice Synchronization", IEEE Journal on Selected Areas in Communications, Vol. SAC-1, No 6, December 1983, S. 1022-1028 ist ein Übertragungssystem zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzwerkes bekannt, bei dem die Übertragung mittels Datenpaketen erfolgt, wobei die an einen Teilnehmer übertragenen Datenpakete beim Teilnehmer empfangen und zunächst zwischengespeichert werden, worauf sie um eine Wiederga- bezeit zeitlich verzögert nach ihrer Zusammenstellung in ein Sprachsignal umgewandelt werden. 



  Es sind verschiedene Methoden zur Ermittelung der Netzwerk-Verzögerungszeit vorgesehen, woraus eine geeignete Wiedergabezeit der Datenpakete bestimmt werden kann. Bei einer wieder- holten Bestimmung der Netzwerk-Verzögerungszeit kann die Wiedergabezeit mit adaptiven Strate- gien wahrend Gesprächspausen angepasst werden. Nachteilig an einem Übertragungssystem gemäss Montgomery ist, dass die Wiedergabezeit nur während einer Gesprächspause geändert werden kann. Weiters ist nachteilig, dass bei einem starken Hintergrundrauschen keine bzw. nur sehr wenige Gesprächspausen auftreten, weshalb die Wiedergabezeit nur sehr selten bzw. nie geändert werden kann. 



   In Castel-Branco Luis et ai., "Clock Recovery for Circuit Emulation Services over ATM", Broad- band Communications, 1996, Global Infrastructure for the Information Age, Proceedings of the International IFIP-IEEE Conference on, 1996, S. 617-625 ist eine Übersicht über verschiedene Arten der asynchronen Takt-Wiedergewinnung für ATM-Netzwerksübertragungen wiedergegeben. 



  Nachteilig bei einer Taktänderung gemäss Castel-Branco ist, dass das Frequenzband verschoben wird, wodurch die Stimmlage verändert wird 
Aufgabe der Erfindung ist es, ein Verfahren der eingangs genannten Art anzugeben, bei dem eine Änderung der Wiedergabezeit während eines Gesprächs nicht nur auf Gesprächspausen beschränkt ist und bei dem beim Empfänger der Eindruck eines abgehackten Signals durch die Änderung der Wiedergabezeit vermieden wird. 



   Eine weitere Aufgabe der Erfindung besteht darin, ein Verfahren der eingangs genannten Art anzugeben, mit dessen Hilfe der Einfluss der sich während der Übertragung der Daten innerhalb des Netzwerkes ändernden Verzögerungen kompensiert werden kann, ohne dass es dabei zu einer merkbaren Verschlechterung der Sprachübertragungsqualität kommt. Im Falle einer guten Netz- werksverbindung soll es weiters möglich sein, die Sprachinformation mit nur geringer Verzögerung zu empfangen. 



   Eine weitere Aufgabe der Erfindung ist es, ein Verfahren anzugeben, mit dem trotz der durch das Netz hervorgerufenen Verzögerungszeiten eine hohe Übertragungsqualität erreichbar ist. 



   Erfindungsgemäss wird dies dadurch erreicht, dass in einem periodischen Teil des Sprachsig- nals eine oder mehrere, einzelne Schwingungen in Abhängigkeit von der ermittelten Netzwerks- Verzögerungszeit entfernt und gegebenenfalls mit vervielfachter, vorzugsweise verdoppelter Signalperiode wieder eingefügt werden, wobei die Zeitpunkte zur Entfernung bzw. Einfügung der 

 <Desc/Clms Page number 3> 

 
Schwingungen vorzugsweise im Nulldurchgang bei positiver Signalflanke des Sprachsignals gewählt werden. 



   Dadurch kann eine kontinuierliche Anpassung der übertragenen Sprachinformation an die gerade herrschende Verzogerungszeit der Datenübertragung innerhalb des Netzes vorgenommen werden, wodurch die Sprachinformation beim Empfänger zwar in veränderter Form, jedoch mit relativ hoher Wiedergabequalität erfolgt. 



   Bei relativ geringem Aufwand für die Umsetzung dieser Massnahmen sind die entstehenden 
Verzerrungen innerhalb des wiedergegebenen Sprachsignals kaum wahrnehmbar. Auch monofre- quente Töne werden dadurch mit Ausnahme ihrer Dauer kaum beeinflusst, nur bei in der Telepho- nie üblichen Mehrfrequenzverfahren, z. B. MFV, MFE, MFC kommt es zu Qualitätseinbussen. 



   Diesbezüglich kann eine sehr verzerrungsfreie Anpassung an die Verzögerung erfolgen, wenn gemäss einem weiteren Ausführungsbeispiel der Erfindung vorgesehen ist, dass im Signalverlauf des Sprachsignals eine Abfolge einer vorbestimmbaren Anzahl von Nulldurchgängen, z. B. drei aufeinanderfolgende Nulldurchgänge, mit steigenden Flanken in konstantem Zeitabstand gesucht und festgestellt wird und im Bereich dieses zeitlichen Abschnitts ein Zeitintervall des Sprachsignals zwischen zwei ansteigenden Flanken entfernt oder der Signalverlauf zwischen zwei ansteigenden 
Flanken mehrfach, vorzugsweise zweifach, hintereinander eingefügt wird. 



   In weiterer Ausbildung der Erfindung kann vorgesehen sein, dass die Netzwerks- 
Verzögerungszeit der Datenübertragung aus der in jedem Datenpaket vorhandenen Zeitinformation über den Sendezeitpunkt desselben berechnet und der Mittelwert über mehrere Datenpakete hinweg gebildet wird. 



   Dabei können die im Datenpaket bereits vorhandenen Zeit-Informationen für eine Analyse der innerhalb der Netzübertragung auftretenden Verzögerungen herangezogen werden. 



   Gemäss einer anderen Variante der Erfindung kann die Änderung der Netzwerks- Verzögerungszeit durch Messung der durchschnittlichen Anzahl der pro Zeiteinheit in der Emp- fangseinheit eintreffenden Datenpakete ermittelt werden. Bei zunehmender Verzögerungszeit nimmt die Anzahl der eintreffenden Datenpakete im Zwischenspeicher, der für die Erzeugung der Verweilzeit vorgesehen werden kann, ab. Sobald eine solche Veränderung registriert wird, können die Datenpakete bzw. die Sprachinformation entsprechend verändert an die Sprachwandler-Einheit weitergeleitet werden, um zu vermeiden, dass ein Mangel an ausgebbaren Datenpaketen entsteht. 



  Bei abnehmender Verzögerungszeit kann z. B. die Weiterleitung der Datenpakete beschleunigt erfolgen und damit angestaute Datenpakete schneller weitergeleitet werden. 



   Die Erfindung betrifft weiters ein Verfahren zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzwerkes, z. B. LAN, Intranet, Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, wobei die an einen Teilnehmer übertragenen Datenpakete beim Teilnehmer empfangen und zunächst zwischengespeichert werden, worauf sie zeitlich verzögert in ein, vorzugsweise analoges, Sprachsignal umgewandelt werden, wobei die Verzögerungszeit der Datenübertragung des zumindest einen Netzwerkes laufend ermittelt wird und die Sprachinformation der Datenpakete in Abhängigkeit von der aktuellen Netzwerks-Verzögerungszeit verändert wird. 



   Aufgabe der Erfindung ist es, ein Verfahren der eingangs genannten Art anzugeben, bei dem eine Änderung der Wiedergabezeit während eines Gesprächs nicht nur auf Gesprächspausen beschränkt ist und bei dem beim Empfänger der Eindruck eines abgehackten Signals durch die Änderung der Wiedergabezeit vermieden wird. 



   Eine weitere Aufgabe der Erfindung besteht darin, ein Verfahren der eingangs genannten Art anzugeben, mit dessen Hilfe der Einfluss der sich während der Übertragung der Daten innerhalb des Netzwerkes ändernden Verzögerungen kompensiert werden kann, ohne dass es dabei zu einer merkbaren Verschlechterung der Sprachübertragungsqualität kommt. Im Falle einer guten Netz- werksverbindung soll es weiters möglich sein, die Sprachinformation mit nur geringer Verzögerung zu empfangen. 



   Eine weitere Aufgabe der Erfindung ist es, ein Verfahren anzugeben, mit dem trotz der durch das Netz hervorgerufenen Verzögerungszeiten eine hohe Übertragungsqualität erreichbar ist. 



   Erfindungsgemäss wird dies dadurch gelöst, dass in Abhängigkeit von der ermittelten Netzwerks- Verzögerungszeit die Ausgaberate der Datenpakete an die Sprachwandler-Einheit verändert wird, 

 <Desc/Clms Page number 4> 

 wobei bei ansteigender Netzwerks-Verzögerungszeit die Ausgaberate erniedrigt und bei abfallen- der Netzwerks-Verzögerungszeit die Ausgaberate erhöht wird. 



   Durch die Erhöhung oder Erniedrigung der Sprachgeschwindigkeit wird eine geeignete Anpas- sung der Verzögerungszeit innerhalb des Netzes erreicht werden. 



   Die bei der Veränderung der Sprachgeschwindigkeit auftretende Stimmlagenänderung zerstört die Identifizierbarkeit des Sprechenden, das empfangene Signal kann der betreffenden Person nicht mehr eindeutig zugeordnet werden. 



   Diese kann in vorteilhafter Weiterbildung der Erfindung dadurch beseitigt werden, dass die entstehende Verschiebung des Frequenzbereiches durch Fourier-Transformation, Frequenzband- korrektur und Fourier-Rücktransformation, kompensiert wird. 



   Dadurch wird das Sprachsignal schneller oder langsamer ausgegeben, die Veränderung der 
Stimmlage wird aber durch die Frequenzbereichsverschiebung wieder normalisiert. 



   Gemäss einer weiteren Variante der Erfindung kann vorgesehen sein, dass die entstehende Verschiebung des Frequenzbandes durch Mischung mit einer ersten Trägerfrequenz und Tiefpass- 
Filterung sowie nachfolgender nochmaliger Mischung mit einer zweiten Trägerfrequenz und Tief- pass-Filterung kompensiert wird, wobei die Frequenzbandverschiebung die Differenz aus zweiter und erster Trägerfrequenz beträgt. Auf diese Weise kann ebenfalls eine Frequenzband-Korrektur erfolgen, die analoge Mischung verschiebt jedoch die Frequenzen unproportional. 



   Nachfolgend wird die Erfindung anhand des in den beigeschlossenen Zeichnungen dargestell- ten Ausführungsbeispiels eingehend erläutert. Es zeigt dabei 
Fig.1die Empfangseinheit eines Übertragungssystems gemäss Stand der Technik; 
Fig. 2 eine Ausführungsform der Empfangseinheit eines erfindungsgemässen Übertragungssys- tems, 
Fig.3ein Sprachsignalverlauf in Abhängigkeit der Zeit; 
Fig. 4 der Sprachsignalverlauf gemäss Fig.3, bei dem eine Verzögerungsanpassung einer Ausführungsform des erfindungsgemässen Verfahrens vorgenommen worden ist;   Fig.5  ein weiterer Sprachsignalverlauf und 
Fig. 6 der Sprachsignalverlauf nach   Fig.5  bei dem ein weitere Ausführungsform des erfindungs- gemässes Verfahrens zur Verzögerungsanpassung vorgenommen worden ist. 



   In Fig. 1 ist eine Empfangseinheit 10 eines Übertragungssystems zur Übertragung von Sprach- information innerhalb eines nicht dargestellten, mehrere Teilnehmer verbindenden Datenübertra- gungs-Netzes, wie z. B. LAN, Intranet, Internet, gezeigt, wie es gemäss Stand der Technik bekannt ist. Die zu übertragenden Daten werden in Datenpakete unterteilt und während der Übertragung zwischen den Teilnehmern ausgetauscht, wobei innerhalb des jeweiligen Netzes der Transport der Datenpakete je nach verfügbaren Übertragungsleitungen verwaltet wird.

   Es können auch mehrere, miteinander gekoppelte Netze für eine solche Sprachübertragung eingesetzt werden, wobei bei unterschiedlichen Protokollen in diesen Netzen zur Umwandlung geeignete Einheiten vorgesehen sein müssen, 
In vielen Fällen findet die Übertragung der Datenpakete auf der Grundlage des Internet- Protokolls (IP) statt, wobei jeder Teilnehmer über die Empfangseinheit 10 und eine in Fig. 1 nicht dargestellte Sendeeinheit mit dem IP-Netzwerk in Verbindung steht. Die Empfangseinheit 10 umfasst einen Empfangsteil 1 und eine Sprachwandler-Einheit 3 zur Umwandlung der Datenpakete in ein Sprachsignal, das in dem Ausführungsbeispiel gemäss Fig. 1 in PCM-Kodierung an ein Tele- phonnetz, eine Nebenstellenanlage oder ein Teilnehmer-Endgerät weitergeleitet wird, wo es direkt weiterverarbeitet werden kann. Jede andere Art der Weiterleitung bzw.

   Verwendung der empfan- genen Signale ist denkbar. Die Sprachwandler-Einheit 3 kann dabei auch eine Wandlung in analo- ge Sprachsignale vornehmen. 



   In Fig. 1 ist zwischen dem Empfangsteil 1 und der Sprachwandler-Einheit 3 eine Dekoder- Einheit 2 vorgesehen, für den Fall, dass senderseitig eine Kodierung der übertragenen Sprachdaten vorgenommen wird. Weiters ist im Empfangsteil 1 eine Vorrichtung zur Verzögerung 1' der emp- fangenen Datenpakete beinhaltet, die nicht als getrennter Funktionsblock dargestellt ist und durch einen Zwischenspeicher realisiert sein kann. Die aus dem Netz empfangenen Datenpakete werden nach einer Verweilzeit, die z. B. 0,3 s oder 0,5 s betragen kann, an die Sprachwandler-Einheit 3 weitergeleitet. Dadurch ist es möglich, unterschiedliche Verzögerungszeiten bei der Übertragung der Datenpakete innerhalb des Netzes auszugleichen. 

 <Desc/Clms Page number 5> 

 



   Um die Ubertragungsqualltat zu verbessern, ist gemäss dem in Fig.2 dargestellten Ausfüh- rungsbeispiel der Erfindung zwischen die Verzogerungsvorrichtung 1' und die Sprachwandlerein- heit 3 eine Datenpaketbearbeitungs-Vorrichtung 6 geschaltet, die einen Steuereingang 11 aufweist. 



  Weiters ist eine Vorrichtung zur Ermittlung der aktuellen Netzwerksverzögerung 4,5 vorgesehen, die ausgangsseitig mit dem Steuereingang 11 verbunden ist. Die Datenpaketbearbeitungs- Vornchtung 6 passt die von der Verzögerungsvorrichtung 2 kommenden Datenpakete an die ermit- telte Netzwerksverzögerung an, um damit eine qualitativ bessere Sprachqualität beim Empfänger zu ermöglichen. Die Datenpakete können dabei in verschiedener Weise so bearbeitet werden, dass Veranderungen der Netzwerks-Verzögerungszeit für den Empfänger nicht mehr merkbar sind. 



   Die   Ermittlungsvorrichtung   ist dabei in Funktionsblöcke, namlich in eine Verbindungsanalyse- 
Einheit 4 und in eine Steuerungs-Einheit 5 unterteilt. 



   In der Verbindungsanalyse-Einheit 4, die eingangsseitig mit einem Ausgang des Empfangsteils 
1 verbunden ist, wird die Verzögerungszeit der Datenübertragung des Netzes laufend ermittelt. Als Ergebnis davon wird über die Steuerungs-Einheit 5 die Sprachinformation der Datenpakete in Abhängigkeit von der Netzwerks-Verzögerungszeit verändert an die Sprachwandler-Einheit 3 weitergeleitet, indem über den Steuereingang 11 eine entsprechende Beeinflussung der Datenpa- ketsbearbeitungs-Vornchtung 6 bewirkt wird. 



   Dadurch kann eine Anpassung an die tatsächlich vorherrschende Netzwerks-Verzögerungszeit vorgenommen werden. Sobald letztere anzusteigen beginnt, wird die Weitergabe der Sprachinfor- mation an die Sprachwandler-Einheit 3 entsprechend verzögert oder die Sprachinformation selbst erweitert, um das langsamere Eintreffen der Datenpakete im Empfangsteil 10 zu kompensieren. Im umgekehrten Fall wird die Sprachinformation rascher weiterverarbeitet bzw. verkürzt und damit eine schnellere Weiterleitung der Datenpakete bzw. eine Informationsreduktion ermöglicht. 



   Die Netzwerks-Verzögerungszeit der Datenübertragung kann aus der in jedem Datenpaket vorhandenen Zeitinformation, wie sie aus dem vorhandenen Echtzeit-Protokoll (real time protocol) RTP entnommen werden kann, über den Sendezeitpunkt desselben berechnet und der Mittelwert über mehrere Datenpakete hinweg gebildet werden. 



   Eine weitere anwendbare Methode die Änderung der Netzwerks-Verzögerungszeit zu ermitteln, besteht darin, aus dem Speicherstand des für die Ausbildung der Verweilzeit verwendeten Zwischenspeichers 1 die durchschnittliche Anzahl der pro Zeiteinheit in der Empfangseinheit 1 eintreffenden Datenpakete festzustellen. 



   Bei lange andauerndem Gesprächsstillstand, z.B Sendungsunterbrechung, wird die Datenbe- arbeitung auf ihrem zuletzt eingestellten Wert konstant gehalten. 



   In weiterer Ausbildung der Erfindung bestehen mehrere Möglichkeiten, eine Anpassung an die Netz-Verzögerung vorzunehmen. 



   So kann die Datenpaketbearbeitungs-Vorrichtung 6 eine Einheit zur Detektion von Gesprächs- pausen innerhalb der in der Empfangseinheit empfangenen Sprachinformation umfassen. 



   Damit werden jeweils der Beginn und das Ende von Gesprächspausen innerhalb der Sprachin- formation detektiert. Die Dauer der Gesprächspausen wird nun im ausgegebenen Sprachsignal in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit verändert, wobei bei sinkender Netzwerks-Verzögerungszeit die Gesprächspause, vorzugsweise durch Entfernen von Null-Abtastwerten der Sprachinformation, verkürzt und bei ansteigender Netzwerks- Verzögerungszeit die Gesprächspause, vorzugsweise durch Hinzufugen von Null-Abtastwerten der Sprachinformation, verlängert wird. 



   Um eine zu starke Beeinträchtigung des Gesprächs zu vermeiden, wird die Gesprächspause um nicht mehr als 20% verändert. Dieses Verfahren ist besonders bei Übertragungen der Daten- pakete mit Echtzeitprotokoll (RTP) und bereits integrierter Pausenerkennung auf der Sendeseite ohne grossen Aufwand implementierbar, da bei Eintreffen der Sprach-Datenpakete nach einer Sprachpause nur der Zeitpunkt des Wiedergabebeginns entsprechend verändert werden muss. 



   Diese Methode ist aber nur dann zielführend, wenn während des Gesprächs auch tatsächlich Gesprächspausen auftreten. Gesprachspausen werden bei Unterschreiten eines vorbestimmbaren Signalpegels festgestellt. Bei ständig vorhandenem Hintergrundpegel während eines Gespräches kann daher keine Gesprächspause auftreten. 



   Es besteht weiters die Möglichkeit, eine Anpassung der Zeitverzogerung vorzunehmen, indem ganze Pakete, z. B. 64 bis 512 Abtastwerte, aus dem Sprachsignal entnommen und verworfen 

 <Desc/Clms Page number 6> 

 werden, wenn sie zu spät beim Empfänger eintreffen, oder indem das jeweils vorhergehende Paket wiederholt wird, falls keine Daten zur Wiedergabe vorhanden sind/Diese Methode wird bereits in anderen Bereichen der Übertragungstechnik verwendet. 



   In Fig.3ist als Beispiel ein willkürlich gewählter Ausschnitt aus dem Sprachsignalverlauf wiedergegeben, der durch einen männlichen Rundfunksprecher hervorgerufen worden ist. Der 
Zeitabschnitt zwischen t1 und t2 entspricht einem Datenpaket mit z. B. 64 Abtastwerten. Das Ent- nehmen und Verwerfen dieses Datenpakets bewirkt einen Sprachsignalverlauf, wie er in Fig.4 dargestellt ist. Durch das Zusammenfügen der beiden verbleibenden Signalzüge entsteht an der 
Stelle t1, t2 eine deutlich hörbare Sprungstelle. Bei einem Sinus-Testsignal würde sich folglich eine relativ starke Verzerrung ergeben. 



   Erfindungsgemäss wird eine Verbesserung vorgenommen, indem in einem periodischen Teil des Sprachsignals eine oder mehrere, einzelne Schwingungen in Abhängigkeit von der ermittelten 
Netzwerks-Verzögerungszeit entfernt und gegebenenfalls mit vervielfachter, vorzugsweise verdop- pelter Signalperiode wieder eingefügt werden. 



   Die Zeitpunkte zur Entfernung bzw. Einfügung der Schwingungen werden vorzugsweise im 
Nulldurchgang bei positiver Signalflanke des Sprachsignals gewählt, wodurch Sprungstellen im 
Sprachsignal vermieden werden. Insgesamt kann dabei z. B. wieder ein ganzes Datenpaket ent- fernt oder hinzugefügt werden. 



   Fig.5 zeigt dazu wieder einen Sprachsignalverlauf, wie er einem gewöhnlichen Redefluss entspricht. Ein besonders gutes Ergebnis wird dann erzielt, wenn das Einfügen oder Entfernen selektiv in einem periodischen Teil des Sprachsignals vorgenommen wird. Diese Periodizität wird dadurch detektiert, dass im Signalverlauf eine Abfolge einer vorbestimmbaren Anzahl von Null- durchgängen, z. B. drei aufeinanderfolgende Nulldurchgänge, mit steigenden Flanken in konstan- tem Abstand gesucht und festgestellt wird und im Bereich dieses zeitlichen Abschnitts ein Zeitin- tervall des Signals zwischen zwei ansteigenden Flanken entfernt oder der Signalverlauf zwischen zwei ansteigenden Flanken mehrfach, vorzugsweise zweifach, hintereinander eingefügt wird.

   In   Fig.5   wurden solche geeigneten Intervalle zwischen % und t4 sowie zwischen t5 und t6 aufgefunden, in Fig. 6 ist jeweils der Signalverlauf zwischen diesen Intervallen entfernt worden, wobei aus Fig. 6 ersichtlich ist, dass die herausgeschnittenen Intervalle keine nennenswerten Verzerrungen hervor- rufen, da die verbleibenden Signalzüge ohne Sprungstellen aneinandergefügt werden. Ein Sinus- Testsignal würde bei Anwenden des erfindungsgemässen Verfahrens daher kaum verzerrt werden. 



  Auch beim Hinzufügen von einem oder mehreren identischen Signalzügen im Intervall zwischen zwei ansteigenden Flanken wird eine sehr geringe und kaum hörbare Signalverzerrung ermöglicht. 



   Dieses erfindungsgemässe Verfahren hat sich in Zusammenhang mit der Verzögerungsanpas- sung hervorragend bewährt. Der Vorgang des Heraustrennens und Einfügens von Signalabschnit- ten ist unabhängig davon auch bei anderen Sprachübertragungsanwendungen und daher unabhängig von der Datenübertragung in Netzwerken mit variabler Verzögerung auch in anderen Übertragungssystemen einsetzbar. Beispielsweise könnte dieses Verfahren auch in digitalen Mobiltelephon-Netzen Anwendung finden. 



   Schliesslich besteht eine dritte Variante eines Anpassungsverfahrens darin, in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit die Ausgaberate der Datenpakete an die Sprachwand- ler-Einheit 3 zu verändern, wobei bei ansteigender Netzwerks-Verzögerungszeit die Ausgaberate erniedrigt und bei abfallender Netzwerks-Verzögerungszeit die Ausgaberate erhöht wird. 



   Für diese Variante der Erfindung kann innerhalb der Datenpaketbearbeitungs-Vorrichtung 6 eine Vorrichtung zur Veränderung der Ausgaberate von Datenpaketen vorgesehen sein. 



   Die dadurch ermöglichte Veränderung der Abtastrate auf der Wiedergabeseite führt dazu, dass die Sprachgeschwindigkeit erhöht oder gesenkt wird, wobei auch die Stimmlage bzw. Tonhöhe eine Änderung erfährt. Eine Erhöhung der Abtastrate hat demnach eine höhere Stimmlage und die Absenkung der Abtastrate eine tiefere Stimmlage zur Folge. Um die sprechende Person wiederer- kennen zu können, kann die Abtastrate nur in einem kleinen Bereich geändert werden. Eine zusätzliche Korrektur der Frequenz ermöglicht jedoch Abtastratenänderungen in einem höheren Ausmass. 



   Zu diesem Zweck kann vorgesehen sein, dass die Datenpaketbearbeitungs-Vorrichtung 6 weiters einen Signalprozessor zur Fourier-Transformation, Frequenzbandkorrektur und Fourier- Rücktransformation umfasst. 

 <Desc/Clms Page number 7> 

 



   Mit Hilfe des Signalprozessors kann die entstehende Verschiebung des Frequenzbereiches de- rin der Sprachwandler-Einheit 3 in Sprachsignale umgewandelten Datenpakete durch Fourier- Transformation, Frequenzbandkorrektur und Fourier-Rücktransformation kompensiert werden. 



   Dadurch kann die Abtastrate in einem weitaus höheren Bereich verändert werden, die dabei auftretende Frequenzverschiebung wird durch die schnelle Fourier-Transformation und -Rücktransformation eines Signalprozessors und der zwischen diesen Operationen vornehmbaren Korrektur beseitigt. Der digitale Signalprozessor ermöglicht eine frequenzproportionale Signalver- arbeitung, sodass für den empfangenden Teilnehmer insgesamt nur eine Erhöhung oder Erniedri- gung der Sprachgeschwindigkeit hörbar wird.

   Bei hohen Verzögerungen wird der sendende Teilnehmer somit, ohne dabei die Stimmlage zu verändern, langsamer sprechend zu hören sein, während bei sehr absinkenden Verzögerungszeiten innerhalb des Netzes die im Zwischenspeicher aufgestauten Datenpakete schneller abgearbeitet werden und durch Erhöhung der Abtastrate eine dementsprechende Beschleunigung des Sprachsignals erzeugt wird. 



   Alternativ dazu kann auch eine analoge Frequenzkorrektur vorgenommen werden, zu welchem Zweck die Datenpaketbearbeitungs-Vorrichtung 6 mit einem ersten Mischglied und einem ersten Tiefpass sowie einem nachfolgenden zweiten Mischglied und einem zweiten Tiefpass ausgestattet ist. 



   Die entstehende Verschiebung des Frequenzbandes wird durch Mischung mit einer ersten Trägerfrequenz und Tiefpass-Filterung sowie nachfolgender nochmaliger Mischung mit einer zwei- ten Trägerfrequenz und Tieipass-Filterung kompensiert, wobei die Frequenzbandverschiebung die Differenz aus zweiter und erster Trägerfrequenz beträgt. 



   Bei der nach jeder Mischung erfolgenden Tiefpass-Filterung wird jeweils nur das untere Seiten- band durchgelassen, das durch die zweite Mischung um die zweite Tragerfrequenz aus seiner nach der ersten Mischung um die erste Trägerfrequenz gespiegelten Lage wieder zurückgespiegelt wird, sodass sich insgesamt eine Verschiebung des Frequenzbandes um die Differenz aus zweiter und erster Trägerfrequenz ergibt. 



   PATENTANSPRÜCHE: 
1. Verfahren zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere 
Teilnehmer verbindenden Datenübertragungs-Netzwerkes, z. B. LAN, Intranet, Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z. B.

   Internet-Protokolls, erfolgt, wobei die an einen Teilnehmer übertragenen Datenpakete beim Teilnehmer empfangen und zunächst zwischengespei- chert werden, worauf sie zeitlich verzögert in ein, vorzugsweise analoges, Sprachsignal umgewandelt werden, wobei die Verzögerungszeit der Datenübertragung des zumindest einen Netzwerkes laufend ermittelt wird und die Sprachinformation der Datenpakete in 
Abhängigkeit von der aktuellen Netzwerks-Verzögerungszeit verändert wird, dadurch gekennzeichnet, dass in einem periodischen Teil des Sprachsignals eine oder mehrere, einzelne Schwingungen in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit entfernt und gegebenenfalls mit vervielfachter, vorzugsweise verdoppelter Signalperiode wieder eingefügt werden, wobei die Zeitpunkte zur Entfernung bzw.

   Einfügung der Schwin- gungen vorzugsweise im Nulldurchgang bei positiver Signalflanke des Sprachsignals gewählt werden.

Claims (1)

  1. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass im Signalverlauf des Sprach- signals eine Abfolge einer vorbestimmbaren Anzahl von Nulldurchgängen, z. B. drei aufeinanderfolgende Nulldurchgänge, mit steigenden Flanken in konstantem Zeitabstand gesucht und festgestellt wird und im Bereich dieses zeitlichen Abschnitts ein Zeitintervall des Sprachsignals zwischen zwei ansteigenden Flanken entfernt oder der Signalverlauf zwischen zwei ansteigenden Flanken mehrfach, vorzugsweise zweifach, hintereinander eingefügt wird.
    3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Netzwerks- Verzögerungszeit der Datenübertragung aus der in jedem Datenpaket vorhandenen Zeitin- formation über den Sendezeitpunkt desselben berechnet und der Mittelwert über mehrere <Desc/Clms Page number 8> Datenpakete hinweg gebildet wird.
    4. Verfahren nach Anspruch 1,2 oder 3, dadurch gekennzeichnet, dass die Änderung der Netzwerks-Verzögerungszeit durch Messung der durchschnittlichen Anzahl der pro Zeit- einheit in der Empfangseinheit (10) eintreffenden Datenpakete ermittelt wird.
    5. Verfahren zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzwerkes, z. B. LAN, Intranet, Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, wobei die an einen Teilnehmer übertragenen Datenpakete beim Teilnehmer empfangen und zunächst zwischengespei- chert werden, worauf sie zeitlich verzögert in ein, vorzugsweise analoges, Sprachsignal umgewandelt werden, wobei die Verzögerungszeit der Datenübertragung des zumindest einen Netzwerkes laufend ermittelt wird und die Sprachinformation der Datenpakete in Abhängigkeit von der aktuellen Netzwerks-Verzögerungszeit verändert wird, dadurch gekennzeichnet,
    dass in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit die Ausgaberate der Datenpakete an die Sprachwandler-Einheit (3) verändert wird, wobei bei ansteigender Netzwerks-Verzögerungszeit die Ausgaberate erniedrigt und bei abfallender Netzwerks-Verzögerungszeit die Ausgaberate erhöht wird.
    6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die entstehende Verschie- bung des Frequenzbereiches durch Fourier-Transformation, Frequenzbandkorrektur und Fourier-Rücktransformation, kompensiert wird.
    7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die entstehende Verschie- bung des Frequenzbandes durch Mischung mit einer ersten Trägerfrequenz und Tiefpass- Filterung sowie nachfolgender nochmaliger Mischung mit einer zweiten Trägerfrequenz und Tiefpass-Filterung kompensiert wird, wobei die Frequenzbandverschiebung die Diffe- renz aus zweiter und erster Trägerfrequenz beträgt.
    HIEZU 2 BLATT ZEICHNUNGEN
AT198598A 1998-11-26 1998-11-26 Übertragungssystem zur übertragung von sprachinformation AT410876B (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
AT198598A AT410876B (de) 1998-11-26 1998-11-26 Übertragungssystem zur übertragung von sprachinformation
AU15000/00A AU1500000A (en) 1998-11-26 1999-11-25 System for transmitting speech information
PCT/AT1999/000290 WO2000033520A1 (de) 1998-11-26 1999-11-25 System fur übertragung von sprachinformation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
AT198598A AT410876B (de) 1998-11-26 1998-11-26 Übertragungssystem zur übertragung von sprachinformation

Publications (2)

Publication Number Publication Date
ATA198598A ATA198598A (de) 2002-12-15
AT410876B true AT410876B (de) 2003-08-25

Family

ID=3525358

Family Applications (1)

Application Number Title Priority Date Filing Date
AT198598A AT410876B (de) 1998-11-26 1998-11-26 Übertragungssystem zur übertragung von sprachinformation

Country Status (3)

Country Link
AT (1) AT410876B (de)
AU (1) AU1500000A (de)
WO (1) WO2000033520A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0004838D0 (sv) 2000-12-22 2000-12-22 Ericsson Telefon Ab L M Method and communication apparatus in a communication system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790538A (en) * 1996-01-26 1998-08-04 Telogy Networks, Inc. System and method for voice Playout in an asynchronous packet network

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CASTEL-BRANCO LUIS ET AL., ''CLOCK RECOVERY FOR CIRCUIT EMULATION SERVICES OVER ATM'', BROADBAND COMMUNICATIONS, 1996, GLOBAL INFRASTRUCTURE FOR THE INFORMATION AGE, PROCEEDINGS OF THE INTERNATIONAL IFIP-IEEE CONFERENCE O, 1996, S. 617-625 *
MONTGOMERY, WARREN A., ''TECHNIQUES FOR PACKET VOICE SYNCHRONIZATION'', IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, VOL. SAC-1, NO. 6, DECEMBER 1983, S. 1022-1028 *

Also Published As

Publication number Publication date
ATA198598A (de) 2002-12-15
AU1500000A (en) 2000-06-19
WO2000033520A1 (de) 2000-06-08

Similar Documents

Publication Publication Date Title
DE60126513T2 (de) Verfahren zum ändern der grösse eines zitlerpuffers zur zeitausrichtung, kommunikationssystem, empfängerseite und transcoder
DE60034484T2 (de) Verfahren und vorrichtung in einem kommunikationssystem
DE60129327T2 (de) Anordnung und verfahren in bezug auf die vermittlung von sprache
DE10190890B4 (de) Teilpaketeinfügung zur Paketverlustkompensation in Internet-Telefonienetzwerken
EP2047669A1 (de) Verfahren zum durchführen einer audiokonferenz, audiokonferenzeinrichtung und umschalteverfahren zwischen kodierern
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
DE60224005T2 (de) Verfahren und vorrichtung zur verarbeitung von mehreren audiobitströmen
DE102004039186B4 (de) Verfahren und Vorrichtung zur Kompensation von Laufzeitschwankungen von Datenpaketen
DE10046939A1 (de) Tauchankersystem mit Anschlagdämpfung
DE10320917A1 (de) Verfahren und Schaltung zur Crestfaktor-Reduzierung
WO2003010929A1 (de) Verfahren und anordnung zur übermittlung von daten aus einem ersten datennetz in ein zweites datennetz
AT410876B (de) Übertragungssystem zur übertragung von sprachinformation
DE4316776A1 (de) Frequenzmodulationsempfänger
EP1349334B1 (de) Verfahren zur Einstellung eines Jitterpuffers in einem Media Gateway
DE60310752T2 (de) Datenzugriffsprozess
DE2455584A1 (de) Anti-larsen-einrichtung
DE102006036562B4 (de) Verfahren und System zum Übertragen aufeinander bezogener Datenströme oder/und zum Synchronisieren aufeinander bezogener Datenströme
DE4325354C1 (de) Verfahren und Anordnung zur Ausgabe von digitalen Sprachsignalen
DE19814633C2 (de) Verfahren zur Verschleierung von Sprachsegmentverlusten bei paketorientierter Übertragung
EP2223523B1 (de) Verfahren und empfangseinrichtung zum synchronisieren eines paketorientiert empfangenen mit einem gebildeten tonsignal
AT409055B (de) Übertragungssystem zur übertragung von sprachinformationen
DE60017565T2 (de) Verfahren zur verwaltung der tonsignalkodierung und -wiedergabe in einem asynchronen übertragungssystem
EP1191749A2 (de) Verfahren und Vorrichtung zur Verbesserung der Übertragungsqualität in einem paket-orientierten Datenübertragungsnetz
DE2112288B2 (de) Nachrichtenuebertragungssystem mit wenigstens zwei Endstellen zur digitalen UEbertragung von Sprache
DE10228861B4 (de) Verfahren zur Übertragung von zeitsynchronen Daten

Legal Events

Date Code Title Description
ELJ Ceased due to non-payment of the annual fee