WO2000033520A1 - System for transmitting speech information - Google Patents

System for transmitting speech information Download PDF

Info

Publication number
WO2000033520A1
WO2000033520A1 PCT/AT1999/000290 AT9900290W WO0033520A1 WO 2000033520 A1 WO2000033520 A1 WO 2000033520A1 AT 9900290 W AT9900290 W AT 9900290W WO 0033520 A1 WO0033520 A1 WO 0033520A1
Authority
WO
WIPO (PCT)
Prior art keywords
data packets
transmission
speech
time
network
Prior art date
Application number
PCT/AT1999/000290
Other languages
German (de)
French (fr)
Inventor
Gerhard Zimmermann
Original Assignee
Ericsson Austria Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Austria Aktiengesellschaft filed Critical Ericsson Austria Aktiengesellschaft
Priority to AU15000/00A priority Critical patent/AU1500000A/en
Publication of WO2000033520A1 publication Critical patent/WO2000033520A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/062Synchronisation of signals having the same nominal but fluctuating bit rates, e.g. using buffers
    • H04J3/0632Synchronisation of packets and cells, e.g. transmission of voice via a packet network, circuit emulation service [CES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport

Definitions

  • the invention relates to a transmission system for the transmission of voice information within at least one data transmission network, e.g. LAN, intranet, Internet, in which the transmission by means of data packets based on at least one common protocol, e.g. Internet protocol, where each participant is connected to the network via a transmitting and receiving unit and the receiving unit, a receiving part, a voice converter unit for converting the data packets into a, preferably analog, voice signal and a device for delaying the received data packets, e.g. an intermediate memory, via which the received data packets can be forwarded to the speech converter unit after a dwell time.
  • a data transmission network e.g. LAN, intranet, Internet
  • a common protocol e.g. Internet protocol
  • networks such as LAN, intranet, internet or the like, based on a standardized protocol, e.g. based on the Internet protocol, each network subscriber is assigned an address from which data can be sent to other subscribers or from which data sent by other subscribers can be received. Since voice can also be transmitted in the form of digital data, such networks can also be used for voice transmission.
  • the type of network and the transmission protocol is not limited in the context of the invention to the abovementioned known designations; the invention can also be applied to all possible networks which are networked with one another and which can be linked to one another at certain points via transformation units (gateways).
  • the voice transmission takes place in defined packets which are sent from the sending point to a receiver and are received by the latter.
  • the packets are composed in a sequential order from the digitized samples of the voice signal to be sent and can be correspondingly coded for transmission on the sending side and decoded on receipt at the receiving end.
  • the received sample values are again combined to form a speech signal, whereby speech signal is understood to mean all acoustic vibrations located in the audible range.
  • speech signal is understood to mean all acoustic vibrations located in the audible range.
  • the special feature of voice transmission in data transmission networks is that the transmission bandwidth is not always guaranteed by the network provider.
  • a system for the switching and transmission of voice signals over a packet-switching network, in particular over the Internet, and a conventional telephone network is e.g. in WO-A-97/14238. This enables a telephone connection from a telephone terminal to a computer connected to the Internet.
  • the receiver can compensate for the delays by longer waiting times without noticeable disadvantages, while voice transmissions are not possible with longer delays.
  • some data packets are therefore always kept ready by buffering in order to be able to replace the delays or losses that occur, for example by repeating the previous data packet in each case.
  • the lost data packets can also be replaced by a noise signal.
  • a high transmission quality can be achieved if the transmitted and converted data packets only after a e.g. by temporarily storing the data packets, a certain dwell time can be output as a reassembled voice signal at the receiver, since this makes it possible to compensate accordingly for the delay occurring on the transmission path.
  • Defined standards set maximum transmission runtimes of e.g. 400 ms (Tiphon Class A) and 600 ms (Tiphon Class B) fixed. An even higher delay would be disruptive for a flowing dialogue. With a running time of 0.4 s, the sending subscriber has a response time of 0.8 s due to the time shift in the transmission of the voice information and the response from the recipient, which means that the flow of the conversation can still be maintained.
  • the Tiphon Class B standard allows a runtime of 0.6s per transmission direction, but the response time is already 1.2s, which clearly shows that there are disabilities in the conversation.
  • the walkie-talkie effect that occurs forces you to consciously wait for the other party's answer.
  • Previously known implementations work with constant delays, the dwell times being less than 400 ms, and optionally use methods known for example from mobile radio technology to replace lost or late voice data packets.
  • the resulting pause is either repeated by a zero value output of the speech signals (silence) or repeated, too modified voice data packets bridged. If delayed data packets arrive late, they will be discarded. In the case of longer delays, this procedure either leads to choppy or distorted or noisy reproduction and results in poor transmission quality.
  • the object of the invention is to provide a transmission system of the type mentioned at the beginning, with the aid of which the influence of the delays which change during the transmission of the data within the network can be compensated for, without this leading to a noticeable deterioration in the voice transmission quality.
  • the receiving unit has a device for determining the current network delay, which is connected on the output side to the control input of a data packet processing device which is connected between the delay device and the voice converter unit, the data packet processing device coming from the delay device Adapts data packets to the determined network delay.
  • the network delay time can be monitored and a corresponding continuous adaptation to the prevailing conditions in the network can be carried out without there being any noticeable deterioration in the sound of the transmission.
  • the data packets are forwarded to the speech converter unit after being temporarily stored in the delay device in the data packet processing device as a function of the determined network delay time.
  • the determining device is connected on the input side to an output of the receiving part.
  • the data packet processing device comprises a unit for detecting pauses in the speech received in the receiving unit.
  • the data packet processing device can comprise a device for changing the output rate of data packets, which makes it possible to increase or decrease the speech speed and thus to compensate for low or high delays within the network.
  • the change in the voice position of the voice signal that occurs can be compensated for in that, according to a further exemplary embodiment of the invention, the data packet processing device further comprises a signal processor for Fourier transformation, frequency band correction and Fourier inverse transformation. With its help, the voice position for the receiving participant can be brought back to the usual level of the voice position without any noticeable loss of quality, so that only an increase or decrease in the speech speed is audible.
  • the data packet processing device can further comprise a first mixing element and a first low-pass filter and a subsequent second mixing element and a second low-pass filter. This makes it possible to compensate for a frequency band shift even in analog form.
  • the invention further relates to a method for the transmission of voice information within at least one data transmission network connecting several participants, e.g. LAN, intranet, Internet, in which the transmission by means of data packets based on at least one common protocol, e.g. Internet protocol, where each participant is connected to the network via a transmitting and receiving unit and the receiving unit has a receiving part, a voice converter unit for converting the data packets into a, preferably analog, voice signal and a device for delaying the received data packets, e.g. comprises a buffer, via which the received data packets are forwarded to the speech converter unit after a dwell time.
  • a common protocol e.g. Internet protocol
  • the object of the invention is to provide a method with which a high transmission quality can be achieved despite the delay times caused by the network.
  • this is achieved in that the delay time of the data transmission of the at least one network is continuously determined and that the voice information of the data packets is passed on to the voice converter unit as a function of the network delay time.
  • the transmitted voice information can be continuously adapted to the current delay time of data transmission within the network, which means that the voice information at the receiver can be changed but with a relatively high reproduction quality.
  • the network delay time of the data transmission is calculated from the time information in each data packet about the time of transmission of the same and that the mean value is formed over several data packets.
  • the time information already present in the data packet can be used for an analysis of the delays occurring within the network transmission.
  • the change in the network delay time can be determined by measuring the average number of data packets arriving in the receiving unit per time unit. As the delay time increases, the number of incoming data packets in the buffer, which can be provided for generating the dwell time, decreases. As soon as such a change is registered, the data packets or the speech information can be passed on to the speech converter unit in a modified manner in order to avoid that there is a shortage of data packets that can be output. If the delay time decreases, the forwarding of the data packets can be accelerated, for example, and thus pent-up data packets can be forwarded faster.
  • the start and end of pauses in the speech information are detected, and that the duration of the pauses in the output voice signal is changed depending on the determined network delay time, with decreasing network -Delay time shortens the pause in the conversation, preferably by removing zero samples of the voice information, and, as the network delay time increases, the pause in conversation, preferably by adding zero samples of the voice information, is extended.
  • This possibility of adapting to the prevailing delay times only changes the duration of the pauses in the conversation for the receiving subscriber, otherwise the transferred call is passed on in unchanged form.
  • This type of adaptation can be implemented in a particularly simple manner for subscribers for whom a device for detecting pauses in conversation is already provided.
  • Another variant of the delay adjustment is that one or more, individual oscillations are removed in a periodic part of the speech signal depending on the determined network delay time and, if necessary, are reinserted with a multiplied, preferably doubled signal period, the times for removal or insertion the vibrations are preferably selected at the zero crossing with a positive signal edge of the speech signal.
  • a very distortion-free adaptation to the delay can take place if, according to a further exemplary embodiment of the invention, it is provided that a sequence of a predeterminable number of zero crossings, for example three consecutive zero crossings, with rising edges is searched for and determined at a constant time interval and in the range this time segment removes a time interval of the signal between two rising edges or the signal curve between two rising edges is inserted several times, preferably twice, one after the other.
  • a suitable adaptation of the delay time within the network can also be achieved by increasing or decreasing the speech speed. It can therefore be provided in a further embodiment of the invention that the output rate of the data packets to the voice converter unit is changed as a function of the determined network delay time, the output rate being reduced as the network delay time increases and the output rate increasing as the network delay time decreasing .
  • this can be eliminated by compensating for the resulting shift in the frequency range by means of Fourier transformation, frequency band correction and Fourier inverse transformation.
  • the speech signal is output faster or slower, but the change in voice position is normalized again by the frequency range shift.
  • the resulting shift in the frequency band is compensated for by mixing with a first carrier frequency and low-pass filtering and subsequent mixing again with a second carrier frequency and low-pass filtering, the frequency band shift being the difference between the second and the first Carrier frequency is.
  • a frequency band correction can also be carried out in this way, but the analog mixing shifts the frequencies disproportionately.
  • Fig.l the receiving unit of a transmission system according to the prior art
  • FIG. 2 shows an embodiment of the receiving unit of a transmission system according to the invention
  • FIG. 4 shows the speech signal curve according to FIG. 3, in which a delay adjustment of an embodiment of the method according to the invention has been carried out;
  • FIG. 6 shows the speech signal curve according to FIG. 5, in which a further embodiment of the inventive method for delay adaptation has been carried out.
  • FIG. 1 shows a receiving unit 10 of a transmission system for the transmission of voice information within a data transmission network, such as LAN, intranet, Internet, which does not show, and which connects several subscribers, as is known in the prior art.
  • the data to be transmitted are divided into data packets and exchanged between the participants during the transmission, the transport of the data packets being managed within the respective network depending on the available transmission lines. It is also possible to use a plurality of networks coupled to one another for such a voice transmission, suitable units having to be provided for conversion in the case of different protocols in these networks.
  • the transmission of the data packets takes place on the basis of the Internet protocol (IP), each participant being connected to the IP network via the receiving unit 10 and a transmitting unit (not shown in FIG. 1).
  • the receiving unit 10 comprises a receiving part 1 and a speech converter unit 3 for converting the data packets into a speech signal, which in the exemplary embodiment according to FIG. 1 in PCM coding is forwarded to a telephone network, a private branch exchange or a subscriber terminal, where it is transmitted directly can be processed further. Any other type of forwarding or use of the received signals is conceivable.
  • the speech converter unit 3 can also convert into analog speech signals.
  • a decoder unit 2 is provided between the receiving part 1 and the speech converter unit 3, in the event that the transmitted voice data is encoded on the transmitter side.
  • the receiving part 1 contains a device for delaying 1 'of the received data packets, which is not shown as a separate function block and can be implemented by a buffer.
  • the data packets received from the network are stored after a dwell time, e.g. Can be 0.3 s or 0.5 s, forwarded to the speech converter unit 3. This makes it possible to compensate for different delay times in the transmission of the data packets within the network.
  • a data packet processing device 6 which has a control input 11, is connected between the delay device 1 'and the speech converter unit 3. Furthermore, a device for determining the current network delay 4, 5 is provided, which is connected on the output side to the control input 11.
  • the data packet processing device 6 adapts the data packets coming from the delay device 2 to the determined network delay in order to enable a better quality voice quality at the receiver.
  • the data packets can be processed in various ways so that changes in the network delay time are no longer noticeable to the receiver.
  • the determination device is divided into functional blocks, namely into a connection analysis unit 4 and into a control unit 5.
  • connection analysis unit 4 which is connected on the input side to an output of the receiving part 1, the delay time of the data transmission of the network is continuously determined.
  • the voice information of the data packets is changed via the control unit 5 as a function of the network delay time and is forwarded to the voice converter unit 3 by influencing the data packet processing device 6 via the control input 11.
  • the network delay time of the data transmission can be calculated from the time information present in each data packet, as can be found in the existing real-time protocol (RTP), over the time of the transmission thereof, and the mean value can be formed over several data packets.
  • RTP real-time protocol
  • Another method that can be used to determine the change in the network delay time consists in determining the average number of data packets arriving in the receiving unit 1 per unit of time from the storage status of the buffer store 1 ′ used for the formation of the dwell time.
  • the data processing is kept constant at its last set value.
  • the data packet processing device 6 can thus comprise a unit for the detection of pauses in conversation within the speech information received in the receiving unit.
  • the start and end of pauses in the conversation are thus detected within the speech information.
  • the duration of the pauses in the speech is now changed in the output voice signal as a function of the determined network delay time, with the pause in the network decreasing, preferably by removing zero samples of the voice information, and the pause in the network delay increasing, preferably by increasing the network delay Adding zero samples of the speech information is extended.
  • the pause in the conversation is not changed by more than 20%.
  • This method is particularly useful for transfers of data packets with real-time protocol (RTP) and is already integrated Pause detection can be implemented on the transmission side with little effort, since when the voice data packets arrive after a voice pause, only the point in time at which playback starts has to be changed accordingly.
  • RTP real-time protocol
  • FIG. 3 shows an example of an arbitrarily selected section from the speech signal course, which was caused by a male broadcaster.
  • the time period between t and t2 corresponds to a data packet with, for example, 64 samples.
  • the removal and discarding of this data packet causes a voice signal waveform as shown in FIG. 4.
  • the joining of the two remaining signal trains creates a clearly audible jump point at the points t j , t2.
  • a sinusoidal test signal would result in a relatively strong distortion.
  • an improvement is made by removing one or more individual vibrations in a periodic part of the speech signal depending on the determined network delay time and, if necessary, reinserting them with a multiplied, preferably doubled signal period.
  • the times for the removal or insertion of the vibrations are preferably selected in the zero crossing with a positive signal edge of the speech signal, as a result of which jumps in the speech signal are avoided. Overall, e.g. an entire data packet can be removed or added again.
  • FIG. 5 shows a speech waveform as it corresponds to an ordinary speech flow.
  • a particularly good result is achieved if the insertion or removal is carried out selectively in a periodic part of the speech signal.
  • This periodicity is detected by searching for and determining a sequence of a predeterminable number of zero crossings, for example three consecutive zero crossings, with rising edges at a constant distance in the signal curve and removing a time interval of the signal between two rising edges or the signal in the area of this time segment course between two rising edges is inserted several times, preferably twice, one after the other.
  • Such suitable intervals between t ⁇ and t ⁇ and between t $ and tg were found in FIG. 5, the signal curve between these intervals has been removed in FIG. 6, wherein it can be seen from FIG.
  • This method according to the invention has proven itself extremely well in connection with the delay adjustment.
  • the process of separating and inserting signal sections can also be used independently of this in other voice transmission applications and therefore independently of data transmission in networks with variable delays in other transmission systems.
  • this method could also be used in digital mobile phone networks.
  • a third variant of an adaptation method consists in changing the output rate of the data packets to the speech converter unit 3 as a function of the determined network delay time, the output rate being reduced as the network delay time increases and the output rate increasing as the network delay time decreasing.
  • a device for changing the output rate of data packets can be provided within the data packet processing device 6.
  • the resulting change in the sampling rate on the playback side leads to the speech speed being increased or decreased, the voice position or pitch also experiencing a change.
  • An increase in the sampling rate therefore results in a higher voice position and a lowering in the sampling rate results in a lower voice position.
  • the sampling rate can only be changed in a small range.
  • an additional correction of the frequency enables sample rate changes to a greater extent.
  • the data packet processing device 6 further comprises a signal processor for Fourier transformation, frequency band correction and Fourier inverse transformation.
  • the resulting shift in the frequency range of the data packets converted into speech signals in the speech converter unit 3 can be compensated for by Fourier transformation, frequency band correction and Fourier inverse transformation.
  • the sampling rate can be changed in a much higher range, the frequency shift which occurs is eliminated by the rapid Fourier transformation and inverse transformation of a signal processor and the correction which can be carried out between these operations.
  • the digital signal processor enables frequency-proportional signal processing, so that only an increase or decrease in the speech speed can be heard by the receiving subscriber overall. at high delays, the sending subscriber will thus be able to be heard more slowly without changing the voice position, while with very declining delay times within the network, the data packets pent up in the buffer will be processed more quickly and a corresponding acceleration of the voice signal will be generated by increasing the sampling rate.
  • an analog frequency correction can also be carried out, for which purpose the data packet processing device 6 is equipped with a first mixing element and a first low-pass filter and a subsequent second mixing element and a second low-pass filter.
  • the resulting shift in the frequency band is compensated for by mixing with a first carrier frequency and low-pass filtering and subsequent subsequent mixing with a second carrier frequency and low-pass filtering, the frequency band shift being the difference between the second and first carrier frequency.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

The invention relates to a transmission system for transmitting speech information within at least one data transmission network connecting several subscribers, for example LAN, Intranet, Internet. In said system transmission is carried out by means of data packets on the basis of at least one shared protocol, for example the Internet protocol. Each subscriber has a receiver unit (10) and a device for time-delaying (6) the data packets received, for example a temporary storage, via which the data packets received can be sent to the speech conversion unit after a dwell time. The receiver unit (10) comprises a device for determining the current network time-delay (4, 5) which on the output side is connected to the control input of a data packet processing device (6) arranged between the time-delay device (1') and speech conversion unit (3). The data packet processing device (6) adjust the data packets arriving from the time-delay device (2) to the network time-delay having been determined.

Description

SYSTEM FÜR ÜBERTRAGUNG VON SPRACHINFORMATION VOICE INFORMATION TRANSMISSION SYSTEM
Die Erfindung betrifft ein Übertragungssystem zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzwerkes, z.B. LAN, Intranet, Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, wobei jeder Teilnehmer über eine Sende- und Empfangseinheit mit dem Netzwerk in Verbindung steht und die Empfangseinheit, einen Empfangsteil, eine Sprachwandlereinheit zur Umwandlung der Datenpakete in ein, vorzugsweise analoges, Sprachsignal und eine Vorrichtung zur Verzögerung der empfangenen Datenpakete, z.B. einen Zwischenspeicher, umfaßt, über die die empfangenen Datenpakete nach einer Verweilzeit an die Sprachwandler-Einheit weiterleitbar sind.The invention relates to a transmission system for the transmission of voice information within at least one data transmission network, e.g. LAN, intranet, Internet, in which the transmission by means of data packets based on at least one common protocol, e.g. Internet protocol, where each participant is connected to the network via a transmitting and receiving unit and the receiving unit, a receiving part, a voice converter unit for converting the data packets into a, preferably analog, voice signal and a device for delaying the received data packets, e.g. an intermediate memory, via which the received data packets can be forwarded to the speech converter unit after a dwell time.
In Netzwerken, wie z.B. LAN, Intranet, Internet o.a., die auf einem standardisierten Protokoll, z.B. dem Internet-Protokoll basieren, ist jedem Netzteilnehmer eine Adresse zugeordnet, von der Daten an andere Teilnehmer gesendet bzw. an der von anderen Teilnehmern abgeschickte Daten empfangen werden können. Da auch Sprache in Form von digitalen Daten übertragbar ist, können solche Netze auch zur Sprachübertragung herangezogen werden. Die Art des Netzwerks und des Übertragungsprotokolls ist im Rahmen der Erfindung nicht auf die vorstehend genannten bekannten Bezeichnungen eingeschränkt, die Erfindung läßt sich auch auf alle möglichen miteinander vernetzten Netzwerke anwenden, die an bestimmten Punkten über Transformationseinheiten (Gateways) miteinander verknüpft sein können.In networks such as LAN, intranet, internet or the like, based on a standardized protocol, e.g. based on the Internet protocol, each network subscriber is assigned an address from which data can be sent to other subscribers or from which data sent by other subscribers can be received. Since voice can also be transmitted in the form of digital data, such networks can also be used for voice transmission. The type of network and the transmission protocol is not limited in the context of the invention to the abovementioned known designations; the invention can also be applied to all possible networks which are networked with one another and which can be linked to one another at certain points via transformation units (gateways).
Bei bisher bekannten Sprachübertragungssystemen der eingangs genannten Art erfolgt die Sprachübertragung in definierten Paketen, die von der Sendestelle an einen Empfänger ausgesendet und von diesem in Empfang genommen werden. Die Pakete werden zu diesem Zweck in nacheinanderfolgender Reihenfolge aus den digitalisierten Abtastwerten des zu sendenden Sprachsignals zusammengesetzt und können für die Übertragung auf der Sendeseite entsprechend kodiert und nach ihrem Empfang auf der Empfängerseite dekodiert werden. Die empfangenen Abtastwerte werden wieder zu einem Sprachsignal zusammengesetzt, wobei unter Sprachsignal alle im hörbaren Bereich gelegenen, akustischen Schwingungen verstanden wird. Im Unterschied zur Übertragung über Telephonleitungen besteht die Besonderheit der Sprachübertragung in Datenübertragungsnetzen darin, daß die Übertragungsbandbreite vom Netzanbieter nicht immer garantiert wird. Ebenso erfolgen an verschiedenen Knoten je nach Vorliegen von freien Leitungen ständige Änderungen des vermittelten Pfades, über den die Übertragung der Datenpakete vorgenommen wird. Aufgrund der unterschiedlichen Laufzeiten oder unterschiedlichen Datenwege können später ausgesendete Datenpakete beim Empfänger früher ankommen als vor diesen ausgesendete Datenpakete. Durch derartige Verzögerungseffekte kann es geschehen, daß einzelne Datenpakete nicht zum richtigen Zeitpunkt beim Empfänger eintreffen und daher nicht rechtzeitig verfügbar sind. Weiters können die Datenpakete durch Übertragungsfehler verloren gehen.In the case of previously known voice transmission systems of the type mentioned at the outset, the voice transmission takes place in defined packets which are sent from the sending point to a receiver and are received by the latter. For this purpose, the packets are composed in a sequential order from the digitized samples of the voice signal to be sent and can be correspondingly coded for transmission on the sending side and decoded on receipt at the receiving end. The received sample values are again combined to form a speech signal, whereby speech signal is understood to mean all acoustic vibrations located in the audible range. In contrast to transmission over telephone lines, the special feature of voice transmission in data transmission networks is that the transmission bandwidth is not always guaranteed by the network provider. Similarly, depending on the presence of free lines, there are constant changes to the switched path via which the data packets are transmitted. Due to the different transit times or different data paths, data packets sent later can arrive at the receiver earlier than data packets sent before them. Such delay effects can mean that individual data packets do not arrive at the receiver at the right time and therefore do not are available on time. The data packets can also be lost due to transmission errors.
Bei größeren Netzen, wie zum Beispiel im Internet, sind die Schwankungen der Übertragungsverzögerungen deutlich merkbar und hängen von der jeweiligen gerade vorhandenen Belastung durch die verschiedenen Teilnehmer ab. Neben tageszeitenbedingten Änderungen können durch bestimmte Ereignisse hervorgerufene Verlangsamungen auftreten, die in keiner Weise vorhersehbar sind.With larger networks, such as the Internet, the fluctuations in transmission delays are clearly noticeable and depend on the current load on the various participants. In addition to changes due to the time of day, slowdowns caused by certain events can occur that are in no way predictable.
Ein System zur Vermittlung und Übertragung von Sprachsignalen über ein paketvermittelndes Netzwerk, insbesondere über das Internet, und ein herkömmliches Telephon-Netzwerk ist z.B. in der WO-A-97/14238 beschrieben. Mit diesem ist eine Telephonverbindung von einem Telephon- Endgerät zu einem mit dem Internet verbundenen Rechner möglich.A system for the switching and transmission of voice signals over a packet-switching network, in particular over the Internet, and a conventional telephone network is e.g. in WO-A-97/14238. This enables a telephone connection from a telephone terminal to a computer connected to the Internet.
Bei reinen Datenübertragungen kann der Empfänger die Verzögerungen durch längere Wartezeiten ohne merkbare Nachteile ausgleichen, während Sprachübertragungen bei längeren Verzögerungen nicht möglich sind.In the case of pure data transmissions, the receiver can compensate for the delays by longer waiting times without noticeable disadvantages, while voice transmissions are not possible with longer delays.
Um eine akzeptable Wiedergabequalität zu erzielen, werden daher jeweils immer einige Datenpakete durch Zwischenspeicherung bereitgehalten, um die auftretenden Verzögerungen oder Verluste ersetzen zu können, indem beispielsweise das jeweils vorhergehende Datenpaket wiederholt wird. Schließlich können die verlorengegangenen Datenpakete auch durch ein Rauschsignal ersetzt werden.In order to achieve an acceptable reproduction quality, some data packets are therefore always kept ready by buffering in order to be able to replace the delays or losses that occur, for example by repeating the previous data packet in each case. Finally, the lost data packets can also be replaced by a noise signal.
Eine hohe Übertragungsqualität läßt sich dann erreichen, wenn die übertragenen und gewandelten Datenpakete erst nach einer z.B. durch Zwischenspeicherung der Datenpakete bestimmten Verweilzeit als wieder zusammengesetztes Sprachsignal beim Empfänger ausgegeben werden, da es dadurch möglich ist, die auf dem Übertragungsweg auftretende Verzögerung entsprechend auszugleichen. Dafür definierte Standards legen maximale Übertragungs-Laufzeiten von z.B. 400 ms (Tiphon Class A) und 600 ms (Tiphon Class B) fest. Eine noch höhere Verzögerung würde für einen fließenden Dialog als störend empfunden werden. Bei 0,4 s Laufzeit entsteht beim sendenden Teilnehmer bedingt durch die Zeitverschiebung bei der Hin-Übertragung der Sprachinformation und die darauf erfolgende Antwort des Empfängers eine Reaktionszeit von 0,8 s, wodurch der Gesprächsfluß noch gut aufrechterhalten werden kann. Der Tiphon Class B-Standard erlaubt eine Laufzeit von 0,6s pro Übertragungsrichtung, die Reaktionszeit beträgt aber bereits 1,2 s, wodurch Gesprächsbehinderungen deutlich zutage treten. Der dabei auftretende Walkie- Talkie-Effekt erzwingt ein bewußtes Abwarten der Antwort des anderen Gesprächsteilnehmers.A high transmission quality can be achieved if the transmitted and converted data packets only after a e.g. by temporarily storing the data packets, a certain dwell time can be output as a reassembled voice signal at the receiver, since this makes it possible to compensate accordingly for the delay occurring on the transmission path. Defined standards set maximum transmission runtimes of e.g. 400 ms (Tiphon Class A) and 600 ms (Tiphon Class B) fixed. An even higher delay would be disruptive for a flowing dialogue. With a running time of 0.4 s, the sending subscriber has a response time of 0.8 s due to the time shift in the transmission of the voice information and the response from the recipient, which means that the flow of the conversation can still be maintained. The Tiphon Class B standard allows a runtime of 0.6s per transmission direction, but the response time is already 1.2s, which clearly shows that there are disabilities in the conversation. The walkie-talkie effect that occurs forces you to consciously wait for the other party's answer.
Bisher bekannte Implementierungen arbeiten mit konstanten Verzögerungen, wobei die Verweilzeiten kleiner als 400 ms betragen, und benutzen dabei gegebenenfalls z.B. aus der Mobilfunktechnik bekannte Verfahren, um verlorengegangene oder verspätete Sprachdatenpakete zu ersetzen. Im Falle fehlender Datenpakete wird die entstehende Pause entweder durch eine Nullwertausgabe der Sprachsignale (Stille) oder wiederholte, auch modifizierte Sprach-Datenpakete überbrückt. Sollten verzögerte Datenpakete verspätet eintreffen, werden diese verworfen. Diese Vorgangsweise führt im Falle von länger andauernden Verzögerungen entweder zu abgehackter oder verzerrter bzw. verrauschter Wiedergabe und ergibt eine schlechte Übertragungsqualität.Previously known implementations work with constant delays, the dwell times being less than 400 ms, and optionally use methods known for example from mobile radio technology to replace lost or late voice data packets. In the event of missing data packets, the resulting pause is either repeated by a zero value output of the speech signals (silence) or repeated, too modified voice data packets bridged. If delayed data packets arrive late, they will be discarded. In the case of longer delays, this procedure either leads to choppy or distorted or noisy reproduction and results in poor transmission quality.
Die Aufgabe der Erfindung besteht darin, ein Übertragungssystem der eingangs genannten Art anzugeben, mit dessen Hilfe der Einfluß der sich während der Übertragung der Daten innerhalb des Netzes ändernden Verzögerungen kompensiert werden kann, ohne daß es dabei zu einer merkbaren Verschlechterung der Sprachübertragungsqualität kommt. Im Falle einer guten Netzwerksverbindung soll es weiters möglich sein, die Sprachinformation mit nur geringer Verzögerung zu empfangen.The object of the invention is to provide a transmission system of the type mentioned at the beginning, with the aid of which the influence of the delays which change during the transmission of the data within the network can be compensated for, without this leading to a noticeable deterioration in the voice transmission quality. In the case of a good network connection, it should also be possible to receive the voice information with only a slight delay.
Erfindungsgemäß wird dies dadurch erreicht, daß die Empfangseinheit eine Vorrichtung zur Ermittlung der aktuellen Netzwerksverzögerung aufweist, die ausgangsseitig mit dem Steuereingang einer Datenpaketbearbeitungs- Vorrichtung verbunden ist, die zwischen die Verzögerungsvorrichtung und die Sprachwandlereinheit geschaltet ist, wobei die Datenpaketbearbeitungs- Vorrichtung die von der Verzögerungsvorrichtung kommenden Datenpakete an die ermittelte Netzwerksverzögerung anpaßt.This is achieved according to the invention in that the receiving unit has a device for determining the current network delay, which is connected on the output side to the control input of a data packet processing device which is connected between the delay device and the voice converter unit, the data packet processing device coming from the delay device Adapts data packets to the determined network delay.
Auf diese Weise kann die Netzwerks-Verzögerungszeit überwacht und eine entsprechende kontinuierliche Anpassung an die im Netzwerk vorherrschenden Bedingungen vorgenommen werden, ohne daß es dabei zu einer merkbaren klanglichen Verschlechterung der Übertragung kommt. Je nach gerade vorherrschender Netzwerks-Verzögerungszeit werden die Datenpakete nach ihrer Zwischenspeicherung in der Verzögerungsvorrichtung in der Datenpaketbearbeitungs- Vorrichtung in Abhängigkeit von der festgestellten Netzwerks- Verzögerungszeit verändert an die Sprachwandlereinheit weitergeleitet.In this way, the network delay time can be monitored and a corresponding continuous adaptation to the prevailing conditions in the network can be carried out without there being any noticeable deterioration in the sound of the transmission. Depending on the currently prevailing network delay time, the data packets are forwarded to the speech converter unit after being temporarily stored in the delay device in the data packet processing device as a function of the determined network delay time.
Zur technisch einfachen Ermittlung der Netzwerks-Verzögerungszeit kann in weiterer Ausbildung der Erfindung vorgesehen sein, daß die Ermittlungsvorrichtung eingangsseitig mit einem Ausgang des Empfangsteils verbunden ist.For a technically simple determination of the network delay time, it can be provided in a further embodiment of the invention that the determining device is connected on the input side to an output of the receiving part.
Um innerhalb der Sprachinformation auftretende Gesprächspausen für die Anpassung an die Netzwerks-Verzögerung heranziehen zu können, ist gemäß einem weiteren Ausführungsbeispiel der Erfindung vorgesehen, daß die Datenpaketbearbeitungs- Vorrichtung eine Einheit zur Detektion von Gesprächspausen innerhalb der in der Empfangseinheit empfangenen Sprachinformation umfaßt.In order to be able to use pauses in the speech for the adaptation to the network delay, it is provided according to a further exemplary embodiment of the invention that the data packet processing device comprises a unit for detecting pauses in the speech received in the receiving unit.
Dadurch können bei Detektion von Gesprächspausen diese zur kontinuierlichen Anpassung an die gerade vorherrschende Netz- Verzögerung verlängert oder verkürzt werden, ohne daß dabei Sprachinformation verlorengeht und der Empfänger davon etwas merkt.As a result, when pauses in the conversation are detected, they can be lengthened or shortened for continuous adaptation to the currently prevailing network delay, without loss of voice information and the receiver noticing anything about it.
Gemäß einer anderen Variante der Erfindung kann die Datenpaketbearbeitungs- Vorrichtung eine Vorrichtung zur Veränderung der Ausgaberate von Datenpaketen umfassen, wodurch es möglich ist, die Sprachgeschwindigkeit zu erhöhen oder abzusenken und damit für einen Ausgleich bei niedrigen oder hohen Verzögerungen innerhalb des Netzes zu sorgen. Die dabei auftretende Veränderung der Stimmlage des Sprachsignals kann ausgeglichen werden, indem gemäß einem weiteren Ausführungsbeispiel der Erfindung die Datenpaketbearbeitungs-Vorrichtung weiters einen Signalprozessor zur Fourier- Transformation, Frequenzbandkorrektur und Fourier-Rücktransformation umfaßt. Mit dessen Hilfe kann die Stimmlage für den empfangenden Teilnehmer ohne merkbare Qualitätsverluste an die gewohnte Höhe der Stimmlage zurückgeführt werden, sodaß nur eine Erhöhung oder Erniedrigung der Sprachgeschwindigkeit hörbar ist.According to another variant of the invention, the data packet processing device can comprise a device for changing the output rate of data packets, which makes it possible to increase or decrease the speech speed and thus to compensate for low or high delays within the network. The change in the voice position of the voice signal that occurs can be compensated for in that, according to a further exemplary embodiment of the invention, the data packet processing device further comprises a signal processor for Fourier transformation, frequency band correction and Fourier inverse transformation. With its help, the voice position for the receiving participant can be brought back to the usual level of the voice position without any noticeable loss of quality, so that only an increase or decrease in the speech speed is audible.
Gemäß einer anderen Variante der Erfindung kann die Datenpaketbearbeitungs- Vorrichtung weiters ein erstes Mischglied und einen ersten Tiefpaß sowie ein nachfolgendes zweites Mischglied und einen zweiten Tiefpaß umfassen. Damit ist es möglich, eine Frequenzbandverschiebung auch in analoger Form zu kompensieren.According to another variant of the invention, the data packet processing device can further comprise a first mixing element and a first low-pass filter and a subsequent second mixing element and a second low-pass filter. This makes it possible to compensate for a frequency band shift even in analog form.
Weiters betrifft die Erfindung ein Verfahren zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzwerkes, z.B. LAN, Intranet, Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, wobei jeder Teilnehmer über eine Sende- und Empfangseinheit mit dem Netzwerk in Verbindung steht und die Empfangseinheit einen Empfangsteil, eine Sprachwandlereinheit zur Umwandlung der Datenpakete in ein, vorzugsweise analoges, Sprachsignal und eine Vorrichtung zur Verzögerung der empfangenen Datenpakete, z.B. einen Zwischenspeicher, umfaßt, über die die empfangenen Datenpakete nach einer Verweilzeit an die Sprachwandler-Einheit weitergeleitet werden.The invention further relates to a method for the transmission of voice information within at least one data transmission network connecting several participants, e.g. LAN, intranet, Internet, in which the transmission by means of data packets based on at least one common protocol, e.g. Internet protocol, where each participant is connected to the network via a transmitting and receiving unit and the receiving unit has a receiving part, a voice converter unit for converting the data packets into a, preferably analog, voice signal and a device for delaying the received data packets, e.g. comprises a buffer, via which the received data packets are forwarded to the speech converter unit after a dwell time.
Aufgabe der Erfindung ist es, ein Verfahren anzugeben, mit dem trotz der durch das Netz hervorgerufenen Verzögerungszeiten eine hohe Übertragungsqualität erreichbar ist.The object of the invention is to provide a method with which a high transmission quality can be achieved despite the delay times caused by the network.
Erfmdungsgemäß wird dies dadurch gelöst, daß die Verzögerungszeit der Datenübertragung des zumindest einen Netzwerkes laufend ermittelt wird, und daß die Sprachinformation der Datenpakete in Abhängigkeit von der Netzwerks-Verzögerungszeit verändert an die Sprachwandler-Einheit weitergeleitet wird.According to the invention, this is achieved in that the delay time of the data transmission of the at least one network is continuously determined and that the voice information of the data packets is passed on to the voice converter unit as a function of the network delay time.
Dadurch kann eine kontinuierliche Anpassung der übertragenen Sprachinformation an die gerade herrschende Verzögerungszeit der Datenübertragung innerhalb des Netzes vorgenommen werden, wodurch die Sprachinformation beim Empfänger zwar in veränderter Form jedoch mit relativ hoher Wiedergabequalität erfolgen kann.As a result, the transmitted voice information can be continuously adapted to the current delay time of data transmission within the network, which means that the voice information at the receiver can be changed but with a relatively high reproduction quality.
In weiterer Ausbildung der Erfindung kann vorgesehen sein, daß die Netzwerks-Verzögerungszeit der Datenübertragung aus der in jedem Datenpaket vorhandenen Zeitinformation über den Sendezeitpunkt desselben berechnet und der Mittelwert über mehrere Datenpakete hinweg gebildet wird.In a further embodiment of the invention, it can be provided that the network delay time of the data transmission is calculated from the time information in each data packet about the time of transmission of the same and that the mean value is formed over several data packets.
Dabei können die im Datenpaket bereits vorhandenen Zeit-Informationen für eine Analyse der innerhalb der Netzübertragung auftretenden Verzögerungen herangezogen werden. Gemäß einer anderen Variante der Erfindung kann die Änderung der Netzwerks-Verzögerungszeit durch Messung der durchschnittlichen Anzahl der pro Zeiteinheit in der Empfangseinheit eintreffenden Datenpakete ermittelt werden. Bei zunehmender Verzögerungszeit nimmt die Anzahl der eintreffenden Datenpakete im Zwischenspeicher, der für die Erzeugung der Verweilzeit vorgesehen werden kann, ab. Sobald eine solche Veränderung registriert wird, können die Datenpakete bzw. die Sprachinformation entsprechend verändert an die Sprachwandler-Einheit weitergeleitet werden, um zu vermeiden, daß ein Mangel an ausgebbaren Datenpaketen entsteht. Bei abnehmender Verzögerungszeit kann z.B. die Weiterleitung der Datenpakete beschleunigt erfolgen und damit angestaute Datenpakete schneller weitergeleitet werden.The time information already present in the data packet can be used for an analysis of the delays occurring within the network transmission. According to another variant of the invention, the change in the network delay time can be determined by measuring the average number of data packets arriving in the receiving unit per time unit. As the delay time increases, the number of incoming data packets in the buffer, which can be provided for generating the dwell time, decreases. As soon as such a change is registered, the data packets or the speech information can be passed on to the speech converter unit in a modified manner in order to avoid that there is a shortage of data packets that can be output. If the delay time decreases, the forwarding of the data packets can be accelerated, for example, and thus pent-up data packets can be forwarded faster.
Gemäß einer weiteren Ausführungsform der Erfindung kann daher vorgesehen sein, daß jeweils der Beginn und das Ende von Gesprächspausen innerhalb der Sprachinformation detektiert werden, und daß die Dauer der Gesprächspausen im ausgegebenen Sprachsignal in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit verändert wird, wobei bei sinkender Netzwerks-Verzögerungszeit die Gesprächspause, vorzugsweise durch Entfernen von Null-Abtastwerten der Sprachinformation, verkürzt und bei ansteigender Netzwerks-Verzögerungszeit die Gesprächspause, vorzugsweise durch Hinzufügen von Null- Abtastwerten der Sprachinformation, verlängert wird.According to a further embodiment of the invention it can therefore be provided that the start and end of pauses in the speech information are detected, and that the duration of the pauses in the output voice signal is changed depending on the determined network delay time, with decreasing network -Delay time shortens the pause in the conversation, preferably by removing zero samples of the voice information, and, as the network delay time increases, the pause in conversation, preferably by adding zero samples of the voice information, is extended.
Diese Möglichkeit der Anpassung an die vorherrschenden Verzögerungszeiten verändert für den empfangenden Teilnehmer nur die Dauer der Gesprächspausen, sonst wird das übertragene Gespräch in unveränderter Form weitergegeben. Bei Teilnehmern, für die bereits eine Vorrichtung zur Gesprächspausen-Erkennung vorgesehen ist, ist diese Art der Anpassung auf besonders einfache Weise implementierbar.This possibility of adapting to the prevailing delay times only changes the duration of the pauses in the conversation for the receiving subscriber, otherwise the transferred call is passed on in unchanged form. This type of adaptation can be implemented in a particularly simple manner for subscribers for whom a device for detecting pauses in conversation is already provided.
Eine weitere Variante der Verzögerungsanpassung besteht darin, daß in einem periodischen Teil des Sprachsignals eine oder mehrere, einzelne Schwingungen in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit entfernt und gegebenenfalls mit vervielfachter, vorzugsweise verdoppelter Signalperiode wieder eingefügt werden, wobei die Zeitpunkte zur Entfernung bzw. Einfügung der Schwingungen vorzugsweise im Nulldurchgang bei positiver Signalflanke des Sprachsignals gewählt werden.Another variant of the delay adjustment is that one or more, individual oscillations are removed in a periodic part of the speech signal depending on the determined network delay time and, if necessary, are reinserted with a multiplied, preferably doubled signal period, the times for removal or insertion the vibrations are preferably selected at the zero crossing with a positive signal edge of the speech signal.
Bei relativ geringem Aufwand für die Umsetzung dieser Maßnahmen sind die entstehenden Verzerrungen innerhalb des wiedergegebenen Sprachsignals kaum wahrnehmbar. Auch monofrequente Töne werden dadurch mit Ausnahme ihrer Dauer kaum beeinflußt, nur bei in der Telephonie üblichen Mehrfrequenzverfahren, z.B. MFV, MFE, MFC kommt es zu Qualitätseinbußen.With relatively little effort for the implementation of these measures, the resulting distortions within the reproduced speech signal are barely perceptible. Even monofrequency tones are hardly affected by this, with the exception of their duration, only with multi-frequency methods common in telephony, e.g. DTMF, MFE, MFC there is a loss of quality.
Diesbezüglich kann eine sehr verzerrungsfreie Anpassung an die Verzögerung erfolgen, wenn gemäß einem weiteren Ausführungsbeispiel der Erfindung vorgesehen ist, daß im Signalverlauf eine Abfolge einer vorbestimmbaren Anzahl von Nulldurchgängen, z.B. drei aufeinanderfolgende Nulldurchgänge, mit steigenden Flanken in konstantem Zeitabstand gesucht und festgestellt wird und im Bereich dieses zeitlichen Abschnitts ein Zeitintervall des Signals zwischen zwei ansteigenden Flanken entfernt oder der Signalverlauf zwischen zwei ansteigenden Flanken mehrfach, vorzugsweise zweifach, hintereinander eingefügt wird.In this regard, a very distortion-free adaptation to the delay can take place if, according to a further exemplary embodiment of the invention, it is provided that a sequence of a predeterminable number of zero crossings, for example three consecutive zero crossings, with rising edges is searched for and determined at a constant time interval and in the range this time segment removes a time interval of the signal between two rising edges or the signal curve between two rising edges is inserted several times, preferably twice, one after the other.
Durch die Erhöhung oder Erniedrigung der Sprachgeschwindigkeit kann ebenfalls eine geeignete Anpassung der Verzögerungszeit innerhalb des Netzes erreicht werden. Daher kann in weiterer Ausbildung der Erfindung vorgesehen sein, daß in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit die Ausgaberate der Datenpakete an die Sprachwandler-Einheit verändert wird, wobei bei ansteigender Netzwerks-Verzögerungszeit die Ausgaberate erniedrigt und bei abfallender Netzwerks- Verzögerungszeit die Ausgaberate erhöht wird.A suitable adaptation of the delay time within the network can also be achieved by increasing or decreasing the speech speed. It can therefore be provided in a further embodiment of the invention that the output rate of the data packets to the voice converter unit is changed as a function of the determined network delay time, the output rate being reduced as the network delay time increases and the output rate increasing as the network delay time decreasing .
Die bei der Veränderung der Sprachgeschwindigkeit auftretende Stimmlagenänderung zerstört die Identifizierbarkeit des Sprechenden, das empfangene Signal kann der betreffenden Person nicht mehr eindeutig zugeordnet werden.The change in voice position that occurs when the speech speed changes destroys the identifiability of the speaker, the signal received can no longer be clearly assigned to the person concerned.
Diese kann in vorteilhafter Weiterbildung der Erfindung dadurch beseitigt werden, daß die entstehende Verschiebung des Frequenzbereiches durch Fourier- Transformation, Frequenzbandkorrektur und Fourier-Rücktransformation, kompensiert wird.In an advantageous further development of the invention, this can be eliminated by compensating for the resulting shift in the frequency range by means of Fourier transformation, frequency band correction and Fourier inverse transformation.
Dadurch wird das Sprachsignal schneller oder langsamer ausgegeben, die Veränderung der Stimmlage wird aber durch die Frequenzbereichsverschiebung wieder normalisiert.As a result, the speech signal is output faster or slower, but the change in voice position is normalized again by the frequency range shift.
Gemäß einer weiteren Variante der Erfindung kann vorgesehen sein, daß die entstehende Verschiebung des Frequenzbandes durch Mischung mit einer ersten Trägerfrequenz und Tiefpaß-Filterung sowie nachfolgender nochmaliger Mischung mit einer zweiten Trägerfrequenz und Tiefpaß-Filterung kompensiert wird, wobei die Frequenzbandverschiebung die Differenz aus zweiter und erster Trägerfrequenz beträgt. Auf diese Weise kann ebenfalls eine Frequenzband-Korrektur erfolgen, die analoge Mischung verschiebt jedoch die Frequenzen unproportional.According to a further variant of the invention, it can be provided that the resulting shift in the frequency band is compensated for by mixing with a first carrier frequency and low-pass filtering and subsequent mixing again with a second carrier frequency and low-pass filtering, the frequency band shift being the difference between the second and the first Carrier frequency is. A frequency band correction can also be carried out in this way, but the analog mixing shifts the frequencies disproportionately.
Nachfolgend wird die Erfindung anhand des in den beigeschlossenen Zeichnungen dargestellten Ausführungsbeispiels eingehend erläutert. Es zeigt dabeiThe invention is explained in detail below with reference to the exemplary embodiment illustrated in the accompanying drawings. It shows
Fig.l die Empfangseinheit eines Übertragungssystems gemäß Stand der Technik;Fig.l the receiving unit of a transmission system according to the prior art;
Fig.2 eine Ausführungsform der Empfangseinheit eines erfindungsgemäßen Übertragungssystems;2 shows an embodiment of the receiving unit of a transmission system according to the invention;
Fig.3 ein Sprachsignalverlauf in Abhängigkeit der Zeit;3 shows a speech signal curve as a function of time;
Fig.4 der Sprachsignalverlauf gemäß Fig.3, bei dem eine Verzögerungsanpassung einer Ausführungsform des erfindungsgemäßen Verfahrens vorgenommen worden ist;4 shows the speech signal curve according to FIG. 3, in which a delay adjustment of an embodiment of the method according to the invention has been carried out;
Fig.5 ein weiterer Sprachsignal verlauf und5 shows another voice signal and
Fig.6 der Sprachsignalverlauf nach Fig.5 bei dem ein weitere Ausführungsform des erfindungsgemäßes Verfahrens zur Verzögerungsanpassung vorgenommen worden ist. In Fig.l ist eine Empfangseinheit 10 eines Übertragungssystems zur Übertragung von Sprachinformation innerhalb eines nicht dargestellten, mehrere Teilnehmer verbindenden Datenübertragungs-Netzes, wie z.B. LAN, Intranet, Internet, gezeigt, wie es gemäß Stand der Technik bekannt ist. Die zu übertragenden Daten werden in Datenpakete unterteilt und während der Übertragung zwischen den Teilnehmern ausgetauscht, wobei innerhalb des jeweiligen Netzes der Transport der Datenpakete je nach verfügbaren Übertragungsleitungen verwaltet wird. Es können auch mehrere, miteinander gekoppelte Netze für eine solche Sprachübertragung eingesetzt werden, wobei bei unterschiedlichen Protokollen in diesen Netzen zur Umwandlung geeignete Einheiten vorgesehen sein müssen.6 shows the speech signal curve according to FIG. 5, in which a further embodiment of the inventive method for delay adaptation has been carried out. FIG. 1 shows a receiving unit 10 of a transmission system for the transmission of voice information within a data transmission network, such as LAN, intranet, Internet, which does not show, and which connects several subscribers, as is known in the prior art. The data to be transmitted are divided into data packets and exchanged between the participants during the transmission, the transport of the data packets being managed within the respective network depending on the available transmission lines. It is also possible to use a plurality of networks coupled to one another for such a voice transmission, suitable units having to be provided for conversion in the case of different protocols in these networks.
In vielen Fällen findet die Übertragung der Datenpakete auf der Grundlage des Internet-Protokolls (IP) statt, wobei jeder Teilnehmer über die Empfangseinheit 10 und eine in Fig.l nicht dargestellte Sendeeinheit mit dem IP -Netzwerk in Verbindung steht. Die Empfangseinheit 10 umfaßt einen Empfangsteil 1 und eine Sprachwandler-Einheit 3 zur Umwandlung der Datenpakete in ein Sprachsignal, das in dem Ausführungsbeispiel gemäß Fig.1 in PCM- Kodierung an ein Telephonnetz, eine Nebenstellenanlage oder ein Teilnehmer- Endgerät weitergeleitet wird, wo es direkt weiterverarbeitet werden kann. Jede andere Art der Weiterleitung bzw. Verwendung der empfangenen Signale ist denkbar. Die Sprachwandler-Einheit 3 kann dabei auch eine Wandlung in analoge Sprachsignale vornehmen.In many cases, the transmission of the data packets takes place on the basis of the Internet protocol (IP), each participant being connected to the IP network via the receiving unit 10 and a transmitting unit (not shown in FIG. 1). The receiving unit 10 comprises a receiving part 1 and a speech converter unit 3 for converting the data packets into a speech signal, which in the exemplary embodiment according to FIG. 1 in PCM coding is forwarded to a telephone network, a private branch exchange or a subscriber terminal, where it is transmitted directly can be processed further. Any other type of forwarding or use of the received signals is conceivable. The speech converter unit 3 can also convert into analog speech signals.
In Fig.l ist zwischen dem Empfangsteil 1 und der Sprachwandler-Einheit 3 eine Dekoder-Einheit 2 vorgesehen, für den Fall, daß senderseitig eine Kodierung der übertragenen Sprachdaten vorgenommen wird. Weiters ist im Empfangsteil 1 eine Vorrichtung zur Verzögerung 1' der empfangenen Datenpakete beinhaltet, die nicht als getrennter Funktionsblock dargestellt ist und durch einen Zwischenspeicher realisiert sein kann. Die aus dem Netz empfangenen Datenpakete werden nach einer Verweilzeit, die z.B. 0,3 s oder 0,5 s betragen kann, an die Sprachwandler-Einheit 3 weitergeleitet. Dadurch ist es möglich, unterschiedliche Verzögerungszeiten bei der Übertragung der Datenpakete innerhalb des Netzes auszugleichen.In Fig.l a decoder unit 2 is provided between the receiving part 1 and the speech converter unit 3, in the event that the transmitted voice data is encoded on the transmitter side. Furthermore, the receiving part 1 contains a device for delaying 1 'of the received data packets, which is not shown as a separate function block and can be implemented by a buffer. The data packets received from the network are stored after a dwell time, e.g. Can be 0.3 s or 0.5 s, forwarded to the speech converter unit 3. This makes it possible to compensate for different delay times in the transmission of the data packets within the network.
Um die Übertragungsqualität zu verbessern, ist gemäß dem in Fig.2 dargestellten Ausführungsbeispiel der Erfindung zwischen die Verzögerungsvorrichtung 1' und die Sprachwandlereinheit 3 eine Datenpaketbearbeitungs- Vorrichtung 6 geschaltet, die einen Steuereingang 11 aufweist. Weiters ist eine Vorrichtung zur Ermittlung der aktuellen Netzwerksverzögerung 4, 5 vorgesehen, die ausgangsseitig mit dem Steuereingang 11 verbunden ist. Die Datenpaketbearbeitungs-Norrichtung 6 paßt die von der Verzögerungsvorrichtung 2 kommenden Datenpakete an die ermittelte Νetzwerksverzögerung an, um damit eine qualitativ bessere Sprachqualität beim Empfänger zu ermöglichen. Die Datenpakete können dabei in verschiedener Weise so bearbeitet werden, daß Veränderungen der Netzwerks-Verzögerungszeit für den Empfänger nicht mehr merkbar sind. Die Ermittlungsvorrichtung ist dabei in Funktionsblöcke, nämlich in eine Verbindungsanalyse-Einheit 4 und in eine Steuerungs-Einheit 5 unterteilt.In order to improve the transmission quality, according to the exemplary embodiment of the invention shown in FIG. 2, a data packet processing device 6, which has a control input 11, is connected between the delay device 1 'and the speech converter unit 3. Furthermore, a device for determining the current network delay 4, 5 is provided, which is connected on the output side to the control input 11. The data packet processing device 6 adapts the data packets coming from the delay device 2 to the determined network delay in order to enable a better quality voice quality at the receiver. The data packets can be processed in various ways so that changes in the network delay time are no longer noticeable to the receiver. The determination device is divided into functional blocks, namely into a connection analysis unit 4 and into a control unit 5.
In der Verbindungsanalyse-Einheit 4, die eingangsseitig mit einem Ausgang des Empfangsteils 1 verbunden ist, wird die Verzögerungszeit der Datenübertragung des Netzes laufend ermittelt. Als Ergebnis davon wird über die Steuerungs-Einheit 5 die Sprachinformation der Datenpakete in Abhängigkeit von der Netzwerks-Verzögerungszeit verändert an die Sprachwandler-Einheit 3 weitergeleitet, indem über den Steuereingang 11 eine entsprechende Beeinflussung der Datenpaketsbearbeitungs- Vorrichtung 6 bewirkt wird.In the connection analysis unit 4, which is connected on the input side to an output of the receiving part 1, the delay time of the data transmission of the network is continuously determined. As a result of this, the voice information of the data packets is changed via the control unit 5 as a function of the network delay time and is forwarded to the voice converter unit 3 by influencing the data packet processing device 6 via the control input 11.
Dadurch kann eine Anpassung an die tatsächlich vorherrschende Netzwerks- Verzögerungszeit vorgenommen werden. Sobald letztere anzusteigen beginnt, wird die Weitergabe der Sprachinformation an die Sprachwandler-Einheit 3 entsprechend verzögert oder die Sprachinformation selbst erweitert, um das langsamere Eintreffen der Datenpakete im Empfangsteil 10 zu kompensieren. Im umgekehrten Fall wird die Sprachinformation rascher weiterverarbeitet bzw. verkürzt und damit eine schnellere Weiterleitung der Datenpakete bzw. eine Informationsreduktion ermöglicht.This enables an adaptation to the actually prevailing network delay time. As soon as the latter begins to increase, the forwarding of the voice information to the voice converter unit 3 is delayed accordingly or the voice information itself is expanded in order to compensate for the slower arrival of the data packets in the receiving part 10. In the opposite case, the voice information is processed or shortened more quickly, thus enabling faster forwarding of the data packets or an information reduction.
Die Netzwerks-Verzögerungszeit der Datenübertragung kann aus der in jedem Datenpaket vorhandenen Zeitinformation, wie sie aus dem vorhandenen Echtzeit- Protokoll (real time protocol) RTP entnommen werden kann, über den Sendezeitpunkt desselben berechnet und der Mittelwert über mehrere Datenpakete hinweg gebildet werden.The network delay time of the data transmission can be calculated from the time information present in each data packet, as can be found in the existing real-time protocol (RTP), over the time of the transmission thereof, and the mean value can be formed over several data packets.
Eine weitere anwendbare Methode die Änderung der Netzwerks- Verzögerungszeit zu ermitteln, besteht darin, aus dem Speicherstand des für die Ausbildung der Verweilzeit verwendeten Zwischenspeichers 1' die durchschnittliche Anzahl der pro Zeiteinheit in der Empfangseinheit 1 eintreffenden Datenpakete festzustellen.Another method that can be used to determine the change in the network delay time consists in determining the average number of data packets arriving in the receiving unit 1 per unit of time from the storage status of the buffer store 1 ′ used for the formation of the dwell time.
Bei lange andauerndem Gesprächsstillstand, z.B. Sendungsunterbrechung, wird die Datenbearbeitung auf ihrem zuletzt eingestellten Wert konstant gehalten.If the call is at a long standstill, e.g. Interruption of shipment, the data processing is kept constant at its last set value.
In weiterer Ausbildung der Erfindung bestehen mehrere Möglichkeiten, eine Anpassung an die Netz- Verzögerung vorzunehmen.In a further embodiment of the invention, there are several options for adapting to the network delay.
So kann die Datenpaketbearbeitungs- Vorrichtung 6 eine Einheit zur Detektion von Gesprächspausen innerhalb der in der Empfangseinheit empfangenen Sprachinformation umfassen.The data packet processing device 6 can thus comprise a unit for the detection of pauses in conversation within the speech information received in the receiving unit.
Damit werden jeweils der Beginn und das Ende von Gesprächspausen innerhalb der Sprachinformation detektiert. Die Dauer der Gesprächspausen wird nun im ausgegebenen Sprachsignal in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit verändert, wobei bei sinkender Netzwerks-Verzögerungszeit die Gesprächspause, vorzugsweise durch Entfernen von Null- Abtastwerten der Sprachinformation, verkürzt und bei ansteigender Netzwerks-Verzögerungszeit die Gesprächspause, vorzugsweise durch Hinzufügen von Null- Abtastwerten der Sprachinformation, verlängert wird.The start and end of pauses in the conversation are thus detected within the speech information. The duration of the pauses in the speech is now changed in the output voice signal as a function of the determined network delay time, with the pause in the network decreasing, preferably by removing zero samples of the voice information, and the pause in the network delay increasing, preferably by increasing the network delay Adding zero samples of the speech information is extended.
Um eine zu starke Beeinträchtigung des Gesprächs zu vermeiden, wird die Gesprächspause um nicht mehr als 20% verändert. Dieses Verfahren ist besonders bei Übertragungen der Datenpakete mit Echtzeitprotokoll (RTP) und bereits integrierter Pausenerkennung auf der Sendeseite ohne großen Aufwand implementierbar, da bei Eintreffen der Sprach-Datenpakete nach einer Sprachpause nur der Zeitpunkt des Wiedergabebeginns entsprechend verändert werden muß.In order to avoid too much impairment of the conversation, the pause in the conversation is not changed by more than 20%. This method is particularly useful for transfers of data packets with real-time protocol (RTP) and is already integrated Pause detection can be implemented on the transmission side with little effort, since when the voice data packets arrive after a voice pause, only the point in time at which playback starts has to be changed accordingly.
Diese Methode ist aber nur dann zielführend, wenn während des Gesprächs auch tatsächlich Gesprächspausen auftreten. Gesprächspausen werden bei Unterschreiten eines vorbestimmbaren Signalpegels festgestellt. Bei ständig vorhandenem Hintergrundpegel während eines Gespräches kann daher keine Gesprächspause auftreten.However, this method is only useful if there are actually pauses in the conversation. Pauses in conversation are determined when the signal level falls below a predeterminable level. If there is a constant background level during a call, there can be no pause in the conversation.
Es besteht weiters die Möglichkeit, eine Anpassung der Zeitverzögerung vorzunehmen, indem ganze Pakete, z.B. 64 bis 512 Abtastwerte, aus dem Sprachsignal entnommen und verworfen werden, wenn sie zu spät beim Empfänger eintreffen, oder indem das jeweils vorhergehende Paket wiederholt wird, falls keine Daten zur Wiedergabe vorhanden sind. Diese Methode wird bereits in anderen Bereichen der Übertragungstechnik verwendet.There is also the possibility of adjusting the time delay by using whole packets, e.g. 64 to 512 samples can be taken from the speech signal and discarded if they arrive late at the receiver, or by repeating the previous packet if there is no data to be reproduced. This method is already used in other areas of transmission technology.
In Fig.3 ist als Beispiel ein willkürlich gewählter Ausschnitt aus dem Sprachsignalverlauf wiedergegeben, der durch einen männlichen Rundfunksprecher hervorgerufen worden ist. Der Zeitabschnitt zwischen t und t2 entspricht einem Datenpaket mit z.B. 64 Abtastwerten. Das Entnehmen und Verwerfen dieses Datenpakets bewirkt einen Sprachsignalverlauf, wie er in Fig.4 dargestellt ist. Durch das Zusammenfügen der beiden verbleibenden Signalzüge entsteht an der Stelle tj, t2 eine deutlich hörbare Sprungstelle. Bei einem Sinus-Testsignal würde sich folglich eine relativ starke Verzerrung ergeben.3 shows an example of an arbitrarily selected section from the speech signal course, which was caused by a male broadcaster. The time period between t and t2 corresponds to a data packet with, for example, 64 samples. The removal and discarding of this data packet causes a voice signal waveform as shown in FIG. 4. The joining of the two remaining signal trains creates a clearly audible jump point at the points t j , t2. A sinusoidal test signal would result in a relatively strong distortion.
Erfindungsgemäß wird eine Verbesserung vorgenommen, indem in einem periodischen Teil des Sprachsignals eine oder mehrere, einzelne Schwingungen in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit entfernt und gegebenenfalls mit vervielfachter, vorzugsweise verdoppelter Signalperiode wieder eingefügt werden.According to the invention, an improvement is made by removing one or more individual vibrations in a periodic part of the speech signal depending on the determined network delay time and, if necessary, reinserting them with a multiplied, preferably doubled signal period.
Die Zeitpunkte zur Entfernung bzw. Einfügung der Schwingungen werden vorzugsweise im Nulldurchgang bei positiver Signalflanke des Sprachsignals gewählt, wodurch Sprungstellen im Sprachsignal vermieden werden. Insgesamt kann dabei z.B. wieder ein ganzes Datenpaket entfernt oder hinzugefügt werden.The times for the removal or insertion of the vibrations are preferably selected in the zero crossing with a positive signal edge of the speech signal, as a result of which jumps in the speech signal are avoided. Overall, e.g. an entire data packet can be removed or added again.
Fig.5 zeigt dazu wieder einen Sprachsignalverlauf, wie er einem gewöhnlichen Redefluß entspricht. Ein besonders gutes Ergebnis wird dann erzielt, wenn das Einfugen oder Entfernen selektiv in einem periodischen Teil des Sprachsignals vorgenommen wird. Diese Periodizität wird dadurch detektiert, daß im Signalverlauf eine Abfolge einer vorbestimmbaren Anzahl von Nulldurchgängen, z.B. drei aufeinanderfolgende Nulldurchgänge, mit steigenden Flanken in konstantem Abstand gesucht und festgestellt wird und im Bereich dieses zeitlichen Abschnitts ein Zeitintervall des Signals zwischen zwei ansteigenden Flanken entfernt oder der Signal verlauf zwischen zwei ansteigenden Flanken mehrfach, vorzugsweise zweifach, hintereinander eingefügt wird. In Fig.5 wurden solche geeigneten Intervalle zwischen t^ und t^ sowie zwischen t$ und tg aufgefunden, in Fig.6 ist jeweils der Signalverlauf zwischen diesen Intervallen entfernt worden, wobei aus Fig. 6 ersichtlich ist, daß die herausgeschnittenen Intervalle keine nennenswerten Verzerrungen hervorrufen, da die verbleibenden Signalzüge ohne Sprungstellen aneinandergefügt werden. Ein Sinus-Testsignal würde bei Anwenden des erfindungsgemäßen Verfahrens daher kaum verzerrt werden. Auch beim Hinzufügen von einem oder mehreren identischen Signalzügen im Intervall zwischen zwei ansteigenden Flanken wird eine sehr geringe und kaum hörbare Signalverzerrung ermöglicht.5 shows a speech waveform as it corresponds to an ordinary speech flow. A particularly good result is achieved if the insertion or removal is carried out selectively in a periodic part of the speech signal. This periodicity is detected by searching for and determining a sequence of a predeterminable number of zero crossings, for example three consecutive zero crossings, with rising edges at a constant distance in the signal curve and removing a time interval of the signal between two rising edges or the signal in the area of this time segment course between two rising edges is inserted several times, preferably twice, one after the other. Such suitable intervals between t ^ and t ^ and between t $ and tg were found in FIG. 5, the signal curve between these intervals has been removed in FIG. 6, wherein it can be seen from FIG. 6 that the intervals cut out are not significant Distortions cause, since the remaining signal trains are joined together without jump points. A sine test signal would therefore hardly be distorted when using the method according to the invention. Even when adding one or more identical signal trains in the interval between two rising edges, a very low and barely audible signal distortion is made possible.
Dieses erfindungsgemäße Verfahren hat sich in Zusammenhang mit der Verzögerungsanpassung hervorragend bewährt. Der Vorgang des Heraustrennens und Einfügens von Signalabschnitten ist unabhängig davon auch bei anderen Sprachübertragungsanwendungen und daher unabhängig von der Datenübertragung in Netzwerken mit variabler Verzögerung auch in anderen Übertragungssystemen einsetzbar. Beispielsweise könnte dieses Verfahren auch in digitalen Mobiltelephon-Netzen Anwendung finden.This method according to the invention has proven itself extremely well in connection with the delay adjustment. The process of separating and inserting signal sections can also be used independently of this in other voice transmission applications and therefore independently of data transmission in networks with variable delays in other transmission systems. For example, this method could also be used in digital mobile phone networks.
Schließlich besteht eine dritte Variante eines Anpassungsverfahrens darin, in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit die Ausgaberate der Datenpakete an die Sprachwandler-Einheit 3 zu verändern, wobei bei ansteigender Netzwerks-Verzögerungszeit die Ausgaberate erniedrigt und bei abfallender Netzwerks- Verzögerungszeit die Ausgaberate erhöht wird.Finally, a third variant of an adaptation method consists in changing the output rate of the data packets to the speech converter unit 3 as a function of the determined network delay time, the output rate being reduced as the network delay time increases and the output rate increasing as the network delay time decreasing.
Für diese Variante der Erfindung kann innerhalb der Datenpaketbearbeitungs- Vorrichtung 6 eine Vorrichtung zur Veränderung der Ausgaberate von Datenpaketen vorgesehen sein.For this variant of the invention, a device for changing the output rate of data packets can be provided within the data packet processing device 6.
Die dadurch ermöglichte Veränderung der Abtastrate auf der Wiedergabeseite fuhrt dazu, daß die Sprachgeschwindigkeit erhöht oder gesenkt wird, wobei auch die Stimmlage bzw. Tonhöhe eine Änderung erfährt. Eine Erhöhung der Abtastrate hat demnach eine höhere Stimmlage und die Absenkung der Abtastrate eine tiefere Stimmlage zur Folge. Um die sprechende Person wiedererkennen zu können, kann die Abtastrate nur in einem kleinen Bereich geändert werden. Eine zusätzliche Korrektur der Frequenz ermöglicht jedoch Abtastratenänderungen in einem höheren Ausmaß.The resulting change in the sampling rate on the playback side leads to the speech speed being increased or decreased, the voice position or pitch also experiencing a change. An increase in the sampling rate therefore results in a higher voice position and a lowering in the sampling rate results in a lower voice position. In order to be able to recognize the speaking person, the sampling rate can only be changed in a small range. However, an additional correction of the frequency enables sample rate changes to a greater extent.
Zu diesem Zweck kann vorgesehen sein, daß die Datenpaketbearbeitungs- Vorrichtung 6 weiters einen Signalprozessor zur Fourier- Transformation, Frequenzbandkorrektur und Fourier-Rücktransformation umfaßt.For this purpose it can be provided that the data packet processing device 6 further comprises a signal processor for Fourier transformation, frequency band correction and Fourier inverse transformation.
Mit Hilfe des Signalprozessors kann die entstehende Verschiebung des Frequenzbereiches der in der Sprachwandler-Einheit 3 in Sprachsignale umgewandelten Datenpakete durch Fourier-Transformation, Frequenzbandkorrektur und Fourier- Rücktransformation kompensiert werden.With the aid of the signal processor, the resulting shift in the frequency range of the data packets converted into speech signals in the speech converter unit 3 can be compensated for by Fourier transformation, frequency band correction and Fourier inverse transformation.
Dadurch kann die Abtastrate in einem weitaus höheren Bereich verändert werden, die dabei auftretende Frequenzverschiebung wird durch die schnelle Fourier- Transformation und -Rücktransformation eines Signalprozessors und der zwischen diesen Operationen vornehmbaren Korrektur beseitigt. Der digitale Signalprozessor ermöglicht eine frequenzproportionale Signalverarbeitung, sodaß für den empfangenden Teilnehmer insgesamt nur eine Erhöhung oder Erniedrigung der Sprachgeschwindigkeit hörbar wird. Bei hohen Verzögerungen wird der sendende Teilnehmer somit, ohne dabei die Stimmlage zu verändern, langsamer sprechend zu hören sein, während bei sehr absinkenden Verzögerungszeiten innerhalb des Netzes die im Zwischenspeicher aufgestauten Datenpakete schneller abgearbeitet werden und durch Erhöhung der Abtastrate eine dementsprechende Beschleunigung des Sprachsignals erzeugt wird.As a result, the sampling rate can be changed in a much higher range, the frequency shift which occurs is eliminated by the rapid Fourier transformation and inverse transformation of a signal processor and the correction which can be carried out between these operations. The digital signal processor enables frequency-proportional signal processing, so that only an increase or decrease in the speech speed can be heard by the receiving subscriber overall. at high delays, the sending subscriber will thus be able to be heard more slowly without changing the voice position, while with very declining delay times within the network, the data packets pent up in the buffer will be processed more quickly and a corresponding acceleration of the voice signal will be generated by increasing the sampling rate.
Alternativ dazu kann auch eine analoge Frequenzkorrektur vorgenommen werden, zu welchem Zweck die Datenpaketbearbeitungs- Vorrichtung 6 mit einem ersten Mischglied und einem ersten Tiefpaß sowie einem nachfolgenden zweiten Mischglied und einem zweiten Tiefpaß ausgestattet ist.As an alternative to this, an analog frequency correction can also be carried out, for which purpose the data packet processing device 6 is equipped with a first mixing element and a first low-pass filter and a subsequent second mixing element and a second low-pass filter.
Die entstehende Verschiebung des Frequenzbandes wird durch Mischung mit einer ersten Trägerfrequenz und Tiefpaß-Filterung sowie nachfolgender nochmaliger Mischung mit einer zweiten Trägerfrequenz und Tiefpaß-Filterung kompensiert, wobei die Frequenzbandverschiebung die Differenz aus zweiter und erster Trägerfrequenz beträgt.The resulting shift in the frequency band is compensated for by mixing with a first carrier frequency and low-pass filtering and subsequent subsequent mixing with a second carrier frequency and low-pass filtering, the frequency band shift being the difference between the second and first carrier frequency.
Bei der nach jeder Mischung erfolgenden Tiefpaß-Filterung wird jeweils nur das untere Seitenband durchgelassen, das durch die zweite Mischung um die zweite Trägerfrequenz aus seiner nach der ersten Mischung um die erste Trägerfrequenz gespiegelten Lage wieder zurückgespiegelt wird, sodaß sich insgesamt eine Verschiebung des Frequenzbandes um die Differenz aus zweiter und erster Trägerfrequenz ergibt. In the low-pass filtering that takes place after each mixture, only the lower sideband is passed through, which is reflected back by the second mixture around the second carrier frequency from its position mirrored after the first mixture around the first carrier frequency, so that there is an overall shift in the frequency band is the difference between the second and the first carrier frequency.

Claims

P A T E N T A N S P R Ü C H E PATENT CLAIMS
1. Übertragungssystem zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzes, z.B. LAN, Intranet, Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, wobei jeder Teilnehmer über eine Sende- und Empfangseinheit mit dem Netz in Verbindung steht und die Empfangseinheit, einen Empfangsteil, eine Sprachwandlereinheit zur Umwandlung der Datenpakete in ein, vorzugsweise analoges, Sprachsignal und eine Vorrichtung zur Verzögerung der empfangenen Datenpakete, z.B. einen Zwischenspeicher, umfaßt, über die die empfangenen Datenpakete nach einer Verweilzeit an die Sprachwandler-Einheit weiterleitbar sind, dadurch gekennzeichnet, daß die Empfangseinheit (10) eine Vorrichtung zur Ermittlung der aktuellen Netzwerksverzögerung (4, 5) aufweist, die ausgangsseitig mit dem Steuereingang (11) einer Datenpaketbearbeitungs- Vorrichtung (6) verbunden ist, die zwischen die Verzögerungsvorrichtung (l1) und die Sprachwandlereinheit (3) geschaltet ist, wobei die Datenpaketbearbeitungs- Vorrichtung (6) die von der Verzögerungsvorrichtung (1') kommenden Datenpakete an die ermittelte Netzwerksverzögerung anpaßt.1. Transmission system for the transmission of voice information within at least one data transmission network connecting several participants, for example LAN, intranet, Internet, in which the transmission takes place by means of data packets on the basis of at least one common protocol, for example Internet protocol, each participant using a Transmitting and receiving unit is connected to the network and includes the receiving unit, a receiving part, a voice converter unit for converting the data packets into a, preferably analog, voice signal and a device for delaying the received data packets, for example a buffer, via which the received data packets after a dwell time can be forwarded to the speech converter unit, characterized in that the receiving unit (10) has a device for determining the current network delay (4, 5), which on the output side has the control input (11) of a data packet processing device (6) v is connected, which is connected between the delay device (l 1 ) and the voice converter unit (3), the data packet processing device (6) adapting the data packets coming from the delay device (1 ') to the determined network delay.
2. Übertragungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Ermittlungsvorrichtung (4, 5) eingangsseitig mit einem Ausgang des Empfangsteils (1) verbunden ist.2. Transmission system according to claim 1, characterized in that the determining device (4, 5) is connected on the input side to an output of the receiving part (1).
3. Übertragungssystem nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Datenpaketbearbeitungs- Vorrichtung (6) eine Einheit zur Detektion von Gesprächspausen innerhalb der in der Empfangseinheit (10) empfangenen Sprachinformation umfaßt.3. Transmission system according to claim 1 or 2, characterized in that the data packet processing device (6) comprises a unit for the detection of pauses in speech within the voice information received in the receiving unit (10).
4. Übertragungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Datenpaketbearbeitungs- Vorrichtung (6) eine Vorrichtung zur Veränderung der Ausgaberate von Datenpaketen umfaßt.4. Transmission system according to claim 1, characterized in that the data packet processing device (6) comprises a device for changing the output rate of data packets.
5. Übertragungssystem nach Anspruch 4, dadurch gekennzeichnet, daß die Datenpaketbearbeitungs-Vorrichtung (6) weiters einen Signalprozessor zur Fourier- Transformation, Frequenzbandkorrektur und Fourier-Rücktransformation umfaßt. 5. Transmission system according to claim 4, characterized in that the data packet processing device (6) further comprises a signal processor for Fourier transformation, frequency band correction and Fourier inverse transformation.
6. Übertragungssystem nach Anspruch 4, dadurch gekennzeichnet, daß die Datenpaketbearbeitungs- Vorrichtung (6) weiters ein erstes Mischglied und einen ersten Tiefpaß sowie ein nachfolgendes zweites Mischglied und einen zweiten Tiefpaß umfaßt.6. Transmission system according to claim 4, characterized in that the data packet processing device (6) further comprises a first mixer and a first low pass and a subsequent second mixer and a second low pass.
7. Verfahren zur Übertragung von Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden Datenübertragungs-Netzwerkes, z.B. LAN, Intranet, Internet, in welchem die Übertragung mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, wobei jeder Teilnehmer über eine Sende- und Empfangseinheit mit dem Netzwerk in Verbindung steht und die Empfangseinheit einen Empfangsteil, eine Sprachwandlereinheit zur Umwandlung der Datenpakete in ein, vorzugsweise analoges, Sprachsignal und eine Vorrichtung zur Verzögerung der empfangenen Datenpakete, z.B. einen Zwischenspeicher, umfaßt, über die die empfangenen Datenpakete nach einer Verweilzeit an die Sprachwandler-Einheit weitergeleitet werden, dadurch gekennzeichnet, daß die Verzögerungszeit der Datenübertragung des zumindest einen Netzwerkes laufend ermittelt wird, und daß die Sprachinformation der Datenpakete in Abhängigkeit von der Netzwerks-Verzögerungszeit verändert an die Sprachwandler-Einheit (3) weitergeleitet wird.7. Method for the transmission of voice information within at least one data transmission network connecting several participants, e.g. LAN, intranet, Internet, in which the transmission by means of data packets based on at least one common protocol, e.g. Internet protocol, where each participant is connected to the network via a transmitting and receiving unit and the receiving unit has a receiving part, a voice converter unit for converting the data packets into a, preferably analog, voice signal and a device for delaying the received data packets, e.g. an intermediate memory, via which the received data packets are forwarded to the speech converter unit after a dwell time, characterized in that the delay time of the data transmission of the at least one network is determined continuously, and that the voice information of the data packets is dependent on the network delay time changed to the speech converter unit (3) is forwarded.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die Netzwerks- Verzögerungszeit der Datenübertragung aus der in jedem Datenpaket vorhandenen Zeitinformation über den Sendezeitpunkt desselben berechnet und der Mittelwert über mehrere Datenpakete hinweg gebildet wird.8. The method according to claim 7, characterized in that the network delay time of the data transmission is calculated from the time information present in each data packet about the time of transmission thereof and the mean value is formed across a number of data packets.
9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, daß die Änderung der Netzwerks-Verzögerungszeit durch Messung der durchschnittlichen Anzahl der pro Zeiteinheit in der Empfangseinheit (10) eintreffenden Datenpakete ermittelt wird.9. The method according to claim 7 or 8, characterized in that the change in the network delay time is determined by measuring the average number of data packets arriving in the receiving unit (10) per time unit.
10. Verfahren nach Anspruch 7, 8 oder 9, dadurch gekennzeichnet, daß jeweils der Beginn und das Ende von Gesprächspausen innerhalb der Sprachinformation detektiert werden, und daß die Dauer der Gesprächspausen im ausgegebenen Sprachsignal in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit verändert wird, wobei bei sinkender Netzwerks-Verzögerungszeit die Gesprächspause, vorzugsweise durch Entfernen von Null-Abtastwerten der Sprachinformation, verkürzt und bei ansteigender Netzwerks- Verzögerungszeit die Gesprächspause, vorzugsweise durch Hinzufügen von Null- Abtastwerten der Sprachinformation, verlängert wird.10. The method according to claim 7, 8 or 9, characterized in that the start and end of pauses in the speech information are detected, and that the duration of the pauses in the output speech signal is changed depending on the determined network delay time, wherein when the network delay time decreases, the pause in the conversation, preferably by removing zero samples of the speech information, is shortened and when the network delay time increases, the pause in the conversation, preferably by adding zero samples of the speech information, is extended.
11. Verfahren nach Anspruch 7, 8 oder 9, dadurch gekennzeichnet, daß in einem periodischen Teil des Sprachsignals eine oder mehrere, einzelne Schwingungen in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit entfernt und gegebenenfalls mit vervielfachter, vorzugsweise verdoppelter Signalperiode wieder eingefügt werden, wobei die Zeitpunkte zur Entfernung bzw. Einfügung der Schwingungen vorzugsweise im Nulldurchgang bei positiver Signalflanke des Sprachsignals gewählt werden.11. The method according to claim 7, 8 or 9, characterized in that in a periodic part of the speech signal one or more, individual vibrations depending on the determined network delay time removed and possibly reinserted with a multiplied, preferably doubled signal period, wherein the times for removing or inserting the vibrations are preferably selected at the zero crossing with a positive signal edge of the speech signal.
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß im Signalverlauf eine Abfolge einer vorbestimmbaren Anzahl von Nulldurchgängen, z.B. drei aufeinanderfolgende Nulldurchgänge, mit steigenden Flanken in konstantem Zeitabstand gesucht und festgestellt wird und im Bereich dieses zeitlichen Abschnitts ein Zeitintervall des Signals zwischen zwei ansteigenden Flanken entfernt oder der Signalverlauf zwischen zwei ansteigenden Flanken mehrfach, vorzugsweise zweifach, hintereinander eingefügt wird.12. The method according to claim 11, characterized in that a sequence of a predetermined number of zero crossings, e.g. three successive zero crossings, with rising edges are searched for and determined at a constant time interval and in the area of this time segment a time interval of the signal between two rising edges is removed or the signal curve between two rising edges is inserted several times, preferably twice, in succession.
13. Verfahren nach einem der Ansprüche 7, 8 oder 9, dadurch gekennzeichnet, daß in Abhängigkeit von der ermittelten Netzwerks-Verzögerungszeit die Ausgaberate der Datenpakete an die Sprachwandler-Einheit (3) verändert wird, wobei bei ansteigender Netzwerks-Verzögerungszeit die Ausgaberate erniedrigt und bei abfallender Netzwerks- Verzögerungszeit die Ausgaberate erhöht wird.13. The method according to any one of claims 7, 8 or 9, characterized in that, depending on the determined network delay time, the output rate of the data packets to the speech converter unit (3) is changed, the output rate being decreased and the network delay time increasing if the network delay time decreases, the output rate is increased.
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß die entstehende Verschiebung des Frequenzbereiches durch Fourier-Transformation, Frequenzbandkorrektur und Fourier-Rücktransformation, kompensiert wird.14. The method according to claim 13, characterized in that the resulting shift in the frequency range is compensated for by Fourier transformation, frequency band correction and Fourier inverse transformation.
15. Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß die entstehende Verschiebung des Frequenzbandes durch Mischung mit einer ersten Trägerfrequenz und Tiefpaß-Filterung sowie nachfolgender nochmaliger Mischung mit einer zweiten Trägerfrequenz und Tiefpaß-Filterung kompensiert wird, wobei die Frequenzbandverschiebung die Differenz aus zweiter und erster Trägerfrequenz beträgt. 15. The method according to claim 13, characterized in that the resulting shift in the frequency band is compensated for by mixing with a first carrier frequency and low-pass filtering and subsequent mixing again with a second carrier frequency and low-pass filtering, the frequency band shift being the difference between the second and first Carrier frequency is.
PCT/AT1999/000290 1998-11-26 1999-11-25 System for transmitting speech information WO2000033520A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU15000/00A AU1500000A (en) 1998-11-26 1999-11-25 System for transmitting speech information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ATA1985/98 1998-11-26
AT198598A AT410876B (en) 1998-11-26 1998-11-26 TRANSMISSION SYSTEM FOR TRANSMITTING VOICE INFORMATION

Publications (1)

Publication Number Publication Date
WO2000033520A1 true WO2000033520A1 (en) 2000-06-08

Family

ID=3525358

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/AT1999/000290 WO2000033520A1 (en) 1998-11-26 1999-11-25 System for transmitting speech information

Country Status (3)

Country Link
AT (1) AT410876B (en)
AU (1) AU1500000A (en)
WO (1) WO2000033520A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002052240A1 (en) * 2000-12-22 2002-07-04 Telefonaktiebolaget Lm Ericsson (Publ) Method and a communication apparatus in a communication system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790538A (en) * 1996-01-26 1998-08-04 Telogy Networks, Inc. System and method for voice Playout in an asynchronous packet network

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790538A (en) * 1996-01-26 1998-08-04 Telogy Networks, Inc. System and method for voice Playout in an asynchronous packet network

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CASTEL-BRANCO L ET AL: "CLOCK RECOVERY FOR CIRCUIT EMULATION SERVICES OVER ATM", GB,LONDON, CHAPMAN AND HALL, 1996, pages 617 - 625, XP000702615, ISBN: 0-412-75970-5 *
MONTGOMERY W A: "TECHNIQUES FOR PACKET VOICE SYNCHRONIZATION", IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS,US,IEEE INC. NEW YORK, vol. SAC-1, no. 6, 1 December 1983 (1983-12-01), pages 1022 - 1028, XP000563228, ISSN: 0733-8716 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002052240A1 (en) * 2000-12-22 2002-07-04 Telefonaktiebolaget Lm Ericsson (Publ) Method and a communication apparatus in a communication system
US7444281B2 (en) 2000-12-22 2008-10-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and communication apparatus generation packets after sample rate conversion of speech stream

Also Published As

Publication number Publication date
AU1500000A (en) 2000-06-19
AT410876B (en) 2003-08-25
ATA198598A (en) 2002-12-15

Similar Documents

Publication Publication Date Title
DE60126513T2 (en) METHOD FOR CHANGING THE SIZE OF A CITRIC BUFFER FOR TIME ORIENTATION, COMMUNICATION SYSTEM, RECEIVER SIDE AND TRANSCODER
DE60129327T2 (en) ARRANGEMENT AND PROCEDURE RELATING TO THE LANGUAGE PROCESSING
DE60034484T2 (en) METHOD AND DEVICE IN A COMMUNICATION SYSTEM
DE60209637T2 (en) Controlling a conference call
EP2047669A1 (en) Method for carrying out an audio conference, audio conference device, and method for switching between encoders
DE3101775A1 (en) VOICE DETECTOR WITH MULTIPLE, VARIABLE THRESHOLD
DE102004039186B4 (en) Method and device for compensating for runtime fluctuations of data packets
EP0048853B1 (en) Telephone switching network for digital speech transmission
DE3204227A1 (en) DIGITAL TELECOMMUNICATION ENTRY FOR TRANSMITTING INFORMATION ABOUT A DIGITAL TELECOMMUNICATION SYSTEM, IN PARTICULAR ABOUT A TELEPHONE SYSTEM. TELEPHONE EXTENSION SYSTEM
DE4316776A1 (en) Frequency modulation receiver
DE2455584C3 (en) Speakerphone
EP1349334B1 (en) Method for adjustment of a Jitter Buffer in a Media Gateway
EP1124342A2 (en) Method for improving the quality of an audio transmission via a communication network using packet transmission and communication system for implementing the method
AT410876B (en) TRANSMISSION SYSTEM FOR TRANSMITTING VOICE INFORMATION
EP0905954A2 (en) Telephone answering machine and method for recording a digital audio signal
DE4325354C1 (en) Method and arrangement for outputting digital speech signals
EP0945853B1 (en) Method for mitigating the effects of speech segments losts in a packet based transmission
EP2223523B1 (en) Method and receiving unit for synchronizing a packet-oriented reception with a calculated tone signal
DE3107671A1 (en) DIGITAL TELECOMMUNICATION CONTROL DEVICE
EP1142234B1 (en) Transmission system with echo cancellation
DE60017565T2 (en) METHOD FOR MANAGING SOUND SIGNALING AND REPRODUCTION IN AN ASYNCHRONOUS TRANSMISSION SYSTEM
EP0048860B1 (en) Universal digital network for packet-switched information transmission
DE60034015T2 (en) A method and apparatus for recovering voice signals transmitted at the beginning of a packet-switched telephone transmission
DE10046901A9 (en) Method and device for improving the transmission quality in a packet-oriented data transmission network
DE69911685T2 (en) Procedure for speech reproduction with regulation of breaks

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref country code: AU

Ref document number: 2000 15000

Kind code of ref document: A

Format of ref document f/p: F

AK Designated states

Kind code of ref document: A1

Designated state(s): AE AL AM AT AT AU AZ BA BB BG BR BY CA CH CN CR CU CZ CZ DE DE DK DK DM EE EE ES FI FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KR KZ LC LK LR LS LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SK SL TJ TM TR TT UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase