DE60212196T2 - Verteilte telefonkonferenz mit sprachkodierern - Google Patents

Verteilte telefonkonferenz mit sprachkodierern Download PDF

Info

Publication number
DE60212196T2
DE60212196T2 DE60212196T DE60212196T DE60212196T2 DE 60212196 T2 DE60212196 T2 DE 60212196T2 DE 60212196 T DE60212196 T DE 60212196T DE 60212196 T DE60212196 T DE 60212196T DE 60212196 T2 DE60212196 T2 DE 60212196T2
Authority
DE
Germany
Prior art keywords
conference
speech
signal
participants
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60212196T
Other languages
English (en)
Other versions
DE60212196D1 (de
Inventor
Peter BLÖCHER
Karl Hellwig
Matthias Rychetsky
Matthias Dörbecker
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of DE60212196D1 publication Critical patent/DE60212196D1/de
Publication of DE60212196T2 publication Critical patent/DE60212196T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/561Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities by multiplexing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung betrifft ein Telefonkonferenzsystem
  • BESCHREIBUNG DES STANDES DER TECHNIK
  • Heutzutage werden in Telekommunikationsnetzen Telefonkonferenzen mit mehreren Teilnehmern mittels zentraler Konferenzvorrichtungen bewerkstelligt, wobei sich drei oder mehrere Konferenzpartner einrufen und mit der ganzen Gruppe kommunizieren können. Die zentrale Konferenzvorrichtung verteilt das Summensignal der anderen Teilnehmer an jeden Konferenzteilnehmer.
  • Ferner sind Konferenzsysteme bekannt, die keiner zentralen Konferenzvorrichtung bedürfen. Aus der US 5,276,678 ist beispielsweise ein Kommunikationssystem mit vollständigen Verarbeitungsfähigkeiten in den Benutzerports bekannt, wobei jeder Port mit einem TDM-Sammelbus und einem TDM-Verteilerbus verbunden ist. Eine Bussteuerung schließt den Sammelbus, auf dem gesprochene Worte durch den jeweiligen Benutzerport in Zeitschlitzen abgelegt werden, ab, wobei die gesprochenen Worte durch die Bussteuerung neu ausgerichtet und an den TDM-Verteilerbus übertragen werden. Jedem Benutzer wird ein Zeitschlitz zugeordnet, so dass er gleichzeitig mit einem oder mehreren Benutzerports kommunizieren kann, z.B. während einer Zweiwegtelefonkonversation oder eine Mehrparteienkonferenz. Ein Speicher in jedem Benutzerport kombiniert mehrere gesprochenen Worte, die von den jeweiligen TDM-Zeitschlitzen der Konferenzteilnehmer erhalten werden, und fasst derartige gesprochene Worte in einem Bildsignal zusammen, welches für sämtliche der anderen Konferenzteilnehmer repräsentativ ist. Die Konferenzschaltung jedes Benutzerports kombiniert die gesprochenen Worte sämtlicher anderen Teilnehmerports über eine Rahmenperiodendauer, mit Ausnahme ihres eigenen gesprochenen Wortes, so dass das zusammengesetzte gesprochene Wort jedes Benutzerports verschieden ist. Allerdings ist die Anzahl der Konferenzteilnehmer in derartigen busstrukturierten Konferenzsystemen durch die Anzahl paralleler Transportkanäle begrenzt (bei diesem System die Anzahl der Zeitschlitze).
  • Ein Verfahren und eine Vorrichtung für die Durchführung einer Gruppenkommunikation in einem Kommunikationssystem ist bereits aus dem U.S.-Patent 6,078,809 bekannt. In diesem Patent werden von einem ersten Teilnehmer codierte Sprachsignale an die anderen Teilnehmer übertragen. Jeder Teilnehmer verfügt über zwei Decodierer, die jeweils eines der codierten Signale empfangen, sowie einen Kombinator zum Kombinieren der decodierten Sprachsignale zur Ausgabe an den Benutzer. Allerdings ist auch hier die Anzahl von Konferenzteilnehmern durch die Anzahl paralleler Transportkanäle beschränkt.
  • Aus der JP 7245664 ist ein Telefonkonferenzsystem bekannt, bei dem lediglich zwei Transportkanäle für den Aufbau einer Konferenz mit einer unbegrenzten Anzahl von Teilnehmern benötigt werden. Als Transportkanäle werden die beiden B-Kanäle eines ISDN-Systems verwendet. Die Konferenz wird aufgebaut, indem die ISDN-Anschlüsse derart verknüpft werden, dass sie eine Kettenschaltung bilden, in welcher Daten in zwei gegensinnig umlaufenden Ringen ausgetauscht werden. Der erste Teilnehmer ruft den zweiten Teilnehmer auf einem seiner B-Kanäle an. Während der zweite Teilnehmer mit dem ersten Teilnehmer auf einem der beiden B-Kanäle verbunden wird, kann der zweite Teilnehmer einen dritten Teilnehmer auf dem anderen B-Kanal anrufen usw. Der letzte Teilnehmer der Konferenzverbindung ruft den ersten Teilnehmer auf dem zweiten B-Kanal an und schließt somit die Kette. Jeder Teilnehmer ist nunmehr mit zwei weiteren Teilnehmern verbunden. Mittels einer Konferenzschaltung in jedem Endgerät wird lediglich das eigene Sprachsignal oder die Summe des eigenen Sprachsignals sowie ein (Summen-) Signal, das von einem der direkt verbundenen Teilnehmer empfangen wird, an den anderen direkt verbundenen Teilnehmer übertragen. Dies erlaubt der Konferenzschaltung in jedem der Teilnehmerendgeräte die Bildung des Summensignals sämtlicher anderen Teilnehmer aus den beiden empfangenen (Teilsummen-) Signalen. Mit dieser Lösung wird ein gleichzeitiger Kontakt sowie eine Telefonverbindung mit kostengünstigen Endeinrichtungen und ohne die Verwendung einer zentralen Vorrichtung erreicht.
  • Die Regeln, wie die Daten über die Konferenzschaltung verteilt werden, scheinen vom Standort der Kette abhängig zu sein. Wird ein Kanal unterbrochen, so können einige der Teilnehmer nicht von anderen Teilnehmern gehört werden.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Das Ziel der Erfindung strebt nach einer einfacheren Lösung.
  • Dieses Ziel wird dadurch erreicht, dass jeder Konferenzteilnehmer eine Sprachcodierung auf sein eigenes Sprachsignal anwendet, um so die Bandbreite seines Sprachsignals zu reduzieren, so dass das bandbreitenkomprimierte Sprachsignal maximal die Hälfte der Bandbreite des Datentransportkanals aufweist, jedes komprimierte Sprachsignal in den Datentransportkanal eingekoppelt wird und jeder Konferenzteilnehmer die komprimierten Sprachsignale der anderen Teilnehmer aus dem Datentransportkanal auskoppelt, jeder Teilnehmer die komprimierten Sprachsignale decodiert und jeder Konferenzteilnehmer sämtliche decodierten Sprachsignale zu einem Summensignal summiert.
  • Durch das Codieren der Sprachsignale ist es möglich, mehr als ein Sprachsignal in einem Datentransportkanal zu transportieren. Da jedem Teilnehmer jedes Originalsprachsignal eines jeden weiteren Teilnehmers bereitgestellt wird, kann das Summensignal auf einfache Weise durch das Summieren dieser separaten Signale gebildet werden. Da separate Signale jedes Teilnehmers vorliegen, ist es – wie allgemein bekannt – ferner möglich, ein räumliches Signal zu bilden. Die räumliche (stereophonische) Wiedergabe erleichtert die Unterscheidung zwischen den unterschiedlichen Sprechern. Da jedes Signal eines jeden Konferenzteilnehmers separat bereitgestellt wird, kann der Benutzer die Stimmen unabhängig voneinander und nach seinen eigenen Präferenzen einstellen.
  • Im Gegensatz zu bekannten Systemen ist die Anzahl der Transportkanäle niedriger als die Anzahl der Teilnehmer. Ferner ist es nicht notwendig, eine geschlossene Verbindungskette aufzubauen.
  • Wird jedoch eine geschlossene Verbindungskette gebildet, z.B. wird jeder Teilnehmer mit zwei weiteren Teilnehmern verbunden, und die kodierten Sprachsignale werden gleichzeitig hin und hergesendet, so sorgt die geschlossene Kette für Redundanz. Wird die Kette versehentlich zwischen zwei Teilnehmern unterbrochen, können dennoch sämtliche Teilnehmer miteinander kommunizieren. Lediglich beim Auftreten einer zweiten Unterbrechung wird die Konferenzverbindung in zwei Teilgruppen getrennt, wobei keine Kommunikationsmöglichkeiten zwischen den beiden Teilgruppen bestehen. Deshalb sollte im Falle einer unterbrochnen Verbindung die Unterbrechung so schnell wie möglich geschlossen werden.
  • KURZE BESCHREIBUNG DER ERFINDUNG
  • Die Erfindung soll im folgenden anhand der Figuren sowie mittels Beispielen weiter erläutert werden.
  • 1 zeigt ein Endgerät für eine Konferenzverbindung (PC);
  • 2 zeigt Schritte zur Durchführung einer Konferenzverbindung;
  • 3 zeigt eine Konferenzverbindung mit drei Teilnehmern;
  • 4 zeigt eine Konferenzverbindung mit fünf Teilnehmern, mit geschlossenem Ring.
  • Zunächst soll eine bevorzugte Ausführungsform eines Endgerätes beschrieben werden, welches die Erfindung umfasst. Ursprünglich wurde ein PC 1 als Endgerät ausgewählt, um in sehr kurzer Zeit ein Anschauungsmodel zu schaffen. Als Sprachschnittstelle zwischen einem Benutzer und dem PC 1 wird ein Soundsystem 13 verwendet. Viele PCs verfügen heutzutage über ein integriertes Soundsystem 13. Ist ein derartiges integriertes Soundsystem nicht vorgesehen, oder soll der besseren Qualität halber ein zusätzliches Soundsystem verwendet werden, so können auch Soundsysteme verwendet werden, die als Erweiterungskarten erhältlich sind. Ein Mikrophon 11 sowie ein oder mehrere Lautsprecher 12 werden in die Schnittstelle des ausgewählten Soundsystems eingesteckt. Alternativ kann auch eine sogenannte Sprechgarnitur mit einem am Kopfhörer angebrachten Mikrofon verwendet werden. Da bezüglich des Datentransportkanals in diesem Beispiel auf das weitverbreitete ISDN zurückgegriffen wird, muss der PC 1 ebenfalls mit einem ISDN-Adapter 15 ausgestattet sein. Eine Telefonkonferenzanwendungssoftware, im folgenden als Anwendungssoftware 14 bezeichnet, steuert den Datenaustausch zwischen dem Soundsystem 13 und dem ISDN-Adapter 15 und verleiht dem PC somit die Funktion eines Telefonkonferenzendgerätes. Es sei darauf hingewiesen, dass Standardsoftwaretreiber für die Soundsysteme und den ISDN-Adapter für die Kommunikation mit der Anwendungssoftware ausreichend sind. Es müssen keine Änderungen an der Treibersoftware vorgenommen werden.
  • Das Mikrofon 11 wird zur Digitalisierung analoger, vom Benutzer hervorgebrachten Sprachsignale in digitale Abtastproben verwendet. Die Anwendungssoftware 14 codiert die digitalen Abtastproben mittels eines Sprachcodierers (Software). Um die Erfindung vorteilhaft zu nutzen, muss der Codierungsgewinn mindestens 50% betragen. Dies bedeutet, dass die Datenrate des codierten Sprachsignals maximal die Hälfte der Datenrate des nicht codierten Sprachsignals (bei einer Konferenz mit drei Teilnehmern) betragen muss. Somit kann ein gewöhnlicher Sprachkanal verwendet werden, um zwei codierte Sprachsignale zu halten. In der Zwischenzeit gibt es eine Vielfalt an Sprachcodierern, die auch in Mobilkommunikationssystemen Verwendung finden, um die Leistungsfähigkeit eines solchen Systems zu verbessern. Aktuelle Codierer sorgen bei einer Datenübertragungsgeschwindigkeit von 12,65 kbps nahezu für dieselbe Qualität (so-genannte Breitbandcodecs) wie uncodierte Sprache über ISDN, die 64 kbps benötigt. Mittels eines derartigen Breitbandcodecs können vier codierte Sprachsignale über einen standardmäßigen ISDN-B-Kanal transportiert werden.
  • Für jeden weiteren Teilnehmer einer Konferenz muss ein geeigneter Decodierer (Software) bereitstehen. Allerdings ist es keine Voraussetzung, dass sämtliche Teilnehmer denselben Codierer verwenden müssen. Die Art des Decodierers, der von jedem Teilnehmer genutzt wird, kann zu Beginn der Konferenzverbindung ausgehandelt werden.
  • Die 2 zeigt nun die Schritte, die von der Anwendungssoftware 14 ausgeführt werden müssen. In der erfindungsgemäßen Ausführungsform muss die Anwendungssoftware von dem Benutzer gestartet werden, wenn dieser eine Konferenzverbindung aufbauen möchte oder auf die Teilnahme in einer Konferenzverbindung wartet (Schritt 201). Gemäß einer bevorzugten Ausführungsform stellt der Initiator einer Konferenzverbindung zunächst eine Liste sämtlicher Konferenzteilnehmer mit deren Rufnummernidentifikation zusammen. Vorzugsweise wird diese Liste nach einer Reihenfolge sortiert, z.B. nach Länder- oder Städtekennzahlen, so dass sämtliche Teilnehmer in einer Weise verbunden werden, welche die Verzögerung zwischen der ersten und der letzten Partei der Konferenzverbindung minimiert. Obgleich die Liste lediglich die Teilnehmer enthalten kann, die noch nicht an der Konferenzverbindung teilnehmen, kann es von Vorteil sein, die vollständige Liste zu senden und lediglich die Teilnehmer zu markieren, die der Konferenz bereits beigetreten sind. Hierdurch steht jedem Konferenzteilnehmer eine vollständige Informationsmenge über die anderen Konferenzteilnehmer zur Verfügung. Diese Information kann für die Anzeige von Statusinformationen über die anderen Parteien verwendet werden, oder um den Kreis der Konferenzteilnehmer zu schließen, wenn eine Partei die Konferenzverbindung mittendrin verlässt, während die anderen Parteien mit der Konferenzverbindung fortfahren möchten.
  • Diese Liste wird beispielsweise an den ersten Teilnehmer in der Liste gesendet, der nicht markiert ist, d.h. bisher noch kein Teilnehmer an der Konferenzverbindung ist. Der Liste können auch zusätzliche Informationen hinzugefügt werden, z.B. der Typ des Sprachcodierers, der von einer bestimmten Partei verwendet wird.
  • Die Anwendungssoftware eines Teilnehmers, die auf einen Anruf wartet, nimmt einen eingehenden Anruf an und wertet die empfangene Konferenzliste aus. Liegt keine Liste vor, wird eine gewöhnliche Verbindung zwischen zwei Teilnehmern hergestellt. Bei Vorliegen einer Liste wird diese von der Anwendungssoftware ausgewertet (Schritt 202). Das Endgerät markiert sich selbst in der Liste als der Konferenz beigetreten. Sind alle Teilnehmer in der Liste markiert (das bedeutet, dass die Liste in diesem Sinne leer ist, da keine weiteren anzurufenden Teilnehmer vorliegen; Entscheidungskasten 203), muss kein weiterer Teilnehmer zu der Konferenzverbindung aufgefordert werden, und das Endgerät kann unmittelbar mit der Konferenz beginnen (Schritt 205). Ansonsten baut das Endgerät eine Verbindung zum nächsten Teilnehmer in der Liste auf (Schritt 204).
  • Im Konferenzmodus codiert das Endgerät sein eigenes Sprachsignal (Schritt 205) und koppelt das komprimierte Sprachsignal in den Datentransportkanal ein. Dann werden sämtliche komprimierten Sprachsignale der anderen Teilnehmer aus dem Datentransportkanal ausgekoppelt (Schritt 207) und decodiert (Schritt 208).
  • Nachdem sämtliche Sprachsignale decodiert sind, beispielsweise in PCM-Signale, wird die Summe sämtlicher Signale gebildet (Schritt 209) und über die Lautsprecher bzw. Kopfhörer ausgegeben. Selbstverständlich kann eine zusätzliche Verarbeitung wie eine aus dem Stand der Technik bekannte räumliche Verteilung jedes Teilnehmers für die stereophonische Wiedergabe angewendet werden.
  • Die Schritte des Codierens und Decodierens (205209) werden vorzugsweise mit der Taktfrequenz eines Datentransportkanals ausgeführt (z.B. im ISDN mit einer Taktfrequenz von 8 kHz). Solange die Konferenzverbindung andauert (Entscheidungsschritt 210), werden diese Codier- und Decodierschritte (205209) in einer Schleife wiederholt. Wird die Konferenzverbindung geschlossen, kann die Anwendung beendet werden (Schritt 211) oder kann alternativ in den Wartestatus zurückkehren (201).
  • Die 3 zeigt eine Telekonferenzverbindung mit drei Teilnehmern T1, T2, T3 auf der Grundlage von ISDN als Datentransportkanäle. Bei der Herstellung der Konferenzverbindung wird der erste Teilnehmer mit dem zweiten Teilnehmer T2 über einen einzigen ISDN-B-Kanal B12. verbunden. Der dritte Teilnehmer T3 wird mit dem zweiten Teilnehmer T2 ebenfalls über einen einzigen ISDN-B-Kanal B23 verbunden. Somit macht lediglich der zweite Teilnehmer T2 „in der Mitte" Verwendung von beiden seiner zwei B-Kanäle B12, B23. Die ISDN-Kanäle stellen in jeder Richtung Datenbytes mit einer Bitbreite von 8 Bit bei einer Taktfrequenz von 8 kHz bereit. In der 3 sind die ISDN-B-Kanäle jeder Richtung durch ein Datenwort symbolisiert.
  • In diesem Beispiel wird davon ausgegangen, dass die Konferenzteilnehmer Sprachcodierer ENC1, ENC2, ENC3 verwenden, welche Sprache auf eine Datenrate von maximal 16 kbps komprimieren. Werden die codierten Sprachsignale kontinuierlich gesendet, sind lediglich zwei Datenbits mit einer Taktfrequenz von 8 kbps notwendig, um sämtliche Ausgangsdaten jedes Codierers zu transportieren. Ist die Taktfrequenz niedriger, so können Füllbits eingesetzt werden, um die geeignete Datenrate zu erhalten. Stehen Codierer mit einer Datenrate zur Verfügung, die gleich oder kleiner als 8 kbps ist, dann muss lediglich eines der acht Bits jedes Bytes verwendet werden, wodurch die Anzahl möglicher Konferenzteilnehmer auf 9 erhöht werden kann.
  • Das Endgerät T1 des ersten Teilnehmers erzeugt für jede codierte Abtastprobe zwei Bits A1, A2. Diese Bits werden in das ISDN-Signal eingekoppelt, das an das Endgerät T2 des zweiten Teilnehmers gesendet wird. Der zweite Teilnehmer koppelt diese beiden Bits A1, A2 aus und führt sie seinem ersten Decodierer DEC1 zu. Ein (nicht gezeigtes) Schaltmittel kopiert diese beiden Bits (Strichlinie) auf das Datenwort der zweiten ISDN-Leitung B23. Die beiden Ausgangsdatenbits B1, B2 des Codierers ENC2 des zweiten Endgerätes T2 koppeln diese beiden Bits in das Datenwort der zweiten ISDN-Leitung, die in Richtung des Endgerätes T3 des dritten Teilnehmers gesendet wird, ein. Hierdurch empfängt das Endgerät T3 des dritten Teilnehmers die beiden codierten Bits A1, A2 des Endgerätes T1 sowie die beiden codierten Datenbits B1, B2 des zweiten Endgerätes T2. Somit ist das dritte Endgerät in der Lage, das Summensignal in einem Konferenzmittel (ADD1) der beiden anderen Konferenzteilnehmer zu bilden. Seine eigenen codierten Datenbits C1, C2 werden an das zweite Endgerät T2 zurückgesendet. Das zweite Endgerät T2 führt diese beiden codierten Datenbits des dritten Endgerätes T3 einem Decodierer DEC3 zu. Die Datenbits C1, C2 werden ebenfalls auf die erste ISDN-Leitung B12, die an das erste Endgerät T1 gerichtet ist, kopiert (Strichlinie). Auch die Ausgangsbits des Codierers ENC2 des zweiten Endgerätes werden in die dritte und zweite Position des Datenwortes, das an das erste Endgerät T1 gesendet wird, eingekoppelt.
  • Bei dieser Ausführungsform hatte jede Abtastprobe ihre feste Position im Datenwort des ISDN-Signals. Der Fachmann weiß, dass auch andere Anordnungen der codierten Datenbits möglich sind, z.B. dass in jedem Endgerät die Position des Datenbits um zwei Positionen gedreht wird. Hierdurch werden die eigenen Datenbits stets an derselben Position eingekoppelt (z.B. an den ersten zwei oder den letzten zwei Positionen), was eine Zuordnung der Datenbits zu den geeigneten Decodierern an jedem Endgerät vereinfacht.
  • Der Vollständigkeit halber zeigt die 3, dass in jedem Endgerät akustische Echokompensatoren AEC vorgesehen sind. Da die Verwendung akustischer Echokompensatoren zum Allgemeinwissen des Fachmanns gehört, ist keine nähere Beschreibung erforderlich. Die Verwendung des Echokompensators ist bei der Verwendung von Kopfhörern überflüssig.
  • Obgleich eine Konferenz mit drei Teilnehmern in bekannter Weise mit zwei ISDN-Leitungen durch Senden von Summensignalen an die Teilnehmer hergestellt werden kann, liegt der Vorteil dieser Ausführungsform darin, dass jeder Teilnehmer ein separates Signal für jeden Teilnehmer empfängt. Dieses kann für die weitere Verarbeitung genutzt werden, wie für räumliche Anordnungen oder eine individuelle Filterung.
  • Die 4 zeigt eine weitere erfindungsgemäße Ausführungsform mit einer Konferenzverbindung mit fünf Teilnehmern. Zur besseren Übersicht sind lediglich die virtuellen Datenverbindungen zwischen dem Endgerät dargestellt, wobei jede Linie die Übertragung von zwei codierten Datenbits zu einer gegebenen Abtastzeit darstellt. Zusätzlich zu der Ausführungsform nach 3 ruft das letzte Endgerät T5 des Konferenzteilnehmers den ersten Teilnehmer T1 an und schließt damit die Kette. Hierdurch haben sämtliche Teilnehmer identische Rollen und zeigen ein identisches Verhalten. Es macht keinen Unterschied, ob ein Teilnehmer sich am Ende oder in der Mitte der Leitung befindet. Wie aus 4 mit herkömmlichen ISDN-Schnittstellen ersichtlich, sind beide B-Kanäle belegt, jedoch jeweils nur in „Vorwärts"-Richtung. Die „Rückwärts"-Richtung wird nicht beansprucht. Durch Verwenden auch der Rückwärtsrichtung kann die Anzahl der Konferenzteilnehmer verdoppelt werden (z.B. sendet jedes ungerade Endgerät vorwärts und jedes gerade Endgerät sendet rückwärts). Eine weitere Möglichkeit besteht im Senden der codierten Abtastproben in beiden Richtungen, um so die Verzögerung zwischen den Teilnehmern zu minimieren.
  • Die mehrheitliche Anzahl von Konferenzverbindungen geht nicht über Verbindungen mit mehr als fünf Teilnehmern hinaus. Sind jedoch Verbindungen mit mehr als fünf Teilnehmern notwendig, können zusätzliche Maßnahmen wie Stummschalten bei nicht aktiven Teilnehmern angewendet werden, um mehrere Teilnehmer zu involvieren.
  • Der Sprachcodierer ist im Sinne der erforderlichen Verarbeitungsleistung normalerweise wesentlich komplexer als der Sprachdecodierer. Da für die Erfindung lediglich ein Sprachcodierer benötigt wird, sind die hinzugefügten Verarbeitungsvoraussetzungen für die zusätzlichen Sprachdecodierer mit der üblichen Verarbeitungsleistung aktueller PCs vernachlässigbar, auch bei Laptops.
  • Es liegt im Ermessen des Fachmanns, welche Ausführungsform für eine bestimmte Ausgestaltung am profitabelsten ist. Hinsichtlich des Datentransportkanals wurde auf feste ISDN-Leitungen hingewiesen, da dies das am meisten verwendete Transportmedium für diese Anwendung zu sein scheint. Selbstverständlich ist die Erfindung nicht auf ISDN-Kanäle beschränkt. Aus TDM-Signale können verwendet werden, wobei die Teilnehmer einer Konferenzverbindung sich jeden Zeitschlitz teilen. Auch Anwendungen mit Endgeräten für die mobile Kommunikation sind denkbar, wenn Verbindungen zu zwei Teilnehmern gleichzeitig hergestellt werden können.
  • Ein weiterer Vorteil der Erfindung besteht darin, dass, wenn die Benutzer einer Konferenzverbindung den Sprachcodierer (Software) unter sich aufteilen, sie ihre eigene Sprachcodiersoftware verwenden können. Somit können sie auf einfache Weise Aktualisierungen auf die neueste verfügbare Technologie durchführen. Im Falle einer zentralen Konferenzvorrichtung sind die Fähigkeiten einer Konferenzverbindung durch diese Vorrichtung eingeschränkt. Die Benutzer einer Konferenzverbindung haben deshalb keine Möglichkeit, von besseren Sprachcodierern zu profitieren, solange der Netzbetreiber, oder wer auch immer für die zentrale Konferenzvorrichtung verantwortlich ist, nicht bereit ist, den Sprachcodierertyp zu aktualisieren, den er sich einrufenden Teilnehmern anbietet. Da die Benutzer der nicht zentralisierten Konferenzverbindung ihre eigenen Sprachcodecs verwenden können, ist es ihnen ebenfalls möglich, ihre eignen Codierverfahren anzuwenden.
  • Obwohl die Erfindung anhand eines PCs beschrieben wurde, weiß der Fachmann, dass es lediglich eine Frage der Zeit ist, wann Signalprozessoren und Schaltungen mit ausreichender Rechenleistung zu niedrigsten Kosten zur Verfügung stehen, um die Erfindung in drahtgebundenen Telefonen für öffentliche und private Wählnetze zu integrieren bzw. um die Erfindung in Endgeräte für die mobile Kommunikation zu integrieren. Ferner sind die Codierer und Decodierer durchgehend als Sprachcodierer bezeichnet worden. Sprachcodierer sind dahingehend zu verstehen, dass sie die beste Qualität für Sprachsignale liefern. Allerdings umfasst dieser Begriff jeden mehr oder weniger geeigneten akustischen Codierer, z.B. auch Codierer, die auf Online-Musikkomprimierung spezialisiert sind, solange dieselben Vorteile erreicht werden.
  • Ferner muss nochmals erwähnt werden, dass die Erfindung nicht auf die in der vorliegenden Erfindung beschriebenen spezifischen Ausführungsformen und Beispiele beschränkt sind. Dies bedeutet, dass aufgrund der in der Beschreibung enthaltenen Lehre verschiedene Abänderungen und Variationen der Erfindung ausgeführt werden können.

Claims (11)

  1. Verfahren zur Teilnahme in einer Telekonferenz mit Zugriff auf mindestens zwei Datentransportkanäle, wobei jeder Konferenzteilnehmer eine Sprachcodierung (205) auf seine eigene Sprache anwendet und sein eigenes Sprachsignal über einen Datentransportkanal zu den anderen Konferenzteilnehmern überträgt und jeder Konferenzteilnehmer ein Summensignal der empfangenen Sprachsignale der anderen Teilnehmer bildet, durch Decodieren und Summieren (209) sämtlicher decodierter Sprachsignale zu einem Summensignal, dadurch gekennzeichnet, dass die Sprachcodierung (205) von dem Konferenzteilnehmer angewendet wird, um die Bandbreite seines Sprachsignals derart zu reduzieren, dass das bandbreitenkomprimierte Sprachsignal maximal die Hälfte der Bandbreite des Datentransportkanals aufweist, jedes komprimierte Sprachsignal in den Datentransportkanal eingekoppelt wird (206), jeder Konferenzteilnehmer die komprimierten Sprachsignale der anderen Teilnehmer aus dem Datentransportkanal auskoppelt (207), und jeder Teilnehmer die komprimierten Sprachsignale decodiert (208).
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Summensignal räumlich verarbeitet wird.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Sprachcodecs (ENC1, ENC2, ENC3; DEC1, DEC2, DEC3) unabhängig voneinander ausgewählt werden.
  4. Verfahren nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, dass die codierten Sprachsignale gleichzeitig in beide Richtung gesendet werden.
  5. Telekommunikationsvorrichtung mit Konferenzfunktionen, wobei das eigene Sprachsignal auf einem Datentransportkanal zu anderen Konferenzteilnehmern gesendet wird, mit einem Konferenzmittel zum Bilden eines Summensignals der von den anderen Konferenzteilnehmern empfangenen Sprachsignale, mit einem Sprachcodierer (ENC1) zum Codieren des eigenen Sprachsignals in ein komprimiertes Sprachsignal, und mit mindestens zwei Sprachdecodierern (DEC2, DEC3) zum Decodieren der ausgekoppelten komprimierten Sprachsignale in dekomprimierte Sprachsignale zur Verarbeitung in dem Konferenzmittel (ADD1), dadurch gekennzeichnet, dass ein Dateneinkopplungsmittel zum Einkoppeln des komprimierten Sprachsignals in einen Datenstrom vorgesehen ist und ein Datenauskopplungsmittel zum Auskoppeln komprimierter Sprachsignale aus dem empfangenen Datenstrom vorgesehen ist.
  6. Telekommunikationsvorrichtung nach Anspruch 5, dadurch gekennzeichnet, dass die Telekommunikationsvorrichtung ein Computer (1) ist.
  7. Telekommunikationsvorrichtung nach Anspruch 6, dadurch gekennzeichnet, dass das Soundsystem des Computers zum Erzeugen der Sprachabtastproben und zum Reproduzieren des Konferenzsummensignals verwendet wird, und dass Codiermittel und Decodiermittel von Softwareroutinen (14) ausgeführt werden, die mit dem Soundsystem (13) dieses Computers kommunizieren.
  8. Telekommunikationsvorrichtung nach Anspruch 5, dadurch gekennzeichnet, dass die Telekommunikationsvorrichtung ein Telefon ist.
  9. Telekommunikationsvorrichtung nach Anspruch 5, dadurch gekennzeichnet, dass die Telekommunikationsvorrichtung ein Telefon für die mobile Kommunikation ist.
  10. Computerprogrammprodukt zum Ausführen der Verfahrensschritte nach den Ansprüchen 1 bis 4 in einer Datenverarbeitungsvorrichtung.
  11. Datenträger, umfassend eine Anwendungssoftware nach Anspruch 10.
DE60212196T 2002-02-06 2002-02-06 Verteilte telefonkonferenz mit sprachkodierern Expired - Lifetime DE60212196T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2002/001231 WO2003067865A1 (en) 2002-02-06 2002-02-06 Distributed telephone conference with speech coders

Publications (2)

Publication Number Publication Date
DE60212196D1 DE60212196D1 (de) 2006-07-20
DE60212196T2 true DE60212196T2 (de) 2007-06-06

Family

ID=27675559

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60212196T Expired - Lifetime DE60212196T2 (de) 2002-02-06 2002-02-06 Verteilte telefonkonferenz mit sprachkodierern

Country Status (5)

Country Link
US (1) US7606563B2 (de)
EP (1) EP1472855B1 (de)
AU (1) AU2002252996A1 (de)
DE (1) DE60212196T2 (de)
WO (1) WO2003067865A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040190701A1 (en) * 2003-03-28 2004-09-30 Versatel Networks Inc. Apparatus and method for a distributed conference bridge
US20070004438A1 (en) * 2005-07-01 2007-01-04 Alec Brusilovsky Method and apparatus enabling PTT (push-to-talk) communications between legacy PSTN, cellular and wireless 3G terminals
US8483101B2 (en) * 2009-09-16 2013-07-09 Mitel Networks Corporation System and method for cascaded teleconferencing
US8914007B2 (en) 2013-02-27 2014-12-16 Nokia Corporation Method and apparatus for voice conferencing
US9313660B2 (en) 2013-11-01 2016-04-12 At&T Intellectual Property I, Lp Apparatus and method for secure provisioning of a communication device

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4920565A (en) 1988-07-18 1990-04-24 Northern Telecom Limited Method for connection of secure conference calls
NO169209C (no) 1989-12-22 1992-05-20 Alcatel Stk As Fremgangsmaate og system for etablering av konferanseforbindelse.
US5276678A (en) 1990-06-18 1994-01-04 Intelect, Inc. Distributed switching and telephone conferencing system
JPH09506983A (ja) * 1993-12-16 1997-07-08 ボイス コンプレッション テクノロジーズ インク. 音声圧縮方法及び装置
JP3425211B2 (ja) 1994-03-03 2003-07-14 株式会社日立コミュニケーションテクノロジー Isdnチェ−ン接続方法及びその装置
US6078809A (en) 1998-02-27 2000-06-20 Motorola, Inc. Method and apparatus for performing a multi-party communication in a communication system
US7177627B2 (en) 2001-07-17 2007-02-13 Comverse, Inc. Method and apparatus for providing images for caller identification over a mobile network
KR100922954B1 (ko) * 2003-02-13 2009-10-22 삼성전자주식회사 할당된 업링크 채널에 적응적으로 음성 데이터를 전송하기위한 통신단말기의 디지털신호 처리기 및 이를 이용한음성 데이터의 전송 방법

Also Published As

Publication number Publication date
US20070067158A1 (en) 2007-03-22
WO2003067865A1 (en) 2003-08-14
EP1472855B1 (de) 2006-06-07
US7606563B2 (en) 2009-10-20
AU2002252996A1 (en) 2003-09-02
DE60212196D1 (de) 2006-07-20
EP1472855A1 (de) 2004-11-03

Similar Documents

Publication Publication Date Title
DE60038516T2 (de) Verfahren und System zum Bandbreitenreduktion von Multimedien-Konferenzen
DE60209637T2 (de) Steuerung eines Konferenzgespräches
DE69927578T2 (de) Verfahren und vorrichtung zur durchführung einer mehrparteienkommunikation für ein kommunikationssystem
DE60127929T2 (de) Verfahren und vorrichtung für einen sprechgruppenruf in einem drahtlosen nachrichten übertragungssystem
DE60010594T2 (de) Verfahren und System für Multimediakonferenz
DE69921062T2 (de) Fernsprechkonferenzgerät und -verfahren
DE3823219C1 (de)
DE10231191A1 (de) Software-basierte Vielpunktkonferenzfähigkeit für einen einzelnen Agenten bzw. Vermittler
DE19756191A1 (de) Verfahren, Vermittlungseinrichtung und Telekommunikationssystem zum Ausführen von Datenkommunikationen zwischen Teilnehmerstationen
EP1168796A1 (de) Wap-gruppenanruf
DE102007046978A1 (de) Verfahren und Kommunikations-Endgerät zum Austausch von Daten während oder nach einer Kommunikationsverbindung
DE10013387A1 (de) Vorrichtung und Verfahren zum Zuführen von Klingel- und Sprachanrufen über eine Arbeitsstation
EP2047632B1 (de) Verfahren zum durchführen einer sprachkonferenz und sprachkonferenzsystem
DE102005049077B4 (de) Verfahren zum Übertragen von Mediendaten, Kommunikationsnetzwerk-Einheit und Computerprogrammelement
DE60212196T2 (de) Verteilte telefonkonferenz mit sprachkodierern
DE69736060T2 (de) Verfahren und vorrichtung zum bereitstellen einer mehrparteien-sprachverbindung für ein drahtloses kommunikationssystem
DE60211383T2 (de) Videokonferenzsystem für das arbeiten aus der ferne
WO2009153176A1 (de) Verfahren zur ermittlung aktiver kommunikationssitzungen und kommunikationssitzungs-informationsserver
EP1050186A1 (de) Kommunikationsnetz, verfahren zum übertragen eines signals, netzverbindungseinheit und verfahren zum anpassen der datenrate eines skalierten datenstroms
CH681409A5 (en) Telephone connection speech monitoring circuit - combines extracted data words obtained from incoming and outgoing speech signals
EP1170934A2 (de) Verfahren und Multimedia-Kommunikationseinrichtung zur Kommunikation zwischen Endgeräten mit unterschiedlichen Multimediafähigkeiten
DE19953868A1 (de) Telekommunikationssystem
DE10153265A1 (de) System zur Sprachkommunikation über ein digitales Netzwerk und zugehörige Schnurlostelefonanlage
DE102007009135B4 (de) Verteilte Konferenz über Verbindung zwischen PBX und Konferenzbrücke
DE2911102A1 (de) Verfahren fuer die produktion von laufbildern mit tonbegleitung in einem heimfernsehgeraet

Legal Events

Date Code Title Description
8364 No opposition during term of opposition