EIN FERNSEHSYSTEM FÜR DAS ZUSAMMENSCHAUEN UND EINE DAZU BENÖTIGTE AUDIOENTZERRUNG
MOTIVATION: Nor dem Fernsehgerät wird heute immer mehr Zeit verbracht. Allerdings ist es eine einsame Aktivität. Viele Leute würden Sendungen lieber mit ihren abwesenden Freunden zusammen anschauen und diskutieren. Ausgehend davon wäre ein neuer Dienst winschenwert: Eine audiovisuelle Verbindung, die auf dem selben Fernsehgerät parallel mit dem TV Programm laufen kann.
TECHNISCHE GRUNDLAGEN: Fernsehgeräte einerseits und Telefon- oder Internet- Verbindungen andererseits sind heute Bestandteil in vielen Haushalten. Durch einen ge- eigneten Ver-knüpfüngspunkt kann diese schon verfugbare Infrastruktur neue Dienste leisten: Während ein TV Programm auf dem Fernsehgerät bereits läuft, kann eine audiovisuelle Verbindung mit einem Freund, der gleichzeitig das selbe TV-Programm in seinem Haus schaut und über die selbe Ausrüstung verfugt, mittels Telefon oder Internet hergestellt und parallel auf dem Fernsehgerät gezeigt werden, z.B. als Bild-in-Bild Funktion. So könnte das selbe TV-Programm zusammen angeschaut und diskutiert werden, obwohl beide Zuschauer entfernt sitzen.
BESCHREIBUNG DER INNOVATION: Diese Innovation basiert sich auf einer Kombination einer bereits bestehenden -Infrastruktur, beispielsweise in einem Haus, mit einer minimalen Anzahl von den dazu benötigten zusätzlichen Modifikationen, wie es in Abb. 1 dargestellt ist.
Die verfugbare Infrastruktur beinhaltet beispielsweise
• Ein Fernsehgerät mit Bildschirm TV1, TV2, Lautsprechern L1, L2) und üblichen TV Anschlüssen (Antenne, Kabel oder Satellit), und
• Ein Telefon- (z.B. ISD? ) oder Internet-Anschluss (z.B. PC mit On-line Modem), geeignet für Videotelefon oder Videokonferenz.
Folgende Zusatzteile werden benötigt:
• Mittel zur Erzeugung audiovisueller Signale, beispielsweise Mikrophone Ml, M2 und Kameras Kl, K2,
Eine geeignete breitbandige Verbindung Dl, D2 mit dem Fernsehgerät für unkomprimierte, audiovisuelle Signale,
• Verbindungen, insbesondere drahtlose Verbindungen Wl, W2, zu Übertragungsnetzwerken, beispielsweise dem Telefonnetz oder dem Internet, und
• Eine Rechnereinheit geeignet für Verarbeitung von audiovisuellen Signalen (Kompression und Dekompression) und für die Signalverwaltung (Auswahl- und Anruffunktionen für Videotelefon, Vor- und Nachverarbeitung von audiovisuellen Signalen zwecks Anpassung mit den TV-Funktionen).
Diese zusätzlichen Teile sind Bestandteil eines sogenannten Ver-knüpfungspunkts VP 1 , VP2 oder Verknüpfungsnetzwerks und können entweder in dem Fernsehgerät mitintegriert werden (mit Möglichkeit einer Mitbenutzung bereits verfügbarer Verarbeitungsressourcen) oder können in einem Zusatzgerät untergebracht werden.
Es sei angenommen, dass dasselbe TV Programm an zwei getrennten Orten 1, 2 durch zwei Benutzer gesehen wird. Bei Bedarf, beispielsweise durch einen Anruf von dem ersten Ort 1 wird eine Videotelefonverbindung zwischen den zwei Orten 1, 2 hergestellt.
An dem ersten Ort 1 wird mittels eines ersten Mikrophons Ml und einer ersten Kamera Kl ein audiovisuelles Signal erzeugt, das in einem ersten Ver-knüpfungspunkt/Verknüpfungs- netzwerk VP1 komprimiert und an ein zweites Verknüpfungsnetzwerk VP2 an dem zweiten Ort 2 übertragen wird. Die Datenübertragung von dem ersten Verknüpfüngsnetzwerk VP1 erfolgt an einen Telefon- oder Internetanschluss, über das Telefonnetz oder das Internet an einen Telefon- oder Internetanschluss an dem zweiten Ort 2 und von dort an das zweite Verknüpfungsnetzwerk VP2. Die Übertragung der komprimierten audiovisuellen Signale von dem ersten Verknüpfungsnetzwerk VP1 zu dem ersten Telefon- bzw. -Internetanschluss und von dem zweiten Telefon- oder Internetanschluss zu dem zweiten Ver-knüpfüngsnetzwerk VP2 erfolgt beispielsweise drahtlos. Diese Verbindungen sind in Abbildung 1 mit den Bezugszeichen Wl, W2 bezeichnet.
Das von dem ersten Ort 1 über das Telefonnetz, das Internet oder ein anderes geeignetes Datennetz empfangene audiovisuelle Signal wird in dem zweiten Verknüpfungsnetzwerk
VP2 dekomprimiert und über eine lokale, breitbandige Verbindung D2 an das zweite Fernsehgerät weitergegeben und weiterverabeitet. Das Videosignal des audiovisuellen Signals wird in einem kleineren Fenster B2 auf dem Bildschirm TV1 dargestellt. Das Tonsignal wird mit dem Audiosignal des Fernsehgeräts an dem zweiten Ort gemischt; das durch Mi- sehen erhaltene Tonsignal wird durch den Lautsprecher L2 des zweiten Fernsehgeräts wiedergegeben.
Parallel zu der Übertragung audiovisueller Daten von dem ersten zu dem zweiten Ort 1, 2 wird in entsprechender Weise unter Verwendung des zweiten Verknüpfungsnetzwerks VPl, des Telefonnetzes oder des Internets und des ersten Verknüpfungsnetzwerks VPl eine audiovisuelle Verbindung von dem zweiten 2 zu dem ersten Ort 1 aufgebaut, über welche Audio- und Videodaten von dem zweiten Ort 2 zu dem ersten Ort 1 übertragen werden. Die Videodaten von diesem zweiten Ort 2 werden dabei in einem -kleineren Fenster Bl auf dem Bildschirm TV1 des ersten Fernsehgeräts zusammen mit dem Fernsehsignal ange- zeigt. Die Audiodaten werden mit den Audiodaten des ersten Fernsehgeräts gemischt und über dessen Lautsprecher Ll wiedergegeben.
In der erläuterten Weise entsteht eine audiovisuelle Verbindung zwischen den beiden Orten gleichzeitig zu dem TV Empfang, wodurch Zuschauer dasselbe TV Programm gemein- sam sehen und diskutieren können.
Die neue Funktionalität ist durch eine Kombination von den verfügbaren Technologien machbar, wie nachfolgend erläutert ist.
Die Kompression/Dekompression des bidirektionalen audiovisuellen Signals kann mittels folgender Verfahren erfolgen:
H263/G723.1 gewährleistet Übertragungsraten von 128 kB/s für ISDN- Telefonverbindung, oder - MPEG4 gewährleistet Übertragungsraten von 64-200 ?kB/s für eine Internet- Verbindung
Die lokale drahtlose Übertragung von den Vernüpfungsnetzwerken zu den Telefon- oder Internetanschlüssen und in umgekehrter Richtung kann beispielsweise mittels folgender Verfahren erfolgen:
WLAN IEEE 802.11.x gewäMeistet Übertragungsraten von 11 - 54 -Mb/s
WLAN Bluetooth gewährleistet Übertragungsraten von 1 Mb/s.
Zur Darstellung der Videodaten von einem Ort in dem Fernsehbild an dem anderen Ort eignet sich die grundsätzlich bekannte Bild-in-Bild-Technologie von Fernsehgeräten, die -hier nicht näher erläutert werden muss.
Für das Zusammenspiel des Fernsehgeräts (TV) an einem Ort und der Übertragung audiovisueller Daten von dem anderen ist eine Lösung für ein im Zusammenhang mit der Erfindung neu entstandenes Problem der Audioentzerrung von entscheidender Bedeutung.
Im Unterschied zu Entzerrungsmethoden, die beispielsweise für Freisprechanlagen im Telefonbereich bekannt sind, müssen im vorliegenden Fall aus dem Mi-krofonsignal an einem Ort sowohl das Audiosignal des Fernsehgeräts dieses Ort als auch das Audiosignal des anderen Ortes, das über den Lautsprecher des Fernsehgeräts dieses Ortes wiedergegeben wird, entfernt werden. Eine Lösung für dieses Problem ist in Abb. 2 für das System des ersten Orts veranschaulicht.
Die beiden Audiosignale, nämlich das Audiosignal des ersten Fernsehgeräts und das Audiosignal, das von dem zweiten Ort 2 empfangen wurde, werden durch den Lautsprecher Ll des ersten Fernsehgeräts zusammen ausgegeben. Dies ist in Abbildung 2 durch eine Addition des Audiosignals des ersten Fernsehgeräts (TV1 Audiosignal) und des über die Datenverbindung von dem zweiten Ort 2 empfangenen Mikrofonsignals (Empfangener Ton aus dem M2) und durch eine Zuführung des additiven Signals zu dem Lautsprecher Ll des ersten Fernsehgeräts dargestellt.
Das erste Mi-krophon Ml an dem ersten Ort 1 nimmt das Echo dieses gemischten Lautsprechersignals und das Nutzsignal des Fernsehzuschauers an dem ersten Ort 1 auf. Nur dieses Nutzsignal soll über die oben erläuterte Datenverbindung zusammen mit einem an dem ersten Ort aufgenommenen Videosignal übertragen werden.
Vor der Kompression des audiovisuellen Signals des ersten Ortes und vor dessen Übertragung muss dieses Echo entfernt werden, um eine unangenehme Mücrophonie und eine Störung des TV-Audiosignals an dem anderen Ende der Verbindung, das heißt an dem zweiten Ort 2, zu verhindern.
Von dem durch das erste Mikrofon Ml erzeugten Signal werden hierzu ein erstes geschätztes Echosignal und ein zweites geschätztes Echosignal subtrahiert. Das erste geschätzte
Echosignal wird mittels eines ersten Entzerrers abhängig von dem Audiosignal des ersten Fernsehgeräts (TV1 Audiosignal) erzeugt, und das zweite geschätzte Echosignal wird mittels eines zweiten Entzerrers abhängig von dem von dem zweiten Ort empfangenen Audiosignal (Empfangener Ton aus dem M2) erzeugt. Die beiden separaten Entzerrer besitzen jeweils einstellbare Koeffizienten. Die richtige Einstellung der Koeffizienten erfolgt durch eine Steuerung, der das Mi-krophonsignal, die Eingangssignale der Entzerrer und das Signale, das durch Subtraktion der Ausgangssignale der Entzerrer von dem Mikrophonsignal erhalten wird, zugeführt sind und die an die beiden Entzerrer angeschlossen ist .
In der Steuerung ist ein Algorithmus implementiert, der unter Verwendung dieser Signale die den Entzerrern zugeführten Koeffizienten während günstiger Signalkonstellationen iterativ verbessert:
• Eine iterative Koeffizientenpassung eines der beiden Entzerrer findet dabei nur dann statt, wenn das Eingangssignal ("TV1 Audiosignal" oder "Empfangener Ton aus dem M2") dieses Entzerrers groß ist und gleichzeitig das mit dem Mikrophon Ml aufgenommene Signal klein ist. Dies entspricht der Annahme, dass nur das Echo mit dem Mi-krophon Ml aufgenommen wird.
• Bei diesen Signalkonstellationen werden die entsprechenden Entzerrungskoeffizienten so eingestellt, dass das entzerrte Signal minimiert wird. Dafür sind mehrere iterative Verfahren, wie z.B. LMS oder ?RLMS Algorithmus, geeignet.
Die erläuterten Verfahren zur Einstellung der Entzerrkoeffizienten, die bei günstigen Sig- nalkonstellationen jeweils für einen Entzerrer vorgenommen werden, sind hinlänglich bekannt und müssen deshalb nicht näher erläutert werden.
Adaptive Filterverfahren sind grundsätzlich in Nowak et al.: "Introduction to Adaptive Filtering", Version 1.5, 2003/08/11 beschrieben. Ein LMS-Filterverfahren (LMS = Least Mean Square) ist beispielsweise in Jones et al.: "Adaptive Filtering: LMS Algorithm", Version 2.13, 2004/02/25 beschrieben. Ein RLMS-Filterverfahren (RLMS = Recursive Least Mean Square) ist beispielsweise in "Design of Active Noise Control Systems With the TSM320 Family, Application Report", Texas Instruments, 1996, Seite 24 ff., bescb-rie- ben.