WO2001084838A1 - Verfahren und system für videokonferenzen - Google Patents

Verfahren und system für videokonferenzen Download PDF

Info

Publication number
WO2001084838A1
WO2001084838A1 PCT/CH2000/000236 CH0000236W WO0184838A1 WO 2001084838 A1 WO2001084838 A1 WO 2001084838A1 CH 0000236 W CH0000236 W CH 0000236W WO 0184838 A1 WO0184838 A1 WO 0184838A1
Authority
WO
WIPO (PCT)
Prior art keywords
participant
image data
data
video conference
subscriber
Prior art date
Application number
PCT/CH2000/000236
Other languages
English (en)
French (fr)
Inventor
Eric Lauper
Beat Herrmann
Original Assignee
Swisscom Mobile Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Swisscom Mobile Ag filed Critical Swisscom Mobile Ag
Priority to BR0013612-3A priority Critical patent/BR0013612A/pt
Priority to MXPA02002131A priority patent/MXPA02002131A/es
Priority to ES00918645T priority patent/ES2206213T3/es
Priority to AU39533/00A priority patent/AU772400B2/en
Priority to DE50003567T priority patent/DE50003567D1/de
Priority to JP2001581534A priority patent/JP4602632B2/ja
Priority to PCT/CH2000/000236 priority patent/WO2001084838A1/de
Priority to US10/069,518 priority patent/US6717607B1/en
Priority to EP00918645A priority patent/EP1201082B1/de
Priority to CN00814101.0A priority patent/CN1192618C/zh
Priority to AT00918645T priority patent/ATE249125T1/de
Priority to DK00918645T priority patent/DK1201082T3/da
Publication of WO2001084838A1 publication Critical patent/WO2001084838A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Definitions

  • the present invention relates to a method and system for video conferences with at least three different video conference participants that communicate with one another, wherein multimedia data are transmitted via a telecommunications network, which comprise at least participant picture data and / or participant sound data, and each participant shows the participant picture data of the other participants on a playback device, e.g. a display or a VRD (Virtual Retinal Display), simultaneously displayed visibly arranged.
  • a playback device e.g. a display or a VRD (Virtual Retinal Display)
  • the invention relates in particular to methods and systems which communicate via telecommunications networks which at least partially consist of a mobile radio network.
  • the fast transmission, reception and display of video images by video and television sets is known.
  • the images usually have a resolution of at least 10x6 ppi (pixels per inch) in sufficiently good color and grayscale quality.
  • a minimum bandwidth of the transmission channel of several megahertz is a prerequisite for the transmission of the entire image information.
  • the cost of such systems is far too high for certain applications such as video conferencing systems for business and private use.
  • media with a smaller bandwidth such as public telecommunications networks, for the transmission of video images.
  • the transmission rate is correspondingly low for these media.
  • Such a limited bandwidth can actually be sufficient for special applications, such as "slow scan" video systems. Examples of this are security and surveillance systems, in which a high refresh rate or high resolution is not necessary.
  • Such systems typically use a resolution of 128x128 pixels for the entire image, using only 16 color or grayscale levels.
  • video systems with higher quality eg with 640x480 pixels (European standard: 620x576 pixels, 8 bit color depth) and a color depth of 64 levels, as are common for video conferences, cannot be transmitted with these systems.
  • a normal video picture needs about 2 million bits of information, ie about 250 kbytes, for grayscale pictures. For color images, the amount of data increases to 750 kbytes.
  • PSTN Public Switched Telephone Network
  • 5700 bps bits per second (for digital data this corresponds to bauds) per line in the analog range and 6400 bps for ISDN, which takes about 30 seconds or 90 seconds, in order to transmit a complete video image of sufficiently good quality.
  • This is far too slow for most video conferencing applications.
  • the raw digital video data are compressed with various data compression algorithms in order to shorten the transmission time.
  • very good compression and Decompression algorithms with a compression rate of 1/20 to 1/50 are inadequate for many video conferencing applications.
  • compression and decompression are normally time-consuming and consume energy and computing power accordingly.
  • the last factor can also be decisive outline conditions consider that, unlike PSTN networks, the connection quality, which allows a maximum transmission rate, is not always given in the mobile radio area. If transmission rates are lower than the maximum possible, the transmission time is multiplied accordingly.
  • US5703637 and US4513317 are examples which register the movement of the eyeball or retina with an eye tracking system and use this information to display only a small area of the image with high resolution.
  • these objectives are achieved by the invention in that at least three participants communicate with one another via video conference participants in a video conference system, multimedia data being transmitted via a telecommunication network, which comprises at least participant image data and / or participant audio data, and each of the participants recording the participant image data of the other participants a playback device, for example a display, which is shown in a visibly arranged manner at the video conference participant location in question, that the direction of view of the participants is registered by an eye tracking system and that eye tracking data, which at least include information about the direction of view, is transmitted to a communication unit of the video conference participant location concerned and that in each case the subscriber image data of that subscriber with full resolution and image transmission rate via the telecommunications network to the communicat tion unit of a video conference participant station are transmitted, the participant image data of which is displayed on the playback device of the last-mentioned video conference participant station in the current viewing direction of the participant of this video conference participant station, while the participant image data of the other participants are transmitted in reduced resolution and / or reduced
  • the invention has the advantage that the compression, ie the reduction, of the subscriber image data is independent of the video standard used, since the subscriber image data of a subscriber are either reduced or transmitted in full resolution without a complicated division into subframes as in the prior art. In this way, for example, the individual video images of a video conference interface can be retained.
  • the simplicity of the method also entails a minimal consumption of computing power, which can be particularly important in the case of mobile radio devices with limited energy reserves.
  • the disadvantage of the prior art that the scanning movement of the fovea has to be corrected does not apply to this invention, since the scanning movement normally relates to the object to be recognized. The impression of a sharp center with a blurred environment is eliminated. The entire logical object, for example the video conference participant, is clearly recognized. If the view moves to the next logical unit, ie the subscriber image data of another subscriber, these are perceived sharply as a whole.
  • the image transmission rate is set to zero for those subscriber image data which are not displayed in the current viewing direction of the subscriber.
  • This embodiment variant has the particular advantage that the network load is limited to a minimum.
  • the computing power required which e.g. is needed to decompress the subscriber image data.
  • the eye tracking data and the subscriber image data are transmitted to a central unit, the central unit determining the resolution and / or the image transmission rate of the subscriber image data of the other subscribers for each subscriber in accordance with the details of the eye tracking data of the subscriber concerned and the Participant image data in this resolution and / or image transmission rate transmitted to the communication unit of the participant concerned.
  • This version variant has the advantage, among other things, that the network load remains small with a larger number of participants. Due to the central reduction of the participant image data, the computing power of the individual video conference participant locations, for example, also remains small compared to other solutions.
  • the subscriber image data are transmitted to a central unit and stored in a data memory (the storage or buffering of the data can be implemented, for example, via a data buffer, a data stream, a database or otherwise) of the central unit, the communication unit of a subscriber determines ge - According to the details of the eye tracking data of the participant concerned, the resolution and / or image transmission rate of the participant image data of the other participants and this participant image data are transmitted by the central unit in this resolution and / or image transmission rate to the communication unit of the participant concerned.
  • This embodiment variant has the same advantages as the previous embodiment variant, but does not require any computing power from the central unit to calculate the video images to be displayed of the individual participants, since the communication units access the participant image data directly in the resolution and image transmission rate determined by them. Another advantage is that the eye tracking data does not have to be transmitted over the network.
  • the subscriber image data of a subscriber are each stored in a data memory of the communications unit of this subscriber and the communications unit determines the resolution and / or the image transmission rate of the subscriber image data of the other subscribers in accordance with the details of the eye tracking data of this subscriber, the latter subscriber image data from the communications units the other participants are transmitted in this resolution and / or image transmission rate to the communication unit of the relevant participant.
  • This variant has i.a. the advantage that it does not need a central unit. Participants in the telecommunication network can connect directly via the telecommunication network without having to use any other units apart from their video conference participants.
  • At least one video conference participant station is connected to the telecommunications network via a mobile radio network.
  • the telecommunications network can be, for example, a fixed network, such as a LAN (Local Area Network) or WAN (Wide Area Network), comprise the public switched telephone network (PSTN (Public Switched Telephone Network) and / or ISDN (Integrated Services Digital Network)), the Internet or another communication network, in particular a mobile radio network.
  • PSTN Public Switched Telephone Network
  • ISDN Integrated Services Digital Network
  • the communication unit uses image analysis and shape reconstruction algorithms in order to display the subscriber image data which have been transmitted with reduced resolution.
  • image analysis and shape reconstruction algorithms in order to display the subscriber image data which have been transmitted with reduced resolution.
  • the present invention also relates to a system for carrying out this method.
  • FIG. 1 shows a block diagram which schematically illustrates an embodiment variant of a video conference system in which communication units 20 of video conference participant stations access participant image data and participant audio data via a central unit 30.
  • FIG. 2 shows a block diagram which schematically illustrates a further embodiment variant of a video conference system, in which communication units 20 from video conference participant locations access participant image data and participant audio data via data memories 26 of the other communication units 20.
  • FIG. 3 shows a flowchart which schematically illustrates the steps for an embodiment variant of a coding module 27 which Coding module 27 includes the compression and decompression functions as well as the encryption and decryption functions.
  • FIG. 1 illustrates an architecture that can be used to implement the invention.
  • at least three different video conference subscriber stations 11 communicate with one another, multimedia data being transmitted via a telecommunications network 40, which at least include subscriber image data 22 and / or subscriber audio data 21, and each of the participants 10 the subscriber image data of the other participants on a playback device 24 of the relevant video conference -
  • the participant position 11 is displayed in a visibly arranged manner.
  • the playback device 24 can be, for example, a display or a VRD (Virtual Retinal Display).
  • the telecommunications network 40 can be, for example, a landline network, such as a LAN (Local Area Network) or WAN (Wide Area Network), the public switched telephone network (PSTN, Public Switched Telephone Network and / or ISDN, Integrated Services Digital Network), the Internet packet-oriented communication network or another communication network, in particular a mobile radio network.
  • the cellular network can be, for example, a GSM, a UMTS or another cellular network. Communication via the mobile radio network 40 takes place, for example, via protocols such as GPRS (Generalized Packet Radio Service), WAP (Wireless Application Protocol) or UMTS (Universal Mobile Telecommunication System).
  • GPRS Generalized Packet Radio Service
  • WAP Wireless Application Protocol
  • UMTS Universal Mobile Telecommunication System
  • the acquisition of the subscriber image data takes place via an image data input module 22 and the acquisition of the subscriber audio data takes place via an audio data input module 21.
  • the image data input module 22 can comprise, for example, a video camera, a scan unit, for example based on MEMS (microelectromechanical system), or a digital camera. Examples of participant image data can be video images, texts, tables, slides, graphics etc.
  • the audio data input module 21 can comprise, for example, one or more microphones, CD-ROM players or other audio input devices.
  • An eye tracking system 23 registers the gaze direction of the respective participant 10 and transmits eye tracking data, which at least include information about the gaze direction, to a communication unit 20 of the relevant video conference participant location 11 (ie the video conference participant location of the respective participant).
  • the eye tracking system 23 can comprise, for example, a Purkinje image-based system, which determines the direction of view of the participant 10 via the reflection differences of two parallel light beams reflected on the fundus of the eye and on the cornea, or, for example, it can comprise a system based on a laser scanner which scans the fundus of the eye via a laser beam and a reference beam and thus the direction of view of the participant 10 or another system for determining the viewing direction of the participant 10, such as, for example, an eye tracking system according to the patent specification WO94 / 09472.
  • Subscriber image data and subscriber sound data are transmitted from the communication unit 20 to a central unit 30.
  • the transmission can be compressed and / or encrypted, for example.
  • the central unit 30 has a coding module 31 which accepts and decompresses and / or decrypts the data.
  • a coding module 31 accepts and decompresses and / or decrypts the data.
  • a wide variety of state-of-the-art algorithms such as Huffman coding, 3: 2 pulldown etc., but also compression standards such as MPEG (Moving Pictures Expert Group) from the International Organization for Standardization (ISO) can be used for the compression.
  • MPEG Motion Picture Expert Group
  • the communication units 20 also have a coding module 26 which takes over the compression / decompression and the encryption / decryption of the data.
  • a video camera of the image data input module 22 generates an analog video signal.
  • the coding switch 279 is set by the communication unit 20 such that the data flow is routed via the compression and encryption system 271.
  • the input processor 273 accepts the video signal, for example a PAL signal with 25 fps (frames per second) or an NTSC signal with 29.97 fps, and digitizes and filters the analog video signal in order to generate the unprocessed digital video signal. In the case of digital image data acquisition, for example, the last step is omitted.
  • the 25 frames of the PAL signal correspond to 50 fields, i.e. 50 fields per second
  • the 29.97 frames of the NTSC signal correspond to 59.94 fields, i.e. 59.94 fields per second.
  • the video data analyzer 274 receives the digital video signal from the input processor 273, which is accompanied for example by a VSync signal, a field synchronization signal, and generates a modified video signal for the compression module 275. The modification of the signal takes place in real time and generates an output signal that can then be optimally compressed.
  • the video data analyzer 274 removes, for example, redundant fields or frames in the video signal and generates the necessary information for, for example, motion compensated prediction or discrete cosine transformation (DCT), as is also used, for example, in MPEG format. If image analysis and shape reconstruction algorithms are used, these can also be carried out by the video data analyzer. This includes in particular face analysis and synthesis techniques, such as feature point modeling.
  • So-called feature points are defined by a given model that is as general as possible (for example of the face), the vector of these feature points describing the shape of the model, the trajectory, the movement of the model and the vector space of these vectors describing the movement possibilities of the model.
  • the deformation of the original general model can be calculated, for example, using DFFD methods (Dirichlet Free Form Deformation).
  • the facial synthesis and the facial animation can be implemented, for example, in accordance with the MPEG-4 standard.
  • the modified digital video data is finally compressed by the compression module 275 and, if necessary, encrypted.
  • the compressed digital video signal will be transmitted by the communication unit 20 via the telecommunication network 40.
  • the coding module 27 of the communication unit 20 can also be used for decrypting and decoding data which have been transmitted to the communication unit 20 via the telecommunications network 40.
  • the coding switch 279 is set by the communication unit 20 such that the functions of the decompression and decryption system 272 are active.
  • the decoding module 276 takes the video data from the communication unit 20, decompresses it and, if necessary, decrypts it.
  • An output processor 277 if shape reconstruction algorithms have been used, carries out the image synthesis, calculates the video image to be displayed and outputs it as a video signal to a display module 278, for example a screen card or a VRD display device (Virtual Retinal Display), for example a VRD display device according to patent specification WO94 / 09472, further.
  • the data transfer of the subscriber image data to be transmitted is initiated and carried out, for example, via a software or hardware-implemented transfer module of the central unit 30 or the communication units 20.
  • the subscriber image data and the subscriber sound data are stored in the central unit in a data storage rather 32 saved.
  • the data can be buffered or stored via a data stream, a data buffer, a database or otherwise.
  • the participant image data of that participant are transmitted with full resolution and image transmission rate via the telecommunications network 40 to the communication unit 20 of a video conference participant station 11, whose participant image data on the playback device 24 of the latter video conference participant station 11 in the current viewing direction of the participant 10 concerned (i.e. the participant 10) Direction of view was registered by the eye tracking system of the video conference participant station), while the participant image data of the other participants are transmitted in reduced resolution and / or reduced image transmission rate.
  • the communication units 20 transmit the subscriber image data of their subscribers 10 to the central unit 30, where they are stored in a data memory 32 of the central unit 30. For example, there is the possibility that the eye tracking data of the respective communication units 20 are transmitted at the same time.
  • the eye tracking data can be, for example, directions of the gaze direction, details of the participant image data displayed in the gaze direction, etc.
  • the central unit 30 determines the resolution and / or the image transmission rate of the participant image data of the other participants for each participant 10 in accordance with the information provided by the eye tracking data with regard to the direction of view of the participant 10 concerned and transmits them to the communication units in this resolution and / or image transmission rate 20 of the subscriber 10 concerned.
  • the coding module 31 of the central unit 30 likewise carries out the reduction in the resolution of the subscriber image data.
  • the reduction of the multimedia data need not necessarily be limited to the subscriber image data, but can also relate to other multimedia image data of the channel selected with the viewing direction, for example the subscriber audio data (for example with the MP3 standard).
  • the eye tracking data are not transmitted from the communication units 20 to the central unit 30, but only the subscriber image data.
  • the central unit 30 stores the subscriber image data in full and reduced resolution in a data memory 32.
  • the communication units 20 can then according to their eye tracking data on the participant image data of the other participants 10 in the appropriate resolution and / or image transfer rate in the central unit 30.
  • the requested subscriber image data are transmitted from the central unit 30 to the corresponding communication unit 20 via the telecommunication network 40.
  • FIG. 2 illustrates an architecture that can be used to implement the invention.
  • at least three different video conference participants 11 communicate with one another via a video conference system, multimedia data being transmitted via a telecommunication network 40, which at least include participant image data 22 and / or participant sound data 21, and each of the participants 10 the participant image data of the other participants on a playback device 24 of the relevant participant Video conference participant position 11 is simultaneously displayed visibly arranged.
  • the playback device 24 can be, for example, a display or a VRD (Virtual Retinal Display).
  • the telecommunications network 40 can, for example, be a fixed network such as a LAN (Local Area Network) or WAN (Wide Area Network), the public switched telephone network (PSTN, Public Switched Telephone Network and / or ISDN, Integrated Services Digital Network) , the Internet or another communication network, in particular a mobile radio network.
  • the acquisition of the subscriber image data takes place via an image data input module 22 and the acquisition of the subscriber audio data takes place via an audio data input module 21.
  • the image data input module 22 can comprise, for example, a video camera, a scan unit or a digital camera. Examples of participant image data can be video images, scanned photos, tables, texts, graphics etc.
  • the audio data input module 21 can comprise, for example, one or more microphones, CD-ROM players or other audio input devices.
  • An eye tracking system 23 registers the gaze direction of the respective participant 10 and transmits eye tracking data, which at least include information about the gaze direction, to a communication unit 20 of the relevant video conference participant location 11. For example, eye tracking systems as described in the previous exemplary embodiment can be used. In each case, the participant image data of that participant are transmitted with full resolution and image transmission rate via the telecommunication network 40 to the communication unit 20 of a video conference participant station 11.
  • the reduction of the multimedia data need not necessarily be limited to the subscriber image data, but can also relate to other multimedia image data of the channel selected with the viewing direction, for example the subscriber audio data (for example with MP3 standard). In this exemplary embodiment, however, subscriber image data and subscriber sound data are not transmitted to a central unit 30, but are stored in a data memory 26 of the respective communication unit 20.
  • the data can be buffered or stored via a data stream, a data buffer, a database or otherwise.
  • the communication unit 20 determines the resolution and / or the image transmission rates of the subscriber image data to be displayed on the playback device 24 on the basis of the information provided by the eye tracking data with regard to the viewing direction of the subscriber 10 concerned and requests this subscriber image data from the communication units of the other subscribers.
  • the requested subscriber image data are transmitted by the communication units 20 of the other subscribers in this resolution and / or image transmission rate to the communication unit of the subscriber 10 concerned.
  • the exemplary embodiment has a coding module 27 with the same functionality as in the previous exemplary embodiment.
  • compression / decompression, encryption / decryption and / or image synthesis with form reconstruction algorithms are implemented in the coding module 27 as described above.
  • the coding module 27 takes over, for example, the conversion of the analog video data into digital video data and vice versa.
  • the image transmission rate can be set to zero for those subscriber image data which are not displayed on the playback device 24 in the viewing direction of the subscriber 10.
  • the subscriber then only receives the currently viewed subscriber image data in motion on the playback device 24, while the rest, for example be displayed as a still image.
  • the still image can include, for example, those participant image data that were transmitted when they were last in the current viewing direction of the participant 10 on the playback device 24.
  • participant image data both that transmitted with full resolution and that transmitted with reduced resolution
  • the movement of the objects of the participant image data is completely synthetic, ie by means of shape reconstruction and animation algorithms being represented. It is then sufficient, for example, to transmit only one picture of a participant and then to simulate the movement.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Glass Compositions (AREA)

Abstract

Verfahren und System für Videokonferenzen mit mindestens drei verschiedenen Videokonferenzteilnehmerstellen (11), welche miteinander über ein Telekommunikationsnetz (40) kommunizieren, wobei Multimediadaten über ein Telekommunikationsnetz (40) übertragen werden, welche mindestens Teilnehmerbilddaten (22) und/oder Teilnehmertondaten (21) umfassen, und jeder Teilnehmer (10) die Teilnehmerbilddaten der anderen Teilnehmer auf einem Wiedergabegerät (24) gleichzeitig sichtbar angeordnet dargestellt erhält. Ein Eye Tracking System (23) registriert die Blickrichtung des betreffenden Teilnehmers (10) und überträgt sie an eine Kommunikationseinheit (20). Es werden diejenigen Teilnehmerbilddaten mit reduzierter Auflösung und/oder Bildübertragungsrate über das Telekommunikationsnetz (40) an die Kommunikationseinheit (20) übermittelt, die auf dem Wiedergabegerät nicht in der momentanen Blickrichtung des Betreffenden Teilnehmers (20) dargestellt werden.

Description

Verfahren und System für Videokonferenzen
Die vorliegende Erfindung betrifft ein Verfahren und System für Videokonferenzen mit mindestens drei verschiedenen Videokonferenzteilnehmerstellen, welche miteinander kommunizieren, wobei Multimediadaten über ein Telekommunikationsnetz übertragen werden, welche mindestens Teilnehmerbilddaten und/oder Teilnehmertondaten umfassen, und jeder Teilnehmer die Teilnehmerbilddaten der anderen Teilnehmer auf einem Wiedergabegerät, z.B. einem Display oder einem VRD (Virtual Retinal Display), gleichzeitig sichtbar angeordnet dargestellt erhält. Die Erfindung betrifft insbesondere Verfahren und Systeme, welche über Telekommunikationsnetze kommunizieren, die mindestens teilweise aus einem Mobilfunknetz bestehen.
Die schnelle Übertragung, der Empfang und das Anzeigen von Videobildem durch Video- und Fernsehapparate ist bekannt. Die Bilder besitzen üblicherweise eine Auflösung von mindestens 10x6 ppi (Pixel pro Inch) in genügend guter Färb- und Graustufenqualität. Für die Übertragung der gesamten Bildinformation ist eine Mindestbandbreite des Übertragungskanals von mehreren Megahertz Voraussetzung. Die Kosten solcher Systeme sind aber für bestimmte Anwendungen wie Videokonferenzsysteme für Geschäfts- und Privatgebrauch bei weitem zu hoch. Es ist bekannt, für die Übertragung von Videobildern Medien mit kleinerer Bandbreite, wie beispielsweise öffentliche Telekommunikationsnetze, zu benutzen. Die Übertragungsrate ist aber entsprechend tief für diese Medien. Für spezielle Anwendungen, wie "slow scan" Videosysteme kann eine solche beschränkte Bandbreite auch tatsächlich ausreichen. Beispiele dafür sind Sicherheits- und Überwachungssysteme, bei wel- chen eine hohe Bildwiederholungsrate bzw. hohe Auflösung nicht notwendig ist. Solche Systeme benutzen typischerweise eine Auflösung von 128x128 Pixel für das ganze Bild, wobei nur 16 Färb- bzw. Graustufen verwendet werden. Videobilder mit höherer Qualität, z.B. mit 640x480 Pixel (europäische Norm: 620x576 Pixel, 8 bit Farbtiefe) und einer Farbtiefe von 64 Stufen, wie sie für Videokonferenzen üblich sind, können mit diesen Systemen aber nicht übertragen werden. Ein normales Videobild braucht etwa 2 Millionen Bits Information, also etwa 250 kByte, für Graustufenbilder. Bei Farbbildern steigt die Datenmenge gar auf 750 kByte. Die Datenübertragungsrate über öffentliche geschaltete Telefonnetze (PSTN: Public Switched Telephone Network) liegt heute typischerweise bei 57O00 bps (Bits pro Sekunde (für digitale Daten entspricht dies bauds) pro Linie im Analogbereich und bei 64O00 bps für ISDN, womit etwa 30 Sekunden bzw. 90 Sekunden gebraucht werden, um ein voll- ständiges Videobild von genügend guter Qualität zu übermitteln. Dies ist für die meisten Videokonferenzanwendungen bei weitem zu langsam. Aus diesem Grund werden die unbearbeiteten digitalen Videodaten mit verschiedensten Datenkompressionsalgorithmen komprimiert, um die Übermittlungszeit zu verkürzen. Doch auch sehr gute Kompressions- und Dekompressionsalgorithmen, mit einer Kompressionsrate von 1/20 bis 1/50, sind für viele Videokonferenzanwendungen ungenügend. Zudem sind Kompression und Dekompression im Normalfall zeitaufwendig und verbrauchen entsprechend Energie und Rechenleistung. Z.B. im Mobilfunkbereich kann gerade der letzte Faktor ebenfalls entscheidend sein. Dabei ist zu berücksichtigen, dass im Mobilfunkbereich anders als bei PSTN-Netzen die Verbindungsqualität, welche eine maximale Übertragungsrate zuliesse, nicht immer gegeben ist. Bei tieferen Übermittlungsraten als der maximal möglichen multipliziert sich die Übertragungszeit zudem entsprechend. Um eine weitere Datenkompression zu erhalten, finden sich im Stand der Technik mehrere Dokumente, die vorschlagen, nur einen bestimmten Ausschnitt eines aufgenommenen Bildes mit hoher Auflösung zu übertragen, während alle anderen Bildausschnitte mit tieferer Auflösung übertragen werden. Die Patentschriften US5703637 und US4513317 sind Beispiele, welche mit einem Eye Tracking System die Bewegung des Augapfels oder der Retina registrieren und diese Information dazu benutzen, nur einen kleinen Bereich des Bildes mit hoher Auflösung darzustellen. Diese Systeme nutzen die Eigenschaft des menschlichen Auges aus, dass nur ein kleiner Teil der Retina (genannt Fovea) hochauflösend ist, während der grosse übrige Teil eine geringe Auflösung besitzt. Der Stand der Technik besitzt jedoch mehrere Nachteile, u.a. den Nachteil, dass alle Teilnehmer den gleichen Videostandard benutzen müssen, um diese Bilder darstellen zu können. Es ist aber wünschenswert, dass Videokonferenzsysteme unabhängig vom Videostandard sind. Des weiteren besitzt die Fovea einen hochauflösenden Blickwinkel von nur 2°. Diese Tatsache wird vom Gehirn durch eine natürliche aber unvermeidliche und ständige Scanbewegung des Auges korrigiert. Das führt dazu, dass, wie gut die Blickrichtung und der hochauflösende Bildausschnitt auch überein- stimmen, dem Benutzer das Bild verschwommen mit einem kleinen scharfen Bildausschnitt im Blickzentrum erscheint. Dieser Nachteil kann mit dem gegenwärtigen Stand der Technik, falls überhaupt, nur aufwendig korrigiert werden.
Es ist eine Aufgabe dieser Erfindung, ein neues Verfahren und Sy- stem für Videokonferenzen vorzuschlagen, welches die oben beschriebenen Nachteile nicht aufweist. Insbesondere sollen die Teilnehmerbilddaten von Videokonferenzen mit hoher Kompression übermittelt werden können.
Gemäss der vorliegenden Erfindung wird dieses Ziel insbesondere durch die Elemente der unabhängigen Ansprüche erreicht. Weitere vorteilhafte Ausführungsformen gehen ausserdem aus den abhängigen Ansprüchen und der Beschreibung hervor.
Insbesondere werden diese Ziele durch die Erfindung dadurch erreicht, dass mindestens drei Teilnehmer über Videokonferenzteilnehmerstellen eines Videokonferenzsystems miteinander kommunizieren, wobei Multimedia- daten über ein Telekommunikationsnetz übertragen werden, welche mindestens Teilnehmerbilddaten und/oder Teilnehmertondaten umfassen, und jeder der Teilnehmer die Teilnehmerbilddaten der anderen Teilnehmer auf einem Wiedergabegerät, z.B. einem Display, der betreffenden Videokonferenzteilnehmerstelle gleichzeitig sichtbar angeordnet dargestellt erhält, dass die Blick- richtung der Teilnehmer jeweils von einem Eye Tracking System registriert und Eye Tracking Daten, die mindestens Angaben über die Blickrichtung umfassen, an eine Kommunikationseinheit der betreffenden Videokonferenzteilnehmerstelle übertragen werden, und dass jeweils die Teilnehmerbilddaten desjenigen Teilnehmers mit voller Auflösung und Bildubertragungsrate über das Telekom- munikationsnetz an die Kommunikationseinheit einer Videokonferenzteilnehmerstelle übermittelt werden, dessen Teilnehmerbilddaten auf dem Wiedergabegerät der letztgenannten Videokonferenzteilnehmerstelle in der momentanen Blickrichtung des Teilnehmers dieser Videokonferenzteilnehmerstelle dargestellt werden, während die Teilnehmerbilddaten der übrigen Teilnehmer in re- duzierter Auflösung und/oder reduzierter Bildubertragungsrate übermittelt werden. Die Erfindung hat den Vorteil, dass die Komprimierung, d.h. die Reduzierung, der Teilnehmerbilddaten unabhängig vom benutzten Videostandard ist, da die Teilnehmerbilddaten eines Teilnehmers entweder reduziert oder in voller Auflösung übermittelt werden, ohne dass dafür eine komplizierte Unterteilung in Subframes wie im Stand der Technik stattfindet. Damit können beispielsweise die einzelnen Videobilder einer Videokonferenzschnittstelle erhalten bleiben. Die Einfachheit des Verfahrens bringt ebenfalls einen minimalen Verbrauch an Rechenleistung mit sich, was insbesondere bei Mobilfunkgeräten mit beschränkten Energiereserven, wichtig sein kann. Der Nachteil beim Stand der Technik, dass die Scanbewegung der Fovea korrigiert werden muss (wie z.B. US4513317), fällt bei dieser Erfindung weg, da sich die Scanbewegung im Normalfall auf den zu erkennenden Gegenstand bezieht. Der Eindruck eines scharfen Mittelpunktes mit unscharfer Umgebung entfällt. Der ganze logische Gegenstand, z.B. der Videokonferenzteilnehmer, wird scharf erkannt. Wandert der Blick zur nächsten logischen Einheit, d.h. den Teilnehmerbilddaten eines anderen Teilnehmers, werden diese als Ganzes scharf wahrgenommen.
In einer Ausführungsvariante wird die Bildubertragungsrate für diejenigen Teilnehmerbilddaten, welche nicht in der momentanen Blickrichtung des Teilnehmers dargestellt werden, gleich Null gesetzt. Diese Ausführungsvariante hat insbesondere den Vorteil, dass die Netzbelastung auf ein Minimum beschränkt wird. Gleichzeitig wird die benötigte Rechenleistung minimiert, die z.B. gebraucht wird um die Teilnehmerbilddaten zu dekomprimieren.
In einer weiteren Ausführungsvariante werden die Eye Tracking Daten sowie die Teilnehmerbilddaten an eine Zentraleinheit übermittelt, wobei die Zentraleinheit für jeden Teilnehmer gemäss den Angaben der Eye Tracking Daten des betreffenden Teilnehmers die Auflösung und/oder die Bildübertra- gungsrate der Teilnehmerbilddaten der anderen Teilnehmer bestimmt und die Teilnehmerbilddaten in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheit des betreffenden Teilnehmers übermittelt. Diese Aus- führungsvariante hat u.a. den Vorteil, dass bei grösserer Anzahl der Teilnehmer die Netzbelastung klein bleibt. Durch die zentrale Reduzierung der Teil- nehmerbilddaten bleibt z.B. ebenfalls die Rechenleistung der einzelnen Videokonferenzteilnehmerstellen im Vergleich zu anderen Lösungen klein. In einer weiteren Ausführungsvariante werden die Teilnehmerbilddaten an eine Zentraleinheit übermittelt und in einem Datenspeicher (das Speichern oder Puffern der Daten kann z.B. über einen Datenpuffer, einen Daten- stream, eine Datenbank oder andersweitig realisiert sein) der Zentraleinheit abgespeichert, die Kommunikationseinheit eines Teilnehmers bestimmt ge- mäss den Angaben der Eye Tracking Daten des betreffenden Teilnehmers die Auflösung und/oder Bildubertragungsrate der Teilnehmerbilddaten der anderen Teilnehmer und diese Teilnehmerbilddaten werden von der Zentraleinheit in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheit des betreffenden Teilnehmers übermittelt. Diese Ausführungsvariante hat dieselben Vorteile wie die vorhergehende Ausführungsvariante, setzt aber von der Zentraleinheit keine Rechenleistung zur Berechnung der darzustellenden Videobilder der einzelnen Teilnehmer voraus, da die Kommunikationseinheiten direkt auf die Teilnehmerbilddaten in der von ihnen bestimmten Auflösung und Bildubertragungsrate zugreifen. Ein anderer Vorteil ist, dass die Eye Tracking Daten nicht über das Netz übermittelt werden müssen.
In einer Ausführungsvariante werden die Teilnehmerbilddaten eines Teilnehmers jeweils in einem Datenspeicher der Kommunikationseinheit dieses Teilnehmers abgespeichert und die Kommunikationseinheit bestimmt gemäss den Angaben der Eye Tracking Daten dieses Teilnehmers die Auflösung und/oder die Bildubertragungsrate der Teilnehmerbilddaten der anderen Teilnehmer, wobei die letztgenannten Teilnehmerbilddaten von den Kommunikationseinheiten der anderen Teilnehmer in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheit des betreffenden Teilnehmers übermittelt werden. Diese Ausführungsvariante hat u.a. den Vorteil, dass sie ohne Zentraleinheit auskommt. Teilnehmer des Telekommunikationsnetzes können sich direkt über das Telekommunikationsnetz zusammenschliessen, ohne weitere Einheiten ausser ihrer Videokonferenzteilnehmerstellen beanspruchen zu müssen.
In einer weiteren Ausführungsvariante ist mindestens eine Videokonferenzteilnehmerstelle über ein Mobilfunknetz mit dem Telekommunikationsnetz verbunden. Das Telekommunikationsnetz kann beispielsweise ein Festnetz, wie ein LAN (Local Area Network) oder WAN (Wide Area Network), das öffentliche geschaltete Telefonnetz (PSTN (Public Switched Telephone Network) und/oder ISDN (Integrated Services Digital Network)), das Internet oder ein anderes Kommunikationsnetz, insbesondere ein Mobilfunknetz umfassen.
In einer anderen Ausführungsvariante verwendet die Kommunikationseinheit Bildanalyse- und Formrekonstruktionsalgorithmen um die Teilnehmerbilddaten, welche mit reduzierter Auflösung übermittelt wurden, darzustellen. Einer der Vorteile dieser Ausführungsvariante ist, dass trotz reduzierter Auflösung der übermittelten Bilder, die Bilder durch die Bildsynthese der Formrekonstruktionsalgorithmen wieder hergestellt werden können und in höherer Auflösung als die Übermittelten dargestellt werden können.
An dieser Stelle soll festgehalten werden, dass sich die vorliegende Erfindung neben dem erfindungsgemässen Verfahren auch auf ein System zur Ausführung dieses Verfahrens bezieht.
Nachfolgend werden Ausführungsvarianten der vorliegenden Erfindung anhand von Beispielen beschrieben. Die Beispiele der Ausführungen werden durch folgende einzige beigelegte Figur illustriert:
Figur 1 zeigt ein Blockdiagramm, welches schematisch eine Ausführungsvariante eines Videokonferenzsystems illustriert, bei welchem Kommuni- kationseinheiten 20 von Videokonferenzteilnehmerstellen über eine Zentraleinheit 30 auf Teilnehmerbilddaten und Teilnehmertondaten zugreifen.
Figur 2 zeigt ein Blockdiagramm, welches schematisch eine weitere Ausführungsvariante eines Videokonferenzsystems illustriert, bei welchem Kommunikationseinheiten 20 von Videokonferenzteilnehmerstellen über Datenspeicher 26 der anderen Kommunikationeinheiten 20 auf Teilnehmerbilddaten und Teilnehmertondaten zugreifen.
Figur 3 zeigt ein Flussdiagramm, welches schematisch die Schritte für eine Ausführungsvariante eines Codingmoduls 27 illustriert, welches Codingmodul 27 u.a. die Komprimier- und Dekomprimierfunktionen sowie die Verschlüsselungs- und Entschlüsselungsfunktionen umfasst.
Figur 1 illustriert eine Architektur, die zur Realisierung der Erfindung verwendet werden kann. In diesem Ausführungsbeispiel kommunizieren min- destens drei verschiedene Videokonferenzteilnehmerstellen 11 miteinander, wobei Multimediadaten über ein Telekommunikationsnetz 40 übertragen werden, welche mindestens Teilnehmerbilddaten 22 und/oder Teilnehmertondaten 21 umfassen, und jeder der Teilnehmer 10 die Teilnehmerbilddaten der anderen Teilnehmer auf einem Wiedergabegerät 24 der betreffenden Videokonfe- renzteilnehmerstelle 11 gleichzeitig sichtbar angeordnet dargestellt erhält. Das Wiedergabegerät 24 kann beispielsweise ein Display oder ein VRD (Virtual Retinal Display) sein. Das Telekommunikationsnetz 40 kann beispielsweise ein Festnetz, wie ein LAN (Local Area Network) oder WAN (Wide Area Network), das öffentliche geschaltete Telefonnetz (PSTN, Public Switched Telephone Network und/oder ISDN, Integrated Services Digital Network), das Internet, ein paketorientiertes Kommunikationsnetz oder ein anderes Kommunikationsnetz, insbesondere ein Mobilfunknetz umfassen. Das Mobilfunknetz kann z.B. ein GSM-, ein UMTS- oder ein anderes Mobilfunknetz sein. Die Kommunikation über das Mobilfunknetz 40 erfolgt beispielsweise über Protokolle wie GPRS (Generalized Packet Radio Service), WAP (Wireless Application Protokoll) oder UMTS (Universal Mobile Telecommunication System). Die Erfassung der Teilnehmerbilddaten erfolgt über ein Bilddateneingabemodul 22 und die Erfassung der Teilnehmertondaten erfolgt über ein Tondateneingabemodul 21. Das Bilddateneingabemodul 22 kann z.B. eine Videokamera, eine Scaneinheit bei- spielsweise basierend auf MEMS (Mikroelektromechanisches System) oder eine digitale Kamera umfassen. Beispiele für Teilnehmerbilddaten können Videobilder, Texte, Tabellen, Dias, Graphiken etc. sein. Das Tondateneingabemodul 21 kann z.B. ein oder mehrere Mikrophone, CD-ROM-Player oder andere Toneingabegeräte umfassen. Ein Eye Tracking System 23 registriert die Blickrichtung des jeweiligen Teilnehmers 10 und übermittelt Eye Tracking Daten, welche mindestens Angaben über die Blickrichtung umfassen, an eine Kommunikationseinheit 20 der betreffenden Videokonferenzteilnehmerstelle 11 (d.h. die Videokonferenzteilnehmerstelle des jeweiligen Teilnehmers). Das Eye Tracking System 23 kann z.B. ein Purkinje-Bild basierendes System umfassen, welches über die Reflexionsunterschiede zweier paralleler, am Augenhintergrund und an der Hornhaut reflektierter Lichtstrahlen die Blickrichtung des Teilnehmers 10 bestimmt, oder z.B. es kann ein System basieren auf einem Laserscanner umfassen, welcher über einen Laserstrahl und einen Referenz- strahl den Augenhintergrund abrastert und so die Blickrichtung des Teilnehmers 10 bestimmt oder ein anderes System zur Bestimmung der Blickrichtung des Teilnehmers 10, wie z.B. ein Eye Trackingsystem gemäss der Patentschrift WO94/09472. Teilnehmerbilddaten und Teilnehmertondaten werden von der Kommunikationseinheit 20 an eine Zentraleinheit 30 übermittelt. Die Übermitt- lung kann z.B. komprimiert und/oder verschlüsselt erfolgen. Die Zentraleinheit 30 besitzt ein Codingmodul 31 , welches die Daten entgegennimmt und dekomprimiert und/oder entschlüsselt. Für die Komprimierung können verschiedenste Algorithmen des Standes der Technik wie z.B. Huffman-Codierung, 3:2 Pulldown etc., aber auch Kompressionsstandards wie z.B. MPEG (Moving Pictures Expert Group) der International Organisation for Standardisation (ISO) verwendet werden. Bei der Übermittlung von Daten von der Zentraleinheit 30 an eine Kommunikationseinheit 20 übernimmt das Codingmodul 31 ebenfalls die Komprimierung und/oder die Verschlüsselung der Daten für die Übermittlung. Die Kommunikationseinheiten 20 besitzen ebenfalls ein Codingmodul 26, welches die Komprimierung/Dekomprimierung sowie die Verschlüsselung/Entschlüsselung der Daten übernimmt. Zum Beispiel erzeugt eine Videokamera des Bilddateneingabemoduls 22 ein analoges Videosignal. Die Coding- Switch 279 wird von der Kommunikationseinheit 20 so gestellt, dass der Da- tenfluss über das Komprimier- und Verschlüsselungssystem 271 geleitet wird. Der Inputprozessor 273 nimmt das Videosignal, z.B. ein PAL-Signal mit 25 fps (Frames per Second) oder ein NTSC-Signal mit 29.97 fps, entgegen und digitalisiert sowie filtert das analoge Videosignal, um das unbearbeitete digitale Videosignal zu erzeugen. Bei z.B. digitaler Bilddatenerfassung entfällt der letzte Schritt. Die 25 Frames des PAL-Signal entsprechen 50 Felder, also 50 Felder pro Sekunde, während die 29.97 Frames des NTSC-Signal 59.94 Felder entsprechen, also 59.94 Felder pro Sekunde. Der Videodatenanalyser 274 erhält das digitale Videosignal vom Inputprozessor 273, welches beispielsweise von einem VSync Signal, einem Feldsynchronisationssignal, begleitet ist und erzeugt ein modifiziertes Videosignal für das Komprimiermodul 275. Die Modifi- kation des Signals findet in Echtzeit statt und erzeugt ein Outputsignal, das danach optimal komprimiert werden kann. U.a. entfernt der Videodatenanalyser 274 beispielsweise redundante Felder oder Frames im Videosignal und erzeugt die notwendige Informationen für z.B. Motion Compensated Prediction oder Discrete Cosine Transformation (DCT) wie sie z.B. auch im MPEG-Format ver- wendet wird. Falls Bildanalyse- und Formrekonstruktionsalgorithmen verwendet werden, können diese ebenfalls vom Videodatenanalyser ausgeführt werden. Dazu gehören insbesondere Gesichtsanalyse und -Synthesetechniken, wie z.B. Feature Point Modeling. Dabei werden von einem vorgegebenen möglichst generellen Model (z.B. des Gesichts) sog. Feature Points definiert, wobei der Vektor dieser Feature Points die Form des Models, die Trajektorie, die Bewegung des Models und der Vektorraum dieser Vektoren die Bewegungsmöglichkeiten des Models beschreibt. Die Verformung des ursprünglichen generellen Models kann z.B. mit DFFD-Methoden (Dirichlet Free Form Deformation) berechnet werden. Die Facial Synthese sowie die Facial Animation können bei- spielsweise gemäss MPEG-4-Standard implementiert sein. Die modifizierten digitalen Videodaten werden vom Komprimiermodul 275 schliesslich komprimiert und falls notwendig verschlüsselt. Das komprimierte digitale Videosignal wird von der Kommunikationseinheit 20 über das Telekommunikationsnetz 40 übermittelt werden. Das Codingmodul 27 der Kommunikationseinheit 20 kann ebenfalls zum Entschlüsseln und Dekodieren von Daten verwendet werden, welche an die Kommunikationseinheit 20 übers Telekommunikationsnetz 40 übermittelt wurden. Die Coding-Switch 279 wird von der Kommunikationseinheit 20 in diesem Fall so gesetzt, dass die Funktionen des Dekomprimier- und Entschlüsselungssystems 272 aktiv sind. Das Decodiermodul 276 übernimmt die Videodaten von der Kommunikationseinheit 20, dekomprimiert sie und falls notwendig entschlüsselt sie. Ein Outputprozessor 277 führt, falls Formrekonstruktionsalgorithmen verwendet wurden, die Bildsynthese durch, berechnet das darzustellende Videobild und gibt es als Videosignal an ein Wiedergabemodul 278, z.B. eine Bildschirmkarte oder eine VRD Anzeigevorrichtung (Virtual Retinal Display), z.B. ein VRD-Anzeigevorrichtung gemäss der Patentschrift WO94/09472, weiter. Der Datentransfer der Teilnehmerbilddaten, welche übermittelt werden sollen, wird z.B. über ein Software- oder hardwaremässig implementiertes Transfermodul der Zentraleinheit 30 oder der Kommunikationseinheiten 20 eingeleitet und durchgeführt. Die Teilnehmerbilddaten und die Teilnehmertondaten werden in der Zentraleinheit in einem Datenspei- eher 32 abgespeichert. Das Puffern oder Speichern der Daten kann über ein Datenstream, ein Datenpuffer, eine Datenbank oder andersweitig realisiert sein. Es werden jeweils die Teilnehmerbilddaten desjenigen Teilnehmers mit voller Auflösung und Bildubertragungsrate über das Telekommunikationsnetz 40 an die Kommunikationseinheit 20 einer Videokonferenzteilnehmerstelle 11 übermittelt, dessen Teilnehmerbilddaten auf dem Wiedergabegerät 24 der letztgenannten Videokonferenzteilnehmerstelle 11 in der momentanen Blickrichtung des betreffenden Teilnehmers 10 (d.h. des Teilnehmers 10, dessen Blickrichtung vom Eye Tracking System der Videokonferenzteilnehmerstelle registriert wurde) dargestellt werden, während die Teilnehmerbilddaten der übrigen Teilnehmer in reduzierter Auflösung und/oder reduzierter Bildubertragungsrate übermittelt werden. Beim Ausführungsbeispiel der Figur 1 übermitteln die Kommunikationseinheiten 20 die Teilnehmerbilddaten ihrer Teilnehmer 10 an die Zentraleinheit 30, wo sie in einem Datenspeicher 32 der Zentralein- heit 30 abgespeichert werden. Es besteht z.B. die Möglichkeit, dass zugleich die Eye Tracking Daten der jeweiligen Kommunikationseinheiten 20 übermittelt werden. Die Eye Tracking Daten können z.B. Richtungsangaben der Blickrichtung, Angaben zu den in Blickrichtung dargestellten Teilnehmerbilddaten etc. sein. In diesem Fall bestimmt die Zentraleinheit 30 für jeden Teilnehmer 10 gemäss den Angaben der Eye Tracking Daten bezüglich der Blickrichtung des betreffenden Teilnehmers 10 die Auflösung und/oder die Bildubertragungsrate der Teilnehmerbilddaten der anderen Teilnehmer und übermittelt sie in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheiten 20 des betreffenden Teilnehmers 10. Das Codingmodul 31 der Zentraleinheit 30 führt ebenfalls die Reduktion der Auflösung der Teilnehmerbilddaten durch. Die Reduktion der Multimediadaten muss sich nicht unbedingt auf die Teilnehmerbilddaten beschränken, sondern kann auch anderen Multimediabilddaten des mit der Blickrichtung selektierten Kanals, beispielsweise die Teilnehmertondaten (z.B. mit MP3-Standard), betreffen. Eine andere Möglichkeit besteht darin, dass die Eye Tracking Daten von den Kommunikationseinheiten 20 nicht an die Zentraleinheit 30 übermittelt werden, sondern lediglich die Teilnehmerbilddaten. Die Zentraleinheit 30 speichert die Teilnehmerbilddaten in voller und reduzierter Auflösung in einem Datenspeicher 32 ab. Die Kommunikationseinheiten 20 können dann gemäss ihren Eye Tracking Daten auf die Teilnehmer- bilddaten der anderen Teilnehmer 10 in der entsprechenden Auflösung und/oder Bildubertragungsrate in der Zentraleinheit 30 zugreifen. Die angeforderten Teilnehmerbilddaten werden von der Zentraleinheit 30 an die entsprechende Kommunikationseinheit 20 über das Telekommunikationsnetz 40 übermittelt.
Figur 2 illustriert eine Architektur, die zur Realisierung der Erfindung verwendet werden kann. In diesem Ausführungsbeispiel kommunizieren mindestens drei verschiedene Videokonferenzteilnehmerstellen 11 über ein Videokonferenzsystem miteinander, wobei Multimediadaten über ein Telekommunikationsnetz 40 übertragen werden, welche mindestens Teilnehmerbilddaten 22 und/oder Teilnehmertondaten 21 umfassen, und jeder der Teilnehmer 10 die Teilnehmerbilddaten der anderen Teilnehmer auf einem Wiedergabegerät 24 der betreffenden Videokonferenzteilnehmerstelle 11 gleichzeitig sichtbar angeordnet dargestellt erhält. Das Wiedergabegerät 24 kann beispielsweise ein Display oder ein VRD (Virtual Retinal Display) sein. Wie im oberen Ausfüh- rungsbeispiel kann das Telekommunikationsnetz 40 beispielsweise ein Festnetz wie ein LAN (Local Area Network) oder WAN (Wide Area Network), das öffentliche geschaltete Telefonnetz (PSTN, Public Switched Telephone Network und/oder ISDN, Integrated Services Digital Network), das Internet oder ein anderes Kommunikationsnetz insbesondere ein Mobilfunknetz umfassen. Die Erfassung der Teilnehmerbilddaten erfolgt über ein Bilddateneingabemodul 22 und die Erfassung der Teilnehmertondaten erfolgt über ein Tondateneingabemodul 21. Das Bilddateneingabemodul 22 kann z.B. eine Videokamera, eine Scaneinheit oder eine digitale Kamera umfassen. Beispiel für Teilnehmerbilddaten können Videobilder, gescannte Fotos, Tabellen, Texte, Graphiken etc. sein. Das Tondateneingabemodul 21 kann z.B. ein oder mehrere Mikrophone, CD-ROM-Player oder andere Toneingabegeräte umfassen. Ein Eye Tracking System 23 registriert die Blickrichtung des jeweiligen Teilnehmers 10 und übermittelt Eye Tracking Daten, welche mindestens Angaben über die Blickrichtung umfassen, an eine Kommunikationseinheit 20 der betreffenden Videokonferenzteilnehmerstelle 11. Es können z.B. Eye Tracking Systeme wie im vorhergehenden Ausführungsbeispiel beschrieben, verwendet werden. Es werden jeweils die Teilnehmerbilddaten desjenigen Teilnehmers mit voller Auflösung und Bildubertragungsrate über das Telekommunikationsnetz 40 an die Kommunikationseinheit 20 einer Videokonferenzteilnehmerstelle 11 über- mittelt, dessen Teilnehmerbilddaten auf dem Wiedergabegerät 24 der letztgenannten Videokonferenzteilnehmerstelle 11 in der momentanen Blickrichtung des betreffenden Teilnehmers 10 (d.h. des Teilnehmers 10, dessen Blickrichtung vom Eye Tracking System der Videokonferenzteilnehmerstelle registriert wurde) dargestellt werden, während die Teilnehmerbilddaten der übrigen Teilnehmer in reduzierter Auflösung und/oder reduzierter Bildubertragungsrate übermittelt werden. Die Reduktion der Multimediadaten muss sich nicht unbedingt auf die Teilnehmerbilddaten beschränken, sondern kann auch anderen Multimediabilddaten des mit der Blickrichtung selektierten Kanals, beispiels- weise die Teilnehmertondaten (z.B. mit MP3-Standard), betreffen. Teilnehmerbilddaten und Teilnehmertondaten werden in diesem Ausführungsbeispiel jedoch nicht an eine Zentraleinheit 30 übermittelt, sondern in einem Datenspeicher 26 der jeweiligen Kommunikationseinheit 20 abgespeichert. Das Puffern oder Speichern der Daten kann über ein Datenstream, ein Datenpuffer, eine Datenbank oder andersweitig realisiert sein. Die Kommunikationseinheit 20 bestimmt anhand der Angaben der Eye Tracking Daten bezüglich der Blickrichtung des betreffenden Teilnehmers 10 die Auflösung und/oder die Bildübertragungsraten der auf dem Wiedergabegerät 24 darzustellenden Teilnehmerbilddaten und fordert diese Teilnehmerbilddaten bei den Kommunikations- einheiten der anderen Teilnehmer an. Die angeforderten Teilnehmerbilddaten werden von den Kommunikationseinheiten 20 der anderen Teilnehmer in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheit des betreffenden Teilnehmers 10 übermittelt. Das Ausführungsbeispiel besitzt ein Codingmodul 27 mit der gleichen Funktionalität wie im vorhergehenden Ausführungsbeispiel. So sind z.B. Kompression/Dekompression, Verschlüsselung/Entschlüsselung und/oder Bildsynthese mit Formrekonstruktionsalgorith- men wie oben beschrieben im Codingmodul 27 implementiert. Ebenso übernimmt das Codingmodul 27, falls notwendig, beispielsweise die Umwandlung der analogen Videodaten in digitale Videodaten und umgekehrt.
Für beide Ausführungsbeispiele ist es möglich, dass die Bildubertragungsrate für diejenigen Teilnehmerbilddaten, welche auf dem Wiedergabegerät 24 nicht in Blickrichtung des Teilnehmers 10 dargestellt werden, gleich Null gesetzt wird. Der Teilnehmer erhält dann auf dem Wiedergabegerät 24 nur die momentan betrachteten Teilnehmerbilddaten bewegt dargestellt, während die übrigen z.B. als Standbild unbewegt dargestellt werden. Das Standbild kann beispielsweise diejenigen Teilnehmerbilddaten umfassen, welche übermittelt wurden, als sie letztmals in der momentanen Blickrichtung des Teilnehmers 10 auf dem Wiedergabegerät 24 lagen. Es besteht aber auch die Möglichkeit z.B. irgendwelche anderen Bilddaten anstelle der vorgenannten als Standbild darzustellen, beispielsweise einfache synthetische Nachbildungen der Teilnehmerbilddaten. Eine andere Möglichkeit für die Teilnehmerbilddaten (sowohl die mit voller Auflösung als auch die mit reduzierter Auflösung übermittelten) ist, dass die Bewegung der Objekte der Teilnehmerbilddaten, also z.B. die Mund- bewegung eines Teilnehmers, vollkommen synthetisch, d.h. durch Formrekon- struktions- und Animationsalgorithmen dargestellt werden. Es reicht dann beispielsweise nur ein Bild eines Teilnehmers zu übermitteln und die Bewegung dann zu simulieren. In einer Ausführungsvariante ist es z.B. auch vorstellbar, durch Motion Compensated Prediction die Bildubertragungsrate zu variieren. So z.B. wird bei grösseren Bewegungen die Bildubertragungsrate erhöht und der Anteil der Bilder mit vollständig animierter Bewegung nimmt ab, während bei kleineren Bewegungen die Bildubertragungsrate gesenkt wird und die Bewegung in den Teilnehmerbilddaten synthetisiert wird.

Claims

Ansprüche
1. Videokonferenzverfahren, bei welchem mindestens drei Teilnehmer über Videokonferenzteilnehmerstellen (11) eines Videokonferenzsystems miteinander kommunizieren, wobei Multimediadaten über ein Telekommunika- tionsnetz (40) übertragen werden, welche mindestens Teilnehmerbilddaten (22) und/oder Teilnehmertondaten (21) umfassen, und jeder der Teilnehmer (10) die Teilnehmerbilddaten der anderen Teilnehmer auf einem Wiedergabegerät (24) der betreffenden Videokonferenzteilnehmerstelle (11) gleichzeitig sichtbar angeordnet dargestellt erhält, dadurch gekennzeichnet,
dass die Blickrichtung der Teilnehmer (10) jeweils von einem Eye
Tracking System (23) registriert und Eye Tracking Daten, die mindestens Angaben über die Blickrichtung umfassen, an eine Kommunikationseinheit (20) der betreffenden Videokonferenzteilnehmerstelle (11) übertragen werden, und
dass jeweils die Teilnehmerbilddaten desjenigen Teilnehmers mit voller Auflösung und Bildubertragungsrate über das Telekommunikationsnetz (40) an die Kommunikationseinheit (20) einer Videokonferenzteilnehmerstelle (11) übermittelt werden, dessen Teilnehmerbilddaten auf dem Wiedergabegerät (24) dieser letztgenannten Videokonferenzteilnehmerstelle (11) in der momentanen Blickrichtung des Teilnehmers (10) dieser Videokonferenzteil- nehmerstelle (11) dargestellt werden, während die Teilnehmerbilddaten der übrigen Teilnehmer in reduzierter Auflösung und/oder reduzierter Bildubertragungsrate übermittelt werden.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Bildubertragungsrate für diejenigen Teilnehmerbilddaten, welche nicht in der momentanen Blickrichtung des Teilnehmers (10) dargestellt werden, gleich Null ist.
3. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass die Eye Tracking Daten sowie die Teilnehmerbilddaten an eine Zentraleinheit (30) übermittelt werden, wobei die Zentraleinheit (30) für jeden Teilnehmer (10) gemäss den Angaben der Eye Tracking Daten des betreffen- den Teilnehmers (10) die Auflösung und/oder die Bildubertragungsrate der Teilnehmerbilddaten der anderen Teilnehmer bestimmt und die Teilnehmerbilddaten in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheit (20) des betreffenden Teilnehmers (10) übermittelt.
4. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass die Teilnehmerbilddaten an eine Zentraleinheit (30) übermittelt werden und in einem Datenspeicher (32) der Zentraleinheit (30) abgespeichert werden, dass die Kommunikationseinheit (20) eines Teilnehmers (10) gemäss den Angaben der Eye Tracking Daten des betreffenden Teilnehmers (10) die Auflösung und/oder Bildubertragungsrate der Teilnehmerbilddaten der anderen Teilnehmer bestimmt und dass diese Teilnehmerbilddaten von der Zentraleinheit (30) in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheit (20) des betreffenden Teilnehmers (10) übermittelt werden.
5. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekenn- zeichnet, dass die Teilnehmerbilddaten eines Teilnehmers (10) in einem Datenspeicher (26) der Kommunikationseinheit (20) dieses Teilnehmers (10) abgespeichert werden und die Kommunikationseinheit (20) gemäss den Angaben der Eye Tracking Daten diese Teilnehmers (10) die Auflösung und/oder die Bildubertragungsrate der Teilnehmerbilddaten der anderen Teilnehmer be- stimmt, wobei die letztgenannten Teilnehmerbilddaten von den Kommunikationseinheiten der anderen Teilnehmer in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheit (20) des betreffenden Teilnehmers (10) übermittelt werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekenn- zeichnet, dass mindestens eine Videokonferenzteilnehmerstelle (11) über ein
Mobilfunknetz (40) mit dem Telekommunikationsnetz (40) verbunden ist.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die Kommunikationseinheit (20) Bildanalyse- und Formrekonstruktionsalgorithmen verwendet, um die Teilnehmerbilddaten, welche mit redu- zierter Auflösung übermittelt wurden, darzustellen.
8. Videokonferenzsystem, welches mindestens drei verschiedene Videokonferenzteilnehmerstellen (11) umfasst, welche über ein Telekommunikationsnetz (40) miteinander verbunden sind, wobei die Videokonferenzteilnehmerstellen (11) eine Kommunikationseinheit (20), ein Wiedergabegerät (24) zur gleichzeitig sichtbaren Darstellung von Teilnehmerbilddaten und ein Tonausgabemodul (25) zur Wiedergabe von Teilnehmertondaten sowie ein Bilddatenerfassungsmodul (22) zur Erfassung von Teilnehmerbilddaten und ein Tondatenerfassungsmodul (21) zur Erfassung von Teilnehmertondaten umfassen, dadurch gekennzeichnet,
dass die Videokonferenzteilnehmerstellen (11) ein Eye Tracking System (23) umfassen, mittels welchem die Blickrichtung des betreffenden Teilnehmers (10) registriert wird, und mittels welchem Eye Tracking Daten an die Kommunikationseinheit (20) übertragen werden, wobei die Eye Tracking Daten mindestens Angaben über die Blickrichtung des Teilnehmers (10) umfassen, und
dass das Videokonferenzsystem Mittel umfasst, welche jeweils die Teilnehmerbilddaten desjenigen Teilnehmers mit voller Auflösung und Bildubertragungsrate über das Telekommunikationsnetz (40) an die Kommunikationseinheit (20) einer Videokonferenzteilnehmerstelle (11) übermitteln, dessen Teilnehmerbilddaten auf dem Wiedergabegerät (24) dieser letztgenannten Videokonferenzteilnehmerstelle (11) in der momentanen Blickrichtung des Teilnehmers (10) dieser Videokonferenzteilnehmerstelle (11) dargestellt werden, und welche die Teilnehmerbilddaten der übrigen Teilnehmer in reduzierter Auflösung und/oder reduzierter Bildubertragungsrate übermitteln.
9. System nach Anspruch 8, dadurch gekennzeichnet, dass die Bildubertragungsrate für diejenigen Teilnehmerbilddaten, welche auf dem Wiedergabegerät (24) nicht in der momentanen Blickrichtung des Teilnehmers (10) dargestellt werden, gleich null ist.
10. System nach einem der Ansprüche 8 oder 9, dadurch gekenn- zeichnet, dass das Videokonferenzsystem eine Zentraleinheit (30) umfasst, welche Zentraleinheit (30) für jeden Teilnehmer gemäss den Angaben der Eye Tracking Daten des betreffenden Teilnehmers (10) die Auflösung und/oder Bildubertragungsrate der Teilnehmerbilddaten der anderen Teilnehmer bestimmt und die Teilnehmerbilddaten in dieser Auflösung und/oder Bildubertragungsrate an die Kommunikationseinheiten (20) des betreffenden Teilnehmers (10) übermittelt.
11. System nach einem der Ansprüche 8 oder 9, dadurch gekennzeichnet, dass das Videokonferenzsystem eine Zentraleinheit (30) mit Datenspeicher (32) umfasst, von welchem Datenspeicher (32) die Teilnehmerbilddaten der Teilnehmer von den Kommunikationseinheiten gemäss den Angaben der Eye Tracking Daten des betreffenden Teilnehmers (10) in voller oder reduzierter Auflösung sowie in voller oder reduzierter Bildubertragungsrate herunterladbar sind.
12. System nach einem der Ansprüche 8 oder 9, dadurch gekennzeichnet, dass die Kommunikationseinheit (20) eines Teilnehmers (10) eine Datenspeicher (26) umfasst, von welcher Datenspeicher (26) die Teilnehmerbilddaten des betreffenden Teilnehmers (10) von den Kommunikationseinheiten (20) gemäss den Angaben der Eye Tracking Daten des betreffenden Teilnehmers in voller oder reduzierter Auflösung und/oder in voller oder reduzierter Bildubertragungsrate herunterladbar sind.
13. System nach einem der Ansprüche 8 bis 12, dadurch gekennzeichnet, dass das Telekommunikationsnetz (40) ein Mobilfunknetz umfasst.
14. System nach einem der Ansprüche 8 bis 13, dadurch gekennzeichnet, dass die Kommunikationseinheit (20) ein Bildrekonstruktionsmodul umfasst, welches Bildanalyse- und Formrekonstruktionsalgorithmen verwendet, um die Teilnehmerbilddaten, welche mit reduzierter Auflösung übermittelt wurden, zu rekonstruieren.
PCT/CH2000/000236 2000-04-28 2000-04-28 Verfahren und system für videokonferenzen WO2001084838A1 (de)

Priority Applications (12)

Application Number Priority Date Filing Date Title
BR0013612-3A BR0013612A (pt) 2000-04-28 2000-04-28 Processo e sistema para vìdeoconferências
MXPA02002131A MXPA02002131A (es) 2000-04-28 2000-04-28 Metodo y sistema para conferencias por video.
ES00918645T ES2206213T3 (es) 2000-04-28 2000-04-28 Procedimiento y sistema para videoconferencias.
AU39533/00A AU772400B2 (en) 2000-04-28 2000-04-28 Method and system for video conferences
DE50003567T DE50003567D1 (de) 2000-04-28 2000-04-28 Verfahren und system für videokonferenzen
JP2001581534A JP4602632B2 (ja) 2000-04-28 2000-04-28 ビデオ会議の方法とシステム
PCT/CH2000/000236 WO2001084838A1 (de) 2000-04-28 2000-04-28 Verfahren und system für videokonferenzen
US10/069,518 US6717607B1 (en) 2000-04-28 2000-04-28 Method and system for video conferences
EP00918645A EP1201082B1 (de) 2000-04-28 2000-04-28 Verfahren und system für videokonferenzen
CN00814101.0A CN1192618C (zh) 2000-04-28 2000-04-28 用于电视会议的方法和系统
AT00918645T ATE249125T1 (de) 2000-04-28 2000-04-28 Verfahren und system für videokonferenzen
DK00918645T DK1201082T3 (da) 2000-04-28 2000-04-28 Fremgangsmåde for og system til videokonferencer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CH2000/000236 WO2001084838A1 (de) 2000-04-28 2000-04-28 Verfahren und system für videokonferenzen

Publications (1)

Publication Number Publication Date
WO2001084838A1 true WO2001084838A1 (de) 2001-11-08

Family

ID=4358070

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CH2000/000236 WO2001084838A1 (de) 2000-04-28 2000-04-28 Verfahren und system für videokonferenzen

Country Status (12)

Country Link
US (1) US6717607B1 (de)
EP (1) EP1201082B1 (de)
JP (1) JP4602632B2 (de)
CN (1) CN1192618C (de)
AT (1) ATE249125T1 (de)
AU (1) AU772400B2 (de)
BR (1) BR0013612A (de)
DE (1) DE50003567D1 (de)
DK (1) DK1201082T3 (de)
ES (1) ES2206213T3 (de)
MX (1) MXPA02002131A (de)
WO (1) WO2001084838A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004091199A1 (ja) * 2003-04-08 2004-10-21 Sony Corporation 再生装置および再生方法

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1148690A1 (de) * 2000-04-20 2001-10-24 Telefonaktiebolaget Lm Ericsson Verfahren, Übergangssystem und Anordung in einem Kommunikationsnetz
KR100396892B1 (ko) * 2000-10-05 2003-09-03 삼성전자주식회사 비디오 mp3 시스템, 축소 비디오데이터 생성장치와생성방법 및 축소 비디오데이터 복원장치 및 복원방법
US20050149364A1 (en) * 2000-10-06 2005-07-07 Ombrellaro Mark P. Multifunction telemedicine software with integrated electronic medical record
US8392502B2 (en) * 2002-04-12 2013-03-05 Alcatel Lucent System and method for effecting conference calling
US7474326B2 (en) * 2002-11-04 2009-01-06 Tandberg Telecom As Inter-network and inter-protocol video conference privacy method, apparatus, and computer program product
US7464262B2 (en) * 2003-09-12 2008-12-09 Applied Minds, Inc. Method and apparatus for synchronizing audio and video in encrypted videoconferences
JP2005182456A (ja) * 2003-12-19 2005-07-07 Canon Inc 情報表示装置及び情報表示方法
CN100334882C (zh) * 2003-12-23 2007-08-29 华为技术有限公司 传输线路配置方法
US20060031910A1 (en) * 2004-07-30 2006-02-09 Pulitzer J H Integrated voice-over-internet-protocol multiple terminal adapter and A/V telecommunication device
US20060036852A1 (en) * 2004-08-16 2006-02-16 Kwok-Yan Leung Byte-based data-processing device and the processing method thereof
EP1667423B1 (de) * 2004-12-02 2009-03-11 Swisscom Mobile AG Verfahren und System zur Wiedergabe des Bildes einer Person
US8223213B2 (en) * 2005-12-07 2012-07-17 Wireless Avionics Wireless and CCTV megapixel digital camera for surveillance and unmanned air vehicles
US8004540B1 (en) 2006-10-10 2011-08-23 Adobe Systems Incorporated Display resolution boundary
US8045469B2 (en) * 2006-12-18 2011-10-25 Research In Motion Limited System and method for adjusting transmission data rates to a device in a communication network
CN101355682B (zh) * 2007-07-23 2011-03-16 中兴通讯股份有限公司 一种宽带专线会议电视系统全网自动调速的方法
JP2009044328A (ja) 2007-08-07 2009-02-26 Seiko Epson Corp 会議システム、サーバ、画像表示方法、コンピュータプログラム及び記録媒体
US20100054526A1 (en) * 2008-09-03 2010-03-04 Dean Eckles Method, apparatus and computer program product for providing gaze information
DE102009011251A1 (de) * 2009-03-02 2010-09-09 Siemens Enterprise Communications Gmbh & Co. Kg Multiplexverfahren und zugehörige funktionelle Datenstruktur zum Zusammenfassen digitaler Videosignale
CN107071688B (zh) 2009-06-23 2019-08-23 诺基亚技术有限公司 用于处理音频信号的方法及装置
US8179417B2 (en) * 2009-07-22 2012-05-15 Hewlett-Packard Development Company, L.P. Video collaboration
US9535651B2 (en) * 2009-12-18 2017-01-03 Oracle International Corporation Co-browsing systems and methods
US8982151B2 (en) 2010-06-14 2015-03-17 Microsoft Technology Licensing, Llc Independently processing planes of display data
US8949333B2 (en) * 2011-05-20 2015-02-03 Alejandro Backer Systems and methods for virtual interactions
US9874990B2 (en) 2012-02-10 2018-01-23 Oracle International Corporation System and method of concurrent unobstructed co-browsing and chat messaging
EP2642752A1 (de) * 2012-03-23 2013-09-25 Alcatel Lucent Verfahren, Server und Endgerät zur Durchführung einer Videokonferenz
US8976226B2 (en) * 2012-10-15 2015-03-10 Google Inc. Generating an animated preview of a multi-party video communication session
US9265458B2 (en) 2012-12-04 2016-02-23 Sync-Think, Inc. Application of smooth pursuit cognitive testing paradigms to clinical drug development
US9485459B2 (en) * 2012-12-14 2016-11-01 Biscotti Inc. Virtual window
US9654563B2 (en) 2012-12-14 2017-05-16 Biscotti Inc. Virtual remote functionality
WO2014093933A1 (en) 2012-12-14 2014-06-19 Biscotti Inc. Distributed infrastructure
US9380976B2 (en) 2013-03-11 2016-07-05 Sync-Think, Inc. Optical neuroinformatics
KR20160026317A (ko) * 2014-08-29 2016-03-09 삼성전자주식회사 음성 녹음 방법 및 장치
US9967399B2 (en) 2014-12-19 2018-05-08 Oracle International Corporation Co-browsing preview of queued customer contacts
US10671337B2 (en) 2015-09-25 2020-06-02 Oracle International Corporation Automatic sizing of agent's screen for html co-browsing applications
US10121337B2 (en) 2016-12-30 2018-11-06 Axis Ab Gaze controlled bit rate
US10643443B2 (en) 2016-12-30 2020-05-05 Axis Ab Alarm masking based on gaze in video management system
US10110802B2 (en) 2016-12-30 2018-10-23 Axis Ab Historical gaze heat map for a video stream
US10123020B2 (en) 2016-12-30 2018-11-06 Axis Ab Block level update rate control based on gaze sensing
CN107168668A (zh) * 2017-04-28 2017-09-15 北京七鑫易维信息技术有限公司 图像数据传输方法、装置以及存储介质、处理器
US10038788B1 (en) 2017-05-09 2018-07-31 Oracle International Corporation Self-learning adaptive routing system
US10445921B1 (en) * 2018-06-13 2019-10-15 Adobe Inc. Transferring motion between consecutive frames to a digital image
DE102020003522B4 (de) * 2020-06-12 2022-04-14 Jochen Ohligs Vorrichtung zur Darstellung von Bildern sowie Verwendung einer solchen Vorrichtung

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5500671A (en) * 1994-10-25 1996-03-19 At&T Corp. Video conference system and method of providing parallax correction and a sense of presence
US5703637A (en) * 1993-10-27 1997-12-30 Kinseki Limited Retina direct display device and television receiver using the same
EP0865207A2 (de) * 1997-03-13 1998-09-16 Kabushiki Kaisha Toshiba Bildübertragungssystem
WO1999012351A1 (en) * 1997-09-05 1999-03-11 Intelect Communications, Inc. Distributed video communications system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57208781A (en) * 1981-06-19 1982-12-21 Hitachi Ltd Conference system by video telephone
JPH099230A (ja) * 1995-06-15 1997-01-10 Oki Electric Ind Co Ltd 解像度制御装置
EP1039752A4 (de) * 1998-10-09 2007-05-02 Sony Corp Telekommunikationsvorrichtung und verfahren

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5703637A (en) * 1993-10-27 1997-12-30 Kinseki Limited Retina direct display device and television receiver using the same
US5500671A (en) * 1994-10-25 1996-03-19 At&T Corp. Video conference system and method of providing parallax correction and a sense of presence
EP0865207A2 (de) * 1997-03-13 1998-09-16 Kabushiki Kaisha Toshiba Bildübertragungssystem
WO1999012351A1 (en) * 1997-09-05 1999-03-11 Intelect Communications, Inc. Distributed video communications system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004091199A1 (ja) * 2003-04-08 2004-10-21 Sony Corporation 再生装置および再生方法
US7415191B2 (en) 2003-04-08 2008-08-19 Sony Corporation Reproduction device and reproduction method

Also Published As

Publication number Publication date
CN1192618C (zh) 2005-03-09
BR0013612A (pt) 2002-05-14
JP2003533098A (ja) 2003-11-05
ATE249125T1 (de) 2003-09-15
CN1379953A (zh) 2002-11-13
AU772400B2 (en) 2004-04-29
AU3953300A (en) 2001-11-12
EP1201082B1 (de) 2003-09-03
DK1201082T3 (da) 2003-12-15
US6717607B1 (en) 2004-04-06
DE50003567D1 (de) 2003-10-09
ES2206213T3 (es) 2004-05-16
MXPA02002131A (es) 2002-09-02
EP1201082A1 (de) 2002-05-02
JP4602632B2 (ja) 2010-12-22

Similar Documents

Publication Publication Date Title
EP1201082B1 (de) Verfahren und system für videokonferenzen
DE68926802T2 (de) Videofernmeldesystem und -verfahren zur Kompression und Dekompression von digitalen Farbvideodaten
DE69630121T2 (de) Bildkompressionssystem
DE10084867B4 (de) Verfahren und Vorrichtung um es einem Videokonferenzteilnehmer zu ermöglichen den zugehörigen Nutzern in der Kamera fokussiert zu erscheinen
US7242850B2 (en) Frame-interpolated variable-rate motion imaging system
EP1186148B1 (de) Übermittlung und darstellung von videodaten
US7302103B2 (en) Apparatus and methods for digital image compression
EP1247401B1 (de) Verfahren für die übermittlung von bilddaten
DE69320867T2 (de) Bildkommunikationsgerät
EP0309669A2 (de) Verfahren zur szenenmodellgestützten Bilddatenreduktion für digitale Fernsehsignale
US20020149696A1 (en) Method for presenting improved motion image sequences
DE68923648T2 (de) Komprimierung und Dekomprimierung von digitalen statistisch kodierten Farbvideodaten.
US7676105B2 (en) Method, apparatus, article and system for use in association with images
DE102005041249A1 (de) Verfahren zur Erzeugung räumlich darstellbarer Bilder
DE69315658T2 (de) Computerarbeitsstation
DE19510389C2 (de) Verfahren und Schaltungsanordnung zum Empfang von codierten Videosignalen
DE69019119T2 (de) Verfahren und Einrichtung zur Bewegtbilddecodierung.
EP1976292B1 (de) Verfahren und Videokommunikationssystem zur Einspeisung von Avatar-Informationen in einen Videodatenstrom
DE102004040023B4 (de) Verfahren, Vorrichtung, Anordnung, Computerlesbares Speichermedium und Programm-Element zum nachgeführten Anzeigen eines menschlichen Gesichts
WO2002078351A1 (de) Verfahren und vorrichtung zur übertragung von video- und/oder audiodaten
KR0176091B1 (ko) 다자간 데스크탑 영상회의를 위한 멀티미디어 보드에서의 비디오스트림 처리방법
English Visual temporal masking at video scene cuts.
DE102006016549A1 (de) Verfahren zum Erstellen von Streaming Media sowie Verfahren und System zum Übertragen von Streaming Media
Nekrasov et al. Application of the image decimation in compatible advanced definition television systems
JPS61189781A (ja) 静止画像表示方式

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AT AU AZ BA BB BG BR BY CA CH CN CR CU CZ CZ DE DE DK DK DM DZ EE EE ES FI FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2000918645

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: PA/a/2002/002131

Country of ref document: MX

ENP Entry into the national phase

Ref country code: RU

Ref document number: 2002 2002105027

Kind code of ref document: A

Format of ref document f/p: F

WWE Wipo information: entry into national phase

Ref document number: 39533/00

Country of ref document: AU

Ref document number: 008141010

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 10069518

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2000918645

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

Ref country code: DE

Ref legal event code: 8642

WWG Wipo information: grant in national office

Ref document number: 2000918645

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 39533/00

Country of ref document: AU