JPWO2009004891A1 - Bidirectional communication system, communication terminal, communication server, communication method, and communication control program used in the bidirectional communication system - Google Patents

Bidirectional communication system, communication terminal, communication server, communication method, and communication control program used in the bidirectional communication system Download PDF

Info

Publication number
JPWO2009004891A1
JPWO2009004891A1 JP2009521561A JP2009521561A JPWO2009004891A1 JP WO2009004891 A1 JPWO2009004891 A1 JP WO2009004891A1 JP 2009521561 A JP2009521561 A JP 2009521561A JP 2009521561 A JP2009521561 A JP 2009521561A JP WO2009004891 A1 JPWO2009004891 A1 JP WO2009004891A1
Authority
JP
Japan
Prior art keywords
impose
image
communication
position information
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009521561A
Other languages
Japanese (ja)
Inventor
良太 竹嶋
良太 竹嶋
一範 小澤
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2009004891A1 publication Critical patent/JPWO2009004891A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

通信サーバに処理負荷をかけることなく、各通信端末の表示画面で画像や文字列がスーパーインポーズされる双方向通信システムを提供する。会議用端末21,22,…,2nから各端末状態情報が多地点会議装置1へ送信され、また、多地点会議装置1により、会議用端末21,22,…,2nから受信される各画像符号化データが任意の各会議用端末21,22,…,2nへ送信されると共に、受信される各端末状態情報に対応するインポーズ画像識別子及びインポーズ位置情報が各画像符号化データ中に挿入されて画像選択部23を経て会議用端末21,22,…,2nへ送信され、会議用端末21,22,…,2nにより、インポーズ画像識別子に対応するインポーズ用画像が選択され、選択されたインポーズ用画像が、インポーズ位置情報に基づいて、各会議用端末21,22,…,2nで表示される画像中にインポーズされる。Provided is a bidirectional communication system in which images and character strings are superimposed on a display screen of each communication terminal without imposing a processing load on the communication server. Each terminal state information is transmitted from the conference terminals 21, 22,..., 2n to the multipoint conference apparatus 1, and each image received by the multipoint conference apparatus 1 from the conference terminals 21, 22,. The encoded data is transmitted to each of the conference terminals 21, 22,..., 2n, and the impose image identifier and the impose position information corresponding to the received terminal state information are included in each encoded image data. .., 2n are inserted and transmitted to the conference terminals 21, 22,..., 2n. The selected impose image is implied in the images displayed on the conference terminals 21, 22,..., 2n based on the impose position information.

Description

この発明は、双方向通信システム、該双方向通信システムに用いられる通信方法及び通信制御プログラムに係り、たとえば、多地点に配置された複数の通信端末間で画像符号化データを送受信し、同各通信端末の表示画面に文字列や画像をスーパーインポーズして会議などを行う場合に用いて好適な双方向通信システム、該双方向通信システムに用いられる通信端末、通信サーバ、通信方法及び通信制御プログラムに関する。   The present invention relates to a bidirectional communication system, a communication method and a communication control program used in the bidirectional communication system. For example, image encoded data is transmitted / received between a plurality of communication terminals arranged at multiple points. Bidirectional communication system suitable for use when a conference or the like is performed by superimposing a character string or an image on a display screen of a communication terminal, a communication terminal, a communication server, a communication method, and communication control used in the bidirectional communication system Regarding the program.

通信ネットワークでは、近年、ADSL(Asymmetric Digital Subscriber Line)や光通信技術などにより、画像符号化データや音声符号化データがパケットを用いて高速伝送されるようになっている。これにより、たとえば、VoIP(Voice over Internet Protocol)やTVoIP(TV over Internet Protocol)に対応した双方向通信システムや双方向通信システムが急速に普及してきている。   In communication networks, recently, image encoded data and audio encoded data are transmitted at high speed using packets by ADSL (Asymmetric Digital Subscriber Line) or optical communication technology. Thereby, for example, a bidirectional communication system and a bidirectional communication system compatible with VoIP (Voice over Internet Protocol) and TVoIP (TV over Internet Protocol) are rapidly spreading.

この種の技術に関連する双方向通信システムは、たとえば、企業などの中枢部に配置された会議用サーバ(通信サーバ)、及び遠隔地にある複数の拠点に配置された会議用端末(通信端末)からなっている。そして、同各会議用端末がインターネットやイントラネットなどの通信回線を介して同会議用サーバに接続され、各会議用端末間で会議用サーバを介して画像符号化データを含むストリーム(画像ストリーム)が送受信される。同会議用サーバでは、各会議用端末から送信された画像符号化データに、同会議用サーバで所有している文字列や画像がインポーズされて同各会議用端末に送信されることがある。たとえば、新たな参加者が会議に参加した際、会議用サーバでは、画像データに入室マークをインポーズしたものが符号化されて各会議用端末へ送信される。この場合、会議用サーバにより、各会議用端末から受信した画像ストリームがデコードされ、上記入室マークに対応した文字列や画像がインポーズされてからエンコードされて各会議用端末へ送信される。   A two-way communication system related to this type of technology includes, for example, a conference server (communication server) disposed in a central part of a company or the like, and a conference terminal (communication terminal) disposed in a plurality of remote locations. ). Each conference terminal is connected to the conference server via a communication line such as the Internet or an intranet, and a stream (image stream) including encoded image data is transmitted between the conference terminals via the conference server. Sent and received. In the conference server, a character string or an image owned by the conference server may be imposed on the encoded image data transmitted from each conference terminal and transmitted to the conference terminal. . For example, when a new participant joins a conference, the conference server encodes the image data with the entrance mark imposed and transmits it to each conference terminal. In this case, an image stream received from each conference terminal is decoded by the conference server, and a character string or an image corresponding to the entry mark is imposed and then encoded and transmitted to each conference terminal.

上記の双方向通信システムの他、関連する技術としては、たとえば、特許文献1に記載されたものがある。
特許文献1に記載された双方向通信システムでは、端末において、操作入力手段により指示された合成する文字及び画像が、WWW(World Wide Web)制御手段によりビットマップ(BMP)イメージデータに変換され、同BMPイメージデータが画像コーデック制御手段に出力される。画像コーデック制御手段では、このBMPイメージデータがMPEG−1の1つのスライス分のデータに変換されてサーバ装置に送信される。サーバ装置では、このデータが端末の4番目のスライス画像に置換されて1乃至3番目のスライス画像と合成される。
In addition to the above two-way communication system, as a related technique, for example, there is one described in Patent Document 1.
In the two-way communication system described in Patent Document 1, characters and images to be combined designated by operation input means are converted into bitmap (BMP) image data by WWW (World Wide Web) control means in a terminal, The BMP image data is output to the image codec control means. In the image codec control means, this BMP image data is converted into data for one slice of MPEG-1 and transmitted to the server apparatus. In the server device, this data is replaced with the fourth slice image of the terminal and synthesized with the first to third slice images.

また、特許文献2に記載されたテレビ会議通信端末装置の制御方法では、自端末で入力した文字情報が画像情報に変換され、スーパーインポーズされて表示されるので、文字情報を入力しているユーザ以外のユーザが、その入力された文字情報の内容、たとえば、文字情報通信の内容を確認することができ、通信会議セッションが円滑に行われる。   Moreover, in the control method of the video conference communication terminal device described in Patent Document 2, character information input by the terminal itself is converted into image information and superimposed and displayed, so that character information is input. A user other than the user can confirm the content of the input character information, for example, the content of character information communication, and the communication conference session is smoothly performed.

また、特許文献3に記載された双方向通信システムでは、参加地点名が各端末装置のモニタ・ディスプレイ上にスーパーインポーズされて表示されるため、受信中の画像がどこの端末装置のものなのかが参加者に確認される。   Further, in the interactive communication system described in Patent Document 3, the participation point name is superimposed and displayed on the monitor / display of each terminal device. Is confirmed by the participants.

また、特許文献4に記載されたテレビ会議システムでは、撮像手段の撮像位置(たとえば、撮影方向と倍率)が会議参加者に合わせて登録され、同時に、その人の名前、所属及び役職などの情報が付加情報として登録される。登録された撮像位置に撮像手段が一致または接近すると、その人物像に名前などの付加情報が合成された画像が得られる。これにより、人物の紹介及び確認が不要となる。
特開2004−023706号公報(要約書、図4、図23) 特開平08−307845号公報(要約書、図2) 特開平05−063830号公報(要約書、図1) 特開平08−051614号公報(要約書、図3)
Further, in the video conference system described in Patent Document 4, the imaging position (for example, the imaging direction and magnification) of the imaging means is registered according to the conference participant, and at the same time, information such as the person's name, affiliation, and title Is registered as additional information. When the imaging means matches or approaches the registered imaging position, an image in which additional information such as a name is combined with the person image is obtained. Thereby, introduction and confirmation of a person become unnecessary.
JP 2004-023706 (abstract, FIGS. 4 and 23) Japanese Patent Application Laid-Open No. 08-307845 (Abstract, FIG. 2) Japanese Patent Laid-Open No. 05-063830 (Abstract, FIG. 1) Japanese Patent Application Laid-Open No. 08-051614 (Abstract, FIG. 3)

しかしながら、上記双方向通信システムでは、次のような問題点があった。
すなわち、会議用サーバにより、受信した画像ストリームがデコードされ、文字列や画像がインポーズされてエンコードされるので、同会議用サーバにおける処理負荷が大きいという問題点がある。また、会議用サーバは、不特定多数のユーザを対象としているものであり、ユーザ個人に対応したインポーズ用画像を所有しているわけではないので、ユーザの好みに合ったインポーズ画像を提供できないという問題点がある。
However, the bidirectional communication system has the following problems.
That is, since the received image stream is decoded by the conference server, and character strings and images are encoded and encoded, there is a problem that the processing load on the conference server is heavy. The conference server is intended for a large number of unspecified users, and does not own the image for impose that corresponds to the individual user. There is a problem that it is not possible.

また、特許文献1に記載された双方向通信システムでは、端末で独自に文字及び画像がWWW制御手段によりBMPイメージデータに変換されるが、サーバ装置の処理負荷が低減される構成ではないので、上記の問題点が改善されるものではない。   Further, in the bidirectional communication system described in Patent Document 1, characters and images are uniquely converted into BMP image data by the WWW control unit at the terminal, but the processing load of the server device is not reduced. The above problems are not improved.

特許文献2に記載されたテレビ会議通信端末装置は、自端末で入力した文字情報が画像情報に変換され、スーパーインポーズされて表示されるものであり、上記の問題点を改善するものではない。   The video conference communication terminal device described in Patent Document 2 is such that character information input at its own terminal is converted into image information, superimposed and displayed, and does not improve the above problems. .

特許文献3に記載された双方向通信システムは、参加地点名がモニタ・ディスプレイに表示されるものであり、上記の問題点を改善するものではない。   In the two-way communication system described in Patent Document 3, the name of a participating point is displayed on a monitor / display, and does not improve the above problem.

特許文献4に記載されたテレビ会議システムは、登録された撮像位置に撮像手段が一致または接近すると、人物像に名前などの付加情報が合成された画像が得られるものであり、上記の問題点は改善されない。   The video conference system described in Patent Document 4 provides an image in which additional information such as a name is combined with a person image when an imaging unit matches or approaches a registered imaging position. Is not improved.

この発明は、上述の事情に鑑みてなされたもので、会議用サーバに処理負荷をかけることなく、指定のタイミングで画像や文字列がインポーズされ、また、ユーザの好みにあったインポーズ画像が得られる双方向通信システム、同双方向通信システムに用いられる通信端末、通信サーバ、通信方法及び通信制御プログラムを提供することを目的としている。   The present invention has been made in view of the above-described circumstances. An image or a character string is imposed at a specified timing without imposing a processing load on the conference server, and an imposed image that suits the user's preference. It is an object to provide a two-way communication system, a communication terminal, a communication server, a communication method, and a communication control program used in the two-way communication system.

上記課題を解決するために、この発明は、複数の通信端末と、前記各通信端末との間で各画像符号化データを送受信する通信サーバとを備え、前記各通信端末は、前記通信サーバから送信される前記画像符号化データに対応する画像を表示するための表示手段を有する双方向通信システムに係り、前記各通信端末は、前記表示手段に表示される前記画像中にスーパーインポーズするための1つ又は複数のインポーズ用画像を各インポーズ画像識別子と1対1に対応付けて保持すると共に、与えられたインポーズ画像識別子に対応する前記インポーズ用画像を選択するインポーズ用画像保持選択手段と、該インポーズ用画像保持選択手段で選択された前記インポーズ用画像を、与えられたインポーズ位置情報に基づいて、前記表示手段に表示される前記画像中にスーパーインポーズする画像合成手段と、前記画像符号化データを前記通信サーバへ送信する送信手段とが設けられ、前記通信サーバは、前記各インポーズ画像識別子及び各インポーズ位置情報を保持し、かつ、前記各通信端末から受信される前記各画像符号化データを任意の前記各通信端末へ送信すると共に、前記インポーズ画像識別子及びインポーズ位置情報を任意の前記各通信端末へ送信する構成とされていることを特徴としている。   In order to solve the above-described problem, the present invention includes a plurality of communication terminals and a communication server that transmits and receives each image encoded data to and from each of the communication terminals. The present invention relates to a bidirectional communication system having display means for displaying an image corresponding to the transmitted image encoded data, and each communication terminal is superimposed on the image displayed on the display means. One or a plurality of impose images are held in association with each impose image identifier in a one-to-one correspondence, and the impose image for selecting the impose image corresponding to the given impose image identifier is stored. The impose image selected by the hold selection means and the impose image hold selection means is displayed on the display means based on the given impose position information. Image composing means for superimposing in the image, and transmitting means for transmitting the encoded image data to the communication server. The communication server includes the impose image identifier and impose position information. And the encoded image data received from each communication terminal is transmitted to any communication terminal, and the impose image identifier and the imposed position information are transmitted to any communication terminal. It is characterized by being configured to transmit.

また、上記課題を解決するために、この発明は、通信端末との間で画像符号化データを送受信するための通信方法であって、前記通信端末に前記画像符号化データを送信する際に、インポーズ画像識別子及びインポーズ位置情報も送信し、前記送信されたインポーズ画像識別子に基づいて、インポーズ用画像を選択し、前記送信されたインポーズ位置情報に基づいて、画像中に前記インポーズ用画像をスーパーインポーズすることを特徴としている。   In order to solve the above problem, the present invention provides a communication method for transmitting and receiving encoded image data to and from a communication terminal, and when transmitting the encoded image data to the communication terminal, An impose image identifier and an impose position information are also transmitted, an impose image is selected based on the transmitted impose image identifier, and the impose image identifier is included in the image based on the transmitted impose position information. It is characterized by superimposing a pause image.

本発明によれば、会議用サーバに処理負荷をかけることなく、指定のタイミングで画像や文字列がインポーズされ、また、ユーザの好みにあったインポーズ画像が得られる双方向通信システム、同双方向通信システムに用いられる通信端末、通信サーバ、通信方法及び通信制御プログラムを提供できる。   According to the present invention, there is provided a bidirectional communication system in which an image or a character string is imposed at a specified timing without imposing a processing load on the conference server, and an imposed image can be obtained according to the user's preference. A communication terminal, a communication server, a communication method, and a communication control program used for a bidirectional communication system can be provided.

本発明は、通信サーバが、インポーズ画像識別子及びインポーズ位置情報を各画像符号化データ中に挿入して各通信端末へ送信する構成とされ、また、通信サーバが、インポーズ画像識別子及びインポーズ位置情報を各画像符号化データとは別に各通信端末へ送信する構成とされている双方向通信システム、同双方向通信システムに用いられる通信方法及び通信制御プログラムに関するものである。
例えば、図1に示すように、通信端末の一例としての複数の会議用端末2〜2と、各会議用端末2〜2との間で各画像符号化データを送受信する通信サーバの一例としての多地点会議装置1とを備え、各会議用端末2〜2は、多地点会議装置1から送信される画像符号化データに対応する画像を表示するための表示手段の一例としての表示部16を有する双方向通信システムに係り、各会議用端末2〜2は、表示部16に表示される画像中にスーパーインポーズするための1つ又は複数のインポーズ用画像を各インポーズ画像識別子と1対1に対応付けて保持すると共に、与えられたインポーズ画像識別子に対応するインポーズ用画像を選択するインポーズ用画像保持選択部210と、インポーズ用画像保持選択部210で選択されたインポーズ用画像を、与えられたインポーズ位置情報に基づいて、表示部16に表示される画像中にスーパーインポーズする画像合成部14と、画像符号化データを多地点会議装置1へ送信する通信部211とが設けられ、多地点会議装置1は、各インポーズ画像識別子及び各インポーズ位置情報を保持し、かつ、各会議用端末2〜2から受信される各画像符号化データを任意の会議用端末2〜2へ通信部230を介して送信すると共に、インポーズ画像識別子及びインポーズ位置情報を任意の会議用端末2〜2へ通信部230を介して送信する構成とする。
この構成によれば、各会議用端末2〜2の通信部211により、画像符号化データが多地点会議装置1へ送信され、多地点会議装置1では、各会議用端末2〜2から受信される上記各画像符号化データが任意の会議用端末2〜2へ送信されると共に、インポーズ画像識別子及びインポーズ位置情報が任意の会議用端末2〜2へ送信される。各会議用端末2〜2では、インポーズ用画像保持選択部210により、多地点会議装置1から与えられたインポーズ画像識別子に対応するインポーズ用画像が選択され、画像合成部14により、インポーズ用画像保持選択部210で選択されたインポーズ用画像が、多地点会議装置1から与えられたインポーズ位置情報に基づいて、表示部16に表示される画像中にスーパーインポーズされる。これにより、多地点会議装置では、デコード、インポーズ、エンコードを行う必要がなく、処理負荷を軽減することができると共に、各会議用端末2〜2の各ユーザの趣向に合った画像をインポーズできる。
以下、本発明の好適な実施の形態について説明する。
The present invention is configured such that the communication server inserts the impose image identifier and the impose position information into each encoded image data and transmits it to each communication terminal. The communication server also includes the impose image identifier and the impose image information. The present invention relates to a bidirectional communication system configured to transmit pause position information to each communication terminal separately from each image encoded data, a communication method used in the bidirectional communication system, and a communication control program.
For example, as shown in FIG. 1, a communication server that transmits and receives each encoded image data between a plurality of conference terminals 2 1 to 2 n as an example of a communication terminal and each of the conference terminals 2 1 to 2 n. An example of display means for displaying images corresponding to the encoded image data transmitted from the multipoint conference device 1, each of the conference terminals 2 1 to 2 n includes the multipoint conference device 1 as an example. In the interactive communication system having the display unit 16, each of the conference terminals 2 1 to 2 n has one or a plurality of impose images for superimposing in the image displayed on the display unit 16. Are stored in association with each impose image identifier in a one-to-one manner, and an impose image holding / selecting unit 210 that selects an impose image corresponding to the given impose image identifier, and an impose image hold Select part The image composition unit 14 for superimposing the impose image selected in 10 on the image displayed on the display unit 16 on the basis of the given impose position information; The multipoint conference device 1 holds each impose image identifier and each impose position information, and is received from each conference terminal 2 1 to 2 n. Each encoded image data is transmitted to any conference terminal 2 1 to 2 n via the communication unit 230, and the impose image identifier and the imposed position information are communicated to any conference terminal 2 1 to 2 n . It is assumed that the transmission is performed via the H.230.
According to this configuration, the encoded image data is transmitted to the multipoint conference apparatus 1 by the communication unit 211 of each conference terminal 2 1 to 2 n. In the multipoint conference apparatus 1, each conference terminal 2 1 to 2 is transmitted. together with the respective coded image data received from the n is transmitted to any conference terminals 2 1 to 2 n, transmission superimpose image identifier and superimpose position information to any conference terminals 2 1 to 2 n Is done. In each of the conference terminals 2 1 to 2 n , the impose image holding / selecting unit 210 selects an impose image corresponding to the impose image identifier given from the multipoint conference device 1, and the image compositing unit 14 The impose image selected by the impose image holding / selecting unit 210 is superimposed on the image displayed on the display unit 16 based on the impose position information given from the multipoint conference apparatus 1. The Thereby, in the multipoint conference apparatus, it is not necessary to perform decoding, imposing, and encoding, and the processing load can be reduced, and an image suitable for each user's preference of each of the conference terminals 2 1 to 2 n can be displayed. Can be imposed.
Hereinafter, preferred embodiments of the present invention will be described.

〔第1の実施形態〕
図2は、本発明を好適に実施した第1の実施形態に係る双方向通信システムの要部の電気的構成を示すブロック図である。
この例の双方向通信システムは、同図に示すように、多地点会議システムであり、多地点会議装置1と、会議用端末2,2,…,2と、外部装置3とから構成されている。
多地点会議装置1は、たとえば、企業などの中枢部に配置され、会議用端末2,2,…,2との間で画像符号化データを含む画像ストリームvs,vs,…,vsをそれぞれ送受信する。会議用端末2,2,…,2は、たとえば、遠隔地にある複数の拠点にそれぞれ配置されると共に、インターネットやイントラネットなどの通信回線を介して多地点会議装置1に接続され、同多地点会議装置1から送信される画像ストリームvs,vs,…,vsに対応する画像を表示するための図示しない表示部を有している。また、会議用端末2,2,…,2は、携帯電話端末などの移動機でも良い。外部状態検出装置の一例としての外部装置3は、たとえば地震センサや気温センサなどで構成され、この多地点会議システムの外部の状態を検出して、地震が発生した状態や気温などを表す1つ又は複数種類の外部状態情報psを生成する。また、外部装置3は、たとえば、主催者が会議に参加した状態に対応して外部状態情報psを生成しても良い。
[First Embodiment]
FIG. 2 is a block diagram showing an electrical configuration of a main part of the bidirectional communication system according to the first embodiment in which the present invention is preferably implemented.
As shown in the figure, the bidirectional communication system of this example is a multipoint conference system, and includes a multipoint conference device 1, conference terminals 2 1 , 2 2 ,..., 2 n and an external device 3. It is configured.
Multipoint conference apparatus 1, for example, is disposed centrally of the corporate conference terminals 2 1, 2 2, ..., the image stream vs 1, vs 2 including an image coded data to and from the 2 n, ... , Vs n are respectively transmitted and received. The conference terminals 2 1 , 2 2 ,..., 2 n are, for example, disposed at a plurality of remote locations and connected to the multipoint conference device 1 via a communication line such as the Internet or an intranet. It has a display unit (not shown) for displaying images corresponding to the image streams vs 1 , vs 2 ,..., Vs n transmitted from the multipoint conference apparatus 1. The conference terminals 2 1 , 2 2 ,..., 2 n may be mobile devices such as mobile phone terminals. The external device 3 as an example of the external state detection device is composed of, for example, an earthquake sensor or an air temperature sensor, and detects the external state of the multipoint conference system to represent the state where the earthquake has occurred, the air temperature, and the like. Alternatively, a plurality of types of external state information ps are generated. The external device 3 may generate the external state information ps corresponding to the state in which the organizer participates in the conference, for example.

図3は、図2中の会議用端末2の電気的構成を示すブロック図である。
この会議用端末2は、同図3に示すように、同会議用端末2全体を制御するコンピュータとしてのCPU(中央処理装置)2a及び同CPU2aを動作させるための通信制御プログラムが記録されたROM(リード・オンリ・メモリ)2bを有している。特に、この本実施形態では、会議用端末2は、受信部11と、インポーズ情報解析部12と、復号部の一例としてのデコーダ13と、画像合成手段の一例としての画像合成部14と、インポーズ用画像保持選択手段の一例としてのインポーズデータ選択部15と、表示部16と、送信手段の一例としての送信部17とから構成されている。受信部11は、多地点会議装置1から送信される画像ストリームvsを受信する。インポーズ情報解析部12は、受信部11で受信される画像ストリームvsに含まれる画像符号化データvaを出力すると共に、同画像符号化データvaを解析してインポーズ画像識別子cm及びインポーズ位置情報cnを取得する。デコーダ13は、インポーズ情報解析部12から出力される画像符号化データvaに対応する画像を復号して画像信号vdを出力する。
Figure 3 is a block diagram showing an electrical configuration of the conference terminal 2 1 in FIG.
The conference terminal 2 1, as shown in FIG. 3, a communication control program for operating the CPU (central processing unit) 2a and the CPU2a as a computer for controlling the 2 1 whole the conference terminals is recorded And a ROM (Read Only Memory) 2b. In particular, in this embodiment, the conference terminal 2 1 includes a receiver 11, a superimpose information analyzing unit 12, a decoder 13 as an example of a decoding unit, an image synthesizing unit 14 as an example of the image combining means , An impose data selection unit 15 as an example of an imposition image holding selection unit, a display unit 16, and a transmission unit 17 as an example of a transmission unit. The receiving unit 11 receives the image stream vs 1 transmitted from the multipoint conference apparatus 1. The impose information analysis unit 12 outputs the encoded image data va included in the image stream vs 1 received by the receiving unit 11, and analyzes the encoded image data va to analyze the impose image identifier cm and the impose. The position information cn is acquired. The decoder 13 decodes an image corresponding to the encoded image data va output from the impose information analysis unit 12 and outputs an image signal vd.

インポーズデータ選択部15は、表示部16に表示される画像中にスーパーインポーズするための複数のインポーズ用画像を各インポーズ画像識別子と1対1に対応付けてデータ集合として保持すると共に、インポーズ情報解析部12から与えられたインポーズ画像識別子cmに対応するインポーズ用画像viを選択する。上記データ集合は、たとえば、あらかじめ外部から提供されて保持されているデータ、ユーザが独自に作成したデータ、ユーザがウェブサイトからダウンロードしたデータなどで構成されている。画像合成部14は、インポーズデータ選択部15で選択されたインポーズ用画像viを、インポーズ情報解析部12から与えられたインポーズ位置情報cnに基づいて、画像信号vdと合成することにより、表示部16に表示される画像中にスーパーインポーズして画像信号veを出力する。表示部16は、画像信号veに基づいて画像を表示する。送信部17は、画像ストリームvs、及び会議用端末2の使用状態(たとえば、同会議用端末2が会議室に入室した状態、退室した状態、保留中の状態など)を表す複数種類の端末状態情報siを多地点会議装置1へ送信する。また、会議用端末2,…,2も、会議用端末2と同様の構成になっている。
なお、受信部11及び送信部17は、図1における通信部211、インポーズ情報解析部12、デコーダ13及びインポーズデータ選択部15は、図1におけるインポーズ用画像選択保持部210に相当する。
The impose data selection unit 15 stores a plurality of impose images for superimposing in the image displayed on the display unit 16 in a one-to-one correspondence with each impose image identifier as a data set. The impose image vi corresponding to the impose image identifier cm given from the impose information analysis unit 12 is selected. The data set includes, for example, data provided and held in advance from the outside, data originally created by the user, data downloaded from the website by the user, and the like. The image synthesis unit 14 synthesizes the impose image vi selected by the impose data selection unit 15 with the image signal vd based on the impose position information cn given from the impose information analysis unit 12. Then, the image signal ve is output after being superimposed on the image displayed on the display unit 16. The display unit 16 displays an image based on the image signal ve. Transmitter 17, the use state of the image stream vs 1, and conference terminals 2 1 (e.g., a state in which the conference terminals 2 1 has entered the conference room, exit state, the state such as pending) a plurality of types that represent Terminal state information si 1 is transmitted to the multipoint conference apparatus 1. Further, the conference terminals 2 2, ..., 2 n also has the same configuration as that of the conference terminals 2 1.
The reception unit 11 and the transmission unit 17 correspond to the communication unit 211, the impose information analysis unit 12, the decoder 13, and the impose data selection unit 15 in FIG. 1 correspond to the impose image selection holding unit 210 in FIG. 1. .

図4は、図2中の多地点会議装置1の電気的構成を示すブロック図である。
この多地点会議装置1は、同図4に示すように、同多地点会議装置1全体を制御するコンピュータとしてのCPU(中央処理装置)1a及び同CPU1aを動作させるための通信制御プログラムが記録されたROM1bを有している。特に、本実施形態では、多地点会議装置1は、受信部21,21,…,21と、インポーズ情報挿入部22,22,…,22と、画像選択部23と、インポーズ情報挿入部24,24,…,24と、送信部25,25,…,25と、タイミング取得部26とから構成されている。受信部21,21,…,21は、会議用端末2,2,…,2から画像ストリームvs,vs,…,vsを受信する。タイミング取得部26は、受信部21,21,…,21で受信された画像ストリームvs,vs,…,vs及び外部装置3で生成された外部状態情報psに基づいて、各インポーズ画像識別子及び各インポーズ位置情報を画像ストリームvs,vs,…,vsの各画像符号化データ中に挿入するための各タイミングを取得する。
FIG. 4 is a block diagram showing an electrical configuration of the multipoint conference apparatus 1 in FIG.
As shown in FIG. 4, the multipoint conference apparatus 1 stores a CPU (Central Processing Unit) 1a as a computer that controls the entire multipoint conference apparatus 1 and a communication control program for operating the CPU 1a. ROM 1b. In particular, in this embodiment, the multipoint conference apparatus 1, the receiving unit 21 1, 21 2, ..., and 21 n, imposed information insertion section 22 1, 22 2, ..., and 22 n, an image selection section 23 , imposed information insertion section 24 1, 24 2, ..., and 24 n, the transmission unit 25 1, 25 2, ..., and 25 n, and a timing acquisition unit 26.. Reception unit 21 1, 21 2, ..., 21 n is conference terminal 2 1, 2 2, ..., the image from the 2 n streams vs 1, vs 2, ..., to receive vs n. The timing acquisition unit 26 is based on the image streams vs 1 , vs 2 ,..., Vs n received by the reception units 21 1 , 21 2 ,..., 21 n and the external state information ps generated by the external device 3. Each timing for inserting each impose image identifier and each impose position information into each image encoded data of the image stream vs 1 , vs 2 ,..., Vs n is acquired.

インポーズ情報挿入部22,22,…,22は、各インポーズ画像識別子及び各インポーズ位置情報を各端末状態情報及び各外部状態情報と対応付けて保持し、タイミング取得部26で取得される各タイミングで、端末状態情報si,si,…,si又は外部状態情報psに対応するインポーズ画像識別子及びインポーズ位置情報を受信部21,21,…,21で受信された画像ストリームvs,vs,…,vsの各画像符号化データ中に挿入して画像ストリームvt,vt,…,vtとして出力する。この場合、たとえば、ITU−T(International Telecommunication Union-Telecommunication Standardization Sector)勧告)H.264のような動画像符号化方式、及びMPEG(Moving Picture Experts Group)−4のような動画圧縮規格に基づいて、上記インポーズ画像識別子及びインポーズ位置情報が上記各画像符号化データ中に挿入される。なお、インポーズ情報挿入部22,22,…,22は、タイミング取得部26で上記各タイミングが取得されない場合、上記インポーズ画像識別子及びインポーズ位置情報は、上記各画像符号化データ中に挿入されない。The impose information insertion units 22 1 , 22 2 ,..., 22 n hold each impose image identifier and each impose position information in association with each terminal state information and each external state information. at each timing to be acquired, the terminal state information si 1, si 2, ..., si n or external status information receiving section 21 1 a superimpose image identifier and imposing position information corresponding to ps, 21 2, ..., 21 n image stream vs 1, vs 2 received in, ..., the image stream vt 1, vt 2 is inserted into the coded image data of vs n, ..., and outputs it as vt n. In this case, for example, ITU-T (International Telecommunication Union-Telecommunication Standardization Sector recommendation) H.264. Based on a moving picture coding system such as H.264 and a moving picture compression standard such as MPEG (Moving Picture Experts Group) -4, the impose image identifier and the impose position information are inserted into each picture coded data. Is done. Note that the impose information insertion units 22 1 , 22 2 ,..., 22 n store the impose image identifier and the impose position information in the encoded image data when the timing acquisition unit 26 does not acquire the respective timings. Not inserted inside.

画像選択部23は、インポーズ情報挿入部22,22,…,22から出力される画像ストリームvt,vt,…,vtを入力し、会議用端末2,2,…,2にいずれの画像ストリームvs,vs,…,vsを送信するかを選択する。この場合の選択方法は、たとえば、会議用端末2,2,…,2の各ユーザが任意に行う方法、一定時間毎に切り替える方法など、任意の方法で良い。インポーズ情報挿入部24,24,…,24は、各インポーズ画像識別子及び各インポーズ位置情報を各端末状態情報及び各外部状態情報と1対1に対応付けて保持し、タイミング取得部26で取得される各タイミングで、端末状態情報si,si,…,si又は外部状態情報psに対応するインポーズ画像識別子及びインポーズ位置情報を画像選択部23から出力される画像ストリームvm,vm,…,vmの各画像符号化データ中に挿入して画像ストリームvu,vu,…,vuとして出力する。なお、インポーズ情報挿入部24,24,…,24は、タイミング取得部26で上記各タイミングが取得されない場合、上記インポーズ画像識別子及びインポーズ位置情報を上記各画像符号化データ中に挿入しない。送信部25,25,…,25は、画像ストリームvu,vu,…,vuを会議用端末2,2,…,2へそれぞれ送信する。この場合、所定の動画送信用プロトコルに基づき、たとえば、RTP(Real Time Protocol)などが用いられる。なお、受信部21,21,…,21及び送信部25,25,…,25は、図1における通信部230に相当する。Image selection section 23, superimpose information insertion section 22 1, 22 2, ..., the image stream vt 1, vt 2 output from the 22 n, ..., type the vt n, conference terminals 2 1, 2 2, ..., of any in 2 n image stream vs 1, vs 2, ..., you select whether to send a vs n. The selection method in this case may be an arbitrary method such as a method arbitrarily performed by each user of the conference terminals 2 1 , 2 2 ,..., 2 n or a method of switching at regular intervals. The impose information insertion units 24 1 , 24 2 ,..., 24 n hold each impose image identifier and each impose position information in a one-to-one correspondence with each terminal state information and each external state information. at each timing acquired by the acquiring unit 26, terminal status information si 1, si 2, ..., outputted from the superimpose image identifier and superimpose position information image selecting unit 23 corresponding to si n or external status information ps image stream vm 1, vm 2, ..., the image is inserted into the coded image data of the vm n streams vu 1, vu 2, ..., and outputs it as vu n. Note that the impose information insertion units 24 1 , 24 2 ,..., 24 n store the impose image identifier and the impose position information in the encoded image data when the timing acquisition unit 26 does not acquire the respective timings. Do not insert into. Transmission unit 25 1, 25 2, ..., 25 n, the image stream vu 1, vu 2, ..., vu n a conference terminal 2 1, 2 2, ..., transmits respectively to 2 n. In this case, for example, RTP (Real Time Protocol) is used based on a predetermined moving picture transmission protocol. The receiving units 21 1 , 21 2 ,..., 21 n and the transmitting units 25 1 , 25 2 ,..., 25 n correspond to the communication unit 230 in FIG.

図5は、図4中の画像選択部23に代えて設けられる画像処理部30の電気的構成を示すブロック図である。
この画像処理部30は、同図5に示すように、デコーダ31,31,…,31と、ミキサ32,32,…,32と、エンコーダ33,33,…,33とから構成されている。デコーダ31,31,…,31は、画像ストリームvt,vt,…,vtの各画像符号化データをデコードして各復号画像データを出力する。ミキサ32,32,…,32は、デコーダ31,31,…,31から出力される各復号画像データをミキシングする。エンコーダ33,33,…,33は、ミキサ32,32,…,32から出力される各画像データを画像符号化データにエンコードして画像ストリームvm,vm,…,vmとして出力する。
FIG. 5 is a block diagram showing an electrical configuration of an image processing unit 30 provided in place of the image selection unit 23 in FIG.
As shown in FIG. 5, the image processing unit 30 includes decoders 31 1 , 31 2 ,..., 31 n , mixers 32 1 , 32 2 ,..., 32 n and encoders 33 1 , 33 2 ,. 33 n . Decoder 31 1, 31 2, ..., 31 n , the image stream vt 1, vt 2, ..., and outputs each decoded image data by decoding the respective coded image data for vt n. Mixers 32 1, 32 2, ..., 32 n, the decoder 31 1, 31 2, ..., mixes the respective decoded image data output from the 31 n. The encoders 33 1 , 33 2 ,..., 33 n encode the image data output from the mixers 32 1 , 32 2 ,..., 32 n into image encoded data to generate image streams vm 1 , vm 2 ,. Output as vm n .

図6及び図7は、動画圧縮規格;MPEG−4に基づいてインポーズ画像識別子及びインポーズ位置情報を各画像符号化データ中に挿入する際のデータ構成の例を示す図である。
これらの図を参照して、この例の双方向通信システム(多地点会議システム)に用いられる通信方法の処理内容について説明する。
この多地点会議システムでは、会議用端末2,2,…,2から同会議用端末2,2,…,2の使用状態を表す複数種類の端末状態情報が多地点会議装置1へ送信される(送信処理)。また、多地点会議装置1により、各インポーズ画像識別子及び各インポーズ位置情報が各端末状態情報と1対1に対応付けて保持され、かつ、会議用端末2,2,…,2から受信される各画像符号化データが任意の各会議用端末2,2,…,2へ送信されると共に、同各会議用端末2,2,…,2から受信される各端末状態情報に対応するインポーズ画像識別子及びインポーズ位置情報が上記各画像符号化データ中に挿入されて任意の会議用端末2,2,…,2へ送信される。
6 and 7 are diagrams showing an example of the data structure when inserting the impose image identifier and the impose position information in each image encoded data based on the moving picture compression standard; MPEG-4.
With reference to these drawings, processing contents of a communication method used in the bidirectional communication system (multipoint conference system) of this example will be described.
This multipoint conference system, the conference terminal 2 1, 2 2, ..., 2 from 2 n the conference terminal 1, 2 2, ..., a plurality of types of terminal state information multipoint conference representing the use state of the 2 n It is transmitted to the device 1 (transmission process). Further, the multipoint conference apparatus 1 holds each impose image identifier and each impose position information in a one-to-one correspondence with each terminal state information, and the conference terminals 2 1 , 2 2 ,. each image coding data terminal for any each meeting received from n 2 1, 2 2, ..., while being transmitted to the 2 n, the respective conference terminals 2 1, 2 2, ..., received from the 2 n The impose image identifier and the impose position information corresponding to each terminal state information are inserted into each image encoded data and transmitted to any conference terminals 2 1 , 2 2 ,..., 2 n .

会議用端末2,2,…,2により、表示部16に表示される画像中にスーパーインポーズするための1つ又は複数のインポーズ用画像が各インポーズ画像識別子と1対1に対応付けて保持されると共に、多地点会議装置1から与えられたインポーズ画像識別子に対応するインポーズ用画像が選択され(インポーズ用画像保持選択処理)、同インポーズ用画像保持選択処理で選択されたインポーズ用画像が、同多地点会議装置1から与えられたインポーズ位置情報に基づいて、表示部16に表示される画像中にスーパーインポーズされる(画像合成処理)。By the conference terminals 2 1 , 2 2 ,..., 2 n , one or a plurality of impose images for superimposing in the image displayed on the display unit 16 are in one-to-one correspondence with each impose image identifier. And an impose image corresponding to the impose image identifier given from the multipoint conference apparatus 1 is selected (impose image holding / selecting process), and the imposing image holding / selecting process is performed. The impose image selected in (1) is superimposed on the image displayed on the display unit 16 based on the impose position information given from the multipoint conference apparatus 1 (image composition processing).

すなわち、会議用端末2,2,…,2では、送信部17により、画像ストリームvs,vs,…,vs及び端末状態情報si,si,…,siが多地点会議装置1へ送信される。多地点会議装置1では、受信部21,21,…,21により、画像ストリームvs,vs,…,vs及び端末状態情報si,si,…,siが受信される。タイミング取得部26により、受信部21,21,…,21で受信された端末状態情報si,si,…,si、及び外部装置3で生成された外部状態情報psに基づいて、各インポーズ画像識別子及び各インポーズ位置情報を画像ストリームvs,vs,…,vsの各画像符号化データ中に挿入するための各タイミングが取得される。That is, the conference terminal 2 1, 2 2, ..., In 2 n, the transmitting unit 17, an image stream vs 1, vs 2, ..., vs n and terminal status information si 1, si 2, ..., si n multi It is transmitted to the point conference device 1. In multipoint conference apparatus 1, the receiving unit 21 1, 21 2, ..., a 21 n, an image stream vs 1, vs 2, ..., vs n and terminal status information si 1, si 2, ..., si n is received The Based on the terminal state information si 1 , si 2 ,..., Si n received by the receiving units 21 1 , 21 2 ,..., 21 n and the external state information ps generated by the external device 3 by the timing acquisition unit 26. Thus, each timing for inserting each impose image identifier and each impose position information into each image encoded data of the image stream vs 1 , vs 2 ,..., Vs n is acquired.

インポーズ情報挿入部22,22,…,22では、タイミング取得部26で取得される各タイミングで、端末状態情報si,si,…,si又は外部状態情報psに対応するインポーズ画像識別子及びインポーズ位置情報が、受信部21,21,…,21で受信された画像ストリームvs,vs,…,vsの各画像符号化データ中に挿入されて画像ストリームvt,vt,…,vtとして出力される。この場合、挿入されるインポーズ画像識別子は、たとえば、会議用端末2,2,…,2のいずれかが保留中である旨などを示す情報に対応している。また、インポーズ情報挿入部22,22,…,22では、インポーズ画像識別子が挿入された時点から何フレーム後のフレームから何フレーム分のインポーズ用画像をインポーズするかを表す情報など、インポーズ開始タイミング情報とインポーズ終了タイミング情報とが挿入されることもある。Imposed information insertion section 22 1, 22 2, ..., the 22 n, at each timing acquired by the timing acquisition unit 26, the terminal state information si 1, si 2, ..., corresponding to si n or external status information ps superimpose image identifier and superimpose position information, receiving unit 21 1, 21 2, ..., the image stream vs 1 received at 21 n, vs 2, ..., are inserted into the respective coded image data for vs n Output as image streams vt 1 , vt 2 ,..., Vt n . In this case, the inserted impose image identifier corresponds to information indicating that one of the conference terminals 2 1 , 2 2 ,..., 2 n is on hold, for example. In addition, the impose information insertion units 22 1 , 22 2 ,..., 22 n indicate how many frames from the frame at which the impose image identifier is inserted and how many frames are to be imposed. Information such as impose start timing information and impose end timing information may be inserted.

上記情報やインポーズ画像識別子を画像符号化データに挿入する方法として、たとえば、MPEG−4の“User_data_start_code”の直後に存在する“User_data”や、H.264のSEI(Supplemental enhancement information)という1つのNAL(Network Abstraction Layer 、ネットワーク抽象化層)ユニットタイプの中に存在する変数“User_data_unregistered”などが用いられる。MPEG−4の“User_data”は、領域が8ビット(1バイト)であるが、複数用いることにより、上記情報やインポーズ画像識別子を格納することができる。また、H.264の変数“User_data_unregistered”は、1バイト長のデータがペイロードサイズ(payloadsize)存在するため、上記情報やインポーズ画像識別子を格納することができる。   As a method for inserting the above information and the imposed image identifier into the encoded image data, for example, “User_data” existing immediately after “User_data_start_code” of MPEG-4, A variable “User_data_unregistered” or the like existing in one NAL (Network Abstraction Layer) unit type called H.264 SEI (Supplemental enhancement information) is used. “User_data” of MPEG-4 has an area of 8 bits (1 byte), but the information and the imposed image identifier can be stored by using a plurality of areas. H. The H.264 variable “User_data_unregistered” can store the above information and the imposed image identifier because 1-byte data has a payload size (payloadsize).

画像インポーズしたいフレームより前の領域に上記情報やインポーズ画像識別子を挿入することにより、会議用端末2,2,…,2において、指定したフレームに画像をインポーズするための情報を付加することができる。しかし、MPEG−4では、“User_dataは同MPEG−4のシンタックス上、フレーム内に存在しない。そこで、MPEG−4のシンタックスに適応できる形式に合わせて“User_data”を挿入する。たとえば、図6に示すように、MPEG−4の変数“User_data”に上記情報やインポーズ画像識別子を挿入するために、同“User_data”を含むDCI(Decoder Configuration Information)が、VOP(Video Object Plane、MPEG−4で符号化した画像データの1フレーム)の前に挿入されている。“User_data”は、DCIの中又は直後に存在するが、上記情報やインポーズ画像識別子を挿入する箇所としては、どちらを選択しても良い。当該DCIを挿入する方法としては、画像符号化データ上のスタートコードを探索し、VOPのスタートコードの前に上記情報やインポーズ画像識別子を含むDCIを挿入する方法が考えられる。ここで用いられるDCIは、インポーズ情報挿入部22に入力される画像符号化データのDCIに、上記情報やインポーズ画像識別子を含む“User_data”を加えたものを用いる。Information for imposing an image on a designated frame in the conference terminals 2 1 , 2 2 ,..., 2 n by inserting the above information and the imposed image identifier into a region before the frame to be image-imposed. Can be added. However, in MPEG-4, “User_data does not exist in a frame on the MPEG-4 syntax. Therefore,“ User_data ”is inserted in a format that can be adapted to the MPEG-4 syntax. As shown in FIG. 6, in order to insert the above information and the imposed image identifier into the MPEG-4 variable “User_data”, DCI (Decoder Configuration Information) including the “User_data” is VOP (Video Object Plane, MPEG- “User_data” exists in DCI or immediately after DCI, but either of the above information and the position of an imposed image identifier is inserted. As a method of inserting the DCI, the start code on the image encoded data is searched, and the above information or Method of inserting a DCI containing Npozu image identifier can be considered. DCI used herein, the DCI of the image coded data input to the imposed information insertion section 22 1, including the information and superimpose the image identifier " Use “User_data” added.

また、図7に示すように、図6中のDCIに代えて、GOV(Group of Vop)ヘッダに含まれる“User_data”を用いることもある。GOVヘッダは、I−VOP(I;Intra、フレーム内)の前に存在する必要があるため、次のVOPがI−VOPである必要がある。また、GOVヘッダを付加する際には、前のGOVヘッダに含まれる時間情報、各VOPの先頭に存在する時間情報、あるいは、装置が所有する時間情報を用いて、当該GOVヘッダに存在する“time_code”に時刻情報を入れる必要がある。また、GOVヘッダには、変数“closed_gov”や変数“broken_link”が存在するが、本実施形態では、これらの変数に関わる操作は行われないので、“0”固定で良い。   Also, as shown in FIG. 7, “User_data” included in a GOV (Group of Vop) header may be used instead of the DCI in FIG. Since the GOV header needs to exist before the I-VOP (I; Intra, in a frame), the next VOP needs to be an I-VOP. In addition, when a GOV header is added, the time information included in the previous GOV header, the time information existing at the head of each VOP, or the time information owned by the apparatus is used. It is necessary to put time information in “time_code”. Further, the variable “closed_gov” and the variable “broken_link” exist in the GOV header. However, in the present embodiment, operations related to these variables are not performed, so that “0” may be fixed.

なお、上記のように、VOPスタートコードの前にDCIあるいはGOVを挿入する方法の他、シンタックスに適合していれば、たとえば、GOVスタートコードの前にDCIを挿入することや、既に存在するGOVに上記情報やインポーズ画像識別子を含む“User_data”を加えることもできる。また、ここでは、MPEG−4の“User_data”を例にあげて説明したが、H.264や、他の同様の仕組みを有する画像符号化データに対しても、上記の挿入処理が適用できる。また、たとえば、“reserved”(予約領域)のスタートコードを用いて、上記情報やインポーズ画像識別子を埋め込むことなども考えられる。   As described above, in addition to the method of inserting DCI or GOV before the VOP start code, if it is compatible with the syntax, for example, DCI may be inserted before the GOV start code or already exists “User_data” including the above information and the imposed image identifier can be added to the GOV. Here, MPEG-4 “User_data” has been described as an example. The above insertion processing can also be applied to H.264 and image encoded data having other similar mechanisms. In addition, for example, it is conceivable to embed the above information or the imposed image identifier using a start code of “reserved” (reserved area).

インポーズ情報挿入部22,22,…,22から出力された画像ストリームvt,vt,…,vtは、画像選択部23により会議用端末2,2,…,2のいずれかが送信先として選択され、画像ストリームvm,vm,…,vmが出力される。インポーズ情報挿入部24,24,…,24では、タイミング取得部26で取得される各タイミングで、端末状態情報si,si,…,si又は外部状態情報psに対応するインポーズ画像識別子及びインポーズ位置情報が画像選択部23から出力される画像ストリームvm,vm,…,vmの各画像符号化データ中に挿入され、画像ストリームvu,vu,…,vuとして出力される。画像ストリームvu,vu,…,vuは、送信部25,25,…,25により、会議用端末2,2,…,2へそれぞれ送信される。Imposed information insertion section 22 1, 22 2, ..., 22 n image outputted from the stream vt 1, vt 2, ..., vt n is conference terminal by the image selecting section 23 2 1, 2 2, ..., 2 Any one of n is selected as a transmission destination, and image streams vm 1 , vm 2 ,..., vm n are output. Imposed information insertion section 24 1, 24 2, ..., the 24 n, at each timing acquired by the timing acquisition unit 26, the terminal state information si 1, si 2, ..., corresponding to si n or external status information ps The impose image identifier and the impose position information are inserted into each encoded image data of the image streams vm 1 , vm 2 ,..., Vm n output from the image selection unit 23, and the image streams vu 1 , vu 2 ,. It is output as vu n. Image stream vu 1, vu 2, ..., vu n is transmitting unit 25 1, 25 2, ..., a 25 n, conference terminals 2 1, 2 2, ..., are respectively transmitted to the 2 n.

また、図4中の画像選択部23に代えて、図5に示す画像処理部30が用いられることもある。画像処理部30では、画像ストリームvt,vt,…,vtは、デコーダ31,31,…,31により復号画像にデコードされ、ミキサ32,32,…,32に入力されてミキシングされる。このミキシングは、任意の方法で行われる。ミキサ32,32,…,32から出力される画像データは、エンコーダ33,33,…,33により画像符号化データに変換され、画像ストリームvm,vm,…,vmとして出力される。なお、この画像処理部30では、ミキサ32,32,…,32が削除された構成とされ、ミキシングが行われなくても良い。Further, the image processing unit 30 shown in FIG. 5 may be used instead of the image selection unit 23 in FIG. In the image processing unit 30, an image stream vt 1, vt 2, ..., vt n, the decoder 31 1, 31 2, ..., is decoded in the decoded image by 31 n, a mixer 32 1, 32 2, ..., to 32 n It is input and mixed. This mixing is performed by an arbitrary method. Image data output from the mixers 32 1 , 32 2 ,..., 32 n are converted into image encoded data by the encoders 33 1 , 33 2 ,..., 33 n , and the image streams vm 1 , vm 2 ,. Output as n . The image processing unit 30 has a configuration in which the mixers 32 1 , 32 2 ,..., 32 n are deleted, and mixing may not be performed.

会議用端末2では、多地点会議装置1から送信される画像ストリームvsが受信部11で受信される。インポーズ情報解析部12では、受信部11で受信される画像ストリームvsに含まれる画像符号化データvaが出力されると共に、同画像符号化データvaが解析されてインポーズ画像識別子cm及びインポーズ位置情報cnが取得される。画像符号化データvaはデコーダ13で復号され、画像信号vdが出力される。インポーズデータ選択部15では、保持しているデータ集合から、インポーズ画像識別子cmに対応するインポーズ用画像viが選択される。画像合成部14では、インポーズ位置情報cnに基づいて、インポーズ用画像viが画像信号vdに合成されることにより、表示部16に表示される画像中にスーパーインポーズされて画像信号veが出力される。表示部16では、画像信号veに基づいて画像が表示される。また、会議用端末2,…,2でも、会議用端末2と同様の処理が行われる。In conference terminal 2 1, the image stream vs 1 transmitted from the multipoint conference apparatus 1 is received by the receiver 11. The impose information analyzing unit 12 outputs the encoded image data va included in the image stream vs 1 received by the receiving unit 11, and the encoded image data va is analyzed to determine the impose image identifier cm and the impose image identifier cm. Pause position information cn is acquired. The encoded image data va is decoded by the decoder 13, and an image signal vd is output. The impose data selection unit 15 selects an impose image vi corresponding to the impose image identifier cm from the stored data set. In the image synthesizing unit 14, the impose image vi is synthesized with the image signal vd based on the impose position information cn, so that the image signal ve is superimposed on the image displayed on the display unit 16. Is output. The display unit 16 displays an image based on the image signal ve. Further, the conference terminals 2 2, ..., even 2 n, the same processing as conference terminals 2 1 is performed.

以上のように、本実施形態では、会議用端末2,2,…,2から各端末状態情報が多地点会議装置1へ送信され、また、多地点会議装置1により、会議用端末2,2,…,2から受信される各画像符号化データが任意の各会議用端末2,2,…,2へ送信されると共に、同各会議用端末2,2,…,2から受信される各端末状態情報に対応するインポーズ画像識別子及びインポーズ位置情報が上記各画像符号化データ中に挿入されて画像選択部23を経て会議用端末2,2,…,2へ送信され、会議用端末2,2,…,2により、多地点会議装置1から与えられたインポーズ画像識別子に対応するインポーズ用画像が選択され、選択されたインポーズ用画像が、同多地点会議装置1から与えられたインポーズ位置情報に基づいて、表示部16に表示される画像中にスーパーインポーズされる。このため、多地点会議装置1では、デコード、インポーズ、エンコードを行う必要がなく、処理負荷の軽減が見込まれる。As described above, in the present embodiment, the terminal state information is transmitted from the conference terminals 2 1 , 2 2 ,..., 2 n to the multipoint conference apparatus 1, and the multipoint conference apparatus 1 performs the conference terminal. 2 1, 2 2, ..., 2 each of the image encoded data terminal for any each meeting received from n 2 1, 2 2, ..., while being transmitted to the 2 n, the respective conference terminals 2 1, 2 2, ..., superimpose image identifier and superimpose position information is inserted into each coded image data the image selection unit 23 through to the conference terminal 2 1 corresponding to each terminal status information received from the 2 n , 2 2 ,..., 2 n and the conference terminal 2 1 , 2 2 ,..., 2 n selects the impose image corresponding to the impose image identifier given from the multipoint conference device 1. The selected impose image is the same multipoint conference device. Based on imposing position information provided from and superimposed on the image displayed on the display unit 16. For this reason, in the multipoint conference apparatus 1, it is not necessary to perform decoding, imposing, and encoding, and the processing load is expected to be reduced.

また、多地点会議装置1中の画像選択部23に代えて、画像処理部30を用いるときにおいても、複数の会議用端末宛に同一の画像を表示したい場合で、かつ異なる画像をインポーズしたい場合において、エンコード回数を減らすことができ、処理負荷の軽減が見込まれる。たとえば、会議用端末2のから送出される画像を会議用端末2,…,2に表示する場合で、かつ会議用端末2,…,2でインポーズしたい画像が異なる場合、従来手法と本実施形態とでは、デコード回数は、会議用端末2の画像をデコードする1回と等しいが、インポーズ及びエンコードの回数は、従来手法では(n−1)回であるのに対し、本実施形態では1回となる。また、多地点会議装置1内で画像インポーズせず、会議用端末2,2,…,2でユーザ各々のインポーズデータを使用することにより、各ユーザの好みに合った画像がインポーズされる。In addition, when the image processing unit 30 is used instead of the image selection unit 23 in the multipoint conference apparatus 1, it is desired to display the same image addressed to a plurality of conference terminals and to impose different images. In some cases, the number of encodings can be reduced, and the processing load can be reduced. For example, conference terminals 2 1 The conference terminal 2 2 images sent from, ..., when displayed on the 2 n, and conference terminals 2 2, ..., if the image to be imposed by 2 n are different, in the conventional technique and the present embodiment, the decoding count is equal to one for decoding the image of the conference terminal 2 1, the number of imposed and encoding, in the conventional technique to a (n-1) times On the other hand, in this embodiment, it is once. In addition, by using the impose data of each user at the conference terminals 2 1 , 2 2 ,..., 2 n without image imposition in the multipoint conference apparatus 1, an image suitable for each user's preference can be obtained. Imposed.

〔第2の実施形態〕
本発明を好適に実施した第2の実施形態に係る多地点会議システムでは、図2中の多地点会議装置1及び会議用端末2,2,…,2に代えて、異なる構成の多地点会議装置1A及び会議用端末2A,2A,…,2Aが設けられている。
多地点会議装置1Aは、会議用端末2A,2A,…,2Aとの間で画像符号化データを含む画像ストリームvs,vs,…,vsをそれぞれ送受信する他、インポーズ画像識別子、インポーズ位置情報及びインポーズ適応区間(すなわち、インポーズの始まるフレームから終了するフレームまでの区間)を上記各画像符号化データとは別に上記会議用端末2A,2A,…,2Aへ送信する。会議用端末2A,2A,…,2Aは、多地点会議装置1Aから送信される画像ストリームvs,vs,…,vsに対応する画像を表示するための図示しない表示部を有すると共に、インポーズ画像識別子及びインポーズ位置情報を受信する。
[Second Embodiment]
In the multipoint conference system according to the second embodiment preferably implementing the present invention, instead of the multipoint conference device 1 and the conference terminals 2 1 , 2 2 ,..., 2 n in FIG. A multipoint conference apparatus 1A and conference terminals 2 1 A, 2 2 A,..., 2 n A are provided.
Multipoint conference device 1A, conference terminals 2 1 A, 2 2 A, ..., 2 image stream vs 1 including the image coded data with n A, vs 2, ..., other to respectively transmit and receive vs n , The impose image identifier, the impose position information, and the impose adaptation section (that is, the section from the frame where the impose starts to the end frame) separately from the image encoded data, the conference terminals 2 1 A, 2 2 A, ..., sent to 2 n A. Conference terminal 2 1 A, 2 2 A, ..., the 2 n A, the image stream vs 1, vs 2 transmitted from the multipoint conference device 1A, ..., (not shown) for displaying an image corresponding to vs n It has a display part and receives an impose image identifier and impose position information.

図8は、本実施形態に係る多地点会議システムに用いられる会議用端末の電気的構成を示すブロック図であり、第1の実施形態を示す図3中の要素と共通の要素には共通の符号が付されている。
この会議用端末2Aでは、図3中の受信部11、インポーズ情報解析部12及び画像合成部14に代えて、異なる機能を有する受信部11A、インポーズ情報取得部18が設けられている。受信部11Aは、多地点会議装置1Aから送信される画像符号化データを含む画像ストリームvs、インポーズ画像識別子、インポーズ位置情報及びインポーズ適応区間を受信する。インポーズ情報取得部18は、受信部11Aで受信されるインポーズ画像識別子cm及びインポーズ位置情報cnを取得する。デコーダ13は、受信部11Aで受信される画像ストリームvsに含まれる画像符号化データに対応する画像を復号して画像信号vdを出力する。他は、図3と同様の構成である。
FIG. 8 is a block diagram showing the electrical configuration of the conference terminal used in the multipoint conference system according to the present embodiment, and is common to the elements in FIG. 3 showing the first embodiment. The code | symbol is attached | subjected.
In this conference terminal 2 1 A, a receiving unit 11A and an impose information acquiring unit 18 having different functions are provided in place of the receiving unit 11, the impose information analyzing unit 12 and the image synthesizing unit 14 in FIG. Yes. The receiving unit 11A receives the image stream vs 1 including the encoded image data transmitted from the multipoint conference apparatus 1A, the imposed image identifier, the imposed position information, and the imposed adaptation section. The impose information acquisition unit 18 acquires the impose image identifier cm and the impose position information cn received by the reception unit 11A. The decoder 13 decodes an image corresponding to image encoded data included in the image stream vs 1 received by the receiving unit 11A, and outputs an image signal vd. The other configuration is the same as in FIG.

図9は、本実施形態に係る多地点会議システムに用いられる多地点会議装置の電気的構成を示すブロック図であり、第1の実施形態を示す図4中の要素と共通の要素には共通の符号が付されている。
この例の多地点会議装置1Aでは、同図9に示すように、図4中のインポーズ情報挿入部22,22,…,22及びインポーズ情報挿入部24,24,…,24が削除されると共に、インポーズ情報生成部27が新たに設けられ、また、タイミング取得部26に代えて、異なる機能を有するタイミング取得部26Aが設けられている。タイミング取得部26Aは、受信部21,21,…,21で受信された端末状態情報si,si,…,si、及び外部装置3で生成された外部状態情報psに基づいて、各インポーズ画像識別子、各インポーズ位置情報及びインポーズ適応区間を生成するための各タイミングを取得する。インポーズ情報生成部27は、タイミング取得部26Aで取得される各タイミングで、各端末状態情報si,si,…,siに対応するインポーズ画像識別子、インポーズ位置情報及びインポーズ適応区間を生成する。他は、図4と同様の構成である。
FIG. 9 is a block diagram showing an electrical configuration of the multipoint conference apparatus used in the multipoint conference system according to the present embodiment, and is common to the elements common to the elements in FIG. 4 showing the first embodiment. The code | symbol is attached | subjected.
In the multipoint conference apparatus 1A of this example, as shown in FIG. 9, the impose information insertion units 22 1 , 22 2 ,..., 22 n and the impose information insertion units 24 1 , 24 2 ,. , 24 n are deleted, an impose information generation unit 27 is newly provided, and a timing acquisition unit 26 </ b > A having a different function is provided instead of the timing acquisition unit 26. The timing acquisition unit 26A is based on the terminal state information si 1 , si 2 ,..., Si n received by the receiving units 21 1 , 21 2 ,..., 21 n and the external state information ps generated by the external device 3. Thus, each impose image identifier, each impose position information, and each timing for generating an impose adaptation section are acquired. Imposed information generating unit 27, at each timing acquired by the timing acquisition unit 26A, the terminal status information si 1, si 2, ..., superimpose image identifier corresponding to si n, imposed position information and imposing adaptive Generate an interval. The other configuration is the same as that of FIG.

この例の多地点会議システムに用いられる通信方法では、次の点が第1の実施形態と異なっている。
すなわち、多地点会議装置1Aにより、会議用端末2A,2A,…,2Aとの間で画像符号化データを含む画像ストリームvs,vs,…,vsがそれぞれ送受信され、また、インポーズ画像識別子、インポーズ位置情報及びインポーズ適応区間が、上記画像ストリームvs,vs,…,vsに含まれる画像符号化データとは別に上記会議用端末2A,2A,…,2Aへ送信される。この場合、所定のプロトコルに基づき、たとえば、RTCP(RTP(Real Time Protocol) Control Protocol)APP(A Posteriori Probability)パケット、RFC2833に記載のDTMF(Dual Tone Multi Frequency)RTPパケット、XML(extensible mark up language)データなどが用いられる。
The communication method used in the multipoint conference system of this example is different from the first embodiment in the following points.
That is, the multi-point conference device 1A, conference terminals 2 1 A, 2 2 A, ..., the image stream vs 1 including the image coded data between the 2 n A, vs 2, ... , vs n is transmitted and received, respectively is also superimpose an image identifier, it is imposed position information and imposing adapter section, the image stream vs 1, vs 2, ..., the terminal for separately the conference from the image coded data included in vs n 2 1 a , 2 2 A,..., 2 n A. In this case, based on a predetermined protocol, for example, RTCP (Real Time Protocol) Control Protocol (APP) (A Posteriori Probability) packet, DTMF (Dual Tone Multi Frequency) RTP packet described in RFC2833, XML (extensible mark up language) ) Data etc. are used.

この場合、会議用端末2A,2A,…,2Aでは、送信部17により、画像ストリームvs,vs,…,vs及び端末状態情報si,si,…,siが多地点会議装置1Aへ送信される。多地点会議装置1Aでは、受信部21,21,…,21により、画像ストリームvs,vs,…,vs及び端末状態情報si,si,…,siが受信される。タイミング取得部26Aでは、受信部21,21,…,21で受信された端末状態情報si,si,…,si、及び外部装置3で生成された外部状態情報psに基づいて、各インポーズ画像識別子、各インポーズ位置情報及
び各インポーズ適応区間を生成するための各タイミングが取得される。インポーズ情報生成部27では、タイミング取得部26Aで取得される各タイミングで、各端末状態情報si,si,…,siに対応するインポーズ画像識別子、インポーズ位置情報及びインポーズ適応区間が生成される。これらのインポーズ画像識別子、インポーズ位置情報及びインポーズ適応区間は、送信部25,25,…,25により、会議用端末2A,2A,…,2Aへそれぞれ送信される。
In this case, in the conference terminals 2 1 A, 2 2 A,..., 2 n A, the transmission unit 17 causes the image stream vs 1 , vs 2 , ..., vs n and the terminal state information si 1 , si 2 ,. si n is transmitted to the multipoint conference unit 1A. In multipoint conference device 1A, the receiving unit 21 1, 21 2, ..., a 21 n, an image stream vs 1, vs 2, ..., vs n and terminal status information si 1, si 2, ..., si n is received The In the timing acquisition unit 26A, based on the terminal state information si 1 , si 2 ,..., Si n received by the receiving units 21 1 , 21 2 ,..., 21 n and the external state information ps generated by the external device 3. Thus, each impose image identifier, each impose position information, and each timing for generating each impose adaptation section are acquired. In imposing information generating unit 27, at each timing acquired by the timing acquisition unit 26A, the terminal status information si 1, si 2, ..., superimpose image identifier corresponding to si n, imposed position information and imposing adaptive An interval is generated. These superimpose image identifier, superimpose position information and superimpose adapter section, the transmission unit 25 1, 25 2, ..., a 25 n, conference terminals 2 1 A, 2 2 A, ..., respectively to 2 n A Sent.

会議用端末2Aでは、多地点会議装置1Aから送信される画像ストリームvs、インポーズ画像識別子、インポーズ位置情報及びインポーズ適応区間が受信部11Aで受信される。インポーズ情報取得部18では、受信部11Aで受信されるインポーズ画像識別子cm、インポーズ位置情報cn及びインポーズ適応区間cqが取得される。また、デコーダ13では、受信部11Aで受信される画像ストリームvsに含まれる画像符号化データに対応する画像が復号されて画像信号vdが出力される。画像合成部14では、インポーズ位置情報cnに基づいて、インポーズ用画像viがインポーズ適応区間cqにて画像信号vdに合成されることにより、表示部16に表示される画像中にスーパーインポーズされて画像信号veが出力される。この後、インポーズデータ選択部15及び表示部16により、第1の実施形態と同様の処理が行われる。In the conference terminal 2 1 A, the reception unit 11A receives the image stream vs 1 , the imposed image identifier, the imposed position information, and the imposed adaptation section transmitted from the multipoint conference device 1A. The impose information acquisition unit 18 acquires the impose image identifier cm, the impose position information cn, and the impose adaptation section cq received by the reception unit 11A. Further, the decoder 13 decodes an image corresponding to the image encoded data included in the image stream vs 1 received by the receiving unit 11A, and outputs an image signal vd. In the image composition unit 14, the impose image vi is synthesized with the image signal vd in the impose adaptation section cq based on the impose position information cn, thereby superimposing in the image displayed on the display unit 16. The image signal ve is output after being paused. Thereafter, processing similar to that of the first embodiment is performed by the impose data selection unit 15 and the display unit 16.

以上のように、本実施形態では、地点会議装置1Aでは、第1の実施形態と同様に、デコード、インポーズ、エンコードを行う必要がなく、処理負荷の軽減が見込まれる。
また、多地点会議装置1A中の画像選択部23に代えて、画像処理部30を用いるときにおいても、第1の実施形態と同様の利点がある。
As described above, in this embodiment, the point conference apparatus 1A does not need to perform decoding, impose, and encode as in the first embodiment, and the processing load can be reduced.
Further, when the image processing unit 30 is used instead of the image selection unit 23 in the multipoint conference apparatus 1A, there are the same advantages as in the first embodiment.

以上、この発明の好適な実施の一例を図面により詳述してきたが、具体的な構成は上記各実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更などがあっても、この発明に含まれる。
たとえば、図4に示す多地点会議装置1は、インポーズ情報挿入部22,22,…,22又はインポーズ情報挿入部24,24,…,24が削除された構成になっていても良い。また、図5に示す画像処理部30は、ミキサ32,32,…,32が存在しない構成とされ、デコーダ31,31,…,31から出力される各復号画像データがエンコーダ33,33,…,33に入力される構成となっていても良い。
また、多地点会議装置1,1Aに、画像ストリームvs,vs,…,vsに基づいて会議用端末2,2,…,2,2A,2A,…,2Aの使用状態を判定する機能が設けられていれば、会議用端末2,2,…,2,2A,2A,…,2Aでは、端末状態情報si,si,…,siを送信する機能が不要となる。
As described above, the preferred embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to the above-described embodiments, and there are design changes and the like without departing from the gist of the present invention. However, it is included in this invention.
For example, multipoint conference apparatus 1 shown in FIG. 4, superimpose information insertion section 22 1, 22 2, ..., 22 n or imposed information insertion section 24 1, 24 2, ..., the configuration in which the deleted 24 n It may be. The image processing unit 30 shown in FIG. 5, a mixer 32 1, 32 2, ..., is configured not exist 32 n, the decoder 31 1, 31 2, ..., each decoded image data output from the 31 n is The encoders 33 1 , 33 2 ,..., 33 n may be input.
Further, the multipoint conference apparatus 1, 1A, an image stream vs 1, vs 2, ..., conference terminals 2 1 based on vs n, 2 2, ..., 2 n, 2 1 A, 2 2 A, ..., if function of determining the use state of the 2 n a is provided, the conference terminal 2 1, 2 2, ..., 2 n, 2 1 a, 2 2 a, ..., the 2 n a, terminal status information si 1, si 2, ..., function of transmitting si n becomes unnecessary.

この発明は、たとえばテレビ会議システムなど、各通信端末が多地点に分散配置されている多地点会議システム全般に適用でき、特に、同各通信端末の表示画面に画像をインポーズする場合に有効である。   The present invention can be applied to all multipoint conference systems in which each communication terminal is distributed at multiple points, such as a video conference system, and is particularly effective when an image is imposed on the display screen of each communication terminal. is there.

この出願は、2007年7月4日に出願された日本出願特願2007−176663を基礎とする優先権を主張し、その開示の全てをここに取り込む。   This application claims the priority on the basis of Japanese application Japanese Patent Application No. 2007-176663 for which it applied on July 4, 2007, and takes in those the indications of all here.

本発明に係る双方向通信システムの構成を示す図である。It is a figure which shows the structure of the bidirectional | two-way communication system which concerns on this invention. 本発明を好適に実施した第1の実施形態に係る双方向通信システムの要部の電気的構成を示すブロック図である。It is a block diagram which shows the electric constitution of the principal part of the bidirectional | two-way communication system which concerns on 1st Embodiment which implemented this invention suitably. 図1中の会議用端末2の電気的構成を示すブロック図である。Is a block diagram showing an electrical configuration of the conference terminal 2 1 in FIG. 図1中の多地点会議装置1の電気的構成を示すブロック図である。It is a block diagram which shows the electrical structure of the multipoint conference apparatus 1 in FIG. 図3中の画像選択部23に代えて設けられる画像処理部30の電気的構成を示すブロック図である。FIG. 4 is a block diagram illustrating an electrical configuration of an image processing unit 30 provided in place of the image selection unit 23 in FIG. 3. 動画圧縮規格;Mpeg−4に基づいてインポーズ画像識別子及びインポーズ位置情報を各画像符号化データ中に挿入する際のデータ構成の例を示す図である。It is a figure which shows the example of a data structure at the time of inserting the impose image identifier and the impose position information in each image coding data based on the moving image compression standard; Mpeg-4. 動画圧縮規格;Mpeg−4に基づいてインポーズ画像識別子及びインポーズ位置情報を各画像符号化データ中に挿入する際のデータ構成の例を示す図である。It is a figure which shows the example of a data structure at the time of inserting the impose image identifier and the impose position information in each image coding data based on the moving image compression standard; Mpeg-4. 本発明を好適に実施した第2の実施形態に係る多地点会議システムに用いられる会議用端末の電気的構成を示すブロック図である。It is a block diagram which shows the electrical structure of the terminal for a conference used for the multipoint conference system which concerns on 2nd Embodiment which implemented this invention suitably. 第2の実施形態に係る多地点会議システムに用いられる多地点会議装置の電気的構成を示すブロック図である。It is a block diagram which shows the electric constitution of the multipoint conference apparatus used for the multipoint conference system which concerns on 2nd Embodiment.

符号の説明Explanation of symbols

1,1A 多地点会議装置(通信サーバ)
1a CPU(中央処理装置)
1b ROM(リード・オンリ・メモリ)
,2,…,2,2A,2A,…,2A 会議用端末(通信端末)
2a CPU(中央処理装置)
2b ROM(リード・オンリ・メモリ)
3 外部装置(外部状態検出装置)
11,11A 受信部
12 インポーズ情報解析部
13 デコーダ(復号部)
14 画像合成部(画像合成手段)
15 インポーズデータ選択部(インポーズ用画像保持選択手段)
16 表示部(表示手段)
17 送信部(送信手段)
18 インポーズ情報取得部
21,21,…,21 受信部
22,22,…,22 インポーズ情報挿入部
23 画像選択部(通信サーバの一部)
24,24,…,24 インポーズ情報挿入部
25,25,…,25 送信部
26,26A タイミング取得部
27 インポーズ情報生成部
30 画像処理部(通信サーバの一部)
31,31,…,31 デコーダ(画像処理部の一部)
32,32,…,32 ミキサ(画像処理部の一部)
33,33,…,33 エンコーダ(画像処理部の一部)
1,1A multipoint conference device (communication server)
1a CPU (Central Processing Unit)
1b ROM (read-only memory)
2 1 , 2 2 , ..., 2 n , 2 1 A, 2 2 A, ..., 2 n A Conference terminal (communication terminal)
2a CPU (Central Processing Unit)
2b ROM (read-only memory)
3 External device (external condition detection device)
11, 11A receiving unit 12 impose information analyzing unit 13 decoder (decoding unit)
14 Image composition section (image composition means)
15 Impose data selection section (impose image holding selection means)
16 Display section (display means)
17 Transmitter (transmission means)
18 impose information acquisition unit 21 1 , 21 2 ,..., 21 n reception unit 22 1 , 22 2 ,..., 22 n impose information insertion unit 23 image selection unit (part of communication server)
24 1 , 24 2 ,..., 24 n impose information insertion unit 25 1 , 25 2 ,..., 25 n transmission unit 26, 26 A Timing acquisition unit 27 Impose information generation unit 30 Image processing unit (part of communication server)
31 1 , 31 2 ,..., 31 n decoder (part of the image processing unit)
32 1 , 32 2 ,..., 32 n mixer (part of the image processing unit)
33 1 , 33 2 ,..., 33 n encoder (part of the image processing unit)

Claims (20)

複数の通信端末と、前記各通信端末との間で各画像符号化データを送受信する通信サーバとを備え、前記各通信端末は、前記通信サーバから送信される前記画像符号化データに対応する画像を表示するための表示手段を有する双方向通信システムであって、
前記各通信端末は、
前記表示手段に表示される前記画像中にスーパーインポーズするための1つ又は複数のインポーズ用画像を各インポーズ画像識別子と1対1に対応付けて保持すると共に、与えられたインポーズ画像識別子に対応する前記インポーズ用画像を選択するインポーズ用画像保持選択手段と、
該インポーズ用画像保持選択手段で選択された前記インポーズ用画像を、与えられたインポーズ位置情報に基づいて、前記表示手段に表示される前記画像中にスーパーインポーズする画像合成手段と、
前記画像符号化データを前記通信サーバへ送信する送信手段とが設けられ、
前記通信サーバは、
前記各インポーズ画像識別子及び各インポーズ位置情報を保持し、かつ、前記各通信端末から受信される前記各画像符号化データを任意の前記各通信端末へ送信すると共に、前記インポーズ画像識別子及びインポーズ位置情報を任意の前記各通信端末へ送信する構成とされていることを特徴とする双方向通信システム。
A plurality of communication terminals, and a communication server that transmits and receives each encoded image data to and from each of the communication terminals, wherein each of the communication terminals corresponds to the image encoded data transmitted from the communication server. A two-way communication system having display means for displaying
Each communication terminal is
One or a plurality of impose images for superimposing in the image displayed on the display means are held in a one-to-one correspondence with each impose image identifier, and the given impose image An impose image holding / selecting means for selecting the impose image corresponding to the identifier;
Image combining means for superimposing the image for imposition selected by the imposition image holding / selecting means on the image displayed on the display means on the basis of given imposition position information;
Transmitting means for transmitting the encoded image data to the communication server;
The communication server is
Each of the imposed image identifiers and each of the imposed position information is held, and each of the encoded image data received from each of the communication terminals is transmitted to any of the respective communication terminals. A two-way communication system, characterized in that the impose position information is transmitted to any of the communication terminals.
前記通信サーバは、
前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データ中に挿入して前記各通信端末へ送信する構成とされていることを特徴とする請求項1記載の双方向通信システム。
The communication server is
The bidirectional communication system according to claim 1, wherein the impose image identifier and the impose position information are inserted into the encoded image data and transmitted to the communication terminals.
前記通信サーバは、
前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データとは別に前記各通信端末へ送信する構成とされていることを特徴とする請求項1記載の双方向通信システム。
The communication server is
2. The bidirectional communication system according to claim 1, wherein the impose image identifier and the impose position information are transmitted to each of the communication terminals separately from the respective encoded image data.
前記通信サーバは、
前記各通信端末から前記各画像符号化データを受信する複数の受信部と、
前記各インポーズ画像識別子及び各インポーズ位置情報を前記各画像符号化データ中に挿入するための各タイミングを取得するタイミング取得部と、
該タイミング取得部で取得される前記各タイミングで前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データ中に挿入する複数のインポーズ情報挿入部とを有することを特徴とする請求項2記載の双方向通信システム。
The communication server is
A plurality of receiving units for receiving the encoded image data from the communication terminals;
A timing acquisition unit for acquiring each timing for inserting each impose image identifier and each impose position information into each encoded image data;
And a plurality of impose information insertion units for inserting the impose image identifier and the impose position information into the respective encoded image data at the respective timings acquired by the timing acquisition unit. 2. The bidirectional communication system according to 2.
前記各通信端末は、
前記通信サーバから送信される前記画像符号化データを受信する受信部と、
該受信部で受信される前記画像符号化データを解析して前記インポーズ画像識別子及びインポーズ位置情報を取得するインポーズ情報解析部と、
前記画像符号化データに対応する画像を復号する復号部とを有することを特徴とする請求項4記載の双方向通信システム。
Each communication terminal is
A receiving unit that receives the encoded image data transmitted from the communication server;
An impose information analyzing unit that analyzes the encoded image data received by the receiving unit and acquires the impose image identifier and the impose position information;
The bidirectional communication system according to claim 4, further comprising: a decoding unit that decodes an image corresponding to the encoded image data.
前記通信サーバは、
前記各通信端末から前記各画像符号化データを受信する複数の受信部と、
前記各インポーズ画像識別子及び各インポーズ位置情報を生成するための各タイミングを取得するタイミング取得部と、
該タイミング取得部で取得される前記各タイミングで前記インポーズ画像識別子及びインポーズ位置情報を生成するインポーズ情報生成部とを有することを特徴とする請求項3記載の双方向通信システム。
The communication server is
A plurality of receiving units for receiving the encoded image data from the communication terminals;
A timing acquisition unit that acquires each timing for generating each impose image identifier and each impose position information;
4. The bidirectional communication system according to claim 3, further comprising an impose information generating unit that generates the impose image identifier and the impose position information at each timing acquired by the timing acquisition unit.
前記各通信端末は、
前記通信サーバから送信される前記画像符号化データ、インポーズ画像識別子及びインポーズ位置情報を受信する受信部と、
該受信部で受信される前記インポーズ画像識別子及びインポーズ位置情報を取得するインポーズ情報取得部と、
前記画像符号化データに対応する画像を復号する復号部とを有することを特徴とする請求項6記載の双方向通信システム。
Each communication terminal is
A receiving unit that receives the encoded image data, the imposed image identifier, and the imposed position information transmitted from the communication server;
An impose information acquisition unit for acquiring the impose image identifier and impose position information received by the receiving unit;
The bidirectional communication system according to claim 6, further comprising: a decoding unit that decodes an image corresponding to the encoded image data.
当該双方向通信システムの外部の状態を検出して1つ又は複数種類の外部状態情報を生成する外部状態検出装置が設けられ、
前記通信サーバは、
前記各インポーズ画像識別子及び各インポーズ位置情報を前記各外部状態情報と対応付けて保持し、かつ、前記各通信端末から受信される前記各画像符号化データを任意の前記各通信端末へ送信すると共に、前記各通信端末から受信される前記各外部状態情報に対応する前記インポーズ画像識別子及びインポーズ位置情報を任意の前記各通信端末へ送信する構成とされていることを特徴とする請求項1記載の双方向通信システム。
An external state detection device that detects an external state of the bidirectional communication system and generates one or more types of external state information is provided,
The communication server is
Each impose image identifier and each impose position information are stored in association with each external state information, and each image encoded data received from each communication terminal is transmitted to any communication terminal. In addition, the apparatus is configured to transmit the imposed image identifier and the imposed position information corresponding to the external state information received from the communication terminals to any of the communication terminals. Item 2. The bidirectional communication system according to item 1.
前記通信サーバは、
所定の動画像符号化方式及び所定の動画圧縮規格に基づいて、前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データ中に挿入する構成とされていることを特徴とする請求項2、4又は5記載の双方向通信システム。
The communication server is
2. The structure according to claim 1, wherein the impose image identifier and the impose position information are inserted into the encoded image data based on a predetermined moving image encoding method and a predetermined moving image compression standard. The bidirectional communication system according to 2, 4, or 5.
前記通信サーバは、
所定のプロトコルに基づいて、前記インポーズ画像識別子及びインポーズ位置情報を前記各通信端末へ送信する構成とされていることを特徴とする請求項3、6又は7記載の双方向通信システム。
The communication server is
8. The bidirectional communication system according to claim 3, 6 or 7, wherein the two-way communication system is configured to transmit the imposed image identifier and the imposed position information to each of the communication terminals based on a predetermined protocol.
通信サーバとの間で各画像符号化データを送受信する通信端末であって、
前記通信サーバから送信される前記画像符号化データに対応する画像を表示するための表示手段と、
前記表示手段に表示される前記画像中にスーパーインポーズするための1つ又は複数のインポーズ用画像を各インポーズ画像識別子と1対1に対応付けて保持すると共に、与えられたインポーズ画像識別子に対応する前記インポーズ用画像を選択するインポーズ用画像保持選択手段と、
該インポーズ用画像保持選択手段で選択された前記インポーズ用画像を、与えられたインポーズ位置情報に基づいて、前記表示手段に表示される前記画像中にスーパーインポーズする画像合成手段と、
前記画像符号化データを前記通信サーバへ送信する送信手段とが設けられた通信端末。
A communication terminal that transmits and receives each encoded image data to and from a communication server,
Display means for displaying an image corresponding to the encoded image data transmitted from the communication server;
One or a plurality of impose images for superimposing in the image displayed on the display means are held in a one-to-one correspondence with each impose image identifier, and the given impose image An impose image holding / selecting means for selecting the impose image corresponding to the identifier;
Image combining means for superimposing the image for imposition selected by the imposition image holding / selecting means on the image displayed on the display means on the basis of given imposition position information;
A communication terminal provided with transmission means for transmitting the encoded image data to the communication server.
画像符号化データに対応する画像を表示するための表示手段を有する複数の通信端末との間で各画像符号化データを送受信する通信サーバであって、
前記表示手段に表示される前記画像中にスーパーインポーズするための1つ又は複数のインポーズ用画像と1対1に対応づけられた各インポーズ画像識別子及び各インポーズ位置情報を保持し、かつ、前記各通信端末から受信される前記各画像符号化データを任意の前記各通信端末へ送信すると共に、前記インポーズ画像識別子及びインポーズ位置情報を任意の前記各通信端末へ送信する構成とされていることを特徴とする通信サーバ。
A communication server that transmits and receives each encoded image data to and from a plurality of communication terminals having display means for displaying an image corresponding to the encoded image data,
Holding each impose image identifier and each impose position information in one-to-one correspondence with one or a plurality of impose images for superimposing in the image displayed on the display means; And while transmitting each said image coding data received from each said communication terminal to each said each communication terminal, the structure which transmits the said impose image identifier and the position information to any said each communication terminal, A communication server.
前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データ中に挿入して前記各通信端末へ送信する構成とされていることを特徴とする請求項12記載の通信サーバ。   13. The communication server according to claim 12, wherein the impose image identifier and the impose position information are inserted into the encoded image data and transmitted to the communication terminals. 前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データとは別に前記各通信端末へ送信する構成とされていることを特徴とする請求項12記載の通信サーバ。   13. The communication server according to claim 12, wherein the impose image identifier and the impose position information are transmitted to each of the communication terminals separately from the respective encoded image data. 前記各通信端末から前記各画像符号化データを受信する複数の受信部と、
前記各インポーズ画像識別子及び各インポーズ位置情報を前記各画像符号化データ中に挿入するための各タイミングを取得するタイミング取得部と、
該タイミング取得部で取得される前記各タイミングで前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データ中に挿入する複数のインポーズ情報挿入部とを有することを特徴とする請求項13記載の通信サーバ。
A plurality of receiving units for receiving the encoded image data from the communication terminals;
A timing acquisition unit for acquiring each timing for inserting each impose image identifier and each impose position information into each encoded image data;
And a plurality of impose information insertion units for inserting the impose image identifier and the impose position information into the respective encoded image data at the respective timings acquired by the timing acquisition unit. 13. The communication server according to 13.
前記各通信端末から前記各画像符号化データを受信する複数の受信部と、
前記各インポーズ画像識別子及び各インポーズ位置情報を生成するための各タイミングを取得するタイミング取得部と、
該タイミング取得部で取得される前記各タイミングで前記インポーズ画像識別子及びインポーズ位置情報を生成するインポーズ情報生成部とを有することを特徴とする請求項14記載の通信サーバ。
A plurality of receiving units for receiving the encoded image data from the communication terminals;
A timing acquisition unit that acquires each timing for generating each impose image identifier and each impose position information;
The communication server according to claim 14, further comprising: an impose information generation unit that generates the impose image identifier and the impose position information at each timing acquired by the timing acquisition unit.
通信端末との間で画像符号化データを送受信するための通信方法であって、
前記通信端末へ前記画像符号化データを送信する際に、インポーズ画像識別子及びインポーズ位置情報も送信し、
前記送信されたインポーズ画像識別子に基づいて、インポーズ用画像を選択し、
前記送信されたインポーズ位置情報に基づいて、画像中に前記インポーズ用画像をスーパーインポーズすることを特徴とする通信方法。
A communication method for transmitting and receiving encoded image data to and from a communication terminal,
When transmitting the encoded image data to the communication terminal, also transmit the impose image identifier and the impose position information,
Based on the transmitted impose image identifier, an image for imposition is selected,
A communication method comprising superimposing the imposition image in an image based on the transmitted imposition position information.
前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データ中に挿入して前記各通信端末へ送信することを特徴とする請求項17記載の通信方法。   18. The communication method according to claim 17, wherein the impose image identifier and the impose position information are inserted into the respective encoded image data and transmitted to the respective communication terminals. 前記インポーズ画像識別子及びインポーズ位置情報を前記各画像符号化データとは別に前記各通信端末へ送信することを特徴とする請求項18記載の通信方法。   19. The communication method according to claim 18, wherein the impose image identifier and the impose position information are transmitted to the communication terminals separately from the encoded image data. コンピュータに請求項1乃至10のいずれか一に記載の双方向通信システムを制御させるための通信制御プログラム。   A communication control program for causing a computer to control the bidirectional communication system according to any one of claims 1 to 10.
JP2009521561A 2007-07-04 2008-06-04 Bidirectional communication system, communication terminal, communication server, communication method, and communication control program used in the bidirectional communication system Pending JPWO2009004891A1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007176663 2007-07-04
JP2007176663 2007-07-04
PCT/JP2008/060317 WO2009004891A1 (en) 2007-07-04 2008-06-04 Interactive communiction system, communication terminal dveice used for interactive communiction, communication server, communication method and communication control program

Publications (1)

Publication Number Publication Date
JPWO2009004891A1 true JPWO2009004891A1 (en) 2010-08-26

Family

ID=40225946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009521561A Pending JPWO2009004891A1 (en) 2007-07-04 2008-06-04 Bidirectional communication system, communication terminal, communication server, communication method, and communication control program used in the bidirectional communication system

Country Status (2)

Country Link
JP (1) JPWO2009004891A1 (en)
WO (1) WO2009004891A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101808221A (en) * 2010-04-01 2010-08-18 中兴通讯股份有限公司 Subtitle remote control method and system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06225293A (en) * 1993-01-25 1994-08-12 Nippon Telegr & Teleph Corp <Ntt> Video communication system
JPH0923394A (en) * 1995-07-07 1997-01-21 Sony Corp Method and device for encoding, method and device for decoding, and recording medium
JPH09135427A (en) * 1995-11-10 1997-05-20 Sharp Corp Television camera equipment
JPH11355747A (en) * 1998-06-10 1999-12-24 Nec Corp Video/sound communication equipment and video conference equipment using the same equipment
JP2004007172A (en) * 2002-05-31 2004-01-08 Sony Corp Information distributing system, device and method, information terminal equipment and information processing method, recording medium and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06225293A (en) * 1993-01-25 1994-08-12 Nippon Telegr & Teleph Corp <Ntt> Video communication system
JPH0923394A (en) * 1995-07-07 1997-01-21 Sony Corp Method and device for encoding, method and device for decoding, and recording medium
JPH09135427A (en) * 1995-11-10 1997-05-20 Sharp Corp Television camera equipment
JPH11355747A (en) * 1998-06-10 1999-12-24 Nec Corp Video/sound communication equipment and video conference equipment using the same equipment
JP2004007172A (en) * 2002-05-31 2004-01-08 Sony Corp Information distributing system, device and method, information terminal equipment and information processing method, recording medium and program

Also Published As

Publication number Publication date
WO2009004891A1 (en) 2009-01-08

Similar Documents

Publication Publication Date Title
US5453780A (en) Continous presence video signal combiner
US8228363B2 (en) Method and system for conducting continuous presence conferences
CN102281391B (en) Camera chain, video choice device and video system of selection
JP4384170B2 (en) How to achieve multi-screen
KR20100124811A (en) Server device, content distribution method, and program
WO2008131644A1 (en) A method, device and system for realizing picture switching in the video service
KR20100122518A (en) Gateway device, method, and program
JP2009505589A (en) Picture-in-picture processing for video telephony
JP2006067124A (en) Method and device for switching image encoded data, system, and program
KR100606785B1 (en) Synchronization method of video and iamge data in system for providing remote multimedia service through network
JP5193026B2 (en) Video distribution system and conversion device
JPH1042261A (en) Text overlay to compression area video image for multimedia communication system
KR101641184B1 (en) Method for processing and mixing multiple feed videos for video conference, video conference terminal apparatus, video conference server and video conference system using the same
KR20110067972A (en) The system and method of inernet settop-box including wideband voice internet telephone
KR101100458B1 (en) Content distribution system, conversion device, and content distribution method for use therein
EP1230802B1 (en) Mpeg-4 video specific control packet for providing a customized set of coding tools
KR20100024505A (en) Conversion device, distribution system, distribution method, and program
JPWO2009004891A1 (en) Bidirectional communication system, communication terminal, communication server, communication method, and communication control program used in the bidirectional communication system
WO2010027082A1 (en) Conference server, video conference system, method, and program
JP2002290973A (en) Multimedia communication equipment
JP2005045666A (en) Transcoder
JP5928561B2 (en) Camera system, video selection device, and video selection method
KR20090132627A (en) Content distribution system, content distribution method, and translator for use in them
JPWO2009017105A1 (en) Communication terminal, distribution system, conversion method, and program
CN103875241B (en) For the method and apparatus of the treatment interference when digital picture time series is transmitted

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120807