JP2012156820A - Video communication system, and operation method of the same - Google Patents
Video communication system, and operation method of the same Download PDFInfo
- Publication number
- JP2012156820A JP2012156820A JP2011014719A JP2011014719A JP2012156820A JP 2012156820 A JP2012156820 A JP 2012156820A JP 2011014719 A JP2011014719 A JP 2011014719A JP 2011014719 A JP2011014719 A JP 2011014719A JP 2012156820 A JP2012156820 A JP 2012156820A
- Authority
- JP
- Japan
- Prior art keywords
- video
- communication terminal
- video communication
- image
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、映像通信端末間で映像を送受信する映像コミュニケーションシステムに関し、特に、各映像通信端末を使用するユーザ間の意思疎通を円滑化する映像コミュニケーションシステム及びその作動方法に関する。 The present invention relates to a video communication system that transmits and receives video between video communication terminals, and more particularly to a video communication system that facilitates communication between users who use each video communication terminal and an operation method thereof.
映像コミュニケーションシステムは、既に一般に普及しており、高価なビジネス向けテレビ会議システムだけでなく、一般向けの携帯電話を映像通信端末としたテレビ会議システムにも実装されるに至っている。 Video communication systems are already in widespread use and have been implemented not only in expensive business videoconferencing systems but also in videoconferencing systems using a general-purpose mobile phone as a video communication terminal.
映像コミュニケーションシステムの一般的な課題として、映像に映っている物体に対して、通常の対面での会話のように「あれ」「それ」といった指示語やジェスチャで指し示して話をすることが困難であることが挙げられる。この問題を解決するために、映像通信端末間で同一の映像を共有し、その共有された映像の中に映像通信端末のユーザが通信する映像中に図形を書き込み、映像と図形を重畳して表示可能なシステムも実用化されている(例えば、非特許文献1参照)。これらのシステムの多くはテレビ会議映像とは別に、ホワイトボードや電子ファイル、Webページ等の画面を各映像通信端末間で共有して書きこむものであるが、テレビ会議映像への図形の重畳も同様に技術的に可能である。 As a general problem of video communication systems, it is difficult to talk to objects shown in video by pointing to them with directives and gestures such as “that” and “it” like normal face-to-face conversations. There are some. In order to solve this problem, the same video is shared between video communication terminals, a graphic is written in the video that the user of the video communication terminal communicates in the shared video, and the video and the graphic are superimposed. A displayable system has also been put into practical use (for example, see Non-Patent Document 1). In many of these systems, screens such as whiteboards, electronic files, and web pages are shared and written between video communication terminals separately from video conference video, but graphics are superimposed on video conference video as well. Technically possible.
映像への図形の重畳表示機能を携帯電話等の移動端末のテレビ電話に応用することで、従来のテレビ会議の場だけでない様々な場面での会話の円滑化に役立つと考えられるが、そのためには次のような課題が存在する。 By applying the graphic superimposition display function to the videophone of a mobile terminal such as a mobile phone, it is thought that it will be useful for facilitating the conversation in various scenes, not only in the place of the conventional videoconference. The following issues exist.
多くの移動端末は手で持って使うために手ぶれが大きく、重畳した図形の映像中の位置が、意図した場所からずれてしまうという課題がある。前述した非特許文献1の技術のような企業向けのテレビ会議システムでは、映像に利用するためのカメラは固定されていることが基本であり、映像に撮影される被写体(対象の物体)も動きは少ない。一方、カメラ付き移動端末を映像通信端末として利用することを考えると、カメラが頻繁に移動するだけでなく、屋外などの場面では映像中の物体についても動きが多くなる。したがって、例えばある瞬間に映像中の中心部に映っていた物体に矢印を書き込んだとしても、その物体が次の瞬間には映像中の別の場所に表示されているということが十分に起こり得る。このような状況で、矢印の位置を元の映像の中心部に固定したままでは、矢印が指す物体が変わってしまい、矢印の意味がなくなってしまうということが起こり得る。 Many mobile terminals have a large amount of camera shake because they are used by hand, and there is a problem that the position of the superimposed graphic in the video is shifted from the intended location. In the video conference system for enterprises such as the technology of Non-Patent Document 1 described above, the camera used for the video is basically fixed, and the subject (target object) captured in the video also moves. There are few. On the other hand, considering the use of a mobile terminal with a camera as a video communication terminal, not only does the camera move frequently, but also the movement of objects in the video increases in scenes such as outdoors. Thus, for example, even if an arrow is written on an object that was reflected in the center of the image at a certain moment, it can be sufficiently that the object is displayed at a different location in the image at the next moment. . In such a situation, if the position of the arrow is fixed at the center of the original image, the object pointed to by the arrow may change, and the meaning of the arrow may be lost.
さらに、非特許文献1のテレビ会議システムでは、業務用の固定端末を映像通信端末として利用するため十分な処理能力を具備できるが、移動端末は比較的処理能力が限定されることが多い。このため、移動端末で図形の重畳等の高負荷な処理を実行できないという問題も想定される。 Furthermore, although the video conference system of Non-Patent Document 1 can be provided with sufficient processing capability to use a business fixed terminal as a video communication terminal, mobile terminals are often relatively limited in processing capability. For this reason, the problem that a high load process, such as a superimposition of a figure, cannot be performed with a mobile terminal is also assumed.
また、図形の重畳等の高負荷な処理を実現するためには、特別な専用のソフトウェアが必要となるため、市販の移動端末をそのまま利用できないことが想定され、テレビ会議システム専用の移動端末や専用のソフトウェアをそれぞれの映像通信端末に用意することは、システムのコストの増大、ユーザ利便性等の問題が生じる。 Also, in order to realize high-load processing such as superimposing graphics, special dedicated software is required, so it is assumed that a commercially available mobile terminal cannot be used as it is, Providing dedicated software for each video communication terminal causes problems such as an increase in system cost and user convenience.
そこで、本発明は、上述の問題を鑑みて為されたものであり、各映像通信端末を使用するユーザ間の意思疎通を円滑化する映像コミュニケーションシステム及びその作動方法を提供することにある。 Accordingly, the present invention has been made in view of the above-described problems, and it is an object of the present invention to provide a video communication system that facilitates communication between users who use each video communication terminal and an operating method thereof.
本発明に係る映像コミュニケーションシステムは、従来のテレビ会議システムとは異なり、各映像通信端末を使用するユーザ間の意思疎通を円滑化するために、映像通信端末から提供される原映像に所定の図形を重畳した合成映像を生成及び提供する映像中継サーバを設け、各映像通信端末は、映像中継サーバを介して映像コミュニケーションを実現する構成とする。従って、本発明に係る映像コミュニケーションシステムでは、各映像通信端末が重畳すべき図形やその座標位置を指定するやり方を主題とするものではなく、各映像通信端末によって重畳すべき図形やその座標位置を指定された際に、映像中継サーバが合成映像を生成及び提供するようにしたことに主題があるため、従来からのテレビ会議システムとは技術的に区別されるべきことに留意する。 The video communication system according to the present invention is different from the conventional video conference system in that a predetermined figure is added to the original video provided from the video communication terminal in order to facilitate communication between users who use each video communication terminal. A video relay server that generates and provides a composite video on which is superimposed is provided, and each video communication terminal is configured to realize video communication via the video relay server. Therefore, in the video communication system according to the present invention, the subject of each video communication terminal is not the method of designating the graphic to be superimposed and its coordinate position, but the graphic to be superimposed by each video communication terminal and its coordinate position. It should be noted that the video relay server, when specified, is technically distinct from conventional video conferencing systems due to the subject matter of generating and providing composite video.
即ち、本発明による第1態様の映像コミュニケーションシステムは、2つ以上の映像通信端末及び映像中継サーバからなる映像コミュニケーションシステムであって、第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備え、第2映像通信端末は、当該原映像中で指定される注目物体の全部又は一部を含む注目物体画像を生成する注目物体画像生成部と、該注目物体画像を前記映像中継サーバに送信する注目物体画像送信部とを備え、前記映像中継サーバは、前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出する注目物体検出部と、前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成する合成映像生成部と、該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信する合成映像送信部と、を備えることを特徴とする。これにより、第1映像通信端末における処理負担を軽減させつつ各映像通信端末間の映像コミュニケーションを実現することができる。 That is, the video communication system according to the first aspect of the present invention is a video communication system including two or more video communication terminals and a video relay server, and the first video communication terminal transmits the original video to the video relay server. The second video communication terminal includes an attention object image generation unit that generates an attention object image including all or a part of the attention object specified in the original image; and A target object image transmission unit for transmitting to the video relay server, and the video relay server collates the target image with the original video received from the first video communication terminal, and the target object is reflected in the original video. A target object detection unit for detecting a target object coordinate indicating a position of the target object, and a composite image by combining a predetermined figure with the position of the target object in the original video based on the target object coordinate And generating synthesized image generating unit, the combined image, characterized in that it comprises a combined image transmission unit to be transmitted to the first video communication terminal or the second video communication terminal. Thereby, the video communication between each video communication terminal is realizable, reducing the processing burden in a 1st video communication terminal.
また、本発明による第1態様の映像コミュニケーションシステムにおいて、前記合成映像送信部は、前記合成映像を前記第1映像通信端末及び前記第2映像通信端末の双方に送信する手段を有することを特徴とする。これにより、第2映像通信端末は、第1映像通信端末と合成映像を共有することができる。 In the video communication system according to the first aspect of the present invention, the composite video transmission unit includes means for transmitting the composite video to both the first video communication terminal and the second video communication terminal. To do. Thereby, the second video communication terminal can share the composite video with the first video communication terminal.
また、本発明による第1態様の映像コミュニケーションシステムにおいて、前記第2映像通信端末の注目物体画像生成部は、当該合成映像中で指定される注目物体の全部又は一部を含む注目物体画像を生成する手段を有することを特徴とする。これにより、第2映像通信端末は、合成映像に対して更に注目物体を指定できるようになる。 In the video communication system according to the first aspect of the present invention, the target object image generation unit of the second video communication terminal generates a target object image including all or part of the target object specified in the composite video. It has the means to do. As a result, the second video communication terminal can further specify the object of interest for the synthesized video.
さらに、本発明による第2態様の映像コミュニケーションシステムは、2つ以上の映像通信端末及び映像中継サーバからなる映像コミュニケーションシステムであって、第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備え、第2映像通信端末は、当該原映像中で指定される注目領域を示す注目領域座標の情報を生成する注目領域座標指定処理部と、該注目領域座標の情報を前記映像中継サーバに送信する注目領域座標送信部とを備え、前記映像中継サーバは、前記第2映像通信端末から受信した注目領域座標の情報を基に、当該原映像中で注目物体の全部又は一部を含む部分画像を抽出して注目物体画像として生成する注目物体画像抽出部と、前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出する注目物体検出部と、前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成する合成映像生成部と、該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信する合成映像送信部と、を備えることを特徴とする。これにより、第1映像通信端末における処理負担を軽減させつつ各映像通信端末間の映像コミュニケーションを実現することができる。 Furthermore, the video communication system according to the second aspect of the present invention is a video communication system including two or more video communication terminals and a video relay server, and the first video communication terminal transmits the original video to the video relay server. The second video communication terminal includes an attention area coordinate designation processing section for generating attention area coordinate information indicating an attention area designated in the original image; and the information on the attention area coordinates. A region-of-interest coordinate transmission unit that transmits the image to the video relay server, and the video relay server includes all or one of the objects of interest in the original video based on the information of the region-of-interest coordinates received from the second video communication terminal. A target object image extraction unit that extracts a partial image including a part and generates a target object image, and collates the target image with the original image received from the first video communication terminal. A target object detection unit that detects a target object coordinate indicating a position where the target object is reflected in the original video, and a predetermined figure is synthesized at the position of the target object in the original video based on the target object coordinate. A composite video generation unit that generates a composite video, and a composite video transmission unit that transmits the composite video to the first video communication terminal or the second video communication terminal. Thereby, the video communication between each video communication terminal is realizable, reducing the processing burden in a 1st video communication terminal.
また、本発明による第2態様の映像コミュニケーションシステムにおいて、前記合成映像送信部は、前記合成映像を前記第1映像通信端末及び前記第2映像通信端末の双方に送信する手段を有することを特徴とする。これにより、第2映像通信端末は、第1映像通信端末と合成映像を共有することができる。 In the video communication system according to the second aspect of the present invention, the composite video transmission unit includes means for transmitting the composite video to both the first video communication terminal and the second video communication terminal. To do. Thereby, the second video communication terminal can share the composite video with the first video communication terminal.
また、本発明による第2態様の映像コミュニケーションシステムにおいて、前記第2映像通信端末の注目領域座標指定処理部は、当該合成映像中で指定される注目領域を示す注目領域座標の情報を生成する手段を有することを特徴とする。これにより、第2映像通信端末は、合成映像に対して更に注目物体を指定できるようになる。 Further, in the video communication system according to the second aspect of the present invention, the attention area coordinate designation processing unit of the second video communication terminal generates information of attention area coordinates indicating the attention area designated in the synthesized video. It is characterized by having. As a result, the second video communication terminal can further specify the object of interest for the synthesized video.
また、本発明による第1態様の映像コミュニケーションシステムにおける作動方法は、2つ以上の映像通信端末及び映像中継サーバからなる映像コミュニケーションシステムにおける映像中継サーバの作動方法であって、第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備えており、第2映像通信端末は、当該原映像中で指定される注目物体の全部又は一部を含む注目物体画像を生成する注目物体画像生成部と、該注目物体画像を前記映像中継サーバに送信する注目物体画像送信部とを備えており、前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出するステップと、前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成するステップと、該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信するステップと、を含むことを特徴とする。 The operating method in the video communication system according to the first aspect of the present invention is an operating method of the video relay server in the video communication system comprising two or more video communication terminals and a video relay server, wherein the first video communication terminal is The second video communication terminal includes an attention object image that includes all or part of the attention object specified in the original image, and includes an original image transmission unit that transmits the original image to the image relay server. An object image generation unit, and a target object image transmission unit that transmits the target object image to the video relay server. The source image received from the first video communication terminal is collated with the target object image, and Detecting a target object coordinate indicating a position where the target object is reflected in the original video; and a position of the target object in the original video based on the target object coordinate. Generating a synthesized and combined image a predetermined shape to, the synthetic video image, characterized in that it comprises the steps of: transmitting to the first video communication terminal or the second video communication terminal.
また、本発明による第2態様の映像コミュニケーションシステムにおける作動方法は、2つ以上の映像通信端末及び映像中継サーバからなる映像コミュニケーションシステムにおける映像中継サーバの作動方法であって、第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備えており、第2映像通信端末は、当該原映像中で指定される注目領域を示す注目領域座標の情報を生成する注目領域座標指定処理部と、該注目領域座標の情報を前記映像中継サーバに送信する注目領域座標送信部とを備えており、前記第2映像通信端末から受信した注目領域座標の情報を基に、当該原映像中で注目物体の全部又は一部を含む部分画像を抽出して注目物体画像として生成するステップと、前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出するステップと、前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成するステップと、該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信するステップと、を含むことを特徴とする。 The operating method in the video communication system according to the second aspect of the present invention is an operating method of a video relay server in a video communication system comprising two or more video communication terminals and a video relay server, wherein the first video communication terminal The second video communication terminal includes an original video transmission unit that transmits the original video to the video relay server, and the second video communication terminal generates attention region coordinate designation that generates attention region coordinate information indicating the attention region designated in the original video A processing unit, and a region-of-interest coordinate transmission unit that transmits information on the region-of-interest coordinates to the video relay server, and based on the information on the region-of-interest coordinates received from the second video communication terminal, the original video Extracting a partial image including all or part of the object of interest in the image and generating it as the object of interest image; and an original image received from the first video communication terminal Collating the target object image and detecting a target object coordinate indicating a position where the target object is reflected in the original video; and a predetermined position at a position of the target object in the original video based on the target object coordinate. The method includes a step of generating a composite video by combining figures and a step of transmitting the composite video to the first video communication terminal or the second video communication terminal.
本発明によれば、映像中継サーバによって映像中に図形を重畳する際に、映像通信端末によって指定された映像中の対象物体に対して予め定めた図形を重畳するため、映像中の物体の位置が動いても、当該図形を対象物体に追随させた合成映像を提供することができるようになる。 According to the present invention, when a graphic is superimposed on a video by the video relay server, a predetermined graphic is superimposed on the target object in the video specified by the video communication terminal. Even if is moved, it is possible to provide a composite image in which the figure follows the target object.
また、図形を対象物体に追随するよう重畳した合成映像の生成及び提供の処理は、各映像通信端末ではなくネットワーク上の映像中継サーバが行うようにしたため、処理能力の低い映像通信端末をも本発明の映像コミュニケーションシステムに利用可能となる。 In addition, since the process of generating and providing the composite video that superimposes the figure to follow the target object is performed not by each video communication terminal but by the video relay server on the network, the video communication terminal with low processing capability is also used in this case. It can be used for the video communication system of the invention.
また、映像通信端末からの映像送受信方式として既設の標準的なものを利用することが可能となり、標準的な映像通信端末及びそのプログラムを専用化することなく利用することができるようになる。 In addition, an existing standard method can be used as a video transmission / reception method from the video communication terminal, and the standard video communication terminal and its program can be used without being dedicated.
したがって、本発明によれば、映像中継サーバによって映像の中継と図形の合成を行なうようにしたので、性能が低く標準的な映像通信機能しか持たない映像通信端末を用いた、既存のテレビ電話システムの利便性をより高めた映像コミュニケーションシステムを提供できるようになる。 Therefore, according to the present invention, the video relay server and the video composition are performed by the video relay server, so that an existing videophone system using a video communication terminal with low performance and only a standard video communication function is used. A video communication system with improved convenience can be provided.
以下、図面を参照して、本発明による各実施形態の映像コミュニケーションシステムについて説明する。まず、本発明に係る映像コミュニケーションシステムの包括的な構成を説明し、より具体的な各実施形態については詳細に後述する。 The video communication system of each embodiment according to the present invention will be described below with reference to the drawings. First, a comprehensive configuration of the video communication system according to the present invention will be described, and more specific embodiments will be described later in detail.
図1は、本発明に係る映像コミュニケーションシステムの構成例を示す図である。本発明に係る映像コミュニケーションシステムは、2つ以上の映像通信端末と、各映像通信端末の映像及び音声についてネットワークを通じて中継する映像中継サーバから構成される。以下の説明では、図1に示すように、代表的に、ユーザAが利用する第1映像通信端末20と、ユーザBが利用する第2映像通信端末30との間で、映像中継サーバ10を介して映像コミュニケーションを実現する例について説明する。映像中継サーバ10は、1つのコンピュータで実現可能であるが、第1映像通信端末20と第2映像通信端末30が遠隔的にネットワークを通じて通信する例を説明するため、説明の便宜上、映像合成ユニット10aと多地点接続ユニット10bからなるものとして説明する。
FIG. 1 is a diagram showing a configuration example of a video communication system according to the present invention. The video communication system according to the present invention includes two or more video communication terminals and a video relay server that relays video and audio of each video communication terminal through a network. In the following description, as shown in FIG. 1, the
第1映像通信端末20は、例えば、既存のカメラ付き移動端末としてユーザAが利用する端末である。ユーザAは、このようなカメラ付き移動端末を利用して内臓カメラで撮像した原映像を、映像中継サーバ10を介して第2映像通信端末30に送信する機能を有する。一方、第1映像通信端末20は、映像中継サーバ10から、この原映像に対して予め定めた図形を重畳した合成映像を受信して、自身のディスプレイのモニタ画面にてユーザAが視聴可能な表示再生機能を有する。
The first
第2映像通信端末30は、例えば、既存のパーソナルコンピュータとしてユーザBが利用する端末である。このパーソナルコンピュータは、マウスを利用するものやタッチパネル形式のものでもよいし、携帯端末でもよい。第2映像通信端末30は、映像中継サーバ10から、第1映像通信端末20が視聴する合成映像を同様に受信して、自身のディスプレイのモニタ画面にてユーザBが視聴可能な表示再生機能を有する。さらに、第2映像通信端末30は、原映像又は合成映像内でユーザBが注目する物体を指定して、その指定された注目物体画像(第1実施形態)又は注目領域座標(第2実施形態)の情報を、映像中継サーバ10に送信する機能を有し、映像中継サーバ10に対して原映像からの所定図形を重畳した合成映像(又は受信した合成映像からの所定図形を重畳した更なる合成映像)を生成可能にする。原映像又は合成映像内でユーザBが注目する物体を指定するユーザインターフェースは、例えばマウスやタッチパネル形式のものが好適である。
The second
ここで、第1映像通信端末20と第2映像通信端末30の双方は、既存のテレビ会議システムと同様に、多地点接続ユニット10bを経由して映像コミュニケーションを実現する機能を有しているものとする。例えば、多地点接続ユニット10bは、RTP(Real-time Transport Protocol)通信用のサーバで構成することができる。
Here, both the 1st
映像中継サーバ10は、この多地点接続ユニット10bと相互接続される、原映像に対して所定図形を重畳した合成映像(又は第2映像通信端末30から前回指定されて生成した合成映像に対して所定図形を重畳した更なる合成映像)の生成及び提供を行う映像合成ユニット10aを備える。
The
つまり、映像中継サーバ10は、第1映像通信端末20からは原映像を受信し、第2映像通信端末30から対象物体の指定がある場合に、第2映像通信端末30から原映像に対する注目物体画像又はその注目物体の領域を示す注目領域座標の情報を受信し、指定された対象物体の画像領域の抽出を行なって、所定の図形を各対象物体に割り当て重畳した合成映像を生成して、第1映像通信端末20及び/又は第2映像通信端末30に送信する。尚、合成映像の共有の観点からは、第1映像通信端末20及び第2映像通信端末30の双方に合成映像が送信されることが好ましく、映像中継サーバ10は、第1映像通信端末20から原映像を受信し、第2映像通信端末30からの対象物体の指定がなされるまで、当該原映像を合成映像として第1映像通信端末20及び第2映像通信端末30の双方に送信する。
That is, the
ここで、重畳される所定の図形は、映像合成ユニット10aが予め用意したものであり、例えば、「丸」や「矢印」などの図形である。第2映像通信端末30からの指定回数に応じて重畳する図形を順次変化させる態様や、第2映像通信端末30から原映像に対する注目物体画像又はその注目物体の領域を示す注目領域座標の情報に対して、図形を指定する補助情報(例えば、「丸」であればフラグ1、「矢印」であればフラグ2、「吹き出し図」であればフラグ3など)を取得するような態様が考えられる。この場合、図形選択を行うタブレット形式のアプリケーションソフトウェアを第2映像通信端末30に設けるのが好適である。
Here, the predetermined graphic to be superimposed is prepared in advance by the
また、映像合成ユニット10aは、第2映像通信端末30から原映像に対する注目物体画像又はその注目物体の領域を示す注目領域座標の情報に対して、指定の対象物体を有する原映像又は合成映像から、既存のオブジェクト抽出処理(例えば、MPEG−4のオブジェクト抽出技法が知られている)を実行し、合成映像の送出後に繰りかえし第1映像通信端末20から原映像を受信した場合も、第2映像通信端末30からの対象物体の更なる指定がなされるまで、当該原映像中の指定の対象物体を追従した位置に所定の図形を重畳した合成映像を生成して提供する。繰り返し得られる原映像中から指定の対象物体が消える又は隠れる場合には、当該図形の重畳をなくした合成映像を提供するように構成することができる。
In addition, the
従って、本発明に係る映像コミュニケーションシステムでは、以下のような手順の利用態様が想定される。
(1)ユーザAとユーザBは、それぞれの映像通信端末20,30を利用して多地点接続ユニット10bを介して映像コミュニケーションを行なう。
(2)ユーザAは、第1映像通信端末20の内蔵カメラで周囲の状況を撮影し原映像として多地点接続ユニット10bに送信する。
(3)ユーザBは、第2映像通信端末30で合成映像に関して視聴しつつ、会話の中で注目すべき物体が映ったときに、その物体を第2映像通信端末30の画面上で指定する。
(4)第2映像通信端末30は、ユーザBによって指定された、合成映像から切り出された注目物体画像又は画面上で指定された場所を示す注目領域座標の情報を映像合成ユニット10aに送信する。
(5)映像合成ユニット10aは、注目物体画像(第2映像通信端末30から受信したもの、若しくは、同じく受信した注目領域座標に基づき原映像等から切り出された部分画像)と原映像を照合し、原映像の中で注目物体が存在する場所を検出する。
(6)映像合成ユニット10aは、検出した場所に所定の図形を合成し、合成映像として多地点接続ユニットを介して各映像通信端末20,30に送信する。
従って、各映像通信端末20,30では、受信した合成映像を表示し、各ユーザA,Bは、ユーザBが指定した物体に関連付けられた図形が重畳された合成映像を視聴可能となる。
Accordingly, in the video communication system according to the present invention, the following procedure usage modes are assumed.
(1) User A and User B perform video communication via the
(2) User A captures the surrounding situation with the built-in camera of the first
(3) While viewing the synthesized video on the second
(4) The second
(5) The
(6) The
Accordingly, each
以下、より具体的に、図2〜図4を参照して、本発明による第1実施形態の映像コミュニケーションシステムについて説明する。図2は、本発明による第1実施形態の映像コミュニケーションシステムの構成を示す図である。図3は、本発明による第1実施形態の映像コミュニケーションシステムのブロック図である。図4は、本発明による第1実施形態の映像コミュニケーションシステムの動作フロー図である。 Hereinafter, the video communication system according to the first embodiment of the present invention will be described more specifically with reference to FIGS. FIG. 2 is a diagram showing the configuration of the video communication system according to the first embodiment of the present invention. FIG. 3 is a block diagram of the video communication system according to the first embodiment of the present invention. FIG. 4 is an operation flowchart of the video communication system according to the first embodiment of the present invention.
〔第1実施形態〕
図2を参照するに、本発明による第1実施形態の映像コミュニケーションシステムは、原映像を第1映像通信端末20にて生成して映像中継サーバ10に送信し、映像中継サーバ10では、第2映像通信端末30から送られてきた注目物体画像と、第1映像通信端末20から逐次送信されてくる原映像を照合して原映像中の注目物体の位置を検出し、この検出位置に図形を重畳するように構成される。より具体的には、実施形態の映像コミュニケーションシステムは、映像中継サーバ10と、第1映像通信端末20と、第2映像通信端末30とを備える。映像中継サーバ10は、注目物体検出部101と、合成映像生成部102と、合成映像送信部103とを備える。第1映像通信端末20は、原映像送信部201を有する。第2映像通信端末30は、注目物体画像生成部301と、注目物体画像送信部302とを備える。尚、本発明に係る主要な部分のみを図2に示しており、画像の表示再生機能、通信機能、ユーザインターフェース機能等の既存の映像通信端末が備える機能を排除するものではないことに留意する。
[First Embodiment]
Referring to FIG. 2, in the video communication system according to the first embodiment of the present invention, an original video is generated by the first
尚、本実施形態に係る映像中継サーバ10は、1つ以上のコンピュータとして構成することができ、映像中継サーバ10の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの所定の記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
Note that the
第1映像通信端末20における原映像送信部201は、ユーザAによって内臓カメラを操作して、その場の状況を撮像した原映像を映像中継サーバ10に送信する機能部である。原映像は、動画でも静止画でもよいが、以下の説明では、動画を例に説明する。
The original
第2映像通信端末30における注目物体画像生成部301は、ユーザBによって原映像が閲覧され、その中で注目する領域をマウスクリックなどの方法で指定された部分画像を切り出し、注目物体画像として生成する機能部である。つまり、注目物体画像生成部301は、ユーザBによって指定が行われた瞬間のフレーム画像を原映像中から取得し、注目領域座標に基づきフレーム画像の一部を注目物体画像として切り出す。この部分画像は、正確な注目物体を切り出す必要はなく、当該注目物体の特定に必要な規定サイズ(例えば、フレーム画像の1/50サイズ)で切り出される。尚、フレーム画像の全部を注目物体画像として指定してもよいことは勿論である。
An attention object
第2映像通信端末30における注目物体画像送信部302は、注目物体画像生成部301によって生成された注目物体画像を映像中継サーバ10に送信する機能部である。
The target object
映像中継サーバ10における注目物体検出部101は、第2映像通信端末30から受信した注目物体画像と受信して保持した原映像を照合し、原映像の中で当該注目物体が存在する場所を「注目物体座標」として検出する機能部である。ここで、原映像の中で当該注目物体が存在する場所を照合して検出する技法は、既存のオブジェクト抽出技法を用いることができるが、単純な画素値マッチングで特定してもよい。
The target
映像中継サーバ10における合成映像生成部102は、注目物体検出部101によって検出した場所に所定の図形を合成し、合成映像として生成する機能部である。
The synthesized
映像中継サーバ10における合成映像送信部103は、合成映像生成部102によって生成した合成映像を各映像通信端末20,30に送信する機能部である。
The composite
図3及び図4には、映像中継サーバ10を映像合成ユニット10aと多地点接続ユニット10bからなるものとして構成した、より具体的な例が示されている。
3 and 4 show more specific examples in which the
図3を参照しながら、図4を説明するに、まず、映像中継サーバ10の多地点接続ユニット10bは、第1映像端末20と第2映像端末30との間での映像・音声コミュニケーションのために、RTP通信を確立している(S1)。
4 will be described with reference to FIG. 3. First, the
第1映像端末20は、ユーザAの操作によってカメラ撮影部2011によって原映像を取得し、エンコード部2012によってこの原映像を所定の符号化方式(例えば、MPEG−4)で符号化し、RTP送信部2013によってRTP通信により多地点接続ユニット10bに送信する(S2)。ここで、第2映像通信端末30は、原映像の待ち受け状態にある(S3)。
The
多地点接続ユニット10bは、RTP受信部1013によって第1映像端末20から符号化された原映像を受信するとともに、トランスコード部1016によって映像・音声コミュニケーションに適合した所定のビットレートに変換し、RTP送信部1017によって第2映像通信端末30に転送する(S4)。尚、多地点接続ユニット10bは、第1映像端末20から受信した符号化された原映像を、トランスコード部1014によって映像合成ユニット10aとのRTP通信に適合した所定のビットレートに変換し、RTP送信部1015によって映像合成ユニット10aに転送する。映像合成ユニット10aに転送された当該符号化された原映像は、RTP受信・デコード部1018によって受信及び復号され、注目物体検出部101に送出される。
The
第2映像通信端末30は、RTP受信・デコード部3011によって、多地点接続ユニット10bから、符号化された原映像を受信して復号し、ディスプレイ表示部3014によって当該原映像をモニタ画面に表示するとともに(S5)、注目物体画像生成部301に送出する。注目物体画像生成部301は、ユーザ入力部3013を介してユーザBによって指定された原映像中の1つの映像フレームに該当する部分画像を抽出する部分画像抽出部3012を有し、この部分画像抽出部3012によって当該部分画像を注目物体画像として生成し、注目物体画像送信部302に送出する(S6)。注目物体画像送信部302は、ネットワークを通じて注目物体画像を映像合成ユニット10aに送信するフレーム画像送信部3021を有し、フレーム画像送信部3021は、ユーザBによって指定された原映像中の1つの映像フレームに該当する注目物体画像を映像合成ユニット10aのフレーム画像受信部1012に送信する(S7)。
The second
映像合成ユニット10aの注目物体検出部101は、フレーム画像受信部1012を介して受信した注目物体画像と、第1映像端末20から受信した原映像とを照合する映像照合認識処理部1011を有し、映像照合認識処理部1011によって、原映像における注目物体の画像領域を特定する(S8)。さらに、映像合成ユニット10aは、原映像に当該特定した注目物体の注目画像座標の位置に対して所定の図形を重畳して合成映像を生成する合成映像生成部102を有し、合成映像生成部102は、RTP受信・デコード部1018から得られる原映像に対して、所定の図形を記憶した記憶部(図示せず)から注目物体に割り当てられる所定の図形の情報を取得して重畳する映像合成処理を実行する映像合成処理部1021を有する(S9)。尚、第2映像通信端末30は、1つ以上の注目物体を指定し、それぞれの注目物体を識別する識別子と、当該識別子に対応する図形を選択して指定するためのフラグを、当該部分画像ともに送信するように構成することができ、この場合、映像合成ユニット10aの注目物体検出部101及び合成映像生成部102は、当該識別子で識別される注目物体に、当該フラグで指定される図形を記憶部(図示せず)から注目物体ごとに取得して重畳するように構成することもできる。
The target
映像合成ユニット10aのエンコード・RTP送信部1031は、合成映像生成部102から得られる合成映像を符号化してRTP通信で多地点接続ユニット10bに送出する。多地点接続ユニット10bは、RTP受信部1032で合成映像を受信して、トランスコード部1033によって映像・音声コミュニケーションに適合した所定のビットレートに変換し、RTP送信部1034によって第1映像通信端末20及び第2映像通信端末30に転送する(S10)。従って、エンコード・RTP送信部1031、RTP受信部1032、トランスコード部1033及びRTP送信部1034は、合成映像を映像通信端末20に送信する合成映像送信部103として機能する。尚、合成映像送信部103は、トランスコード部1016及びRTP送信部1017によって、合成映像を映像通信端末30に送信することもできる。
The encoding /
第1映像通信端末20は、RTP受信・デコード部2014によって当該合成映像を受信して復号し、ディスプレイ表示部2015によって当該合成映像をモニタ画面に表示する(S11)。同様に、第2映像通信端末30は、RTP受信・デコード部3011によって当該合成映像を受信して復号し、ディスプレイ表示部3014によって当該合成映像をモニタ画面に表示する(S12)。
The first
このように、本実施形態の映像コミュニケーションシステムによれば、第1映像通信端末20と第2映像通信端末30との間でやり取りされる映像中、第2映像通信端末30のユーザBが図形を重畳する対象として指定した注目物体の画像領域を照合によって判別して図形を重畳するように構成したため、従来では図形を描画する際に描画する位置を指定していたため手ぶれや物体の移動より重畳した図形がずれてしまう問題を解決することができる。
As described above, according to the video communication system of the present embodiment, the user B of the second
また、本実施形態の映像コミュニケーションシステムによれば、第1映像通信端末20から原映像を映像中継サーバ10に送信して、図形の重畳を映像中継サーバ20で実行するように構成したため、第1映像通信端末20として利用する移動端末の処理能力不足に係る問題を解決することができる。
Further, according to the video communication system of the present embodiment, the first
また、本実施形態の映像コミュニケーションシステムによれば、第1映像通信端末20に特別な専用のハードウェアやソフトウェアを使用する必要が無くなり、つまり、第1映像通信端末20(もしくは第2映像通信端末30)と映像中継サーバ20の間の映像送受信の実装方式として、通常の映像コミュニケーションと同様の方式を採用すればよくなり、過大なコスト増加等の問題を生じることなく実現可能となる。
Further, according to the video communication system of the present embodiment, it is not necessary to use special dedicated hardware or software for the first
次に、図5〜図7を参照して、本発明による第2実施形態の映像コミュニケーションシステムについて説明する。図5は、本発明による第2実施形態の映像コミュニケーションシステムの構成を示す図である。図6は、本発明による第2実施形態の映像コミュニケーションシステムのブロック図である。図7は、本発明による第2実施形態の映像コミュニケーションシステムの動作フロー図である。尚、第1実施形態と同様な構成要素には同一の参照番号を付している。 Next, a video communication system according to a second embodiment of the present invention will be described with reference to FIGS. FIG. 5 is a diagram showing a configuration of a video communication system according to the second embodiment of the present invention. FIG. 6 is a block diagram of a video communication system according to the second embodiment of the present invention. FIG. 7 is an operation flowchart of the video communication system according to the second embodiment of the present invention. In addition, the same reference number is attached | subjected to the component similar to 1st Embodiment.
〔第2実施形態〕
図5を参照するに、本発明による第2実施形態の映像コミュニケーションシステムは、原映像を第1映像通信端末20にて生成して映像中継サーバ10に送信し、図形を重畳するための注目物体が映像コミュニケーションシステムでやり取りされる映像中のどこに映っているかを、第2映像通信端末30にてユーザBが指定し、この指定場所を示す注目領域座標の情報を映像中継サーバ10に送信し、映像中継サーバ10は、この注目領域座標の情報を基に第1映像通信端末30から受信した原映像から注目物体画像を抽出し、抽出した注目物体画像と原映像を照合して原映像中の注目物体の位置を注目物体座標の情報として検出し、この検出位置に図形を重畳するように構成される。より具体的には、本実施形態の映像コミュニケーションシステムは、映像中継サーバ10と、第1映像通信端末20と、第2映像通信端末30とを備える。映像中継サーバ10は、注目物体検出部101と、合成映像生成部102と、合成映像送信部103と、注目物体画像抽出部104とを備える。第1映像通信端末20は、原映像送信部201を有する。第2映像通信端末30は、注目領域座標指定処理部303と、注目領域座標送信部304とを備える。尚、本発明に係る主要な部分のみを図5に示しており、画像の表示再生機能、通信機能、ユーザインターフェース機能等の既存の映像通信端末が備える機能を排除するものではないことに留意する。
[Second Embodiment]
Referring to FIG. 5, the video communication system according to the second embodiment of the present invention generates an original video at the first
第2実施形態では、第2映像通信端末30が、注目領域座標指定処理部303と、注目領域座標送信部304とを備える点と、映像中継サーバ10が、注目物体画像抽出部104を備える点で相違する。
In the second embodiment, the second
尚、本実施形態に係る映像中継サーバ10は、1つ以上のコンピュータとして構成することができ、映像中継サーバ10の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの所定の記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
Note that the
第1映像通信端末20における原映像送信部201は、ユーザAによって内臓カメラを操作して、その場の状況を撮像した原映像を映像中継サーバ10に送信する機能部である。原映像は、動画でも静止画でもよいが、以下の説明では、動画を例に説明する。
The original
第2映像通信端末30における注目領域座標指定処理部303は、ユーザBによって原映像が閲覧され、その中で注目する領域をマウスクリックなどの方法で指定された注目領域の座標を特定し、注目領域座標の情報として生成する機能部である。つまり、注目領域座標指定処理部303は、ユーザBによって指定が行われた瞬間のフレーム画像を原映像中から取得し、フレーム画像の一部を注目物体画像として切り出し可能な注目領域座標を指定する。この注目領域座標は、注目物体を囲む座標群とするか、又は1点を指定する座標とすることができ、この場合、映像中継サーバ10側で当該注目物体の特定に必要な規定サイズ(例えば、フレーム画像の1/50サイズ)で切り出される。
The attention area coordinate
第2映像通信端末30における注目領域座標送信部304は、注目領域座標指定処理部303によって生成された注目領域座標の情報を映像中継サーバ10に送信する機能部である。
The attention area coordinate
映像中継サーバ10における注目物体画像抽出部104は、第2映像通信端末30から取得した「注目領域座標」の情報を基に、原映像から注目物体画像を抽出し、注目物体検出部101に送出する。この注目物体画像の抽出は、例えば、注目領域座標の情報を重心位置とする注目物体の特定に必要な規定サイズ(例えば、フレーム画像の1/50サイズ)で切り出せばよい。
The target object image extraction unit 104 in the
映像中継サーバ10における注目物体検出部101は、注目物体画像抽出部104によって抽出した注目物体画像と受信して保持した原映像を照合し、原映像の中で当該注目物体が存在する場所を「注目物体座標」として検出する機能部である。ここで、原映像の中で当該注目物体が存在する場所を照合して検出する技法は、既存のオブジェクト抽出技法を用いることができるが、単純な画素値マッチングで特定してもよい。
The target
映像中継サーバ10における合成映像生成部102は、注目物体検出部101によって検出した場所に所定の図形を合成し、合成映像として生成する機能部である。
The synthesized
映像中継サーバ10における合成映像送信部103は、合成映像生成部102によって生成した合成映像を各映像通信端末20,30に送信する機能部である。
The composite
図6及び図7には、映像中継サーバ10を映像合成ユニット10aと多地点接続ユニット10bからなるものとして構成した、より具体的な例が示されている。
6 and 7 show more specific examples in which the
図6を参照しながら、図7を説明するに、まず、映像中継サーバ10の多地点接続ユニット10bは、第1映像端末20と第2映像端末30との間での映像・音声コミュニケーションのために、RTP通信を確立している(S21)。
7 will be described with reference to FIG. 6. First, the
第1映像端末20は、ユーザAの操作によってカメラ撮影部2011によって原映像を取得し、エンコード部2012によってこの原映像を所定の符号化方式(例えば、MPEG−4)で符号化し、RTP送信部201によってRTP通信により多地点接続ユニット10bに送信する(S22)。ここで、第2映像通信端末30は、原映像の待ち受け状態にある(S23)。
The
多地点接続ユニット10bは、RTP受信部1013によって第1映像端末20から符号化された原映像を受信して、トランスコード部1014及びRTP送信部1015経由で映像合成ユニット10aに送信され、最初に撮像された原映像については指定の注目領域座標がないことから、RTP受信部1032経由でこの原映像を映像合成ユニット10aによる合成映像として取得し、トランスコード部1033及びRTP送信部1034経由で第2映像通信端末30に転送する(S24)。
The
第2映像通信端末30は、RTP受信・デコード部3011によって、多地点接続ユニット10bから、符号化された原映像を受信して復号し、ディスプレイ表示部3014によって当該原映像をモニタ画面に表示する(S25)。注目領域座標指定処理部303は、 ユーザ入力部3031を介してユーザBによって指定された原映像中の1つの映像フレームに該当する部分画像を特定する注目領域座標の情報を生成し(S26)、注目領域座標送信部304に送出する。注目領域座標送信部304は、ネットワークを通じて注目領域座標の情報を映像合成ユニット10aに送信する座標送信部3021bを有し、座標送信部3021bは、ユーザBによって指定された原映像中の1つの映像フレームに該当する注目物体を特定するための注目領域座標の情報を映像合成ユニット10aの座標受信部1012bに送信する(S27)。
The second
映像合成ユニット10aの注目物体画像抽出部104は、第1映像端末20から受信した原映像から、注目領域座標の情報を基に部分画像を抽出する部分画像抽出部1041を有し、部分画像抽出部1041は、抽出した部分画像を注目物体画像として注目物体検出部101に送出し、注目物体検出部101は、注目物体画像抽出部104によって抽出した注目物体画像と、第1映像端末20から受信した原映像とを照合する映像照合認識処理部1011を有し、映像照合認識処理部1011によって、原映像における注目物体の注目画像座標を特定する(S28)。
The target object image extraction unit 104 of the
映像合成ユニット10aは、原映像に当該特定した注目物体の注目画像座標の位置に対して所定の図形を重畳して合成映像を生成する合成映像生成部102を有し、合成映像生成部102は、RTP受信・デコード部1018から得られる原映像に対して、所定の図形を記憶した記憶部(図示せず)から注目物体に割り当てられる所定の図形の情報を取得して重畳する映像合成処理を実行する映像合成処理部1021を有する(S29)。尚、第2映像通信端末30は、1つ以上の注目物体を指定する1つ以上の注目領域座標を特定する際に、それぞれの注目物体を識別する識別子と、当該識別子に対応する図形を選択して指定するためのフラグを、当該注目領域座標の情報ともに送信するように構成することができ、この場合、映像合成ユニット10aの注目物体検出部101及び合成映像生成部102は、当該識別子で識別される注目物体に、当該フラグで指定される図形を記憶部(図示せず)から注目物体ごとに取得して重畳するように構成することもできる。
The
映像合成ユニット10aのエンコード・RTP送信部1031は、合成映像生成部102から得られる合成映像を符号化してRTP通信で多地点接続ユニット10bに送出する。多地点接続ユニット10bは、RTP受信部1032で合成映像を受信して、トランスコード部1033によって映像・音声コミュニケーションに適合した所定のビットレートに変換し、RTP送信部1034によって第2映像通信端末30に転送するとともに、トランスコード部1016によって映像・音声コミュニケーションに適合した所定のビットレートに変換し、RTP送信部1017によって第1映像通信端末20に転送する(S30)。従って、エンコード・RTP送信部1031、RTP受信部1032、トランスコード部1033、RTP送信部1034、トランスコード部1033及びRTP送信部1034は、合成映像を各映像通信端末20,30に送信する合成映像送信部103として機能する。
The encoding /
第1映像通信端末20は、RTP受信・デコード部2014によって当該合成映像を受信して復号し、ディスプレイ表示部2015によって当該合成映像をモニタ画面に表示する(S31)。同様に、第2映像通信端末30は、RTP受信・デコード部3011によって当該合成映像を受信して復号し、ディスプレイ表示部3014によって当該合成映像をモニタ画面に表示する(S32)。
The first
このように、本実施形態の映像コミュニケーションシステムにおいても、第1実施形態の利点をすべて包含した構成とすることができる。 Thus, the video communication system of the present embodiment can also be configured to include all the advantages of the first embodiment.
図8は、原映像に所定の図形を重畳した例である。撮影画像(原映像)における注目領域に「丸」を追加したり、「矢印」を追加したりすることができ、「吹き出し」を追加したりすることができる。この「吹き出し」が与えられた合成映像について、第1映像通信端末20や第2映像通信端末30からの指示によりRTP通信でテキスト情報を送信して、文字入力することも可能である。
FIG. 8 shows an example in which a predetermined figure is superimposed on the original video. “Circle” can be added to the region of interest in the captured image (original video), “arrow” can be added, and “balloon” can be added. It is also possible to input text by transmitting text information by RTP communication in response to an instruction from the first
本発明によれば、映像中継サーバによって映像中に図形を重畳する際に、映像通信端末によって指定された映像中の対象物体に対して予め定めた図形を重畳するため、映像中の物体の位置が動いても、当該図形を対象物体に追随させた合成映像を提供することができるようになるから、移動端末を利用した映像コミュニケーションの用途に有用である。 According to the present invention, when a graphic is superimposed on a video by the video relay server, a predetermined graphic is superimposed on the target object in the video specified by the video communication terminal. Even if the image moves, it is possible to provide a composite image in which the figure follows the target object, which is useful for video communication using a mobile terminal.
10 映像中継サーバ
10a 映像合成ユニット
10b 多地点接続ユニット
20 第1映像通信端末
30 第2映像通信端末
101 注目物体検出部
102 合成映像生成部
103 合成映像送信部
104 注目物体画像抽出部
201 原映像送信部
301 注目物体画像生成部
302 注目物体画像送信部
303 注目領域座標指定処理部
304 注目領域座標送信部
DESCRIPTION OF
Claims (8)
第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備え、
第2映像通信端末は、当該原映像中で指定される注目物体の全部又は一部を含む注目物体画像を生成する注目物体画像生成部と、該注目物体画像を前記映像中継サーバに送信する注目物体画像送信部とを備え、
前記映像中継サーバは、
前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出する注目物体検出部と、
前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成する合成映像生成部と、
該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信する合成映像送信部と、
を備えることを特徴とする映像コミュニケーションシステム。 A video communication system comprising two or more video communication terminals and a video relay server,
The first video communication terminal includes an original video transmission unit that transmits the original video to the video relay server,
The second video communication terminal includes a target object image generation unit that generates a target object image including all or part of a target object specified in the original video, and a target for transmitting the target object image to the video relay server. An object image transmission unit,
The video relay server is
An attention object detection unit that compares the original image received from the first video communication terminal with the attention object image and detects an attention object coordinate indicating a position where the attention object is reflected in the original image;
A synthesized video generating unit that generates a synthesized video by synthesizing a predetermined figure at the position of the target object in the original video based on the target object coordinates;
A composite video transmission unit for transmitting the composite video to the first video communication terminal or the second video communication terminal;
A video communication system comprising:
第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備え、
第2映像通信端末は、当該原映像中で指定される注目領域を示す注目領域座標の情報を生成する注目領域座標指定処理部と、該注目領域座標の情報を前記映像中継サーバに送信する注目領域座標送信部とを備え、
前記映像中継サーバは、
前記第2映像通信端末から受信した注目領域座標の情報を基に、当該原映像中で注目物体の全部又は一部を含む部分画像を抽出して注目物体画像として生成する注目物体画像抽出部と、
前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出する注目物体検出部と、
前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成する合成映像生成部と、
該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信する合成映像送信部と、
を備えることを特徴とする映像コミュニケーションシステム。 A video communication system comprising two or more video communication terminals and a video relay server,
The first video communication terminal includes an original video transmission unit that transmits the original video to the video relay server,
The second video communication terminal generates an attention area coordinate specification processing unit that generates attention area coordinate information indicating the attention area specified in the original video, and transmits the attention area coordinate information to the video relay server. An area coordinate transmitter,
The video relay server is
An attention object image extraction unit that extracts a partial image including all or part of the attention object in the original image based on the information of the attention area coordinates received from the second video communication terminal; ,
An attention object detection unit that compares the original image received from the first video communication terminal with the attention object image and detects an attention object coordinate indicating a position where the attention object is reflected in the original image;
A synthesized video generating unit that generates a synthesized video by synthesizing a predetermined figure at the position of the target object in the original video based on the target object coordinates;
A composite video transmission unit for transmitting the composite video to the first video communication terminal or the second video communication terminal;
A video communication system comprising:
第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備えており、
第2映像通信端末は、当該原映像中で指定される注目物体の全部又は一部を含む注目物体画像を生成する注目物体画像生成部と、該注目物体画像を前記映像中継サーバに送信する注目物体画像送信部とを備えており、
前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出するステップと、
前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成するステップと、
該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信するステップと、
を含むことを特徴とする映像中継サーバの作動方法。 An operation method of a video relay server in a video communication system including two or more video communication terminals and a video relay server,
The first video communication terminal includes an original video transmission unit that transmits the original video to the video relay server,
The second video communication terminal includes a target object image generation unit that generates a target object image including all or part of a target object specified in the original video, and a target for transmitting the target object image to the video relay server. An object image transmission unit,
Collating the original image received from the first video communication terminal with the object-of-interest image and detecting object-of-interest coordinates indicating a position where the object of interest is reflected in the original image;
Generating a synthesized image by synthesizing a predetermined figure at the position of the object of interest in the original image based on the object of interest coordinates;
Transmitting the composite video to the first video communication terminal or the second video communication terminal;
A method for operating a video relay server, comprising:
第1映像通信端末は、原映像を映像中継サーバに送信する原映像送信部を備えており、
第2映像通信端末は、当該原映像中で指定される注目領域を示す注目領域座標の情報を生成する注目領域座標指定処理部と、該注目領域座標の情報を前記映像中継サーバに送信する注目領域座標送信部とを備えており、
前記第2映像通信端末から受信した注目領域座標の情報を基に、当該原映像中で注目物体の全部又は一部を含む部分画像を抽出して注目物体画像として生成するステップと、
前記第1映像通信端末から受信した原映像と前記注目物体画像を照合し、当該原映像中で注目物体が映っている位置を示す注目物体座標を検出するステップと、
前記注目物体座標に基づいて当該原映像中の注目物体の位置に所定の図形を合成して合成映像を生成するステップと、
該合成映像を、前記第1映像通信端末又は前記第2映像通信端末に送信するステップと、
を含むことを特徴とする映像中継サーバの作動方法。
An operation method of a video relay server in a video communication system including two or more video communication terminals and a video relay server,
The first video communication terminal includes an original video transmission unit that transmits the original video to the video relay server,
The second video communication terminal generates an attention area coordinate specification processing unit that generates attention area coordinate information indicating the attention area specified in the original video, and transmits the attention area coordinate information to the video relay server. An area coordinate transmitter,
Extracting a partial image including all or part of the target object in the original video based on the information of the target area coordinates received from the second video communication terminal, and generating the target object image;
Collating the original image received from the first video communication terminal with the object-of-interest image and detecting object-of-interest coordinates indicating a position where the object of interest is reflected in the original image;
Generating a synthesized image by synthesizing a predetermined figure at the position of the object of interest in the original image based on the object of interest coordinates;
Transmitting the composite video to the first video communication terminal or the second video communication terminal;
A method for operating a video relay server, comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011014719A JP5553782B2 (en) | 2011-01-27 | 2011-01-27 | Video communication system and operating method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011014719A JP5553782B2 (en) | 2011-01-27 | 2011-01-27 | Video communication system and operating method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012156820A true JP2012156820A (en) | 2012-08-16 |
JP5553782B2 JP5553782B2 (en) | 2014-07-16 |
Family
ID=46838085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011014719A Expired - Fee Related JP5553782B2 (en) | 2011-01-27 | 2011-01-27 | Video communication system and operating method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5553782B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015115724A (en) * | 2013-12-10 | 2015-06-22 | Kddi株式会社 | Video instruction method capable of superposing instruction picture on imaged moving picture, system, terminal, and program |
JP2015115723A (en) * | 2013-12-10 | 2015-06-22 | Kddi株式会社 | Video instruction method capable of superposing instruction picture on imaged moving picture, system, terminal, and program |
JPWO2015072195A1 (en) * | 2013-11-13 | 2017-03-16 | ソニー株式会社 | Display control apparatus, display control method, and program |
US10623231B2 (en) | 2018-03-29 | 2020-04-14 | Ricoh Company, Ltd. | Communication terminal, image communication system, and display control method |
US10686848B2 (en) | 2018-03-30 | 2020-06-16 | Ricoh Company, Ltd. | Communication terminal, image communication system, and display control method |
US10764513B2 (en) | 2018-07-31 | 2020-09-01 | Ricoh Company, Ltd. | Communication terminal, image data communication system, and communication method |
WO2024078064A1 (en) * | 2022-10-11 | 2024-04-18 | 中兴通讯股份有限公司 | Image processing method and apparatus, and terminal |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11298872A (en) * | 1998-04-07 | 1999-10-29 | Toshiba Corp | Video communication system |
JP2000231625A (en) * | 1999-02-12 | 2000-08-22 | Sanyo Electric Co Ltd | Instruction information transmission device |
JP2005301606A (en) * | 2004-04-09 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | Device, system, method and program for instructing operation |
JP2009219037A (en) * | 2008-03-12 | 2009-09-24 | Fuji Xerox Co Ltd | Indication system, indication program and indication device |
JP2010034720A (en) * | 2008-07-28 | 2010-02-12 | Fuji Xerox Co Ltd | Instruction system, instruction device, terminal apparatus, instruction program, and program for terminal |
JP2010245796A (en) * | 2009-04-06 | 2010-10-28 | Sony Corp | Video display and method, video display system, and program |
-
2011
- 2011-01-27 JP JP2011014719A patent/JP5553782B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11298872A (en) * | 1998-04-07 | 1999-10-29 | Toshiba Corp | Video communication system |
JP2000231625A (en) * | 1999-02-12 | 2000-08-22 | Sanyo Electric Co Ltd | Instruction information transmission device |
JP2005301606A (en) * | 2004-04-09 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | Device, system, method and program for instructing operation |
JP2009219037A (en) * | 2008-03-12 | 2009-09-24 | Fuji Xerox Co Ltd | Indication system, indication program and indication device |
JP2010034720A (en) * | 2008-07-28 | 2010-02-12 | Fuji Xerox Co Ltd | Instruction system, instruction device, terminal apparatus, instruction program, and program for terminal |
JP2010245796A (en) * | 2009-04-06 | 2010-10-28 | Sony Corp | Video display and method, video display system, and program |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2015072195A1 (en) * | 2013-11-13 | 2017-03-16 | ソニー株式会社 | Display control apparatus, display control method, and program |
JP2015115724A (en) * | 2013-12-10 | 2015-06-22 | Kddi株式会社 | Video instruction method capable of superposing instruction picture on imaged moving picture, system, terminal, and program |
JP2015115723A (en) * | 2013-12-10 | 2015-06-22 | Kddi株式会社 | Video instruction method capable of superposing instruction picture on imaged moving picture, system, terminal, and program |
US10623231B2 (en) | 2018-03-29 | 2020-04-14 | Ricoh Company, Ltd. | Communication terminal, image communication system, and display control method |
US10944619B2 (en) | 2018-03-29 | 2021-03-09 | Ricoh Company, Ltd. | Communication terminal, image communication system, and display control method |
US10686848B2 (en) | 2018-03-30 | 2020-06-16 | Ricoh Company, Ltd. | Communication terminal, image communication system, and display control method |
US10944798B2 (en) | 2018-03-30 | 2021-03-09 | Ricoh Company, Ltd. | Communication terminal, image communication system, and display control method |
US10764513B2 (en) | 2018-07-31 | 2020-09-01 | Ricoh Company, Ltd. | Communication terminal, image data communication system, and communication method |
WO2024078064A1 (en) * | 2022-10-11 | 2024-04-18 | 中兴通讯股份有限公司 | Image processing method and apparatus, and terminal |
Also Published As
Publication number | Publication date |
---|---|
JP5553782B2 (en) | 2014-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5553782B2 (en) | Video communication system and operating method thereof | |
US9497416B2 (en) | Virtual circular conferencing experience using unified communication technology | |
CN110597774B (en) | File sharing method, system, device, computing equipment and terminal equipment | |
US9560317B2 (en) | Videoconferencing system using QR codes for interaction | |
CN102883135B (en) | Screen sharing and control method | |
US9124765B2 (en) | Method and apparatus for performing a video conference | |
CA2865545C (en) | Communication control system and control device | |
AU2013345759B2 (en) | Transmission system and program | |
CN103597468A (en) | Systems and methods for improved interactive content sharing in video communication systems | |
US20150070458A1 (en) | System and method for video call | |
CN111803940B (en) | Game processing method and device, electronic equipment and computer-readable storage medium | |
KR20120086810A (en) | Terminal and method for processing image thereof | |
EP3089025B1 (en) | Information processing device, program, and transfer system | |
KR20150008840A (en) | Augmented reality panorama supporting visually imparired individuals | |
JP6291580B2 (en) | A method for generating immersive videos of multiple people | |
WO2014012444A1 (en) | Method, device and system for realizing augmented reality information sharing | |
CN113395477B (en) | Sharing method and device based on video conference, electronic equipment and computer medium | |
CN114610253A (en) | Screen projection method and equipment | |
US20100066806A1 (en) | Internet video image producing method | |
CN112817671A (en) | Image processing method, device, equipment and computer readable storage medium | |
KR101943456B1 (en) | Transcoding Server and Method for Overlaying Added Information to Dynamic Image in Transcoding Server | |
CN111800599B (en) | Method for acquiring and displaying data stream based on intelligent glasses and intelligent glasses | |
KR20090001627A (en) | Public system for interactive contents | |
KR102391898B1 (en) | Remote access system for transmitting video data and method performing there of | |
JP6606251B2 (en) | SENDING COMPUTER, RECEIVING COMPUTER, METHOD EXECUTED BY THE SAME, AND COMPUTER PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140527 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5553782 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |