JP2002051315A - Data transmitting method and data transmitter, and data transmitting system - Google Patents

Data transmitting method and data transmitter, and data transmitting system

Info

Publication number
JP2002051315A
JP2002051315A JP2001130877A JP2001130877A JP2002051315A JP 2002051315 A JP2002051315 A JP 2002051315A JP 2001130877 A JP2001130877 A JP 2001130877A JP 2001130877 A JP2001130877 A JP 2001130877A JP 2002051315 A JP2002051315 A JP 2002051315A
Authority
JP
Japan
Prior art keywords
image
data
data transmission
transmitted
characteristic portion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001130877A
Other languages
Japanese (ja)
Inventor
Keisuke Aoki
敬介 青木
Hirobumi Morimoto
博文 森本
Masatoshi Takashima
昌利 高嶋
Hideyuki Narita
秀之 成田
Daisuke Hiranaka
大介 平中
Yoshihiro Ishida
善啓 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001130877A priority Critical patent/JP2002051315A/en
Publication of JP2002051315A publication Critical patent/JP2002051315A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a data transmitting method and a data transmitter, and a data transmitting system in which the image quality of a transmitted image and its own image can be held at the substantially same level. SOLUTION: In the data transmitting system where image data is transmitted while being contained in an image frame of preset size at the time of communication among a plurality of terminals 50-1, 50-2, an image including a target image to be transmitted is picked up, a target image to be transmitted from the picked up image is regulated to fully fill the image frame and then the regulated image data in the image frame is transmitted while being compressed.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、複数端末間で、コ
ミュニケーション、ストリーミング等を行う場合におけ
る、画像を含むデータ伝送方法、および、携帯電話、P
DA、TV電話端末、PC端末等のデータ伝送装置、並
びにデータ伝送システムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for transmitting data including an image when performing communication, streaming, and the like between a plurality of terminals, a portable telephone, and a portable telephone.
The present invention relates to a data transmission device such as a DA, a TV telephone terminal, and a PC terminal, and a data transmission system.

【0002】[0002]

【従来の技術】複数端末間で、コミュニケーション、ス
トリーミング等を行う通信サービスとして、たとえば図
24に示すような、たとえば携帯電話からなる移動体端
末(MT:Mobile Terminal)によるデータ伝送システム
としてのビジュアルコミュニケーションサービスが行わ
れている。
2. Description of the Related Art As a communication service for performing communication, streaming, and the like between a plurality of terminals, visual communication as a data transmission system by a mobile terminal (MT) such as a mobile phone as shown in FIG. Service is being performed.

【0003】このビジュアルコミュニケーションサービ
スシステム1は、移動体端末(以下、単に端末という)
2−1と端末2−2間で、音声と、画像を圧縮して互い
の信号を、伝送路3を通して交換することで、相手の顔
を見ながら、会話を楽しむことができるものである。
[0003] The visual communication service system 1 includes a mobile terminal (hereinafter simply referred to as a terminal).
By exchanging the voice and the image and exchanging the signals through the transmission path 3 between the terminal 2-1 and the terminal 2-2, it is possible to enjoy a conversation while seeing the face of the other party.

【0004】端末2−1、2−2は、外観的には図24
に示すように、本体ケース21と、本体ケース21の下
方に設けられた、通話機能のための電話番号を入力した
り、所定の動作指示を入力するためのテンキー等を含む
操作部22と、操作部22の上方に設けられた表示モニ
タ23と、表示モニタ23の上方(本体ケース21の上
部)に設けられたカメラ24と、アンテナ25とを有し
ている。
The terminals 2-1 and 2-2 are shown in FIG.
As shown in the figure, a main body case 21 and an operation unit 22 provided below the main body case 21 including a numeric keypad and the like for inputting a telephone number for a call function and inputting a predetermined operation instruction, It has a display monitor 23 provided above the operation unit 22, a camera 24 provided above the display monitor 23 (above the main body case 21), and an antenna 25.

【0005】伝送路3は、無線基地局(MBS:Mobile
Base Station )31−1,31−2、移動交換局(M
SC:Mobile Switching Center )32−1,32−
2、ホームロケーションレジスタ(HLR:Home Locat
ion Register)を有する関門移動交換局(GMSC:Ga
teway Mobile Switching Center )33−1,33−
2、および回線網35により構成されている。
[0005] The transmission path 3 is a wireless base station (MBS: Mobile
Base Station) 31-1, 31-2, Mobile Switching Center (M
SC: Mobile Switching Center) 32-1, 32-
2. Home location register (HLR: Home Locat)
Gateway Mobile Switching Center (GMSC: Ga)
teway Mobile Switching Center) 33-1,33-
2 and a network 35.

【0006】無線基地局31−1,31−2は、端末2
−1、2−2との通信を行う。これら基地局31−1,
31−2でやり取りされる信号は、その上位に位置する
移動交換局32−1、32−2に送られ、さらに、その
上位の関門移動交換局33−1、33−2を介してバッ
クボーン回線網35に繋がっている。
[0006] The radio base stations 31-1 and 31-2 are connected to the terminal 2.
-1, 2-2. These base stations 31-1,
The signal exchanged at 31-2 is sent to the mobile switching centers 32-1 and 32-2 located at a higher level, and further transmitted via the higher-level gateway mobile switching stations 33-1 and 33-2 to the backbone line. It is connected to the net 35.

【0007】[0007]

【発明が解決しようとする課題】ところで、このような
回線網35に画像を伝送する場合、回線網35に流せる
情報量は、回線網35の帯域によって制限されている。
したがって、たとえば端末2−1で会話を行っているユ
ーザは、カメラ24による自分の画像は、スルーでモニ
タされるために、図24中、23aで示す画像のように
高画質でみることができるが、端末2−1で圧縮され、
端末2−2に伝送されたとき、端末2−2は、端末2−
1から送られてきた映像は、23bで示す画像のように
画質が極端に劣化してしまう。同様に、端末2−2から
端末2−1に送られてきた画像も、端末2−1では極端
に劣化してしまう。
However, when transmitting an image to such a network 35, the amount of information that can flow through the network 35 is limited by the bandwidth of the network 35.
Therefore, for example, a user who is having a conversation with the terminal 2-1 can monitor his / her own image by the camera 24 with high image quality, as shown by an image 23a in FIG. Is compressed by the terminal 2-1.
When transmitted to the terminal 2-2, the terminal 2-2
The image quality of the video sent from 1 is extremely deteriorated like the image indicated by 23b. Similarly, the image transmitted from the terminal 2-2 to the terminal 2-1 is extremely deteriorated at the terminal 2-1.

【0008】このように、従来の画像伝送システムで
は、送られてきた画像は、極端に劣化し、自分自身のモ
ニタされている画像との差が大き過ぎて、非常に違和感
があると同時に、相手の表情がつかめずに、ストレスを
感じることになってしまう。
As described above, in the conventional image transmission system, the transmitted image is extremely deteriorated, the difference between the transmitted image and the monitored image is too large, and at the same time, there is a sense of discomfort. You will feel stress without grasping the other person's expression.

【0009】また、端末2−1,2−2において、カメ
ラ24が、端末のモニタ用表示モニタ23の上部につい
ていることから、ユーザは、端末の表示モニタ23に目
線をやってしまい、互いに、目線が下を向いてしまい、
目線があった会話を成立させることができないという不
都合が生じる。
Further, in the terminals 2-1 and 2-2, since the camera 24 is located above the monitor display monitor 23 of the terminal, the user looks at the display monitor 23 of the terminal, and My eyes are pointing down,
A disadvantage arises in that it is not possible to establish a conversation with a glance.

【0010】本発明は、かかる事情に鑑みてなされたも
のであり、第1の目的は、伝送されてきた画像と自分自
身の画像の画質を略同程度に保持できるデータ伝送方法
およびその装置、並びにデータ伝送システムを提供する
ことにある。
The present invention has been made in view of the above circumstances, and a first object of the present invention is to provide a data transmission method and a data transmission apparatus capable of maintaining the quality of a transmitted image and that of an own image at substantially the same level. Another object of the present invention is to provide a data transmission system.

【0011】また、本発明の第2の目的は、互いの目線
がよりあった状態での通信を実現できるデータ伝送方法
およびその装置、並びにデータ伝送システムを提供する
ことにある。
A second object of the present invention is to provide a data transmission method and apparatus capable of realizing communication in a state where the eyes are more closely aligned, and a data transmission system.

【0012】[0012]

【課題を解決するための手段】上記目的を達成するた
め、本発明は、少なくとも画像データをあらかじめ設定
された大きさの画枠内に収めて伝送するデータ伝送方法
であって、伝送すべきターゲット画像を含む画像を撮像
し、撮像した画像から伝送すべきターゲット画像が略上
記画枠いっぱいになるように調整し、調整後の画枠内の
画像データを圧縮して伝送する。
In order to achieve the above object, the present invention relates to a data transmission method for transmitting at least image data in an image frame of a predetermined size, comprising: An image including an image is captured, the target image to be transmitted from the captured image is adjusted so as to substantially fill the image frame, and the image data in the adjusted image frame is compressed and transmitted.

【0013】また、本発明は、少なくとも画像データを
伝送するデータ伝送方法であって、伝送すべきターゲッ
ト画像を含む画像を撮像し、撮像した画像から伝送すべ
きターゲット画像をあらかじめ決められた所定の大きさ
になるように調整し、調整後の画枠内の画像データを圧
縮して伝送する。
The present invention also relates to a data transmission method for transmitting at least image data, wherein an image including a target image to be transmitted is captured, and a target image to be transmitted is determined from a captured image by a predetermined predetermined method. The image data is adjusted so as to have a size, and the image data in the adjusted image frame is compressed and transmitted.

【0014】また、本発明方法では、画枠にターゲット
画像をいっぱいになるように調整する場合、あるいはタ
ーゲット画像を所定の大きさになるように調整する場
合、伝送すべき画像の特徴部分の画像を利用してマッチ
ングを行い、最もマッチングがとれた部分を中心に、そ
の周りの画像を切り出すことで、画像のトラッキングを
行う。
Further, according to the method of the present invention, when adjusting the target image to fill the image frame or when adjusting the target image to a predetermined size, the image of the characteristic portion of the image to be transmitted is adjusted. , And the image is tracked by cutting out an image around the best matching part.

【0015】また、本発明方法では、画枠にターゲット
画像をいっぱいになるように調整する場合、あるいはタ
ーゲット画像を所定の大きさになるように調整する場
合、伝送画像の特徴部分の画像を利用して、特徴部分の
距離を算出し、これにより、画像の拡大、縮小、トラッ
キングを行う。
In the method of the present invention, when adjusting the target image to fill the image frame or when adjusting the target image to a predetermined size, the image of the characteristic portion of the transmission image is used. Then, the distance of the characteristic portion is calculated, and thereby, enlargement, reduction, and tracking of the image are performed.

【0016】また、本発明方法では、画像の特徴部分を
検出する場合、伝送画像の取り込まれた状態をモニタし
ながら、所望の画像状態で当該画像の状態をロックさ
せ、ロックしたときの画像の中心付近を画像の特徴部分
とする。
Further, according to the method of the present invention, when detecting a characteristic portion of an image, the state of the image is locked in a desired image state while monitoring the state in which the transmitted image is captured, and the image of the locked image is locked. The vicinity of the center is defined as a characteristic portion of the image.

【0017】また、本発明方法では、画像の特徴部分を
検出する場合、伝送画像の取り込まれた状態を表示さ
せ、表示画面上で所定箇所を指定し、指定したポイント
を中心に、画像の特徴部分とする。
In the method of the present invention, when a characteristic portion of an image is detected, a state in which the transmitted image is captured is displayed, a predetermined portion is designated on the display screen, and the characteristic of the image is centered on the designated point. Part.

【0018】また、本発明方法では、画像の特徴部分を
利用して、ターゲット画像をロックする場合、伝送され
る画像と同じか、または、それ以上のフレームレートに
て、画像を取り込み、トラッキング操作を行い、伝送フ
レームレートと同じか、それ以上のレートで、トラッキ
ングのための基準となるリファレンス画像を更新する。
In the method of the present invention, when the target image is locked by utilizing the characteristic portion of the image, the image is captured at a frame rate equal to or higher than that of the transmitted image, and the tracking operation is performed. Is performed, and a reference image serving as a reference for tracking is updated at a rate equal to or higher than the transmission frame rate.

【0019】また、本発明方法では、伝送画像の取り込
まれた状態を表示し、表示画面上で伝送すべき範囲を指
定して、画像を伝送する範囲を決定する。
Further, according to the method of the present invention, the state in which the transmitted image is captured is displayed, the range to be transmitted is specified on the display screen, and the range for transmitting the image is determined.

【0020】また、本発明は、複数端末間で少なくとも
ユーザの画像データを表示画面に表示させ、受信した画
像データを上記表示画面に表示させながら、少なくとも
画像データを伝送するデータ伝送方法であって、上記表
示画面の略中央部から伝送すべきユーザのターゲット画
像を含む画像を撮像する。
The present invention is a data transmission method for transmitting at least image data while displaying at least image data of a user on a display screen among a plurality of terminals and displaying received image data on the display screen. And capturing an image including a target image of the user to be transmitted from a substantially central portion of the display screen.

【0021】また、本発明は、複数端末間で、少なくと
もユーザの画像データを表示画面に表示させ、受信した
相手方からの画像データを上記表示画面に表示させ、か
つ共通の話題となるコンテンツを上記表示画面に表示さ
せながら、少なくとも画像データを伝送するデータ伝送
方法であって、上記表示画面の略中央部から伝送すべき
ユーザのターゲット画像を含む画像を撮像し、撮像部位
である表示画面の略中央を中心として、表示画面の上側
または下側の一方側に上記画像データを表示させ、他方
側に上記コンテンツを表示させる。
According to the present invention, at least a plurality of terminals display at least image data of a user on a display screen, display received image data from the other party on the display screen, and display a content which is a common topic. A data transmission method for transmitting at least image data while displaying on a display screen, wherein an image including a target image of a user to be transmitted is captured from a substantially central portion of the display screen, and a display screen, which is an imaging portion, is captured. With the center at the center, the image data is displayed on one side of the upper or lower side of the display screen, and the content is displayed on the other side.

【0022】すなわち、本発明方法では、上記表示画面
には、コンテンツの上側に画像データを表示させ、ある
いはコンテンツの下側に画像データを表示させる。
That is, in the method of the present invention, on the display screen, image data is displayed above the content or image data is displayed below the content.

【0023】また、本発明は、少なくとも画像データを
あらかじめ設定された大きさの画枠内に収めて伝送する
データ伝送装置であって、伝送すべきターゲット画像を
含む画像を撮像する撮像手段と、上記撮像手段で撮像し
た画像から伝送すべきターゲット画像が略上記画枠いっ
ぱいになるように調整する第1の回路と、調整後の画枠
内の画像データを圧縮して伝送する第2の回路とを有す
る。
Also, the present invention is a data transmission apparatus for transmitting at least image data in an image frame of a preset size, wherein the imaging means captures an image including a target image to be transmitted, A first circuit for adjusting a target image to be transmitted from an image captured by the image capturing means to substantially fill the image frame, and a second circuit for compressing and transmitting image data in the adjusted image frame And

【0024】また、本発明は、少なくとも画像データを
伝送するデータ伝送装置であって、伝送すべきターゲッ
ト画像を含む画像を撮像する撮像手段と、撮像した画像
から伝送すべきターゲット画像をあらかじめ決められた
所定の大きさになるように調整する第1の回路と、調整
後の画枠内の画像データを圧縮して伝送する第2の回路
とを有する。
According to the present invention, there is provided a data transmitting apparatus for transmitting at least image data, wherein an image pickup means for picking up an image including a target image to be transmitted, and a target image to be transmitted based on the picked-up image are determined in advance. And a second circuit for compressing and transmitting image data within the adjusted image frame.

【0025】また、本発明装置では、上記第1の回路
は、画枠にターゲット画像をいっぱいになるように調整
する場合、あるいはターゲット画像を所定の大きさにな
るように調整する場合、伝送すべき画像の特徴部分の画
像を利用してマッチングを行い、最もマッチングがとれ
た部分を中心に、その周りの画像を切り出すことで、画
像のトラッキングを行う。
In the device of the present invention, the first circuit transmits the signal when adjusting the target image to fill the image frame or when adjusting the target image to a predetermined size. Image matching is performed by using the image of the characteristic portion of the power image, and an image around the best matching portion is cut out to perform image tracking.

【0026】また、本発明装置では、上記第1の回路
は、画枠にターゲット画像をいっぱいになるように調整
する場合、あるいはターゲット画像を所定の大きさにな
るように調整する場合、伝送画像の特徴部分の画像を利
用して、特徴部分の距離を算出し、これにより、画像の
拡大、縮小、トラッキングを行う。
In the apparatus according to the present invention, the first circuit adjusts the target image to fill the image frame, or adjusts the target image to a predetermined size. By using the image of the characteristic portion, the distance of the characteristic portion is calculated, and accordingly, enlargement, reduction, and tracking of the image are performed.

【0027】また、本発明装置では、画像データを表示
させる表示手段と、上記表示手段に表示された画像を、
所望の画像状態でロックさせることが可能なロック手段
と、を有し、上記第1の回路は、画像の特徴部分を検出
する場合、上記ロック手段でロックされたときの画像の
中心付近を画像の特徴部分とする。
In the apparatus of the present invention, a display means for displaying image data, and an image displayed on the display means,
A lock unit capable of locking the image in a desired image state, wherein the first circuit detects the vicinity of the center of the image when locked by the lock unit when detecting a characteristic portion of the image. The characteristic part of.

【0028】また、本発明装置では、画像データを表示
させ、所定箇所を指定可能なポインタを含む表示手段
と、上記表示手段に表示された画像の所定箇所を上記ポ
インタで指定させることが可能な指定手段と、を有し、
上記第1の回路は、画像の特徴部分を検出する場合、上
記指定手段で指定されたポイントを中心に、画像の特徴
部分とする。
Further, in the apparatus of the present invention, it is possible to display image data and include a display means including a pointer capable of designating a predetermined location, and to designate a predetermined location of an image displayed on the display means with the pointer. Designation means, and
When detecting the characteristic part of the image, the first circuit sets the characteristic part of the image around the point specified by the specifying means.

【0029】また、本発明装置では、上記第1の回路
は、画像の特徴部分を利用して、ターゲット画像をロッ
クする場合、伝送される画像と同じか、または、それ以
上のフレームレートにて、画像を取り込み、トラッキン
グ操作を行い、伝送フレームレートと同じか、それ以上
のレートで、トラッキングのための基準となるリファレ
ンス画像を更新する。
Further, in the device of the present invention, when the first circuit locks the target image using the characteristic portion of the image, the first circuit has the same or higher frame rate as the transmitted image. , An image is captured, a tracking operation is performed, and a reference image serving as a reference for tracking is updated at a rate equal to or higher than the transmission frame rate.

【0030】また、本発明装置では、画像データを表示
させ、所定箇所を指定可能なポインタを含む表示手段
と、上記表示手段に表示された画像の所定箇所を上記ポ
インタで指定させることが可能な指定手段と、を有し、
上記第1の回路は、上記指定手段で指定された範囲を画
像を伝送する範囲として決定する。
Further, in the apparatus of the present invention, it is possible to display image data and include a display means including a pointer capable of designating a predetermined location, and to designate a predetermined location of an image displayed on the display means with the pointer. Designation means, and
The first circuit determines a range specified by the specifying unit as a range for transmitting an image.

【0031】また、本発明は、複数端末間で少なくとも
ユーザの画像データを表示画面に表示させ、受信した画
像データを上記表示画面に表示させながら、少なくとも
画像データを伝送するデータ伝送システムであって、上
記端末は、伝送すべきターゲット画像を含む画像を撮像
する撮像手段と、上記撮像手段で撮像した画像から伝送
すべきターゲット画像が略画枠いっぱいになるように調
整する第1の回路と、調整後の画枠内の画像データを圧
縮して伝送する第2の回路とを有する。
The present invention is also a data transmission system for transmitting at least image data while displaying at least image data of a user on a display screen among a plurality of terminals and displaying received image data on the display screen. An image capturing unit that captures an image including a target image to be transmitted, a first circuit that adjusts the target image to be transmitted from the image captured by the image capturing unit so that the target image substantially fills an image frame, A second circuit for compressing and transmitting the image data in the adjusted image frame.

【0032】また、本発明は、複数端末間で少なくとも
ユーザの画像データを表示画面に表示させ、受信した画
像データを上記表示画面に表示させながら、少なくとも
画像データを伝送するデータ伝送システムであって、上
記端末は、伝送すべきターゲット画像を含む画像を撮像
する撮像手段と、撮像した画像から伝送すべきターゲッ
ト画像をあらかじめ決められた所定の大きさになるよう
に調整する第1の回路と、調整後の画枠内の画像データ
を圧縮して伝送する第2の回路とを有する。
Further, the present invention is a data transmission system for transmitting at least image data while displaying at least a user's image data on a display screen between a plurality of terminals and displaying the received image data on the display screen. An image capturing unit that captures an image including a target image to be transmitted, a first circuit that adjusts the target image to be transmitted from the captured image to have a predetermined size, A second circuit for compressing and transmitting the image data in the adjusted image frame.

【0033】また、本発明は、複数端末間で少なくとも
ユーザの画像データを表示画面に表示させ、受信した画
像データを上記表示画面に表示させながら、少なくとも
画像データを伝送するデータ伝送システムであって、上
記表示画面の略中央部に、伝送すべきユーザのターゲッ
ト画像を含む画像を撮像する撮像手段が配置されてい
る。
Further, the present invention is a data transmission system for transmitting at least image data while displaying at least image data of a user on a display screen among a plurality of terminals and displaying received image data on the display screen. An image pickup means for picking up an image including a target image of a user to be transmitted is arranged substantially at the center of the display screen.

【0034】また、本発明は、複数端末間で、少なくと
もユーザの画像データを表示画面に表示させ、受信した
相手方からの画像データを上記表示画面に表示させ、か
つ共通の話題となるコンテンツを上記表示画面に表示さ
せながら、少なくとも画像データを伝送するデータ伝送
システムであって、上記表示画面の略中央部に配置さ
れ、伝送すべきユーザのターゲット画像を含む画像を撮
像する撮像手段と、撮像部位である表示画面の略中央を
中心として、表示画面の上側または下側の一方側に上記
画像データを表示させ、他方側に上記コンテンツを表示
させる表示手段とを有する。
According to the present invention, at least a plurality of terminals display at least image data of a user on a display screen, display received image data from the other party on the display screen, and display a content which is a common topic. What is claimed is: 1. A data transmission system for transmitting at least image data while displaying it on a display screen, comprising: an imaging unit disposed at a substantially central portion of the display screen for capturing an image including a target image of a user to be transmitted; And display means for displaying the image data on one side of the upper or lower side of the display screen with the center substantially at the center of the display screen being the center, and displaying the content on the other side.

【0035】本発明によれば、たとえばターゲット画像
であるユーザの顔画像が画枠いっぱいになるように、当
該顔画像が、拡大、縮小および、動きに合わせてトラッ
キングされる。そして、顔画像のみを切り出され、この
画像が圧縮されて伝送される。
According to the present invention, the face image is tracked in accordance with the enlargement, reduction, and movement so that, for example, the user's face image as the target image fills the image frame. Then, only the face image is cut out, and this image is compressed and transmitted.

【0036】また、本発明によれば、たとえば伝送を始
めたユーザの画像の大きさが、常に同じ大きさになるよ
うに、圧縮、縮小および、動きに合わせてトラッキング
される。これにより、同じ大きさの人物画像が取り出さ
れ、この画像が圧縮されて伝送される。
Further, according to the present invention, for example, tracking is performed in accordance with the compression, reduction and movement so that the size of the image of the user who has started transmission is always the same. As a result, a person image of the same size is extracted, and this image is compressed and transmitted.

【0037】また、ユーザが、モニタ画面を見ながら、
ユーザが希望の状態で、端末にその画像の状態をロック
(キープ)するように構成することで、ユーザの指示に
従って、端末では画像のトラッキング、拡大、縮小、切
りだしが行われる。また、このロックした状態を継続す
るために、ロックスタートの時点で、この画像の中か
ら、特徴的な、たとえば画像部分(目、鼻、口、耳、顔
輪郭の器官部分)が取り出され、この部分がリファレン
スとして、画像の拡大、縮小、トラッキングが行われ
る。たとえば、両目の距離が検出され、この距離から、
拡大、縮小値、画像の切りだし位置が検出される。
Further, while the user looks at the monitor screen,
By configuring the terminal to lock (keep) the state of the image in the terminal in a desired state, the terminal performs tracking, enlargement, reduction, and clipping of the image in accordance with the user's instruction. Further, in order to continue this locked state, at the time of lock start, for example, characteristic image portions (eg, eyes, nose, mouth, ears, and facial contour organ portions) are extracted from this image, This portion is used as a reference to enlarge, reduce, and track the image. For example, the distance between both eyes is detected, and from this distance,
The enlargement / reduction values and the cutout position of the image are detected.

【0038】また、ユーザのモニタ画像には、撮像手段
であるカメラから入力された画像全てが出力され、ユー
ザは、この画像の取りこみ範囲を指定することで、この
範囲を切り出し、以降、この画像と同じ大きさになるよ
うに、画像の縮小、拡大、トラッキングが行われる。ま
た、モニタ画面上に、ユーザが操作可能なポインタを用
いることで、ロックスタートした時点での、特徴的な画
像をユーザが指定することにより、画像の縮小、拡大、
トラッキングが行われる。さらに、このトラッキング精
度を向上させるために、伝送される画像と同じか、また
は、それ以上のフレームレートにて、画像が取り込ま
れ、トラッキング操作を行い、伝送フレームレートと同
じか、それ以上のレートで、トラッキングのための基準
となるリファレンス画像が更新される。
Further, all the images input from the camera as the image pickup means are output to the user's monitor image, and the user cuts out this range by designating the capture range of the image. The image is reduced, enlarged, and tracked so as to have the same size as. In addition, by using a pointer that can be operated by the user on the monitor screen, the user can specify a characteristic image at the time of lock start, thereby reducing or enlarging the image.
Tracking is performed. Furthermore, in order to improve the tracking accuracy, an image is captured at a frame rate equal to or higher than the transmitted image, a tracking operation is performed, and a rate equal to or higher than the transmission frame rate is performed. Then, a reference image serving as a reference for tracking is updated.

【0039】さらに、撮像手段が表示画面の中に埋め込
まれる。これにより、互いに伝送さる画像の目線を合わ
せることができる。
Further, an image pickup means is embedded in the display screen. Thereby, the eyes of the images transmitted to each other can be matched.

【0040】また、本発明によれば、たとえば顔画像
と、話題のコンテンツを上下に配置し、その中間付近に
撮像手段が配置されることから、互いに、話題の映像を
見ながら話をしている様子を伝えることができ、また、
モニタ上の互いの顔を見れば、目線が合うという、バー
チャルリアリティのコミュニケーションが実現できる。
Further, according to the present invention, for example, a face image and a topic content are arranged vertically, and an image pickup means is arranged in the vicinity of the face image. You can tell that you are
If you look at each other's faces on the monitor, you can realize virtual reality communication that your eyes are aligned.

【0041】[0041]

【発明の実施の形態】図1は、本発明に係るデータ伝送
システムとしてのビジュアルコミュニケーションサービ
スシステムの一実施形態を示すシステム構成図である。
FIG. 1 is a system configuration diagram showing an embodiment of a visual communication service system as a data transmission system according to the present invention.

【0042】本ビジュアルコミュニケーションサービス
システム100は、複数端末、たとえば移動体端末(以
下、単に端末という)50−1と端末50−2間で、音
声と、画像を圧縮して互いの信号を、伝送路60を通し
て交換することで、相手の顔を見ながら、会話を楽しむ
ことが可能となっている。
The visual communication service system 100 transmits a signal between a plurality of terminals, for example, a mobile terminal (hereinafter simply referred to as a terminal) 50-1 and a terminal 50-2 by compressing voice and images and transmitting each other. By exchanging through the road 60, it is possible to enjoy a conversation while looking at the other person's face.

【0043】図2は、端末50−1、50−2の一構成
例を示す外観図である。端末50−1、50−2は、外
観的には図2に示すように、本体ケース51と、本体ケ
ース51の下方に設けられた、通話機能のための電話番
号を入力したり、所定の動作指示を入力するためのテン
キー等を含む操作部52と、操作部52の上方に設けら
れたモニタとしての表示モニタ53と、表示モニタ53
の略中央領域にレンズ部分が配置された撮像手段として
のカメラモジュール54と、アンテナ55、およびGU
Iとしての機能を備えたロック手段あるいは指定手段と
してのスイッチ56とを有している。なお、図2におい
ては、マイク部やスピーカ部は省略しており、データ伝
送装置としての端末の具体的な回路構成は、後で詳述す
る。
FIG. 2 is an external view showing an example of the configuration of the terminals 50-1 and 50-2. As shown in FIG. 2, the terminals 50-1 and 50-2 are used to input a main body case 51 and a telephone number provided below the main body case 51 for a call function, An operation unit 52 including ten keys for inputting operation instructions, a display monitor 53 as a monitor provided above the operation unit 52, and a display monitor 53
A camera module 54 having a lens portion disposed in a substantially central region of the camera module, an antenna 55, and a GU.
And a switch 56 as a lock means or a designation means having a function as I. In FIG. 2, a microphone unit and a speaker unit are omitted, and a specific circuit configuration of a terminal as a data transmission device will be described later in detail.

【0044】上記したように表示モニタ53は、その略
中央領域にカメラモジュール54のレンズ部分が配置さ
れており、図2に示すように、レンズ部分の配置を中心
として、上下に顔画像と後記するアプリケーションサー
ビスプロバイダ(ASP)による所定のコンテンツ画像
が表示される。図2の例では、上側に顔画像を表示さ
せ、下側にコンテンツ画像を表示させているが、逆に、
上側にコンテンツ画像を表示させ、下側に顔画像を表示
させるように構成することも可能である。
As described above, in the display monitor 53, the lens portion of the camera module 54 is disposed in a substantially central area thereof, and as shown in FIG. A predetermined content image by an application service provider (ASP) is displayed. In the example of FIG. 2, the face image is displayed on the upper side and the content image is displayed on the lower side.
It is also possible to display the content image on the upper side and the face image on the lower side.

【0045】伝送路60は、無線基地局(MBS:Mobi
le Base Station )61−1,61−2、移動交換局
(MSC:Mobile Switching Center )62−1,62
−2、ホームロケーションレジスタ(HLR:Home Loc
ation Register)を有する関門移動交換局(GMSC:
Gateway Mobile Switching Center )63−1,63−
2、および回線網64を含んでいる。
The transmission line 60 is a wireless base station (MBS: Mobi
le Base Station) 61-1 and 61-2, Mobile Switching Center (MSC) 62-1 and 62
-2, Home Location Register (HLR: Home Loc)
Gateway Mobile Switching Center (GMSC:
Gateway Mobile Switching Center) 63-1, 63-
2, and the network 64.

【0046】無線基地局61−1,61−2は、端末5
0−1、50−2との通信を行う。これら基地局61−
1,61−2でやり取りされる信号は、その上位に位置
する移動交換局62−1、62−2に送られ、さらに、
その上位の関門移動交換局63−1、63−2を介して
バックボーン回線網64に繋がっている。さらに、回線
網64には、関門局(GW:Gateway )65が接続され
ており、関門局65には、コンテンツ配信を可能とした
アプリケーションサービスプロバイダ(ASP)66が
接続されている。これにより、複数のコンテンツCON
Tが用意されたアプリケーションサービスプロバイダ
(ASP)66を立ち上げ、これらコンテンツCONT
を、関門局65を通じて、各端末50−1,50−2に
同じ映像を出力することができる。
The radio base stations 61-1 and 61-2 are connected to the terminal 5
Communication with 0-1 and 50-2 is performed. These base stations 61-
Signals exchanged at 1, 61-2 are sent to the mobile switching centers 62-1 and 62-2 located at a higher level, and further,
It is connected to the backbone line network 64 via the higher-order gateway mobile switching offices 63-1 and 63-2. Further, a gateway 64 (GW) is connected to the line network 64, and an application service provider (ASP) 66 that enables content distribution is connected to the gateway 65. Thereby, a plurality of contents CON
T launches an application service provider (ASP) 66 provided with these contents CONT.
Can be output to the terminals 50-1 and 50-2 through the gateway station 65.

【0047】以下に、上記するようなビジュアルコミュ
ニケーションサービスシステム100に適用される、本
発明に係るデータ伝送装置しての端末50(端末50−
1、50−2)の具体的な信号処理系の回路構成を第
1、第2、および第3の実施形態として図面に関連付け
て順を追って説明する。
Hereinafter, a terminal 50 (terminal 50-) serving as a data transmission device according to the present invention, which is applied to the visual communication service system 100 as described above.
The specific circuit configuration of the signal processing system of (1, 50-2) will be described step by step as first, second, and third embodiments with reference to the drawings.

【0048】第1実施形態 図3は、本発明に係るデータ伝送装置としての端末の信
号処理系の第1の実施形態を示す回路図である。
First Embodiment FIG. 3 is a circuit diagram showing a first embodiment of a signal processing system of a terminal as a data transmission device according to the present invention.

【0049】この信号処理系500は、図3に示すよう
に、マイクロフォン501、カメラ回路502、第1の
回路としての前処理回路503、ビデオ圧縮符号化器5
04、音声圧縮符号化器505、マルチプレクサ(MU
X)506、伝送回路507、受信回路508、デマル
チプレクサ(DeMUX)509、ビデオ復号化器51
0、音声復号化器511、画像合成装置512、表示回
路513、スピーカ514、GUIインタフェース(I
/F)回路515、およびCPU516を有している。
なお、ビデオ圧縮符号化器504、音声圧縮符号化器5
05、マルチプレクサ(MUX)506、伝送回路50
7により第2の回路が構成される。
As shown in FIG. 3, the signal processing system 500 includes a microphone 501, a camera circuit 502, a pre-processing circuit 503 as a first circuit, and a video compression encoder 5
04, audio compression encoder 505, multiplexer (MU)
X) 506, transmission circuit 507, reception circuit 508, demultiplexer (DeMUX) 509, video decoder 51
0, an audio decoder 511, an image synthesizing device 512, a display circuit 513, a speaker 514, a GUI interface (I
/ F) circuit 515 and CPU 516.
Note that the video compression encoder 504 and the audio compression encoder 5
05, multiplexer (MUX) 506, transmission circuit 50
7 constitutes a second circuit.

【0050】マイクロフォン501は、ユーザ等が発し
た音声を電気信号に変換して音声圧縮符号化器505に
出力する。
The microphone 501 converts a voice uttered by a user or the like into an electric signal and outputs the electric signal to the voice compression encoder 505.

【0051】カメラ回路502は、カメラモジュール5
4のレンズを通して撮像され、光信号から電気信号に変
換されたたとえばユーザの上半身部分の画像に対し所定
の処理を施して、ディジタル画像信号S502として前
処理回路503に出力する。
The camera circuit 502 includes the camera module 5
For example, an image of the upper body part of the user, which is imaged through the lens 4 and converted from an optical signal to an electric signal, is subjected to predetermined processing, and is output to the preprocessing circuit 503 as a digital image signal S502.

【0052】前処理回路503は、画像信号S502を
受けて、撮像したユーザの上半身部分の画像から、伝送
すべき画像(以下、ターゲット画像という)を抽出し、
伝送する画像の画枠いっぱいになるように合わせた画像
信号を生成してビデオ圧縮符号化器504および画像合
成装置512に出力する。前処理回路503は、画枠に
ターゲット画像をいっぱいに合わせる処理としては、た
とえば伝送画像の特徴部分の画像を利用してマッチング
を行い、最もマッチングがとれたところを中心に、その
周りの画像を切り出すことで、画像のトラッキングを可
能にしている。なお、ここで「画枠いっぱい」とは、背
景が何かがわからない程度に、ターゲット画像で埋め尽
くすことを言う。特にコミュニケーションにおける画像
伝送装置では、このターゲット画像は、顔画像である場
合が多い。
Upon receiving the image signal S502, the preprocessing circuit 503 extracts an image to be transmitted (hereinafter, referred to as a target image) from the captured image of the upper body of the user,
An image signal adjusted so as to fill the image frame of the image to be transmitted is generated and output to the video compression encoder 504 and the image synthesizing device 512. The pre-processing circuit 503 performs matching using, for example, an image of a characteristic portion of the transmission image as a process of fully fitting the target image to the image frame, and focuses the image around the most-matched image on the basis of the best matching. The clipping enables tracking of the image. Here, “full image frame” means that the target image is filled to the extent that the background is not known. In particular, in an image transmission apparatus for communication, the target image is often a face image.

【0053】以下に、前処理回路503の処理につい
て、さらに詳述する。
Hereinafter, the processing of the pre-processing circuit 503 will be described in more detail.

【0054】図4は、本第1の実施形態に係る前処理回
路の要部の具体的な構成例を示す回路図である。また、
図5は前処理回路におけるトラッキング処理を説明する
ための概略図である。
FIG. 4 is a circuit diagram showing a specific configuration example of a main part of the preprocessing circuit according to the first embodiment. Also,
FIG. 5 is a schematic diagram for explaining the tracking processing in the preprocessing circuit.

【0055】前処理回路503は、図4に示すように、
サーチ範囲抽出部5031、2値化部5032、パター
ンマッチング部5033、リファレンスメモリ部503
4、および矩形領域抽出部5035を有している。
The pre-processing circuit 503, as shown in FIG.
Search range extraction unit 5031, binarization unit 5032, pattern matching unit 5033, reference memory unit 503
4 and a rectangular area extraction unit 5035.

【0056】サーチ範囲抽出部5031は、リファレン
スメモリ部5034にある、図5(A)に示す前画像P
IMのリファレンス画像RIMの座標情報を元に、図5
(B)に示すサーチ範囲部分SRGを抽出する。
The search range extracting unit 5031 stores the previous image P in the reference memory unit 5034 shown in FIG.
5 based on the coordinate information of the IM reference image RIM.
The search range portion SRG shown in (B) is extracted.

【0057】2値化部5032は、サーチ範囲抽出部5
031で抽出されたサーチ範囲データの輝度信号を2値
化してパターンマッチング部5033に供給する。
The binarizing section 5032 includes a search range extracting section 5
The luminance signal of the search range data extracted in 031 is binarized and supplied to the pattern matching unit 5033.

【0058】パターンマッチング部5033は、2値化
部5032によるサーチ範囲データの輝度信号の2値化
データと、リファレンスメモリ部5034に格納されて
いる図5(A)に示す前画像PIMのリファレンス画像
RIMの2値化されたデータとの輝度情報のパターンマ
ッチング処理を行い、その結果を、矩形領域抽出部50
35に出力する。このパターンマッチング処理は、図5
(B)中に示すサーチ範囲部分SRG内で一致度が最も
高い位置の画像データMMTを採用し、これを現画像C
IMにおけるトラッキング結果とする。また、パターン
マッチング部5033は、この時のトラッキング結果で
ある一致度が最も高い位置の画像データMMTを次画像
におけるリファレンス画像としてリファレンスメモリ部
5034に格納する。
The pattern matching unit 5033 converts the binarized data of the luminance signal of the search range data by the binarizing unit 5032 and the reference image of the previous image PIM stored in the reference memory unit 5034 shown in FIG. A pattern matching process of the luminance information with the binarized data of the RIM is performed, and the result is referred to as a rectangular area extraction unit 50.
35. This pattern matching process is performed as shown in FIG.
(B) employs the image data MMT at the position with the highest matching degree in the search range portion SRG shown in FIG.
This is a tracking result in IM. In addition, the pattern matching unit 5033 stores the image data MMT at the position with the highest matching degree, which is the tracking result at this time, in the reference memory unit 5034 as a reference image in the next image.

【0059】矩形領域抽出部5035は、パターンマッ
チング部5033で得られたトラッキング結果MMTの
周りを含めた矩形領域を切り出して出力する。
The rectangular area extracting section 5035 cuts out and outputs a rectangular area including the periphery of the tracking result MMT obtained by the pattern matching section 5033.

【0060】このような構成を有する前処理回路503
では、ユーザが送信する所望の画像状態( 以後、これを
初期リファレンス画像と呼ぶ) を維持するために、入力
画像のトラッキングを行う。そして、トラッキングは伝
送フレームレートと同じか、それ以上のフレームレート
で行い、同時にトラッキングの基準となるリファレンス
画像も逐次更新する。
The preprocessing circuit 503 having such a configuration
Then, tracking of an input image is performed in order to maintain a desired image state transmitted by the user (hereinafter, referred to as an initial reference image). The tracking is performed at a frame rate equal to or higher than the transmission frame rate, and at the same time, a reference image serving as a tracking reference is sequentially updated.

【0061】前処理回路503におけるトラッキング
は、CPU516から初期リファレンス画像情報(図6
および図7を参照して後述する) が送信されると開始さ
れる。
The tracking in the pre-processing circuit 503 is performed by the CPU 516 from the initial reference image information (FIG. 6).
(To be described later with reference to FIG. 7 and FIG. 7).

【0062】まず、カメラ回路502により新しく入力
された、図5(B)に示すような、入力画像データ(現
画像)CIMは、リファレンスメモリ部5034に格納
されている前画像PIMのリファレンス画像RIMの座
標情報を元にサーチ範囲抽出部5031でサーチ範囲部
分SRGが抽出される。次に、抽出されたデータの輝度
信号は、2値化部5032で2値化された後、パターン
マッチング部5033で、リファレンスメモリ部503
4に格納されているリファレンス画像RIMの2値化さ
れたデータとの輝度情報のパターンマッチング処理が行
われる。この時のトラッキング結果である一致度が最も
高い位置の画像データMMTは、次画像におけるリファ
レンス画像としてリファレンスメモリ部5034に格納
され保持される。そして、矩形領域抽出部5035に
て、パターンマッチング部5033で得られたトラッキ
ング結果MMTの周りを含めた矩形領域が切り出されて
出力される。
First, the input image data (current image) CIM newly input by the camera circuit 502 as shown in FIG. 5B is stored in the reference memory unit 5034 as the reference image RIM of the previous image PIM. The search range extracting unit 5031 extracts a search range portion SRG based on the coordinate information of. Next, the luminance signal of the extracted data is binarized by a binarization unit 5032, and then a reference memory unit 503 by a pattern matching unit 5033.
4, a pattern matching process of the luminance information with the binarized data of the reference image RIM stored in the reference image RIM is performed. The image data MMT at the position with the highest coincidence, which is the tracking result at this time, is stored and held in the reference memory unit 5034 as a reference image in the next image. Then, the rectangular region including the periphery of the tracking result MMT obtained by the pattern matching unit 5033 is cut out and output by the rectangular region extraction unit 5035.

【0063】次に、初期リファレンス画像の第1および
第2の決定方法について、図6および図7に関連付けて
説明する。
Next, the first and second methods for determining the initial reference image will be described with reference to FIGS.

【0064】第1の決定方法は、伝送画像サイズ枠のモ
ニタリングを行うことにより決定する。具体的には、図
6(A)に示すように、初期画像IIM内に伝送画像サ
イズ枠FRを設定しておき、その枠FR内の画像をモニ
タ画像MNTaとして出力して、図6(B)に示すよう
に、図3の表示回路513により表示モニタ53に表示
させる。ユーザがモニタ出力を見て所望の画像状態に合
わせたところで、たとえばスイッチ56を押し込む操作
を行って画像ロック指示を発信することにより、図6
(C)に示すように、初期リファレンス画像IRIを決
定する。
The first determination method is determined by monitoring a transmission image size frame. Specifically, as shown in FIG. 6A, the transmission image size frame FR is set in the initial image IIM, and the image in the frame FR is output as the monitor image MNTa. As shown in ()), the display is displayed on the display monitor 53 by the display circuit 513 in FIG. When the user sees the monitor output and adjusts to the desired image state, for example, the user presses the switch 56 to transmit an image lock instruction, thereby making it possible to perform the operation shown in FIG.
As shown in (C), an initial reference image IRI is determined.

【0065】一方、第2の決定方法は、縮小画像のモニ
タリングを行うことにより決定する。具体的には、図7
(A)に示すように、初期画像IIMを縮小して、図7
(B)に示すようなモニタ画像MNTbとして出力し、
ユーザが所望のリファレンスのセンタと表示領域( 画像
取り込み範囲) をポインタPOI等を用いて指定するこ
とにより、初期リファレンス画像IRIを決定する。な
お、ポインタPOIの表示モニタ53上における移動指
示は、たとえばボールスイッチであるスイッチ56によ
り行われる。すなわち、スイッチ56を所望の方向に回
転させることにより、ポインタPOIを上下左右、ある
いは斜め方向に移動させる。
On the other hand, the second determination method is determined by monitoring a reduced image. Specifically, FIG.
As shown in FIG. 7A, the initial image IIM is reduced, and FIG.
Output as a monitor image MNTb as shown in (B),
The user designates a desired reference center and a display area (image capture range) using a pointer POI or the like, thereby determining an initial reference image IRI. The movement instruction of the pointer POI on the display monitor 53 is performed by a switch 56, for example, a ball switch. That is, by turning the switch 56 in a desired direction, the pointer POI is moved up, down, left, right, or obliquely.

【0066】このように、第1または第2の方法で決定
された初期リファレンス画像情報(座標情報、輝度情報)
はGUIインタフェース回路515からCPU516
を介して前処理回路503のリファレンスメモリ部50
34に送信される。
As described above, the initial reference image information (coordinate information, luminance information) determined by the first or second method
Are the GUI interface circuit 515 to the CPU 516
The reference memory unit 50 of the preprocessing circuit 503
34.

【0067】また、図3において、ビデオ圧縮符号化器
504は、前処理回路503で抽出された伝送すべき画
像データを圧縮符号化してマルチプレクサ506に出力
する。
In FIG. 3, the video compression encoder 504 compresses and encodes the image data to be transmitted extracted by the pre-processing circuit 503 and outputs the image data to the multiplexer 506.

【0068】音声圧縮符号化器505は、マイクロフォ
ン501による音声データを圧縮符号化してマルチプレ
クサ506に出力する。
The audio compression encoder 505 compresses and encodes the audio data from the microphone 501 and outputs it to the multiplexer 506.

【0069】マルチプレクサ506は、ビデオ圧縮符号
化器504で圧縮符号化された伝送すべき画像データ
と、音声圧縮符号化器505で圧縮符号化された音声の
ストリームとを多重化(マルチプレクス)して、伝送回
路507に出力する。
The multiplexer 506 multiplexes (multiplexes) the image data to be transmitted which has been compression-encoded by the video compression encoder 504 and the audio stream which has been compression-encoded by the audio compression encoder 505. Output to the transmission circuit 507.

【0070】伝送回路507は、マルチプレクサ506
による多重化された画像および音声データに所定の伝送
プロトコルの変換、変調を行って、無線基地局(MB
S)61−1または61−2に伝送する。
The transmission circuit 507 includes a multiplexer 506
Performs conversion and modulation of a predetermined transmission protocol on image and audio data multiplexed by the radio base station (MB).
S) Transmit to 61-1 or 61-2.

【0071】受信回路508は、コミュニケーション相
手から送信され、伝送路60を介した伝送信号を受信し
て、復調、伝送プロトコルの解凍を行いデマルチプレク
サ509に出力する。
The receiving circuit 508 receives a transmission signal transmitted from the communication partner and transmitted through the transmission path 60, demodulates the signal, decompresses the transmission protocol, and outputs the result to the demultiplexer 509.

【0072】デマルチプレクサ509は、受信回路50
8による画像および音声データを分離して、画像データ
ストリームをビデオ復号化器510に供給し、音声デー
タストリームを音声復号化器511に供給する。
The demultiplexer 509 is connected to the receiving circuit 50.
8, the image data and the audio data are separated, and the image data stream is supplied to the video decoder 510 and the audio data stream is supplied to the audio decoder 511.

【0073】ビデオ復号化器510は、デマルチプレク
サ509で分離された画像データストリームを復号して
画像合成装置512に出力する。
The video decoder 510 decodes the image data stream separated by the demultiplexer 509 and outputs it to the image synthesizer 512.

【0074】音声復号化器511は、デマルチプレクサ
509で分離された音声データストリームを復号してス
ピーカ514に供給し、再生させる。
The audio decoder 511 decodes the audio data stream separated by the demultiplexer 509, supplies it to the speaker 514, and reproduces it.

【0075】画像合成装置512は、前処理回路503
による端末を使用しているユーザの顔画像データとビデ
オ復号化器510によるたとえば相手方の顔画像デー
タ、あるいはアプリケーションサービスプロバイダ(A
SP)66による所定のコンテンツ画像を合成して表示
回路513に供給する。
The image synthesizing device 512 includes a pre-processing circuit 503
Face image data of a user using a terminal according to the present invention and face image data of the other party by the video decoder 510 or an application service provider (A
SP) 66 and synthesizes a predetermined content image and supplies it to the display circuit 513.

【0076】表示回路513は、画像合成装置512に
よる合成画像を受けて、図2および図3に示すように、
端末50−1(または50−2)の表示モニタ53に、
ユーザ自身の顔画像と伝送されてきた相手方の顔画像
を、たとえばカメラモジュール54のレンズ部分より上
側に並列に表示させ、所定のコンテンツ画像を下側に表
示する。
The display circuit 513 receives the synthesized image from the image synthesizing device 512, and as shown in FIGS. 2 and 3,
On the display monitor 53 of the terminal 50-1 (or 50-2),
The face image of the user and the transmitted face image of the other party are displayed in parallel above the lens portion of the camera module 54, for example, and a predetermined content image is displayed below.

【0077】GUIインタフェース回路515は、スイ
ッチ56を含み、またCPU516は、ユーザからの指
示に従って、画像ロック状態への移行、モニタ表示の切
り替え等、端末50−1(または50−2)全体を制御
する。
The GUI interface circuit 515 includes the switch 56, and the CPU 516 controls the entire terminal 50-1 (or 50-2) according to an instruction from the user, such as shifting to an image lock state and switching monitor display. I do.

【0078】次に、図3の端末50の動作を説明する。
たとえばユーザの上半身の画像がカメラモジュール54
のレンズ部分を通して撮像され、カメラ回路502にお
いて光信号から電気信号に変換され、ディジタル画像信
号S502として前処理回路503に入力される。この
ユーザの上半身の画像データは、画像合成装置512を
通して表示回路513に供給され、端末の表示モニタ5
3にユーザの上半身の画像である初期画像IIMが表示
される。ユーザは、表示モニタ53に表示されている自
身の上半身の画像、すなわち初期画像IIMを見なが
ら、たとえば第1の決定方法である伝送画像サイズ枠の
モニタリングを行うことにより初期リファレンス画像I
RIを決定する。すなわち、初期画像IIM内に伝送画
像サイズ枠FRを設定しておき、その枠FR内の画像を
モニタ画像MNTaとして出力して、表示回路513に
より表示モニタ53に表示させる。そして、ユーザがモ
ニタ出力を見て所望の画像状態に合わせたところで、た
とえばスイッチ56を押し込む操作を行って画像ロック
指示をCPU516に発信することにより、初期リファ
レンス画像IRIを決定する。
Next, the operation of the terminal 50 in FIG. 3 will be described.
For example, the image of the upper body of the user is stored in the camera module 54.
An image is taken through a lens portion of the camera circuit 502, is converted from an optical signal into an electric signal in a camera circuit 502, and is input to a preprocessing circuit 503 as a digital image signal S502. The image data of the upper body of the user is supplied to the display circuit 513 through the image synthesizing device 512, and is displayed on the display monitor 5 of the terminal.
3 displays an initial image IIM which is an image of the upper body of the user. The user monitors, for example, the transmission image size frame, which is the first determination method, while watching the image of the upper body of the user, that is, the initial image IIM displayed on the display monitor 53, to thereby display the initial reference image I.
Determine RI. That is, the transmission image size frame FR is set in the initial image IIM, the image in the frame FR is output as the monitor image MNTa, and displayed on the display monitor 53 by the display circuit 513. Then, when the user views the monitor output and adjusts to the desired image state, the user presses the switch 56 to transmit an image lock instruction to the CPU 516, thereby determining the initial reference image IRI.

【0079】そして、CPU516から初期リファレン
ス画像情報が送信されると前処理回路503におけるト
ラッキングが開始される。この状態で、カメラ回路50
2により新しく入力された入力画像データ(現画像)C
IMが、リファレンスメモリ部5034に格納されてい
る前画像PIMのリファレンス画像RIMの座標情報を
元にサーチ範囲抽出部5031でサーチ範囲部分SRG
が抽出される。次に、抽出されたデータの輝度信号が2
値化部5032で2値化された後、パターンマッチング
部5033で、リファレンスメモリ部5034に格納さ
れているリファレンス画像RIMの2値化されたデータ
との輝度情報のパターンマッチング処理が行われる。こ
の処理結果が、次画像におけるリファレンス画像として
リファレンスメモリ部5034に格納され保持される。
そして、矩形領域抽出部5035にて、パターンマッチ
ング部5033で得られたトラッキング結果MMTの周
りのある矩形領域が切り出されて、ビデオ圧縮符号化器
504および画像合成装置512に供給される。
When the initial reference image information is transmitted from the CPU 516, the tracking in the preprocessing circuit 503 is started. In this state, the camera circuit 50
2. Input image data (current image) C newly input by
The IM is searched by the search range extraction unit 5031 based on the coordinate information of the reference image RIM of the previous image PIM stored in the reference memory unit 5034.
Is extracted. Next, the luminance signal of the extracted data is 2
After being binarized by the binarizing unit 5032, the pattern matching unit 5033 performs a pattern matching process of luminance information with binarized data of the reference image RIM stored in the reference memory unit 5034. The processing result is stored and held in the reference memory unit 5034 as a reference image in the next image.
Then, a rectangular area around the tracking result MMT obtained by the pattern matching section 5033 is cut out by the rectangular area extraction section 5035 and supplied to the video compression encoder 504 and the image synthesis apparatus 512.

【0080】このような状態において、マイクロフォン
501で取り込まれた音声は、ディジタルに変換された
後、音声圧縮符号化器505で圧縮される。そして、上
述したように前処理回路503による画像データは、ビ
デオ圧縮符号化器504で圧縮符号化され、圧縮された
音声のストリームと、マルチプレクサ506でマルチプ
レクスされて、伝送回路507に供給される。そして、
伝送回路507において、多重化データを受けて、伝送
プロトコルの変換、変調が行われて、たとえば無線基地
局61−1に伝送され、伝送路60を伝送されて相手の
たとえば端末50−2に送り届けられる。
In such a state, the voice fetched by the microphone 501 is converted into a digital signal and then compressed by the voice compression encoder 505. Then, as described above, the image data from the pre-processing circuit 503 is compression-encoded by the video compression encoder 504, multiplexed with the compressed audio stream by the multiplexer 506, and supplied to the transmission circuit 507. . And
The transmission circuit 507 receives the multiplexed data, converts and modulates the transmission protocol, transmits the multiplexed data to, for example, the wireless base station 61-1 and transmits the multiplexed data to the other party, for example, the terminal 50-2. Can be

【0081】また、逆に相手方から届いた伝送信号は、
受信回路508に取りこまれ、復調、伝送プロトコルの
解凍が行われた後、デマルチプレクサ509において音
声と画像のストリームに分離される。分離された音声ス
トリームは、音声復号化器511で復号され、スピーカ
514に送られ、再生される。画像ストリームは、ビデ
オ復号化器510で復号化された後、画像合成装置51
2で、前処理回路503によるユーザ自身の画像と合成
される。この合成画像データは、表示回路513に供給
され、表示モニタ53に表示される。このとき、表示モ
ニタ53には、ユーザ自身の顔画像と伝送されてきた相
手方の顔画像が、たとえばカメラモジュール54のレン
ズ部分より上側に並列に表示され、また、所定のコンテ
ンツ画像は下側に表示される。
On the other hand, the transmission signal arriving from the other party is
After being taken into the receiving circuit 508, demodulation and decompression of the transmission protocol are performed, the signal is separated by the demultiplexer 509 into audio and video streams. The separated audio stream is decoded by the audio decoder 511, sent to the speaker 514, and reproduced. After the image stream is decoded by the video decoder 510, the image
In step 2, the image is combined with the user's own image by the preprocessing circuit 503. The composite image data is supplied to the display circuit 513 and displayed on the display monitor 53. At this time, the face image of the user and the transmitted face image of the other party are displayed in parallel on the display monitor 53, for example, above the lens portion of the camera module 54, and the predetermined content image is displayed below. Is displayed.

【0082】以上説明したように、本第1の実施形態に
よれば、複数端末50−1,50−2間で、コミュニケ
ーション等を行う場合、ターゲット画像が伝送する画像
の画枠いっぱいになるよう合わせた後に、圧縮し、伝送
するようにしたので、コミュニケーションに最も必要な
相手の表情を伝送しつつ、情報量を極力削減することが
可能となる。また、画枠いっぱいに、顔画像を合わせる
ことから、解像度の高い背景画像の伝送を自然に削除す
ることができ、圧縮後の情報量を、大幅に削減できる。
これにより、高画質の画像を伝送することが可能とな
る。さらに、画像のフレーム相関性を大幅に向上させる
ことができ、画像圧縮の手法に、MPEGのようなイン
ターフレーム圧縮を行う圧縮技術を使用することで、情
報量の大幅な削減が可能になり、これにより、高画質の
画像を伝送することが可能となる。
As described above, according to the first embodiment, when communication or the like is performed between the plurality of terminals 50-1 and 50-2, the target image fills the image frame of the image to be transmitted. After the adjustment, the data is compressed and transmitted, so that it is possible to reduce the amount of information as much as possible while transmitting the expression of the partner most necessary for communication. In addition, since the face image is matched to the entire image frame, transmission of the background image with high resolution can be naturally deleted, and the amount of information after compression can be greatly reduced.
This makes it possible to transmit high-quality images. Furthermore, the frame correlation of an image can be greatly improved, and the amount of information can be significantly reduced by using a compression technique for performing inter-frame compression such as MPEG as an image compression method. This makes it possible to transmit high-quality images.

【0083】また、ユーザの伝送したい画像の状態(画
像ロックの状態)を、自動的にキープすることができ、
また、画像の特徴部分の検出を助け、人物画像等のター
ゲット画像のトラッキングが可能となる。その結果、画
像の時間軸方向の相関性が高まり、圧縮後の情報量の削
減が可能となり、これにより、高画質の画像を伝送する
ことが可能となる。
Further, the state of the image to be transmitted by the user (the state of the image lock) can be automatically kept,
Further, it assists in detecting a characteristic portion of an image, and enables tracking of a target image such as a human image. As a result, the correlation in the time axis direction of the image is increased, and the amount of information after compression can be reduced. As a result, a high-quality image can be transmitted.

【0084】また、顔画像と、話題のコンテンツを上下
に表示モニタ53に配置させ、その中間付近にカメラモ
ジュール54のレンズ部分を配置したので、互いの目線
がよりあった状態を実現できる。また、互いに、話題の
映像を見ながら話をしている様子を伝えることができ、
また、モニタ上の互いの顔を見れば、目線が合うとい
う、バーチャルリアリティのコミュニケーションを実現
できる利点がある。さらに、伝送路60の中に、コンテ
ンツ配信を可能とするアプリケーションサービスプロバ
イダ66を立ち上げ、アプリケーションサービスプロバ
イダ66に用意したコンテンツCONTを、関門局65
を通じて、端末50−1,50−2に、同じ映像を出力
することができる。
Further, since the face image and the topic content are arranged vertically on the display monitor 53, and the lens portion of the camera module 54 is arranged near the middle thereof, it is possible to realize a state in which the eyes of each other are better. In addition, we can tell each other how we are talking while watching the video of the topic,
In addition, there is an advantage that virtual reality communication can be realized, that is, the eyes are aligned when the faces of each other are viewed on the monitor. Further, an application service provider 66 that enables content distribution is set up in the transmission path 60, and the content CONT prepared by the application service provider 66 is transferred to the gateway station 65.
, The same video can be output to the terminals 50-1 and 50-2.

【0085】第2実施形態 図8は、本発明に係るデータ伝送装置としての端末の信
号処理系の第2の実施形態を示す回路図である。
Second Embodiment FIG. 8 is a circuit diagram showing a second embodiment of a signal processing system of a terminal as a data transmission device according to the present invention.

【0086】本第2の実施形態に係る端末の信号処理系
と上述した第1の実施形態に係る信号処理系と異なる点
は、前処理回路503AおよびCPU516Aの処理に
ある。具体的には、コミュニケーション等を行う場合、
入力画像内から顔器官を検出し、この情報から顔の大き
さを計算してモニタ内に一杯に顔画像を表示するように
拡大縮小を行い、顔画像を切り出す。この場合、伝送す
べき画像の特徴部分の画像を利用して、特徴部分の距離
を算出し、これにより、画像の拡大、縮小、トラッキン
グを行う。特に顔画像の場合には、この特徴部分に、た
とえば目の部分を取りだし、2つの目の距離から、リフ
ァレンス画像と同じ距離になるように、画像の拡大、縮
小値を決定し、トラッキングを行う。また、特徴部分と
しては、目、鼻、口、耳、顔輪郭の器官部分の少なくと
も一部を利用し、その大きさ、距離から、画像の拡大、
縮小、トラッキングを行う。
The difference between the signal processing system of the terminal according to the second embodiment and the signal processing system according to the first embodiment described above lies in the processing of the preprocessing circuit 503A and the CPU 516A. Specifically, when communicating, etc.,
A face organ is detected from the input image, the size of the face is calculated from this information, the image is scaled up and down so that the face image is fully displayed on the monitor, and the face image is cut out. In this case, the distance of the characteristic portion is calculated by using the image of the characteristic portion of the image to be transmitted, and thereby the enlargement, reduction, and tracking of the image are performed. In particular, in the case of a face image, for example, an eye portion is taken out of this characteristic portion, and the enlargement / reduction values of the image are determined from the distance between the two eyes so as to be the same distance as the reference image, and tracking is performed. . In addition, as a characteristic portion, at least a part of an organ portion of an eye, a nose, a mouth, an ear, and a face contour is used.
Perform reduction and tracking.

【0087】その他の構成は、図3に示す構成と同様で
ある。したがって、図8においては、図3と同一構成部
分は同一符号をもって表している。すなわち、端末の信
号処理系500Aは、図8に示すように、マイクロフォ
ン501、カメラ回路502、前処理回路503A、ビ
デオ圧縮符号化器504、音声圧縮符号化器505、マ
ルチプレクサ(MUX)506、伝送回路507、受信
回路508、デマルチプレクサ(DeMUX)509、
ビデオ復号化器510、音声復号化器511、画像合成
装置512、表示回路513、スピーカ514、GUI
インタフェース(I/F)回路515、およびCPU5
16Aを有している。
The other structure is the same as the structure shown in FIG. Therefore, in FIG. 8, the same components as those in FIG. 3 are denoted by the same reference numerals. That is, as shown in FIG. 8, the signal processing system 500A of the terminal includes a microphone 501, a camera circuit 502, a preprocessing circuit 503A, a video compression encoder 504, an audio compression encoder 505, a multiplexer (MUX) 506, a transmission A circuit 507, a receiving circuit 508, a demultiplexer (DeMUX) 509,
Video decoder 510, audio decoder 511, image synthesizer 512, display circuit 513, speaker 514, GUI
Interface (I / F) circuit 515 and CPU 5
16A.

【0088】このように前処理回路503AおよびCP
U516Aの機能が第1の実施形態と異なることから、
ここでは前処理回路503AおよびCPU516Aの機
能についてのみ詳述し、その他の構成部分についての説
明は省略する。
Thus, preprocessing circuits 503A and CP
Since the function of U516A is different from the first embodiment,
Here, only the functions of the preprocessing circuit 503A and the CPU 516A will be described in detail, and description of the other components will be omitted.

【0089】図9は、本第2の実施形態に係る前処理回
路の要部の具体的な構成例を示す回路図である。なお、
図9においては、理解を容易にするためにCPU516
Aを含めて図示している。
FIG. 9 is a circuit diagram showing a specific configuration example of a main part of a preprocessing circuit according to the second embodiment. In addition,
In FIG. 9, for easy understanding, the CPU 516
A is also illustrated.

【0090】本前処理回路503Aは、図9に示すよう
に、顔器官位置検出部5036、画像拡大縮小部503
7、画像切り出し部5038、およびリファレンス顔画
像記憶部5039を有している。
As shown in FIG. 9, the pre-processing circuit 503A includes a face organ position detecting section 5036 and an image scaling section 503.
7, an image cutout unit 5038, and a reference face image storage unit 5039.

【0091】顔器官位置検出部5036は、CPU51
6Aによる顔位置の初期範囲の情報である顔器官検出サ
ーチ範囲内で、顔の器官、たとえば、両目、鼻、口、
眉、耳、顔の輪郭の位置等を輝度、色情報を利用して、
検出し、検出した顔器官の位置情報S5036をCPU
516Aに供給する。
The face organ position detecting section 5036
Within the face organ detection search range, which is information on the initial range of the face position according to 6A, the face organs, for example, both eyes, nose, mouth,
Using the brightness and color information, the position of eyebrows, ears, face outline, etc.
The position information S5036 of the detected face organ is detected by the CPU.
516A.

【0092】画像拡大縮小部5037は、CPU516
Aにおいて計算された拡大/縮小率に基づいて、入力画
像の拡大または縮小を行い画像切り出し部5038に供
給する。
The image enlargement / reduction unit 5037 includes a CPU 516
Based on the enlargement / reduction ratio calculated in A, the input image is enlarged or reduced and supplied to the image cutout unit 5038.

【0093】画像切り出し部5038は、CPU516
Aからすでに送られている顔の位置情報(座標等)をも
とに、拡大または縮小画像から、モニタ画面内において
表示される領域の顔画像を切り出す。
The image cut-out unit 5038 is provided with a CPU 516
A face image of an area displayed in the monitor screen is cut out from the enlarged or reduced image based on the face position information (coordinates and the like) already sent from A.

【0094】リファレンス顔画像記憶部5039には、
切り出された顔画像が送られる。この際、この画像と拡
大/縮小率からリファレンス画像が構成される。
The reference face image storage unit 5039 stores
The cut out face image is sent. At this time, a reference image is composed of this image and the enlargement / reduction ratio.

【0095】次に、CPU516Aの処理を含めて、前
処理回路503Aの動作を、図10〜図15に関連付け
て説明する。図10は顔の大きさの計算例を説明するた
めの図、図11は顔器官検出サーチ範囲例を説明するた
めの図、図12および図13は顔器官検出サーチ範囲の
顔画像を縮小して表示モニタに表示させる処理を説明す
るための図、図14および図15は顔器官検出サーチ範
囲の顔画像を拡大して表示モニタに表示させる処理を説
明するための図である。
Next, the operation of the preprocessing circuit 503A, including the processing of the CPU 516A, will be described with reference to FIGS. FIG. 10 is a diagram for explaining an example of calculation of the face size, FIG. 11 is a diagram for explaining an example of a face organ detection search range, and FIGS. 14 and 15 are diagrams for explaining a process of enlarging a face image in a face organ detection search range and displaying the image on a display monitor.

【0096】まず、入力画像の第一番目(初期画像)に
関しては、ユーザからのGUIインタフェース回路51
5(スイッチ56)による指定により顔位置の初期範囲
の情報がCPU516Aに供給される。CPU516A
では、送られた初期範囲が顔器官検出サーチ範囲信号S
516aとして顔器官位置検出部5036に供給され
る。
First, as for the first (initial image) of the input image, the GUI interface circuit 51
5 (switch 56), the information of the initial range of the face position is supplied to the CPU 516A. CPU 516A
Then, the transmitted initial range is the face organ detection search range signal S
516a is supplied to the face organ position detection unit 5036.

【0097】顔器官位置検出部5036では、供給され
たサーチ範囲内で、顔の器官、たとえば、両目、鼻、
口、眉、耳、顔の輪郭の位置等が、輝度、色情報を利用
して、検出される。そして、顔器官位置検出部5036
で検出された顔器官の位置情報は、信号S5036とし
てCPU516Aに供給される。
The face organ position detecting unit 5036 detects the face organs, for example, both eyes, nose,
The positions of the mouth, eyebrows, ears, face outline, and the like are detected using luminance and color information. Then, the face organ position detecting unit 5036
Is supplied to the CPU 516A as a signal S5036.

【0098】CPU516Aでは、顔器官の位置情報を
もとに、画像内での顔の大きさの計算が行われる。たと
えば、図10に示すように、検出された両目の距離a、
目と口の垂直方向の距離bとしたときに、顔の大きさ
は、横方向に3a、縦方向に4bとする。なお、この場
合、顔の肌色を検出して輪郭を抽出し、その大きさから
顔の大きさを計算してもよい。
The CPU 516A calculates the size of the face in the image based on the position information of the face organ. For example, as shown in FIG.
When the distance b between the eyes and the mouth in the vertical direction is set, the size of the face is 3a in the horizontal direction and 4b in the vertical direction. In this case, the outline of the face may be extracted by detecting the skin color of the face, and the size of the face may be calculated from the size.

【0099】また、CPU516Aでは、顔器官の位置
情報をもとに、次の画像の顔器官検出サーチ範囲の計算
が行われる。たとえば、図11に示すように、両目と口
を含むax bの矩形のまわりに水平方向に±ax N、垂
直方向には、+bx M、−bx Lの範囲を次の画像の顔
器官検出サーチ範囲とする。なお、サーチ範囲は、入力
画像より大きくなることはない。
Further, the CPU 516A calculates the face organ detection search range of the next image based on the position information of the face organ. For example, as shown in FIG. 11, a range of ± ax N in the horizontal direction and a range of + bx M and -bx L in the vertical direction around an ax b rectangle including both eyes and a mouth are included in the face image detection search of the next image. Range. Note that the search range does not become larger than the input image.

【0100】第二番目以降の入力画像に関しては、前画
像において求めた顔器官検出サーチ範囲がCPU516
Aにより顔器官位置検出部5036に供給される。顔器
官位置検出部5036では、供給されたサーチ範囲内
で、上記したと同様に、顔器官の位置が検出される。こ
のとき、リファレンス顔画像記憶部5039において記
憶されている前画像の顔部分の情報が顔器官検出のため
のリファレンス画像として、使用される。顔器官位置検
出部5036で検出された顔器官の位置情報は、CPU
516Aに信号S5036として供給される。そして、
CPU516Aにおいて、初期画像の場合と同様に、画
像内での顔の大きさと次の画像の顔器官検出サーチ範囲
の計算が行われる。なお、図12および図14は、顔器
官のサーチ範囲を示したものである。
For the second and subsequent input images, the face organ detection search range obtained in the previous image is determined by the CPU 516.
A supplies it to the face organ position detection unit 5036. The face organ position detection unit 5036 detects the position of the face organ in the supplied search range in the same manner as described above. At this time, information on the face portion of the previous image stored in the reference face image storage unit 5039 is used as a reference image for detecting a face organ. The facial organ position information detected by the facial organ position detection unit 5036 is
516A is supplied as a signal S5036. And
As in the case of the initial image, the CPU 516A calculates the size of the face in the image and the search range for the face organ detection of the next image. FIGS. 12 and 14 show the search range of the face organ.

【0101】次に、CPU516Aにおいて、計算され
た顔の大きさから拡大または縮小の倍率が計算される。
この倍率は、ユーザの顔が表示されるモニタ画面内にお
いて顔画像が一杯に表示されるように顔が拡大または縮
小されるだけの倍率である。たとえば、図13に示すよ
うに、顔の横方向の大きさ3aとモニタ画面の横方向の
大きさdから縮小率d/3aが計算される。また、図1
5の場合には、拡大率d/3a’が計算される。
Next, the CPU 516A calculates an enlargement or reduction magnification from the calculated face size.
This magnification is such that the face is enlarged or reduced so that the face image is fully displayed in the monitor screen on which the user's face is displayed. For example, as shown in FIG. 13, the reduction rate d / 3a is calculated from the horizontal size 3a of the face and the horizontal size d of the monitor screen. FIG.
In the case of 5, the enlargement ratio d / 3a 'is calculated.

【0102】CPU516Aにおいて計算された倍率
は、信号S516cとして画像拡大縮小部5037に供
給される。画像拡大縮小部5037において、信号S5
16cに基づいて入力画像の拡大または縮小が行われ
る。拡大または縮小された画像は、画像切り出し部50
38に供給される。画像切り出し部5038では、CP
U516Aからすでに信号S516bとして供給されて
いる顔の位置情報(座標等)をもとに、拡大または縮小
画像から、モニタ画面内において表示される領域の顔画
像が切り出される。
The magnification calculated by the CPU 516A is supplied to the image enlargement / reduction unit 5037 as a signal S516c. In the image scaling unit 5037, the signal S5
The input image is enlarged or reduced based on 16c. The enlarged or reduced image is output to the image cutout unit 50.
38. In the image clipping unit 5038, the CP
Based on the face position information (coordinates and the like) already supplied as the signal S516b from the U516A, the face image of the area displayed in the monitor screen is cut out from the enlarged or reduced image.

【0103】図13および図15は、それぞれ、入力画
像内の顔の大きさがモニタ画面よりも大きい場合と入力
画像内の顔の大きさがモニタ画面よりも小さい場合を示
している。入力画像の顔の大きさは異なるが、どちらも
モニタ画面に表示される顔画像の大きさは同じとなる。
FIGS. 13 and 15 show the case where the size of the face in the input image is larger than the monitor screen and the case where the size of the face in the input image is smaller than the monitor screen, respectively. Although the size of the face of the input image is different, the size of the face image displayed on the monitor screen is the same in both cases.

【0104】切り出された顔画像は、後段のビデオ圧縮
符号化器504および画像合成装置512に供給され
る。また、リファレンス顔画像記憶部5039には、切
り出された顔画像が送られる。この際、この画像と拡大
縮小率からリファレンス画像が構成される。
The cut-out face image is supplied to the video compression encoder 504 and the image synthesizing unit 512 at the subsequent stage. The cut-out face image is sent to the reference face image storage unit 5039. At this time, a reference image is formed from this image and the scaling ratio.

【0105】本第2の実施形態によれば、上述した第1
の実施形態の効果と同様の効果を得ることができる。
According to the second embodiment, the above-described first embodiment
The same effect as that of the embodiment can be obtained.

【0106】第3実施形態 図16は、本発明に係るデータ伝送装置としての端末の
信号処理系の第3の実施形態を示す回路図である。ま
た、図17は、第3の実施形態に係る前処理回路の要部
の具体的な構成例を示す回路図である。
Third Embodiment FIG. 16 is a circuit diagram showing a third embodiment of a signal processing system of a terminal as a data transmission device according to the present invention. FIG. 17 is a circuit diagram showing a specific configuration example of a main part of a preprocessing circuit according to the third embodiment.

【0107】本第3の実施形態に係る端末の信号処理系
と上述した第2の実施形態に係る信号処理系と異なる点
は、前処理回路503BおよびCPU516Bの処理に
ある。具体的には、ユーザによって指定された顔画像の
大きさを常に保つように顔画像の拡大縮小を行い、顔画
像を切り出す。そのために、前処理回路503Bは、図
9の回路に対して、モニタと顔画像の比率記憶部504
0を追加した回路構成となっている。
The difference between the signal processing system of the terminal according to the third embodiment and the signal processing system according to the second embodiment described above lies in the processing of the preprocessing circuit 503B and the CPU 516B. Specifically, the face image is scaled up and down so as to always keep the size of the face image specified by the user, and the face image is cut out. For this purpose, the pre-processing circuit 503B is different from the circuit of FIG.
It has a circuit configuration in which 0 is added.

【0108】その他の構成は、図8および図9に示す構
成と同様である。したがって、図16および図17にお
いては、図8および図9と同一構成部分は同一符号をも
って表している。すなわち、端末の信号処理系500B
は、図16に示すように、マイクロフォン501、カメ
ラ回路502、前処理回路503B、ビデオ圧縮符号化
器504、音声圧縮符号化器505、マルチプレクサ
(MUX)506、伝送回路507、受信回路508、
デマルチプレクサ(DeMUX)509、ビデオ復号化
器510、音声復号化器511、画像合成装置512、
表示回路513、スピーカ514、GUIインタフェー
ス(I/F)回路515、およびCPU516Bを有し
ている。
Other structures are the same as those shown in FIGS. 8 and 9. Therefore, in FIGS. 16 and 17, the same components as those in FIGS. 8 and 9 are denoted by the same reference numerals. That is, the signal processing system 500B of the terminal
As shown in FIG. 16, a microphone 501, a camera circuit 502, a pre-processing circuit 503B, a video compression encoder 504, an audio compression encoder 505, a multiplexer (MUX) 506, a transmission circuit 507, a reception circuit 508,
A demultiplexer (DeMUX) 509, a video decoder 510, an audio decoder 511, an image synthesizer 512,
The display includes a display circuit 513, a speaker 514, a GUI interface (I / F) circuit 515, and a CPU 516B.

【0109】本前処理回路503Bは、図17に示すよ
うに、顔器官位置検出部5036、画像拡大縮小部50
37、画像切り出し部5038、リファレンス顔画像記
憶部5039、およびモニタと顔画像の比率記憶部50
40を有している。
As shown in FIG. 17, the pre-processing circuit 503B includes a face organ position detecting section 5036 and an image scaling section 50.
37, an image cutout unit 5038, a reference face image storage unit 5039, and a monitor-to-face image ratio storage unit 50
40.

【0110】このように前処理回路503BおよびCP
U516Bの機能の一部が第2の実施形態と異なること
から、ここでは前処理回路503BおよびCPU516
Bの機能についてのみ詳述し、その他の構成部分につい
ての説明は省略する。
As described above, the preprocessing circuits 503B and CP
Since some of the functions of the U516B are different from those of the second embodiment, the preprocessing circuit 503B and the CPU
Only the function B will be described in detail, and description of the other components will be omitted.

【0111】モニタと顔画像の比率記憶部5040は、
CPU516Bにおいて抽出された顔器官の位置情報を
もとに、モニタ画面に表示する顔の大きさ、モニタ内の
顔の位置を計算するための値が記憶される。記憶データ
は、第二番目以降の入力画像において、リファレンス値
として使用される。
The monitor-to-face image ratio storage unit 5040 stores
Based on the facial organ position information extracted by the CPU 516B, the size of the face to be displayed on the monitor screen and the value for calculating the position of the face in the monitor are stored. The stored data is used as a reference value in the second and subsequent input images.

【0112】次に、CPU516Bの処理を含めて、前
処理回路503Bの動作を、図18〜図22に関連付け
て説明する。図18および図19は指定した伝送画像範
囲の顔画像を縮小して表示モニタに表示させる処理を説
明するための図、図20は顔の肌色である画素数eとモ
ニタ画像内の画素数fの比率ついて説明するための図、
図21および図22は顔器官検出サーチ範囲の顔画像を
縮小して表示モニタに表示させる処理を説明するための
図である。
Next, the operation of the preprocessing circuit 503B, including the processing of the CPU 516B, will be described with reference to FIGS. 18 and 19 are diagrams for explaining a process of reducing a face image in a designated transmission image range and displaying the reduced image on a display monitor. FIG. Figure for explaining the ratio of
FIGS. 21 and 22 are diagrams for explaining a process of reducing the face image in the face organ detection search range and displaying the reduced face image on the display monitor.

【0113】まず、第一番目の画面内(初期画面内)で
ユーザがモニタに表示させたい(伝送させたい)自分の
顔の範囲をたとえば表示モニタのGUI上で指定し、そ
の範囲の情報が、CPU516Bに供給される。この範
囲は、モニタと相似であるとユーザにとって範囲の指定
が行いやすい。
First, in the first screen (in the initial screen), the user specifies a range of his / her face to be displayed (transmitted) on the monitor, for example, on a GUI of a display monitor, and the information of the range is displayed. , CPU 516B. If this range is similar to the monitor, it is easy for the user to specify the range.

【0114】CPU516Bでは、供給された初期範囲
が顔器官検出サーチ範囲信号S516aとして顔器官位
置検出部5036に供給される。顔器官位置検出部50
36では、供給されたサーチ範囲内で、顔の器官、たと
えば、両目、鼻、口、眉、耳、顔の輪郭の位置等が検出
される。顔器官位置検出部5036で検出された顔器官
の位置情報は、信号S5036としてCPU516Bに
供給される。
In the CPU 516B, the supplied initial range is supplied to the face organ position detecting section 5036 as a face organ detection search range signal S516a. Facial organ position detector 50
At 36, the facial organs, for example, the eyes, nose, mouth, eyebrows, ears, and the position of the contour of the face are detected within the supplied search range. The face organ position information detected by the face organ position detection unit 5036 is supplied to the CPU 516B as a signal S5036.

【0115】CPU516Bでは、顔器官の位置情報を
もとに、モニタ画面に表示する顔の大きさ、モニタ内の
顔の位置を計算するための値が抽出される。たとえば、
入力画像の第一番目(初期画像)においては、図19に
示すように、ユーザが指定した範囲の横方向の大きさ
c、初期画像内の顔の両目間の距離a、表示モニタ53
の横方向の距離dなどの値が使用できる。または、図2
0に示すように、顔の肌色を検出して、肌色である画素
数eとモニタ画像内の画素数fの比率を計算してもよ
い。これらの値は、比率記憶部5040に送られ、第二
番目以降の入力画像において、リファレンス値として使
用される。なお、この値は、CPU516B内に記憶さ
れてもよい。
The CPU 516B extracts a value for calculating the size of the face displayed on the monitor screen and the position of the face in the monitor based on the position information of the face organ. For example,
In the first (initial image) of the input image, as shown in FIG. 19, the horizontal size c of the range specified by the user, the distance a between the eyes of the face in the initial image, the display monitor 53
Can be used. Or Figure 2
As shown by 0, the skin color of the face may be detected, and the ratio of the number of pixels e, which is the skin color, to the number of pixels f in the monitor image may be calculated. These values are sent to the ratio storage unit 5040 and used as reference values in the second and subsequent input images. Note that this value may be stored in CPU 516B.

【0116】また、CPU516Bでは、顔器官の位置
情報をもとに、次の画像の顔器官検出サーチ範囲が計算
される。たとえば、第2の実施形態の場合と同等に、図
11に示すように、両目と口を含むax bの矩形のまわ
りに水平方向に±ax N、垂直方向には、+bx M、−
bx Lの範囲を次の画像の顔器官検出サーチ範囲とす
る。
Further, the CPU 516B calculates the face organ detection search range of the next image based on the face organ position information. For example, as in the case of the second embodiment, as shown in FIG. 11, ± ax N in the horizontal direction around the rectangle of ax b including both eyes and the mouth, and + bx M,-in the vertical direction.
The range of bx L is defined as a face organ detection search range of the next image.

【0117】第二番目以降の入力画像に関しては、前画
像において求めた顔器官検出サーチ範囲がCPU516
Bから顔器官位置検出部5036に供給される。顔器官
位置検出部5036では、供給されたサーチ範囲内で、
上記と同様に、顔の器官の位置が検出される。このと
き、リファレンス顔画像記憶部5039において記憶さ
れている前画像の顔部分の情報が、顔器官検出のための
リファレンス画像として使用される。顔器官位置検出部
5036で検出された顔器官の位置情報は、信号S50
36としてCPU516Bに供給される。
For the second and subsequent input images, the CPU 516 determines the face organ detection search range obtained in the previous image.
B supplies the face organ position detection unit 5036. In the face organ position detecting unit 5036, within the supplied search range,
Similarly to the above, the position of the facial organ is detected. At this time, the information of the face part of the previous image stored in the reference face image storage unit 5039 is used as a reference image for detecting a face organ. The facial organ position information detected by the facial organ position detecting unit 5036 is represented by a signal S50.
36 is supplied to the CPU 516B.

【0118】そして、CPU516Bにおいて、表示モ
ニタ53に表示するために拡大または縮小の倍率が計算
される。第一画面(初期画面)においては、たとえば、
比率記憶部5040に記憶されているユーザが指定した
範囲の横方向の長さcとモニタ画面の横方向の長さdと
から縮小率d/cが計算される。第二画面以降に関して
は、顔器官位置検出部5036から送られる顔位置情報
と比率記憶部5040に記憶されているリファレンス値
から比率が計算される。たとえば、図22に示すよう
に、顔器官位置検出部5036からの両目の距離a’と
比率記憶部5040にリファレンス値として記憶されて
いる初期画像の両目の距離aから縮小率a’/aが計算
される。または、顔器官位置検出部5036からの肌色
の画素数gと比率記憶部5040に記憶されている初期
画像の肌色の画素数eから縮小率を求めてもよい。
Then, the CPU 516B calculates an enlargement or reduction magnification for displaying on the display monitor 53. On the first screen (initial screen), for example,
The reduction ratio d / c is calculated from the horizontal length c of the range designated by the user and the horizontal length d of the monitor screen stored in the ratio storage unit 5040. For the second and subsequent screens, the ratio is calculated from the face position information sent from the face organ position detection unit 5036 and the reference value stored in the ratio storage unit 5040. For example, as shown in FIG. 22, the reduction ratio a ′ / a is calculated based on the distance a ′ between both eyes from the face organ position detecting unit 5036 and the distance a between eyes of the initial image stored as a reference value in the ratio storage unit 5040. Is calculated. Alternatively, the reduction ratio may be obtained from the number g of skin color pixels from the face organ position detection unit 5036 and the number e of skin color pixels of the initial image stored in the ratio storage unit 5040.

【0119】CPU516Bにおいて計算された倍率
は、信号S516cとして画像拡大縮小部5037に供
給される。画像拡大縮小部5037において、信号S5
16cに基づいて入力画像の拡大または縮小が行われ
る。拡大または縮小された画像は、画像切り出し部50
38に供給される。画像切り出し部5038では、CP
U516Bからすでに信号S516bとして供給されて
いる顔の位置情報(座標等)をもとに、拡大または縮小
画像から、モニタ画面内において表示される領域の顔画
像が切り出される。
The magnification calculated by the CPU 516B is supplied to the image enlargement / reduction unit 5037 as a signal S516c. In the image scaling unit 5037, the signal S5
The input image is enlarged or reduced based on 16c. The enlarged or reduced image is output to the image cutout unit 50.
38. In the image clipping unit 5038, the CP
Based on the face position information (coordinates and the like) already supplied as the signal S516b from the U516B, the face image of the area displayed in the monitor screen is cut out from the enlarged or reduced image.

【0120】図22は、モニタ画面よりも大きい入力画
像内の顔の大きさが、初期画面においてユーザから指定
された顔の大きさと同じに表示されるように縮小され、
モニタ画面に表示される顔画像の大きさが常に同じにな
る様子を示している。入力画像内の顔が初期画像よりも
小さい時は、拡大処理が行われる。
FIG. 22 shows that the size of the face in the input image larger than the monitor screen is reduced so as to be displayed on the initial screen in the same size as the face specified by the user.
The figure shows that the size of the face image displayed on the monitor screen is always the same. When the face in the input image is smaller than the initial image, enlargement processing is performed.

【0121】切り出された顔画像は、後段のビデオ圧縮
符号化器504および画像合成装置512に供給され
る。また、リファレンス顔画像記憶部5039には、切
り出された顔画像が送られる。この際、この画像と拡大
縮小率からリファレンス画像が構成される。
The extracted face image is supplied to the video compression encoder 504 and the image synthesizing device 512 at the subsequent stage. The cut-out face image is sent to the reference face image storage unit 5039. At this time, a reference image is formed from this image and the scaling ratio.

【0122】本第3の実施形態によれば、上述した第1
の実施形態の効果と同様の効果を得ることができる。
According to the third embodiment, the above-described first embodiment
The same effect as that of the embodiment can be obtained.

【0123】第4実施形態 次に、画像のトラッキング精度を向上させるために、伝
送される画像と同じか、または、それ以上のフレームレ
ートにて、画像を取り込み、トラッキング操作を行い、
伝送フレームレートと同じか、それ以上のレートで、ト
ラッキングのための基準となるリファレンス画像を更新
する具体例を本発明の第4の実施形態として説明する。
Fourth Embodiment Next, in order to improve the tracking accuracy of an image, an image is captured at a frame rate equal to or higher than that of a transmitted image, and a tracking operation is performed.
A specific example of updating a reference image serving as a reference for tracking at a rate equal to or higher than the transmission frame rate will be described as a fourth embodiment of the present invention.

【0124】図23は、本第4の実施形態に係る、トラ
ッキング精度を向上させるために、伝送される画像と同
じか、または、それ以上のフレームレートにて、画像を
取り込み、トラッキング操作を行い、伝送フレームレー
トと同じか、それ以上のレートで、トラッキングのため
の基準となるリファレンス画像を更新する処理を説明す
るための概念図である。
FIG. 23 shows an example in which an image is captured at a frame rate equal to or higher than that of a transmitted image and tracking operation is performed in order to improve tracking accuracy according to the fourth embodiment. FIG. 9 is a conceptual diagram for explaining a process of updating a reference image serving as a reference for tracking at a rate equal to or higher than the transmission frame rate.

【0125】なお、図23は、伝送される画像のフレー
ムレートが入力フレームレートの1/3の場合を示して
いる。実際には、このフレームレートの比率は、伝送路
のバンド幅、輻輳状態に応じてコントロールされ、一様
に決まらない。
FIG. 23 shows a case where the frame rate of the transmitted image is 1/3 of the input frame rate. In practice, the frame rate ratio is controlled according to the bandwidth of the transmission path and the state of congestion, and is not determined uniformly.

【0126】図23の例では、入力フレーム毎に前画像
の顔画像をリファレンス画像として更新を行い、次の画
像のサーチ範囲内でマッチングを行っている。たとえ
ば、図23の100−1で検出された顔画像を次画面の
リファレンス画像100−8として用い、100−8を
100−2の画像内でマッチングを行い、顔画像を検出
している。そして、ここで検出された顔画像を次のリフ
ァレンス画像として用いる。
In the example of FIG. 23, the face image of the previous image is updated for each input frame as a reference image, and matching is performed within the search range of the next image. For example, the face image detected at 100-1 in FIG. 23 is used as the reference image 100-8 of the next screen, and the face image is detected by matching 100-8 within the image of 100-2. Then, the face image detected here is used as the next reference image.

【0127】さらに、この顔画像の位置から上述した第
2および第3の実施形態のように次の入力画像でのサー
チ範囲を決定し、更新する。伝送する画像は、伝送され
る画像のフレームレートに応じて、入力フレーム内で検
出された顔画像から選択される。図23では、100−
1、100−4、100−7の画像内で切り出された顔
画像が伝送される。
Further, the search range in the next input image is determined from the position of the face image and updated as in the second and third embodiments described above. The image to be transmitted is selected from the face images detected in the input frame according to the frame rate of the image to be transmitted. In FIG. 23, 100-
The face images cut out from the images 1, 100-4, and 100-7 are transmitted.

【0128】なお、伝送画像のフレームレートとリファ
レンス画像の更新を同じにした場合には、リファレンス
画像とマッチングを行う画像の時間的距離が遠くなるた
め、たとえば、顔画像が徐々に小さくなる場合や、表情
が大きく変わる場合、斜めに傾いた場合などに、マッチ
ングの精度が悪くなる可能性がある。たとえば、100
−8と100−4のマッチングを行った場合、顔画像の
大きさが異なることにより、マッチングの精度が悪くな
る。また、サーチ範囲の更新も伝送画像のフレームレー
トと同じにした場合には、顔が横に移動している場合な
どは、サーチ範囲内に顔画像が含まれない場合が生じ、
マッチングの精度が悪くなる可能性がある。たとえば、
100−1のサーチ範囲を100−4のマッチングに適
用した場合、サーチ範囲内に顔画像が全て含まれない事
になり、マッチングの精度が悪くなる。
When the frame rate of the transmission image and the update of the reference image are the same, the temporal distance between the reference image and the image to be matched is long, so that, for example, when the face image gradually decreases, However, when the expression changes greatly, or when the camera is tilted obliquely, there is a possibility that the matching accuracy is deteriorated. For example, 100
When matching between −8 and 100−4 is performed, the accuracy of matching deteriorates due to the difference in size of the face images. Also, if the update of the search range is also the same as the frame rate of the transmission image, there may be cases where no face image is included in the search range, such as when the face is moving sideways,
The accuracy of the matching may be reduced. For example,
When the search range of 100-1 is applied to the matching of 100-4, all the face images are not included in the search range, and the matching accuracy is deteriorated.

【0129】本第4の実施形態にように、伝送される画
像と同じか、または、それ以上のフレームレートにて、
画像を取り込み、トラッキング操作を行い、伝送フレー
ムレートと同じか、それ以上のレートで、トラッキング
のための基準となるリファレンス画像を更新すること
で、トラッキング精度を向上させることができる。
As in the fourth embodiment, at the same or higher frame rate as the transmitted image,
Tracking accuracy can be improved by capturing an image, performing a tracking operation, and updating a reference image serving as a reference for tracking at a rate equal to or higher than the transmission frame rate.

【0130】[0130]

【発明の効果】本発明によれば、コミュニケーションに
最も必要な相手の表情を伝送しつつ、情報量を極力削減
することが可能となる。また、本発明によれば、画枠い
っぱいに、顔画像を合わせることから、解像度の高い背
景画像の伝送を自然に削除することができ、圧縮後の情
報量を、大幅に削減できる。これにより、高画質の画像
を伝送することが可能となる。
According to the present invention, it is possible to reduce the amount of information as much as possible while transmitting the expression of the partner most necessary for communication. Further, according to the present invention, since the face image is matched to the entire image frame, transmission of the background image with high resolution can be naturally deleted, and the amount of information after compression can be greatly reduced. This makes it possible to transmit high-quality images.

【0131】本発明によれば、画像のフレーム相関性を
大幅に向上させることができ、画像圧縮の手法に、MP
EGのようなインターフレーム圧縮を行う圧縮技術を使
用することで、情報量の大幅な削減が可能になる。これ
により、高画質の画像を伝送することが可能となる。
According to the present invention, the frame correlation of an image can be greatly improved.
By using a compression technique for performing inter-frame compression such as EG, it is possible to greatly reduce the amount of information. This makes it possible to transmit high-quality images.

【0132】また、本発明によれば、ユーザの伝送した
い画像の状態(画像ロックの状態)を、自動的にキープ
することを可能とし、また、画像の特徴部分の検出を助
け、人物画像等のターゲット画像のトラッキングが可能
となる。その結果、画像の時間軸方向の相関性が高ま
り、圧縮後の情報量の削減を可能とする。これにより、
高画質の画像を伝送することが可能となる。
Further, according to the present invention, it is possible to automatically keep the state of the image that the user wants to transmit (the state of the image lock), and to help detect the characteristic portion of the image, Tracking of the target image is possible. As a result, the correlation in the time axis direction of the image is increased, and the amount of information after compression can be reduced. This allows
High quality images can be transmitted.

【0133】また、本発明によれば、互いの目線がより
あった状態を実現できる。
Further, according to the present invention, it is possible to realize a state in which the eyes are more aligned.

【0134】さらに、本発明によれば、互いに、話題の
映像を見ながら話をしている様子を伝えることができ、
また、モニタ上の互いの顔を見れば、目線が合うとい
う、バーチャルリアリティのコミュニケーションを実現
できる利点がある。
Further, according to the present invention, it is possible to tell each other how to talk while watching the video of the topic,
In addition, there is an advantage that virtual reality communication can be realized, that is, the eyes are aligned when the faces of each other are viewed on the monitor.

【図面の簡単な説明】[Brief description of the drawings]

【図1】図1は、本発明に係るデータ伝送システムとし
てのビジュアルコミュニケーションサービスシステムの
一実施形態を示すシステム構成図である。
FIG. 1 is a system configuration diagram showing an embodiment of a visual communication service system as a data transmission system according to the present invention.

【図2】本実施形態に係る移動体端末の一構成例を示す
外観図である。
FIG. 2 is an external view illustrating a configuration example of a mobile terminal according to the embodiment.

【図3】本発明に係るデータ伝送装置としての端末の信
号処理系の第1の実施形態を示す回路図である。
FIG. 3 is a circuit diagram showing a first embodiment of a signal processing system of a terminal as a data transmission device according to the present invention.

【図4】第1の実施形態に係る図3の前処理回路を示す
回路図である。
FIG. 4 is a circuit diagram showing a pre-processing circuit of FIG. 3 according to the first embodiment.

【図5】前処理回路におけるトラッキングの概略を説明
するための図である。
FIG. 5 is a diagram for explaining an outline of tracking in a preprocessing circuit.

【図6】初期リファレンス画像の第1の決定方法を説明
するための図である。
FIG. 6 is a diagram illustrating a first method of determining an initial reference image.

【図7】初期リファレンス画像の第2の決定方法を説明
するための図である。
FIG. 7 is a diagram illustrating a second method of determining an initial reference image.

【図8】本発明に係るデータ伝送装置としての端末の信
号処理系の第2の実施形態を示す回路図である。
FIG. 8 is a circuit diagram showing a second embodiment of a signal processing system of a terminal as a data transmission device according to the present invention.

【図9】第2の実施形態に係る図8の前処理回路を示す
回路図である。
FIG. 9 is a circuit diagram showing a preprocessing circuit of FIG. 8 according to a second embodiment.

【図10】顔の大きさの計算例を説明するための図であ
る。
FIG. 10 is a diagram illustrating an example of calculating the size of a face.

【図11】顔器官検出サーチ範囲例を説明するための図
である。
FIG. 11 is a diagram for describing an example of a face organ detection search range.

【図12】顔器官検出サーチ範囲の顔画像を縮小して表
示モニタに表示させる処理を説明するための図である。
FIG. 12 is a diagram illustrating a process of reducing a face image in a face organ detection search range and displaying the reduced image on a display monitor.

【図13】顔器官検出サーチ範囲の顔画像を縮小して表
示モニタに表示させる処理を説明するための図である。
FIG. 13 is a diagram illustrating a process of reducing a face image in a face organ detection search range and displaying the reduced face image on a display monitor.

【図14】顔器官検出サーチ範囲の顔画像を拡大して表
示モニタに表示させる処理を説明するための図である。
FIG. 14 is a diagram for explaining a process of enlarging a face image in a face organ detection search range and displaying the enlarged face image on a display monitor.

【図15】顔器官検出サーチ範囲の顔画像を拡大して表
示モニタに表示させる処理を説明するための図である。
FIG. 15 is a diagram for explaining a process of enlarging a face image in a face organ detection search range and displaying the enlarged face image on a display monitor.

【図16】本発明に係るデータ伝送装置としての端末の
信号処理系の第3の実施形態を示す回路図である。
FIG. 16 is a circuit diagram showing a third embodiment of a signal processing system of a terminal as a data transmission device according to the present invention.

【図17】第3の実施形態に係る図16の前処理回路を
示す回路図である。
FIG. 17 is a circuit diagram showing the preprocessing circuit of FIG. 16 according to the third embodiment.

【図18】第3の実施形態において、指定した伝送画像
範囲の顔画像を縮小して表示モニタに表示させる処理を
説明するための図である。
FIG. 18 is a diagram illustrating a process of reducing a face image in a specified transmission image range and displaying the reduced face image on a display monitor in the third embodiment.

【図19】第3の実施形態において、指定した伝送画像
範囲の顔画像を縮小して表示モニタに表示させる処理を
説明するための図である。
FIG. 19 is a diagram illustrating a process of reducing a face image in a designated transmission image range and displaying the reduced face image on a display monitor in the third embodiment.

【図20】第3の実施形態において、顔の肌色である画
素数eとモニタ画像内の画素数fの比率ついて説明する
ための図である。
FIG. 20 is a diagram for explaining a ratio between the number of pixels e, which is the skin color of the face, and the number of pixels f in the monitor image in the third embodiment.

【図21】第3の実施形態において、顔器官検出サーチ
範囲の顔画像を縮小して表示モニタに表示させる処理を
説明するための図である。
FIG. 21 is a diagram illustrating a process of reducing a face image in a face organ detection search range and displaying the reduced face image on a display monitor in the third embodiment.

【図22】第3の実施形態において、顔器官検出サーチ
範囲の顔画像を縮小して表示モニタに表示させる処理を
説明するための図である。
FIG. 22 is a diagram illustrating a process of reducing a face image in a face organ detection search range and displaying the reduced face image on a display monitor in the third embodiment.

【図23】本第4の実施形態に係る、トラッキング精度
を向上させるために、伝送される画像と同じか、また
は、それ以上のフレームレートにて、画像を取り込み、
トラッキング操作を行い、伝送フレームレートと同じ
か、それ以上のレートで、トラッキングのための基準と
なるリファレンス画像を更新する処理を説明するための
概念図である。
FIG. 23 is a diagram showing an example in which an image is captured at a frame rate equal to or higher than that of a transmitted image in order to improve tracking accuracy according to the fourth embodiment;
FIG. 9 is a conceptual diagram for describing a process of performing a tracking operation and updating a reference image serving as a reference for tracking at a rate equal to or higher than a transmission frame rate.

【図24】従来のビジュアルコミュニケーション端末と
伝送路の説明図である。
FIG. 24 is an explanatory diagram of a conventional visual communication terminal and a transmission path.

【符号の説明】[Explanation of symbols]

100…ビジュアルコミュニケーションサービスシステ
ム、50−1,50−2…移動体端末、60…伝送路、
61−1,61−2…無線基地局(MSB)、62−
1,62−2…移動交換局(MSC)、63−1、63
−2…関門移動交換局(GMSC)、64…回線網、6
5…関門局(GW)、66…アプリケーションサービス
プロバイダ(ASP)、500,500A,500B…
端末の信号処理系、501…マイクロフォン、502…
カメラ回路、503,503A,503B…前処理回
路、504…ビデオ圧縮符号化器、505…音声圧縮符
号化器、506…マルチプレクサ(MUX)、507…
伝送回路、508…受信回路、509…デマルチプレク
サ(DeMUX)、510…ビデオ復号化器、511…
音声復号化器、512…画像合成装置、513…表示回
路、514…スピーカ、515…GUIインタフェース
(I/F)回路、516,516A,516B…CP
U、5036…顔器官位置検出部、5037…画像拡大
縮小部、5038…画像切り出し部、5039…リファ
レンス顔画像記憶部、5040…モニタと顔画像の比率
記憶部。
100: visual communication service system, 50-1, 50-2: mobile terminal, 60: transmission line,
61-1, 61-2 ... wireless base station (MSB), 62-
1, 62-2 ... mobile switching center (MSC), 63-1, 63
-2: Gateway Mobile Switching Center (GMSC), 64: Network, 6
5: Gateway station (GW), 66: Application service provider (ASP), 500, 500A, 500B ...
Terminal signal processing system, 501 ... microphone, 502 ...
Camera circuit, 503, 503A, 503B pre-processing circuit, 504 video compression encoder, 505 audio compression encoder, 506 multiplexer (MUX), 507
Transmission circuit, 508 reception circuit, 509 demultiplexer (DeMUX), 510 video decoder, 511
Audio decoder, 512: image synthesizing device, 513: display circuit, 514: speaker, 515: GUI interface (I / F) circuit, 516, 516A, 516B: CP
U, 5036: face organ position detection unit, 5037: image scaling unit, 5038: image cutout unit, 5039: reference face image storage unit, 5040: monitor and face image ratio storage unit.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 7/24 H04N 7/13 Z 5L096 (72)発明者 高嶋 昌利 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 成田 秀之 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 平中 大介 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 石田 善啓 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5B057 BA02 CA08 CA12 CA16 CB08 CB12 CB16 CC01 CD05 CH08 DA08 DB02 DB09 DC03 DC32 5C059 MA00 SS07 SS10 UA02 UA03 UA05 5C064 AA01 AB04 AC04 AC06 AC08 AC12 AC16 AD02 AD14 5C075 AB06 CA05 5C076 AA02 AA21 AA22 BA06 5L096 AA06 BA20 CA02 DA01 EA03 EA35 FA66 GA08 HA07 JA20──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) H04N 7/24 H04N 7 / 13Z 5L096 (72) Inventor Masatoshi Takashima 6-7 Kita Shinagawa, Shinagawa-ku, Tokyo No. 35 Inside Sony Corporation (72) Hideyuki Narita Inventor 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Tokyo Inside (72) Inventor Daisuke Hiranaka 6-35, Kita-Shinagawa, Shinagawa-ku, Tokyo No. within Sony Corporation (72) Inventor Yoshihiro Ishida 6-35 Kita Shinagawa, Shinagawa-ku, Tokyo F-term within Sony Corporation (reference) 5B057 BA02 CA08 CA12 CA16 CB08 CB12 CB16 CC01 CD05 CH08 DA08 DB02 DB09 DC03 DC32 5C059 MA00 SS07 SS10 UA02 UA03 UA05 5C064 AA01 AB04 AC04 AC06 AC08 AC12 AC16 AD02 AD14 5C075 AB06 CA05 5C076 AA02 AA21 AA22 BA06 5L096 AA06 BA20 CA02 DA01 EA03 EA35 FA66 GA08 H A07 JA20

Claims (48)

【特許請求の範囲】[Claims] 【請求項1】 少なくとも画像データをあらかじめ設定
された大きさの画枠内に収めて伝送するデータ伝送方法
であって、 伝送すべきターゲット画像を含む画像を撮像し、 撮像した画像から伝送すべきターゲット画像が略上記画
枠いっぱいになるように調整し、 調整後の画枠内の画像データを圧縮して伝送するデータ
伝送方法。
1. A data transmission method for transmitting at least image data in an image frame of a preset size, wherein an image including a target image to be transmitted is captured, and the image is transmitted from the captured image. A data transmission method in which a target image is adjusted so as to substantially fill the image frame, and image data in the adjusted image frame is compressed and transmitted.
【請求項2】 画枠にターゲット画像をいっぱいになる
ように調整する場合、伝送すべき画像の特徴部分の画像
を利用してマッチングを行い、最もマッチングがとれた
部分を中心に、その周りの画像を切り出すことで、画像
のトラッキングを行う請求項1記載のデータ伝送方法。
2. When adjusting a target image to fill an image frame, matching is performed using an image of a characteristic portion of an image to be transmitted. 2. The data transmission method according to claim 1, wherein the tracking of the image is performed by cutting out the image.
【請求項3】 画枠にターゲット画像をいっぱいになる
ように調整する場合、伝送画像の特徴部分の画像を利用
して、特徴部分の距離を算出し、これにより、画像の拡
大、縮小、トラッキングを行う請求項1記載のデータ伝
送方法。
3. When adjusting the target image so as to fill the image frame, the distance of the characteristic portion is calculated by using the image of the characteristic portion of the transmission image, whereby the image is enlarged, reduced, and tracked. The data transmission method according to claim 1, wherein
【請求項4】 画像の特徴部分を検出する場合、伝送画
像の取り込まれた状態をモニタしながら、所望の画像状
態で当該画像の状態をロックさせ、ロックしたときの画
像の中心付近を画像の特徴部分とする請求項2記載のデ
ータ伝送方法。
4. When detecting a characteristic portion of an image, the state of the image is locked in a desired image state while monitoring the state in which the transmitted image is captured, and the vicinity of the center of the image at the time of locking is determined. 3. The data transmission method according to claim 2, wherein the data transmission method is a characteristic part.
【請求項5】 画像の特徴部分を検出する場合、伝送画
像の取り込まれた状態をモニタしながら、所望の画像状
態で当該画像の状態をロックさせ、ロックしたときの画
像の中心付近を画像の特徴部分とする請求項3記載のデ
ータ伝送方法。
5. When detecting a characteristic portion of an image, the state of the image is locked in a desired image state while monitoring the state in which the transmission image is captured, and the vicinity of the center of the image at the time of locking is determined. 4. The data transmission method according to claim 3, wherein the data transmission method is a characteristic part.
【請求項6】 画像の特徴部分を検出する場合、伝送画
像の取り込まれた状態を表示させ、表示画面上で所定箇
所を指定し、指定したポイントを中心に、画像の特徴部
分とする請求項2記載のデータ伝送方法。
6. When a characteristic portion of an image is detected, a state in which a transmission image is captured is displayed, a predetermined portion is designated on a display screen, and a characteristic point of the image is set around the designated point. 2. The data transmission method according to 2.
【請求項7】 画像の特徴部分を検出する場合、伝送画
像の取り込まれた状態を表示させ、表示画面上で所定箇
所を指定し、指定したポイントを中心に、画像の特徴部
分とする請求項3記載のデータ伝送方法。
7. When detecting a characteristic portion of an image, a state in which the transmitted image is captured is displayed, a predetermined portion is designated on the display screen, and the characteristic portion of the image is set around the designated point. 3. The data transmission method according to 3.
【請求項8】 画像の特徴部分を利用して、ターゲット
画像をロックする場合、伝送される画像と同じか、また
は、それ以上のフレームレートにて、画像を取り込み、
トラッキング操作を行い、伝送フレームレートと同じ
か、それ以上のレートで、トラッキングのための基準と
なるリファレンス画像を更新する請求項4記載のデータ
伝送方法。
8. When a target image is locked by using a characteristic portion of an image, the image is captured at a frame rate equal to or higher than that of a transmitted image.
5. The data transmission method according to claim 4, wherein a tracking operation is performed and a reference image serving as a reference for tracking is updated at a rate equal to or higher than the transmission frame rate.
【請求項9】 画像の特徴部分を利用して、ターゲット
画像をロックする場合、伝送される画像と同じか、また
は、それ以上のフレームレートにて、画像を取り込み、
トラッキング操作を行い、伝送フレームレートと同じ
か、それ以上のレートで、トラッキングのための基準と
なるリファレンス画像を更新する請求項5記載のデータ
伝送方法。
9. When locking a target image using a characteristic portion of an image, the image is captured at a frame rate equal to or higher than that of a transmitted image.
6. The data transmission method according to claim 5, wherein a tracking operation is performed, and a reference image serving as a reference for tracking is updated at a rate equal to or higher than the transmission frame rate.
【請求項10】 伝送画像の取り込まれた状態を表示
し、表示画面上で伝送すべき範囲を指定して、画像を伝
送する範囲を決定する請求項1記載のデータ伝送方法。
10. The data transmission method according to claim 1, wherein a state in which the transmission image is captured is displayed, a range to be transmitted is specified on the display screen, and a range to transmit the image is determined.
【請求項11】 少なくとも画像データを伝送するデー
タ伝送方法であって、 伝送すべきターゲット画像を含む画像を撮像し、 撮像した画像から伝送すべきターゲット画像をあらかじ
め決められた所定の大きさになるように調整し、 調整後の画枠内の画像データを圧縮して伝送するデータ
伝送方法。
11. A data transmission method for transmitting at least image data, wherein an image including a target image to be transmitted is imaged, and the target image to be transmitted has a predetermined size from the captured image. A data transmission method in which the image data in the image frame after adjustment is compressed and transmitted.
【請求項12】 ターゲット画像を所定の大きさになる
ように調整する場合、伝送すべき画像の特徴部分の画像
を利用してマッチングを行い、最もマッチングがとれた
部分を中心に、その周りの画像を切り出すことで、画像
のトラッキングを行う請求項11記載のデータ伝送方
法。
12. When adjusting a target image to have a predetermined size, matching is performed using an image of a characteristic portion of an image to be transmitted, and a portion around the best matching is centered. The data transmission method according to claim 11, wherein the tracking of the image is performed by cutting out the image.
【請求項13】 ターゲット画像を所定の大きさになる
ように調整する場合、伝送画像の特徴部分の画像を利用
して、特徴部分の距離を算出し、これにより、画像の拡
大、縮小、トラッキングを行う請求項11記載のデータ
伝送方法。
13. When adjusting a target image to have a predetermined size, a distance of a characteristic portion is calculated by using an image of a characteristic portion of a transmission image, and thereby, enlargement, reduction, and tracking of the image are performed. 12. The data transmission method according to claim 11, wherein:
【請求項14】 画像の特徴部分を検出する場合、伝送
画像の取り込まれた状態をモニタしながら、所望の画像
状態で当該画像の状態をロックさせ、ロックしたときの
画像の中心付近を画像の特徴部分とする請求項12記載
のデータ伝送方法。
14. When detecting a characteristic portion of an image, the state of the image is locked in a desired image state while monitoring the state where the transmitted image is captured. The data transmission method according to claim 12, which is a characteristic portion.
【請求項15】 画像の特徴部分を検出する場合、伝送
画像の取り込まれた状態をモニタしながら、所望の画像
状態で当該画像の状態をロックさせ、ロックしたときの
画像の中心付近を画像の特徴部分とする請求項13記載
のデータ伝送方法。
15. When detecting a characteristic portion of an image, the state of the image is locked in a desired image state while monitoring the state in which the transmitted image is captured, and the vicinity of the center of the image at the time of locking is determined. 14. The data transmission method according to claim 13, which is a characteristic part.
【請求項16】 画像の特徴部分を検出する場合、伝送
画像の取り込まれた状態を表示させ、表示画面上で所定
箇所を指定し、指定したポイントを中心に、画像の特徴
部分とする請求項12記載のデータ伝送方法。
16. When detecting a characteristic portion of an image, a state in which the transmitted image is captured is displayed, a predetermined portion is designated on the display screen, and the characteristic portion of the image is set around the designated point. 13. The data transmission method according to item 12.
【請求項17】 画像の特徴部分を検出する場合、伝送
画像の取り込まれた状態を表示させ、表示画面上で所定
箇所を指定し、指定したポイントを中心に、画像の特徴
部分とする請求項13記載のデータ伝送方法。
17. When detecting a characteristic portion of an image, a state in which the transmission image is captured is displayed, a predetermined portion is designated on a display screen, and the characteristic portion of the image is set around the designated point. 14. The data transmission method according to item 13.
【請求項18】 画像の特徴部分を利用して、ターゲッ
ト画像をロックする場合、伝送される画像と同じか、ま
たは、それ以上のフレームレートにて、画像を取り込
み、トラッキング操作を行い、伝送フレームレートと同
じか、それ以上のレートで、トラッキングのための基準
となるリファレンス画像を更新する請求項14記載のデ
ータ伝送方法。
18. When a target image is locked using a characteristic portion of an image, the image is captured at a frame rate equal to or higher than that of a transmitted image, a tracking operation is performed, and a transmission frame is transmitted. 15. The data transmission method according to claim 14, wherein a reference image serving as a reference for tracking is updated at a rate equal to or higher than the rate.
【請求項19】 画像の特徴部分を利用して、ターゲッ
ト画像をロックする場合、伝送される画像と同じか、ま
たは、それ以上のフレームレートにて、画像を取り込
み、トラッキング操作を行い、伝送フレームレートと同
じか、それ以上のレートで、トラッキングのための基準
となるリファレンス画像を更新する請求項15記載のデ
ータ伝送方法。
19. When a target image is locked using a characteristic portion of an image, an image is captured at a frame rate equal to or higher than that of a transmitted image, a tracking operation is performed, and a transmission frame is transmitted. The data transmission method according to claim 15, wherein the reference image serving as a reference for tracking is updated at a rate equal to or higher than the rate.
【請求項20】 伝送画像の取り込まれた状態を表示
し、表示画面上で伝送すべき範囲を指定して、画像を伝
送する範囲を決定する請求項11記載のデータ伝送方
法。
20. The data transmission method according to claim 11, wherein a state in which the transmission image is captured is displayed, a range to be transmitted is specified on the display screen, and a range to transmit the image is determined.
【請求項21】 複数端末間で少なくともユーザの画像
データを表示画面に表示させ、受信した画像データを上
記表示画面に表示させながら、少なくとも画像データを
伝送するデータ伝送方法であって、上記表示画面の略中
央部から伝送すべきユーザのターゲット画像を含む画像
を撮像するデータ伝送方法。
21. A data transmission method for transmitting at least image data while displaying image data of at least a user on a display screen among a plurality of terminals and displaying received image data on the display screen. A data transmission method for capturing an image including a target image of a user to be transmitted from a substantially central portion of the data.
【請求項22】 複数端末間で、少なくともユーザの画
像データを表示画面に表示させ、受信した相手方からの
画像データを上記表示画面に表示させ、かつ共通の話題
となるコンテンツを上記表示画面に表示させながら、少
なくとも画像データを伝送するデータ伝送方法であっ
て、 上記表示画面の略中央部から伝送すべきユーザのターゲ
ット画像を含む画像を撮像し、 撮像部位である表示画面の略中央を中心として、表示画
面の上側または下側の一方側に上記画像データを表示さ
せ、他方側に上記コンテンツを表示させるデータ伝送方
法。
22. Display of at least user image data on a display screen among a plurality of terminals, display of received image data from the other party on the display screen, and display of a common topic on the display screen. A data transmission method for transmitting at least image data, wherein an image including a target image of a user to be transmitted is captured from a substantially central portion of the display screen, and the image is captured about a substantially central portion of the display screen as an imaging portion. A data transmission method in which the image data is displayed on one side of an upper or lower side of a display screen, and the content is displayed on the other side.
【請求項23】 上記表示画面には、コンテンツの上側
に画像データを表示させる請求項22記載のデータ伝送
方法。
23. The data transmission method according to claim 22, wherein image data is displayed above the content on the display screen.
【請求項24】 上記表示画面には、コンテンツの下側
に画像データを表示させる請求項22記載のデータ伝送
方法。
24. The data transmission method according to claim 22, wherein image data is displayed below the content on the display screen.
【請求項25】 少なくとも画像データをあらかじめ設
定された大きさの画枠内に収めて伝送するデータ伝送装
置であって、 伝送すべきターゲット画像を含む画像を撮像する撮像手
段と、 上記撮像手段で撮像した画像から伝送すべきターゲット
画像が略上記画枠いっぱいになるように調整する第1の
回路と、調整後の画枠内の画像データを圧縮して伝送す
る第2の回路とを有するデータ伝送装置。
25. A data transmission device for transmitting at least image data in an image frame of a preset size, wherein said imaging device captures an image including a target image to be transmitted. Data having a first circuit for adjusting a target image to be transmitted from a captured image to substantially fill the image frame, and a second circuit for compressing and transmitting image data in the adjusted image frame Transmission equipment.
【請求項26】 上記第1の回路は、画枠にターゲット
画像をいっぱいになるように調整する場合、伝送すべき
画像の特徴部分の画像を利用してマッチングを行い、最
もマッチングがとれた部分を中心に、その周りの画像を
切り出すことで、画像のトラッキングを行う請求項25
記載のデータ伝送装置。
26. The first circuit performs matching using an image of a characteristic portion of an image to be transmitted when adjusting the target frame so as to fill the image frame. 26. Image tracking is performed by cutting out an image around the center of the image.
A data transmission device according to claim 1.
【請求項27】 上記第1の回路は、画枠にターゲット
画像をいっぱいになるように調整する場合、伝送画像の
特徴部分の画像を利用して、特徴部分の距離を算出し、
これにより、画像の拡大、縮小、トラッキングを行う請
求項25記載のデータ伝送装置。
27. The first circuit calculates a distance of a characteristic portion using an image of a characteristic portion of a transmission image when adjusting the target image to fill the image frame.
26. The data transmission apparatus according to claim 25, wherein the enlargement, reduction, and tracking of the image are performed.
【請求項28】 画像データを表示させる表示手段と、 上記表示手段に表示された画像を、所望の画像状態でロ
ックさせることが可能なロック手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記ロック手段でロックされたときの画像の中心付近を画
像の特徴部分とする請求項26記載のデータ伝送装置。
28. A display device comprising: display means for displaying image data; and lock means for locking an image displayed on the display means in a desired image state. 27. The data transmission apparatus according to claim 26, wherein when detecting a characteristic portion of the image, a vicinity of the center of the image when the image is locked by the lock unit is a characteristic portion of the image.
【請求項29】 画像データを表示させる表示手段と、 上記表示手段に表示された画像を、所望の画像状態でロ
ックさせることが可能なロック手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記ロック手段でロックされたときの画像の中心付近を画
像の特徴部分とする請求項27記載のデータ伝送装置。
29. A display device comprising: display means for displaying image data; and lock means for locking an image displayed on the display means in a desired image state. 28. The data transmission apparatus according to claim 27, wherein when detecting a characteristic portion of the image, a vicinity of the center of the image when the image is locked by the lock unit is a characteristic portion of the image.
【請求項30】 画像データを表示させ、所定箇所を指
定可能なポインタを含む表示手段と、 上記表示手段に表示された画像の所定箇所を上記ポイン
タで指定させることが可能な指定手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記指定手段で指定されたポイントを中心に、画像の特徴
部分とする請求項26記載のデータ伝送装置。
30. A display means for displaying image data and including a pointer capable of designating a predetermined location, and a designation means capable of designating a predetermined location of an image displayed on the display means with the pointer. 27. The data transmission apparatus according to claim 26, wherein the first circuit, when detecting a characteristic portion of the image, sets the characteristic portion of the image around a point designated by the designation means.
【請求項31】 画像データを表示させ、所定箇所を指
定可能なポインタを含む表示手段と、 上記表示手段に表示された画像の所定箇所を上記ポイン
タで指定させることが可能な指定手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記指定手段で指定されたポイントを中心に、画像の特徴
部分とする請求項27記載のデータ伝送装置。
31. A display means for displaying image data and including a pointer capable of designating a predetermined location, and a designation means capable of designating a predetermined location of an image displayed on the display means with the pointer. 28. The data transmission apparatus according to claim 27, wherein the first circuit, when detecting a characteristic portion of the image, sets the characteristic portion of the image around a point designated by the designation means.
【請求項32】 上記第1の回路は、画像の特徴部分を
利用して、ターゲット画像をロックする場合、伝送され
る画像と同じか、または、それ以上のフレームレートに
て、画像を取り込み、トラッキング操作を行い、伝送フ
レームレートと同じか、それ以上のレートで、トラッキ
ングのための基準となるリファレンス画像を更新する請
求項28記載のデータ伝送装置。
32. The first circuit captures an image at a frame rate equal to or higher than that of a transmitted image when locking a target image using a characteristic portion of the image, 29. The data transmission apparatus according to claim 28, wherein a tracking operation is performed to update a reference image serving as a reference for tracking at a rate equal to or higher than the transmission frame rate.
【請求項33】 上記第1の回路は、画像の特徴部分を
利用して、ターゲット画像をロックする場合、伝送され
る画像と同じか、または、それ以上のフレームレートに
て、画像を取り込み、トラッキング操作を行い、伝送フ
レームレートと同じか、それ以上のレートで、トラッキ
ングのための基準となるリファレンス画像を更新する請
求項29記載のデータ伝送装置。
33. The first circuit captures an image at a frame rate equal to or higher than that of a transmitted image when locking a target image using a characteristic portion of the image, 30. The data transmission apparatus according to claim 29, wherein a tracking operation is performed to update a reference image serving as a reference for tracking at a rate equal to or higher than the transmission frame rate.
【請求項34】 画像データを表示させ、所定箇所を指
定可能なポインタを含む表示手段と、 上記表示手段に表示された画像の所定箇所を上記ポイン
タで指定させることが可能な指定手段と、を有し、 上記第1の回路は、上記指定手段で指定された範囲を画
像を伝送する範囲として決定する請求項25記載のデー
タ伝送装置。
34. A display means for displaying image data and including a pointer capable of designating a predetermined location, and a designation means capable of designating a predetermined location of an image displayed on the display means with the pointer. 26. The data transmission device according to claim 25, wherein the first circuit determines a range designated by the designation means as a range for transmitting an image.
【請求項35】 少なくとも画像データを伝送するデー
タ伝送装置であって、 伝送すべきターゲット画像を含む画像を撮像する撮像手
段と、 撮像した画像から伝送すべきターゲット画像をあらかじ
め決められた所定の大きさになるように調整する第1の
回路と、 調整後の画枠内の画像データを圧縮して伝送する第2の
回路とを有するデータ伝送装置。
35. A data transmission device for transmitting at least image data, comprising: an image pickup means for picking up an image including a target image to be transmitted; A data transmission apparatus comprising: a first circuit that adjusts the image data so that the image data in the image frame after the adjustment is compressed;
【請求項36】 上記第1の回路は、ターゲット画像を
所定の大きさになるように調整する場合、伝送すべき画
像の特徴部分の画像を利用してマッチングを行い、最も
マッチングがとれた部分を中心に、その周りの画像を切
り出すことで、画像のトラッキングを行う請求項35記
載のデータ伝送装置。
36. The first circuit, when adjusting a target image to have a predetermined size, performs matching using an image of a characteristic portion of an image to be transmitted, and obtains a best matching portion. 36. The data transmission apparatus according to claim 35, wherein the tracking of the image is performed by cutting out an image around the image.
【請求項37】 上記第1の回路は、ターゲット画像を
所定の大きさになるように調整する場合、伝送画像の特
徴部分の画像を利用して、特徴部分の距離を算出し、こ
れにより、画像の拡大、縮小、トラッキングを行う請求
項35記載のデータ伝送装置。
37. When adjusting the target image to have a predetermined size, the first circuit calculates a distance of the characteristic portion by using an image of the characteristic portion of the transmission image, and thereby, The data transmission device according to claim 35, wherein the data transmission device performs enlargement, reduction, and tracking of an image.
【請求項38】 画像データを表示させる表示手段と、 上記表示手段に表示された画像を、所望の画像状態でロ
ックさせることが可能なロック手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記ロック手段でロックされたときの画像の中心付近を画
像の特徴部分とする請求項36記載のデータ伝送装置。
38. A display device comprising: display means for displaying image data; and lock means for locking an image displayed on the display means in a desired image state. 37. The data transmission apparatus according to claim 36, wherein when detecting a characteristic portion of the image, a vicinity of the center of the image when locked by the locking means is a characteristic portion of the image.
【請求項39】 画像データを表示させる表示手段と、 上記表示手段に表示された画像を、所望の画像状態でロ
ックさせることが可能なロック手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記ロック手段でロックされたときの画像の中心付近を画
像の特徴部分とする請求項37記載のデータ伝送装置。
39. A display device, comprising: display means for displaying image data; and lock means capable of locking an image displayed on the display means in a desired image state. 38. The data transmission apparatus according to claim 37, wherein when detecting a characteristic portion of the image, a vicinity of the center of the image when the image is locked by the lock unit is a characteristic portion of the image.
【請求項40】 画像データを表示させ、所定箇所を指
定可能なポインタを含む表示手段と、 上記表示手段に表示された画像の所定箇所を上記ポイン
タで指定させることが可能な指定手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記指定手段で指定されたポイントを中心に、画像の特徴
部分とする請求項36記載のデータ伝送装置。
40. A display means for displaying image data and including a pointer capable of designating a predetermined location, and a designation means capable of designating a predetermined location of an image displayed on the display means with the pointer. 37. The data transmission apparatus according to claim 36, wherein the first circuit, when detecting a characteristic portion of the image, sets the characteristic portion of the image around a point designated by the designation means.
【請求項41】 画像データを表示させ、所定箇所を指
定可能なポインタを含む表示手段と、 上記表示手段に表示された画像の所定箇所を上記ポイン
タで指定させることが可能な指定手段と、を有し、 上記第1の回路は、画像の特徴部分を検出する場合、上
記指定手段で指定されたポイントを中心に、画像の特徴
部分とする請求項37記載のデータ伝送装置。
41. A display means for displaying image data and including a pointer capable of designating a predetermined location, and a designation means capable of designating a predetermined location of an image displayed on the display means with the pointer. 38. The data transmission apparatus according to claim 37, wherein the first circuit, when detecting a characteristic part of the image, sets the characteristic part of the image around a point designated by the designation means.
【請求項42】 上記第1の回路は、画像の特徴部分を
利用して、ターゲット画像をロックする場合、伝送され
る画像と同じか、または、それ以上のフレームレートに
て、画像を取り込み、トラッキング操作を行い、伝送フ
レームレートと同じか、それ以上のレートで、トラッキ
ングのための基準となるリファレンス画像を更新する請
求項38記載のデータ伝送装置。
42. The first circuit captures an image at a frame rate equal to or higher than that of a transmitted image when locking a target image using a characteristic portion of the image. 39. The data transmission apparatus according to claim 38, wherein a tracking operation is performed to update a reference image serving as a reference for tracking at a rate equal to or higher than the transmission frame rate.
【請求項43】 上記第1の回路は、画像の特徴部分を
利用して、ターゲット画像をロックする場合、伝送され
る画像と同じか、または、それ以上のフレームレートに
て、画像を取り込み、トラッキング操作を行い、伝送フ
レームレートと同じか、それ以上のレートで、トラッキ
ングのための基準となるリファレンス画像を更新する請
求項39記載のデータ伝送装置。
43. The first circuit captures an image at a frame rate equal to or higher than a transmitted image when locking a target image using a characteristic portion of the image, The data transmission apparatus according to claim 39, wherein a tracking operation is performed to update a reference image serving as a reference for tracking at a rate equal to or higher than the transmission frame rate.
【請求項44】 画像データを表示させ、所定箇所を指
定可能なポインタを含む表示手段と、 上記表示手段に表示された画像の所定箇所を上記ポイン
タで指定させることが可能な指定手段と、を有し、 上記第1の回路は、上記指定手段で指定された範囲を画
像を伝送する範囲として決定する請求項35記載のデー
タ伝送装置。
44. A display means for displaying image data and including a pointer capable of designating a predetermined location, and a designation means capable of designating a predetermined location of an image displayed on the display means with the pointer. 36. The data transmission device according to claim 35, wherein the first circuit determines a range designated by the designation means as a range for transmitting an image.
【請求項45】 複数端末間で少なくともユーザの画像
データを表示画面に表示させ、受信した画像データを上
記表示画面に表示させながら、少なくとも画像データを
伝送するデータ伝送システムであって、 上記端末は、伝送すべきターゲット画像を含む画像を撮
像する撮像手段と、 上記撮像手段で撮像した画像から伝送すべきターゲット
画像が略画枠いっぱいになるように調整する第1の回路
と、 調整後の画枠内の画像データを圧縮して伝送する第2の
回路とを有するデータ伝送システム。
45. A data transmission system for transmitting at least image data while displaying at least image data of a user on a display screen among a plurality of terminals and displaying received image data on the display screen. Image capturing means for capturing an image including a target image to be transmitted; a first circuit for adjusting the target image to be transmitted from the image captured by the image capturing means so as to substantially fill the image frame; A second circuit for compressing and transmitting image data in the frame.
【請求項46】 複数端末間で少なくともユーザの画像
データを表示画面に表示させ、受信した画像データを上
記表示画面に表示させながら、少なくとも画像データを
伝送するデータ伝送システムであって、 上記端末は、伝送すべきターゲット画像を含む画像を撮
像する撮像手段と、撮像した画像から伝送すべきターゲ
ット画像をあらかじめ決められた所定の大きさになるよ
うに調整する第1の回路と、 調整後の画枠内の画像データを圧縮して伝送する第2の
回路とを有するデータ伝送システム。
46. A data transmission system for transmitting at least image data while displaying at least image data of a user on a display screen among a plurality of terminals and displaying the received image data on the display screen. Image capturing means for capturing an image including a target image to be transmitted, a first circuit for adjusting the target image to be transmitted from the captured image to have a predetermined size, and an image after the adjustment. A second circuit for compressing and transmitting image data in the frame.
【請求項47】 複数端末間で少なくともユーザの画像
データを表示画面に表示させ、受信した画像データを上
記表示画面に表示させながら、少なくとも画像データを
伝送するデータ伝送システムであって、 上記表示画面の略中央部に、伝送すべきユーザのターゲ
ット画像を含む画像を撮像する撮像手段が配置されてい
るデータ伝送システム。
47. A data transmission system for transmitting at least image data while displaying at least image data of a user on a display screen among a plurality of terminals and displaying the received image data on the display screen. A data transmission system in which an image pickup means for picking up an image including a target image of a user to be transmitted is arranged at a substantially central portion of the data transmission system.
【請求項48】 複数端末間で、少なくともユーザの画
像データを表示画面に表示させ、受信した相手方からの
画像データを上記表示画面に表示させ、かつ共通の話題
となるコンテンツを上記表示画面に表示させながら、少
なくとも画像データを伝送するデータ伝送システムであ
って、 上記表示画面の略中央部に配置され、伝送すべきユーザ
のターゲット画像を含む画像を撮像する撮像手段と、 撮像部位である表示画面の略中央を中心として、表示画
面の上側または下側の一方側に上記画像データを表示さ
せ、他方側に上記コンテンツを表示させる表示手段とを
有するデータ伝送システム。
48. At least a user's image data is displayed on a display screen among a plurality of terminals, received image data from a partner is displayed on the display screen, and a common topic content is displayed on the display screen. A data transmission system for transmitting at least image data, wherein the imaging means is arranged at a substantially central portion of the display screen and captures an image including a target image of a user to be transmitted; and a display screen as an imaging part And a display means for displaying the image data on one side of the upper or lower side of the display screen, and displaying the content on the other side, about the center of the display screen.
JP2001130877A 2000-05-24 2001-04-27 Data transmitting method and data transmitter, and data transmitting system Pending JP2002051315A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001130877A JP2002051315A (en) 2000-05-24 2001-04-27 Data transmitting method and data transmitter, and data transmitting system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-157994 2000-05-24
JP2000157994 2000-05-24
JP2001130877A JP2002051315A (en) 2000-05-24 2001-04-27 Data transmitting method and data transmitter, and data transmitting system

Publications (1)

Publication Number Publication Date
JP2002051315A true JP2002051315A (en) 2002-02-15

Family

ID=26592782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001130877A Pending JP2002051315A (en) 2000-05-24 2001-04-27 Data transmitting method and data transmitter, and data transmitting system

Country Status (1)

Country Link
JP (1) JP2002051315A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003259322A (en) * 2002-03-01 2003-09-12 Sumitomo Electric Ind Ltd Image display method, display apparatus, and two-way interactive system
JP2003296713A (en) * 2002-04-04 2003-10-17 Mitsubishi Electric Corp Device and method for synthesizing facial images, communication terminal provided with program for performing the method and facial image synthesizing device and communicating method by the communication terminal
JP2003348556A (en) * 2002-05-29 2003-12-05 Hitachi Ltd Video telephone system and terminal device thereof
JP2004096487A (en) * 2002-08-30 2004-03-25 Sony Corp Image processing apparatus, method therefor and imaging apparatus
JP2004120404A (en) * 2002-09-26 2004-04-15 Fuji Photo Film Co Ltd Image distribution apparatus, image processing apparatus, and program
JP2005184230A (en) * 2003-12-17 2005-07-07 Sharp Corp Mobile communication terminal
JP2008066796A (en) * 2006-09-04 2008-03-21 Sharp Corp Video display device
JP2008301399A (en) * 2007-06-04 2008-12-11 Nippon Telegr & Teleph Corp <Ntt> Television conference apparatus, television conference method, television conference system, computer program and recording medium
US8098293B2 (en) 2002-08-30 2012-01-17 Sony Corporation Image extraction device, image extraction method, image processing device, image processing method, and imaging device
JP2017224182A (en) * 2016-06-16 2017-12-21 キヤノンマーケティングジャパン株式会社 Information processing apparatus, information processing method, and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311834A (en) * 1994-05-19 1995-11-28 Toshiba Medical Eng Co Ltd Image processor and its aid
JPH1013729A (en) * 1996-06-19 1998-01-16 Matsushita Electric Works Ltd Tracking device
JPH1042180A (en) * 1996-07-26 1998-02-13 Sharp Corp Image input device
JPH1051755A (en) * 1996-05-30 1998-02-20 Fujitsu Ltd Screen display controller for video conference terminal equipment
JP2000113158A (en) * 1998-10-01 2000-04-21 Toshiba Corp Device and method for tracking object

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311834A (en) * 1994-05-19 1995-11-28 Toshiba Medical Eng Co Ltd Image processor and its aid
JPH1051755A (en) * 1996-05-30 1998-02-20 Fujitsu Ltd Screen display controller for video conference terminal equipment
JPH1013729A (en) * 1996-06-19 1998-01-16 Matsushita Electric Works Ltd Tracking device
JPH1042180A (en) * 1996-07-26 1998-02-13 Sharp Corp Image input device
JP2000113158A (en) * 1998-10-01 2000-04-21 Toshiba Corp Device and method for tracking object

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003259322A (en) * 2002-03-01 2003-09-12 Sumitomo Electric Ind Ltd Image display method, display apparatus, and two-way interactive system
JP2003296713A (en) * 2002-04-04 2003-10-17 Mitsubishi Electric Corp Device and method for synthesizing facial images, communication terminal provided with program for performing the method and facial image synthesizing device and communicating method by the communication terminal
JP2003348556A (en) * 2002-05-29 2003-12-05 Hitachi Ltd Video telephone system and terminal device thereof
JP2004096487A (en) * 2002-08-30 2004-03-25 Sony Corp Image processing apparatus, method therefor and imaging apparatus
US8098293B2 (en) 2002-08-30 2012-01-17 Sony Corporation Image extraction device, image extraction method, image processing device, image processing method, and imaging device
JP2004120404A (en) * 2002-09-26 2004-04-15 Fuji Photo Film Co Ltd Image distribution apparatus, image processing apparatus, and program
JP2005184230A (en) * 2003-12-17 2005-07-07 Sharp Corp Mobile communication terminal
US7515193B2 (en) 2003-12-17 2009-04-07 Sharp Kabushiki Kaisha Portable communication terminal switchably displaying pictures based on a plurality of video signal sources
JP2008066796A (en) * 2006-09-04 2008-03-21 Sharp Corp Video display device
JP4744400B2 (en) * 2006-09-04 2011-08-10 シャープ株式会社 Video display device
JP2008301399A (en) * 2007-06-04 2008-12-11 Nippon Telegr & Teleph Corp <Ntt> Television conference apparatus, television conference method, television conference system, computer program and recording medium
JP2017224182A (en) * 2016-06-16 2017-12-21 キヤノンマーケティングジャパン株式会社 Information processing apparatus, information processing method, and program

Similar Documents

Publication Publication Date Title
KR100881526B1 (en) Data transmission method, apparatus using same, and data transmission system
US8798168B2 (en) Video telecommunication system for synthesizing a separated object with a new background picture
KR0180543B1 (en) Image signal encoding and communicating apparatus using means for extracting particular portions of an object image
KR100836616B1 (en) Portable Terminal Having Image Overlay Function And Method For Image Overlaying in Portable Terminal
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
US7657056B2 (en) Apparatus for identifying a photographer of an image
EP1841226A2 (en) Video conference system and method in a communication network
US20020093531A1 (en) Adaptive display for video conferences
US20050206581A1 (en) Transmitting device and transmitting method, receiving device and receiving method, transmitting/receiving device and transmitting/receiving method, recorded medium, and signal
JP2001514826A (en) Method and apparatus for transmitting and displaying still images
EP1938208A1 (en) Face annotation in streaming video
US20040120584A1 (en) Portable communication terminal capable of abstracting and inserting backgroud image and method thereof
EP0805600A2 (en) Compressed video text overlay
US7277115B2 (en) Communication terminal device capable of transmitting visage information
CN109168032B (en) Video data processing method, terminal, server and storage medium
JP2002051315A (en) Data transmitting method and data transmitter, and data transmitting system
JPH07288789A (en) Intelligent encoder and picture communication equipment
KR100678035B1 (en) Device and method for identifying photographer of image in terminal using camera
JPH05328342A (en) Video signal processor and inter multi-point video communication equipment
KR100475953B1 (en) Method and System for Providing Substitute Image for Use in Image Mobile Phone
US7154906B2 (en) Image processing apparatus, image processing method, image processing program, and computer-readable storage medium storing image processing program code
KR20080047683A (en) Apparatus and method for forwarding streaming service in portable terminal
KR100678059B1 (en) Portable composite commmunication terminal having mirror mode and implementation method therof
JP2004241871A (en) Data transmission method and device, and data transmission system
JP2002262138A (en) Image pickup system, video conference system, monitoring system, and information terminal with image pickup function

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426