JP2007013801A - Image transmitting method - Google Patents

Image transmitting method Download PDF

Info

Publication number
JP2007013801A
JP2007013801A JP2005194236A JP2005194236A JP2007013801A JP 2007013801 A JP2007013801 A JP 2007013801A JP 2005194236 A JP2005194236 A JP 2005194236A JP 2005194236 A JP2005194236 A JP 2005194236A JP 2007013801 A JP2007013801 A JP 2007013801A
Authority
JP
Japan
Prior art keywords
image
terminal device
frame
transmission method
display screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005194236A
Other languages
Japanese (ja)
Inventor
Toshiaki Kakii
俊昭 柿井
Yoichi Hata
洋一 畑
Hitoshi Takaya
仁志 貴家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Tokyo Metropolitan Public University Corp
Original Assignee
Sumitomo Electric Industries Ltd
Tokyo Metropolitan Public University Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd, Tokyo Metropolitan Public University Corp filed Critical Sumitomo Electric Industries Ltd
Priority to JP2005194236A priority Critical patent/JP2007013801A/en
Publication of JP2007013801A publication Critical patent/JP2007013801A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image transmitting method for more effectively providing visual data such as image data as the auxiliary information in both-way dialog. <P>SOLUTION: In the image transmitting method, while a user 3A of a first terminal device 1A is monitoring relative location on a display image 8A of one or a plurality of image extracting frames 801A on the display image 8A, a frame image as a part of the display image 8A surrounded by the image extracting frame 801A is extracted in every predetermined timing, and the frame image is transmitted to a second terminal device 1B for each extraction of the frame image. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

この発明は、通信ケーブルを介して直接接続されたりネットワークを介して接続された端末装置間での双方向対話の補助データとして利用される視覚データの加工技術等に関するものである   The present invention relates to a technology for processing visual data used as auxiliary data for interactive dialogue between terminal devices connected directly via a communication cable or via a network.

近年、遠隔地の対話者間で互いに相手側対話者の映像を互いに視線一致した状態でモニタに表示しながらテレビ会議やカウンセリング等の親密な対話を実現する双方向対話型システムが提案されている。この視線一致技術には種々の技術が提案されており、相手側対話者像が表示されるモニタの所定位置にCCDカメラのような撮像デバイスを配置することにより視線一致を実現している(特許文献1参照)。   In recent years, a two-way interactive system has been proposed that enables intimate conversations such as video conferencing and counseling while displaying the images of the other party's dialogues on the monitor in a state where the other's dialogues are in line with each other. . Various techniques have been proposed for this line-of-sight matching technique, and line-of-sight matching is realized by disposing an imaging device such as a CCD camera at a predetermined position of a monitor on which the image of the conversation partner is displayed (patent) Reference 1).

一方、上述のような双方向対話型システムは、一対一対話において資料等の補助資料の利用には必ずしも適しているとは言えず、広範囲の分野での双方向対話の適用には至っていない。また、一対一対話では未だにIP電話などによる双方向対話が主流であり、テキストなどの静止画像、動画像等の視覚データは共通の対話補助データとしての利用に留まっているのが現状である。
特許第3074677号公報
On the other hand, the bidirectional interactive system as described above is not necessarily suitable for use of auxiliary materials such as materials in one-on-one dialogue, and has not yet been applied to interactive dialogue in a wide range of fields. In addition, interactive conversations using IP phones are still mainstream in one-on-one conversations, and visual data such as still images such as text and moving images is still used as common conversation assistance data.
Japanese Patent No. 3074677

発明者らは、従来の双方向型対話システムについて検討した結果、以下のような課題を発見した。すなわち、パーソナルコンピュータ(PC)の普及により一般的な職場環境下では、各人の机上に1台以上のPCの設置が実現されているにも関わらず、現実には、電話による音声対話が中心であり、PCを利用した画像伝送を併用した電話会議(IP電話など)の活用例は十分に普及しているとは言えない。   As a result of examining the conventional interactive dialog system, the inventors have found the following problems. In other words, in the general work environment due to the spread of personal computers (PCs), in reality, one or more PCs are installed on each person's desk. Therefore, it cannot be said that an example of utilizing a telephone conference (IP telephone or the like) using image transmission using a PC is sufficiently widespread.

また、上述のような環境下において、対話者間で共通の資料を参照しながらの双方向対話が行われると、勢い双方向対話の効率が低下してしまう。これは、リアルタイムの双方向画像伝送ができないことに起因している。例えば、資料を事前に一方の対話者から相手対話者にメール送信することはできるが、実際の対話では、資料のどのページ、更にはどの位置を指摘しているのかを、対話者自身が口頭で相手対話者に伝える必要があり、双方向対話におけるこのネゴシエーションによる遅延は対話自体の効率性を著しく低下させてしまう。一方で、資料が送られてきた相手対話者は、誤り無くその指定された資料を開けなくてはならない。また、相手対話者がその資料を正しく開けたか否かも、実はメール送信者である対話者自身にも判らないという課題があった。   In addition, when a two-way dialogue is performed while referring to a common material among the interlocutors in the environment as described above, the efficiency of the momentary two-way dialogue is lowered. This is because real-time bidirectional image transmission is not possible. For example, a document can be emailed in advance from one interlocutor to the other interlocutor, but in an actual dialogue, the interlocutor himself orally tells which page of the document, and what position it points out. The delay due to this negotiation in a two-way dialogue significantly reduces the efficiency of the dialogue itself. On the other hand, the correspondent who sent the material must open the designated material without error. In addition, there is a problem that whether or not the other party's interlocutor correctly opened the material cannot be understood by the interlocutor who is the mail sender.

この発明は上述のような課題を解決するためになされたものであり、音声を中心とした双方向対話の他、音声データとともに対話者の顔画像を含む画像データの送受信も同時に行われるテレビ電話サービス、テレビ会議システム等の双方対話における補助情報として、静止画像や動画像などの画像データに代表される視覚データをより効果的に提供していくための画像伝送方法、該画像伝送方法を実行するためのコンピュータプログラム、及び該コンピュータプログラムが記録された記録媒体を提供することを目的としている。   The present invention has been made in order to solve the above-described problems, and in addition to interactive conversation centered on voice, a videophone which simultaneously transmits and receives image data including a conversation person's face image together with voice data. Image transmission method for effectively providing visual data typified by image data such as still images and moving images as auxiliary information in both dialogues of services, video conference systems, etc., and executing the image transmission method An object of the present invention is to provide a computer program and a recording medium on which the computer program is recorded.

この発明に係る画像伝送方法は、LANケーブルなどの通信ケーブル、電話回線網やインターネットなどのネットワークなど所定の伝送手段を介して直接又は間接的に接続されることにより互いに対話可能な状態に設定された第1端末装置から第2端末装置に対して、該第1端末装置から該第1端末装置の表示画面の一部を選択的に送信する画像伝送方法に関する。これら第1及び第2端末装置間の接続形態としては、通信ケーブルを会して直接接続された1対1接続(Peer-to-peer接続)、サーバを介した1対1接続、サーバを介して第1端末装置と複数の第2端末装置が接続された1対多接続などがあり、当該画像伝送方法は、音声を中心とした双方向対話の他、音声データとともに対話者の顔画像を含む映像データの送受信も同時に行われるテレビ電話サービス、テレビ会議システム等の双方向対話における補助情報として、静止画像や動画像などの画像データに代表される資料データをより効果的に提供する。ここで、表示画面とは、各端末装置に備えられた表示装置のモニタ画面上の、該端末装置の利用者自身(端末装置を利用する対話者自身)が視覚的に認知している表示データ自体を意味する。また、表示画面の一部とは、このモニタ画面上に同時表示されているPowerPoint(マイクロソフト社の登録商標)、表計算ソフト(例えば“Excel”など)、ワープロソフト(例えば“Word”など)、ブラウザなどのアプリケーションソフトにより生成される資料データ(テキスト、写真、映像等)などで構成された、端末装置の利用者自身が視覚的に認知している表示データの一部を意味している。   The image transmission method according to the present invention is set in a state where it can interact with each other by being connected directly or indirectly via a predetermined transmission means such as a communication cable such as a LAN cable, a network such as a telephone line network or the Internet. The present invention also relates to an image transmission method for selectively transmitting a part of the display screen of the first terminal device from the first terminal device to the second terminal device. As the connection form between these first and second terminal devices, there is a one-to-one connection (Peer-to-peer connection) directly connected via a communication cable, a one-to-one connection via a server, and a server. In addition to the one-to-many connection in which the first terminal device and a plurality of second terminal devices are connected, the image transmission method is not limited to the interactive dialogue centered on the voice, but also the face image of the talker along with the voice data. As auxiliary information in interactive conversation such as a videophone service and a video conference system in which video data including transmission and reception is simultaneously performed, material data represented by image data such as still images and moving images is provided more effectively. Here, the display screen is the display data visually recognized by the user of the terminal device (the conversation person who uses the terminal device) on the monitor screen of the display device provided in each terminal device. Means itself. In addition, a part of the display screen includes PowerPoint (registered trademark of Microsoft Corporation), spreadsheet software (eg “Excel”, etc.), word processing software (eg “Word”, etc.), It means a part of display data which is composed of document data (text, photograph, video, etc.) generated by application software such as a browser and is visually recognized by the user of the terminal device.

この発明に係る画像伝送方法は、第1端末装置から第2端末装置への画像伝送において、まず第1端末装置の利用者自身が視覚的に認知している表示画面の一部を切り出すステップと、この切り出された表示画面の一部を第2端末装置に送信する伝送ステップとを備える。   In the image transmission method according to the present invention, in image transmission from the first terminal device to the second terminal device, first, a part of a display screen that is visually recognized by the user of the first terminal device itself is cut out; And a transmission step of transmitting a part of the cut-out display screen to the second terminal device.

上記切り出しステップでは、第1端末装置の利用者により表示画面上で設定された1又は複数の画像取込フレームの該表示画面上の相対位置をモニタしながら、該画像取込フレームで囲まれた該表示画面の一部であるフレーム画像を所定のタイミングごとに切り取っていく。また、伝送ステップでは、切り取られたフレーム画像を第2端末装置に送信する。なお、必ずしもフレーム画像の切り出しごとに送信しなくてもよい。   In the clipping step, the relative position on the display screen of one or more image capture frames set on the display screen by the user of the first terminal device is monitored and surrounded by the image capture frame. A frame image that is a part of the display screen is cut out at every predetermined timing. In the transmission step, the cut frame image is transmitted to the second terminal device. It is not always necessary to transmit each frame image cut out.

なお、フレーム画像が切り取られるタイミングは、1秒間に1回〜数回程度の一定時間ごととするタイミング、フレーム画像の変化が検知されるなど任意の条件を満たすタイミング、及び、ウィンドサイズを変更する場合など利用者自身のマウス操作やキー入力などによる制御信号の発生タイミングのいずれであってもよい。また、利用者自身によって送信指示(手動送信)されるタイミングであってもよい。特に、表示画面上に複数の画像取込フレームが設定された場合におけるフレーム画像の伝送では、伝送容量等のリソース性能を有効利用するため、予め決められた条件(例えば、画像取込フレーム内での表示変化の検出など)を満たすタイミングや利用者による制御信号の発生タイミングで切り取られたフレーム画像の伝送を行うのが好ましい。   It should be noted that the timing at which the frame image is cut out is a timing that is set at a constant time of about once to several times per second, a timing that satisfies any condition such as detection of a change in the frame image, and a window size is changed. In any case, any timing of generating a control signal by the user's own mouse operation or key input may be used. Further, it may be a timing at which a transmission instruction (manual transmission) is made by the user himself / herself. In particular, in the transmission of frame images when a plurality of image capture frames are set on the display screen, in order to effectively use resource performance such as transmission capacity, predetermined conditions (for example, in the image capture frame) It is preferable to transmit a frame image clipped at a timing that satisfies a display change detection timing, etc.) or a timing at which a user generates a control signal.

上述のように、対話者像や音声の送受信を中心とした双方向対話において、端末装置の利用者である対話者同士が資料を単に共有するのではなく、対話者自身が相手対話者に注目させたい部位を視覚データとして効率的に伝送することができるため、綿密かつスムースな対話進行が可能になる。すなわち、上述のような構成により、対話者同士による資料共有化のためのネゴシエーションの、双方向対話全体に占める時間比率を著しく低減することが可能になる。また、対話者自身は、共有化された資料の特定部位だけに焦点を絞って相手対話者にプレゼンテーションできる点や、送信前に予め対話者自身が伝送すべき部分を確認できる点などからも、効率的な双方向対話が可能になる。   As mentioned above, in interactive conversations centered on the transmission and reception of dialogue images and voices, the dialogue users who are users of the terminal device do not simply share the materials, but the dialogue participants themselves pay attention to the other dialogue party. Since the desired part can be efficiently transmitted as visual data, detailed and smooth dialogue progress is possible. In other words, with the configuration as described above, it is possible to significantly reduce the time ratio of negotiations for sharing materials between interlocutors to the entire interactive dialogue. In addition, from the point that the conversation person can focus on a specific part of the shared material and present it to the other party, and the part that the conversation person should transmit in advance before sending, Efficient interactive interaction becomes possible.

なお、上記画像取込フレームのサイズ及び表示画面上における設定位置については、第1端末装置の利用者自身が任意に設定可能である。ところが、この画像取込フレームが大きく設定されると、フレーム画像の圧縮などに処理負荷(時間及びリソース負荷)が大きくなるため、予め一定サイズ以上の画像取込フレームが設定された場合には、取込対象であるフレーム画像を複数の領域に分割し、これら分割された領域ごとに画像処理(画像伝送の前処理としての画像縮小や圧縮など)が行われるのが好ましい。この場合、JPEG2000のタイリング技術が有効である。JPEG2000では、分割された領域(タイル)それぞれが処理単位となるため、タイルごとに伝送の有無を決定したり、個別に圧縮率を設定することができ、より柔軟な画像処理が可能になる。   The user of the first terminal device can arbitrarily set the size of the image capture frame and the setting position on the display screen. However, if this image capture frame is set to a large size, the processing load (time and resource load) increases for compression of the frame image, etc. When an image capture frame of a certain size or larger is set in advance, It is preferable that the frame image to be captured is divided into a plurality of regions, and image processing (image reduction or compression as preprocessing for image transmission) is performed for each of the divided regions. In this case, the JPEG 2000 tiling technique is effective. In JPEG2000, since each divided area (tile) is a processing unit, the presence / absence of transmission can be determined for each tile, and the compression rate can be individually set, thereby enabling more flexible image processing.

この発明に係る画像伝送方法では、表示画面上に設定された画像取込フレーム内における表示変化が検知されるごとに(動き検知)、該画像取込フレームで規定された表示画面の一部であるフレーム画像を第2端末装置へ送信するのが好ましい。   In the image transmission method according to the present invention, every time a display change in the image capture frame set on the display screen is detected (motion detection), a part of the display screen defined by the image capture frame is detected. It is preferable to transmit a certain frame image to the second terminal device.

双方向対話中であれば、1秒間に1回〜数回程度のデータ送信を行うことにより、リアルタイムで指摘箇所のフレーム画像を送信することもできる。しかしながら、上述のようなアプリケーションソフトにより生成される表示データは、一旦画像取込フレームの位置が固定されると該画像取込フレームで規定されるフレーム画像の表示変化は生じ難い。このような状況でも一定時間ごとにフレーム画像を送信していたのでは通信リソースを有効利用しているとは言い難い。一方で、時間経過とともに部分的な変化(例えば、カーソルの移動や文字の追加表示など)も生じることから、画像取込フレーム内に表示変化が生じた時にフレーム画像を送信すれば、より通信リソースの有効利用が可能になる。なお、上述のように、1つのフレーム画像が複数の領域に分割される場合には、これら複数の領域のうち動き検知された領域のみを第2端末装置に送信すれることで、より効率的な画像伝送が可能になる。   If a two-way dialogue is in progress, the frame image of the indicated location can be transmitted in real time by transmitting data once to several times per second. However, in the display data generated by the application software as described above, once the position of the image capture frame is fixed, the display change of the frame image defined by the image capture frame hardly occurs. Even in such a situation, it is difficult to say that communication resources are effectively used if frame images are transmitted at regular intervals. On the other hand, partial changes (for example, movement of the cursor, additional display of characters, etc.) occur over time, so if you send a frame image when a display change occurs in the image capture frame, more communication resources Can be used effectively. In addition, as described above, when one frame image is divided into a plurality of regions, only the region in which motion is detected among the plurality of regions is transmitted to the second terminal device, so that it is more efficient. Image transmission becomes possible.

ここで、この発明に係る画像伝送方法で取り扱われるフレーム画像は、静止画像や動画像が含まれる。動画像には、所定の撮像装置などにより取り込まれた対話者の顔画像などの映像データの他、上記アプリケーションソフトなどにより生成された表示データ、静止画像と映像の組み合わせなども含まれる。また、上記アプリケーションソフトなどにより生成されたデータファイルは、一旦画像データに変換された後に圧縮等の処理が施される。   Here, the frame image handled by the image transmission method according to the present invention includes a still image and a moving image. The moving image includes display data generated by the above application software, a combination of a still image and a video, in addition to video data such as a conversation person's face image captured by a predetermined imaging device or the like. The data file generated by the application software or the like is once converted into image data and then subjected to processing such as compression.

上述の動き検知によって検知されるべきフレーム画像の表示変化は、第1端末装置の表示画面対話者自身が設定した画像取込フレームで規定されるフレーム画像自体の表示変化の他、表示画面内における画像取込フレームの設定変更にともなう表示変化も含まれる。この画像取込フレームの設定変更には、フレームサイズの変更やフレームの移動(カーソル等によって対話者自身がフレームを移動させる場合)が含まれる。   The display change of the frame image to be detected by the above-described motion detection includes the display change of the frame image itself defined by the image capture frame set by the display screen interactive person of the first terminal device, as well as in the display screen. The display change accompanying the setting change of the image capture frame is also included. This setting change of the image capture frame includes a change in the frame size and a movement of the frame (when the interlocutor moves the frame with a cursor or the like).

この発明に係る画像伝送方法において、第1及び第2端末装置間での総伝送量が一定又は所定値以下になるよう切り取られたフレーム画像の伝送品質や画像サイズは逐次変更されるのが好ましい。例えば、テレビ電話サービスやテレビ会議システムなどのように対話者の顔画像及び音声の各データの送受信が行われるシステムにおいては、これら顔画像及び音声も含んだデータ全体として伝送量が制御される。通常、端末装置における処理負荷(CPU負荷)、伝送路容量等の画像処理、伝送能力はモニタ可能である。また、複数の画像取込フレームが設定された場合には、双方向対話中に複数のフレーム画像が並行して伝送されることになる。このような場合、或る画像伝送処理の伝送負荷だけが大きくなると他の画像伝送処理に影響を与えてしまう一方、他の画像伝送処理が行われていない場合にはより伝送負荷を大きくすることで通信リソースのより効率的な利用も可能になる。ここで、フレーム画像の伝送品質は、例えばフレーム画像の伝送レートを変更したり、該フレーム画像の圧縮率を変更することにより調整される。なお、フレーム画像が複数の領域に分割されている場合、JPEG2000を利用することにより分割領域ごとに圧縮率の変更も可能である。   In the image transmission method according to the present invention, it is preferable that the transmission quality and the image size of the frame image clipped so that the total transmission amount between the first and second terminal apparatuses is constant or less than a predetermined value are sequentially changed. . For example, in a system that transmits / receives face image data and voice data of a conversation person such as a videophone service and a video conference system, the transmission amount is controlled as the entire data including the face image and voice data. Usually, it is possible to monitor the processing load (CPU load) in the terminal device, image processing such as transmission path capacity, and transmission capability. When a plurality of image capture frames are set, a plurality of frame images are transmitted in parallel during the interactive dialogue. In such a case, when only the transmission load of a certain image transmission process is increased, the other image transmission process is affected. On the other hand, when the other image transmission process is not performed, the transmission load is increased. This makes it possible to use communication resources more efficiently. Here, the transmission quality of the frame image is adjusted, for example, by changing the transmission rate of the frame image or changing the compression rate of the frame image. When the frame image is divided into a plurality of regions, the compression rate can be changed for each divided region by using JPEG2000.

この発明に係る画像伝送方法は、第1及び第2端末装置の少なくともいずれかにおいて、切り取られたフレーム画像を、該フレーム画像が伝送されるごとに順次記録していくのが好ましい。このように逐次記録されたデータは当該双方向対話の記録データとなる。   In the image transmission method according to the present invention, it is preferable that at least one of the first and second terminal devices sequentially records the cut frame images each time the frame image is transmitted. The data sequentially recorded in this way becomes the recording data of the interactive dialogue.

なお、上述のような画像伝送方法は、コンピュータ等で実行されるプログラムであってもよく、この場合、当該プログラムは、有線、無線を問わずネットワークを介して配信されてもよく、また、CD、DVD、フラッシュメモリ等の記録媒体に格納されていてもよい。   The image transmission method as described above may be a program executed by a computer or the like. In this case, the program may be distributed via a network regardless of wired or wireless, or a CD. Further, it may be stored in a recording medium such as a DVD or a flash memory.

この発明によれば、双方向対話における補助情報として、静止画像や動画像などの画像データに代表される視覚データをより効果的に提供することが可能になり、綿密かつスムースな対話進行が可能になる。   According to the present invention, it is possible to more effectively provide visual data represented by image data such as a still image and a moving image as auxiliary information in a two-way dialogue, and a detailed and smooth dialogue progress is possible. become.

以下、この発明に係る画像伝送方法の各実施形態を、図1〜図7を用いて詳細に説明する。なお、図面の説明において、同一要素、同一部位には同一符号を付して重複する説明を省略する。   Embodiments of the image transmission method according to the present invention will be described in detail below with reference to FIGS. In the description of the drawings, the same elements and the same parts are denoted by the same reference numerals, and redundant description is omitted.

図1は、この発明に係る画像伝送方法が適用可能なネットワークシステムの概略構成を示す図である。なお、図1では、第1端末装置1Aと第2端末装置1Bとがネットワーク2を介して接続されているが、LANケーブルなどの通信ケーブルによりこれら端末装置1A、1B間が直接接続されてもよい。また、インターネットと既存の電話回線など、複数種類のネットワークが併用されてもよい。これら端末装置1A、1Bの接続形態としては、図1に示されたようなサーバを介した1対1接続の他、通信ケーブルを介して直接接続された1対1接続(peer-to-peer接続)や、サーバを介して1台の端末装置(例えば端末装置1Aに相当)と複数台の端末装置(それぞれが端末装置1Bに相当)が接続された、講義形式が実現可能な1対多接続などがある。   FIG. 1 is a diagram showing a schematic configuration of a network system to which an image transmission method according to the present invention can be applied. In FIG. 1, the first terminal device 1A and the second terminal device 1B are connected via the network 2. However, even if the terminal devices 1A and 1B are directly connected by a communication cable such as a LAN cable. Good. A plurality of types of networks such as the Internet and existing telephone lines may be used in combination. As a connection form of these terminal devices 1A and 1B, in addition to the one-to-one connection through the server as shown in FIG. 1, the one-to-one connection directly through the communication cable (peer-to-peer) Connection) or a one-to-many that can realize a lecture format in which one terminal device (for example, corresponding to the terminal device 1A) and a plurality of terminal devices (each corresponding to the terminal device 1B) are connected via a server. There are connections.

この図1において、伝送手段としてのネットワーク2には、それぞれノード2a、2bを介して端末装置1A、1Bが接続されており、これら端末装置1A、1B間での双方向対話が可能になっている。例えば、端末装置1Aは、一般的に、通信制御機能等、主要な情報処理機能を実行するPC本体100Aと、表示装置200Aを備えている。同様に、端末装置1Bも、PC本体100Bと、表示装置200Bを備える。   In FIG. 1, terminal devices 1A and 1B are connected to a network 2 as a transmission means via nodes 2a and 2b, respectively, so that bidirectional communication between these terminal devices 1A and 1B is possible. Yes. For example, the terminal device 1A generally includes a PC main body 100A that executes main information processing functions such as a communication control function, and a display device 200A. Similarly, the terminal device 1B includes a PC main body 100B and a display device 200B.

この発明に係る画像伝送方法は、上述のような伝送手段(図1の場合、ネットワーク2)を介して直接又は間接的に接続されることにより互いに対話可能な状態に設定された端末装置1Aから第2端末装置1Bに対して、該端末装置1Aから該第1端末装置1Aの表示画面の一部を選択的に端末装置1Bに送信する画像伝送方法である。   The image transmission method according to the present invention is based on the terminal device 1A that is set to be in a state of being able to interact with each other by being directly or indirectly connected via the transmission means as described above (in the case of FIG. 1, the network 2). In this image transmission method, a part of the display screen of the first terminal device 1A is selectively transmitted from the terminal device 1A to the terminal device 1B to the second terminal device 1B.

図2は、この発明に係る画像伝送方法を実行可能な端末装置の構成を示すブロック図である。この端末装置1A(1B)は、モニタ等の表示装置200A(200B)と、映像処理を行うPC本体100A(100B)と、外部記録装置700と、マウス等のポインティングデバイス400と、キーボード500と、マイク600と、スピーカー300とを備える。なお、端末装置1Bについても同様の構造を有するため、以下、端末装置1Aについてのみ説明する。   FIG. 2 is a block diagram showing a configuration of a terminal device capable of executing the image transmission method according to the present invention. The terminal device 1A (1B) includes a display device 200A (200B) such as a monitor, a PC main body 100A (100B) that performs video processing, an external recording device 700, a pointing device 400 such as a mouse, a keyboard 500, A microphone 600 and a speaker 300 are provided. Since the terminal device 1B has a similar structure, only the terminal device 1A will be described below.

PC本体100Aは、ネットワーク2を介して相手対話者からの音声データや画像データ(符号化データ)の送受信を行うためのデータ入出力部110(図中、I/O)と、この発明に係る画像伝送方法を実行する制御部120と、送受信される画像データを格納しておくためのデータベース130(図中、D/B)と、表示装置200Aへ制御部120の指示に従って所定のパターンを表示させるための、VRAM141を有する描画部140と、マウス等のポインティングデバイス400からの位置情報の取り込みや外部記録装置700とのデータ授受を可能にするデータ入出力部150(図中、I/O)と、相手対話者の音声が出力されるスピーカー300を制御するための音源コントローラ160とを備える。   The PC main unit 100A includes a data input / output unit 110 (I / O in the figure) for transmitting and receiving voice data and image data (encoded data) from the other party through the network 2, and the present invention. A control unit 120 that executes the image transmission method, a database 130 (D / B in the figure) for storing image data to be transmitted and received, and a predetermined pattern displayed on the display device 200A in accordance with instructions from the control unit 120 A data input / output unit 150 (I / O in the figure) that enables the drawing unit 140 having the VRAM 141 to receive position information from the pointing device 400 such as a mouse and exchange data with the external recording device 700. And a sound source controller 160 for controlling the speaker 300 from which the other party's voice is output.

なお、外部記録装置700は、例えば磁気テープ、CD、光ディスク、ハードディスク、DVD、フラッシュメモリ等を含み、この発明に係る画像伝送方法を実行するコンピュータプログラムや相手側対話者からの送信データなどが格納される。   The external recording device 700 includes, for example, a magnetic tape, a CD, an optical disk, a hard disk, a DVD, a flash memory, and the like, and stores a computer program for executing the image transmission method according to the present invention, transmission data from the other party's dialog, and the like. Is done.

この発明に係る画像伝送方法は、上述のような構造を有する端末装置1Aが設置されたA地点と、端末装置1Bが設置されたB地点との間で実行される双方向対話に特に有効である。このような双方向対話の実施形態には、図3に示されたような種々の形態がある。   The image transmission method according to the present invention is particularly effective for interactive conversation executed between the point A where the terminal device 1A having the above-described structure is installed and the point B where the terminal device 1B is installed. is there. There are various forms of such interactive interactions as shown in FIG.

例えば、図3(a)に示された実施形態では、双方向対話としてIP電話サービス(テレビ電話サービスやテレビ会議システムなど、対話者の顔画像とともに音声データの送受信を行う双方向対話であってもよい)などを提供しているネットワークをそのまま利用して視覚データを送信している。すなわち、A地点に居る対話者3Aの音声データがマイク600Aを介してPC本体100Aに取り込まれ、このPC本体100Aからネットワーク2を介してB地点に設置された端末装置1BのPC本体100Bに伝送される。PC本体100Bに取り込まれた音声データはスピーカ300Bから相手対話者3Bに出力される。逆に、B地点に居る対話者3Bの音声データはマイク600Bを介してPC本体100Bに取り込まれ、このPC本体100Bからネットワーク2を介してA地点に設置された端末装置1AのPC本体100Aに伝送される。PC本体100Aに取り込まれた音声データはスピーカ300Aから対話者3Aに出力される。   For example, in the embodiment shown in FIG. 3 (a), an IP phone service (such as a video phone service or a video conference system) is used as a two-way dialogue. Visual data is transmitted as it is using the network that provides. That is, the voice data of the conversation person 3A at the point A is taken into the PC main body 100A via the microphone 600A and transmitted from the PC main body 100A to the PC main body 100B of the terminal device 1B installed at the point B via the network 2. Is done. The audio data captured by the PC main body 100B is output from the speaker 300B to the partner dialoger 3B. Conversely, the voice data of the conversation person 3B at the point B is taken into the PC main body 100B via the microphone 600B, and is transmitted from the PC main body 100B to the PC main body 100A of the terminal device 1A installed at the point A via the network 2. Is transmitted. The audio data captured by the PC main body 100A is output from the speaker 300A to the conversation person 3A.

このとき、対話者3Aは、表示装置200Aの表示画面の一部を指定し、双方向対話の補助資料データとして画像データをネットワーク2を介してB地点の端末装置1Bに送信している。B地点の端末装置1Bでは、端末装置1Aから送信されてきた画像データを表示装置200Bの表示画面上に設定された表示ウィンド内に表示する。   At this time, the conversation person 3A designates a part of the display screen of the display device 200A, and transmits image data as auxiliary material data for the interactive conversation to the terminal device 1B at the point B via the network 2. In the terminal device 1B at the point B, the image data transmitted from the terminal device 1A is displayed in the display window set on the display screen of the display device 200B.

なお、上述の図3(a)に示された実施形態では、音声データとともに対話補助データである画像データもネットワーク2を介して伝送される。しかしながら、現実の双方向対話では、上述のようなネットワークを介して音声データの送受信を行うIP電話サービスの他、既存の電話回線網20を利用した従来型の双方向対話も広く行われている。この場合、図3(b)に示されたように、音声による双方向対話は既存の電話網を利用する一方、この双方向対話と並行してネットワーク2を介した視覚データの送受信を行うことも可能である。   In the embodiment shown in FIG. 3A described above, image data that is dialogue assistance data is also transmitted via the network 2 together with the audio data. However, in an actual two-way dialogue, a conventional two-way dialogue using the existing telephone line network 20 is widely performed in addition to the IP phone service for transmitting and receiving voice data via the network as described above. . In this case, as shown in FIG. 3B, the interactive conversation by voice uses the existing telephone network, and the visual data is transmitted and received through the network 2 in parallel with the interactive conversation. Is also possible.

この発明に係る画像伝送方法は、端末装置1Aから端末装置1Bへの画像伝送において、まず端末装置1Aの利用者自身が視覚的に認知している表示画面の一部を切り出すステップと、この切り出された表示画面の一部を端末装置1Bに送信する伝送ステップとを備える。   In the image transmission method according to the present invention, in the image transmission from the terminal device 1A to the terminal device 1B, first, a part of the display screen visually recognized by the user of the terminal device 1A itself is cut out, and this cut-out is performed. A transmission step of transmitting a part of the displayed screen to the terminal device 1B.

具体的には、図4(a)に示されたように、端末装置1Aにおける表示装置200Aの表示画面8A上にて対話者3Aがカーソル80Aを利用して画像取込フレーム801Aを設定する。一方、相手対話者3Bは、端末装置1Bにおける表示装置200Bの表示画面8B上にて端末装置1Aから送信されてくるフレーム画像(静止画像、動画像のいずれでもよい)を表示するウィンド801Bをカーソル80Bの操作により設定する。   Specifically, as shown in FIG. 4A, the conversation person 3A sets an image capture frame 801A using the cursor 80A on the display screen 8A of the display device 200A in the terminal device 1A. On the other hand, the opponent dialog person 3B cursors a window 801B for displaying a frame image (either a still image or a moving image) transmitted from the terminal device 1A on the display screen 8B of the display device 200B in the terminal device 1B. Set by operation of 80B.

このとき、表示画面8Aは、端末装置1Aを利用している対話者3A自身が視覚的に認知している表示データ自体を意味する。この表示画面8A上には、PowerPoint(マイクロソフト社の登録商標)、表計算ソフト(例えば“Excel”など)、ワープロソフト(例えば“Word”など)、ブラウザなどのアプリケーションソフトにより生成される資料データ(テキスト、写真、映像等)などが同時表示されており、図4(b)では、表示画面8A上に資料の静止画像データ9Aと、動画像データ9Bが同時表示されている。フレーム画像の切り出しステップでは、対話者3Aにより画像取込フレーム801Aが図4(b)で示された位置に設置されたとすると、この画像取込フレーム801Aで規定されるフレーム画像に対し、所定の画像処理(品質制御)が行われる。さらに、伝送ステップにおいて相手対話者3Bの端末装置1Bに切り取られたフレーム画像が送信されると、該端末装置1Bにおいて表示制御が行われる。具体的には、端末装置1Bにおいて、送信されたフレーム画像は、予め相手対話者3Bによって設定された表示ウィンド801B内に表示できるよう、復号化した後に拡大あるいは縮小などの処理を施して表示画面8B上の表示ウィンド801B内に表示される。   At this time, the display screen 8A means the display data itself visually recognized by the conversation person 3A who uses the terminal device 1A. On the display screen 8A, document data generated by application software such as PowerPoint (registered trademark of Microsoft Corporation), spreadsheet software (eg “Excel”, etc.), word processing software (eg “Word”, etc.), browser, etc. In FIG. 4B, the still image data 9A of the material and the moving image data 9B are simultaneously displayed on the display screen 8A. In the frame image cutout step, assuming that the image capture frame 801A is installed at the position shown in FIG. 4B by the interlocutor 3A, a predetermined amount is applied to the frame image defined by the image capture frame 801A. Image processing (quality control) is performed. Further, when the cut frame image is transmitted to the terminal device 1B of the counterpart conversation person 3B in the transmission step, display control is performed in the terminal device 1B. Specifically, in the terminal device 1B, the transmitted frame image is decrypted and then subjected to processing such as enlargement or reduction so that the frame image can be displayed in the display window 801B set in advance by the other party conversation person 3B. It is displayed in the display window 801B on 8B.

なお、画像取込フレーム801Aのサイズ及び表示画面8A上における設定位置については、上述のように端末装置1Aを利用する対話者3A自身が任意に設定する。ところが、この画像取込フレーム801Aが大きく設定されると、フレーム画像の圧縮などに処理負荷(時間及びリソース負荷)が大きくなるため、予め一定サイズ以上の画像取込フレーム801Aが設定された場合には、取込対象であるフレーム画像を複数の領域に分割し、これら分割された領域ごとに画像処理(画像伝送の前処理としての画像縮小や圧縮など)が行われるのが好ましい。この場合、JPEG2000のタイリング技術が有効である。JPEG2000では、分割された領域(タイル)それぞれが処理単位となるため、タイルごとに伝送の有無を決定したり、個別に圧縮率を設定することができ、より柔軟な画像処理が可能になる。   The size of the image capture frame 801A and the setting position on the display screen 8A are arbitrarily set by the conversation person 3A who uses the terminal device 1A as described above. However, if this image capture frame 801A is set to a large size, the processing load (time and resource load) increases for compression of the frame image and the like, so when an image capture frame 801A of a certain size or larger is set in advance. Preferably, the frame image to be captured is divided into a plurality of regions, and image processing (image reduction or compression as preprocessing for image transmission) is performed for each of the divided regions. In this case, the JPEG 2000 tiling technique is effective. In JPEG2000, since each divided area (tile) is a processing unit, the presence / absence of transmission can be determined for each tile, and the compression rate can be individually set, thereby enabling more flexible image processing.

また、フレーム画像が切り取られるタイミングは、1秒間に数回程度の一定時間ごととするタイミング、フレーム画像の変化が検知されるなど任意の条件を満たすタイミング、及び、ウィンドサイズを変更するなど対話者3A自身によるマウス400Aの操作やキーボード500からの入力で発生する制御信号の発生タイミングのいずれであってもよい。さらには、対話者3A自身によって送信指示(手動送信)されるタイミングであってもよい。表示画面8A上に複数の画像取込フレーム801Aが設定された場合におけるフレーム画像の伝送では、伝送容量等のリソース性能を有効利用するため、予め決められた条件(例えば、画像取込フレーム内での表示変化の検出など)を満たすタイミングや利用者3Aによる制御信号の発生タイミングで切り取られたフレーム画像の伝送を行ってもよい。   In addition, the timing at which the frame image is cut out is a timing that is set at regular intervals of about several times per second, a timing that satisfies any condition such as a change in the frame image being detected, and a window size is changed. The timing may be any of the generation timing of the control signal generated by the operation of the mouse 400A by 3A itself or the input from the keyboard 500. Furthermore, it may be a timing when a transmission instruction (manual transmission) is performed by the conversation person 3A itself. In transmission of a frame image when a plurality of image capture frames 801A are set on the display screen 8A, in order to effectively use resource performance such as transmission capacity, a predetermined condition (for example, in an image capture frame) The frame image clipped at the timing of satisfying the display change detection timing or the generation timing of the control signal by the user 3A may be transmitted.

特に、動き検知によって検知されるべきフレーム画像の表示変化は、端末装置1Aの表示画面8A上において対話者3A自身が設定した画像取込フレーム801Aで規定されるフレーム画像自体の表示変化の他、表示画面8A内における画像取込フレーム801Aの設定変更に伴う表示変化も含まれる。この画像取込フレーム801Aの設定変更には、フレームサイズの変更やフレームの移動(カーソル等によって対話者自身がフレームを移動させる場合)が含まれる。図4(c)及び4(d)は、対話者3A自身がカーソル80Aを操作することにより画像取込フレーム801Aを移動させたときの状態を示す。   In particular, the display change of the frame image to be detected by the motion detection includes the display change of the frame image itself defined by the image capture frame 801A set by the conversation person 3A on the display screen 8A of the terminal device 1A. The display change accompanying the setting change of the image capture frame 801A in the display screen 8A is also included. This setting change of the image capture frame 801A includes a change in the frame size and a movement of the frame (when the interlocutor moves the frame with a cursor or the like). 4 (c) and 4 (d) show a state when the conversation person 3A moves the image capture frame 801A by operating the cursor 80A.

すなわち、図4(c)に示されたように、対話者3Aが表示画面8A上における画像取込フレーム801Aの位置を移動させることにより、端末装置1Bにおける表示画面8B上に設定された表示ウィンド801B内には、画像取込フレーム801Aの移動に伴って逐次伝送されたフレーム画像が表示される(動き検知のタイミングに一致したタイミングで表示される)。さらに、図4(d)に示されたように、対話者3Aが表示画面8A上における画像取込フレーム801Aの位置を動画像9Bの表示位置まで移動させると、端末装置1Bにおける表示画面8B上に設定された表示ウィンド801B内には、画像取込フレーム801A内に表示されている動画像9Bの一部が表示される。   That is, as shown in FIG. 4C, the display window set on the display screen 8B in the terminal device 1B is obtained by moving the position of the image capture frame 801A on the display screen 8A by the conversation person 3A. In 801B, frame images sequentially transmitted as the image capture frame 801A moves are displayed (displayed at a timing that matches the timing of motion detection). Furthermore, as shown in FIG. 4D, when the conversation person 3A moves the position of the image capture frame 801A on the display screen 8A to the display position of the moving image 9B, the display screen 8B on the terminal device 1B is displayed. A part of the moving image 9B displayed in the image capture frame 801A is displayed in the display window 801B set to “”.

このような双方向対話において、対話者3A、3B同士が資料を単に共有するのではなく、対話者3A自身が相手対話者3Bに注目させたい部位を視覚データとして効率的に伝送することができるため、綿密かつスムースな対話進行が可能になる。すなわち、上述のような構成により、対話者3A、3B同士による資料共有化のためのネゴシエーションの、双方向対話全体に占める時間比率を著しく低減することが可能になる。また、対話者自身は、共有化された資料の特定部位だけに焦点を絞って相手対話者にプレゼンテーションできる点や、送信前に予め対話者自身が伝送すべき部分を確認できる点などからも、効率的な双方向対話が可能になる。   In such a two-way dialogue, the conversation parties 3A and 3B can not only simply share materials, but can efficiently transmit the part that the conversation person 3A himself / herself wants the other conversation person 3B to pay attention to as visual data. Therefore, detailed and smooth dialogue progress is possible. That is, with the configuration as described above, it is possible to significantly reduce the time ratio of the negotiation for sharing materials between the interlocutors 3A and 3B to the entire interactive dialogue. In addition, from the point that the conversation person can focus on a specific part of the shared material and present it to the other party, and the part that the conversation person should transmit in advance before sending, Efficient interactive interaction becomes possible.

次に、この発明に係る画像伝送方法を、フレーム画像の送信を上述の動き検知タイミングで行う場合を例に説明する。図5は、画像データの送信側端末における画像伝送手順(この発明に係る画像伝送方法)を説明するためのフローチャートである。   Next, the image transmission method according to the present invention will be described by taking as an example the case of transmitting a frame image at the above-described motion detection timing. FIG. 5 is a flowchart for explaining an image transmission procedure (an image transmission method according to the present invention) in the image data transmission side terminal.

まず、図4(a)に示されたように、端末装置1aを利用する対話者3A自身が表示画面8A上に画像取込フレーム801Aをカーソル操作により設定する(ステップST10)。   First, as shown in FIG. 4A, the conversation person 3A who uses the terminal device 1a sets the image capture frame 801A on the display screen 8A by a cursor operation (step ST10).

画像取込フレーム801Aが設定されると、このフレーム801Aで規定されるフレーム画像が1秒間に数回のタイミングで取り込まれ(ステップST20)、動き検知が行われる(ステップST30)。なお、取り込まれるフレーム画像は、端末装置1Aにおける描画部140のVRAM141に格納されているビットマップデータである。   When the image capture frame 801A is set, a frame image defined by the frame 801A is captured at a timing several times per second (step ST20), and motion detection is performed (step ST30). The captured frame image is bitmap data stored in the VRAM 141 of the drawing unit 140 in the terminal device 1A.

具体的に、この動き検知は、図6に示されたように行われる。双方向対話中であれば、1秒間に1回〜数回程度のデータ送信を行うことにより、リアルタイムで指摘箇所のフレーム画像を送信することもできる。しかしながら、上述のようなアプリケーションソフトにより生成される表示データは、一旦画像取込フレーム801Aの位置が固定されると該画像取込フレーム801Aで規定されるフレーム画像の表示変化は生じ難い。このような状況でも一定時間ごとにフレーム画像を送信していたのでは通信リソースを有効利用しているとは言い難い。一方で、時間経過とともに部分的な変化(例えば、カーソルの移動や文字の追加表示など)も生じることから、画像取込フレーム801A内に表示変化が生じた時にフレーム画像を送信すれば、より通信リソースの有効利用が可能になる。なお、上述のように、1つのフレーム画像が複数の領域に分割される場合には、これら複数の画像ごとに動き検知を行い、動き検知された領域のみを第2端末装置に送信することで、より効率的な画像伝送が可能になる。すなわち、変化検出時のみ、変化領域のみの効率的な画像伝送が可能になる。   Specifically, this motion detection is performed as shown in FIG. If a two-way dialogue is in progress, the frame image of the indicated location can be transmitted in real time by transmitting data once to several times per second. However, in the display data generated by the application software as described above, once the position of the image capture frame 801A is fixed, the display change of the frame image defined by the image capture frame 801A hardly occurs. Even in such a situation, it is difficult to say that communication resources are effectively used if frame images are transmitted at regular intervals. On the other hand, since a partial change (for example, movement of the cursor, additional display of characters, etc.) occurs as time passes, if a frame image is transmitted when a display change occurs in the image capture frame 801A, more communication is performed. Effective use of resources becomes possible. As described above, when one frame image is divided into a plurality of regions, motion detection is performed for each of the plurality of images, and only the motion detected region is transmitted to the second terminal device. More efficient image transmission becomes possible. In other words, only when a change is detected, efficient image transmission of only the change area is possible.

なお、図6(a)には、時間t1、t2(=t1+Δt)でそれぞれ取り込まれた前フレーム画像t1と、後フレーム画像t2同士を比較する様子が示されている。具体的な比較では、前フレーム画像t1内の予め指定された画素の輝度値a1、a2、a3、a4、a5、a6と、後フレーム画像t2内の対応する画素の輝度値b1、b2、b3、b4、b5、b6を求め、これら対応する画素同士の差を合計することで動き量を算出する。すなわち、フレーム画像内の動き量は、以下の式で表される。
|a1−b1|+|a2−b2|+|a3−b3|
+|a4−b4|+|a5−b5|+|a6−b6|
FIG. 6A shows a state in which the previous frame image t1 and the subsequent frame image t2 captured at times t1 and t2 (= t1 + Δt) are compared with each other. In a specific comparison, the luminance values a1, a2, a3, a4, a5, a6 of the pixels designated in the previous frame image t1 and the luminance values b1, b2, b3 of the corresponding pixels in the subsequent frame image t2. , B4, b5, and b6, and the amount of motion is calculated by summing the differences between the corresponding pixels. That is, the amount of motion in the frame image is expressed by the following equation.
| A1-b1 | + | a2-b2 | + | a3-b3 |
+ | A4-b4 | + | a5-b5 | + | a6-b6 |

以上の式で算出された動き量が所定の閾値を超えている場合に、画像取込フレーム801A内に表示変化が生じたと判断される。ここで、画像取込フレーム801Aにより規定されるフレーム画像が複数の領域(JPEG2000におけるタイルに相当)に分割されている場合、この動き検知は各タイルごとに行われ、また、輝度値を比較するための画素数は、タイルごとに異なっていてもよい。   When the amount of motion calculated by the above formula exceeds a predetermined threshold, it is determined that a display change has occurred in the image capture frame 801A. Here, when the frame image defined by the image capture frame 801A is divided into a plurality of regions (corresponding to tiles in JPEG2000), this motion detection is performed for each tile, and the luminance values are compared. The number of pixels for this may vary from tile to tile.

図6(b)は、上述の動き検知動作を含む符号化処理を概念的に示すブロック図である。この図6(b)に示されたように、処理対象である後フレーム画像t2について、比較対象である前フレーム画像t1を利用した動き検知が行われ、この検知結果に基づいて、伝送ステップが行われる。この伝送ステップでは、送信されるフレーム画像が、通信リソースや通信環境を考慮して所定の圧縮率で符号化された後に送信される。   FIG. 6B is a block diagram conceptually showing an encoding process including the above-described motion detection operation. As shown in FIG. 6B, motion detection using the previous frame image t1 as the comparison target is performed for the subsequent frame image t2 as the processing target, and the transmission step is performed based on the detection result. Done. In this transmission step, a frame image to be transmitted is transmitted after being encoded at a predetermined compression rate in consideration of communication resources and a communication environment.

上述のステップST30における動き検知によって画像取込フレーム801A内での表示変化が検知された場合、さらに送信されるべきフレーム画像の伝送品質や画像サイズが決定される(ステップST40)。このステップST40における伝送品質は、通信状況等の環境条件によって決定される。すなわち、送信側である端末装置1Aと受信側である端末装置1B間での総伝送量が一定又は一定値以下になるよう切り取られたフレーム画像の伝送品質や画像サイズは逐次変更される。例えば、テレビ電話サービスやテレビ会議システムなどのように対話者の顔画像及び音声の各データの送受信が行われるシステムにおいては、制御部120がこれら顔画像及び音声も含んだデータ全体として伝送量を制御する。通常、端末装置1Aにおける処理負荷(CPU負荷)、伝送路容量等の画像処理、伝送能力はモニタ可能である。また、端末装置1Aの表示画面8A上にて複数の画像取込フレーム801Aが設定された場合には、双方向対話中に複数の画像データが並行して伝送される。このような場合、当該画像伝送方法による伝送負荷だけが大きくなると他の画像伝送に影響を与えてしまう一方、他の処理が行われていない場合にはより伝送負荷を大きくすることで通信リソースのより効率的な利用も可能になる。そこで、この発明に係る画像伝送方法では、フレーム画像ごとのの伝送レートの変更(例えば、資料用の視覚データが伝送されている1〜2秒程度の間、対話者の顔画像伝送が停止されたとしても対話への影響は大きくない)、該フレーム画像の圧縮率の変更、更には画像サイズの変更を行うことにより、伝送品質の調整が行われる。なお、フレーム画像が複数の領域に分割されている場合、JPEG2000を利用することにより分割領域ごとに圧縮率の変更も可能である。   When a display change in the image capture frame 801A is detected by the motion detection in step ST30 described above, the transmission quality and image size of the frame image to be transmitted are further determined (step ST40). The transmission quality in step ST40 is determined by environmental conditions such as communication conditions. That is, the transmission quality and the image size of the frame image cut out so that the total transmission amount between the terminal device 1A on the transmission side and the terminal device 1B on the reception side is constant or less than a certain value are sequentially changed. For example, in a system in which each image data and voice data of a conversation person is transmitted / received, such as a videophone service or a video conference system, the control unit 120 reduces the transmission amount of the entire data including the face image and voice. Control. Normally, the processing load (CPU load), image processing such as transmission path capacity, and transmission capability in the terminal device 1A can be monitored. When a plurality of image capture frames 801A are set on the display screen 8A of the terminal device 1A, a plurality of image data are transmitted in parallel during the interactive conversation. In such a case, if only the transmission load due to the image transmission method increases, other image transmissions are affected. On the other hand, if other processing is not performed, the transmission load is increased by increasing the transmission load. More efficient use is also possible. Therefore, in the image transmission method according to the present invention, the transmission rate of each frame image is changed (for example, the face image transmission of the conversation person is stopped for about 1 to 2 seconds during which the visual data for the material is transmitted). However, the transmission quality is adjusted by changing the compression rate of the frame image and further changing the image size. When the frame image is divided into a plurality of regions, the compression rate can be changed for each divided region by using JPEG2000.

以上のように決定された伝送品質となるよう、切り取られたフレーム画像又は複数に分割された領域に対して符号化が行われ(ステップST50)、この符号化データが相手側対話者3Bの端末装置1Bへ順次送信される(ステップST60)。ところで、資料の画像圧縮データの伝送では、画面全体を送信しようとすると一度に連続送信するパケット数が著しく多くなってしまう。そこで、ADSLなど、ネットワーク上のパケット受信状況をモニタし、状況に応じて一定の間隔を開けてパケット送信するなどの非連続型の送信制御が有効になる(例えば、10パケット連続送信した後に20msec間隔を開け、再度10パケットを送信していく)。例えば、大きい資料であれば、この資料を一旦分割しこれら分割単位ごとに送信を行い、受信されたこれら分割単位を受信側で組み立てることになるが、これら分割単位の圧縮データの送信を、連続送信ではなく、一定の間隔を開けて送信していくのが好ましい。なお、上述の各ステップを経て送信されるデータは、端末装置1AにおけるD/B130にも順次格納される。このように逐次記録されたデータは当該双方向対話の記録データとなる。また、図5に示された画像伝送手順の中断又は中止は、対話者3Aがマウス操作やキーボード入力することにより割り込み処理される。   Encoding is performed on the clipped frame image or the region divided into a plurality of regions so as to achieve the transmission quality determined as described above (step ST50), and this encoded data is transmitted to the terminal of the other-party conversation party 3B. Sequentially transmitted to apparatus 1B (step ST60). By the way, in the transmission of the compressed image data of the material, the number of packets that are continuously transmitted at one time is remarkably increased when attempting to transmit the entire screen. Therefore, non-continuous transmission control such as ADSL or the like that monitors packet reception status on the network and transmits packets at regular intervals according to the status becomes effective (for example, 20 msec after 10 packets are transmitted continuously). Send 10 packets again at intervals.) For example, if the material is large, this material is divided once and transmitted for each division unit, and the received division unit is assembled on the receiving side. It is preferable to transmit at regular intervals rather than transmission. Note that data transmitted through the above-described steps is also sequentially stored in the D / B 130 in the terminal device 1A. The data sequentially recorded in this way becomes the recording data of the interactive dialogue. In addition, the interruption or cancellation of the image transmission procedure shown in FIG. 5 is interrupted by the dialog person 3A operating the mouse or inputting a keyboard.

一方、相手対話者3Bの端末装置では、図7に示されたように、まず、双方向対話の開始に先だって、端末装置1Bにおける表示画面8B上に相手対話者3Bにより表示ウィンド801Bが設定されており(ステップST100)、端末装置1Bは、端末装置1Aからの符号化データの受信待機状態となっている(ステップST110)。   On the other hand, as shown in FIG. 7, in the terminal device of the other party conversation person 3B, first, before the start of the interactive conversation, the display window 801B is set by the other party conversation person 3B on the display screen 8B in the terminal device 1B. (Step ST100), the terminal device 1B is in a standby state for receiving encoded data from the terminal device 1A (Step ST110).

端末装置1Aからの符号化データが到達すると、端末装置1Bでは制御部により復号化が行われ(ステップST120)、該制御部120が表示ウィンド801Bの情報(例えば、表示ウィンド801Bのサイズ)に基づいて拡大/縮小処理により得られた描画データをVRAM141に書き込んでいく(ステップST130)。この図7に示された表示動作においても、その中断又は中止は、対話者3Bがマウス操作やキーボード入力することにより割り込み処理される。   When the encoded data from the terminal device 1A arrives, the terminal device 1B performs decoding by the control unit (step ST120), and the control unit 120 determines the display window 801B information (for example, the size of the display window 801B). Then, the drawing data obtained by the enlargement / reduction process is written into the VRAM 141 (step ST130). Also in the display operation shown in FIG. 7, the interruption or cancellation is interrupted by the dialog person 3B by mouse operation or keyboard input.

この相手対話者3Bの端末装置1Bにおいて、以上のようにVRAM141へ書き込まれた描画データが、描画部140により表示画面8B上に表示ウィンド801B内に表示される。   In the terminal device 1B of the partner conversation person 3B, the drawing data written in the VRAM 141 as described above is displayed in the display window 801B on the display screen 8B by the drawing unit 140.

なお、上述の構成では、端末装置1B側で表示ウィンド801Bのサイズ設定は、相手対話者3Bにより行われるため、端末装置1A側の対話者3Aと端末装置1B側の対話者3Bが相似形のフレーム画像を見ているとは限らない。そこで、この発明は、両者の見ているフレーム画像が相似形になるように修正する機能や、両者の見ているフレーム画像の解像度を一致させる機能(ウィンドサイズ及びウィンド形状の修正機能)を備えてもよい。また、端末装置1A、1B間で同じ解像度のフレーム画像を表示させる場合、端末装置1B側で設定されたウィンドサイズでは表示しきれない可能性もある。この場合、この発明は、端末装置1B側で送信されたフレーム画像と相似形である縮小フレーム画像を表示させる機能を備えてもよい。この際、端末装置1B側は、縮小表示されている旨を示すアラーム発生や縮小率(あるいは拡大率)を表示する機能を含んでもよい。   In the above-described configuration, the size of the display window 801B is set on the terminal device 1B side by the partner dialoger 3B. Therefore, the dialoger 3A on the terminal device 1A side and the dialoger 3B on the terminal device 1B side are similar in shape. You are not always looking at frame images. Therefore, the present invention is provided with a function for correcting the frame images viewed by both to have similar shapes and a function for matching the resolutions of the frame images viewed by both (window size and window shape correcting functions). May be. In addition, when displaying frame images having the same resolution between the terminal devices 1A and 1B, there is a possibility that the window size set on the terminal device 1B side cannot be displayed. In this case, the present invention may include a function of displaying a reduced frame image that is similar to the frame image transmitted on the terminal device 1B side. At this time, the terminal device 1B side may include a function of displaying an alarm generation indicating that the display is reduced and a reduction rate (or enlargement rate).

この発明に係る画像伝送方法が適用可能なネットワークシステムの概略構成を示す図である。1 is a diagram showing a schematic configuration of a network system to which an image transmission method according to the present invention is applicable. この発明に係る画像伝送方法を実行可能な端末装置の構成を示すブロック図である。It is a block diagram which shows the structure of the terminal device which can perform the image transmission method which concerns on this invention. この発明に係る画像伝送方法を利用した双方向対話の実施形態を説明するための図である。It is a figure for demonstrating embodiment of the interactive dialogue using the image transmission method which concerns on this invention. この発明に係る画像伝送方法を概念的に説明するための図である。It is a figure for demonstrating notionally the image transmission method which concerns on this invention. 画像データの送信側端末における画像伝送手順(この発明に係る画像伝送方法)を説明するためのフローチャートである。It is a flowchart for demonstrating the image transmission procedure (The image transmission method which concerns on this invention) in the transmission side terminal of image data. この発明に係る画像伝送方法における動き検知動作の一例を説明するための図である。It is a figure for demonstrating an example of the motion detection operation | movement in the image transmission method which concerns on this invention. この発明に係る画像伝送方法により伝送された画像データの表示動作を説明するための図である。It is a figure for demonstrating the display operation | movement of the image data transmitted by the image transmission method which concerns on this invention.

符号の説明Explanation of symbols

1A、1B…端末装置、2…ネットワーク、2a、2b…ノード、8A、8B…表示画面(モニタ画面)、100A、100B…PC本体、200A、200B…ディスプレイ、801A…画像取込フレーム、801B…表示ウィンド。   DESCRIPTION OF SYMBOLS 1A, 1B ... Terminal device, 2 ... Network, 2a, 2b ... Node, 8A, 8B ... Display screen (monitor screen), 100A, 100B ... PC main body, 200A, 200B ... Display, 801A ... Image capture frame, 801B ... Display window.

Claims (9)

所定の伝送手段を介して互いに対話可能な状態に設定された第1端末装置から第2端末装置に対して、該第1端末装置から該第1端末装置の表示画面の一部を選択的に送信する画像伝送方法であって、
前記第1端末装置において、該第1端末装置の利用者により表示画面上で設定された1又は複数の画像取込フレームの該表示画面上の相対位置をモニタしながら、該画像取込フレームで囲まれた該表示画面の一部であるフレーム画像を所定のタイミングごとに切り取り、
切り取られた前記フレーム画像を前記第2端末装置に送信する画像伝送方法。
A part of a display screen of the first terminal device is selectively transmitted from the first terminal device to the second terminal device set to be in a state where they can interact with each other via a predetermined transmission means. An image transmission method for transmitting,
In the first terminal device, while monitoring the relative position on the display screen of one or a plurality of image capture frames set on the display screen by the user of the first terminal device, Cut out a frame image that is a part of the enclosed display screen at every predetermined timing,
An image transmission method for transmitting the cut frame image to the second terminal device.
前記画像取込フレームで規定されるフレーム画像は、それぞれが処理単位となる複数の領域に分割されることを特徴とする請求項1記載の画像伝送方法。 2. The image transmission method according to claim 1, wherein the frame image defined by the image capture frame is divided into a plurality of regions each serving as a processing unit. 前記表示画面上に設定された画像取込フレーム内における表示変化が検知されるごとに、該画像取込フレームで規定された前記表示画面の一部であるフレーム画像を前記第2端末装置へ送信することを特長とする請求項1又は2記載の画像伝送方法。 Each time a display change in the image capture frame set on the display screen is detected, a frame image that is a part of the display screen defined by the image capture frame is transmitted to the second terminal device. 3. The image transmission method according to claim 1, wherein the image transmission method is performed. 分割された前記複数の領域のうち表示変化が検知された領域を前記第2端末装置へ送信することを特長とする請求項2記載の画像伝送方法。 The image transmission method according to claim 2, wherein an area in which a display change is detected among the plurality of divided areas is transmitted to the second terminal device. 前記画像取込フレーム内における表示変化には、前記表示画面内における前記画像取込フレームの設定変更にともなう表示変化が含まれることを特徴とする請求項3又は4記載の画像伝送方法。 5. The image transmission method according to claim 3, wherein the display change in the image capture frame includes a display change accompanying a setting change of the image capture frame in the display screen. 前記第1及び第2端末装置間での総伝送量が一定又は所定値以下になるよう切り取られた前記フレーム画像全体又は分割された領域ごとに伝送品質又は画像サイズを逐次変更することを特徴とする請求項1〜5のいずれか一項記載の画像伝送方法。 The transmission quality or the image size is sequentially changed for the entire frame image or the divided area cut out so that the total transmission amount between the first and second terminal devices is constant or less than a predetermined value. The image transmission method according to any one of claims 1 to 5. 前記第1及び第2端末装置の少なくともいずれかにおいて、切り取られた前記フレーム画像を、該フレーム画像が伝送されるごとに順次記録していくことを特徴とする請求項1〜6のいずれか一項記載の画像伝送方法。 7. The cut frame image is sequentially recorded every time the frame image is transmitted in at least one of the first and second terminal devices. The image transmission method according to item. コンピュータにより請求項1〜7のいずれか一項記載の画像伝送方法を実行するコンピュータプログラム。 A computer program for executing the image transmission method according to claim 1 by a computer. コンピュータにより請求項1〜7のいずれか一項記載の画像伝送方法を実行するコンピュータプログラムが記録された記録媒体。 A recording medium in which a computer program for executing the image transmission method according to claim 1 is recorded by a computer.
JP2005194236A 2005-07-01 2005-07-01 Image transmitting method Pending JP2007013801A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005194236A JP2007013801A (en) 2005-07-01 2005-07-01 Image transmitting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005194236A JP2007013801A (en) 2005-07-01 2005-07-01 Image transmitting method

Publications (1)

Publication Number Publication Date
JP2007013801A true JP2007013801A (en) 2007-01-18

Family

ID=37751633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005194236A Pending JP2007013801A (en) 2005-07-01 2005-07-01 Image transmitting method

Country Status (1)

Country Link
JP (1) JP2007013801A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015208021A (en) * 2015-06-10 2015-11-19 レノボ・イノベーションズ・リミテッド(香港) Moving image communication system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0530498A (en) * 1991-07-24 1993-02-05 Seiko Epson Corp Moving picture data compressing device
JPH05336516A (en) * 1992-05-29 1993-12-17 Canon Inc Image communication device
JPH1066086A (en) * 1996-08-19 1998-03-06 Nec Off Syst Ltd Moving image processing system
JPH10257461A (en) * 1997-03-11 1998-09-25 Toshiba Corp Image transmitter, image receiver, system and method for picture communication
JP2000083239A (en) * 1998-07-08 2000-03-21 Victor Co Of Japan Ltd Monitor system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0530498A (en) * 1991-07-24 1993-02-05 Seiko Epson Corp Moving picture data compressing device
JPH05336516A (en) * 1992-05-29 1993-12-17 Canon Inc Image communication device
JPH1066086A (en) * 1996-08-19 1998-03-06 Nec Off Syst Ltd Moving image processing system
JPH10257461A (en) * 1997-03-11 1998-09-25 Toshiba Corp Image transmitter, image receiver, system and method for picture communication
JP2000083239A (en) * 1998-07-08 2000-03-21 Victor Co Of Japan Ltd Monitor system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015208021A (en) * 2015-06-10 2015-11-19 レノボ・イノベーションズ・リミテッド(香港) Moving image communication system

Similar Documents

Publication Publication Date Title
US8817061B2 (en) Recognition of human gestures by a mobile phone
US6453336B1 (en) Video conferencing with adaptive client-controlled resource utilization
US7539504B2 (en) Wireless telepresence collaboration system
US20170208291A1 (en) System and method for video communication on mobile devices
US7308476B2 (en) Method and system for participant automatic re-invite and updating during conferencing
US8560641B2 (en) Enhanced multimedia capabilities in video conferencing
US7719975B2 (en) Method and system for communication session under conditions of bandwidth starvation
US20110216153A1 (en) Digital conferencing for mobile devices
US20080062252A1 (en) Apparatus and method for video mixing and computer readable medium
US20050099492A1 (en) Activity controlled multimedia conferencing
JP2006101522A (en) Video conference system, video conference system for enabling participant to customize cooperation work model, and method for controlling mixing of data stream for video conference session
KR20120079454A (en) Apparatus and method for screen sharing
TW201031149A (en) Instant data sharing system and machine readable medium thereof
US7425979B2 (en) Communication system
JP2007150921A (en) Communication terminal, communication system and display method of communication terminal
US20070011232A1 (en) User interface for starting presentations in a meeting
CN111246150A (en) Control method, system, server and readable storage medium for video conference
US20100066806A1 (en) Internet video image producing method
JP2004187170A (en) Video conference system
US20130335517A1 (en) Information processing apparatus, conference system, and computer program products
JP4229774B2 (en) Session control program and communication terminal device
JP5274750B2 (en) Communication terminal and display method thereof
JP2007013801A (en) Image transmitting method
JP2005269498A (en) Video conference system, video conference terminal device, and its control method and video conference terminal device controlling program for it
US20130198399A1 (en) Input/output communication

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102