JP2008005349A - Video encoder, video transmission apparatus, video encoding method, and video transmission method - Google Patents
Video encoder, video transmission apparatus, video encoding method, and video transmission method Download PDFInfo
- Publication number
- JP2008005349A JP2008005349A JP2006174502A JP2006174502A JP2008005349A JP 2008005349 A JP2008005349 A JP 2008005349A JP 2006174502 A JP2006174502 A JP 2006174502A JP 2006174502 A JP2006174502 A JP 2006174502A JP 2008005349 A JP2008005349 A JP 2008005349A
- Authority
- JP
- Japan
- Prior art keywords
- video
- person
- encoding
- video data
- procedure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、テレビ会議や講演のスピーチ等の人物を含む映像データを符号化する映像符号化装置及び映像符号化方法、並びにネットワーク等を介して異なる地点間で上記映像データを伝送する映像伝送装置及び映像伝送方法に関する。 The present invention relates to a video encoding device and video encoding method for encoding video data including a person such as a teleconference or speech, and a video transmission device for transmitting the video data between different points via a network or the like. And a video transmission method.
従来、本社と営業所間等、離れた地点間での会議の時に使用する遠隔会議システムがあった。このような遠隔会議システムとしては、例えば、特許文献1に、会議参加者のそれぞれに対して1つずつマイクを設置して各発言者の音声を収音し、また、ズームアップ用カメラを用いて発言者を撮影するテレビ会議システムが開示されている。
特許文献1に示すようなテレビ会議システムでは、専用回線等を介して音声データや映像データをやりとりしている。また、最近のテレビ会議システムでは、ISDN回線やアナログ電話網などの低ビットレートの通信回線を利用したネットワークを介してテレビ会議を行うことができるように、MPEG1,2やITU−T H.263などで規定された映像圧縮方法を用いて圧縮したデジタル映像データをやりとりしている。
In a video conference system as shown in
MPEG1,2やITU−T H.263などを利用して映像を符号化する場合、動き情報と映像の空間的な情報量から、一定で均一なアルゴリズムを使用して、ビット割り当てを行う。例えば、テレビ放送のスポーツ番組や映画DVD等のコンテンツでは、このような方法がとられる。 MPEG1, 2 and ITU-TH. When video is encoded using H.263 or the like, bit allocation is performed using a constant and uniform algorithm from the motion information and the spatial information amount of the video. For example, such a method is used for contents such as television broadcast sports programs and movie DVDs.
一方、従来のテレビ会議システムは、低ビットレートの通信回線でもテレビ会議が行えるように設計されているにもかかわらず、同時接続するユーザ数の増加等により、通信回線のトラフィックが増大して通信レートが低下した場合には、映像全体にわたって品質が低下するので必要な情報を送ることができず、例えば動いている人物がモザイク画のようになったり、動いている人物の画像が欠落したりするという問題があった。 On the other hand, the conventional video conferencing system is designed so that video conferencing can be performed even with a low bit rate communication line, but the communication line traffic increases due to an increase in the number of simultaneously connected users. If the rate drops, the quality of the whole video will drop, so you will not be able to send the necessary information.For example, a moving person will look like a mosaic picture, or a moving person's image will be missing. There was a problem to do.
そこで、本発明は、テレビ会議や講演のスピーチ等の映像において、注目される対象である人物の映像について品質を保ちながら、映像データを効率良く符号化できる映像符号化装置及び映像符号化方法、並びに伝送路の通信レートや映像全体に占める人物の情報量の割合に応じて、効率良く影像データを伝送できる映像伝送装置及び映像伝送方法を提供することを目的とする。 Therefore, the present invention provides a video encoding apparatus and a video encoding method capable of efficiently encoding video data while maintaining the quality of a video of a person who is a target of attention in a video such as a video conference or speech. It is another object of the present invention to provide a video transmission apparatus and a video transmission method capable of efficiently transmitting image data in accordance with the communication rate of the transmission path and the ratio of the amount of human information to the entire video.
この発明は、上記の課題を解決するための手段として、以下の構成を備えている。 The present invention has the following configuration as means for solving the above problems.
(1)人物及びその周囲を撮影してその映像を出力する撮像手段と、
前記映像から人物を検出する人物検出手段と、
前記映像から前記検出した人物の映像を周期的に抽出して、この人物映像データを低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化する符号化処理を行う符号化手段と、
を備えたことを特徴とする。
(1) imaging means for photographing a person and its surroundings and outputting the image;
A person detecting means for detecting a person from the video;
Encoding for periodically extracting the detected person's video from the video, encoding the human video data at a low compression rate, and encoding the video data other than the person at a high compression rate Means,
It is provided with.
この構成においては、映像符号化装置は、人物及びその周囲の映像から、人物の映像を抽出して、この映像データを低圧縮率で符号化し、人物以外の映像データを高圧縮率で符号化する。したがって、テレビ会議や講演のスピーチ等の映像においては、動きがほとんど発生せず、注目されるのは人物の領域であるため、注目される対象の映像については、品質を保ちながら映像データを効率良く符号化できる。 In this configuration, the video encoding device extracts a video of a person from a person and surrounding video, encodes this video data at a low compression rate, and encodes video data other than the person at a high compression rate. To do. Therefore, in video such as video conferences and speeches, there is almost no movement, and attention is focused on the human area. Encode well.
(2)人物及びその周囲を撮影してその映像を出力する撮像手段と、
前記映像から人物を検出する人物検出手段と、
前記撮像手段が撮影した映像の全体領域を符号化し、それ以降は周期的に、映像中の人物を含む矩形領域である人物映像データを符号化する符号化手段と、
を備えたことを特徴とする。
(2) imaging means for photographing a person and its surroundings and outputting the image;
A person detecting means for detecting a person from the video;
Encoding means for encoding the entire area of the video imaged by the imaging means, and thereafter encoding the person video data that is a rectangular area including a person in the video periodically;
It is provided with.
この構成においては、映像伝送装置は、人物及びその周囲の映像の全体領域を符号化し、それ以降は人物の映像データのみを符号化する。したがって、テレビ会議や講演のスピーチ等の映像においては、動きがほとんど発生せず、注目されるのは人物の領域であるため、注目される対象である人物の映像を周期的に符号化することで、復号時には、全体領域の映像において、人物の領域だけを更新すれば良いので、さらに映像データを効率良く符号化できる。 In this configuration, the video transmission apparatus encodes the entire area of the person and the surrounding video, and thereafter encodes only the video data of the person. Therefore, in video such as video conferences and speeches, there is almost no movement, and it is the person's area that is noticed. Therefore, the video of the person who is the subject of attention should be encoded periodically. Thus, at the time of decoding, only the person area needs to be updated in the video of the entire area, so that the video data can be encoded more efficiently.
(3)前記撮像手段が撮影した映像の全体領域における構成の変化を検出するシーンチェンジ検出手段を備え、
前記符号化手段は、前記シーンチェンジ検出手段が映像の全体領域における構成の変化を検出したタイミングで、映像の全体領域を符号化することを特徴とする。
(3) a scene change detecting means for detecting a change in configuration in the entire area of the video imaged by the imaging means;
The encoding means encodes the entire area of the video at a timing when the scene change detection means detects a change in configuration in the entire area of the video.
この構成においては、シーンチェンジ検出手段が映像の全体領域における構成の変化を検出したタイミングで、映像の全体領域を符号化する。したがって、テレビ会議や講演のスピーチ等の映像において、シーンチェンジが発生した時には、映像の領域全体を設定(更新)しなおすので、復号時において映像に矛盾が生じることなく、符号化することかできる。 In this configuration, the entire area of the video is encoded at the timing when the scene change detection means detects the change in the configuration in the entire area of the video. Therefore, when a scene change occurs in a video such as a video conference or speech, the entire video area is set (updated), so that the video can be encoded without any contradiction during decoding. .
(4)(1)乃至(3)のいずれかに記載の映像符号化装置と、
前記映像符号化装置が符号化した映像データを相手装置に送信する通信手段と、
を備えたことを特徴とする。
(4) The video encoding device according to any one of (1) to (3),
Communication means for transmitting video data encoded by the video encoding device to a counterpart device;
It is provided with.
この構成においては、映像伝送装置は、符号化した映像データを相手装置に送信する。したがって、テレビ会議や講演のスピーチ等の映像が効率良く符号化されているので、伝送路の通信レートに左右されることなく確実に相手装置に映像データを送信することができる。 In this configuration, the video transmission device transmits the encoded video data to the counterpart device. Accordingly, since video such as a video conference or lecture speech is efficiently encoded, the video data can be reliably transmitted to the partner apparatus regardless of the communication rate of the transmission path.
(5)人物及びその周囲を撮影してその映像を出力する撮像手段と、
前記映像から人物を検出する人物検出手段と、
伝送路の通信レートの状態、及び映像全体に占める人物の情報量の割合に基づいて所定の演算を行う演算手段と、
前記演算手段の演算結果が閾値以上の場合には、前記撮像手段が撮影した映像から前記検出した人物の映像を周期的に抽出して、この映像データを低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化し、
前記演算手段の演算結果が閾値未満の場合には、前記撮像手段が撮影した映像の全体領域を符号化し、それ以降は周期的に、映像中の人物を含む矩形領域である人物映像データを符号化する符号化手段と、
前記符号化手段が符号化した映像データを相手装置に送信する通信手段と、
を備えたことを特徴とする。
(5) imaging means for photographing a person and its surroundings and outputting the image;
A person detecting means for detecting a person from the video;
A calculation means for performing a predetermined calculation based on the state of the communication rate of the transmission path and the ratio of the information amount of the person in the entire video;
If the calculation result of the calculation means is equal to or greater than a threshold, the detected person's video is periodically extracted from the video taken by the imaging means, and the video data is encoded at a low compression rate. Video data at a high compression rate,
When the calculation result of the calculation means is less than the threshold value, the entire area of the video imaged by the imaging means is encoded, and thereafter the person video data that is a rectangular area including the person in the video is encoded periodically. Encoding means for
Communication means for transmitting the video data encoded by the encoding means to a counterpart device;
It is provided with.
この構成においては、映像伝送装置は、通信レートの状態、及び映像全体に占める人物の情報量の割合に基づいて行う所定の演算の結果が一定値以上の場合には、映像から人物の映像を抽出して、この人物映像データを低圧縮率で符号化し、人物以外の映像データを高圧縮率で符号化して、両映像データを相手装置に送信する。また、映像伝送装置は、上記の演算の結果が一定値未満の場合には、映像データの全体領域を符号化して、その映像データを相手装置に送信し、それ以降は人物を矩形に抽出した映像データを符号化して、その映像データを相手装置に送信する。したがって、伝送路における通信レートの状態、及び映像全体に占める人物の情報量の割合に応じて、映像における情報量の再割り当てや不要情報の削除を行うことにより、テレビ会議や講演のスピーチ等の映像において、注目される対象である人物の映像を確実に相手装置に送信することができる。 In this configuration, when the result of a predetermined calculation performed based on the state of the communication rate and the ratio of the information amount of the person occupying the entire video is equal to or greater than a certain value, the video transmission apparatus converts the video of the person from the video. The person video data is extracted and encoded at a low compression rate, the video data other than the person is encoded at a high compression rate, and both video data are transmitted to the partner apparatus. In addition, when the result of the above calculation is less than a certain value, the video transmission apparatus encodes the entire area of the video data, transmits the video data to the partner apparatus, and thereafter extracts the person into a rectangle. The video data is encoded, and the video data is transmitted to the partner apparatus. Therefore, depending on the state of the communication rate on the transmission path and the ratio of the amount of human information to the entire video, the information amount in the video is reassigned and unnecessary information is deleted, so that video conferences, speeches, etc. In the video, it is possible to reliably transmit the video of the person who is the target of attention to the partner apparatus.
(6)人物及びその周囲を撮影した映像から、人物を周期的に検出する手順、
前記検出した人物の映像データを抽出して低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化する手順、
を備えたことを特徴とする。
(6) a procedure for periodically detecting a person from an image of the person and the surroundings;
Extracting the detected person's video data and encoding it at a low compression rate, and encoding the video data other than the person at a high compression rate,
It is provided with.
この構成においては、(1)と同様の作用効果を得ることができる。 In this configuration, the same effect as (1) can be obtained.
(7)人物及びその周囲を撮影した映像から、人物を周期的に検出する手順、
前記人物及びその周囲の映像の全体領域を符号化し、それ以降は周期的に、映像中の人物を含む矩形領域である人物映像データを符号化する手順、
を備えたことを特徴とする。
(7) a procedure for periodically detecting a person from an image of the person and its surroundings;
A procedure for encoding the entire area of the person and the surrounding video, and encoding the person video data which is a rectangular area including the person in the video periodically thereafter;
It is provided with.
この構成においては、(2)と同様の作用効果を得ることができる。 In this configuration, the same effect as (2) can be obtained.
(8)前記人物及びその周囲の映像における全体領域の構成変化を検出する手順、
前記映像における全体領域の構成変化を検出したタイミングに、前記映像データの全体領域を符号化する手順、
を備えたことを特徴とする。
(8) A procedure for detecting a configuration change of the entire area in the person and the surrounding image,
A procedure for encoding the entire area of the video data at a timing when a change in the configuration of the entire area in the video is detected;
It is provided with.
この構成においては、(3)と同様の作用効果を得ることができる。 In this configuration, the same effect as (3) can be obtained.
(9)(6)乃至(8)のいずれかに記載の映像符号化方法を行った後に、
前記符号化した映像データを相手装置に送信する手順、
を備えたことを特徴とする。
(9) After performing the video encoding method according to any one of (6) to (8),
A procedure for transmitting the encoded video data to a counterpart device;
It is provided with.
この構成においては、(4)と同様の作用効果を得ることができる。 In this configuration, the same effect as (4) can be obtained.
(10)伝送路の通信レートの状態、及び映像全体に占める人物の情報量の割合に基づいて所定の演算を行う手順、
前記演算結果が閾値以上の場合において、
人物及びその周囲を撮影した映像から、人物を周期的に検出する手順、
前記検出した人物の映像データを抽出して低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化する手順、
前記符号化された人物映像データ及び人物以外の映像データを相手装置に送信する手順、
前記演算結果が閾値未満の場合において、
人物及びその周囲を撮影した映像から、人物を周期的に検出する手順、
前記映像の全体領域を符号化し、それ以降は周期的に前記映像中の人物を含む矩形領域である人物映像データを符号化する手順、
前記符号化された映像データを相手装置に送信する手順、
を備えたことを特徴とする。
(10) A procedure for performing a predetermined calculation based on the state of the communication rate of the transmission path and the ratio of the information amount of the person in the entire video,
When the calculation result is equal to or greater than a threshold value,
A procedure for periodically detecting a person from an image of the person and its surroundings,
Extracting the detected person's video data and encoding it at a low compression rate, and encoding the video data other than the person at a high compression rate,
A procedure for transmitting the encoded person video data and video data other than the person to the counterpart device;
When the calculation result is less than the threshold value,
A procedure for periodically detecting a person from an image of the person and its surroundings,
A procedure for encoding the entire area of the video, and thereafter encoding the person video data which is a rectangular area including the person in the video periodically;
A procedure for transmitting the encoded video data to a counterpart device;
It is provided with.
この構成においては、(5)と同様の作用効果を得ることができる。 In this configuration, the same effect as (5) can be obtained.
テレビ会議や講演のスピーチ等の映像においては、動きがほとんど発生せず、また人物等の注目される対象以外についての情報はほぼ不要であるといった特徴を持つが、本発明によれば、映像における情報量の再割り当てや不要情報の削除を行うことにより、伝送路の通信レートの状態、及び映像全体に占める人物の情報量の割合に基づいて行った所定の演算結果が閾値未満の場合には、注目される対象の映像のみを符号化して送信し、上記演算結果が閾値以上の場合には、注目される対象の映像を低圧縮率で、背景映像を高圧縮率で符号化して送信するので、回線の状況や映像の特徴に応じて、通信レートが低下しても、注目される対象の映像を確実に送ることができる。また、同じ転送レートでは映像の高画質化を、また、同じ品質であれば低ビットレート化を図ることができる。 In video images such as video conferences and speeches, there is little movement, and there is a feature that information about objects other than the subject of interest such as people is almost unnecessary. When the predetermined calculation result based on the state of the communication rate of the transmission path and the proportion of the information amount of the person in the entire video is less than the threshold by reallocating the information amount or deleting unnecessary information , Only the target video of interest is encoded and transmitted, and if the calculation result is equal to or greater than the threshold, the target video of interest is encoded with a low compression rate and the background video is encoded with a high compression rate and transmitted. Therefore, even if the communication rate decreases according to the line status and video characteristics, it is possible to reliably send the target video. In addition, it is possible to improve the image quality of the video at the same transfer rate, and to reduce the bit rate if the quality is the same.
以下の説明では、本発明の映像符号化装置及び映像伝送装置の機能を備えた遠隔会議装置を例に挙げて説明する。なお、本発明の符号化装置及び映像伝送装置は、もちろん単独の構成であっても良い。 In the following description, a remote conference apparatus having the functions of the video encoding apparatus and the video transmission apparatus of the present invention will be described as an example. Of course, the encoding device and the video transmission device of the present invention may have a single configuration.
図1は、本発明の一実施形態に係る遠隔会議装置の斜視概観図、及びネットワーク接続した2台の遠隔会議装置を示す図である。図1(A)に示すように、遠隔会議装置1は、一方向に長尺な直方体形状であり、スピーカアレイ26を構成する8個のスピーカユニットSP1〜SP8、及びマイクアレイ30を構成する14個のマイクユニットMIC1〜MIC14が、正面側にそれぞれ一定の間隔で直線上に配置された構成である。また、図示していないが、遠隔会議装置1の裏面側には、入出力コネクタ64が設けられている。
FIG. 1 is a perspective view of a remote conference apparatus according to an embodiment of the present invention, and a diagram showing two remote conference apparatuses connected to a network. As shown in FIG. 1A, the
なお、スピーカアレイ26を構成するスピーカユニット数及びマイクアレイ30を構成するマイクユニット数は、上記の数量に限定するものではない。
The number of speaker units constituting the
遠隔会議装置1には、ビデオカメラ50及びモニタ52を接続可能であり、これらを接続した場合には、図1(A)に示したようにモニタ52の上面に遠隔会議装置1を載せ、さらに遠隔会議装置1の上面にビデオカメラ50を載せて使用すると良い。また、遠隔会議装置1は、ビデオカメラ50及びモニタ52の接続の有無にかかわらず、会議机の端や台の上に置いて使用することも可能である。
A
図1(B)に示すように、2台の遠隔会議装置1a,1bをインターネットやLAN等のネットワーク8に接続することで、遠隔会議システムを構築することができる。遠隔会議装置1aは、ネットワーク8に接続されている別の遠隔会議装置1bと、マイクアレイ30で収音した音声信号やビデオカメラ50で撮像した映像信号を、SIP等のプロトコルを用いてやりとり(送受信)する。ユーザは、遠隔会議装置1a,1b、ビデオカメラ50a,50b及びモニタ52a,52bを使用することで、異なる地点a,b間で音声と映像によるテレビ会議を行うことができる。また、図示していないが、複数の遠隔会議装置1をネットワーク8に接続することで、さらに複数の地点間でテレビ会議を行うことが可能である。
As shown in FIG. 1B, a remote conference system can be constructed by connecting two
次に、遠隔会議装置1の具体的な構成について説明する。図2は、本発明の一実施形態に係る遠隔会議装置の機能ブロック図である。遠隔会議装置1は、リモコン(リモートコントローラ)10、信号受信部12、制御部14、メモリ16、音声処理部20、8個のスピーカユニットSP1〜SP8から成るスピーカアレイ26、14個のマイクユニットMIC1〜MIC14から成るマイクアレイ30、ビデオカメラ50、モニタ52、映像符号化部54、映像復号部56、多重化/分離部60、通信部62、及び入出力コネクタ64を備えている。
Next, a specific configuration of the
遠隔会議装置1では、ITU−T H.261、H.262、H.263、H.264、MotionJPEGなどの映像符号化方式に対して適応することができる。
In the
ここで、本発明は映像伝送装置の映像処理機能に関するものであり、音声処理機能は主題から外れるので、以下の説明では遠隔会議装置1の音声処理系の説明は簡単にとどめる。
Here, the present invention relates to the video processing function of the video transmission apparatus, and the audio processing function is not the subject of the present invention. Therefore, in the following description, the description of the audio processing system of the
リモコン10は、操作部101を備えており、遠隔会議装置1の各種設定を行うためのものである。リモコン10は、ユーザの操作に応じた信号を赤外光として出力する。
The
信号受信部12は、リモコン10から出力された信号(赤外光)を受信(受光)して、制御部14に出力する。
The
制御部14は、音声処理部20・ビデオカメラ50・映像符号化部54・映像復号部56・通信部62等を制御する。また、制御部14は、信号受信部12から送られてきた信号に基づいて各部を制御したり、メモリ16からプログラムを読み出したりメモリ16にデータを書き込んだりする。
The
メモリ16は、制御部14が実行するプログラムや、制御部14によって書き込まれたデータ等を記憶している。
The
音声処理部20は、マイクアレイ30で収音した音声信号を、圧縮・符号化して多重化/分離部60に出力したり、多重化/分離部60から符号化された音声信号が送られてくると、復号してスピーカアレイ26に出力したりする。また、音声処理部20は、マイクアレイ30が収音した音声信号と、スピーカアレイ26に対して出力する音声信号と、に対して、エコーキャンセル処理を行うことにより、適切なエコー除去が行われ、自装置の話者音声のみが出力音声信号として、ネットワークに送信される。
The
スピーカユニットSP1〜SP8は、無指向性のスピーカから成り、音声処理部20から個別に与えられた放音信号を音声変換して外部に放音する。
The speaker units SP <b> 1 to SP <b> 8 are composed of omnidirectional speakers, which convert sound output signals individually given from the
マイクアレイ30を構成する各マイクユニットMIC1〜MIC14は、遠隔会議装置1の外部からの音声を収音して電気信号に変換し、収音信号を音声処理部20に出力する。
Each microphone unit MIC <b> 1 to MIC <b> 14 constituting the
ビデオカメラ50は、会議風景や会議参加者(人物)の映像を撮像して、その映像データを一定周期で映像符号化部54に出力する。
The
モニタ52は、別の遠隔会議装置から送られてきて、映像復号部56で復号された映像データを表示する。
The
映像符号化部54は、ビデオカメラ50から一定周期で出力された映像データをエンコード(符号化)して、多重化/分離部60に出力する。また、映像符号化部54は、映像ブロック情報量や人物重み係数を制御部14に対して出力する。
The
映像復号部56は、多重化/分離部60から出力された符号化された映像データをデコード(復号)して、モニタ52へ出力する。
The
多重化/分離部60は、音声処理部20から出力された符号化された音声データと、映像符号化部54から出力された符号化された映像信号と、を多重化してストリームデータを通信部62へ出力する。また、多重化/分離部60は、通信部62から送られてきたストリームデータを符号化された音声データと符号化された映像データに分離して、音声信号を音声処理部20へ出力し、映像信号を映像復号部56へ出力する。
The multiplexing / separating
通信部62は、多重化/分離部60から出力されたストリームデータを、ネットワーク8における通信方式に対応するデータ形式(プロトコル)に変換して、入出力コネクタ64及びネットワーク8を介して別の遠隔会議装置1へ送信する。また、通信部62は、入出力コネクタ64に接続されたネットワーク(LAN)8を介して入力された別の遠隔会議装置1から送られてきたストリームデータを、ネットワーク8に対応するデータ形式(プロトコル)から変換して、多重化/分離部60に出力する。さらに、通信部62は、ネットワーク(伝送路)8における通信の状態(損失)を監視しており、制御部14に対してその情報を随時送信している。
The
次に、映像符号化部54の詳細な構成について説明する。図3は、映像符号化部の構成を示すブロック図である。
Next, a detailed configuration of the
映像符号化部54は、顔/人物検出器70、画面切替検出器72、符号化制御器74、第1切替スイッチ76、離散余弦変換器(DCT)78、量子化器(Q)80、符号化器81、逆量子化器(IQ)82、逆離散余弦変換器(IDCT)84、加算器86、動き補償付き映像メモリ88、第2切替スイッチ90、及び減算器92を備えている。
The
映像符号化部54では、イントラ符号化を行う場合には、第1切替スイッチ76をイントラ端子76A側に切り替え、第2切替スイッチ90をイントラ端子90A側に切り替える。また、映像符号化部54では、インター符号化を行う場合には、第1切替スイッチ76をインター端子76B側に切り替え、第2切替スイッチ90をインター端子90B側に切り替える。
When performing the intra coding, the
ビデオカメラ50から入力された映像データは、顔/人物検出器70、第1切替スイッチ76のイントラ端子76A、動き補償付き映像メモリ88、及び減算器92に送られる。
Video data input from the
顔/人物検出器70は、送られてきた映像データ中に、顔や人物の特徴を有する映像の有無を判定し、顔や人物の特徴を有する映像を検出すると、顔の場合と人物の場合とで異なる信号を符号化制御器74へ出力する。顔/人物検出器70は、肌の色や画面輪郭構成等を利用して顔部を検出する。すなわち、顔/人物検出器70は、スキントーンや、顔のパーツ(目、めがね、鼻、口等)、映像の輝度変化等の特徴を利用して、顔部を検出する。
When the face /
また、顔/人物検出器70は、画面切替検出器72から大域的な境界/動き検出信号を取得して、顔部の検出信号とともに複合的に人物抽出を行う。具体的には、顔/人物検出器70は、顔部が存在する領域に対して、縮退・拡張処理を行うとともに近傍エッジ検出を行って、大域的な領域から人物を検出する。また、会議参加者は口や手を動かしていることが多いので、弱い動きが存在するなどのパラメータを用いて、人物の検出精度を向上させる。
In addition, the face /
なお、以上の処理は、符号化単位のフレーム毎に行う必要は無い。また、遠隔会議装置1に設定されているモードに応じて、検出結果をビット優先割り当ての優先順位を上げる感度係数に利用したり、限定領域エリア決定のための情報としたりする。例えば、顔部の重み(感度)を高くし、その周辺部である人物(体)をそれに続く重み係数に設定する。
Note that the above processing need not be performed for each frame of a coding unit. Further, according to the mode set in the
ビデオカメラ50から入力された映像データは、イントラ符号化を行う場合には、第1切替スイッチ76を介して離散余弦変換器78に送られ、離散余弦変換器78で離散余弦変換処理が施され、量子化器80に送られる。量子化器80は、符号化制御器74から送られてきた量子化パラメータに基づいて、離散余弦変換器78から送られてきた映像データを量子化して、符号化器81へ出力する。また、量子化器80で量子化された映像データは、逆量子化器82で逆量子化され、さらに逆離散余弦変換器84で逆離散余弦変換処理が施されて、加算器86に送られる。
When performing intra coding, the video data input from the
加算器86は、イントラ符号化を行う場合には、逆離散余弦変換器84から出力された映像データをそのまま動き補償付き映像メモリ88へ出力する。また、加算器86は、インター符号化を行う場合には、動き補償付き映像メモリ88から第2切替スイッチ90を介して送られてきた動き補償付き映像データと、逆離散余弦変換器84から出力された映像データと、を加算して、動き補償付き映像メモリ88に出力する。
When the intra coding is performed, the
動き補償付き映像メモリ88は、加算器86から出力された映像データと、ビデオカメラ50からの映像データと、を用いて生成した動き補償映像を、減算器92に出力する。また、動き補償付き映像メモリ88は、動きベクトルを符号化器81に出力する。さらに、インター符号化を行う場合には、動き補償付き映像メモリ88は、第2切替スイッチ90を介して加算器86に動き補償映像を出力する。
The motion compensated
減算器92は、ビデオカメラ50の映像データを、動き補償付き映像メモリ88から出力された動き補償映像データから減算して、フレーム間の差分データを画面切替検出器72へ出力する。また、インター符号化を行う場合には、減算器92は、第1切替スイッチ76を介して離散余弦変換器78へ、フレーム間の差分データを出力する。
The
このフレーム間の差分データは、離散余弦変換器78で離散余弦変換処理が施され、量子化器80に送られる。量子化器80は、符号化制御器74から送られてきた量子化パラメータに基づいて、離散余弦変換器78から送られてきたフレーム間の差分データを量子化して、画素係数を符号化器81へ出力するとともに逆量子化器82へ出力する。
The difference data between the frames is subjected to a discrete cosine transform process by a
画面切替検出器72は、減算器92から出力されたフレーム間の差分データに基づいて画面の切り替わりを検出する。画面切替検出器72は、シーンチェンジはもちろん、輝度や彩度が大きく変化した場合、カメラがパン、ズーム、チルトの動作が発生した場合等、画面が切り替わったことを検出した場合には、符号化制御器74へその旨を伝える信号を出力する。
The
符号化制御器74は、イントラ符号化を行うか、またはインター符号化を行うかに応じて、第1切替スイッチ76及び第2切替スイッチ90へ切り替え信号を出力するとともに、符号化器81へイントラフラグまたはインターフラグを出力する。また、符号化制御器74は、符号化フラグまたは非符号化フラグを符号化器81へ出力する。さらに、符号化制御器74は、量子化器80及び符号化器81へ量子化パラメータを出力する。
The encoding
次に、遠隔会議装置1の動作について説明する。図4は、遠隔会議装置を用いた会議風景、及びビデオカメラが撮影した通常モードの映像を示す図である。
Next, the operation of the
図5は、ビット優先割当モードで撮影した映像を示す図である。図6は、限定領域伝送モードで撮影した映像を示す図である。図7は、ズーム前の会議風景の全体画像、及びズーム後の会議風景の全体画像を示す図である。 FIG. 5 is a diagram showing a video shot in the bit priority assignment mode. FIG. 6 is a diagram illustrating an image captured in the limited area transmission mode. FIG. 7 is a diagram illustrating an entire image of the conference landscape before zooming and an entire image of the conference landscape after zooming.
図4(A)に示すように、モニタ52、遠隔会議装置1、及びビデオカメラ50を、会議机41の前に設置することで、会議の映像や会議参加者が発言する音声を別の遠隔会議装置とネットワーク(伝送路)8を介してやりとりすることができる。
As shown in FIG. 4A, by installing the
ビデオカメラ50が撮影した会議風景は、図4(B)に示すような映像として別の遠隔会議装置に送られる。
The conference scene shot by the
遠隔会議装置1では、1.通常モード、2.ビット優先割当モード、及び3.限定領域伝送モードのうちいずれか1つの映像データ伝送モードを設定することができる。ただし、限定領域伝送モードであってもビット優先割当モードまたは通常モードの状態、また、ビット優先割当モードであっても通常モードの状態に自動的に遷移する場合がある。
In the
1.通常モードは、映像を符号化する場合に、動き情報と、映像の空間的な情報量から、一定で均一なアルゴリズムを使用して、ビット割り当てを行うモードである。このモードは、必要なビットレートに対して伝送路に余裕が十分にある場合か、画面全体を更新しなければならない場合に使用する。 1. The normal mode is a mode in which bits are allocated using a constant and uniform algorithm from motion information and the amount of spatial information of the video when encoding the video. This mode is used when the transmission path has a sufficient margin for the required bit rate or when the entire screen has to be updated.
2.ビット優先割当モードは、動き情報と、時間差分情報の情報量と、人物重み係数を利用してビット割り当てを行う。すなわち、映像における重要な領域である人物や特に顔の部分により多くの符号ビットが割り振られるように設定する。このモードでは、人物の領域やその顔の領域を抽出する。遠隔会議装置1は、例えば図5に示すように、映像符号化部54の顔/人物検出器70により会議風景映像中の人物A〜Cやその顔の部分を検出する。映像符号化部54の符号化制御器74は、人物重み係数を用いて、ブロック(例えばマクロブロック)の符号化打ち切りの判断を行う。また、符号化制御器74は、人物重み係数を用いて、量子化器80に出力する量子化パラメータと連動し、より符号ビットが割り振られるように設定する。これにより、ビット優先割当モードでは、図5に示した会議風景映像において、人物A〜Cの顔の領域[1]・[3]・[5]は低圧縮率で高品位な映像で、人物A〜Cの体の領域[2]・[4]・[6]は、人物A〜Cの顔の領域に次いで低圧縮率で高品位な映像で、その他の領域である背景の領域[7]は高圧縮率で低品位な映像で、別の遠隔会議装置に送られる。
2. In the bit priority allocation mode, bit allocation is performed using motion information, the amount of time difference information, and a person weighting factor. In other words, the setting is made so that more code bits are allocated to a person who is an important area in the video and particularly to a face portion. In this mode, the person area and the face area are extracted. For example, as shown in FIG. 5, the
また、遠隔会議装置1は、通常、画面を帯状構造に分割して、その単位で、画面の上端から順番に下端まで送信するが、このモードでは、送信最後で符号が割り当てられなくなるのを防ぐために、画面の中で重要な領域を先に送信する。すなわち、通常、会議風景の映像では人物の領域は、画面の中央部から下部にかけて位置するが、遠隔会議装置1は、このモードでは、図5(B)に示すように、画面を帯状構造に分割して、会議風景の映像における人物を検出すると、その人物を含む領域(同図における人物Bの頭頂部を含む領域[3])の上端から順に下端まで送信し、続いて上端から順に、その人物を含む領域の直前までを送信する。
In addition, the
3.限定領域伝送モードは、ISDNやGSTN(アナログ電話網)、そして輻輳が大きい、かつまた低帯域のIP網のような低ビットレートでのテレビ会議やスピーチモードの場合に適用する。伝送路が低ビットレートの場合には、映像において動きが無いエリアであっても、ヘッダのオーバヘッドが相対的に大きくなる。そのため、このモードでは、映像データの送信開始時及びシーンチェンジ時には、図6(A)に示すように、会議風景の全体領域[10]の映像を伝送するが、それ以外の時には、必要なデータを確実に伝送するために、図6(B)に示すように、映像における必要な領域、すなわち顔や人物の領域[11]〜[14]のみを伝送して、他の領域についてはブロックの属性情報も送信しないように設定されている。 3. The limited area transmission mode is applied to video conferencing and speech modes at a low bit rate such as ISDN, GSTN (analog telephone network), and a high congestion and low bandwidth IP network. When the transmission path has a low bit rate, the header overhead becomes relatively large even in an area where there is no motion in the video. Therefore, in this mode, as shown in FIG. 6 (A), when the transmission of video data is started and when the scene changes, the video of the entire area [10] of the conference scene is transmitted. 6B, as shown in FIG. 6B, only the necessary areas in the video, that is, the face and person areas [11] to [14] are transmitted, and the other areas are block blocks. The attribute information is also set not to be transmitted.
また、このモードでは、伝送するデータ量を抑えるために、以下のように顔や人物の領域を設定する。すなわち、実装を容易にするために、顔や人物の領域のブロック形状を矩形に設定し、人物重み係数を利用してこの矩形領域を決定する。また、あまり細かなブロックに分割せず、会議風景の映像に含まれる人物の数程度までになるように設定する。また、このモードでは、別の遠隔会議装置1に対して、上記のブロックは、先頭ブロックのアドレスを送信し、連続するブロックの画像データを送信する。
In this mode, in order to reduce the amount of data to be transmitted, the face and person areas are set as follows. That is, in order to facilitate the implementation, the block shape of the face or person area is set to a rectangle, and this rectangle area is determined using a person weighting factor. In addition, the setting is made so that the number of persons included in the video of the meeting scene is not divided into very fine blocks. Further, in this mode, the above block transmits the address of the first block and transmits image data of successive blocks to another
また、別の符号化方式として、図6(C)の上部に示すように、データを伝送しない領域、すなわち顔や人物の領域以外の領域(同図における黒ベタ領域)については、どれだけブロックをスキップするかを指定する情報のみを送り、顔や人物の領域(同図における人物A,B,Cの領域)についてはブロックアドレスと映像データを送るように設定することが可能である。この方式では、人物数に依存することなく、また、矩形に限らず複雑な形状であっても、符号化する領域(伝送する領域)および符号化しない領域(伝送しない領域)を決定して、映像データを容易に伝送することができる。 Further, as another encoding method, as shown in the upper part of FIG. 6 (C), for an area where data is not transmitted, that is, an area other than the face or person area (solid black area in the figure) It is possible to send only the information specifying whether to skip the image, and to send a block address and video data for the face and person areas (person A, B, and C areas in the figure). In this method, it is not dependent on the number of persons, and even if the shape is not limited to a rectangle, a region to be encoded (region to transmit) and a region not to be encoded (region to not transmit) are determined. Video data can be easily transmitted.
また、このモードでは、背景の映像が送られないことになるため、映像データ送信開始時やシーンチェンジはもちろん、輝度や彩度が大きく変化した場合や、ビデオカメラ50がパン・ズーム・チルトの動作を行って、映像の大域が変化した場合、例えば、ズーム動作により図7(A)の映像から図7(B)の映像に変化した場合等には、通常モードに切り替えて、映像のリフレッシュを行う必要がある。
Also, in this mode, the background video is not sent, so when the video data starts or when the scene changes, the brightness or saturation changes greatly, or when the
遠隔会議装置1では、以上のような3つのモードを設定することが可能である。
The
また、遠隔会議装置1では、上記の3つのモードを自動的に切り替える自動切り替えモードを設定することも可能である。遠隔会議装置1では、通信部62がネットワーク(伝送路)8の通信の状態(損失)を監視しているので、自動切り替えモードが設定された場合には、ネットワーク8における通信レートおよびその通信状態、さらに映像全体に占める人物の情報量の割合に応じて、上記の3つのモードを自動的に切り替える。
In the
図8は、制御部の具体的な構成を示すブロック図である。図8に示すように、制御部14では、ブロック情報量演算器32で、映像符号化部54から得たブロック情報量と人物重み係数(α)との積を求め、人物領域積算器33で、これを積算して、画面に占める人物領域の情報量Rpを求める。また、全体領域積算器34で、ブロック情報量を積算して、画面全体の情報量Raを求める。そして、除算器35でRp/Raの演算を行って、人物アクティビティApを求める。ここで、人物アクティビティApは、画面に占める人物領域の割合である。
FIG. 8 is a block diagram illustrating a specific configuration of the control unit. As shown in FIG. 8, in the
モード決定評価器36は、通信部62から取得したビットレート及び伝送損失率と、上記のようにして求めた人物アクティビティApと、を用いて所定の関数演算を行う。ここで、ビットレートは、回線通信レートの設定値である。また、伝送損失率は、伝送に失敗した実際のデータ比率である。
The
モード決定評価器36は、演算結果が第1閾値A以上であれば、通常モードを選択する。また、モード決定評価器36は、演算結果が第1閾値A〜第2閾値Bの場合にはビット優先割当モードを選択する。さらに、モード決定評価器36は、演算結果が第2閾値B未満の場合には限定領域伝送モードを選択する。
The
遠隔会議装置1では、例えば、人物アクティビティAp>>0の場合には、限定領域伝送モードを選択する。また、回線通信レートが低い場合には、ビット優先モードが選択され、回線通信レートが更に低い場合には、限定領域伝送モードが選択される。更に、伝送損失率が高い場合には、ビット優先割当モードかまたは限定領域伝送モードが選択される。但し、低い伝送レートで、かつ、損失が大きい場合には、自動切り換えを行わずに、限定モードが選択される。
In the
なお、モード決定評価器36は、テーブル37を参照して演算結果に対応するモードを選択するようにしても良い。また、モード決定評価器36が行う演算に用いる関数は、実験等により予め設定されている。
The
また、遠隔会議装置1では、上記の3つのモードのうちビット優先割当モードと限定領域伝送モードを自動的に切り替えるように自動切り替えモードを設定することも可能である。この場合には、遠隔会議装置1では、モード決定評価器36の演算結果が第2閾値B以上ではビット優先割当モード、モード決定評価器36の演算結果が第2閾値B未満では限定領域伝送モードに切り替える。
Further, in the
図1(B)に示した構成の遠隔会議システムでは、地点aにおいて設置された遠隔会議装置1aから、上記のように各モードにおいて映像データを含むストリームデータが出力されると、地点bにおいて設置された1bは、入出力コネクタ64を介して通信部62で、ストリームデータを受信する。そして、多重化/分離部60で符号化された映像データを分離し、映像復号部56で、映像データを複合化してモニタに出力する。
In the remote conference system having the configuration shown in FIG. 1B, when stream data including video data in each mode is output from the
遠隔会議装置1aから通常モードで送られてきた映像データは、図4(B)に示すように、全体が一定品位な映像としてモニタ52bに映し出される。
As shown in FIG. 4B, the video data sent from the
また、遠隔会議装置1aからビット優先割当モードで送られてきた映像データは、図5(A)に示したように、人物A〜Cの顔の領域[1]・[3]・[5]は低圧縮率で高品位な映像で、人物A〜Cの体の領域[2]・[4]・[6]は、人物A〜Cの顔の領域に次いで低圧縮率で高品位な映像で、その他の領域である背景の領域[7]は高圧縮率で低品位な映像で、モニタ52bに映し出される。
Further, the video data sent from the
また、遠隔会議装置1aから限定領域伝送モードで送られてきた映像データは、図6に示すように、映像データ送信開始時には、図6(A)に示す会議風景の全体領域[10]の映像が送られてくるが、その後はシーンチェンジ等が発生しない限り、図6(B)に示すように、人物A〜Cとその周囲の領域[11]〜[14]が一定品位な映像として送られてくる。遠隔会議装置1bは、会議風景の全体領域[10]の映像データを含むストリームデータを受信すると、図6(A)に示した映像をモニタ52bに表示させる。また、遠隔会議装置1bは、人物A〜Cとその周囲の領域のみの映像データを含むストリームデータを受信すると、図6(A)に示した映像のうち、図6(B)に示した領域[11]〜[14]を置きかえて、モニタ52bに表示させる。
In addition, as shown in FIG. 6, the video data sent from the
ここで、映像データの更新を行わない背景領域と、映像データを更新する人物領域と、が不連続な映像になることがあり得る。そのため、遠隔会議装置1bは、映像復号部56に低域通過フィルタ(不図示)を備えており、会議風景の全体映像に人物映像を合成する際に、人物映像の境界付近の領域に対して、ブロック境界を検知しにくくするため、低域通過フィルタを挿入する。
Here, the background area where the video data is not updated and the person area where the video data is updated may be discontinuous videos. For this reason, the
次に、遠隔会議装置1の動作について、フローチャートに基づいて説明する。図9は、遠隔会議装置の動作を説明するためのフローチャートである。
Next, operation | movement of the
制御部14は、起動時にはメモリ16の記憶内容を読み出して、映像データ伝送モードがどのモードになっているかを確認する(s1)。制御部14は、通常モードに設定されている場合には(s2)、通常モードで映像の伝送を行う(s3)。制御部14は、ビット優先割当モードが設定されている場合には(s4)、ビット優先割当モードで映像の伝送を行う(s5)。制御部14は、限定領域伝送モードに設定されている場合には(s6)、限定領域伝送モードで映像の伝送を行う(s7)。
The
一方、制御部14は、自動切り替えモードが設定されている場合には(s8)、現在のネットワーク8の通信状態、さらに映像全体に占める人物の情報量の割合に基づいて演算を行い、その結果に基づいて実行するモードを設定する(s9)。制御部14は、演算結果が第1閾値A以上の場合には(s10)、通常モードで映像の伝送を行う(s11)。制御部14は、演算結果が第1閾値A〜第2閾値Bの場合には(s12)、ビット優先割当モードで映像の伝送を行う(s13)。制御部14は、ステップs12において、演算結果が第2閾値B未満の場合に、限定領域伝送モードで映像の伝送を行う(s14)。
On the other hand, when the automatic switching mode is set (s8), the
制御部14は、一定周期で、すなわち一例として3秒毎に、現在のネットワーク8の状態及び伝送しようとする映像の特徴に基づいて演算を行っており(s15,s17,s19)、演算結果が変化していない場合には(s16,s18,s20)、引き続き現在設定されているモードで映像の伝送を行う。
The
一方、演算結果が変化している場合には(s16,s18,s20)、ステップs10以降の処理を行う。 On the other hand, when the calculation result has changed (s16, s18, s20), the process after step s10 is performed.
以上のように、本発明の遠隔会議装置では、設定に応じて、またはネットワークの状態に応じて、通信レートが低下したり映像全体に占める人物の情報量の割合が変化したりしても、会議風景の全体画像における注目される対象の映像を確実に送ることができる。また、同じ転送レートでは映像の高画質化を、また、同じ品質であれば低ビットレート化を図ることができる。 As described above, in the remote conference device of the present invention, even if the communication rate decreases or the ratio of the information amount of the person occupying the entire video changes according to the setting or the network state, It is possible to reliably send the target video in the entire image of the meeting scene. In addition, it is possible to improve the image quality of the video at the same transfer rate, and to reduce the bit rate if the quality is the same.
なお、以上の説明では、会議風景の映像を伝送する場合を例に挙げて説明したが、これに限るものではなく、人物及びその周囲を撮影した映像であれば、講演のスピーチの映像等、他の映像でも良い。 In the above description, the case where the video of the conference scene is transmitted has been described as an example, but the present invention is not limited to this. Other images may be used.
1,1a,1b−遠隔会議装置 8−ネットワーク 10−リモコン 12−信号受信部 14−制御部 16−メモリ 20−スピーカ信号処理部 20−音声処理部 26−スピーカアレイ 30−マイクアレイ 32−ブロック情報量演算器 33−人物領域積算器 34−全体領域積算器 35−除算器 36−モード決定評価器 37−テーブル 41−会議机 50,50a,50b−ビデオカメラ 52,52a,52b−モニタ 54−映像符号化部 56−映像復号部 62−通信部 64−入出力コネクタ 72−画面切替検出器 74−符号化制御器 76−第1切替スイッチ 78−離散余弦変換器 80−量子化器 81−符号化器 82−逆量子化器 84−逆離散余弦変換器 86−加算器 88−映像メモリ 90−第2切替スイッチ 92−減算器 101−操作部
1, 1a, 1b-Remote conference device 8-Network 10-Remote control 12-Signal reception unit 14-Control unit 16-Memory 20-Speaker signal processing unit 20-Audio processing unit 26-Speaker array 30-Microphone array 32-Block information Quantity calculator 33-Person area integrator 34-Whole area integrator 35-Divider 36-Mode decision evaluator 37-Table 41-
Claims (10)
前記映像から人物を検出する人物検出手段と、
前記映像から前記検出した人物の映像を周期的に抽出して、この人物映像データを低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化する符号化処理を行う符号化手段と、
を備えた映像符号化装置。 Imaging means for photographing a person and its surroundings and outputting the image;
A person detecting means for detecting a person from the video;
Encoding for periodically extracting the detected person's video from the video, encoding the human video data at a low compression rate, and encoding the video data other than the person at a high compression rate Means,
A video encoding device comprising:
前記映像から人物を検出する人物検出手段と、
前記撮像手段が撮影した映像の全体領域を符号化し、それ以降は周期的に、映像中の人物を含む矩形領域である人物映像データを符号化する符号化手段と、
を備えた映像符号化装置。 Imaging means for photographing a person and its surroundings and outputting the image;
A person detecting means for detecting a person from the video;
Encoding means for encoding the entire area of the video imaged by the imaging means, and thereafter encoding the person video data that is a rectangular area including a person in the video periodically;
A video encoding device comprising:
前記符号化手段は、前記シーンチェンジ検出手段が映像の全体領域における構成の変化を検出したタイミングで、映像の全体領域を符号化する請求項2に記載の映像符号化装置。 A scene change detecting means for detecting a change in configuration in the entire area of the video imaged by the imaging means;
The video encoding device according to claim 2, wherein the encoding means encodes the entire area of the video at a timing when the scene change detection means detects a change in configuration in the entire area of the video.
前記映像符号化装置が符号化した映像データを相手装置に送信する通信手段と、
を備えたことを特徴とする映像伝送装置。 A video encoding device according to any one of claims 1 to 3,
Communication means for transmitting video data encoded by the video encoding device to a counterpart device;
A video transmission apparatus comprising:
前記映像から人物を検出する人物検出手段と、
伝送路の通信レートの状態、及び映像全体に占める人物の情報量の割合に基づいて所定の演算を行う演算手段と、
前記演算手段の演算結果が閾値以上の場合には、前記撮像手段が撮影した映像から前記検出した人物の映像を周期的に抽出して、この映像データを低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化し、
前記演算手段の演算結果が閾値未満の場合には、前記撮像手段が撮影した映像の全体領域を符号化し、それ以降は周期的に、映像中の人物を含む矩形領域である人物映像データを符号化する符号化手段と、
前記符号化手段が符号化した映像データを相手装置に送信する通信手段と、
を備えたことを特徴とする映像伝送装置。 Imaging means for photographing a person and its surroundings and outputting the image;
A person detecting means for detecting a person from the video;
A calculation means for performing a predetermined calculation based on the state of the communication rate of the transmission path and the ratio of the information amount of the person in the entire video;
If the calculation result of the calculation means is equal to or greater than a threshold, the detected person's video is periodically extracted from the video taken by the imaging means, and the video data is encoded at a low compression rate. Video data at a high compression rate,
When the calculation result of the calculation means is less than the threshold value, the entire area of the video imaged by the imaging means is encoded, and thereafter the person video data that is a rectangular area including the person in the video is encoded periodically. Encoding means for
Communication means for transmitting the video data encoded by the encoding means to a counterpart device;
A video transmission apparatus comprising:
前記検出した人物の映像データを抽出して低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化する手順、
を備えた映像符号化方法。 A procedure for periodically detecting a person from an image of the person and its surroundings,
Extracting the detected person's video data and encoding it at a low compression rate, and encoding the video data other than the person at a high compression rate,
A video encoding method comprising:
前記人物及びその周囲の映像の全体領域を符号化し、それ以降は周期的に、映像中の人物を含む矩形領域である人物映像データを符号化する手順、
を備えた映像符号化方法。 A procedure for periodically detecting a person from an image of the person and its surroundings,
A procedure for encoding the entire area of the person and the surrounding video, and encoding the person video data which is a rectangular area including the person in the video periodically thereafter;
A video encoding method comprising:
前記映像における全体領域の構成変化を検出したタイミングに、前記映像データの全体領域を符号化する手順、
を備えた請求項7に記載の映像符号化方法。 A procedure for detecting a composition change of the entire area in the person and the surrounding image;
A procedure for encoding the entire area of the video data at a timing when a change in the configuration of the entire area in the video is detected;
The video encoding method according to claim 7, further comprising:
前記符号化した映像データを相手装置に送信する手順、
を備えたことを特徴とする映像伝送方法。 After performing the video encoding method according to claim 6,
A procedure for transmitting the encoded video data to a counterpart device;
A video transmission method comprising:
前記演算結果が閾値以上の場合において、
人物及びその周囲を撮影した映像から、人物を周期的に検出する手順、
前記検出した人物の映像データを抽出して低圧縮率で符号化し、前記人物以外の映像データを高圧縮率で符号化する手順、
前記符号化された人物映像データ及び人物以外の映像データを相手装置に送信する手順、
前記演算結果が閾値未満の場合において、
人物及びその周囲を撮影した映像から、人物を周期的に検出する手順、
前記映像の全体領域を符号化し、それ以降は周期的に前記映像中の人物を含む矩形領域である人物映像データを符号化する手順、
前記符号化された映像データを相手装置に送信する手順、
を備えた映像伝送方法。 A procedure for performing a predetermined calculation based on the state of the communication rate of the transmission path and the ratio of the information amount of the person in the entire video,
When the calculation result is equal to or greater than a threshold value,
A procedure for periodically detecting a person from an image of the person and its surroundings,
Extracting the detected person's video data and encoding it at a low compression rate, and encoding the video data other than the person at a high compression rate,
A procedure for transmitting the encoded person video data and video data other than the person to the counterpart device;
When the calculation result is less than the threshold value,
A procedure for periodically detecting a person from an image of the person and its surroundings,
A procedure for encoding the entire area of the video, and thereafter encoding the person video data which is a rectangular area including the person in the video periodically;
A procedure for transmitting the encoded video data to a counterpart device;
A video transmission method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006174502A JP2008005349A (en) | 2006-06-23 | 2006-06-23 | Video encoder, video transmission apparatus, video encoding method, and video transmission method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006174502A JP2008005349A (en) | 2006-06-23 | 2006-06-23 | Video encoder, video transmission apparatus, video encoding method, and video transmission method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008005349A true JP2008005349A (en) | 2008-01-10 |
Family
ID=39009345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006174502A Pending JP2008005349A (en) | 2006-06-23 | 2006-06-23 | Video encoder, video transmission apparatus, video encoding method, and video transmission method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008005349A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010161740A (en) * | 2009-01-09 | 2010-07-22 | Canon Inc | Image coding device and image coding method |
JP2010258724A (en) * | 2009-04-24 | 2010-11-11 | Panasonic Corp | Camera, video transmitting apparatus, video receiving device and video communication system |
JP2014515225A (en) * | 2011-04-11 | 2014-06-26 | インテル・コーポレーション | Target object-based image processing |
US8831094B2 (en) | 2010-09-01 | 2014-09-09 | Electronics And Telecommunications Research Institute | Video processing method and apparatus based on multiple texture images |
WO2018190198A1 (en) * | 2017-04-14 | 2018-10-18 | 株式会社メガチップス | Image processing device, image processing system, information processing system, and image processing method |
-
2006
- 2006-06-23 JP JP2006174502A patent/JP2008005349A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010161740A (en) * | 2009-01-09 | 2010-07-22 | Canon Inc | Image coding device and image coding method |
JP2010258724A (en) * | 2009-04-24 | 2010-11-11 | Panasonic Corp | Camera, video transmitting apparatus, video receiving device and video communication system |
US8831094B2 (en) | 2010-09-01 | 2014-09-09 | Electronics And Telecommunications Research Institute | Video processing method and apparatus based on multiple texture images |
JP2014515225A (en) * | 2011-04-11 | 2014-06-26 | インテル・コーポレーション | Target object-based image processing |
US9247203B2 (en) | 2011-04-11 | 2016-01-26 | Intel Corporation | Object of interest based image processing |
US9871995B2 (en) | 2011-04-11 | 2018-01-16 | Intel Corporation | Object of interest based image processing |
WO2018190198A1 (en) * | 2017-04-14 | 2018-10-18 | 株式会社メガチップス | Image processing device, image processing system, information processing system, and image processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3431373B2 (en) | Coded area image decoding for multimedia communication systems | |
JP5153674B2 (en) | Moving picture coding apparatus and moving picture coding method | |
US20050021620A1 (en) | Web data conferencing system and method with full motion interactive video | |
JP2008005349A (en) | Video encoder, video transmission apparatus, video encoding method, and video transmission method | |
JP4100146B2 (en) | Bi-directional communication system, video communication device | |
US20190306462A1 (en) | Image processing apparatus, videoconference system, image processing method, and recording medium | |
JP2000059772A (en) | Video displaying system | |
US5900906A (en) | Image communication apparatus having automatic answering and recording function | |
KR101164365B1 (en) | 4 channels screen method of video monitoring device for a car | |
JPH07203434A (en) | Image transmitter | |
JP3317327B2 (en) | Moving picture coding method and apparatus | |
JP2007201938A (en) | Communication terminal, communication system, and communication method | |
JP3927606B2 (en) | Image communication apparatus and system, image receiving apparatus and received image data processing method | |
JPH09116882A (en) | Audio visual communication equipment | |
JPH07298231A (en) | Multi-point moving image communication system and its controller and moving communication terminal equipment | |
JPH07162831A (en) | Control method for video conference communication equipment | |
JPH0884329A (en) | Image communication terminal equipment | |
JPH09275550A (en) | Video conference system | |
WO2007122907A1 (en) | Image codec device | |
JP6045051B1 (en) | Moving picture transmission apparatus and moving picture transmission method | |
JP3475541B2 (en) | Image communication terminal device | |
JPH0294886A (en) | Method and device for coding and decoding video signal | |
JPH05300506A (en) | Image/voice communication terminal equipment | |
JPH08340521A (en) | Image communication terminal equipment | |
JP4888279B2 (en) | Video transmission device |