JP2010226594A - Image transmission device and imaging device mounting the same - Google Patents
Image transmission device and imaging device mounting the same Download PDFInfo
- Publication number
- JP2010226594A JP2010226594A JP2009073556A JP2009073556A JP2010226594A JP 2010226594 A JP2010226594 A JP 2010226594A JP 2009073556 A JP2009073556 A JP 2009073556A JP 2009073556 A JP2009073556 A JP 2009073556A JP 2010226594 A JP2010226594 A JP 2010226594A
- Authority
- JP
- Japan
- Prior art keywords
- attention area
- code amount
- region
- image
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、動画像を符号化して送信するための画像送信装置およびそれを用いた撮像装置に関する。 The present invention relates to an image transmission apparatus for encoding and transmitting a moving image and an imaging apparatus using the same.
近年、動画を撮影することができるデジタルムービーカメラが普及してきている。デジタルムービーカメラは、年々、高画質化しており、フルHD(High Definiton)画質に対応したものも実用化されている。それに伴い画像圧縮効率の高いH.264/AVC規格で動画像を圧縮符号化するデジタルムービーカメラも実用化されている。 In recent years, digital movie cameras capable of shooting moving images have become widespread. Digital movie cameras have improved image quality year by year, and those compatible with full HD (High Definiton) image quality have also been put into practical use. Accordingly, H.H. has high image compression efficiency. Digital movie cameras that compress and code moving images according to the H.264 / AVC standard have also been put into practical use.
このようなデジタルムービーカメラのなかには、特定のオブジェクトの形状、色などオブジェクトの特徴量を抽出してこれを追尾するものもある。ユーザは、このようなデジタルムービーカメラを利用して、例えば、運動会で走っている子供を所定の注目領域内に継続して収まるように追尾しながら撮影することができる。(例えば、特許文献1) Among such digital movie cameras, there are those that extract and track object feature amounts such as the shape and color of a specific object. Using such a digital movie camera, for example, the user can shoot while tracking a child running in an athletic meet so as to be continuously within a predetermined region of interest. (For example, Patent Document 1)
また、携帯電話や無線LAN(Local Area Network)などの無線通信技術の発展により、無線通信ネットワークにおいても大容量のデータを高速に伝送できるようになっている。このため、デジタルムービーカメラにおいても、撮影した動画像を記録媒体に記録するだけでなく、無線通信ネットワークを介して伝送することが要望されている。 In addition, with the development of wireless communication technologies such as mobile phones and wireless local area networks (LANs), large amounts of data can be transmitted at high speed even in wireless communication networks. For this reason, even in a digital movie camera, it is demanded not only to record a captured moving image on a recording medium but also to transmit it via a wireless communication network.
しかしながら、無線通信ネットワークにおける伝送速度は、伝播環境の影響を受け易く、十分な伝送速度を確保できないこともある。他方、特定のオブジェクトを追尾しながら撮影した場合、ユーザはその特定のオブジェクトを含む注目領域内の動画像を主な視聴対象とするため、注目領域内の動画像を効率良く伝送できれば、撮像した画面全体の動画像を伝送する必要がないことも多い。 However, the transmission rate in the wireless communication network is easily affected by the propagation environment, and a sufficient transmission rate may not be ensured. On the other hand, when shooting while tracking a specific object, the user takes a moving image in the attention area including the specific object as a main viewing target. In many cases, it is not necessary to transmit a moving image of the entire screen.
本発明はこのような状況に鑑みてなされたものであり、注目領域内の動画像を効率良く伝送することができる画像伝送装置およびそれを搭載した撮像装置を提供することを目的とする。 The present invention has been made in view of such a situation, and an object thereof is to provide an image transmission apparatus capable of efficiently transmitting a moving image in a region of interest and an imaging apparatus equipped with the image transmission apparatus.
本発明のある態様は、画像送信装置である。この画像送信装置は、画像上の特定オブジェクトを含むように、前記画像上に注目領域を設定する設定部と、前記注目領域内の画像を符号化して注目領域符号化データを生成する符号化部と、前記注目領域符号化データを送信する送信部と、前記送信部で取得した前注目領域符号化データの伝送速度と、前記符号化部で予測した前記注目領域符号化データと前記特定オブジェクトの符号量に応じて、前記注目領域における前記特定オブジェクトの占める割合を変更する処理部と、を備えることを特徴とする画像送信装置である。 One embodiment of the present invention is an image transmission device. The image transmission device includes a setting unit that sets a region of interest on the image so as to include a specific object on the image, and an encoding unit that encodes an image in the region of interest and generates region-of-interest encoded data A transmission unit that transmits the region-of-interest encoded data, a transmission rate of the previous region-of-interest encoded data acquired by the transmission unit, the region-of-interest encoded data predicted by the encoding unit, and the specific object An image transmission device comprising: a processing unit that changes a ratio of the specific object in the region of interest according to a code amount.
また、前記処理部は、前記伝送速度が第1のしきい値よりも小さく、かつ前記注目領域符号化データの符号量が第2のしきい値よりも大きく、かつ前記特定オブジェクトの符号量が第3のしきい値よりも大きい場合、前記注目領域における前記特定オブジェクトの占める割合を縮小する処理を実行することが好ましい。 Further, the processing unit is configured such that the transmission rate is smaller than a first threshold, the code amount of the attention area encoded data is larger than a second threshold, and the code amount of the specific object is When larger than a 3rd threshold value, it is preferable to perform the process which reduces the ratio for which the said specific object accounts in the said attention area.
また、前記処理部は、前記伝送速度が第1のしきい値よりも小さく、かつ前記注目領域符号化データの符号量が第2のしきい値よりも大きく、かつ前記特定オブジェクトの符号量が第3のしきい値よりも小さい場合、前記注目領域における前記特定オブジェクトの占める割合を拡大する処理を実行することが好ましい。 Further, the processing unit is configured such that the transmission rate is smaller than a first threshold, the code amount of the attention area encoded data is larger than a second threshold, and the code amount of the specific object is When it is smaller than the third threshold value, it is preferable to execute a process of expanding the proportion of the specific object in the attention area.
本発明によれば、注目領域内の動画像の伝送効率を向上させることができる。 According to the present invention, it is possible to improve the transmission efficiency of moving images within a region of interest.
本発明を具体的に説明する前に概要について述べる。本発明の実施の形態は、特定のオブジェクトを追尾しながら撮像することができる撮像装置に関する。撮像装置は、動画像に含まれるフレーム画像内に、人物などの特定のオブジェクトを検出すると、フレーム画像上(以下、全体領域とも言う)に、そのオブジェクトを含むように注目領域を設定する。また撮像装置は、オブジェクトから特徴量(例えば、人物の顔の形状など)を抽出し、そのオブジェクトを追尾する。そして、注目領域にオブジェクトが継続的に収まるように、そのオブジェクトの動きに注目領域を追従させる。 The outline will be described before the present invention is specifically described. Embodiments described herein relate generally to an imaging apparatus that can capture an image while tracking a specific object. When a specific object such as a person is detected in a frame image included in a moving image, the imaging apparatus sets a region of interest on the frame image (hereinafter also referred to as an entire region) so as to include the object. Further, the imaging apparatus extracts a feature amount (for example, the shape of a human face) from the object, and tracks the object. Then, the attention area is caused to follow the movement of the object so that the object continuously fits in the attention area.
さらに撮像装置は、無線通信ネットワーク(例えば、IEEE 802.11nなどの無線LAN)において、注目領域内の動画像を伝送する。無線通信ネットワークでデータ送信を行うと、伝播環境によりその伝送速度が変動するため、所定の期間内に注目領域内の動画像を送信することができない場合がある。 Furthermore, the imaging apparatus transmits a moving image in the region of interest in a wireless communication network (for example, a wireless LAN such as IEEE 802.11n). When data is transmitted through a wireless communication network, the transmission speed varies depending on the propagation environment, so that there may be a case where a moving image in the region of interest cannot be transmitted within a predetermined period.
そこで、本発明の実施の形態における撮像装置においては、無線通信ネットワークの伝送速度を取得するとともに、注目領域内の動画像を符号化したときに発生する符号量およびオブジェクトを符号化したときに発生する符号量を予測し、伝送速度の応じて、注目領域におけるオブジェクトが占める割合を可変制御する。 Therefore, in the imaging device according to the embodiment of the present invention, the transmission rate of the wireless communication network is acquired, and the code amount generated when the moving image in the attention area is encoded and the object are encoded. The amount of code occupied by the object in the attention area is variably controlled according to the transmission speed.
これにより、伝送速度に応じて注目領域に含まれるオブジェクトの符号量を調整することができ、注目領域内の動画像を伝播環境に応じて効率良く送信することができる。 Thereby, the code amount of the object included in the attention area can be adjusted according to the transmission speed, and the moving image in the attention area can be efficiently transmitted according to the propagation environment.
図1は、本発明の実施の形態における撮像装置1の構成を示す概念図である。撮像装置1は撮像部10および画像送信装置20を含む。
FIG. 1 is a conceptual diagram illustrating a configuration of an imaging apparatus 1 according to an embodiment of the present invention. The imaging device 1 includes an
撮像部10は、動画像を取得し画像送信装置20に供給する。撮像部10は、CCD(Charge Coupled Devices)センサやCMOS(Complementary Metal Oxide Semiconductor)イメージセンサなどの固体撮像素子、固体撮像素子からアナログの三原色信号をデジタルの輝度信号および色差信号に変更する信号処理部を含む。
The
画像送信装置20は、撮像部10から取得した動画像を、例えば、H.264/AVC規格に従い圧縮符号化して符号化データ(以下、全体領域符号化データともいう)を生成し、記録媒体に記録する。また、画像送信装置20は、動画像上に設定された注目領域内の動画像を圧縮符号化して符号化データ(以下、注目領域符号化データともいう)を生成し、無線通信ネットワークを介して図示しない画像受信装置に出力する。
The
画像送信装置20は、オブジェクト抽出部201、注目領域設定部202、注目領域処理部203、符号化部204、記録部205、送信部206および制御部207を含む。
The
オブジェクト抽出部201は、撮像部10から受け取った動画像に含まれるフレーム画像内から特定のオブジェクトを検出する。オブジェクト抽出部201が検出すべき特定のオブジェクトは、ユーザが指定をすることができる。オブジェクトの具体例としては、人物、犬や猫などペット、自動車や飛行機などの移動体などが挙げられる。以下においては、説明の便宜上、特定のオブジェクトとして人物を検出するものとする。
The
オブジェクト抽出部201は、フレーム画像内の顔を検出することにより人物を特定する。検出した顔を含む顔領域の下方に顔領域の大きさに比例させた胴体領域を設定する。顔検出は、公知な方法で行えばよく、本発明の実施の形態においては、エッジ検出法を用いるものとする。
The
オブジェクト抽出部201は、上記胴体領域の色に類似する色の領域を、後続フレーム画像内で探索することにより人物を追尾する。なお、後続フレーム画像内での、顔検出の結果を加味すれば、追尾の精度を高めることができる。
The
注目領域設定部202は、オブジェクト抽出部201が検出した人物を含むよう、フレーム画像上に注目領域を設定する。注目領域は人物全体を包含し、かつその周辺領域を含む矩形の形状であってもよい。注目領域の設定はユーザが行ってもよく、オブジェクト抽出部201から検出した人物の全体領域内における位置情報やサイズ情報を受け取り、自動的に行ってもよい。
The attention
また、注目領域設定部202は、オブジェクト抽出部201の追尾状況から人物全体の動きベクトルを検出し、その動きベクトルに応じて注目領域を移動させ、人物の動きに注目領域を追従させる。
The attention
さらに、注目領域設定部202は、制御部207の指示に従い、注目領域動画像に対して、人物が注目領域内で占める割合を変更する処理を実行する。例えば、制御部207より人物が注目領域内で占める割合を大きくするように指示があると、注目領域設定部202は、対象人物を含むように設定した注目領域(以下、第1の注目領域ともいう)を解除し、制御部207から指定された拡大倍率に基づき、対象人物を含み、かつ第1の注目領域よりも小さな注目領域(以下、第2の注目領域ともいう)を設定する。第2の注目領域の大きさは第1の注目領域の大きさよりも小さい。このため、第2の注目領域内で人物が占める割合は、第1の注目領域内で人物が占める割合よりも大きくなっている。
Further, the attention
一方、制御部207より人物が注目領域内で占める割合を小さくするように指示があると、注目領域設定部202は、第1の注目領域を解除し、制御部207から指定された縮小倍率に基づき、対象人物を含み、かつ第1の注目領域よりも大きな注目領域(以下、第3の注目領域ともいう)を設定する。第3の注目領域の大きさは第1の注目領域の大きさよりも大きい。このため、第3の注目領域内で人物が占める割合は、第1の注目領域内で人物が占める割合よりも小さくなっている。
On the other hand, when the
注目領域処理部203は、注目領域設定部202からフレーム画像上における注目領域の位置情報や形状情報などを受け取る。これらの情報を参照して、撮像部10から受け取った動画像に含まれるフレーム画像から、注目領域内の画像を抽出する。
The attention
これにより、注目領域処理部203は、フレーム画像ごとに抽出された注目領域内の画像を単位画像(以下、注目領域単位画像ともいう)とし、この注目領域単位画像が連続した注目領域動画像を構成する。
As a result, the attention
注目領域処理部203は、注目領域動画像と、注目領域設定部202から受け取ったフレーム画像上における注目領域の位置情報や形状情報(以下、第1の位置情報等ともいう)および人物の位置情報や形状情報(以下、第2の位置情報等ともいう)を符号化部204に供給する。
The attention
符号化部204は、撮像部10から受け取った動画像に対して、動き補償処理、直交変換処理、量子化処理、エントロピー符号化処理などを実行し、H.264/AVC規格に準拠した圧縮符号化方式により全体領域符号化データを生成し、記録部205に供給する。
The
また、注目領域処理部203から受け取った注目領域動画像に対しても同様の処理を実行し、H.264/AVC規格に準拠した圧縮符号化方式により注目領域符号化データを生成し、送信部206に供給する。
The same processing is executed for the attention area moving image received from the attention
さらに、符号化部204は、第1および第2の位置情報等を参照して、注目領域内の全体画像および注目領域に含まれる人物のそれぞれに対して、H.264/AVC規格に準拠した圧縮符号化方式を適用した場合に発生する符号量を算出する。一般に、動画像には時間方向に相関性があり、符号化対象フレーム画像を符号化したときの符号量は、時間方向に前後するフレーム画像を符号化したときの符号量に近い値となることが多い。そこで、符号化部204は、符号化対象の注目領域内の全体画像と、注目領域に含まれる人物を符号化したときのそれそれの符号量を、次に符号化対象とされる注目領域内の全体画像と、該注目領域に含まれる人物の予測符号量として制御部207に供給する。
Further, the
以上の説明では、制御部207より人物が注目領域内で占める割合を大きくするように指示があると、注目領域設定部202は、画像を抽出すべき領域を注目領域よりも小さくする処理を実行した。一方、制御部207より人物が注目領域内で占める割合を小さくするように指示があると、注目領域設定部202は、画像を抽出すべき領域を注目領域よりも大きくする処理を実行した。
In the above description, when the
しかしこれに限らず注目領域処理部203で人物が注目領域で占める割合を変更する処理を実行してもよい。例えば、注目領域処理部203は、制御部207より人物が注目領域内で占める割合を大きくするように指示があると、人物の画素データに対して補間処理を実行する。すなわち、注目領域処理部203は、注目領域設定部202から受け取ったフレーム画像上における人物の位置情報や形状情報により、人物の画素データを含むマクロブロックを特定する。制御部207から指定された拡大倍率に基づき、FIR(Finite Impulse Response)フィルタの係数を算出し、所定の通過帯域特性を有する補間フィルタを構成する。特定したマクロブロックの画素データに対して、水平方向と垂直方向に所定の間隔でゼロパディングを行いながら構築した補間フィルタを二次元的に適用し、人物の形状を拡大する。
However, the present invention is not limited to this, and the attention
また、制御部207より人物が注目領域内で占める割合を小さくするように指示があると、注目領域処理ブ203は、人物の画素データに対して間引き処理を実行する。すなわち、注目領域処理部203は、注目領域設定部202から受け取ったフレーム画像上における人物の位置情報や形状情報により、人物の画素データを含むマクロブロックを特定する。制御部207から指定された縮小倍率に基づき、FIRフィルタの係数を算出し、所定の通過帯域特性を有する間引きフィルタを構成する。特定したマクロブロックの画素データに対して、水平方向と垂直方向に構築した補間フィルタを二次元的に適用しながら、所定の間隔で画素データを間引き、人物の形状を縮小する。
When the
注目領域処理部203は、制御部207の指示により注目領域動画像に対して人物が注目領域内で占める割合を変更した場合は、第1および第2の位置情報等に加えて、フレーム画像上における変更後の人物の位置情報や形状情報(以下、第3の位置情報等ともいう)も符号化部204に供給する。
When the ratio of the person in the attention area to the attention area moving image is changed according to an instruction from the
このとき、符号化部204は、第1から第3の位置情報等を参照し、注目領域内の全体画像および注目領域に含まれる人物のそれぞれに対して、H.264/AVC規格に準拠した圧縮符号化方式を適用した場合に発生する符号量を算出する。
At this time, the
さらに、符号化部204は、注目領域処理部203で人物の画素データに対して間引き処理が実行された場合、注目領域処理部203から受け取った第2および第3の位置情報等から、間引き処理が実行される前の人物の形状に沿った境界線と、間引き処理が実行された後の人物の形状に沿った境界線とで囲まれた領域を特定する。そして符号化部204は、特定した領域に含まれるマクロブロックに対して、補償処理を実行する。
Furthermore, when the attention
すなわち、同じフレーム画像内に含まれる人物の背景画素データや、時間方向に前後するフレーム画像内に含まれる人物の背景画素データから、特定した領域に含まれるマクロブロックの画素データを予測する。そして、予測した画素データで特定した領域に含まれるマクロブロックの画素データを補償する。また、予測した画素データで補償するのではなく、特定の色(例えば、青)で表示されるように特定した領域に含まれるマクロブロックの画素データを補償してもよい。また、人物の間引き処理に関する情報(例えば、縮小倍率など)を注目領域符号化データに含めて画像受信装置に送信し、その情報に基づき、画像受信装置側で、間引き処理が実行される前の人物の形状まで拡大してもよい。 In other words, the pixel data of the macroblock included in the specified area is predicted from the background pixel data of the person included in the same frame image and the background pixel data of the person included in the frame image that moves back and forth in the time direction. Then, the pixel data of the macro block included in the area specified by the predicted pixel data is compensated. Further, instead of compensating with the predicted pixel data, the pixel data of the macroblock included in the area specified to be displayed in a specific color (for example, blue) may be compensated. In addition, information related to the thinning process of a person (for example, a reduction ratio) is included in the region-of-interest encoded data and transmitted to the image receiving apparatus, and before the thinning process is executed on the image receiving apparatus side based on the information. You may expand to the shape of a person.
記録部205は、符号化部204から受け取った全体領域符号化データを、例えば、HDD(Hard Disk Drive)、光ディスク、フラッシュメモリなどの記録媒体に記録する。
The
送信部206は、符号化部204から受け取った注目領域符号化データを図示しない送信バッファに格納する。そして、送信バッファに格納した注目領域符号化データが所定の送信単位に達すると(例えば、1500バイト)、送信バッファから注目領域符号化データを読み出し、データフォーマットの変換を行い、無線通信ネットワークに送信する。
The
また、送信部206は、所定の期間(例えば、動画像のフレーム期間)内に送信できた注目領域符号化データのバイト数を計測して、所定の期間ごとに無線通信ネットワークの伝送速度を算出し、制御部207に供給する。
In addition, the
制御部207は、画像送信装置全体の制御を行う。また、制御部207は、符号化部204から受け取った符号化対象の注目領域内の全体画像および注目領域に含まれる人物の予測符号量と、送信部206から受け取った無線通信ネットワークの伝送速度に基づき、人物が注目領域内で占める割合を変更すべきか否かを決定する。
The
制御部207は、シミュレーションや実験により、無線通信ネットワークの伝送速度に関するしきい値(以下、第1のしきい値ともいう)と注目領域内の全体画像の予測符号量に関するしきい値(以下、第2のしきい値ともいう)と注目領域に含まれる人物の予測符号量に関するしきい値(以下、第3のしきい値ともいう)とをあらかじめ規定しており、伝送速度、注目領域内の全体画像の予測符号量および注目領域に含まれる人物の予測符号量のそれぞれを、これらしきい値と比較することで、注目領域内で人物が占める割合を変更すべきか否かを決定する。
The
すなわち、制御部207は、送信部207から受け取った無線通信ネットワークの伝送速度が第1のしきい値よりも小さく、かつ符号化部204から受け取った注目領域内の全体画像の予測符号量が第2のしきい値より大きく、かつ注目領域に含まれる人物の予測符号量が第3のしきい値より大きい場合、注目領域内で人物が占める割合を小さくするように注目領域処理部203に指示する。
That is, the
伝送速度が第1のしきい値より小さい場合は、所定の期間内に無線通信ネットワークに送信できる情報量も小さくなるため、注目領域符号化データの符号量もできるだけ少ないほうが好ましい。また、注目領域に含まれる人物の予測符号量が第3のしきい値よりも大きい場合は、注目領域符号化データの符号量に対する、人物の符号化の寄与は、注目領域内の人物を除く領域の符号化の寄与よりも大きいと考えられる。 When the transmission rate is smaller than the first threshold value, the amount of information that can be transmitted to the wireless communication network within a predetermined period is also small. Therefore, it is preferable that the code amount of the attention area encoded data is as small as possible. In addition, when the predicted code amount of the person included in the attention area is larger than the third threshold value, the contribution of the person encoding to the code amount of the attention area encoded data excludes the person in the attention area. This is considered to be larger than the contribution of the region coding.
そこで、制御部207は、注目領域内の全体画像の予測符号量が第2のしきい値より大きく、注目領域符号化データの符号量が、無線通信ネットワークに伝送速度に比べ大きすぎると判断した場合であって、その主たる要因が注目領域に含まれる人物の符号化にあると判断した場合、注目領域内で人物が占める割合を小さくする。
Therefore, the
注目領域内で人物が占める割合が小さくなれば、符号化すべき人物の画素データを含むマクロブロックが少なくなり、また、人物の動きベクトルの大きさも割合に応じて小さくなる。このため、人物を符号化したときの符号量を小さくすることができる。注目領域符号化データの符号量に対する寄与が大きい人物の符号量を小さくできるので、結果として注目領域符号化データの符号量を小さくすることができる。 If the proportion of the person in the region of interest decreases, the number of macroblocks including the pixel data of the person to be encoded decreases, and the size of the person's motion vector also decreases according to the proportion. For this reason, the amount of codes when a person is encoded can be reduced. Since the code amount of the person who greatly contributes to the code amount of the attention area encoded data can be reduced, the code amount of the attention area encoded data can be reduced as a result.
一方、制御部207は、送信部207から受け取った無線通信ネットワークの伝送速度が第1のしきい値よりも小さく、かつ符号化部204から受け取った注目領域内の全体画像の予測符号量が第2のしきい値より大きく、かつ注目領域に含まれる人物の予測符号量が第3のしきい値より小さい場合、注目領域内で人物が占める割合を大きくするように注目領域処理部203に指示する。
On the other hand, the
注目領域に含まれる人物の予測符号量が第3のしきい値よりも小さい場合は、注目領域符号化データの符号量に対する、人物の符号化の寄与は、注目領域内の人物を除く領域の符号化の寄与よりも小さいと考えられる。 When the predicted code amount of the person included in the attention area is smaller than the third threshold value, the contribution of the person's encoding to the code amount of the attention area encoded data is that of the area excluding the person in the attention area. This is considered to be smaller than the contribution of encoding.
そこで、制御部207は、注目領域内の全体画像の予測符号量が第2のしきい値より大きく、注目領域符号化データの符号量が、無線通信ネットワークに伝送速度に比べ大きすぎると判断した場合であって、その主たる要因が注目領域内の人物を除く領域の符号化にあると判断した場合、注目領域内で人物が占める割合を大きくする。
Therefore, the
注目領域内で人物が占める割合が大きくなれば、注目領域内の人物を除く領域に含まれるマクロブロックが少なくなる。このため、注目領域の人物を除く領域を符号化したときの符号量を小さくすることができる。注目領域符号化データの符号量に対する寄与が大きい人物を除く領域の符号量を小さくできるので、結果として注目領域符号化データの符号量を小さくすることができる。 When the proportion of the person in the attention area increases, the number of macroblocks included in the area excluding the person in the attention area decreases. For this reason, it is possible to reduce the amount of code when the area excluding the person in the attention area is encoded. Since the code amount of a region excluding a person who greatly contributes to the code amount of the attention area encoded data can be reduced, the code amount of the attention area encoded data can be reduced as a result.
図2は、注目領域における特定オブジェクトの占める割合を変更する手順を示すフローチャートである。符号化部204は、時点Tnで符号化対象とされたフレーム画像Fn上に設定された注目領域内の全体画像を符号化することで生じた符号量を算出し、注目領域内の全体画像の予測符号量として制御部207に供給する(S10)。また、符号化部204は、時点Tnで符号化対象とされたフレーム画像Fn上に設定された注目領域に含まれる人物を符号化することで生じた符号量を算出し、注目領域に含まれる人物の予測符号量として制御部207に供給する(S12)。
FIG. 2 is a flowchart showing a procedure for changing the proportion of the specific object in the attention area. The
送信部206は、時点Tnで送信バッファの残量を参照し、無線通信ネットワークの伝送速度を算出し、制御部207に供給する(S14)。
The
制御部207は、時点Tn+1でフレーム画像Fn+1が符号化対象のフレーム画像となると、伝送速度を第1のしきい値と比較する(S16)。伝送速度が第1のしきい値より小さい場合(S16のY)、制御部207は、注目領域内の全体画像の予測符号量を第2のしきい値と比較する(S18)。注目領域内の全体画像の予想符号量が第2のしきい値よりも大きい場合(S18のY)、制御部207は、注目領域に含まれる人物の予測符号量を第3のしきい値と比較する(S20)。注目領域に含まれる人物の予想符号量が第3のしきい値よりも大きい場合(S20のY)、制御部207は、フレーム画像Fn+1上に設定された注目領域に含まれる人物の、注目領域に占める割合を大きくするように注目領域処理部203に対して指示を行う(S22)。一方、注目領域に含まれる人物の予想符号量が第3のしきい値よりも小さい場合(S20のN)、制御部207は、フレーム画像Fn+1上に設定された注目領域に含まれる人物の、注目領域に占める割合を小さくするように注目領域処理部203に対して指示を行う(S24)。
When the frame image Fn + 1 becomes the encoding target frame image at time Tn + 1, the
このような本発明の実施の形態によれば、以下のとおりの作用効果を享受することができる。 According to such an embodiment of the present invention, the following operational effects can be enjoyed.
(1)無線通信ネットワークの伝送速度と注目領域内の全体画像の予測符号量と注目領域に含まれる人物の予測符号量に基づき、注目領域に含まれる人物の、注目領域に占める割合を変更するので、無線通信ネットワークの伝播環境に最適な注目領域符号化データの送信が実現できる。 (1) The ratio of the person included in the attention area to the attention area is changed based on the transmission speed of the wireless communication network, the prediction code amount of the entire image in the attention area, and the prediction code amount of the person included in the attention area. Therefore, it is possible to realize transmission of attention area encoded data that is optimal for the propagation environment of the wireless communication network.
(2)無線通信ネットワークの伝送速度が第1のしきい値より小さく、かつ注目領域内の全体画像の予測符号量が第2のしきい値より大きく、かつ注目領域に含まれる人物の予測符号量が第3のしきい値よりも大きい場合、注目領域に含まれる人物の、注目領域に占める割合を小さくするので、量子化スケール大きくしたりや解像度を小さくすることなく符号量を調整することができ、高品質かつ伝播環境に最適な注目領域符号化データの送信を実現できる。 (2) Prediction codes of persons included in the attention area whose transmission speed of the wireless communication network is smaller than the first threshold value and whose prediction code amount of the entire image in the attention area is larger than the second threshold value When the amount is larger than the third threshold value, the ratio of the person included in the attention region to the attention region is reduced, so that the code amount can be adjusted without increasing the quantization scale or reducing the resolution. It is possible to realize transmission of attention area encoded data that is high quality and optimal for the propagation environment.
(3)無線通信ネットワークの伝送速度が第1のしきい値より小さく、かつ注目領域内の全体画像の予測符号量が第2のしきい値より大きく、かつ注目領域に含まれる人物の予測符号量が第3のしきい値よりも小さい場合、注目領域に含まれる人物の、注目領域に占める割合を大きくするので、量子化スケール大きくしたり解像度を小さくすることなく符号量を調整することができ、高品質かつ伝播環境に最適な注目領域符号化データの送信を実現できる。 (3) Predictive code of a person whose transmission speed of the wireless communication network is smaller than the first threshold and whose prediction code amount of the entire image in the attention area is larger than the second threshold and included in the attention area When the amount is smaller than the third threshold value, the ratio of the person included in the attention area to the attention area is increased, so that the code amount can be adjusted without increasing the quantization scale or decreasing the resolution. It is possible to realize transmission of attention area encoded data that is high quality and optimal for the propagation environment.
よって、注目領域符号化データの伝送効率を向上できる。 Therefore, the transmission efficiency of attention area coding data can be improved.
以上、本発明を実施するための形態について説明をしてきたが、本発明は、この実施の形態の構成に限定されるものではなく、特許請求の範囲に規定された本発明の適用範囲にあり、上述した実施の形態の構成が備える機能を達成可能であれば、いろいろな変形が可能である。 As mentioned above, although the form for implementing this invention has been demonstrated, this invention is not limited to the structure of this embodiment, It exists in the application range of this invention prescribed | regulated by the claim. Various modifications are possible as long as the functions of the configuration of the above-described embodiment can be achieved.
例えば、本発明の実施の形態において画像送信装置20は、H.264/AVC規格に従い圧縮符号化するとしたが、 MPEG−2、またはMPEG−4などの規格にしたがい圧縮符号化してもよい。
For example, in the embodiment of the present invention, the
201 オブジェクト抽出部、202 注目領域設定部、203 注目領域処理部、204 符号化部、205 記録部、206 送信部、207 制御部。
DESCRIPTION OF
Claims (4)
前記注目領域内の画像を符号化して注目領域符号化データを生成するとともに、前記注目領域符号化データの符号量と前記特定オブジェクトの符号量を予測する符号化部と、
前記注目領域符号化データを送信するとともに、前記注目領域符号化データ送信時の伝送速度を取得する送信部と、
前記送信部で取得した前注目領域符号化データの伝送速度と、前記符号化部で予測した前記注目領域符号化データと前記特定オブジェクトの符号量に応じて、前記注目領域における前記特定オブジェクトの占める割合を変更する処理部と、
を備えることを特徴とする画像送信装置。 A setting unit for setting a region of interest on the image so as to include a specific object on the image;
An encoding unit that encodes an image in the region of interest to generate region-of-interest encoded data, and predicts a code amount of the region-of-interest encoded data and a code amount of the specific object;
A transmitter that transmits the attention area encoded data and obtains a transmission rate at the time of the attention area encoded data transmission;
The specific object occupies the attention area according to the transmission speed of the preceding attention area encoded data acquired by the transmission unit, the attention area encoded data predicted by the encoding section, and the code amount of the specific object. A processing unit for changing the ratio;
An image transmitting apparatus comprising:
前記撮像部により取得される動画像を処理する請求項1から3のいずれかに記載の画像送信装置と、
を備えることを特徴とする撮像装置。
An imaging unit for acquiring a moving image;
The image transmission device according to any one of claims 1 to 3, which processes a moving image acquired by the imaging unit;
An imaging apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009073556A JP5235746B2 (en) | 2009-03-25 | 2009-03-25 | Image transmission device and imaging device equipped with the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009073556A JP5235746B2 (en) | 2009-03-25 | 2009-03-25 | Image transmission device and imaging device equipped with the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010226594A true JP2010226594A (en) | 2010-10-07 |
JP5235746B2 JP5235746B2 (en) | 2013-07-10 |
Family
ID=43043268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009073556A Expired - Fee Related JP5235746B2 (en) | 2009-03-25 | 2009-03-25 | Image transmission device and imaging device equipped with the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5235746B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016072686A (en) * | 2014-09-26 | 2016-05-09 | Kddi株式会社 | Image transmission/reception system and method for performing data reduction processing based on region request |
JP2021527969A (en) * | 2018-06-19 | 2021-10-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Audio and video multimedia modifications and presentations |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8847638B2 (en) | 2009-07-02 | 2014-09-30 | Qualcomm Incorporated | High speed divide-by-two circuit |
US8791740B2 (en) | 2009-07-16 | 2014-07-29 | Qualcomm Incorporated | Systems and methods for reducing average current consumption in a local oscillator path |
US9154077B2 (en) | 2012-04-12 | 2015-10-06 | Qualcomm Incorporated | Compact high frequency divider |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01228384A (en) * | 1988-03-09 | 1989-09-12 | Kokusai Denshin Denwa Co Ltd <Kdd> | Moving image coding system using area division |
JPH09205648A (en) * | 1996-01-26 | 1997-08-05 | Sony Corp | Image compression transmitter |
JPH1028269A (en) * | 1995-08-02 | 1998-01-27 | Matsushita Electric Ind Co Ltd | Picture-encoding device and picture-transmission system using the same and quantization controlling method and mean through-put calculating method used for the same |
JP2001069502A (en) * | 1999-08-25 | 2001-03-16 | Toshiba Corp | Video image transmission terminal and video image reception terminal |
JP2001145101A (en) * | 1999-11-12 | 2001-05-25 | Mega Chips Corp | Human image compressing device |
JP2006099404A (en) * | 2004-09-29 | 2006-04-13 | Sanyo Electric Co Ltd | Image display device |
JP2009027536A (en) * | 2007-07-20 | 2009-02-05 | Sanyo Electric Co Ltd | Image processor and imaging apparatus using same |
JP2009278568A (en) * | 2008-05-16 | 2009-11-26 | Sony Corp | Image processing device and image processing method |
-
2009
- 2009-03-25 JP JP2009073556A patent/JP5235746B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01228384A (en) * | 1988-03-09 | 1989-09-12 | Kokusai Denshin Denwa Co Ltd <Kdd> | Moving image coding system using area division |
JPH1028269A (en) * | 1995-08-02 | 1998-01-27 | Matsushita Electric Ind Co Ltd | Picture-encoding device and picture-transmission system using the same and quantization controlling method and mean through-put calculating method used for the same |
JPH09205648A (en) * | 1996-01-26 | 1997-08-05 | Sony Corp | Image compression transmitter |
JP2001069502A (en) * | 1999-08-25 | 2001-03-16 | Toshiba Corp | Video image transmission terminal and video image reception terminal |
JP2001145101A (en) * | 1999-11-12 | 2001-05-25 | Mega Chips Corp | Human image compressing device |
JP2006099404A (en) * | 2004-09-29 | 2006-04-13 | Sanyo Electric Co Ltd | Image display device |
JP2009027536A (en) * | 2007-07-20 | 2009-02-05 | Sanyo Electric Co Ltd | Image processor and imaging apparatus using same |
JP2009278568A (en) * | 2008-05-16 | 2009-11-26 | Sony Corp | Image processing device and image processing method |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016072686A (en) * | 2014-09-26 | 2016-05-09 | Kddi株式会社 | Image transmission/reception system and method for performing data reduction processing based on region request |
JP2021527969A (en) * | 2018-06-19 | 2021-10-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Audio and video multimedia modifications and presentations |
JP7416718B2 (en) | 2018-06-19 | 2024-01-17 | キンドリル・インク | Audio and video multimedia modification and presentation |
Also Published As
Publication number | Publication date |
---|---|
JP5235746B2 (en) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102121558B1 (en) | Method of stabilizing video image, post-processing device and video encoder including the same | |
JP5766877B2 (en) | Frame coding selection based on similarity, visual quality, and interest | |
JP4887750B2 (en) | Image processing apparatus, control method, and program | |
WO2009139123A1 (en) | Image processor and imaging device using the same | |
JP2003189290A (en) | Apparatus and method for controlling camera using video compression algorithm | |
JP5235746B2 (en) | Image transmission device and imaging device equipped with the same | |
JP2008193530A (en) | Image recorder, image recording method and program | |
KR101585022B1 (en) | Streaming Data Analysis System for Motion Detection in Image Monitering System and Streaming Data Analysis Method for Motion detection | |
JP2019068248A (en) | Image processing apparatus, image processing method, and program | |
JP2011147049A (en) | Image processing apparatus and method, and program | |
JP2011135326A (en) | Image processing device and method, and program | |
JP2007122232A (en) | Image processor and program | |
US8488892B2 (en) | Image encoder and camera system | |
US8749701B2 (en) | Digital photographing apparatus and method of controlling power of the digital photographing apparatus | |
JP2019134323A (en) | Image processor, image processing method and program | |
WO2011074189A1 (en) | Image encoding method and image encoding device | |
JP2009218965A (en) | Image processor, imaging device mounted with the same and image reproduction device | |
JP2007214886A (en) | Image processor | |
US10516896B2 (en) | Encoding device, encoding method, and storage medium | |
EP3547684B1 (en) | Method, device and system for encoding a sequence of frames in a video stream | |
US7412079B2 (en) | Image processing apparatus | |
WO2011064935A1 (en) | Motion vector detection method and motion vector detection device | |
JP5165084B2 (en) | Image encoding device | |
JP5171675B2 (en) | Image processing apparatus and imaging apparatus equipped with the same | |
JP4700992B2 (en) | Image processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111117 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111130 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120229 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121211 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130326 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |