JP4136403B2 - Image processing apparatus, image processing method, program, and storage medium - Google Patents
Image processing apparatus, image processing method, program, and storage medium Download PDFInfo
- Publication number
- JP4136403B2 JP4136403B2 JP2002063556A JP2002063556A JP4136403B2 JP 4136403 B2 JP4136403 B2 JP 4136403B2 JP 2002063556 A JP2002063556 A JP 2002063556A JP 2002063556 A JP2002063556 A JP 2002063556A JP 4136403 B2 JP4136403 B2 JP 4136403B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- block
- difference
- background image
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、動画像を構成する連続した静止画像において、オブジェクトのみが含まれるオブジェクト画像と、オブジェクトを含む背景画像の夫々を符号化し、外部に伝送する画像処理装置、画像処理方法、プログラム、記憶媒体に関するものである。
【0002】
【従来の技術】
従来、画像の符号化方式としてフレーム内符号化方式であるMotion JPEGやDigital Video等の符号化方式や、フレーム間予測符号化を用いたH.261,H.263,MPEG−1,MPEG−2等の符号化方式が知られている。これらの符号化方式は、ISO(International Organization for Standardization:国際標準化機構)やITU(International Telecommunication Union:国際電気通信連合)によって国際標準化されている。フレーム内符号化方式はフレーム単位で独立に符号化を行うもので、フレームの管理がしやすいため、動画像の編集や特殊再生が必要な装置に最適である。また、フレーム間予測符号化方式は、フレーム間での画像データの差分に基づくフレーム間予測を用いるため、符号化効率が高いという特徴を持っている。
【0003】
さらにコンピュータ・放送・通信など多くの領域で利用できる、汎用的な次世代マルチメディア符号化規格としてMPEG-4の国際標準化作業が進められている。MPEG-4の大きな特徴として、オブジェクト・ベース符号化を行う機能がある。
【0004】
オブジェクト・ベース符号化とは、MPEG(Moving Picture ExpertGroup)-1やMPEG-2で採用されているような長方形の画像全体を符号化する方法ではなく、予め何等かの方法で生成された形状情報の画像によって、画像の中の切り出された人物やその他の物体、つまり画像のオブジェクト毎に符号化を行う方法である。以降ではこの形状情報画像と区別するため、一般的に処理対象とする画像を自然画像と称する。
【0005】
形状情報画像とは、符号化対象となっている自然画像と全く同じ縦横の画素数を持ち、オブジェクトの形状を表す画像である。形状情報画像には各画素が1bitで表されるバイナリ・アルファ・プレーンと、各画素が2bit以上で表されるグレイスケール・アルファ・プレーンがある。バイナリ・アルファ・プレーンは通常、画素の値が“1”の領域はオブジェクト領域、“0”の領域はオブジェクト外の領域を表す。
【0006】
尚、その他のMPEG-4の詳細内容については、ISO/IECによる国際標準の文書に委ねることとする。
【0007】
【発明が解決しようとする課題】
図6を用いてオブジェクト・ベース符号化方法について説明する。図6(a)は自然画像、(b)は(a)に対応した形状情報画像である。
【0008】
形状情報画像はオブジェクトの内外を示す画素群で構成される画像で、オブジェクトの内部を示す画素群(同図(b)において白の部分)の画素値は1以上で、オブジェクトの外部を示す画素群(同図(b)において斜線部分)の画素値は0である。よって、この形状情報画像を参照することで、自然画像におけるオブジェクトを構成する画素群を特定することができる。
【0009】
これにより自然画像においてオブジェクトの内部(オブジェクト画像)と外部(背景画像)に分けて符号化し、外部に伝送することができるが、背景画像はオブジェクト画像に比べてその面積は大きい。これは構成する画素数がオブジェクト画像よりも背景画像のほうが多いことを示している。これにより背景画像の扱いによっては自然画像を外部に伝送する場合、その効率に大きな影響を与えることになる。
【0010】
本発明は以上の問題に鑑みてなされたものであり、背景画像を含む画像全体の符号化効率、そして背景画像の伝送効率を向上させることを目的とする。
【0011】
【課題を解決するための手段】
本発明の問題を解決するために、たとえば本発明の画像処理装置は以下の構成を備える。
【0012】
すなわち、動画像を構成する連続した静止画像を入力し、各静止画像において、オブジェクト画像と背景画像の夫々を符号化し、外部に伝送する画像処理装置であって、
前記背景画像を格納する格納手段と、
1フレーム分の静止画像からブロックxを抽出すると共に、前記格納手段に格納されている背景画像から前記ブロックxに対応する対応ブロックxを抽出し、前記ブロックxと前記対応ブロックxとの差分を示す差分ブロックxを生成する処理を、x=1,2,…,N(N>1)について行う差分画像生成手段と、
予め設定されたフレーム数に渡って前記差分画像生成手段が各フレームについて生成した差分ブロックxの平均ブロックxを求める処理を、x=0,1,…,Nについて行う平均手段と、
前記平均ブロックxに対して周波数変換を施して係数ブロックxを生成する処理を、x=0,1,…,Nについて行う周波数変換手段と、
前記係数ブロックxと、比較対象のブロックと、の絶対差分和が予め設定された閾値よりも大きいか否かを判定する処理を、x=0,1,…,Nについて行う判定手段と、
前記判定手段がx=0,1,…,Nについて判定した結果、大きいと判定した回数が予め設定された閾値よりも大きい場合には、新たな背景画像として、前記予め設定されたフレーム数分の静止画像のうち何れか1つを符号化し、外部に出力する出力手段と
を備えることを特徴とする。
【0013】
本発明の問題を解決するために、たとえば本発明の画像処理方法は以下の構成を備える。
【0014】
すなわち、動画像を構成する連続した静止画像を入力し、各静止画像において、オブジェクト画像と背景画像の夫々を符号化し、外部に伝送する画像処理装置が行う画像処理方法であって、
1フレーム分の静止画像からブロックxを抽出すると共に、メモリに格納されている背景画像から前記ブロックxに対応する対応ブロックxを抽出し、前記ブロックxと前記対応ブロックxとの差分を示す差分ブロックxを生成する処理を、x=1,2,…,N(N>1)について行う差分画像生成工程と、
予め設定されたフレーム数に渡って前記差分画像生成工程で各フレームについて生成した差分ブロックxの平均ブロックxを求める処理を、x=0,1,…,Nについて行う平均工程と、
前記平均ブロックxに対して周波数変換を施して係数ブロックxを生成する処理を、x=0,1,…,Nについて行う周波数変換工程と、
前記係数ブロックxと、比較対象のブロックと、の絶対差分和が予め設定された閾値よりも大きいか否かを判定する処理を、x=0,1,…,Nについて行う判定工程と、
前記判定工程でx=0,1,…,Nについて判定した結果、大きいと判定した回数が予め設定された閾値よりも大きい場合には、新たな背景画像として、前記予め設定されたフレーム数分の静止画像のうち何れか1つを符号化し、外部に出力する出力工程と
を備えることを特徴とする。
【0015】
【発明の実施の形態】
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
【0016】
[第1の実施形態]
本実施形態における画像処理装置は外部の撮像装置によって撮像された動画(連続する静止画像により構成されている)を入力し、撮像画像を構成する各静止画像に含まれるオブジェクトの画像領域、背景の画像領域の夫々を符号化し、必要に応じて多重化し、ストリームとして出力する。
【0017】
本実施形態における画像処理装置の機能構成を示すブロック図である図1を参照して、本実施形態における画像処理装置の各部について説明する。なお、以下の説明では入力した画像を符号化する際に所定のサイズのブロックに分割し、更にそのサイズを8画素×8ラインとするが、このサイズに限定されるものではない。また以下、撮影画像、背景画像は共に、上記動画を構成する1フレームの静止画とする。
【0018】
100は背景画像を記憶する背景画像メモリ、101は現在撮像している画像と、背景画像メモリ100内の背景画像とを用いて伝送すべき新たな背景画像の出力制御を行う伝送背景画像出力制御器である。102は伝送背景画像出力制御器101からの背景画像を符号化する背景画像符号化器である。103は現在撮像している画像から、オブジェクト領域を抽出し、オブジェクト画像を生成するオブジェクト画像生成器である。104はオブジェクト画像生成器103からのオブジェクト画像を符号化するオブジェクト画像符号化器である。105は背景画像符号化器102および/またはオブジェクト画像符号化器104からの符号化データを多重化し、ストリームを出力する多重化器である。
【0019】
次に、以上の構成を備える本実施形態における画像処理装置の動作について説明する。まず、予めオブジェクトの無い状態の背景画像を撮像し、この画像を背景画像メモリ100へ蓄積する。同時に、伝送背景画像出力制御器101、背景画像符号化器102を介して、背景画像の符号化データが生成される。具体的には、撮像された画像を規定のフレームレートで伝送背景画像出力制御器101へ入力する。伝送背景画像出力制御器101は入力される画像と既に背景画像メモリ100に蓄積された背景画像とを用いて、伝送すべき新たな背景画像の出力制御を行う。この制御方法については後述する。背景画像は、背景画像符号化器102により符号化され、多重化器105へ入力される。
【0020】
一方、撮像された画像は、オブジェクト画像生成器103、オブジェクト画像符号化器104を介し、多重化器105へ入力される。多重化器105からは多重化されたストリームが出力される。
【0021】
次に、伝送背景画像出力制御器101が行う、伝送すべき背景画像の出力制御の処理について図2を参照して説明する。図2は伝送背景画像出力制御器101の機能構成を示すブロック図である。
【0022】
200は背景画像メモリ100から入力される背景画像から画像中の所定の位置にあるブロックを抽出するブロック抽出器である。201は撮像された画像から画像中の所定の位置にあるブロックを抽出するブロック抽出器である。202はブロック抽出器200,201から入力される夫々のブロックから差分ブロック(差分画像)を生成する差分画像生成器である。203は差分画像生成器202から入力される差分ブロックを蓄積し、積分する差分画像積分器である。
【0023】
204は差分画像積分器203からの積分された差分ブロックを入力し、DCT(離散コサイン変換)を施すDCT器である。このDCT器204により、差分ブロックの周波数成分を獲得し、各成分の値を見ることで、画像の変化量をみることができる。205はDCT器204からのDCT係数ブロックと、このDCT係数ブロックと比較するための係数ブロック、そして閾値ブロックを入力し、背景画像を更新するかどうかの制御信号を出力するDCT係数比較器である。206はDCT係数比較器205からの制御信号に応じて、撮像された画像を新背景画像として選択し、出力する新背景画像出力器である。
【0024】
図3(a)に、ブロック抽出器200,201が抽出するブロックの位置の例を示す。たとえば撮像された画像が図3(b)に示す画像とし、背景画像メモリ100に格納されている画像が図3(c)に示された画像とする場合、図3(b)に示した4つの位置のブロックを夫々の画像から抽出する。なお、同図では抽出するブロックの数は4つとしているが、これに限定されるものではない。また、これらの位置に限定されるものではない。
【0025】
図4に、伝送背景画像出力制御器101が行う処理のフローチャートを示す。まず差分画像積分器203内の背景出力フラグoutf=0,処理ブロックカウンタbcnt=0(ステップS300)と初期化し、更に蓄積回数カウンタcnt=0、蓄積ブロックInt=0と初期化する(ステップS301)。次にブロック抽出器200により背景画像内のブロックを入力する(ステップS302)。また撮像された画像(第1のフレーム)からブロック抽出器201により撮像画像内のブロックを入力する(ステップS303)。
【0026】
そして差分画像生成器202において夫々のブロックの差分をとり、差分ブロックDiffを生成する(ステップS304)。次に差分画像積分器203でこの差分ブロックDiffを蓄積ブロックIntへ累積(各要素ごとに累積)すると同時に、cntを+1する(ステップS305)。そして以上のステップS302からステップS304までをcnt=2となるまで繰り返す。すなわち、次の撮像画像(上記撮像画像の次のフレームの画像である第2のフレーム)から上記撮像画像と同じ位置のブロックを抽出し、このブロックと背景画像のブロックとの差分をとり、差分ブロックDiffを生成し、差分ブロックDiffを蓄積ブロックIntへ累積(各要素ごとに累積)する。
【0027】
次に差分画像積分器203はIntを繰り返し回数、すなわち2で除算する(ステップS307)。次にDCT器204はIntに対してDCTを施す(ステップS308)。次にDCT係数比較器205において比較係数ブロックと閾値ブロックを入力し(ステップS309,ステップS310)、DCT器204からの係数ブロック(Int係数ブロック)と比較係数ブロックとの差分絶対値和と、閾値ブロックの値とを比較する(ステップS311)。比較式は否に示す式に従うものとする。
【0028】
Σ|Ai−Bi| > 閾値ブロック
ここで、AiはInt係数ブロックのi番目の要素、Biは比較係数ブロックのi番目の要素を示し、左辺はInt係数ブロックと比較係数ブロックとで位置的に対応する要素間の差分をすべての要素に対して加算した結果を示す。また、上記比較係数ブロックの各要素、および閾値ブロックの値はここでは特に決めていないが、画像の性質などに応じて適宜決める。
【0029】
左辺>右辺の場合、処理をステップS312に進め、DCT係数比較器205はoutfを+1する(ステップS312)。次にbcntを+1し(ステップS313)、bcntが4以上かどうかを判定する(ステップS314)。すなわち、4つのブロック(図3(a)における4つの白の矩形)すべてに対して行ったか否かを判定する。次にoutfが2より大かどうかを判定し(ステップS315)、3以上の場合、処理をステップS315に進め、DCT係数比較器205は新背景画像出力器206に対して制御信号を出力する。新背景画像出力器206はこの制御信号に基づいて新背景画像として撮像画像(上記第1のフレーム、第2のフレームのいずれでもよい)を背景画像符号化器102に出力すると共に、背景画像メモリ100に出力する(ステップS316)。すなわち、3つ以上のブロックにおいて、背景画像メモリ100内の背景画像が撮像画像と大きく異なる(上記式において左辺が閾値ブロック以上となる程異なる)と判定された場合には、新背景画像として撮像画像を用いる。
【0030】
一方、ステップS315においてDCT係数比較器205がoutfが2以下であると判定した場合、処理をステップS317に進め、DCT係数比較器205は新背景画像出力器206に対して制御信号を出力する。新背景画像出力器206はこの制御信号に基づいて背景画像を出力しない旨を示すNULLを背景画像符号化器102に出力する(ステップS317)。すなわち、背景画像メモリ100内の背景画像が撮像画像と大きく異なる(上記式において左辺が閾値ブロック以上となる程異なる)と判定されたブロックが半数以下であるということは、背景にほとんど変化がないということを意味しているので、新たに背景画像を出力する必要がない(ストリームを受信し、復号する装置は従前に復号した背景画像を用いることになる)。
【0031】
なお、背景画像符号化器206はNULLを入力すると符号化処理を行わず、従ってこの場合、多重化器105が出力するストリームにはオブジェクトの符号化データのみ含まれることになる。
【0032】
このようにすることで、背景画像にほとんど変化がない場合には背景画像の符号化、伝送といった処理を行わなくてもよいので、処理量の軽減、そして伝送効率の向上といった効果が得られる。
【0033】
以上の説明により、本実施形態における画像処理装置は背景画像を、撮像画像が従前に保持しておいた背景画像と大きく異なる場合にのみ撮像画像を符号化し、伝送し、ほとんど変わらない場合には背景画像の伝送を行わないことで、全体の伝送処理の軽減、そして伝送の効率の向上を図ることができる。
【0034】
[第2の実施形態]
第1の実施形態ではMPEG-4に適用しているが、その他のオブジェクト・ベース符号化方式に適用してもよい。また、第1の実施形態では、差分画像積分器203内のcnt=2の場合までを積分対象としたが(つまり第1のフレームと第2のフレームのみを用いたが)、その他の値でもかまわない。また、上記第1の実施形態では差分ブロックに対する周波数変換としてDCTを用いたが、これに限定されるものではない。
【0035】
[第3の実施形態]
第1の実施形態で説明した各処理は、図5に示す構成を有する一般のコンピュータにおいても実行可能である。図5は第1の実施形態で説明した各処理を実行するコンピュータの基本構成を示すブロック図である。500はコンピュータ全体の制御、及び種々の処理を行う中央演算装置(CPU)、501は本コンピュータの制御に必要なオペレーティングシステム(OS)、ソフトウエア、データ、演算に必要な記憶領域を提供するメモリである。また、CPU500が各種の処理を行う際のワークエリアとしても用いられる。
【0036】
502は種々の装置をつなぎ、データ、制御信号をやりとりするバス、503は各種のソフトウエアを蓄積する記憶装置、504は動画像データを蓄積する記憶装置、505は画像やコンピュータからのシステムメッセージなどを表示するモニタである。
【0037】
507は通信回路508に符号化データを送信する通信インターフェースで、装置外部とLAN、公衆回線、無線回線、放送電波等により接続されている。506はコンピュータを起動したり、ビットレート等の各種条件を設定したりするために、各種の指示を入力する操作部である。
【0038】
メモリ501には上述のとおりコンピュータ全体を制御し、各種ソフトウエアを動作させるためのOSや動作させるソフトウエアを格納し、画像データを符号化のために読み込むエリア、一時的に符号データを格納する符号エリア、各種演算のパラメータ等を格納しておくワーキングエリアが存在する。
【0039】
このような構成において、上記符号化処理に先立ち、操作部506から記憶装置504に蓄積されている動画像データから符号化する動画像データを選択している。すると、記憶装置503に格納されているソフトウエアがバス502を介してメモリ501に展開され、ソフトウエアが起動される。
【0040】
そして、CPU500による記憶装置504に格納されている動画像データの符号化動作は図3に示したフローチャートに従ったプログラムコード(前述のソフトウエア)が実行されることになる。
【0041】
以上の説明により、本実施形態におけるコンピュータは、第1の実施形態におけるオブジェクト・ベース画像符号化を実現する装置として機能する。
【0042】
[他の実施形態]
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0043】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0044】
【発明の効果】
以上の説明により、本発明によって、背景画像を含む画像全体の符号化効率、そして背景画像の伝送効率を向上させることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像処理装置の機能構成を示すブロック図である。
【図2】伝送背景画像出力制御器101の機能構成を示すブロック図である。
【図3】(a)はブロック抽出器200が抽出するブロックの位置の例を示す図で、(b)はブロック抽出器201が抽出するブロックの位置の例を示す図である。
【図4】伝送背景画像出力制御器101が行う処理のフローチャートである。
【図5】本発明の第3の実施形態におけるコンピュータの基本構成を示すブロック図である。
【図6】オブジェクト・ベース符号化方法を説明する図である。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus, an image processing method, a program, and a memory for encoding and transmitting an object image including only an object and a background image including the object in continuous still images constituting a moving image. It relates to the medium.
[0002]
[Prior art]
Conventionally, as an image encoding method, an intra-frame encoding method such as Motion JPEG or Digital Video, or H.264 using inter-frame predictive encoding is used. 261, H.M. Coding schemes such as H.263, MPEG-1, and MPEG-2 are known. These encoding methods are internationally standardized by ISO (International Organization for Standardization) and ITU (International Telecommunication Union). The intra-frame coding method performs coding independently for each frame, and is easy to manage the frames, so that it is most suitable for an apparatus that requires editing of moving images and special reproduction. In addition, the inter-frame predictive coding method has a feature that coding efficiency is high because inter-frame prediction based on a difference in image data between frames is used.
[0003]
Furthermore, the international standardization of MPEG-4 is in progress as a general-purpose next-generation multimedia coding standard that can be used in many fields such as computer, broadcasting, and communication. A major feature of MPEG-4 is the ability to perform object-based coding.
[0004]
Object-based encoding is not a method of encoding an entire rectangular image as employed in MPEG (Moving Picture Expert Group) -1 or MPEG-2, but shape information generated by some method in advance. In this method, encoding is performed for each person or other object cut out in the image, that is, for each object in the image. Hereinafter, in order to distinguish from this shape information image, an image to be processed is generally referred to as a natural image.
[0005]
The shape information image is an image having the same number of vertical and horizontal pixels as the natural image to be encoded and representing the shape of the object. The shape information image includes a binary alpha plane in which each pixel is represented by 1 bit and a grayscale alpha plane in which each pixel is represented by 2 bits or more. In the binary alpha plane, an area having a pixel value “1” generally represents an object area, and an area “0” represents an area outside the object.
[0006]
The other detailed contents of MPEG-4 will be entrusted to international standard documents by ISO / IEC.
[0007]
[Problems to be solved by the invention]
The object-based encoding method will be described with reference to FIG. FIG. 6A is a natural image, and FIG. 6B is a shape information image corresponding to FIG.
[0008]
The shape information image is an image composed of pixel groups indicating the inside and outside of the object, and the pixel value of the pixel group indicating the inside of the object (the white portion in FIG. 5B) is 1 or more and the pixel indicating the outside of the object The pixel value of the group (shaded portion in FIG. 5B) is 0. Therefore, by referring to this shape information image, it is possible to specify a pixel group constituting an object in the natural image.
[0009]
As a result, the natural image can be encoded separately inside the object (object image) and outside (background image) and transmitted to the outside, but the background image has a larger area than the object image. This indicates that the background image has more pixels than the object image. As a result, depending on how the background image is handled, when the natural image is transmitted to the outside, the efficiency is greatly affected.
[0010]
The present invention has been made in view of the above problems, and an object thereof is to improve the coding efficiency of the entire image including the background image and the transmission efficiency of the background image.
[0011]
[Means for Solving the Problems]
In order to solve the problems of the present invention, for example, an image processing apparatus of the present invention comprises the following arrangement.
[0012]
That is, an image processing apparatus that inputs continuous still images constituting a moving image, encodes each of an object image and a background image in each still image, and transmits the encoded image to the outside.
Storage means for storing the background image;
The block x is extracted from the still image for one frame, the corresponding block x corresponding to the block x is extracted from the background image stored in the storage means, and the difference between the block x and the corresponding block x is calculated. Differential image generation means for performing the process of generating the difference block x shown for x = 1, 2,..., N (N>1);
An averaging means for performing the process of obtaining an average block x of the difference blocks x generated by the difference image generating means for each frame over a preset number of frames for x = 0, 1,.
Frequency conversion means for performing a frequency conversion on the average block x to generate a coefficient block x for x = 0, 1,..., N ;
A determination means for determining whether or not the absolute difference sum of the coefficient block x and the comparison target block is larger than a preset threshold value for x = 0, 1,..., N ;
The determination unit is x = 0, 1, ..., a result of determining the N, large and when the number of times it is determined is greater than a preset threshold, as a new background image, the number of frames that is set in advance Output means for encoding any one of the still images and outputting the encoded image to the outside.
[0013]
In order to solve the problems of the present invention, for example, an image processing method of the present invention comprises the following arrangement.
[0014]
That is, an image processing method performed by an image processing apparatus that inputs continuous still images constituting a moving image, encodes each of an object image and a background image in each still image, and transmits the encoded image to the outside.
A block x is extracted from a still image for one frame, a corresponding block x corresponding to the block x is extracted from a background image stored in a memory, and a difference indicating a difference between the block x and the corresponding block x A difference image generation step of performing processing for generating a block x with respect to x = 1, 2,..., N (N>1);
A process of obtaining an average block x of the difference blocks x generated for each frame in the difference image generation process over a preset number of frames, with respect to x = 0, 1,.
A frequency conversion step of performing a frequency conversion on the average block x to generate a coefficient block x for x = 0, 1,..., N ;
A determination step for determining whether or not the absolute difference sum of the coefficient block x and the comparison target block is larger than a preset threshold value for x = 0, 1,..., N ;
The determination step at x = 0, 1, ..., a result of determining the N, large and when the number of times it is determined is greater than a preset threshold, as a new background image, the number of frames that is set in advance An output step of encoding any one of the still images and outputting the encoded image to the outside.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in detail according to preferred embodiments with reference to the accompanying drawings.
[0016]
[First Embodiment]
The image processing apparatus according to the present embodiment inputs a moving image (consisting of continuous still images) captured by an external imaging device, and includes an image area and background of an object included in each still image constituting the captured image. Each of the image areas is encoded, multiplexed as necessary, and output as a stream.
[0017]
With reference to FIG. 1 which is a block diagram showing a functional configuration of the image processing apparatus in the present embodiment, each part of the image processing apparatus in the present embodiment will be described. In the following description, when an input image is encoded, it is divided into blocks of a predetermined size, and the size is 8 pixels × 8 lines. However, the present invention is not limited to this size. Further, hereinafter, both the photographed image and the background image are assumed to be one frame still images constituting the moving image.
[0018]
100 is a background image memory for storing a background image, and 101 is a transmission background image output control for performing output control of a new background image to be transmitted using the currently captured image and the background image in the
[0019]
Next, the operation of the image processing apparatus according to this embodiment having the above configuration will be described. First, a background image without an object is captured in advance, and this image is stored in the
[0020]
On the other hand, the captured image is input to the
[0021]
Next, processing for controlling the output of the background image to be transmitted performed by the transmission background
[0022]
A
[0023]
[0024]
FIG. 3A shows an example of the position of the block extracted by the
[0025]
FIG. 4 shows a flowchart of processing performed by the transmission background
[0026]
Then, the
[0027]
Next, the
[0028]
Σ | Ai−Bi |> threshold block where Ai indicates the i-th element of the Int coefficient block, Bi indicates the i-th element of the comparison coefficient block, and the left side is a position between the Int coefficient block and the comparison coefficient block. The difference between corresponding elements is added to all elements. The elements of the comparison coefficient block and the value of the threshold block are not particularly determined here, but are appropriately determined according to the properties of the image.
[0029]
If left side> right side, the process proceeds to step S312 and the
[0030]
On the other hand, if the
[0031]
Note that the
[0032]
In this way, when there is almost no change in the background image, it is not necessary to perform processing such as encoding and transmission of the background image, so that effects such as reduction in processing amount and improvement in transmission efficiency can be obtained.
[0033]
As described above, the image processing apparatus according to the present embodiment encodes and transmits a captured image only when the captured image is significantly different from the previously stored background image. By not transmitting the background image, it is possible to reduce the overall transmission processing and improve the transmission efficiency.
[0034]
[Second Embodiment]
In the first embodiment, the present invention is applied to MPEG-4, but may be applied to other object-based encoding schemes. In the first embodiment, the integration target is up to cnt = 2 in the difference image integrator 203 (that is, only the first frame and the second frame are used), but other values may be used. It doesn't matter. In the first embodiment, the DCT is used as the frequency conversion for the difference block. However, the present invention is not limited to this.
[0035]
[Third Embodiment]
Each process described in the first embodiment can also be executed by a general computer having the configuration shown in FIG. FIG. 5 is a block diagram illustrating a basic configuration of a computer that executes each process described in the first embodiment.
[0036]
502 is a bus for connecting various devices to exchange data and control signals, 503 is a storage device for storing various software, 504 is a storage device for storing moving image data, 505 is an image or a system message from a computer, etc. Is a monitor that displays.
[0037]
[0038]
The
[0039]
In such a configuration, prior to the encoding process, moving image data to be encoded is selected from the moving image data accumulated in the
[0040]
Then, for the encoding operation of the moving image data stored in the
[0041]
As described above, the computer according to the present embodiment functions as a device that implements the object-based image coding according to the first embodiment.
[0042]
[Other Embodiments]
An object of the present invention is to supply a storage medium (or recording medium) in which a program code of software for realizing the functions of the above-described embodiments is recorded to a system or apparatus, and a computer (or CPU or MPU) of the system or apparatus. Needless to say, this can also be achieved by reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention. Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an operating system (OS) running on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
[0043]
Furthermore, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the function is determined based on the instruction of the program code. It goes without saying that the CPU or the like provided in the expansion card or the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
[0044]
【The invention's effect】
As described above, according to the present invention, the encoding efficiency of the entire image including the background image and the transmission efficiency of the background image can be improved.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a functional configuration of an image processing apparatus according to a first embodiment of the present invention.
2 is a block diagram showing a functional configuration of a transmission background
3A is a diagram showing an example of the position of a block extracted by the
4 is a flowchart of processing performed by a transmission background
FIG. 5 is a block diagram showing a basic configuration of a computer according to a third embodiment of the present invention.
FIG. 6 is a diagram illustrating an object-based encoding method.
Claims (7)
前記背景画像を格納する格納手段と、
1フレーム分の静止画像からブロックxを抽出すると共に、前記格納手段に格納されている背景画像から前記ブロックxに対応する対応ブロックxを抽出し、前記ブロックxと前記対応ブロックxとの差分を示す差分ブロックxを生成する処理を、x=1,2,…,N(N>1)について行う差分画像生成手段と、
予め設定されたフレーム数に渡って前記差分画像生成手段が各フレームについて生成した差分ブロックxの平均ブロックxを求める処理を、x=0,1,…,Nについて行う平均手段と、
前記平均ブロックxに対して周波数変換を施して係数ブロックxを生成する処理を、x=0,1,…,Nについて行う周波数変換手段と、
前記係数ブロックxと、比較対象のブロックと、の絶対差分和が予め設定された閾値よりも大きいか否かを判定する処理を、x=0,1,…,Nについて行う判定手段と、
前記判定手段がx=0,1,…,Nについて判定した結果、大きいと判定した回数が予め設定された閾値よりも大きい場合には、新たな背景画像として、前記予め設定されたフレーム数分の静止画像のうち何れか1つを符号化し、外部に出力する出力手段と
を備えることを特徴とする画像処理装置。An image processing apparatus that inputs continuous still images constituting a moving image, encodes each of an object image and a background image in each still image, and transmits the encoded image to the outside.
Storage means for storing the background image;
The block x is extracted from the still image for one frame, the corresponding block x corresponding to the block x is extracted from the background image stored in the storage means, and the difference between the block x and the corresponding block x is calculated. Differential image generation means for performing the process of generating the difference block x shown for x = 1, 2,..., N (N>1);
An averaging means for performing the process of obtaining an average block x of the difference blocks x generated by the difference image generating means for each frame over a preset number of frames for x = 0, 1,.
Frequency conversion means for performing a frequency conversion on the average block x to generate a coefficient block x for x = 0, 1,..., N ;
A determination means for determining whether or not the absolute difference sum of the coefficient block x and the comparison target block is larger than a preset threshold value for x = 0, 1,..., N ;
The determination unit is x = 0, 1, ..., a result of determining the N, large and when the number of times it is determined is greater than a preset threshold, as a new background image, the number of frames that is set in advance An image processing apparatus comprising: output means for encoding any one of the still images and outputting the encoded image to the outside.
1フレーム分の静止画像からブロックxを抽出すると共に、メモリに格納されている背景画像から前記ブロックxに対応する対応ブロックxを抽出し、前記ブロックxと前記対応ブロックxとの差分を示す差分ブロックxを生成する処理を、x=1,2,…,N(N>1)について行う差分画像生成工程と、
予め設定されたフレーム数に渡って前記差分画像生成工程で各フレームについて生成した差分ブロックxの平均ブロックxを求める処理を、x=0,1,…,Nについて行う平均工程と、
前記平均ブロックxに対して周波数変換を施して係数ブロックxを生成する処理を、x=0,1,…,Nについて行う周波数変換工程と、
前記係数ブロックxと、比較対象のブロックと、の絶対差分和が予め設定された閾値よりも大きいか否かを判定する処理を、x=0,1,…,Nについて行う判定工程と、
前記判定工程でx=0,1,…,Nについて判定した結果、大きいと判定した回数が予め設定された閾値よりも大きい場合には、新たな背景画像として、前記予め設定されたフレーム数分の静止画像のうち何れか1つを符号化し、外部に出力する出力工程と
を備えることを特徴とする画像処理方法。An image processing method performed by an image processing apparatus that inputs continuous still images constituting a moving image, encodes each of an object image and a background image in each still image, and transmits the encoded image to the outside.
A block x is extracted from a still image for one frame, a corresponding block x corresponding to the block x is extracted from a background image stored in a memory, and a difference indicating a difference between the block x and the corresponding block x A difference image generation step of performing processing for generating a block x with respect to x = 1, 2,..., N (N>1);
A process of obtaining an average block x of the difference blocks x generated for each frame in the difference image generation process over a preset number of frames, with respect to x = 0, 1,.
A frequency conversion step of performing a frequency conversion on the average block x to generate a coefficient block x for x = 0, 1,..., N ;
A determination step for determining whether or not the absolute difference sum of the coefficient block x and the comparison target block is larger than a preset threshold value for x = 0, 1,..., N ;
The determination step at x = 0, 1, ..., a result of determining the N, large and when the number of times it is determined is greater than a preset threshold, as a new background image, the number of frames that is set in advance An image processing method comprising: an output step of encoding any one of the still images and outputting the encoded image to the outside.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002063556A JP4136403B2 (en) | 2002-03-08 | 2002-03-08 | Image processing apparatus, image processing method, program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002063556A JP4136403B2 (en) | 2002-03-08 | 2002-03-08 | Image processing apparatus, image processing method, program, and storage medium |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003264838A JP2003264838A (en) | 2003-09-19 |
JP2003264838A5 JP2003264838A5 (en) | 2007-02-22 |
JP4136403B2 true JP4136403B2 (en) | 2008-08-20 |
Family
ID=29196770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002063556A Expired - Fee Related JP4136403B2 (en) | 2002-03-08 | 2002-03-08 | Image processing apparatus, image processing method, program, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4136403B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7706440B2 (en) * | 2005-02-08 | 2010-04-27 | Hong Kong Applied Science And Technology Research Institute Co., Ltd. | Method for reducing bit rate requirements for encoding multimedia data |
JP2021022910A (en) * | 2019-07-30 | 2021-02-18 | 株式会社リコー | Communication terminal, communication program, communication method, and communication system |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2518503B2 (en) * | 1993-03-08 | 1996-07-24 | 日本電気株式会社 | Screen switching detection method |
JPH07131794A (en) * | 1993-11-05 | 1995-05-19 | Fujitsu Ltd | Method and device for coding picture data |
JPH07152779A (en) * | 1993-11-29 | 1995-06-16 | Toshiba Corp | Processing method for detecting moving picture index and moving picture processor having moving picture index detection processing function |
JPH07288806A (en) * | 1994-04-20 | 1995-10-31 | Hitachi Ltd | Moving image communication system |
JP3984665B2 (en) * | 1995-12-27 | 2007-10-03 | キヤノン株式会社 | Image signal coding and compression apparatus and method |
JPH10145797A (en) * | 1996-11-12 | 1998-05-29 | K D D Technol:Kk | Method for encoding image and device therefor |
JP2000050259A (en) * | 1998-08-03 | 2000-02-18 | Hitachi Telecom Technol Ltd | Dynamic image coder and dynamic image decoder |
JP2000209570A (en) * | 1999-01-20 | 2000-07-28 | Toshiba Corp | Moving object monitor |
US6331859B1 (en) * | 1999-04-06 | 2001-12-18 | Sharp Laboratories Of America, Inc. | Video skimming system utilizing the vector rank filter |
JP2000295624A (en) * | 1999-04-07 | 2000-10-20 | Matsushita Electric Ind Co Ltd | Scene detector |
-
2002
- 2002-03-08 JP JP2002063556A patent/JP4136403B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003264838A (en) | 2003-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9716891B2 (en) | Quantization method and apparatus in encoding/decoding | |
US5592302A (en) | Coding method for coding pixel blocks and apparatus therefor | |
JP2002064709A (en) | Image processing unit and its method, and its computer program and storage medium | |
JP2003517796A (en) | How to reduce the "uneven picture" effect | |
US6546052B1 (en) | Image processing apparatus and method, and computer-readable memory | |
JP4023324B2 (en) | Watermark embedding and image compression unit | |
US8111753B2 (en) | Video encoding method and video encoder for improving performance | |
JP4136403B2 (en) | Image processing apparatus, image processing method, program, and storage medium | |
JP2002218472A (en) | Device and method for decoding variable image rate | |
JP4514666B2 (en) | Video encoding device | |
JPH11177982A (en) | Method and device for controlling the number of codes of picture data | |
JP2776284B2 (en) | Image coding device | |
US7065139B2 (en) | Video encoding method and video encoder for improving performance | |
JP3115866B2 (en) | Image encoding device and image decoding device | |
JP2021013145A (en) | Video transmission device and video transmission method | |
KR20160002712A (en) | Method and apparatus for processing video signal | |
JP2008199521A (en) | Image processing apparatus and method thereof | |
JPH07123412A (en) | Moving image compression-encoding method | |
JP2001218206A (en) | Image coder and its method, and medium | |
JP2001103483A (en) | Moving picture coding method | |
JP2000175200A (en) | Highly efficient encodng device/decoding device | |
JPH11239319A (en) | High efficiency coded image signal compositing device and editor | |
JPH1051767A (en) | Picture reproduction device | |
JP2000228772A (en) | Moving picture data quantity reduction device and storage medium storing moving picture data quantity reduction program | |
JP2002142225A (en) | Image signal-coding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050308 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070702 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080516 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080603 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |