JP2006304060A - 画像通信装置、画像通信システム、及び画像通信方法 - Google Patents
画像通信装置、画像通信システム、及び画像通信方法 Download PDFInfo
- Publication number
- JP2006304060A JP2006304060A JP2005124961A JP2005124961A JP2006304060A JP 2006304060 A JP2006304060 A JP 2006304060A JP 2005124961 A JP2005124961 A JP 2005124961A JP 2005124961 A JP2005124961 A JP 2005124961A JP 2006304060 A JP2006304060 A JP 2006304060A
- Authority
- JP
- Japan
- Prior art keywords
- image
- person
- encoding
- communication apparatus
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【課題】 装置全体としてのハードウェア規模及び演算処理量を低減し、かつ装置間で通信すべきデータ量を削減して、プライバシーコンシャスな画像通信を実現可能な画像通信装置、画像通信システム、及び画像通信方法を提供する。
【解決手段】 JPEG2000規格に準拠した符号化器17と、符号化器でコンポーネント変換された撮像画像から人物画像を分離する背景差分器21と、符号化器でウェーブレット変換された人物画像に基づいて、撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定器22とを備え、人物領域判定器での判定結果に基づいて人物領域だけの画像信号をリアルタイムに符号化伝送するようにして、認識処理にて行っていた冗長な処理及びそれを実現するためのハードウェアを削減し、かつ通信データの総量を低減できるようにする。
【選択図】 図1
【解決手段】 JPEG2000規格に準拠した符号化器17と、符号化器でコンポーネント変換された撮像画像から人物画像を分離する背景差分器21と、符号化器でウェーブレット変換された人物画像に基づいて、撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定器22とを備え、人物領域判定器での判定結果に基づいて人物領域だけの画像信号をリアルタイムに符号化伝送するようにして、認識処理にて行っていた冗長な処理及びそれを実現するためのハードウェアを削減し、かつ通信データの総量を低減できるようにする。
【選択図】 図1
Description
本発明は、画像通信装置、画像通信システム、及び画像通信方法に関し、詳しくは送信側での被写体と撮像カメラとの距離などに応じて、受信側における画像表示器に被写体が写ったり消えたり半透明に表示されたりするプライバシーコンシャスな画像通信技術に関する。
従来の画像通信システムは、例えばJPEG(Joint Photographic Experts Group)やMPEG(Moving Picture Experts Group)といった公知の画像圧縮方式のように、カメラで撮像して得られた映像をできるだけそのまま伝送することを目的として設計されている。例えば、特許文献1には、データ通信時にバーストエラーが発生しても何らかの画像が表示されるような、JPEG2000又はMotion JPEG2000といった国際標準符号化方式に基づく画像通信技術について開示されている。
上述した従来の画像通信システムに対して、近年、被写体とカメラとの距離に応じて、相手側に被写体が写ったり、消えたり、半透明となる、すなわち被写体を表示したり非表示したり半透明に表示したりする画像通信システムが提案され、被写体のプライバシーや対話の意思を、受信側での表示映像に反映できるプライバシーコンシャスな画像通信システムが注目されている(例えば、非特許文献1参照。)。
ここで、プライバシーコンシャスな画像通信システムにおける画像通信装置(送信側機能)は、大きく分けて符号化器と認識器とから構成されている。符号化器は、撮像して得られたディジタル映像信号をデータ圧縮する処理を行うものであり、例えば、現行のTV電話や会議システム等の構成要素である。また、認識器は、カメラからの距離や視線方向といった被写体の様子を認識する処理を行うものであり、例えば、状況認識や個人認証等を行うシステムの構成要素となっている。
従来の画像通信装置では、これら符号化器と認識器との2つの機能回路を独立して別々に構成した上でそれらを併用しているため、一般に回路規模(ハードウェア規模)や消費電力が大きくなってしまう。更に、符号化器と認識器を別々に構成するため、各々の処理を実現するためのLSI等の集積回路や通信装置そのものの開発期間及びコストもやはり膨大となる。
加えて、符号化結果と認識結果とを別々に送信した場合、通信データの総量が増大し、通信に要する時間が長くなるか、或いは通信に要する帯域が広くなる。その結果、通信コストが高額になったり、通信回線の混雑に対して脆弱となったりしてしまう。
本発明は、装置全体としてのハードウェア規模及び演算処理量を低減し、かつ装置間で通信すべきデータ量を削減して、プライバシーコンシャスな画像通信を実現可能な画像通信装置、画像通信システム、及び画像通信方法を提供することを目的とする。
本発明の画像通信装置は、JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化手段と、上記符号化手段にてコンポーネント変換された撮像画像から人物画像を分離する画像分離手段と、上記画像分離手段により分離され、上記符号化手段にてウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定手段とを備え、上記符号化手段は、上記人物領域判定手段での判定結果に基づいて、上記人物領域だけの画像信号を符号化することを特徴とする。
本発明の画像通信装置は、JPEG2000規格に準拠して符号化伝送された画像信号を受信して復号するための復号化手段と、背景画像を予め蓄積し、当該背景画像と上記復号化手段により復号された画像とを加算処理により合成し再生画像を生成する背景画像蓄積加算手段とを備え、上記復号化手段により復号される画像が上記背景画像とは異なる人物画像であることを特徴とする。
本発明の画像通信システムは、JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化手段と、上記符号化手段にてコンポーネント変換された撮像画像から人物画像を分離する画像分離手段と、上記画像分離手段により分離され、上記符号化手段にてウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定手段と、上記人物領域判定手段での判定結果に従って上記符号化手段により符号化し伝送された上記人物領域だけの画像信号を受信して復号するための復号化手段と、上記復号化手段により復号された人物領域の画像と、予め蓄積している背景画像とを加算処理により合成し再生画像を生成する背景画像蓄積加算手段とを備えることを特徴とする。
本発明の画像通信方法は、JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化工程と、上記符号化工程でコンポーネント変換された撮像画像から人物画像を分離する画像分離工程と、上記画像分離工程にて分離されて上記符号化工程でウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定工程とを有し、上記人物領域判定工程での判定結果に基づいて、上記符号化工程では上記人物領域だけの画像信号を符号化することを特徴とする。
本発明の画像通信装置は、JPEG2000規格に準拠して符号化伝送された画像信号を受信して復号するための復号化手段と、背景画像を予め蓄積し、当該背景画像と上記復号化手段により復号された画像とを加算処理により合成し再生画像を生成する背景画像蓄積加算手段とを備え、上記復号化手段により復号される画像が上記背景画像とは異なる人物画像であることを特徴とする。
本発明の画像通信システムは、JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化手段と、上記符号化手段にてコンポーネント変換された撮像画像から人物画像を分離する画像分離手段と、上記画像分離手段により分離され、上記符号化手段にてウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定手段と、上記人物領域判定手段での判定結果に従って上記符号化手段により符号化し伝送された上記人物領域だけの画像信号を受信して復号するための復号化手段と、上記復号化手段により復号された人物領域の画像と、予め蓄積している背景画像とを加算処理により合成し再生画像を生成する背景画像蓄積加算手段とを備えることを特徴とする。
本発明の画像通信方法は、JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化工程と、上記符号化工程でコンポーネント変換された撮像画像から人物画像を分離する画像分離工程と、上記画像分離工程にて分離されて上記符号化工程でウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定工程とを有し、上記人物領域判定工程での判定結果に基づいて、上記符号化工程では上記人物領域だけの画像信号を符号化することを特徴とする。
本発明によれば、JPEG2000規格に準拠した符号化処理に含まれる処理の一部を、被写体の様子を認識するための認識処理に活用することで、従来、認識処理にて実行されていた冗長な処理及びそれを実現するためのハードウェアを削減することができ、装置全体としてのハードウェア規模及び演算処理量を低減することができる。また、撮像画像における人物領域を判定して人物領域の画像信号だけを符号化することで、背景画像の画像信号を伝送せずにそれに対応するデータ量を削減でき、装置間で通信すべきデータ量を低減することができる。
以下、本発明の実施形態を図面に基づいて説明する。
図1は、本発明の一実施形態による画像通信装置1、2の構成例を示すブロック図である。
図1は、本発明の一実施形態による画像通信装置1、2の構成例を示すブロック図である。
画像通信装置1は、送信側装置としての機能を有する画像通信装置であり、カメラ等を用いて撮影されたディジタル画像信号(撮像画像)が入力され、それをJPEG2000国際標準規格に準拠した符号化方式で符号化して圧縮データとして送信又は蓄積する。画像通信装置1は、JPEG2000規格に準拠して画像信号を符号化する符号化器17に加え、認識器23を有する。
また、画像通信装置2は、受信側装置としての機能を有する画像通信装置であり、画像通信装置1より伝送された圧縮データを受信し、それを復号してディジタル画像信号として再生し図示しない画像表示装置に投影する(表示する)。画像通信装置2は、JPEG2000規格に準拠して圧縮データ(符号化されたデータ)を復号する復号器18に加え、背景画像の蓄積加算器24を有する。
画像通信装置1、2、詳細にはそれらが有する符号化器17、認識器23、復号器18、及び背景画像の蓄積加算器24について詳細に説明する。
図1に示すように、符号化器17は、コンポーネント変換部11、ウェーブレット変換部12、量子化部13、ビットモデリング部14、算術符号化部15、及び多重化部16により構成される。また、認識器23は、背景差分器21及び人物領域判定器22を有し構成される。
図1に示すように、符号化器17は、コンポーネント変換部11、ウェーブレット変換部12、量子化部13、ビットモデリング部14、算術符号化部15、及び多重化部16により構成される。また、認識器23は、背景差分器21及び人物領域判定器22を有し構成される。
ここで、符号化器17を構成する各機能部11〜16の作用は、ISO(International Organization for Standardization)が定める国際標準のひとつであるJPEG2000により規定されており、例えば、文献「JPEG 2000-Image compression fundamentals, standards and practice」、D.S.Taubman,M.W.Marcellin共著,Kluwer Academic Publishers,2002出版に記載されている。
コンポーネント変換部11は、入力される撮像画像(画像信号)にコンポーネント変換を施す。具体的には、コンポーネント変換部11は、撮像画像をタイル毎にコンポーネント変換し、赤緑青の3成分であるRGB信号から、輝度成分と2つの色差成分であるYUV信号に変換する。ここで、タイルとは、画像全体を分割することで得られる互いに隣接するN×N画素(Nは任意の自然数)の矩形領域であり、例えばこのタイルを符号化単位として符号化器17にて画像信号が符号化される。コンポーネント変換部11は、コンポーネント変換した撮像信号を背景差分器21に供給する。
背景差分器21は、コンポーネント変換された撮像画像から人物画像を得るためのものであり、図2に示すように差分器32と蓄積器33を有する。
蓄積器33には、予め被写体(人物)が居ない状況で撮影された背景画像P2が蓄積されている。差分器32は、被写体と背景が共に写っている撮像画像P1の画素値から、蓄積器33に蓄積されている背景画像P2の画素値を、全画素について対応する画素毎に引き算し、撮像画像P1から背景画像成分が除去された人物画像P3を生成する。つまり、背景画像成分を除去することで撮像画像P1から人物画像P3を分離する。生成された人物画像P3は、ウェーブレット変換部12に供給される。
ここで、撮像画像P1はリアルタイムに撮像され、コンポーネント変換部11を経て背景差分器21に随時供給されている。したがって、リアルタイムに撮像される撮影画像P1に基づく人物画像P3も随時生成される。
背景差分器21の蓄積器33にストアされている背景画像P2は、JPEG2000規格に準拠した符号化器17におけるウェーブレット変換部12、量子化部13、ビットモデリング部14、算術符号化部15、及び多重化部16で適宜処理を施すことにより符号化され、圧縮データとして符号化器17(画像通信装置1)から送信される。
一方、受信側の画像通信装置2は、JPEG2000規格に準拠して符号化され伝送された背景画像に係る圧縮データを受信し、それをJPEG2000規格に準拠した復号器18により再生(復号)する。そして、復号器18により再生された背景画像は、背景画像の蓄積加算器24に蓄積される。
このようにして、送信側及び受信側の画像通信装置1、2において、同じ背景画像P2がそれぞれ蓄積される。なお、背景画像P2は、蓄積したものを継続して使用するようにしても良いが、被写体(人物)がいないときに撮影を行い、蓄積しておく背景画像を適宜更新するようにしても良い。背景画像を適宜更新するようにした場合には、日照や照明の変化に応じた、より画質の良好な画像通信が可能になる。
また、図2を参照して説明したようにして、背景差分器21にてリアルタイムに生成される人物画像P3は、JPEG2000規格に準拠した符号化器17におけるウェーブレット変換部12、量子化部13、ビットモデリング部14、算術符号化部15、及び多重化部16で適宜処理を施すことにより符号化され、圧縮データとして符号化器17(画像通信装置1)から送信される。なお、符号化器17による人物画像P3の符号化処理は、後述する人物領域判定器22からフィードバックされる判定結果に基づいて行われる。
一方、受信側の画像通信装置2は、JPEG2000規格に準拠して符号化され伝送された人物画像に係る圧縮データを受信し、それを復号器18により再生(復号)する。そして、背景画像の蓄積加算器24により、予め蓄積されている背景画像と、復号器18で再生された人物画像とを加算して再生画像を生成する。生成された再生画像は、図示しない画像表示装置に供給され投影(再生表示)される。
上述したように、背景画像P2については予め画像通信装置1、2の双方に蓄積しておき、画像通信装置1、2との間での通常の画像通信においては、背景差分器21で生成される人物画像P3のみをリアルタイムに符号化伝送する。これにより、画像通信装置1、2との間で伝送される画像通信に係る通信データの総量が低減される。
なお、符号化器17におけるウェーブレット変換部12は、背景差分器21より供給される画像信号にウェーブレット変換を施し、量子化部13は、ウェーブレット変換して得られたウェーブレット変換係数を量子化処理する。また、ビットモデリング部14及び算術符号化部15は、ビットプレーン単位で符号化を行い、エントロピー符号化を行う。多重化部16は、エントロピー符号化されたデータを多重化して送信する。
次に、認識器23の人物領域判定器22にて行われる判定処理について説明する。
人物領域判定器22は、背景差分器21にて生成された人物画像P3、及びそれに対してウェーブレット変換して得られた画像に基づいて、人物画像P3の人物領域を自動的に判別し、カメラ等の撮像装置と被写体(人物)との距離を推定するものである。
人物領域判定器22は、背景差分器21にて生成された人物画像P3、及びそれに対してウェーブレット変換して得られた画像に基づいて、人物画像P3の人物領域を自動的に判別し、カメラ等の撮像装置と被写体(人物)との距離を推定するものである。
背景差分器21にて生成された人物画像P3は、ウェーブレット変換部12にて、図3に示すようにJPEG2000規格に準拠したウェーブレット変換が複数回適用されることで、複数種類の低周波数画像(図3においては、画像LL1、LL2)が生成される。ここで図3は、ウェーブレット変換による人物画像P3についての多重解像度表現を示す図である。
例えば、人物画像P3に対して、ウェーブレット変換部12によりウェーブレット変換を施すことで、低周波数画像LL1と高周波数画像HL1、LH1、及びHH1が生成される。さらに、低周波数画像LL1に対してウェーブレット変換を施すことで、低周波数画像LL2と高周波数画像HL2、LH2、及びHH2が生成される。
そして、このようにウェーブレット変換して得られた低周波数画像LL1、LL2、…と元の人物画像P3とが、人物領域判定器22に供給される。
そして、このようにウェーブレット変換して得られた低周波数画像LL1、LL2、…と元の人物画像P3とが、人物領域判定器22に供給される。
人物領域判定器22では、図4に示すように、ウェーブレット変換部12から供給される複数種類の低周波数画像(本実施形態では画像LL1、LL2)及び人物画像P3が二値化処理部51でそれぞれ二値化される。
例えば、本実施形態においては、ウェーブレット変換部12から供給される画像について、0から255までの多値で表現されている画素値をある閾値と比較する。その結果、画素値が閾値よりも大きければ、その画素の画素値を1(図4では白)、そうでなければ画素値を0(図4では黒)のように二値化する。ここで、閾値については、例えば最小自乗法に基づく自動閾値選定法が利用可能である。この方法は、二値化の結果として得られる画像と二値化する前の多値画像との二乗誤差が最小となる場合の閾値を得るものであり、下記式に従って最適な閾値を得ることができる。
ここで、kは暫定的な閾値、k*は最終的に得られる最適な閾値である。また、piは画素値がiとなる画素の数を全画素数で割った値、すなわち画素値iの出現確率である。
二値化処理部51により二値化された低周波数画像は、拡大処理部52で原画像サイズ、すなわち人物画像P3と同じサイズにそれぞれ拡大される。
例えば、二値化された画素のサイズを縦横ともに2倍にする場合には、同じ画素値を縦横斜め方向にコピー(複写)する。すなわち、拡大前の画像をx(n1,n2)(n1=0,1,…,N1、及びn2=0,1,…,N2)とし、その画像を縦横ともに2倍に拡大することで、
例えば、二値化された画素のサイズを縦横ともに2倍にする場合には、同じ画素値を縦横斜め方向にコピー(複写)する。すなわち、拡大前の画像をx(n1,n2)(n1=0,1,…,N1、及びn2=0,1,…,N2)とし、その画像を縦横ともに2倍に拡大することで、
が拡大後の画像として得られる。
以上のようにして、人物画像P3及び低周波数画像LL1、LL2に二値化処理及び拡大処理を適宜施した後、これらすべての画像を用いて対応する画素毎に論理和演算を論理和演算部53で行うことにより人物領域が生成される。さらに、判定部54で人物領域を含むタイルが人物領域タイルとして判定される。
このようにして、人物領域であるか否かの判定がタイル毎になされ、判定結果(人物領域であるか否かの情報)が個々のタイルに対応したタイル情報として、量子化部13及び多重化部16へ送られる。
上述した人物領域判定器23での二値化処理については、例えば大津展之,栗田多喜夫,関田巌,“パターン認識理論と応用”,朝倉書店,pp.65〜97,1996.に記載の方法が適用できる。なお、論理和とは二値信号のORを意味する。
ここで、人物画像P3そのものを二値化すると、解像度が高いために人物領域の判定においては、輪郭部分が比較的正確であっても、内部が不正確となる場合がある。言い換えれば、本来は人物領域であっても、背景領域であると誤認識されてしまう場合がある。一方、低周波数画像LL1、LL2を二値化すると、解像度が低いために人物領域の判定においては、内部が比較的正確であっても、輪郭部分が不正確となる場合がある。そこで、本実施形態では、人物画像P3及び低周波数画像LL1、LL2を二値化し、さらに二値化された低周波数画像LL1、LL2を適宜原寸大まで拡大してから、これらの画像の対応する画素について論理和をとることで、被写体の映像(人物画像)がすべて包含されるような人物領域を指定することができる。
また、人物領域判定器22(より詳細には判定部54)では、人物領域と判定したタイルの数(以下、説明の便宜上「人物領域の面積」と称す。)に基づいて、人物の透明度、すなわち人物領域の画像を表示する際の透明度が決定される。
具体的には、人物領域判定器22は、例えば、図5に示すように人物領域の面積が大きければ被写体がカメラに近いと判断し、人物領域の面積が小さければ遠いと判断する。このような判断により推定されるカメラに遠い又は近いといった被写体の状況情報は、図5に示すように被写体像を表示する際の透明度を決定するファクターとして活用される。そのため、被写体とカメラとの状況情報(距離情報)は、個々のタイルに対応するタイル情報として、量子化部13及び多重化部16にフィードバックされる。なお、図5においては、人物領域の面積をタイル数ではなく画素数で示しているが、タイルの大きさ、すなわち1タイル内に存在する画素数は予め定めておくので、タイル数と画素数とは比例している。
そして、人物領域判定器22での判定結果によりタイル情報として記述された透明度に応じて、個々のタイルのビットプレーンの一部のみが、JPEG2000規格に準拠した量子化部13、ビットモデリング部14、算術符号化部15、及び多重化部16により符号化処理され、圧縮データとして符号化器17(画像通信装置1)から送信される。
例えば、図5に示したように、
(1)人物領域の面積が15000画素より大きい場合には、人物がカメラに近いと判断し、透明度は2の0乗と指定される。そして、人物領域内のこのタイルについては、全ビットプレーンが符号化され、送信される。
(2)また、人物領域の面積が10000画素より大きく、かつ15000画素以下の場合には、人物がカメラにやや近いと判断し、透明度は2の(−1)乗と指定される。このタイルについては、最下位ビットであるLSB以外のビットプレーンが符号化される。
(3)また、人物領域の面積が6000画素より大きく、かつ10000画素以下の場合には、人物とカメラとの距離が中間であると判断し、透明度は2の(−2)乗と指定される。このタイルについては、LSB側の2プレーン以外のビットプレーンが符号化される。
(4)また、人物領域の面積が3000画素より大きく、かつ6000画素以下の場合には、人物がカメラからやや遠いと判断し、透明度は2の(−3)乗と指定される。このタイルについては、LSB側の3プレーン以外のビットプレーンが符号化される。
(5)なお、人物領域の面積が3000画素以下の場合は、人物がカメラから遠いと判断し、透明度は2の(−∞)乗、すなわちゼロと指定される。このタイルについては、どのビットプレーンも符号化されない。
(1)人物領域の面積が15000画素より大きい場合には、人物がカメラに近いと判断し、透明度は2の0乗と指定される。そして、人物領域内のこのタイルについては、全ビットプレーンが符号化され、送信される。
(2)また、人物領域の面積が10000画素より大きく、かつ15000画素以下の場合には、人物がカメラにやや近いと判断し、透明度は2の(−1)乗と指定される。このタイルについては、最下位ビットであるLSB以外のビットプレーンが符号化される。
(3)また、人物領域の面積が6000画素より大きく、かつ10000画素以下の場合には、人物とカメラとの距離が中間であると判断し、透明度は2の(−2)乗と指定される。このタイルについては、LSB側の2プレーン以外のビットプレーンが符号化される。
(4)また、人物領域の面積が3000画素より大きく、かつ6000画素以下の場合には、人物がカメラからやや遠いと判断し、透明度は2の(−3)乗と指定される。このタイルについては、LSB側の3プレーン以外のビットプレーンが符号化される。
(5)なお、人物領域の面積が3000画素以下の場合は、人物がカメラから遠いと判断し、透明度は2の(−∞)乗、すなわちゼロと指定される。このタイルについては、どのビットプレーンも符号化されない。
上述のように送信側の画像通信装置1は、人物領域と判定したタイル数に基づいて決定された人物の透明度が2の(−p)乗の場合には、(8−p)個のビットプレーンを符号化し伝送する。一方、それを受信する受信側の画像通信装置2は、人物領域の画像について、{(人物領域の画素値)×(透明度)+(背景画像の画素値)×(1−透明度)}として再生画像を生成する。
なお、上述した説明に用いた画素数の閾値15000、10000、6000、3000は、一例に過ぎず、これら閾値はカメラの解像度やアプリケーションのユーザによって適宜調整すれば良い。
なお、上述のようにして人物領域判定器22での判定結果に応じてタイル情報として記述される透明度は、図6に示すJPEG2000規格に準拠したビットストリームにおいて個々のタイルに対応するタイルパートヘッダのコメント拡張マーカに記述して送信するようにしても良い。
以上、説明したように本実施形態によれば、下記に示すような効果を得ることができる。
従来においてプライバシーコンシャスな画像通信を実現しようとする場合には、符号化器と認識器とを別々に構成することで、ハードウェア規模が大きくなるとともに、およそ倍の処理を要していた。
それに対して、本実施形態では、JPEG2000規格に準拠した符号化器17の内部処理を認識器23にて実行する認識処理にも適用することで、JPEG2000規格に準拠した符号化処理の処理量に加え、僅かに処理量を増加させるだけでプライバシーコンシャスな画像通信を実現することができる。したがって、プライバシーコンシャスな画像通信に係る処理を実現するためのLSIの省電力化が可能になる。
それに対して、本実施形態では、JPEG2000規格に準拠した符号化器17の内部処理を認識器23にて実行する認識処理にも適用することで、JPEG2000規格に準拠した符号化処理の処理量に加え、僅かに処理量を増加させるだけでプライバシーコンシャスな画像通信を実現することができる。したがって、プライバシーコンシャスな画像通信に係る処理を実現するためのLSIの省電力化が可能になる。
また、背景画像を画像通信装置1、2の双方に予め蓄積しておき、装置間で人物領域のみの画像データのみをリアルタイム符号化伝送するので、プライバシーコンシャスな画像通信において送受信されるデータ量が低減することができる。したがって、通信回線を経済的に利用したり、通信コストを低減したりすることが可能になる。
また、JPEG2000規格に準拠した処理を実行するために開発された汎用的なLSIのハードウェアコアを活用できるため、ハードウェア設計の開発期間を短縮することができる。
また、JPEG2000規格に準拠した処理を実行するために開発された汎用的なLSIのハードウェアコアを活用できるため、ハードウェア設計の開発期間を短縮することができる。
具体的には、JPEG2000規格に準拠した符号化器17を用い、当該符号化器17での符号化処理における要素技術を、例えば人物領域の判別やその領域内の画像データの圧縮に活用して、背景領域以外の人物領域のみの画像信号をリアルタイムに符号化伝送するため、装置間で通信すべき通信データの総量を削減することができる。また、符号化器17にてウェーブレット変換された画像を用いて認識器23で人物領域の判定等を行う、つまり符号化器17にて実行されるウェーブレット変換を認識処理のツールとして活用するようにしたので、従来の認識処理において実行していた冗長な処理及びそれを実現するハードウェアを削減でき、消費電力を低減することができる。
従来の認識器では、符号化器とは独立した別の処理として、色変換処理及び直交変換処理を行って特徴量を抽出し、これを基に人物領域を指定していた。それに対して本実施形態では、従来の認識器における色変換処理及び直交変換処理を、符号化器にて実行されるコンポーネント変換処理及びウェーブレット変換処理で代用する。これにより、従来のように符号化器と認識器とを別々に構成して併用する場合に比べて、全体の演算量を削減でき、電力消費量の低減や回路の小型化を図ることができる。
例えば、従来においては認識器と符号化器とを別々に構成することでおよそ2倍の処理を要したのに対し、本実施形態ではJPEG2000符号化器の内部処理を認識処理にも活用することで図7に示すように1.34倍程度の処理増で従来と同様の機能を実現することができる。図7は、本実施形態を適用した画像通信システムにおける圧縮処理及び認識処理に係る演算量の一例を示す図であり、圧縮処理量の平均を1.0とした場合に認識処理量の平均が0.34であることを示している。
例えば、従来においては認識器と符号化器とを別々に構成することでおよそ2倍の処理を要したのに対し、本実施形態ではJPEG2000符号化器の内部処理を認識処理にも活用することで図7に示すように1.34倍程度の処理増で従来と同様の機能を実現することができる。図7は、本実施形態を適用した画像通信システムにおける圧縮処理及び認識処理に係る演算量の一例を示す図であり、圧縮処理量の平均を1.0とした場合に認識処理量の平均が0.34であることを示している。
また、JPEG2000規格に準拠した符号化器17や復号器18を適用することで、JPEG2000規格に準拠した方式用として開発された汎用ハードウェアコアを活用でき、通信装置の開発費及びコストを削減することができる。
また、人物領域判定器22が、人物領域に含まれる画素数に基づいて被写体(人物)とカメラとの距離を推定するようにしたので、比較的単純な処理でカメラに対する被写体の状況情報を識別でき、小型・低消費電力型のプライバシーコンシャスな画像通信システムを構成することができる。
(本発明の他の実施形態)
なお、以上に説明した本実施形態の画像通信装置は、コンピュータのCPU又はMPU、RAM、ROM等で構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現でき、上記プログラムは本発明の実施形態に含まれる。また、コンピュータが上述した実施形態の機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものであり、上記プログラムを記録した記録媒体は本発明の実施形態に含まれる。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
なお、以上に説明した本実施形態の画像通信装置は、コンピュータのCPU又はMPU、RAM、ROM等で構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現でき、上記プログラムは本発明の実施形態に含まれる。また、コンピュータが上述した実施形態の機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものであり、上記プログラムを記録した記録媒体は本発明の実施形態に含まれる。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
また、コンピュータがプログラムを実行し処理を行うことにより、上述の実施形態の機能が実現されるプログラムプロダクトは、本発明の実施形態に含まれる。上記プログラムプロダクトとしては、上述の実施形態の機能を実現するプログラム自体、上記プログラムが読み込まれたコンピュータ、ネットワークを介して通信可能に接続されたコンピュータに上記プログラムを提供可能な送信装置、及び当該送信装置を備えるネットワークシステム等がある。
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)又は他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理のすべて又は一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。
例えば、本実施形態の画像通信装置は、図8に示すようなコンピュータ機能800を有し、そのCPU801により上述した実施形態での動作が実施される。
コンピュータ機能800は、上記図8に示すように、CPU801と、ROM802と、RAM803と、キーボード(KB)809のキーボードコントローラ(KBC)805と、表示部としてのCRTディスプレイ(CRT)810のCRTコントローラ(CRTC)806と、ハードディスク(HD)811及びフレキシブルディスク(FD)812のディスクコントローラ(DKC)807と、ネットワークインタフェースカード(NIC)808とが、システムバス804を介して互いに通信可能に接続された構成としている。
CPU801は、ROM802又はHD811に記憶されたソフトウェア、又はFD812より供給されるソフトウェアを実行することで、システムバス804に接続された各構成部を総括的に制御する。
すなわち、CPU801は、上述したような動作を行うための処理プログラムを、ROM802、HD811、又はFD812から読み出して実行することで、上述した実施形態での動作を実現するための制御を行う。
すなわち、CPU801は、上述したような動作を行うための処理プログラムを、ROM802、HD811、又はFD812から読み出して実行することで、上述した実施形態での動作を実現するための制御を行う。
RAM803は、CPU801の主メモリ又はワークエリア等として機能する。
KBC805は、KB809や図示していないポインティングデバイス等からの指示入力を制御する。
CRTC806は、CRT810の表示を制御する。
DKC807は、ブートプログラム、種々のアプリケーション、ユーザファイル、ネットワーク管理プログラム、及び上記処理プログラム等を記憶するHD811及びFD812とのアクセスを制御する。
NIC808はネットワーク813上の他の装置と双方向にデータをやりとりする。
KBC805は、KB809や図示していないポインティングデバイス等からの指示入力を制御する。
CRTC806は、CRT810の表示を制御する。
DKC807は、ブートプログラム、種々のアプリケーション、ユーザファイル、ネットワーク管理プログラム、及び上記処理プログラム等を記憶するHD811及びFD812とのアクセスを制御する。
NIC808はネットワーク813上の他の装置と双方向にデータをやりとりする。
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
1 画像通信装置(送信側)
2 画像通信装置(受信側)
11 コンポーネント変換部
12 ウェーブレット変換部
13 量子化部
14 ビットモデリング部
15 算術符号化部
16 多重化部
17 符号化器
18 復号器
21 背景差分器
22 人物領域判定器
23 認識器
24 蓄積加算器
2 画像通信装置(受信側)
11 コンポーネント変換部
12 ウェーブレット変換部
13 量子化部
14 ビットモデリング部
15 算術符号化部
16 多重化部
17 符号化器
18 復号器
21 背景差分器
22 人物領域判定器
23 認識器
24 蓄積加算器
Claims (10)
- JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化手段と、
上記符号化手段にてコンポーネント変換された撮像画像から人物画像を分離する画像分離手段と、
上記画像分離手段により分離され、上記符号化手段にてウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定手段とを備え、
上記符号化手段は、上記人物領域判定手段での判定結果に基づいて、上記人物領域だけの画像信号を符号化することを特徴とする画像通信装置。 - 上記人物領域判定手段は、上記画像分離手段により分離された人物画像と、上記符号化手段にてウェーブレット変換を、上記人物画像又は当該ウェーブレット変換により得られる低周波数画像に施して得られた低周波数画像とに基づいて、上記撮像画像における人物領域を判定することを特徴とする請求項1記載の画像通信装置。
- 上記人物領域判定手段は、上記画像分離手段により分離された人物画像と、当該人物画像に上記符号化手段でのウェーブレット変換を複数回適用することで得られる複数の低周波数画像とを、それぞれ二値化し、さらに上記低周波数画像を上記人物画像と同じサイズにそれぞれ拡大して、上記人物画像と上記拡大した複数の低周波数画像との対応する画素についての論理演算により上記撮像画像における人物領域を判定することを特徴とする請求項1記載の画像通信装置。
- 上記人物領域判定手段は、符号化単位であるタイル毎に上記人物領域であるか否かを判定することを特徴とする請求項1〜3の何れか1項に記載の画像通信装置。
- 上記人物領域判定手段は、上記人物領域と判定した領域内に存在する画素数に応じて、当該領域の画像を表示する際の透明度を判定することを特徴とする請求項1〜4の何れか1項に記載の画像通信装置。
- 上記符号化手段は、上記人物領域判定手段により判定された透明度に応じて、画像を構成する個々のタイルのビットプレーンの一部のみに、JPEG2000規格に準拠した量子化、ビットモデリング、算術符号化、及び多重化に係る処理を施して符号化し送信することを特徴とする請求項1〜5の何れか1項に記載の画像通信装置。
- 上記人物領域判定手段により判定された透明度を、JPEG2000規格に準拠した個々のタイルに対応するタイルパートヘッダのコメント拡張マーカに記述して送信することを特徴とする請求項1〜6の何れか1項に記載の画像通信装置。
- JPEG2000規格に準拠して符号化伝送された画像信号を受信して復号するための復号化手段と、
背景画像を予め蓄積し、当該背景画像と上記復号化手段により復号された画像とを加算処理により合成し再生画像を生成する背景画像蓄積加算手段とを備え、
上記復号化手段により復号される画像が上記背景画像とは異なる人物画像であることを特徴とする画像通信装置。 - JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化手段と、
上記符号化手段にてコンポーネント変換された撮像画像から人物画像を分離する画像分離手段と、
上記画像分離手段により分離され、上記符号化手段にてウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定手段と、
上記人物領域判定手段での判定結果に従って上記符号化手段により符号化し伝送された上記人物領域だけの画像信号を受信して復号するための復号化手段と、
上記復号化手段により復号された人物領域の画像と、予め蓄積している背景画像とを加算処理により合成し再生画像を生成する背景画像蓄積加算手段とを備えることを特徴とする画像通信システム。 - JPEG2000規格に準拠した符号化方式に従って画像信号を符号化するための符号化工程と、
上記符号化工程でコンポーネント変換された撮像画像から人物画像を分離する画像分離工程と、
上記画像分離工程にて分離されて上記符号化工程でウェーブレット変換された人物画像に基づいて、上記撮像画像における人物領域とその画像を表示する際の透明度とを判定する人物領域判定工程とを有し、
上記人物領域判定工程での判定結果に基づいて、上記符号化工程では上記人物領域だけの画像信号を符号化することを特徴とする画像通信方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005124961A JP2006304060A (ja) | 2005-04-22 | 2005-04-22 | 画像通信装置、画像通信システム、及び画像通信方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005124961A JP2006304060A (ja) | 2005-04-22 | 2005-04-22 | 画像通信装置、画像通信システム、及び画像通信方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006304060A true JP2006304060A (ja) | 2006-11-02 |
Family
ID=37471798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005124961A Pending JP2006304060A (ja) | 2005-04-22 | 2005-04-22 | 画像通信装置、画像通信システム、及び画像通信方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006304060A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010103963A1 (ja) * | 2009-03-10 | 2010-09-16 | ソニー株式会社 | 情報処理装置および方法、並びに情報処理システム |
-
2005
- 2005-04-22 JP JP2005124961A patent/JP2006304060A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010103963A1 (ja) * | 2009-03-10 | 2010-09-16 | ソニー株式会社 | 情報処理装置および方法、並びに情報処理システム |
JP2010212947A (ja) * | 2009-03-10 | 2010-09-24 | Sony Corp | 情報処理装置および方法、情報処理システム、並びにプログラム |
CN102405642A (zh) * | 2009-03-10 | 2012-04-04 | 索尼公司 | 信息处理设备和方法、及信息处理系统 |
RU2524677C2 (ru) * | 2009-03-10 | 2014-08-10 | Сони Корпорейшн | Устройство и способ обработки информации и система обработки информации |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI669939B (zh) | 用於立方體面圖框的選擇性濾波的方法和裝置 | |
US11115680B2 (en) | Apparatuses and methods for encoding and decoding a panoramic video signal | |
US7792372B2 (en) | Method and apparatus for encoding/decoding image based on region of interest | |
Kim et al. | Hierarchical prediction and context adaptive coding for lossless color image compression | |
JP4575447B2 (ja) | パノラマ画像の動き推定及び補償のために仮想画像領域を生成する方法及び装置 | |
TWI436286B (zh) | 畫像解碼方法及裝置 | |
WO2015024362A1 (zh) | 一种图像处理方法及设备 | |
JP5130381B2 (ja) | 効率的な映像処理のための方法および装置 | |
JP2002531020A (ja) | 立体画像符号化処理におけるフォアグラウンド情報抽出方法 | |
US20070064275A1 (en) | Apparatus and method for compressing images | |
WO2018190199A1 (ja) | 画像処理装置、画像処理システム、情報処理システム及び画像処理方法 | |
WO2023005740A1 (zh) | 图像编码、解码、重建、分析方法、系统及电子设备 | |
EP1227684A2 (en) | Encoding of video signals | |
JP2005519543A (ja) | レイヤ映像符合化のための方法及びシステム | |
WO2006046550A1 (ja) | 画像符号化方法および装置、ならびに画像復号方法および装置 | |
Afsana et al. | Efficient scalable uhd/360-video coding by exploiting common information with cuboid-based partitioning | |
US20070269120A1 (en) | Video image compression using model plus difference image | |
US11196977B2 (en) | Unified coding of 3D objects and scenes | |
CN113810692B (zh) | 对变化和移动进行分帧的方法、图像处理装置及程序产品 | |
JP2006304060A (ja) | 画像通信装置、画像通信システム、及び画像通信方法 | |
JP4934808B2 (ja) | 画像通信装置及び画像通信方法 | |
US6614933B1 (en) | Image processing apparatus and method, and storage medium | |
US11711540B2 (en) | Method for encoding video using effective differential motion vector transmission method in omnidirectional camera, and method and device | |
WO2024093627A1 (zh) | 一种视频压缩方法、视频解码方法和相关装置 | |
US20230105436A1 (en) | Generative adversarial network for video compression |