JP3997406B2 - 画像処理装置および方法、記録媒体、並びにプログラム - Google Patents

画像処理装置および方法、記録媒体、並びにプログラム Download PDF

Info

Publication number
JP3997406B2
JP3997406B2 JP2002230855A JP2002230855A JP3997406B2 JP 3997406 B2 JP3997406 B2 JP 3997406B2 JP 2002230855 A JP2002230855 A JP 2002230855A JP 2002230855 A JP2002230855 A JP 2002230855A JP 3997406 B2 JP3997406 B2 JP 3997406B2
Authority
JP
Japan
Prior art keywords
image
grid
pixel
movement information
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002230855A
Other languages
English (en)
Other versions
JP2004072555A (ja
Inventor
宏 久曽神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002230855A priority Critical patent/JP3997406B2/ja
Publication of JP2004072555A publication Critical patent/JP2004072555A/ja
Application granted granted Critical
Publication of JP3997406B2 publication Critical patent/JP3997406B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置および方法、記録媒体、並びにプログラムに関し、特に、画像を圧縮した後の画像情報量を小さく抑え、かつ、画像の特定範囲の画質を高めることができるようにした、画像処理装置および方法、記録媒体、並びにプログラムに関する。
【0002】
【従来の技術】
近年、画像を圧縮する方式の1つとして、JPEG(Joint Photographic Expert Group)2000が提示されている。JPEG2000は、図1に示されるような、縦のサイズがXであり、横のサイズがYである1枚の画像1を、複数のタイルに分割し、各タイル毎に圧縮をすることが可能な画像エンコード方式である。図1の例の場合、画像1には、オブジェクト10、オブジェクト11、オブジェクト12、およびオブジェクト13が含まれている。
【0003】
次に、図2を参照して、図1の画像1を分割する例を説明する。図2の例では、画像1は、縦に6分割され、横に6分割されて、36個のタイルに分割されている。タイルは、グリッドに沿って区切られる範囲を意味する。図2において、タイルの縦の列の番号を1乃至6とし、横の行の番号をA乃至Fとし、1番左上のタイルをタイルA1と称し、タイルA1の右を順番に、タイルA2、タイルA3、タイルA4、タイルA5、およびタイルA6と称する。また、タイルA1の下を順番に、タイルB1、タイルC1、タイルD1、タイルE1、およびタイルF1と称する。
【0004】
このように、画像を分割し、各タイル毎に圧縮をすることができる。
【0005】
【発明が解決しようとする課題】
しかしながら、画像1の中から、例えば楕円形のオブジェクトであるオブジェクト10の部分だけを切り出した画像を作る場合、このオブジェクト10の大きさは、2個のタイルに収まる大きさであるにも拘わらず、図2に示されるようなタイル分割では、「B3,B4,B5,C3,C4,およびC5」の6つのタイル画像が必要となり、画像情報量を効率的に少なくすることができないという課題があった。
【0006】
本発明はこのような状況に鑑みてなされたものであり、画像を圧縮した後の画像情報量を小さく抑え、かつ、画像の特定範囲の画質を高めることができるようにするものである。
【0007】
【課題を解決するための手段】
本発明の画像処理装置は、所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得手段と、取得手段により取得された位置情報に基づいて、グリッドを移動する移動情報を生成する生成手段と、生成手段により生成された移動情報に基づいて移動されたグリッドにより所定のフレームの画像を複数の領域分割し、移動情報に基づいて移動されたグリッドが画像の画枠に対して基準の位置となるように分割した複数の領域を、それぞれ移動させて再配置することにより、再合成する合成手段と、合成手段により再合成された所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮手段とを備えることを特徴とする。
合成手段は、分割された複数の領域の位置関係が変化するようにそれぞれ移動させて再配置することができる。
【0008】
圧縮手段は、取得手段により取得された位置情報により指定される特定領域を内包するようにタイルの形および大きさを設定し、所定のフレームの画像を、形および大きさを設定したタイル毎に分割し、圧縮するようにすることができる。
【0009】
圧縮手段は、特定の範囲の画像が含まれるタイルに対して、特定の範囲の画像が含まれないタイルとは異なるアルゴリズムで圧縮するようにすることができる。
【0010】
圧縮手段は、特定の範囲の画像が含まれるタイルに対して、特定の範囲が含まれないタイルとは異なる解像度で圧縮するようにすることができる。
生成手段により生成される移動情報は、画像の画枠に対して基準の位置となるグリッドの座標を含み、合成手段は、画像を、移動情報に含まれる座標において、画像の縦方向および画像の横方向にそれぞれ2分割し、得られた4つの矩形領域を、それぞれ移動させて再配置することにより、再合成するようにすることができる。
合成手段は、画像全体を分割し、4つの矩形領域として、座標に位置する第1の画素の左上方向に隣りの画素を右下端とする矩形領域である第1の領域、第1の画素の上方向に隣りの画素を左下端とする矩形領域である第2の領域、第1の画素の左方向に隣りの画素を右上端とする矩形領域である第3の領域、並びに、第1の画素を左上端とする矩形領域である第4の領域を得ると、第1の画素が画像全体の左上端となるように第4の領域を移動させ、第1の領域の左上端の画素が第4の領域の右下端の画素である第2の画素の右下方向に隣の画素となるように第1の領域を移動させ、第2の領域の右上端の画素が第2の画素の下方向に隣の画素となるように第2の領域を移動させ、第3の領域の左下端の画素が第2の画素の右方向に隣の画素となるように第3の領域を移動させ、各領域を再配置するようにすることができる。
【0011】
本発明の画像処理方法は、所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得ステップと、取得ステップの処理により取得された位置情報に基づいて、グリッドを移動する移動情報を生成する生成ステップと、生成ステップの処理により生成された移動情報に基づいて移動されたグリッドにより所定のフレームの画像を複数の領域分割し、移動情報に基づいて移動されたグリッドが画像の画枠に対して基準の位置となるように分割した複数の領域を、それぞれ移動させて再配置することにより、再合成する合成ステップと、合成ステップの処理により再合成された所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮ステップとを含むことを特徴とする。
【0012】
本発明の記録媒体に記録されているプログラムは、所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得ステップと、取得ステップの処理により取得された位置情報に基づいて、グリッドを移動する移動情報を生成する生成ステップと、生成ステップの処理により生成された移動情報に基づいて移動されたグリッドにより所定のフレームの画像を複数の領域分割し、移動情報に基づいて移動されたグリッドが画像の画枠に対して基準の位置となるように分割した複数の領域を、それぞれ移動させて再配置することにより、再合成する合成ステップと、合成ステップの処理により再合成された所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮ステップとを含むことを特徴とする。
【0013】
本発明のプログラムは、所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得ステップと、取得ステップの処理により取得された位置情報に基づいて、グリッドを移動する移動情報を生成する生成ステップと、生成ステップの処理により生成された移動情報に基づいて移動されたグリッドにより所定のフレームの画像を複数の領域分割し、移動情報に基づいて移動されたグリッドが画像の画枠に対して基準の位置となるように分割した複数の領域を、それぞれ移動させて再配置することにより、再合成する合成ステップと、合成ステップの処理により再合成された所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮ステップとを含む処理をコンピュータに実行させることを特徴とする。
【0014】
本発明の画像処理装置および方法、記録媒体、並びにプログラムにおいては、所定のフレームの画像の中の特定領域の画像を指定する位置情報が取得され、取得された位置情報に基づいて、グリッドを移動する移動情報が生成され、生成された移動情報に基づいて移動されたグリッドにより所定のフレームの画像が複数の領域分割され、移動情報に基づいて移動されたグリッドが画像の画枠に対して基準の位置となるように分割した複数の領域が、それぞれ移動されて再配置されることにより、再合成され、再合成された所定のフレームの画像が複数のタイルに分割され、圧縮される。
【0015】
【発明の実施の形態】
図3は、本発明を適用した画像変換装置50の構成例を示すブロック図である。画像変換装置50は、エンコーダ71、位置指定部72、および記憶部73により構成されている。
【0016】
位置指定部72は、ユーザの指令に基づいて供給されてきた位置情報(例えば、ユーザにより、マウスなどから入力された位置に対応する情報)に対して、位置を指定するための、グリッド移動情報92を生成する。例えば、後述する図4のオブジェクト10がROI(Region of Interest)(切り出したい画像、すなわち、注目領域)として、ユーザにより指定されたとすると、位置指定部72は全体の画像に対するROIの移動情報を生成する。タイルは、複数のグリッドから構成される。
【0017】
具体的には、位置指定部72は、図4に示される所定のフレームの画像1(図2に示される画像1と同一の画像)に対して、左上頂点を原点0として、横方向にx軸を設定し、縦方向にy軸を設定し、画像1内の全ての画素の座標を(x,y)の形で表わす。このとき、0≦x≦Xかつ、0≦y≦Yとする。ここで、ユーザにより指令された、切り出したいROI(図4の例の場合、オブジェクト10)の座標のうち、x軸とy軸に関してそれぞれ最小値を基準座標として求め、その値を図4に示されるように(Δx,Δy)とする。この、(Δx,Δy)が、グリッド移動情報となる。位置指定部72は、グリッド移動情報92((Δx,Δy))を、エンコーダ71へ供給する。また、位置指定部72は、図5に示されるように、グリッド移動情報92((Δx,Δy))を記憶部73に供給し、記憶させる。
【0018】
図5の例では、画像1に対応するファイル名はtest0とされ、そのグリッド移動情報は、(Δx,Δy)=(20,10)とされている。Image0は、別のファイルの名称であり、そのグリッド移動情報は、(5,7)とされている。図5に示されるように、グリッド移動情報92は、エンコード済画像情報91と1対1に対応する。
【0019】
エンコーダ71は、供給されてきた画像情報(画像データ)を、グリッド移動情報92(位置指定部72から供給されたグリッド移動情報92)を用いて変換した画像をJPEG2000の方式でエンコードし、エンコード済画像情報91として記憶部72に供給し、記憶させる。変換の詳細は、図6と図7を参照して後述する。画像情報は、カメラなどから入力されたものであってもよいし、ハードディスク(図示せず)などに記憶された画像データを再生したものであってもよい。
【0020】
図3に戻って、記憶部73には、エンコーダ71から供給されたエンコード済画像情報92以外に、位置指定部72から供給されたグリッド移動情報92が記憶されている。1つのエンコード済画像情報91には、1つのグリッド移動情報92が対応している。
【0021】
なお、図4の例では、画像1内での注目領域(ROI)をオブジェクト10と指定したが、画像1内の所定の領域(特定範囲)を矩形で指定するようにしてもよい。また、例えば、ビデオカメラで撮影した映像のように、画像が連続している場合(または動画の場合)には、画像毎や、シーンチェンジの度に範囲を指定し直してもよい。勿論、全ての画像1に対して共通する、ある特定範囲を指定してもよい。
【0022】
さらに、例えば、スタジオでニュースを読むキャスターの映像が流れている場合などにおいては、そのキャスターの背景の画像はほとんど変化することなく、キャスターの顔周辺の画像のみが、時刻の経過とともに変化する。このような場合、前の画像との差分を取りながら、値が大きく変化している範囲を注目領域(特定範囲)として自動的に選び出すようにすることもできる。これは、動きが激しい部分には、重要な情報が含まれているという仮定に基づいているが、画像の種類によっては、効果的に画像を圧縮することが可能となる。
【0023】
次に、図6と図7のフローチャートを参照して、画像変換装置50における処理について説明する。なお、この処理は、ユーザにより図4の画像1の圧縮が指令されたとき開始される。
【0024】
ステップS1において、位置指定部72は、ユーザからの指示に基づいて、ROIを指定する位置情報を取得する。
【0025】
ステップS2において、位置指定部72は、位置情報からグリッド移動情報92を演算する。例えば、図4のオブジェクト10がROIとしてユーザにより指定された場合、位置指定部72は、ROIの基準座標を、ROIの最小値として求める。図4の例の場合、グリッド移動情報92は、例えば、(Δx,Δy)=(20,10)として求められる。このグリッド移動情報92は、エンコーダ71に供給される。
【0026】
ステップS3において、エンコーダ71は、y=0と初期設定する。
【0027】
ステップS4において、エンコーダ71は、x=0と初期設定する。
【0028】
ステップS5において、エンコーダ71は、Δx≦xかつΔy≦yであるか否かを判定する。いまの例の場合、ステップS3とステップS4の処理によりy=0,x=0とされ、(Δx,Δy)=(20,10)であるため、Δx≦xでもなく、Δy≦yでもない。そのため、NOと判定される。
【0029】
ステップS5において、Δx≦xかつΔy≦yでないと判定された場合、処理は、ステップS7に進み、エンコーダ71は、Δx≦xであるか否かを判定する。いまの例の場合、ステップS4の処理によりx=0とされ、(Δx,Δy)=(20,10)であるため、NOと判定される。
【0030】
ステップS7において、Δx≦xではないと判定された場合、処理はステップS9に進み、エンコーダ71は、Δy≦yであるか否かを判定する。いまの例の場合、ステップS3の処理によりy=0とされ、(Δx,Δy)=(20,10)であるため、NOと判定される。
【0031】
ステップS9において、Δy≦yでないと判定された場合、処理はステップS11に進み、エンコーダ71は、m=x+X−Δx,n=y+Y−Δyと設定する。例えば、X=50,Y=35とすると、いまの例の場合、(x,y)=(0,0)であり、(Δx,Δy)=(20,10)であるため、(m,n)=(50−20,35−10)、すなわち、(m,n)=(30,25)と設定される。
【0032】
ステップS11の後、ステップS12に進み、エンコーダ71は、座標(x,y)の画素を、座標(m,n)の画素として出力する。いまの例の場合、(x,y)=(0,0)の画素情報が、座標(m,n)=(30,25)の画素情報として出力される。
【0033】
すなわち、ステップS11の処理は、Δx≦xでもなく、Δy≦yでもない場合(ステップS5,ステップS7,ステップS9が全てNOである場合)、座標(x,y)の画素を座標(x+X−Δx,y+Y−Δy)に移動させることを意味する。
【0034】
ステップS13において、エンコーダ71は、x<Xであるか否かを判定する。例えば、X=50であるとすると、いまの例の場合、x=0であるため、YESと判定される。ステップS13において、x<Xであると判定された場合、処理はステップS14に進み、x=x+1と設定される。すなわち、(x,y)=(1,0)とされ、処理はステップS5に戻る。
【0035】
再び、ステップS5において、エンコーダ71は、Δx≦xかつΔy≦yであるか否かを判定する。いまの例の場合、ステップS14の処理により(x,y)=(1,0)とされ、(Δx,Δy)=(20,10)とされるため、NOと判定される。その後、同様の処理が繰り返され、ステップS14の処理により、xに1づつ加算され(x=x+1され)、x=20になるまで同様の処理が繰り返される。ステップS14の処理により、x=20と設定された場合、ステップS7において、Δx≦xであると判定される。
【0036】
その後、処理は、ステップS8に進み、エンコーダ71は、(m,n)=(x−Δx,y+Y−Δy)と設定する。いまの例の場合、x=20と設定されたため(ステップS14)、(x,y)=(20,0)であり、(m,n)=(20−20,0+35−10)、すなわち、(m,n)=(25)とされる。ステップS9の処理の後、ステップS12に進み、座標(x,y)=(20,0)の画素は、座標(m,n)=(25)の画素として出力される。
【0037】
すなわち、ステップS8の処理は、Δx≦xであり、Δy≦yでない場合(ステップS5においてNOとされ、ステップS7においてYESとされる場合)、座標(x,y)の画素を座標(x−Δx,y+Y−Δy)に移動させることを意味する。
【0038】
ステップS12の処理の後、ステップS13に進み、再び、エンコーダ71は、x<Xであるか否かを判定する。いまの例の場合、x=20であるため、YESと判定され、処理はステップS14に進み、x=50になるまで同様の処理が繰り返される。これにより、y=0における横軸全ての画素が出力される。
【0039】
ステップS14において、x=50と設定された場合、上述した処理と同様の処理がステップS12まで繰り返され、ステップS13において、x<Xでないと判定される(x=50,X=50であるため)。ステップS13において、x<Xでないと判定された場合、処理はステップS15に進み、エンコーダ71は、y<Yであるか否かを判定する。いまの例の場合、Y=35であり、y=0であるため、YESと判定される。ステップS15において、y<Yであると判定された場合、処理はステップS16に進み、y=y+1と設定される(yに1が加算される)。すなわち、(x,y)=(50,1)とされ、処理はステップS4に戻る。
【0040】
その後、ステップS4において、エンコーダ71は、x=0とする。以下、同様の処理が繰り返され、再度、x=50となったとき(いまの例の場合、y=1である)、ステップS15において、y=y+1とされ、y=2となる。以下、ステップS16の処理によりy=10とされるまで、同様の処理が繰り返される。ステップS16の処理により、y=10と設定された場合、ステップS9において、Δy≦yであると判定される。
【0041】
ステップS9において、Δy≦yであると判定された場合、処理はステップS10に進み、エンコーダ71は、(m,n)=(x+X−Δx,y−Δy)と設定する。例えば、y=10,x=0であるとすると、(m,n)=(0+50−20,10−10)、すなわち、(m,n)=(30,)とされる。その後、処理はステップS12に進み、同様の処理が繰り返され、x=20とされたとき(y=10)、ステップS5において、Δx≦xかつ、Δy≦yであると判定され、処理はステップS6に進む。
【0042】
すなわち、ステップS10の処理は、Δx≦xではなく、Δy≦yである場合(ステップS5とステップS7においてNOとされ、ステップS9においてYESとされる場合)、座標(x,y)の画素を座標(x+X−Δx,y−Δy)に移動させることとを意味する。
【0043】
ステップS6において、エンコーダ71は、(m,n)=(x−Δx,y−Δy)と設定する。いまの例の場合、(x,y)=(2010)であるため、(m,n)=(20−2010−10)となり、(m,n)=()となる。その後、処理はステップS12に進み、座標(x,y)=(2010)の画素は、座標()の画素として出力される。
【0044】
すなわち、ステップS6の処理は、Δx≦xであり、かつ、Δy≦yである場合(ステップS5においてYESと判定される場合)、座標(x,y)の画素を座標(x−Δx,y−Δy)に移動させることを意味する。
【0045】
その後、ステップS16の処理によりy=35とされるまで、処理は繰り返される。そして、x=50,y=35とされたとき、ステップS13において、x<Xではないと判定され、さらに、ステップS15において、y<Yではないと判定される。
【0046】
ステップS15において、y<Yではないと判定された場合、処理はステップS17に進み、エンコーダ71は、ステップS12の処理により出力された画素よりなる画像情報をエンコードする。具体的には、ステップS5乃至ステップS16の処理が繰り返し行なわれることにより、図4に示される画像が、図8に示されるような画像として再合成される。すなわち、グリッド移動情報92に基づいて、原画像に対するグリッドの位置が相対的に移動され、移動されたグリッドが画枠に対して基準の位置になるように(画枠に対する位置が、図1における場合と同一の位置となるように)、画像の各領域が分割され、再合成(再配置)される。図8に示されるように、画枠に対するグリッドの位置ではずれてはいないが、画像の分割された領域が再配置されているため、画像の各タイルに分割される範囲は、図1の場合と異なったものとなる。
【0047】
エンコーダ71は、図8に示される画像1を、タイル毎にエンコードする。これにより、オブジェクト10は、2個のタイルのみで構成されることになり、効率的に圧縮することができる。
【0048】
図8に示されるように、図4の画像1が、グリッド移動情報92((x,y)=(20,10))に基づいて移動された結果、図4における、0≦xΔx、かつ、0≦yΔyの範囲の領域R1、Δxx≦X、かつ、0≦yΔyの範囲の領域R2、0≦xΔx、かつ、Δy≦y≦Yの範囲の領域R3、または、Δxx≦X、かつ、Δy≦y≦Yの範囲の領域R4は、図8におけるX−Δx<x≦X、かつ、Y−Δy<y≦Yの範囲の領域、0≦x≦X−Δx、かつ、Y−Δy<y≦Yの範囲の領域、X−Δx<x≦X、かつ、0≦y≦Y−Δyの範囲の領域、または、0≦x≦X−Δx、かつ、0≦y≦Y−Δyの範囲の領域に、それぞれ移動されている。このためオブジェクト13は、オブジェクト13Kとオブジェクト13Jに分けられている。
【0049】
図7に戻って、ステップS18において、エンコーダ71は、エンコードした画像1を記憶部73に出力し、エンコード済画像情報91として記憶させる。
【0050】
このように、図6と図7の処理により、図4の画像1が、グリッド移動情報92((Δx,Δy))に基づいて、(Δx,Δy)だけ移動され、図8の画像1として、分割、再合成され、エンコードされる。これにより、「タイルaI」と「タイルaII」の2個のタイルのみで、ROIとしてのオブジェクト10を表示することが可能となる。このとき、(Δx,Δy)の分のグリッドが移動し、新たに、タイルが生成される。エンコーダ71は、ステップS18において、1枚の画像のデータを、この新たに生成されたタイル(タイル「aI」,「aII」・・・毎にエンコードする。
【0051】
図6と図7の処理によりエンコードされた画像は、デコード後、元の画像に戻すためにグリッド移動情報92が必要となる。そこで、図9に示されるように、エンコード済画像情報91を画像表示装置150に送信する場合、グリッド移動情報92を同時に送信するようにする。これにより、画像表示装置150は、受信したグリッド移動情報92を用いることで、画像情報のデコードを正しく行なうことができる。
【0052】
図9の例では、画像変換装置50と画像表示装置150がネットワーク130を介して、接続されている。画像変換装置50の記憶部73には、図6と図7の処理により、エンコード済画像情報91が記憶されており、さらに、位置指定部72から供給されたグリッド移動情報92が記憶されている。また、画像変換装置50には、ネットワーク130を介して通信する通信部101が備えられている。
【0053】
通信部101は、ユーザからの指令に基づいて、エンコード済画像情報91と、それに対応するグリッド移動情報92を、ネットワーク130を介して、画像表示装置150の通信部161に送信する。
【0054】
画像表示装置150は、通信部161、デコーダ162、および出力部163により構成されている。通信部161は、ネットワーク130を介して、通信し、画像変換装置50から送信されたエンコード済画像情報91と、それに対応するグリッド移動情報92を受信し、デコーダ162に供給する。デコーダ162は、通信部161から供給されたエンコード済画像情報91とそれに対応するグリッド移動情報92を取得してデコードし、画像情報として出力部163に供給する。これにより、画像情報を正しくデコードし、表示することができる。
【0055】
また、画像表示装置150が、このようなエンコード方式(図6と図7のエンコード処理)に対応していない場合、図10に示されるように、画像変換装置50にデコーダ181を設けることにより、デコーダ181でデコードした後(デコーダ181が、エンコード済画像情報91とグリッド移動情報92に基づいて、デコードした後)、画像情報として、通信部101を介して送信することもできる。
【0056】
このとき、図11に示されるように、デコーダ181にデコードさせた後、グリッド移動情報92を必要としない別のフォーマットで、エンコーダ221により再度エンコードさせ、通信部101に、エンコーダ221によりエンコードされた画像情報を、ネットワーク130を介して送信させることも可能である。図11の例においては、エンコーダ221と、デコーダ251は、通常の(上述した方式を用いない)エンコーダとデコーダである。これにより、画像表示装置150が、画像変換装置50による画像変換方法と対応していない場合においても、画像変換装置50側でフォーマットを変更することにより、対応させることができる。
【0057】
以上の処理により、画像の特定範囲(ROI)を切り出す場合に、特定範囲の形や大きさに対応して、グリッドの移動位置を調整し、最小限のタイルを切り出して、圧縮するようにしたので、画像情報量を効率的に少なくすることが可能となる。
【0058】
また、エンコーダ71の圧縮アルゴリズムなどを変更する必要もなく、容易に実行できる。
【0059】
さらに、画像を圧縮した後の画像情報量を小さく抑え、かつ、画像の特定範囲の画質を高めることが可能となる。
【0060】
なお、以上の例では、タイルの大きさを固定としたが、ROIの形や大きさに対応して、グリッドの移動位置を調整するのではなく、タイルの形や大きさを変更することも可能である。例えば、オブジェクト10をROI(注目領域)とした場合、図12に示されるように、タイルのサイズ(グリッド幅)をx方向に2倍し、y方向に1/2倍すると、タイルの面積は、変更前と同じであるが、2個のタイルに跨っていたオブジェクト10が1個のタイルに収まる。これにより、1個のタイルのみで、オブジェクト10が構成されるため、オブジェクト10を切り取る場合、1個のタイル分の画像情報量のみとなり、さらに、効率よく圧縮することができ、もって、画像情報量を減らすことができる。
【0061】
なお、記憶部73にエンコード済画像情報91とグリッド移動情報92を別々に保存したが、例えば、エンコード済画像情報91の最後に1ワード分のデータ領域を追加し、そこにグリッド移動情報92を保存するようにしてもよい。
【0062】
なお、以上の例では、位置指定部72は、オブジェクト10の楕円形内の座標のうち、x軸とy軸に関してそれぞれ最小値を基準座標として求めて、その座標(Δx,Δy)をグリッド移動情報92として設定したが、オブジェクト10の楕円形内の座標のうち、x軸とy軸に関してそれぞれ最大値を基準座標として求めるようにすることもできる。
【0063】
最小値を基準座標として求めて、その座標(Δx,Δy)をグリッド移動情報92と設定した場合、図8に示されるように、グリッドが楕円(オブジェクト10)の左上で接することになるが、最大値を基準座標として求めて、その座標を(Δx,Δy)をグリッド移動情報92と設定した場合、グリッドが楕円の右下で接することになる。
【0064】
また、例えば、x軸を最大値にし、y軸を最小値にして(Δx,Δy)を設定すると、グリッドが楕円(オブジェクト10)の右上で接し、x軸を最小値にし、y軸を最大値にして(Δx,Δy)を設定すると、グリッドが楕円(オブジェクト10)の左下で接することになる。さらに、楕円(オブジェクト10)の重心とタイルの重心を合わせることもでき、楕円がタイルに含まれる範囲であれば、任意の値で(Δx,Δy)を設定することができる。
【0065】
なお、以上の例では、エンコーダ71により出力されたエンコード済画像情報91と、位置指定部72により出力されたグリッド移動情報92を記憶部73に記憶させるようにしたが、必ずしも保存する必要はなく、直接ネットワークに配信するようにすることもできる。
【0066】
また、以上の例では、分割されたタイルに対して、同じアルゴリズム、および同じ解像度でエンコードするモデルを示したが、特定領域に対して異なるエンコードアルゴリズムを適用したり、高解像度での圧縮を行なうようにすることもできる。例えば、図7のステップS17において、エンコーダ71は、ROIとしてのオブジェクト10が含まれる「タイルaI」と「タイルaII」を高解像度で圧縮し、それ以外のタイルを低解像度で圧縮する。これにより、必要以上にファイルサイズが大きくなるのを防ぎ、もって、効率的に圧縮をすることができる。
【0067】
上述した一連の処理は、ハードウエアにより実行させることもできるが、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどの、記録媒体からインストールされる。この場合、例えば、画像変換装置50は、図13に示されるようなパーソナルコンピュータ300により構成される。
【0068】
図13において、CPU(Central Processing Unit)301は、ROM(Read Only Memory)302に記憶されているプログラム、または、記憶部308からRAM(Random Access Memory)303にロードされたプログラムに従って各種の処理を実行する。RAM303にはまた、CPU301が各種の処理を実行する上において必要なデータなどが適宜記憶される。
【0069】
CPU301、ROM302、およびRAM303は、内部バス304を介して相互に接続されている。この内部バス304にはまた、入出力インターフェース305も接続されている。
【0070】
入出力インターフェース305には、キーボード、マウスなどよりなる入力部306、CRT(Cathode Ray Tube),LCD(Liquid Crystal Display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部307、ハードディスクなどより構成される記憶部308、モデム、ターミナルアダプタなどより構成される通信部309が接続されている。通信部309は、衛星回線やCATVを含む各種のネットワークを介しての通信処理を行なう。
【0071】
入出力インターフェース305にはまた、必要に応じてドライブ310が接続され、磁気ディスク321、光ディスク322、光磁気ディスク323、あるいは半導体メモリ324などが適宜装着され、それから読み出されたコンピュータプログラムが、必要に応じて記憶部308にインストールされる。
【0072】
一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用の専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば、汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。
【0073】
この記録媒体は、図13に示されるように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク321(フロッピディスクを含む)、光ディスク322(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク323(MD(Mini Disc)を含む)、半導体メモリ324などによりなるパッケージメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM302や記憶部308が含まれるハードディスクなどで構成される。
【0074】
なお、本明細書において、コンピュータプログラムを記述するステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0075】
【発明の効果】
以上の如く、本発明によれば、画像を圧縮した後の画像情報量を小さく抑え、かつ、画像の特定範囲の画質を高めることができる。
【図面の簡単な説明】
【図1】従来の画像の例を説明する図である。
【図2】図1の画像をタイルに分割したときの例を説明する図である。
【図3】本発明の画像変換装置の構成例を示すブロック図である。
【図4】画像のグリッド移動の例を説明する図である。
【図5】図3の画像変換装置の記憶部に記憶されるグリッド移動情報の例を説明する図である。
【図6】図3の画像変換装置のエンコーダにおける処理を説明するフローチャートである。
【図7】図3の画像変換装置のエンコーダにおける処理を説明するフローチャートである。
【図8】図6と図7の処理により再合成された画像を説明する図である。
【図9】図3の画像変換装置から画像表示装置に情報を送信する例を説明する図である。
【図10】図3の画像変換装置から画像表示装置に情報を送信する例を説明する図である。
【図11】図3の画像変換装置から画像表示装置に情報を送信する例を説明する図である。
【図12】図4の画像のタイルを変更した例を説明する図である。
【図13】パーソナルコンピュータを示すブロック図である。
【符号の説明】
1 画像, 10,11,12,13 オブジェクト, 50 画像変換装置, 71 エンコーダ, 72 位置指定部, 73 記憶部, 91 エンコード済画像情報, 92 グリッド移動情報

Claims (10)

  1. 所定のフレームの画像をグリッドに沿って複数のタイルに分割して圧縮する画像処理装置において、
    前記所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得手段と、
    前記取得手段により取得された位置情報に基づいて、前記グリッドを移動する移動情報を生成する生成手段と、
    前記生成手段により生成された前記移動情報に基づいて移動されたグリッドにより前記所定のフレームの画像を複数の領域分割し、前記移動情報に基づいて移動された前記グリッドが前記画像の画枠に対して基準の位置となるように分割した前記複数の領域を、それぞれ移動させて再配置することにより、再合成する合成手段と、
    前記合成手段により再合成された前記所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮手段と
    を備えることを特徴とする画像処理装置。
  2. 前記合成手段は、前記分割された複数の領域の位置関係が変化するようにそれぞれ移動させて再配置する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記圧縮手段は、前記取得手段により取得された前記位置情報により指定される前記特定領域を内包するようにタイルの形および大きさを設定し、前記所定のフレームの画像を、形および大きさを設定した前記タイル毎に分割し、圧縮する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記圧縮手段は、前記特定の範囲の画像が含まれる前記タイルに対して、前記特定の範囲の画像が含まれない前記タイルとは異なるアルゴリズムで圧縮する
    ことを特徴とする請求項1に記載の画像処理装置。
  5. 前記圧縮手段は、前記特定の範囲の画像が含まれる前記タイルに対して、前記特定の範囲が含まれない前記タイルとは異なる解像度で圧縮する
    ことを特徴とする請求項1に記載の画像処理装置。
  6. 前記生成手段により生成される前記移動情報は、前記画像の画枠に対して基準の位置となるグリッドの座標を含み、
    前記合成手段は、前記画像を、前記移動情報に含まれる前記座標において、前記画像の縦方向および前記画像の横方向にそれぞれ2分割し、得られた4つの矩形領域を、それぞれ移動させて再配置することにより、再合成する
    ことを特徴とする請求項1に記載の画像処理装置。
  7. 前記合成手段は、前記画像全体を分割し、前記4つの矩形領域として、前記座標に位置する第1の画素の左上方向に隣りの画素を右下端とする矩形領域である第1の領域、前記第1の画素の上方向に隣りの画素を左下端とする矩形領域である第2の領域、前記第1の画素の左方向に隣りの画素を右上端とする矩形領域である第3の領域、並びに、前記第1の画素を左上端とする矩形領域である第4の領域を得ると、前記第1の画素が前記画像全体の左上端となるように前記第4の領域を移動させ、前記第1の領域の左上端の画素が前記第4の領域の右下端の画素である第2の画素の右下方向に隣の画素となるように前記第1の領域を移動させ、前記第2の領域の右上端の画素が前記第2の画素の下方向に隣の画素となるように前記第2の領域を移動させ、前記第3の領域の左下端の画素が前記第2の画素の右方向に隣の画素となるように前記第3の領域を移動させ、各領域を再配置する
    ことを特徴とする請求項6に記載の画像処理装置。
  8. 所定のフレームの画像をグリッドに沿って複数のタイルに分割して圧縮する画像処理装置の画像処理方法において、
    前記所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得ステップと、
    前記取得ステップの処理により取得された位置情報に基づいて、前記グリッドを移動する移動情報を生成する生成ステップと、
    前記生成ステップの処理により生成された前記移動情報に基づいて移動されたグリッドにより前記所定のフレームの画像を複数の領域分割し、前記移動情報に基づいて移動された前記グリッドが前記画像の画枠に対して基準の位置となるように分割した前記複数の領域を、それぞれ移動させて再配置することにより、再合成する合成ステップと、
    前記合成ステップの処理により再合成された前記所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮ステップと
    を含むことを特徴とする画像処理方法。
  9. 所定のフレームの画像をグリッドに沿って複数のタイルに分割して圧縮する画像処理装置を制御するプログラムであって、
    前記所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得ステップと、
    前記取得ステップの処理により取得された位置情報に基づいて、前記グリッドを移動する移動情報を生成する生成ステップと、
    前記生成ステップの処理により生成された前記移動情報に基づいて移動されたグリッドにより前記所定のフレームの画像を複数の領域分割し、前記移動情報に基づいて移動された前記グリッドが前記画像の画枠に対して基準の位置となるように分割した前記複数の領域を、それぞれ移動させて再配置することにより、再合成する合成ステップと、
    前記合成ステップの処理により再合成された前記所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮ステップと
    を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。
  10. 所定のフレームの画像をグリッドに沿って複数のタイルに分割して圧縮する画像処理装置を制御するコンピュータに、
    前記所定のフレームの画像の中の特定領域の画像を指定する位置情報を取得する取得ステップと、
    前記取得ステップの処理により取得された位置情報に基づいて、前記グリッドを移動する移動情報を生成する生成ステップと、
    前記生成ステップの処理により生成された前記移動情報に基づいて移動されたグリッドにより前記所定のフレームの画像を複数の領域分割し、前記移動情報に基づいて移動された前記グリッドが前記画像の画枠に対して基準の位置となるように分割した前記複数の領域を、それぞれ移動させて再配置することにより、再合成する合成ステップと、
    前記合成ステップの処理により再合成された前記所定のフレームの画像を複数のタイルに分割し、圧縮する圧縮ステップと
    を含む処理を実行させることを特徴とするプログラム。
JP2002230855A 2002-08-08 2002-08-08 画像処理装置および方法、記録媒体、並びにプログラム Expired - Fee Related JP3997406B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002230855A JP3997406B2 (ja) 2002-08-08 2002-08-08 画像処理装置および方法、記録媒体、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002230855A JP3997406B2 (ja) 2002-08-08 2002-08-08 画像処理装置および方法、記録媒体、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2004072555A JP2004072555A (ja) 2004-03-04
JP3997406B2 true JP3997406B2 (ja) 2007-10-24

Family

ID=32016787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002230855A Expired - Fee Related JP3997406B2 (ja) 2002-08-08 2002-08-08 画像処理装置および方法、記録媒体、並びにプログラム

Country Status (1)

Country Link
JP (1) JP3997406B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8447128B2 (en) 2008-04-07 2013-05-21 Fujifilm Corporation Image processing system
JP2009273117A (ja) * 2008-04-07 2009-11-19 Fujifilm Corp 画像処理システム、画像処理方法、およびプログラム
JP5337969B2 (ja) * 2008-04-08 2013-11-06 富士フイルム株式会社 画像処理システム、画像処理方法、およびプログラム
JP5340091B2 (ja) * 2008-12-19 2013-11-13 キヤノン株式会社 画像符号化装置及びその制御方法
JP5406703B2 (ja) * 2009-12-25 2014-02-05 キヤノン株式会社 画像処理装置及び画像処理方法及び画像形成装置

Also Published As

Publication number Publication date
JP2004072555A (ja) 2004-03-04

Similar Documents

Publication Publication Date Title
WO2019134442A1 (zh) 视频图像编解码方法及设备
US20210211752A1 (en) Transmission of reconstruction data in a tiered signal quality hierarchy
US8842926B2 (en) Method and apparatus for encoding and decoding coding unit of picture boundary
US10244200B2 (en) View-dependent operations during playback of panoramic video
US10574955B2 (en) Re-projecting flat projections of pictures of panoramic video for rendering by application
US6795581B1 (en) Continuous gradation compression apparatus and method, continuous gradation expansion apparatus and method, data processing apparatus and electron device, and memory medium storing programs for executing said methods
CN112204993B (zh) 使用重叠的被分区的分段的自适应全景视频流式传输
US7432983B2 (en) Moving-picture processing method and moving-picture processing apparatus with metadata processing
KR20170118463A (ko) 인코딩 장치, 디코딩 장치 및 이의 제어 방법
JP2003087785A (ja) 動画像符号化データの形式変換方法及び装置
JP2002010216A (ja) 復号化装置及びその制御方法並びに記憶媒体
US6687411B1 (en) Image coding/decoding method and recording medium having program for this method recorded thereon
JP2014183353A (ja) 映像処理装置、映像再生装置、映像処理方法、映像再生方法及び映像処理システム
US20230107834A1 (en) Method and apparatus of adaptive sampling for mesh compression by encoders
JP3997406B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
US20230099405A1 (en) Image data transfer apparatus, image display system, and image data transfer method
JPH1051770A (ja) 画像符号化システム及び方法、及び画像分割システム
CN117280680A (zh) 动态网格对齐的并行方式
JPH0715602A (ja) 画像データ処理装置
JP4546207B2 (ja) 動画編集装置、プログラム、および動画編集方法
JP2022063882A (ja) 情報処理装置および方法、並びに、再生装置および方法
US10592146B2 (en) Data processing systems
JPH07160865A (ja) 静止画再生装置
US20220076485A1 (en) Information processing apparatus and information processing method
WO2024084316A1 (en) V3c syntax extension for mesh compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130817

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees