JP5944078B1 - 情報処理装置及び情報処理方法及び情報処理プログラム - Google Patents
情報処理装置及び情報処理方法及び情報処理プログラム Download PDFInfo
- Publication number
- JP5944078B1 JP5944078B1 JP2016500425A JP2016500425A JP5944078B1 JP 5944078 B1 JP5944078 B1 JP 5944078B1 JP 2016500425 A JP2016500425 A JP 2016500425A JP 2016500425 A JP2016500425 A JP 2016500425A JP 5944078 B1 JP5944078 B1 JP 5944078B1
- Authority
- JP
- Japan
- Prior art keywords
- information
- motion
- macroblocks
- encoded information
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 28
- 238000003672 processing method Methods 0.000 title claims description 5
- 230000033001 locomotion Effects 0.000 claims abstract description 173
- 239000013598 vector Substances 0.000 claims abstract description 78
- 239000000284 extract Substances 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims description 64
- 238000006243 chemical reaction Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 20
- 238000013139 quantization Methods 0.000 claims description 14
- 230000002776 aggregation Effects 0.000 claims description 10
- 238000004220 aggregation Methods 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 53
- 238000003384 imaging method Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 7
- 239000000872 buffer Substances 0.000 description 5
- 101001139126 Homo sapiens Krueppel-like factor 6 Proteins 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000012536 storage buffer Substances 0.000 description 4
- 101000760620 Homo sapiens Cell adhesion molecule 1 Proteins 0.000 description 2
- 101000661816 Homo sapiens Suppression of tumorigenicity 18 protein Proteins 0.000 description 2
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 2
- 102100027867 FH2 domain-containing protein 1 Human genes 0.000 description 1
- 101001060553 Homo sapiens FH2 domain-containing protein 1 Proteins 0.000 description 1
- 101001012154 Homo sapiens Inverted formin-2 Proteins 0.000 description 1
- 102100030075 Inverted formin-2 Human genes 0.000 description 1
- 101150022168 L3MBTL3 gene Proteins 0.000 description 1
- 102100040548 Lethal(3)malignant brain tumor-like protein 3 Human genes 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Abstract
エントロピー復号部(101)と、複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、画像符号化情報から、複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出する。領域抽出部(102)は、エントロピー復号部(101)により抽出された複数の符号化情報に含まれる複数の動きベクトルに基づいて、画像情報内の動きのある領域を動き領域として抽出する。
Description
本発明は、画像情報内で動きのある動き領域を抽出する技術に関する。
カメラで撮影した画像情報の転送負荷の軽減やデータ量の縮小を目的に、動画像を符号化して圧縮し、画像符号化情報を生成する技術が広く使われている。
しかし、画像符号化情報を画像解析する際には復号処理によって符号化する前の画像情報に戻すことが必要である。
特許文献1には、動画像に含まれる人や車などの動物体を検出する解析手法を有する画像処理装置が開示されている。
しかし、画像符号化情報を画像解析する際には復号処理によって符号化する前の画像情報に戻すことが必要である。
特許文献1には、動画像に含まれる人や車などの動物体を検出する解析手法を有する画像処理装置が開示されている。
特許文献1の画像処理装置は、画像符号化情報から画像情報を復号し、復号により得られた画像情報を解析して動物体を検出する。
このように、特許文献1の画像処理装置は、画像情報を復号するため、計算負荷が高いという課題がある。
このように、特許文献1の画像処理装置は、画像情報を復号するため、計算負荷が高いという課題がある。
本発明は、上記の課題を解決することを主な目的としており、画像情報内で動きのある動き領域を抽出する際の計算負荷を低減することを主な目的とする。
本発明に係る情報処理装置は、
複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出するエントロピー復号部と、
前記エントロピー復号部により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出部とを有する。
複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出するエントロピー復号部と、
前記エントロピー復号部により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出部とを有する。
本発明によれば、画像情報を復号することなく、符号化情報に含まれる動きベクトルに基づいて動き領域を抽出するため、動き領域を抽出する際の計算負荷を低減することができる。
実施の形態1.
***構成の説明***
図1は、実施の形態1に係る情報処理装置100の機能構成例を示す。
図1に示すように、情報処理装置100は、エントロピー復号部101、領域抽出部102及び画素値変換部103で構成される。
また、画素値変換部103は、図2に示すように、領域決定部1031、符号化情報演算部1032及び符号化情報画像化部1033で構成される。
なお、後述する情報処理装置100の動作は、情報処理方法及び情報処理プログラムの例に相当する。
***構成の説明***
図1は、実施の形態1に係る情報処理装置100の機能構成例を示す。
図1に示すように、情報処理装置100は、エントロピー復号部101、領域抽出部102及び画素値変換部103で構成される。
また、画素値変換部103は、図2に示すように、領域決定部1031、符号化情報演算部1032及び符号化情報画像化部1033で構成される。
なお、後述する情報処理装置100の動作は、情報処理方法及び情報処理プログラムの例に相当する。
情報処理装置100には、図14に示すように、プロセッサ901、記憶装置902、受信装置903及び送信装置904というハードウェアが含まれる。
記憶装置902には、エントロピー復号部101、領域抽出部102及び画素値変換部103の機能を実現するプログラムが記憶されている。
そして、プロセッサ901がこれらプログラムを実行して、後述するエントロピー復号部101、領域抽出部102及び画素値変換部103の動作を行う。
図14では、プロセッサ901がエントロピー復号部101、領域抽出部102及び画素値変換部103の機能を実現するプログラムを実行している状態を模式的に表している。
受信装置903は、画像符号化情報を受信する。
送信装置904は、画素値情報を、図示していない画像認識装置に送信する。
記憶装置902には、エントロピー復号部101、領域抽出部102及び画素値変換部103の機能を実現するプログラムが記憶されている。
そして、プロセッサ901がこれらプログラムを実行して、後述するエントロピー復号部101、領域抽出部102及び画素値変換部103の動作を行う。
図14では、プロセッサ901がエントロピー復号部101、領域抽出部102及び画素値変換部103の機能を実現するプログラムを実行している状態を模式的に表している。
受信装置903は、画像符号化情報を受信する。
送信装置904は、画素値情報を、図示していない画像認識装置に送信する。
***動作の説明***
次に、図1に示すエントロピー復号部101、領域抽出部102及び画素値変換部103の動作を説明する。
次に、図1に示すエントロピー復号部101、領域抽出部102及び画素値変換部103の動作を説明する。
エントロピー復号部101は、図14に示す受信装置903を介して画像符号化情報を受信し、画像符号化情報に対してエントロピー復号を行い、画像符号化情報から符号化情報を抽出する。
画像符号化情報は、複数のマクロブロックで構成される画像情報がエントロピー符号化されて得られた情報である。
エントロピー復号部101は、エントロピー復号により、画像符号化情報から、複数のマクロブロックに対応して設けられた複数の符号化情報を抽出する。
符号化情報のそれぞれには、少なくとも動きベクトル、マクロブロックタイプ、量子化ステップ、参照画像情報が含まれる。
なお、エントロピー復号部101の動作は、エントロピー復号処理に相当する。
画像符号化情報は、複数のマクロブロックで構成される画像情報がエントロピー符号化されて得られた情報である。
エントロピー復号部101は、エントロピー復号により、画像符号化情報から、複数のマクロブロックに対応して設けられた複数の符号化情報を抽出する。
符号化情報のそれぞれには、少なくとも動きベクトル、マクロブロックタイプ、量子化ステップ、参照画像情報が含まれる。
なお、エントロピー復号部101の動作は、エントロピー復号処理に相当する。
領域抽出部102は、エントロピー復号部101により抽出された複数の符号化情報に含まれる複数の動きベクトルをマクロブロックの順序に従って配置し、複数の動きベクトルの位置に基づいて、画像情報内の動きのある領域を動き領域として抽出する。
動き領域は、画像情報において動物体が描画される領域である。
領域抽出部102は、より具体的には、複数の動きベクトルのうち近接する位置に配置されている2以上の動きベクトルを統合し、統合後の動きベクトルの位置に基づいて動き領域を抽出する。
なお、領域抽出部102の動作は、領域抽出処理に相当する。
動き領域は、画像情報において動物体が描画される領域である。
領域抽出部102は、より具体的には、複数の動きベクトルのうち近接する位置に配置されている2以上の動きベクトルを統合し、統合後の動きベクトルの位置に基づいて動き領域を抽出する。
なお、領域抽出部102の動作は、領域抽出処理に相当する。
画素値変換部103は、領域抽出部102により抽出された動き領域を構成するマクロブロックに対応する符号化情報を取得し、取得した符号化情報の動きベクトル、マクロブロックタイプ、量子化ステップ、参照画像情報とのうちの少なくともいずれかを画素値に変換する。
そして、画素値変換部103は、符号化情報から変換された画素値を画素ごとに示す画素値情報を、図14に示す送信装置904を介して、画像認識装置に送信する。
なお、画素値変換部103による符号化情報の画素値への変換を、符号化情報の画像化ともいう。
前述したように、画素値変換部103は、図2に示す領域決定部1031、符号化情報演算部1032及び符号化情報画像化部1033で構成されるが、領域決定部1031、符号化情報演算部1032及び符号化情報画像化部1033の詳細は後述する。
そして、画素値変換部103は、符号化情報から変換された画素値を画素ごとに示す画素値情報を、図14に示す送信装置904を介して、画像認識装置に送信する。
なお、画素値変換部103による符号化情報の画素値への変換を、符号化情報の画像化ともいう。
前述したように、画素値変換部103は、図2に示す領域決定部1031、符号化情報演算部1032及び符号化情報画像化部1033で構成されるが、領域決定部1031、符号化情報演算部1032及び符号化情報画像化部1033の詳細は後述する。
図3は、エントロピー復号部101により画像符号化情報に対してエントロピー復号が行われて得られる情報を示す。
エントロピー復号により、画像符号化情報から、ヘッダ情報、符号化情報及び符号化テクスチャ情報が得られる。
ヘッダ情報、符号化情報及び符号化テクスチャ情報は、画像情報を構成するマクロブロックごとに設けられている。
ヘッダ情報は、例えば、H.264符号化におけるSPS(Sequence Parameter Set:シーケンスレベルの符号化情報)やPPS(Picture Parameter Set:ピクチャレベルの符号化情報)を示す。
符号化情報には、マクロブロックタイプ、量子化ステップ、画面内予測モード、参照画像情報、動きベクトル、画面内予測コスト、画面間予測コスト及びマクロブロック符号量というパラメータが含まれる。
本実施の形態では、マクロブロックタイプ、量子化ステップ、動きベクトル、参照画像情報を画素値の変換に利用可能である。
符号化テクスチャ情報は、符号化されている画像情報である。
符号化テクスチャ情報に対する復号処理によりマクロブロック単位で画像情報が得られる。
従来技術では、符号化テクスチャ情報に対する復号処理により画像情報を得て、画像情報を解析することで、画像情報内の動き領域を抽出する。
本実施の形態では、符号化テクスチャ情報に対する復号処理を行わずに、領域抽出部102が、符号化情報に含まれる動きベクトルを解析し、画像情報内の動き領域を抽出する。
エントロピー復号により、画像符号化情報から、ヘッダ情報、符号化情報及び符号化テクスチャ情報が得られる。
ヘッダ情報、符号化情報及び符号化テクスチャ情報は、画像情報を構成するマクロブロックごとに設けられている。
ヘッダ情報は、例えば、H.264符号化におけるSPS(Sequence Parameter Set:シーケンスレベルの符号化情報)やPPS(Picture Parameter Set:ピクチャレベルの符号化情報)を示す。
符号化情報には、マクロブロックタイプ、量子化ステップ、画面内予測モード、参照画像情報、動きベクトル、画面内予測コスト、画面間予測コスト及びマクロブロック符号量というパラメータが含まれる。
本実施の形態では、マクロブロックタイプ、量子化ステップ、動きベクトル、参照画像情報を画素値の変換に利用可能である。
符号化テクスチャ情報は、符号化されている画像情報である。
符号化テクスチャ情報に対する復号処理によりマクロブロック単位で画像情報が得られる。
従来技術では、符号化テクスチャ情報に対する復号処理により画像情報を得て、画像情報を解析することで、画像情報内の動き領域を抽出する。
本実施の形態では、符号化テクスチャ情報に対する復号処理を行わずに、領域抽出部102が、符号化情報に含まれる動きベクトルを解析し、画像情報内の動き領域を抽出する。
次に、領域抽出部102の動作例を説明する。
領域抽出部102は、複数のマクロブロックに対応する複数の符号化情報に含まれる複数の動きベクトルをマクロブロックの順序に従って配置する。
そして、領域抽出部102は、マクロブロックの順序に従って配置された複数の動きベクトルの位置に基づいて動き領域を抽出する。
動き領域は動きベクトルの有無、動きベクトル同士の距離によって決定される。
領域抽出部102は、近接する位置に配置されている2以上の動きベクトルを統合する。
つまり、領域抽出部102は、相互間の距離が閾値TH_DIST以下の2以上の動きベクトルを包含する領域を候補領域として指定する。
そして、領域抽出部102は、面積が閾値TH_RANGE以上の候補領域を動き領域として抽出する。
一方、領域抽出部102は、閾値TH_RANGE未満の面積の候補領域はノイズとみなして破棄する。
そして、領域抽出部102は、マクロブロックの順序に従って配置された複数の動きベクトルの位置に基づいて動き領域を抽出する。
動き領域は動きベクトルの有無、動きベクトル同士の距離によって決定される。
領域抽出部102は、近接する位置に配置されている2以上の動きベクトルを統合する。
つまり、領域抽出部102は、相互間の距離が閾値TH_DIST以下の2以上の動きベクトルを包含する領域を候補領域として指定する。
そして、領域抽出部102は、面積が閾値TH_RANGE以上の候補領域を動き領域として抽出する。
一方、領域抽出部102は、閾値TH_RANGE未満の面積の候補領域はノイズとみなして破棄する。
図4及び図5は、領域抽出部102の動作の概要を示す。
領域抽出部102は、画像情報の1フレーム分の符号化情報を取得する。
図4の(a)では、各列が1つのマクロブックの符号化情報のパラメータを表している。
すなわち、動きベクトルMV1、マクロブロックタイプMBT1、量子化ステップST1、参照画像情報INF1が、マクロブロックMB1の符号化情報のパラメータである。
同様に、動きベクトルMV2、マクロブロックタイプMBT2、量子化ステップST2、参照画像情報INF2が、マクロブロックMB2の符号化情報のパラメータである。
マクロブロックMB3以降についても同様である。
次に、図4の(b)に示すように、領域抽出部102は、動きベクトルを、マクロブロックの順に配置する。
更に、図5の(a)に示すように、領域抽出部102は、相互間の距離が閾値TH_DIST以下の動きベクトルを1つの候補領域にまとめる。
そして、図5の(b)に示すように、領域抽出部102は、面積が閾値TH_RANGE以上の候補領域を動き領域として抽出する。
図4の(a)では、各列が1つのマクロブックの符号化情報のパラメータを表している。
すなわち、動きベクトルMV1、マクロブロックタイプMBT1、量子化ステップST1、参照画像情報INF1が、マクロブロックMB1の符号化情報のパラメータである。
同様に、動きベクトルMV2、マクロブロックタイプMBT2、量子化ステップST2、参照画像情報INF2が、マクロブロックMB2の符号化情報のパラメータである。
マクロブロックMB3以降についても同様である。
次に、図4の(b)に示すように、領域抽出部102は、動きベクトルを、マクロブロックの順に配置する。
更に、図5の(a)に示すように、領域抽出部102は、相互間の距離が閾値TH_DIST以下の動きベクトルを1つの候補領域にまとめる。
そして、図5の(b)に示すように、領域抽出部102は、面積が閾値TH_RANGE以上の候補領域を動き領域として抽出する。
図6は、領域抽出部102の動作例を示すフローチャート図である。
領域抽出部102は、まず、エントロピー復号部101によって抽出された1フレーム分の符号化情報の動きベクトルをマクロブロックの順に配置する(ST11)。
すなわち、領域抽出部102は、1フレーム分の動きベクトルを、画像情報が復号された場合の動きベクトルの配置と同様に配置する。
すなわち、領域抽出部102は、1フレーム分の動きベクトルを、画像情報が復号された場合の動きベクトルの配置と同様に配置する。
次に、領域抽出部102は、配置された全ての動きベクトルを調査済みか否かを判定する(ST12)。
未調査の動きベクトルが存在する場合(ST12でNO)は、領域抽出部102は、調査対象の動きベクトルを選択する(ST13)。
次に、領域抽出部102は、ST13で選択した動きベクトルと、当該動きベクトルの近傍の動きベクトルとの距離が閾値TH_DIST以下であるかを判定する(ST14)。
ST13で選択した動きベクトルと近傍の動きベクトルとの距離が閾値TH_DIST以下である場合(ST14でYES)は、領域抽出部102は、ST13で選択した動きベクトルと近傍の動きベクトルを包含する領域を候補領域に指定し、候補領域を領域格納バッファに格納する。
なお、領域格納バッファは、図14に示す記憶装置902に構成される。
次に、領域抽出部102は、領域格納バッファに格納されている候補領域のうち、相互に重なっている2以上の候補領域を1つの候補領域にまとめる(ST16)。
未調査の動きベクトルが存在する場合(ST12でNO)は、領域抽出部102は、調査対象の動きベクトルを選択する(ST13)。
次に、領域抽出部102は、ST13で選択した動きベクトルと、当該動きベクトルの近傍の動きベクトルとの距離が閾値TH_DIST以下であるかを判定する(ST14)。
ST13で選択した動きベクトルと近傍の動きベクトルとの距離が閾値TH_DIST以下である場合(ST14でYES)は、領域抽出部102は、ST13で選択した動きベクトルと近傍の動きベクトルを包含する領域を候補領域に指定し、候補領域を領域格納バッファに格納する。
なお、領域格納バッファは、図14に示す記憶装置902に構成される。
次に、領域抽出部102は、領域格納バッファに格納されている候補領域のうち、相互に重なっている2以上の候補領域を1つの候補領域にまとめる(ST16)。
一方、ST12において、全ての動き領域の調査が完了している場合(ST12でYES)は、領域抽出部102は、領域格納バッファ内の候補領域のうち、面積が閾値TH_RANGE未満の候補領域を破棄する(ST17)。
換言すれば、領域抽出部102は、面積が閾値TH_RANGE以上の候補領域を動き領域として抽出する。
次に、領域抽出部102は、抽出した動き領域に対応する符号化情報を符号化情報バッファに格納する(ST18)。
すなわち、領域抽出部102は、ST17で抽出した動き領域を構成するマクロブロックに対応する符号化情報を符号化情報バッファに格納する。
符号化情報バッファは、図14に示す記憶装置902に構成される。
換言すれば、領域抽出部102は、面積が閾値TH_RANGE以上の候補領域を動き領域として抽出する。
次に、領域抽出部102は、抽出した動き領域に対応する符号化情報を符号化情報バッファに格納する(ST18)。
すなわち、領域抽出部102は、ST17で抽出した動き領域を構成するマクロブロックに対応する符号化情報を符号化情報バッファに格納する。
符号化情報バッファは、図14に示す記憶装置902に構成される。
次に、画素値変換部103を説明する。
図7は、画素値変換部103の動作の概要を示す。
図7は、画素値変換部103の動作の概要を示す。
画素値変換部103は、領域抽出部102により抽出された動き領域を構成するマクロブロックの符号化情報を符号化情報バッファから取得する。
そして、画素値変換部103は、各マクロブロックの符号化情報を画素値に変換する。
画素値変換部103は、例えば、動きベクトルのX方向のノルムとY方向のノルムと、マクロブロックタイプとをRGB空間の画素値に変換する。
そして、画素値変換部103は、変換された画素値をマクロブロックの配置順に従って画素に格納し、画素ごとに画素値が示される画素値情報を生成し、生成した画素値情報を画像認識装置に出力する。
そして、画素値変換部103は、各マクロブロックの符号化情報を画素値に変換する。
画素値変換部103は、例えば、動きベクトルのX方向のノルムとY方向のノルムと、マクロブロックタイプとをRGB空間の画素値に変換する。
そして、画素値変換部103は、変換された画素値をマクロブロックの配置順に従って画素に格納し、画素ごとに画素値が示される画素値情報を生成し、生成した画素値情報を画像認識装置に出力する。
次に、画素値変換部103の構成要素である、領域決定部1031、符号化情報演算部1032及び符号化情報画像化部1033を説明する。
領域決定部1031は、符号化情報の画像化に使用する動き領域の個数を決定する。
符号化情報演算部1032は、領域決定部1031により決定された単数もしくは複数の動き領域の符号化情報に対して演算処理を行うか否かを決定する。
符号化情報演算部1032は、符号化情報に対して演算処理を行う場合は、例えば、以下のような演算処理を行う。
符号化情報演算部1032は、1つの動き領域が使用される場合は、符号化情報のマクロブロックの列ごとの平均値を算出する。
また、符号化情報演算部1032は、複数の動き領域が使用される場合は、符号化情報の動き領域間の平均値を算出する。
また、符号化情報演算部1032は、複数の動き領域が使用される場合は、異なるフレームの画像符号化情報から抽出された動き領域を使用してもよい。
なお、符号化情報演算部1032は、符号化情報に対して演算処理を行わなくてもよい。
符号化情報演算部1032は、符号化情報に対して演算処理を行う場合は、例えば、以下のような演算処理を行う。
符号化情報演算部1032は、1つの動き領域が使用される場合は、符号化情報のマクロブロックの列ごとの平均値を算出する。
また、符号化情報演算部1032は、複数の動き領域が使用される場合は、符号化情報の動き領域間の平均値を算出する。
また、符号化情報演算部1032は、複数の動き領域が使用される場合は、異なるフレームの画像符号化情報から抽出された動き領域を使用してもよい。
なお、符号化情報演算部1032は、符号化情報に対して演算処理を行わなくてもよい。
符号化情報画像化部1033は、符号化情報を画素値に変換する。
つまり、符号化情報画像化部1033は、領域決定部1031及び符号化情報演算部1032で処理された符号化情報の配置を決定し、符号化情報を画素値に変換する。
また、符号化情報画像化部1033は、画素値への変換の際に、画素値情報の送信先の画像認識装置の特性に応じて符号化情報を正規化してもよい。
符号化情報演算部1032は、例えば、動きベクトルとマクロブロックタイプを正規化してもよい。
なお、画素値の形式はカラー、グレースケール、ハイダイナミックレンジなどでもよく、特定の形式に限定されない。
つまり、符号化情報画像化部1033は、領域決定部1031及び符号化情報演算部1032で処理された符号化情報の配置を決定し、符号化情報を画素値に変換する。
また、符号化情報画像化部1033は、画素値への変換の際に、画素値情報の送信先の画像認識装置の特性に応じて符号化情報を正規化してもよい。
符号化情報演算部1032は、例えば、動きベクトルとマクロブロックタイプを正規化してもよい。
なお、画素値の形式はカラー、グレースケール、ハイダイナミックレンジなどでもよく、特定の形式に限定されない。
図8は、本実施の形態に係る画素値変換部103の動作例を示すフローチャート図である。
図8のフローは、図6のST18により動き領域に対応する符号化情報が符号化情報バッファに格納された後に行われる。
図8のフローは、図6のST18により動き領域に対応する符号化情報が符号化情報バッファに格納された後に行われる。
まず、領域決定部1031が、符号化情報の画像化に使用する動き領域を決定する(ST21)。
次に、符号化情報演算部1032が、ST21で決定された動き領域に対して演算処理を行うか否かを判定する(ST22)。
ST22において演算処理を行うと判定した場合は、符号化情報演算部1032は、符号化情報を用いて演算処理を行う(ST23)。
なお、演算処理の例は、図9及び図10を参照して後述する。
ST23の演算処理が行われた後は、ST24が行われる。
一方、ST22において演算処理を行わないと判定した場合は、ST24が行われる。
次に、符号化情報演算部1032が、ST21で決定された動き領域に対して演算処理を行うか否かを判定する(ST22)。
ST22において演算処理を行うと判定した場合は、符号化情報演算部1032は、符号化情報を用いて演算処理を行う(ST23)。
なお、演算処理の例は、図9及び図10を参照して後述する。
ST23の演算処理が行われた後は、ST24が行われる。
一方、ST22において演算処理を行わないと判定した場合は、ST24が行われる。
ST24において、符号化情報画像化部1033が、符号化情報の画素値を算出するか否かを判定する。
符号化情報の画素値を算出する場合は、符号化情報画像化部1033は、符号化情報の画素値を算出する(ST25)。
なお、画素値の算出処理の例は、図11、図12及び図13を参照して後述する。
次に、符号化情報画像化部1033は、ST25で算出した符号化情報の画素値が示される画素値情報を生成し、画素値情報を画像認識装置に送信する(ST26)。
符号化情報の画素値を算出する場合は、符号化情報画像化部1033は、符号化情報の画素値を算出する(ST25)。
なお、画素値の算出処理の例は、図11、図12及び図13を参照して後述する。
次に、符号化情報画像化部1033は、ST25で算出した符号化情報の画素値が示される画素値情報を生成し、画素値情報を画像認識装置に送信する(ST26)。
図9及び図10は、図8のST23で行われる、符号化情報演算部1032による演算処理の例を示す。
図9は、1つの動き領域が使用される場合に、符号化情報演算部1032が、符号化情報のマクロブロックの列ごとの平均値を算出して、情報量を低減する手順を示す。
つまり、図9の例では、符号化情報演算部1032は、(4×4)のマクロブロックに対応する16個の符号化情報を、4個の符号化情報に集約する演算を行っている。
そして、図9の集約演算の後、符号化情報画像化部1033が、集約後の4個の符号化情報をそれぞれ画素値に変換する。
また、図10は、複数の動き領域が使用される場合に、同じ位置にあるマクロブロックで符号化情報の平均値を算出して、情報量を低減する手順を示す。
つまり、図10の例では、符号化情報演算部1032は、2個の動き領域がそれぞれ(4×4)のマクロブロックで構成される場合に、{2×(4×4)}の符号化情報を、(4×4)個の符号化情報に集約する演算を行っている。
そして、図10の集約演算の後、符号化情報画像化部1033が、集約後の16個の符号化情報をそれぞれ画素値に変換する。
つまり、図9の例では、符号化情報演算部1032は、(4×4)のマクロブロックに対応する16個の符号化情報を、4個の符号化情報に集約する演算を行っている。
そして、図9の集約演算の後、符号化情報画像化部1033が、集約後の4個の符号化情報をそれぞれ画素値に変換する。
また、図10は、複数の動き領域が使用される場合に、同じ位置にあるマクロブロックで符号化情報の平均値を算出して、情報量を低減する手順を示す。
つまり、図10の例では、符号化情報演算部1032は、2個の動き領域がそれぞれ(4×4)のマクロブロックで構成される場合に、{2×(4×4)}の符号化情報を、(4×4)個の符号化情報に集約する演算を行っている。
そして、図10の集約演算の後、符号化情報画像化部1033が、集約後の16個の符号化情報をそれぞれ画素値に変換する。
なお、図9では、符号化情報演算部1032は、マクロブロックの列ごとに平均値を算出して符号化情報を集約しているが、別の演算方法によって符号化情報を集約してもよい。
例えば、符号化情報演算部1032は、符号化情報の最大値(又は最小値又は中央値)により符号化情報を集約してもよい。
つまり、符号化情報演算部1032は、領域抽出部102により抽出された動き領域を構成するn個(nは2以上の整数)のマクロブロックに対応するn個の符号化情報をm個(mは1以上の整数であって、nの約数)の符号化情報に集約する演算であれば、どのような演算を行ってもよい。
例えば、符号化情報演算部1032は、符号化情報の最大値(又は最小値又は中央値)により符号化情報を集約してもよい。
つまり、符号化情報演算部1032は、領域抽出部102により抽出された動き領域を構成するn個(nは2以上の整数)のマクロブロックに対応するn個の符号化情報をm個(mは1以上の整数であって、nの約数)の符号化情報に集約する演算であれば、どのような演算を行ってもよい。
同様に、図10では、符号化情報演算部1032は、同じ位置にあるマクロブロックの符号化情報の平均値を算出して符号化情報を集約しているが、別の演算方法によって符号化情報を集約してもよい。
例えば、符号化情報演算部1032は、符号化情報の最大値(又は最小値又は中央値)により符号化情報を集約してもよい。
つまり、符号化情報演算部1032は、領域抽出部102により、それぞれがi個(iは1以上の整数)のマクロブロックで構成されるj個(jは2以上の整数)の動き領域が抽出された場合に、j個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算であれば、どのような演算を行ってもよい。
また、図10では、符号化情報演算部1032は、1つのフレームから抽出されたj個(図10ではj=2)の動き領域について、(i×j)個(図10では、(i×j)=(16×2))の符号化情報をi個(図10では、i=16)の符号化情報に集約する例を示している。
これに対し、符号化情報演算部1032は、過去に領域抽出部102により抽出された、(j―1)個の動き領域を取得してもよい。
つまり、符号化情報演算部1032は、図4のフローの対象となっているフレームとは異なる、過去のフレームから抽出された(j―1)個の動き領域を取得してもよい。
なお、(j―1)個の動き領域は、それぞれがi個のマクロブロックで構成されるものとする。
そして、符号化情報演算部1032は、取得した(j―1)個の動き領域と、領域抽出部102により抽出された動き領域(図4のフローにより抽出された動き領域)とを合わせたj個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行うようにしてもよい。
具体的には、符号化情報演算部1032は、図10と同様に、同じ位置にあるマクロブロックの符号化情報の平均値を算出して符号化情報を集約する。
そして、符号化情報画像化部1033は、この場合も、集約後のi個の符号化情報をそれぞれ画素値に変換する。
例えば、符号化情報演算部1032は、符号化情報の最大値(又は最小値又は中央値)により符号化情報を集約してもよい。
つまり、符号化情報演算部1032は、領域抽出部102により、それぞれがi個(iは1以上の整数)のマクロブロックで構成されるj個(jは2以上の整数)の動き領域が抽出された場合に、j個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算であれば、どのような演算を行ってもよい。
また、図10では、符号化情報演算部1032は、1つのフレームから抽出されたj個(図10ではj=2)の動き領域について、(i×j)個(図10では、(i×j)=(16×2))の符号化情報をi個(図10では、i=16)の符号化情報に集約する例を示している。
これに対し、符号化情報演算部1032は、過去に領域抽出部102により抽出された、(j―1)個の動き領域を取得してもよい。
つまり、符号化情報演算部1032は、図4のフローの対象となっているフレームとは異なる、過去のフレームから抽出された(j―1)個の動き領域を取得してもよい。
なお、(j―1)個の動き領域は、それぞれがi個のマクロブロックで構成されるものとする。
そして、符号化情報演算部1032は、取得した(j―1)個の動き領域と、領域抽出部102により抽出された動き領域(図4のフローにより抽出された動き領域)とを合わせたj個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行うようにしてもよい。
具体的には、符号化情報演算部1032は、図10と同様に、同じ位置にあるマクロブロックの符号化情報の平均値を算出して符号化情報を集約する。
そして、符号化情報画像化部1033は、この場合も、集約後のi個の符号化情報をそれぞれ画素値に変換する。
図11、図12及び図13は、図8のST25で行われる、符号化情報画像化部1033による画素値の算出処理の例を示す。
図11では、符号化情報画像化部1033が、(4×4)のマクロブロックに対応する16個の符号化情報の各々のマクロブロックタイプと動きベクトルのX方向のノルムとY方向のノルムをRGB空間の画素値に変換する例を示している。
符号化情報画像化部1033は、画素値情報の送信先の画像認識装置に応じて、符号化情報に含まれる値のうち、画素値に変換する値を決定する。
例1では、符号化情報画像化部1033は、動きベクトルのX方向のノルムをRの画素値に変換し、動きベクトルのY方向のノルムをGの画素値に変換し、マクロブロックタイプをBの画素値に変換している。
例2では、符号化情報画像化部1033は、符号化情報には含まれていない固定値をRの画素値に変換し、動きベクトルのY方向のノルムをGの画素値に変換し、動きベクトルのX方向のノルムをBの画素値に変換している。
例3では、符号化情報画像化部1033は、マクロブロックタイプをRGBの全ての画素値に変換している。
また、符号化情報画像化部1033は、画素値情報の送信先の画像認識装置に応じて、画素値への変換方法を決定する。
例4では、符号化情報画像化部1033は、0〜255の間でマクロブロックタイプを正規化し、正規化後のマクロブロックタイプをRの画素値に変換し、動きベクトルのX方向のノルムをGとBの画素値に変換している。
例5では、符号化情報画像化部1033は、動きベクトルのX方向のノルムとY方向のノルムとの加算値をRとGの画素値に変換し、マクロブロックタイプをBの画素値に変換している。
なお、符号化情報画像化部1033は、任意の計算式を用いて、符号化情報から画素値を計算することができる。
符号化情報画像化部1033は、画素値情報の送信先の画像認識装置に応じて、符号化情報に含まれる値のうち、画素値に変換する値を決定する。
例1では、符号化情報画像化部1033は、動きベクトルのX方向のノルムをRの画素値に変換し、動きベクトルのY方向のノルムをGの画素値に変換し、マクロブロックタイプをBの画素値に変換している。
例2では、符号化情報画像化部1033は、符号化情報には含まれていない固定値をRの画素値に変換し、動きベクトルのY方向のノルムをGの画素値に変換し、動きベクトルのX方向のノルムをBの画素値に変換している。
例3では、符号化情報画像化部1033は、マクロブロックタイプをRGBの全ての画素値に変換している。
また、符号化情報画像化部1033は、画素値情報の送信先の画像認識装置に応じて、画素値への変換方法を決定する。
例4では、符号化情報画像化部1033は、0〜255の間でマクロブロックタイプを正規化し、正規化後のマクロブロックタイプをRの画素値に変換し、動きベクトルのX方向のノルムをGとBの画素値に変換している。
例5では、符号化情報画像化部1033は、動きベクトルのX方向のノルムとY方向のノルムとの加算値をRとGの画素値に変換し、マクロブロックタイプをBの画素値に変換している。
なお、符号化情報画像化部1033は、任意の計算式を用いて、符号化情報から画素値を計算することができる。
また、図12に示すように、マクロブロックタイプ、動きベクトル以外に、量子化ステップ値、参照画像情報の最前フレームの番号、最後フレームの番号を画素値に変換するようにしてもよい。
また、変換先の色空間の種類は任意である。
つまり、符号化情報画像化部1033は、符号化情報を、RGB空間の画素値以外に、YUV空間の画素値又はHSV空間の画素値に変換可能である。
また、変換先の色空間の種類は任意である。
つまり、符号化情報画像化部1033は、符号化情報を、RGB空間の画素値以外に、YUV空間の画素値又はHSV空間の画素値に変換可能である。
また、図13に示すように、符号化情報画像化部1033は、符号化情報の数(例:マクロブロックタイプの数、動きベクトルの数)に合わせて変換先の画素数を調整してもよい(図13の例1)。
また、符号化情報画像化部1033は、例えば、マクロブロックタイプの個数と動きベクトルの個数が異なる場合は、個数が少ないパラメータを複製して、マクロブロックタイプの個数と動きベクトルの個数を合わせてもよい(図13の例2)。
また、符号化情報画像化部1033は、例えば、マクロブロックタイプの個数と動きベクトルの個数が異なる場合は、個数が少ないパラメータを複製して、マクロブロックタイプの個数と動きベクトルの個数を合わせてもよい(図13の例2)。
***実施の形態の効果の説明***
このように、実施の形態1によれば、画像情報を復号することなく、符号化情報に含まれる動きベクトルに基づいて動き領域を抽出するため、動き領域を抽出する際の計算負荷を低減することができる。
このように、実施の形態1によれば、画像情報を復号することなく、符号化情報に含まれる動きベクトルに基づいて動き領域を抽出するため、動き領域を抽出する際の計算負荷を低減することができる。
また、本実施の形態に係る情報処理装置100は、画像符号化情報から符号化情報を取得するエントロピー復号部101を有しており、エントロピー復号以外の復号処理を行わないため復号処理に係る計算負荷を低減できる。
また、領域抽出部102では符号化情報のみを利用することから画像情報と比較して少ない情報量だけで大まかに動物体が存在する領域を確定できる。
また、画素値変換部103によって、画像認識装置に適した、動き領域を通知する画像を生成可能である。
更に、画素値変換部103によって符号化情報を画像化することにより、画像認識装置が復号された画像情報を処理する場合と比較して、画像認識装置での計算負荷を低減することができる。
音声情報や文字情報と比較して画像情報を処理する場合の計算負荷は高く、また、復号した画像情報のサイズの増加に比例して画像認識装置での計算負荷が高くなるが、本実施の形態によれば、画像認識装置は、画像情報そのものではなく、符号化情報の画素値情報を処理するため、画像認識装置での計算負荷を低減することができる。
また、領域抽出部102では符号化情報のみを利用することから画像情報と比較して少ない情報量だけで大まかに動物体が存在する領域を確定できる。
また、画素値変換部103によって、画像認識装置に適した、動き領域を通知する画像を生成可能である。
更に、画素値変換部103によって符号化情報を画像化することにより、画像認識装置が復号された画像情報を処理する場合と比較して、画像認識装置での計算負荷を低減することができる。
音声情報や文字情報と比較して画像情報を処理する場合の計算負荷は高く、また、復号した画像情報のサイズの増加に比例して画像認識装置での計算負荷が高くなるが、本実施の形態によれば、画像認識装置は、画像情報そのものではなく、符号化情報の画素値情報を処理するため、画像認識装置での計算負荷を低減することができる。
***ハードウェア構成の説明***
最後に、情報処理装置100のハードウェア構成の補足説明を行う。
情報処理装置100はコンピュータである。
図14に示すプロセッサ901は、プロセッシングを行うIC(Integrated Circuit)である。
プロセッサ901は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)等である。
図14に示す記憶装置902は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、HDD(Hard Disk Drive)等である。
図14に示す受信装置903及び送信装置904は、それぞれ、例えば、通信チップ又はNIC(Network Interface Card)である。
最後に、情報処理装置100のハードウェア構成の補足説明を行う。
情報処理装置100はコンピュータである。
図14に示すプロセッサ901は、プロセッシングを行うIC(Integrated Circuit)である。
プロセッサ901は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)等である。
図14に示す記憶装置902は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、HDD(Hard Disk Drive)等である。
図14に示す受信装置903及び送信装置904は、それぞれ、例えば、通信チップ又はNIC(Network Interface Card)である。
また、記憶装置902には、OS(Operating System)も記憶されている。
そして、OSの少なくとも一部がプロセッサ901により実行される。
プロセッサ901はOSの少なくとも一部を実行しながら、エントロピー復号部101、領域抽出部102及び画素値変換部103(以下、これらをまとめて「部」という)の機能を実現するプログラムを実行する。
図14では、1つのプロセッサが図示されているが、情報処理装置100が複数のプロセッサを備えていてもよい。
また、「部」の処理の結果を示す情報やデータや信号値や変数値が、記憶装置902、又は、プロセッサ901内のレジスタ又はキャッシュメモリに記憶される。
また、「部」の機能を実現するプログラムは、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVD等の可搬記憶媒体に記憶されてもよい。
そして、OSの少なくとも一部がプロセッサ901により実行される。
プロセッサ901はOSの少なくとも一部を実行しながら、エントロピー復号部101、領域抽出部102及び画素値変換部103(以下、これらをまとめて「部」という)の機能を実現するプログラムを実行する。
図14では、1つのプロセッサが図示されているが、情報処理装置100が複数のプロセッサを備えていてもよい。
また、「部」の処理の結果を示す情報やデータや信号値や変数値が、記憶装置902、又は、プロセッサ901内のレジスタ又はキャッシュメモリに記憶される。
また、「部」の機能を実現するプログラムは、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVD等の可搬記憶媒体に記憶されてもよい。
また、「部」を「プロセッシングサーキットリー」又は「回路」又は「工程」又は「手順」又は「処理」に読み替えてもよい。
「プロセッシングサーキットリー」又は「回路」は、プロセッサ901だけでなく、ロジックIC又はGA(Gate Array)又はASIC(Application Specific Integrated Circuit)又はFPGA(Field−Programmable Gate Array)といった他の種類の処理回路をも包含する概念である。
「プロセッシングサーキットリー」又は「回路」は、プロセッサ901だけでなく、ロジックIC又はGA(Gate Array)又はASIC(Application Specific Integrated Circuit)又はFPGA(Field−Programmable Gate Array)といった他の種類の処理回路をも包含する概念である。
100 情報処理装置、101 エントロピー復号部、102 領域抽出部、103 画素値変換部、1031 領域決定部、1032 符号化情報演算部、1033 符号化情報画像化部。
Claims (12)
- 複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに動きベクトルが含まれるとともに、マクロブロックタイプと量子化ステップと参照画像情報とのうちの少なくともいずれかが含まれる複数の符号化情報を抽出するエントロピー復号部と、
前記エントロピー復号部により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出部と、
前記領域抽出部により抽出された前記動き領域を構成するマクロブロックに対応する符号化情報を取得し、取得した符号化情報の前記動きベクトルと前記マクロブロックタイプと前記量子化ステップと前記参照画像情報とのうちの少なくともいずれかを画素値に変換する画素値変換部とを有する情報処理装置。 - 複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出するエントロピー復号部と、
前記エントロピー復号部により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出部と、
前記領域抽出部により、それぞれがi個(iは1以上の整数)のマクロブロックで構成されるj個(jは2以上の整数)の動き領域が抽出された場合に、前記j個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行い、集約後のi個の符号化情報をそれぞれ画素値に変換する画素値変換部とを有する情報処理装置。 - 複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出するエントロピー復号部と、
前記エントロピー復号部により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出部と、
前記領域抽出部により、i個(iは1以上の整数)のマクロブロックで構成される動き領域が抽出された場合に、過去に前記領域抽出部により抽出された、それぞれがi個のマクロブロックで構成される(j―1)個(jは2以上の整数)の動き領域を取得し、取得した(j―1)個の動き領域と、前記領域抽出部により抽出された前記動き領域とを合わせたj個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行い、集約後のi個の符号化情報をそれぞれ画素値に変換する画素値変換部とを有する情報処理装置。 - 前記領域抽出部は、
前記複数の符号化情報に含まれる複数の動きベクトルをマクロブロックの順序に従って配置し、前記複数の動きベクトルの位置に基づいて前記動き領域を抽出する請求項1〜3のいずれか一項に記載の情報処理装置。 - 前記領域抽出部は、
前記複数の動きベクトルのうち近接する位置に配置されている2以上の動きベクトルを統合し、統合後の動きベクトルの位置に基づいて前記動き領域を抽出する請求項4に記載の情報処理装置。 - 前記画素値変換部は、
前記領域抽出部により抽出された前記動き領域がn個(nは2以上の整数)のマクロブロックで構成される場合に、
前記n個のマクロブロックに対応するn個の符号化情報をm個(mは1以上の整数であって、nの約数)の符号化情報に集約する演算を行い、集約後のm個の符号化情報の前記動きベクトルと前記マクロブロックタイプと前記量子化ステップと前記参照画像情報とのうちの少なくともいずれかをそれぞれ画素値に変換する請求項1に記載の情報処理装置。 - コンピュータが、複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに動きベクトルが含まれるとともに、マクロブロックタイプと量子化ステップと参照画像情報とのうちの少なくともいずれかが含まれる複数の符号化情報を抽出し、
前記コンピュータが、前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出し、
前記コンピュータが、抽出された前記動き領域を構成するマクロブロックに対応する符号化情報を取得し、取得した符号化情報の前記動きベクトルと前記マクロブロックタイプと前記量子化ステップと前記参照画像情報とのうちの少なくともいずれかを画素値に変換する情報処理方法。 - コンピュータが、複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出し、
前記コンピュータが、前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出し、
それぞれがi個(iは1以上の整数)のマクロブロックで構成されるj個(jは2以上の整数)の動き領域が抽出された場合に、前記コンピュータが、前記j個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行い、集約後のi個の符号化情報をそれぞれ画素値に変換する情報処理方法。 - コンピュータが、複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出し、
前記コンピュータが、前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出し、
i個(iは1以上の整数)のマクロブロックで構成される動き領域が抽出された場合に、前記コンピュータが、過去に抽出された、それぞれがi個のマクロブロックで構成される(j―1)個(jは2以上の整数)の動き領域を取得し、取得した(j―1)個の動き領域と、抽出された前記動き領域とを合わせたj個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行い、集約後のi個の符号化情報をそれぞれ画素値に変換する情報処理方法。 - 複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに動きベクトルが含まれるとともに、マクロブロックタイプと量子化ステップと参照画像情報とのうちの少なくともいずれかが含まれる複数の符号化情報を抽出するエントロピー復号処理と、
前記エントロピー復号処理により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出処理と、
前記領域抽出処理により抽出された前記動き領域を構成するマクロブロックに対応する符号化情報を取得し、取得した符号化情報の前記動きベクトルと前記マクロブロックタイプと前記量子化ステップと前記参照画像情報とのうちの少なくともいずれかを画素値に変換する画素値変換処理とをコンピュータに実行させる情報処理プログラム。 - 複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出するエントロピー復号処理と、
前記エントロピー復号処理により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出処理と、
前記領域抽出処理により、それぞれがi個(iは1以上の整数)のマクロブロックで構成されるj個(jは2以上の整数)の動き領域が抽出された場合に、前記j個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行い、集約後のi個の符号化情報をそれぞれ画素値に変換する画素値変換処理とをコンピュータに実行させる情報処理プログラム。 - 複数のマクロブロックで構成される画像情報が符号化されて得られた画像符号化情報に対してエントロピー復号を行い、前記画像符号化情報から、前記複数のマクロブロックに対応して設けられた、それぞれに少なくとも動きベクトルが含まれる複数の符号化情報を抽出するエントロピー復号処理と、
前記エントロピー復号処理により抽出された前記複数の符号化情報に含まれる複数の動きベクトルに基づいて、前記画像情報内の動きのある領域を動き領域として抽出する領域抽出処理と、
前記領域抽出処理により、i個(iは1以上の整数)のマクロブロックで構成される動き領域が抽出された場合に、過去に前記領域抽出処理により抽出された、それぞれがi個のマクロブロックで構成される(j―1)個(jは2以上の整数)の動き領域を取得し、取得した(j―1)個の動き領域と、前記領域抽出処理により抽出された前記動き領域とを合わせたj個の動き領域に含まれる(i×j)個のマクロブロックに対応する(i×j)個の符号化情報をi個の符号化情報に集約する演算を行い、集約後のi個の符号化情報をそれぞれ画素値に変換する画素値変換処理とをコンピュータに実行させる情報処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/074997 WO2017037900A1 (ja) | 2015-09-02 | 2015-09-02 | 情報処理装置及び情報処理方法及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5944078B1 true JP5944078B1 (ja) | 2016-07-05 |
JPWO2017037900A1 JPWO2017037900A1 (ja) | 2017-08-31 |
Family
ID=56289176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016500425A Expired - Fee Related JP5944078B1 (ja) | 2015-09-02 | 2015-09-02 | 情報処理装置及び情報処理方法及び情報処理プログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP5944078B1 (ja) |
TW (1) | TW201711469A (ja) |
WO (1) | WO2017037900A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001250118A (ja) * | 2000-03-06 | 2001-09-14 | Kddi Corp | 動画像内の移動物体検出追跡装置 |
JP2002027480A (ja) * | 2000-07-10 | 2002-01-25 | Fujitsu Ltd | 動画像処理方法および動画像処理装置 |
JP2005073280A (ja) * | 2003-08-26 | 2005-03-17 | Lg Electronics Inc | 圧縮動画像の動き客体分割方法 |
-
2015
- 2015-09-02 WO PCT/JP2015/074997 patent/WO2017037900A1/ja active Application Filing
- 2015-09-02 JP JP2016500425A patent/JP5944078B1/ja not_active Expired - Fee Related
- 2015-10-26 TW TW104135041A patent/TW201711469A/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001250118A (ja) * | 2000-03-06 | 2001-09-14 | Kddi Corp | 動画像内の移動物体検出追跡装置 |
JP2002027480A (ja) * | 2000-07-10 | 2002-01-25 | Fujitsu Ltd | 動画像処理方法および動画像処理装置 |
JP2005073280A (ja) * | 2003-08-26 | 2005-03-17 | Lg Electronics Inc | 圧縮動画像の動き客体分割方法 |
Non-Patent Citations (1)
Title |
---|
JPN6015042651; 大田 修平、外3名: '"MPEG動きベクトルを用いたグローバルモーション推定に基づく移動物体のリアルタイム抽出"' 電子情報通信学会技術研究報告 Vol.108, No.263, 20081016, pp.19-24, 社団法人電子情報通信学会 * |
Also Published As
Publication number | Publication date |
---|---|
JPWO2017037900A1 (ja) | 2017-08-31 |
WO2017037900A1 (ja) | 2017-03-09 |
TW201711469A (zh) | 2017-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4712643B2 (ja) | フレーム間予測処理装置、フレーム間予測方法、画像符号化装置及び画像復号装置 | |
TWI660623B (zh) | 運動向量之預測解碼方法、預測解碼裝置 | |
TW202002657A (zh) | 成分依賴的子區塊分割 | |
JP2006246431A (ja) | 画像符号化装置および画像符号化方法 | |
JP4504230B2 (ja) | 動画像処理装置、動画像処理方法、及び動画像処理プログラム | |
US10277810B2 (en) | Image processing apparatus that divides and processes an image signal, control method thereof, and storage medium | |
JP5306485B2 (ja) | 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム | |
JPWO2011099440A1 (ja) | 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム | |
US20130163674A1 (en) | Encoding of the Link to a Reference Block in Video Compression by Image Content Based on Search and Ranking | |
JP2007214641A (ja) | 符号化装置、復号化装置、画像処理装置及び画像処理方法をコンピュータに実行させるためのプログラム | |
KR20130126698A (ko) | 영상 부호화 장치, 영상 부호화 방법 및 영상 부호화 프로그램 | |
JP2022103284A (ja) | 映像符号化装置、映像復号装置、及びこれらのプログラム | |
US20180227592A1 (en) | Motion picture encoding device, motion picture encoding method, and storage medium storing motion picture encoding program | |
JP2008219141A (ja) | 動きベクトル検出装置、それを用いた画像符号化装置および撮像装置 | |
US10666970B2 (en) | Encoding apparatus, encoding method, and storage medium | |
JP5944078B1 (ja) | 情報処理装置及び情報処理方法及び情報処理プログラム | |
JP7180679B2 (ja) | 映像符号化装置、映像符号化方法、映像符号化プログラム、映像復号装置、映像復号方法、及び映像復号プログラム | |
WO2011062082A1 (ja) | 動画像符号化装置および動画像復号装置 | |
US10893290B2 (en) | Apparatus for moving image coding, apparatus for moving image decoding, and non-transitory computer-readable storage medium | |
JP6016488B2 (ja) | 映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム | |
JP2015026922A (ja) | 動画像符号化装置および動画像符号化方法 | |
CN107431821B (zh) | 高效低复杂度视频压缩 | |
JP6728870B2 (ja) | 画像圧縮装置、画像圧縮方法、及び画像圧縮プログラム | |
JP5970507B2 (ja) | 映像符号化装置及び映像符号化プログラム | |
JP7323014B2 (ja) | 映像復号方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5944078 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |