JP6443540B2 - 画像処理装置、画像処理方法および記憶媒体 - Google Patents

画像処理装置、画像処理方法および記憶媒体 Download PDF

Info

Publication number
JP6443540B2
JP6443540B2 JP2017510420A JP2017510420A JP6443540B2 JP 6443540 B2 JP6443540 B2 JP 6443540B2 JP 2017510420 A JP2017510420 A JP 2017510420A JP 2017510420 A JP2017510420 A JP 2017510420A JP 6443540 B2 JP6443540 B2 JP 6443540B2
Authority
JP
Japan
Prior art keywords
patch
image
input
patches
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017510420A
Other languages
English (en)
Other versions
JP2017531244A (ja
Inventor
カピック リ
カピック リ
佐藤 敦
敦 佐藤
剛志 柴田
剛志 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2017531244A publication Critical patent/JP2017531244A/ja
Application granted granted Critical
Publication of JP6443540B2 publication Critical patent/JP6443540B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/21Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4053Super resolution, i.e. output image resolution higher than sensor resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0125Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards being a high definition standard

Description

本発明は、劣化画像を復元する画像処理技術に関する。
超解像は、劣化画像を復元する方法のひとつである。事例ベースの超解像(exemplar based super-resolution)では、訓練セット内の予め特定された高解像度画像および低解像画像のペアを用いて、入力低解像度画像から、より高解像度の画像が再構成される。
事例ベースの超解像方式の例が、特許文献1に開示されている。特許文献1の図1に示されるように、特許文献1に開示の方法は、主に訓練フェーズと推定フェーズとより成る。
特許文献1の図1に説明されるように、訓練フェーズでは、シーン(高解像度;HR)および画像(低解像度)を合成または測定によって取得する。取得した高解像度および低解像度画像は、その後、特許文献1の図2に示されるように「パッチ」と呼ばれる重複する小片に分割される。各低解像度パッチは、訓練フェーズにおいて、対応する高解像度パッチにペアとして紐付けられる。
推定フェーズでは、未知画像もまたパッチに分割される。未知画像の各パッチに関して、訓練データを探索して、未知パッチを最も良く説明する候補の集合を見つける。パッチの選択は、該候補パッチの集合の中で最高スコア(例えば、最小のL2ノルム、すなわち最近傍)を有する訓練パッチを選択することによって決定される。その後、これらの選択された訓練パッチを組み合わせることによって、推定シーンが再構成される。
事例ベースの超解像方式の別の例が、特許文献2に開示されている。特許文献2も、また、訓練フェーズおよび推定フェーズを含む画像処理装置を開示する。訓練フェーズはまた、辞書がデータおよび関連する不鮮明なパッチを記憶することを含む。特許文献2の推定フェーズでは、入力パッチと辞書内の不鮮明なパッチとの間における重み付き類似度が算出される。重みは、辞書内の候補HRパッチに対する選択されたHRの類似性に依存する危険度(degree of doubt)(K)を用いて算出される。最低の危険度(K)を有するパッチを組み合わせることによって、推定シーンが再構成される。
特許文献3は、データベースからの最類似オブジェクトの選択、スコア算出およびデータベースからの類似オブジェクトのソートの3つのフェーズを主に含むオブジェクト認識方法を開示する。スコア算出には、クエリー特徴ベクトルおよびデータベース特徴ベクトル間の類似性を見積もる類似性スコアが含まれる。各タイプのオブジェクトが1つのIDを有するように、データベース内のオブジェクトに対してID(識別子)番号が割り当てられる。類似スコアは、クエリーおよび同IDのデータベースオブジェクト間のスコアの和によって算出される。
米国特許第6496184号明細書 国際公開第2013/089261号 国際公開第2011/021605号
再構成画像は、通常鮮明でなく、元の対象の本物の細部を欠くため、特許文献1で開示される方法によって再構成される高解像度画像は、監視カメラでの顔認識には通常適していない。
特許文献1によって開示される方法では、各位置において、1つのパッチ(通常、最近傍パッチ)の情報のみが推定フェーズで用いられる。データベースには、観測されたパッチを良好に説明する1より多くのシーンのパッチが存在し得、通常それらは異なる対象に由来するため、各位置において1つのみのパッチの情報を用いることは、通常、多くの異なる対象から選択されたパッチに帰結する。
選択されたパッチは異なる対象に由来するため、高解像度画像を形成するために選択された重複するパッチを組み合わせる間に、選択されたパッチ上のいくつかの細部が平均化され、鮮明でない高解像度画像が作成される。
さらに、多すぎる異なる対象からパッチを得ることは、また、結果として得られる高解像度画像に、元の対象の本物の細部をなくさせる。
特許文献2による方法では、危険度(K)で候補パッチを重み付けすることにより、上記した課題を解決しようとしている。しかしながら、危険度(K)は、同じ位置での候補パッチ間の類似性を測定するのみである。周囲位置にある候補パッチは考慮注目されない。多くの異なる対象よりパッチを選択すること、そしてそのために、重複を通して画像の細部が平均化されるという課題は解決されていない。
特許文献3による方法では、クエリーと辞書内の同じID(同じタイプ)のオブジェクトとの間のスコアを合計することによって類似スコアを算出する。画像パッチを考慮する代わりに、スコア算出においてクエリー画像の全体が考慮される。特許文献3による方法は、劣化画像を復元する目的で類似パッチを選択することの役に立たない。
特許文献1および特許文献2の方法は、監視カメラでの顔認識に十分に鮮明な画像を生み出さず、特許文献3の方法は、類似スコアの算出においてオブジェクト画像を全体として考慮するが、特許文献3の方法では、劣化画像の再構成のために類似するパッチを選択することができない。
本発明は、鮮明な高解像度画像を再構成することが可能であり、再構成された画像が元の未知入力画像と同様であるように、上述の方法における課題を解決することを目指す。
本発明の一態様に係る画像処理装置は、ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチに関連付けられる、推定手段と、前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出する第1のスコア算出手段と、前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択するパッチ置換手段と、を備える。
本発明の一態様に係る画像処理方法は、ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチに関連付けられ、前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出し、前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択する。
本発明の一態様に係るコンピュータ読み取り可能な記憶媒体は、コンピュータを、ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチと関連付けられる、推定手段と、前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出する第1のスコア算出手段と、前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択するパッチ置換手段として動作させるプログラムを記憶する。上述のコンピュータ読み取り可能な記憶媒体に格納されているプログラムも、本発明の一態様を実現する。
本発明の一態様によれば、元の未知入力画像と同様である鮮明な高解像度画像を再構成することが可能である。
図1は、異なる対象IDをもつパッチによる再構成画像と、同じ対象IDをもつパッチによる再構成画像との差異を概略的に示す図である。 図2は、本発明の第1の実施形態に係る画像処理装置200の構成を示すブロック図である。 図3は、画像分割部204により分割された重複するパッチの例を示す図である。 図4は、本発明の第1および第2の実施形態による画像処理装置200の、訓練フェーズにおける動作の例を示すフローチャートである。 図5は、本発明の第1の実施形態に係る、訓練フェーズにおける画像処理装置200を示すブロック図である。 図6は、本発明の第1の実施形態に係る画像処理装置200の、再構成フェーズにおける動作を示すフローチャートである。 図7は、本発明の第1の実施形態に係る、再構成フェーズにおける画像処理装置200を示すブロック図である。 図8は、注目中のパッチの周辺の、周囲領域の例を示す図である。 図9は、本発明の第2および第3の実施形態に係る画像処理装置500の構成を示すブロック図である。 図10は、本発明の第2および第3の実施形態に係る、訓練フェーズにおける画像処理装置500を示すブロック図である。 図11は、本発明の第2および第3の実施形態に係る、再構成フェーズにおける画像処理装置500を示すブロック図である。 図12は、本発明の第2および第3の実施形態に係る画像処理装置500の、再構成フェーズにおける動作の例を示すフローチャートである。 図13は、対象IDマップを視覚化した例を示す図である。 図14は、本発明の第3の実施形態に係る画像処理装置500の、訓練フェーズにおける動作の例を示すフローチャートである。 図15は、本発明の第4の実施形態に係る画像処理装置200Aの構成の例を示すブロック図である。 図16は、本発明の実施形態に係る画像処理装置を実現することができるコンピュータ1000のハードウェア構成の例を示すブロック図である。
<第1の実施形態>
本発明の第1の実施形態について、図面を参照しながら詳細に説明する。
図2は、本発明の第1の実施形態による画像処理装置200の構成を示すブロック図である。
画像処理装置200は、入力部201、画像合成部202、画像ID登録部203、画像分割部204、画像記憶部205、未知画像入力部206、推定部207、スコア算出部208、パッチ置換部209および画像再構成部210を含む。推定部207は、本発明の実施形態の説明において、第1のスコア算出部207とも記載される。
入力部201は、以下において単に「入力顔画像」または「入力画像」と記述される、高解像度入力顔画像を受信する。高解像度入力顔画像は、例えば、顔データベースまたは顔辞書を作成するために顔を撮影することによって得られる画像であってよい。
画像合成部202が、入力部201によって受信された顔画像を正規化する。すなわち、画像合成部202は、例えば、全ての入力顔画像の、例えば目、鼻および口等の顔パーツ上の、所定の種類の特徴点が、顔画像内で、それぞれ同じまたはほぼ同じ位置であるように、各入力顔画像を変換する。画像合成部202が、顔画像から、顔パーツおよび顔パーツ上の所定の特徴点を検出してもよい。画像合成部202が顔パーツおよび顔パーツ上の所定の特徴点を検出する方法として、様々な顔認識方法を用いることができる。画像合成部202による入力顔画像の変換方法として、様々な顔画像変換方法を用いることができる。画像合成部202によって正規化される入力顔画像は、以下において、「正規化顔画像」、「正規化画像」または「正規化入力画像」と記述される。例えば入力画像が既に正規化されている場合は、画像合成部202は入力画像を正規化しなくてよい。
画像ID登録部203が、入力顔画像の識別情報(identity)に応じて、入力顔画像に対してそれぞれIDを割り当て、以下において「対象ID」ともそれぞれ表記される、そのIDを登録する。入力顔画像の識別情報は、それぞれ、顔画像内で撮像されている顔をもつ人物の識別情報であってもよい。IDの各々は、固有のデータ値であってもよい。
画像分割部204が、入力画像から、重複するパッチを生成する。具体的には、画像分割部204が、正規化顔画像の各々を、重複するパッチに分割する。重複するパッチは、それぞれ、正規化顔画像のうちのひとつの、一部分の画像である。重複するパッチは、それらの間で重複してよく、すなわち、重複するパッチの2つ以上が、共通の部分を有していてもよい。この重複するパッチは、以下において、単に「パッチ」、「入力パッチ」または「辞書パッチ」と記述される。パッチのサイズは、任意に、または経験によって決められてよく、予め決定されていてもよい。各々のパッチのサイズは、同じであってよい。画像分割部204が、各々のパッチについて、パッチに、そのパッチに分割される正規化顔画像へと正規化される入力顔画像のIDを関連付ける。画像分割部204が、IDとパッチとを、画像記憶部205に格納する。
画像記憶部205が、入力顔画像のIDと、その入力顔画像から分割されたパッチとを記憶する。
未知画像入力部206は、その識別情報が画像処理装置200に与えられない、低解像度未知顔画像を受信する。低解像度未知顔画像の解像度は、入力顔画像の解像度より低くてよい。低解像度未知顔画像は、以下において、「未知顔画像」、「入力クエリー画像」または「未知画像」と記述される。低解像度の未知顔画像は、例えば、防犯システムに含まれるカメラで取得した監視画像から抽出した顔画像であってよい。
画像分割部204が、未知顔画像から重複するパッチを生成する。具体的には、入力顔画像を分割するのと同様に、画像分割部204は、また、未知顔画像を重複するパッチに分割する。未知顔画像から生成される重複するパッチは、以下において、「低解像度未知顔画像パッチ」、「未知顔画像パッチ」または「未知パッチ」と記述される。未知顔画像パッチの各々は、未知顔画像の一部分の画像である。未知顔画像パッチのサイズは、辞書パッチのサイズと同じであってよい。
推定部207が、画像記憶部205に格納されているパッチの中から、低解像度未知顔画像パッチの各々を最もよく説明する候補パッチのセットを選択する。推定部207は、例えば、2つの画像の間の類似性を推定する様々な方法のうちのひとつによって、未知顔画像パッチの各々と、画像記憶部205に格納されているパッチの各々との間の類似度を推定してもよい。推定部207は、以下に記載されるL2ノルム距離を比較することによって類似性を推定してもよい。推定部207が、画像記憶部205に格納されているパッチの中から、類似性の推定結果に基づいて、パッチを候補パッチとして選択してもよい。対象の未知顔画像パッチに最も類似するパッチは、対象の未知顔画像パッチの「最近傍パッチ」と記述される。言い換えると、推定部207は、対象の未知顔画像パッチのそれぞれに対して最も類似するパッチを最近傍パッチとして決定することによって、最近傍パッチを推定してもよい。推定部207は、最近傍パッチを推定し、未知画像顔パッチの各々について、最近傍パッチを選択パッチとして選択してもよい。
スコア算出部208が、推定部207によって選択された候補パッチのスコアを算出する。
パッチ置換部209が、未知顔画像パッチの各々について、スコア算出部208により算出された、最も高いスコアをもつパッチを選択する。パッチ置換部209は、推定部207により推定された最近傍パッチである選択パッチを、スコア算出部208により算出された最高スコアをもつパッチで置換してもよい。
画像再構成部210は、そのそれぞれが、パッチ置換部209によって置換されていない最近傍パッチであるかまたは最も高いスコアをもつ置換されたパッチである、選択パッチを組み合わせて、高解像度画像を再構成する。
図3は、画像分割部204により分割された重複するパッチの例を示す図である。図3に示すブロックは、入力画像または未知画像などである分割画像上の1つまたは複数の画素をそれぞれ含む領域である。例えば図3に示すパッチA、パッチB、パッチCおよびパッチDであるパッチは、画像を分割することにより生成される重複するパッチの例である。パッチは、1つまたは複数の他のパッチと重複していてもよい。
次に、画像処理装置200の動作について、図面を参照しながら詳細に記載する。
図4は、画像処理装置200の、訓練フェーズにおける動作の例を示すフローチャートである。
図5は、訓練フェーズにおける、画像処理装置200を示すブロック図である。訓練フェーズにおいて、画像処理装置200内で動作する部は、例えば、入力部201、画像合成部202、画像ID登録部203、画像分割部204および画像記憶部205である。図5では、他の部を破線で描かれている。
図4によれば、入力部201が、入力顔画像を受信する(ステップS101)。入力顔画像は、高解像度顔画像を記憶するサーバ(図示せず)によって入力されてもよい。入力部201が、高解像度顔画像を記憶する記憶装置(図示せず)から、入力顔画像を読み出してもよい。入力部201はまた、ステップS101において入力顔画像の識別情報を受信してもよい。
次に、画像合成部202が、入力顔画像を正規化する(ステップS102)。画像ID登録部203が、入力顔画像にIDを割り当てる(ステップS103)。
画像分割部204が、画像合成部202によって正規化された入力画像である正規化顔画像を、重複するパッチに分割する(ステップS104)。ステップS104では、画像分割部204が、各パッチとして、正規化された入力画像内の異なる位置において部分的な画像を抽出してもよい。画像分割部204は、例えば所定のルールに従って、正規化された入力顔画像がパッチでカバーされるように、正規化された入力顔画像内においてパッチの位置を決定してもよい。重複するパッチは、1つまたは複数の他の重複するパッチに部分的に重複してもよい。
画像分割部204は、パッチの各々をIDと関連付ける(ステップS105)。画像分割部204は、IDとそのIDに関連付けられたパッチとを、画像記憶部205に格納する(ステップS106)。画像処理装置200の利用者が、画像処理装置200と通信可能に接続されている端末装置(図示せず)を介して、訓練フェーズを終了するように指示してもよい。画像処理装置200は、訓練フェーズ終了の条件によって訓練フェーズが終了されるかどうかを決定してもよい。訓練フェーズが終了する場合(ステップS107においてYes)、図4に示す動作は終了する。訓練フェーズが終了しない場合(ステップS107においてNo)、画像処理装置200は、ステップS101からステップS106の動作をもう一度行う。
図6は、再構成フェーズにおける、画像処理装置200の動作を示すフローチャートである。
図7は、再構成フェーズにおける、画像処理装置200を示すブロック図である。再構成フェーズにおいて、画像処理装置200内で動作する部は、例えば、画像分割部204、画像記憶部205、未知画像入力部206、推定部207、スコア算出部208、パッチ置換部209および画像再構成部210である。図7では、他の部は破線で描かれている。
図6によれば、まず、未知画像入力部206が、低解像度の未知顔画像を受信する(ステップS201)。そして、画像分割部204が、その未知顔画像を、重複する未知顔画像パッチに分割する(ステップS202)。上述のように、未知顔画像パッチのサイズは、任意に、または経験によって決定できる。
推定部207は、未知顔画像の各位置で候補パッチのセットを選択する。その「位置」は、未知顔画像パッチのうちのひとつを指していてもよい(ステップS203)。この場合、ステップS203で、推定部207は、画像記憶部205に格納されたパッチの中から、未知顔画像パッチの各々を最も良く説明する候補パッチのセットを選択する。推定部207は、IDの各々と関連するパッチの中から、候補パッチのひとつとして、未知顔画像パッチの各々に最も類似するパッチを選択してもよい。推定部207は、未知顔画像パッチの各々について、IDの各々と関連するパッチの中から多くて1つの候補パッチを選択してもよい。未知顔画像パッチの各々について、推定部207は、未知顔画像パッチに対する類似度が閾値を超える入力パッチを、その未知顔画像パッチの候補パッチとして選択してもよい。推定部207は、例えば、対象の未知顔画像パッチに対する類似度に基づいて、セット内で一連の候補パッチを決定し、セット内の候補パッチのそれぞれに連続番号を割り当ててもよい。ステップS203では、推定部207が、各未知顔画像パッチについての選択パッチとして、未知顔画像パッチに最も類似するパッチである最近傍パッチを暫定的に選択してもよい。
スコア算出部208が、推定部207によって未知顔画像パッチについて選択された候補パッチのスコアを算出する(ステップS204)。数1は、候補パッチのスコアを算出する式の例を示す。候補パッチのそれぞれが、IDのうちのひとつと関連付けられる。従って、各候補パッチについて、候補パッチのスコアは、候補パッチと関連付けられているIDのスコアとみなされる。スコアは、GLVQ(Generalized Learning Vector Quantization)の誤分類尺度で算出される。数1に示す式は、候補パッチの各々に関するIDの各々のスコアを表す。スコア算出部208は、例えば、数1によって表される式に従って、候補パッチの各々のスコアを算出する。以下に記載する数1および数2において、rは候補パッチに割り当てられる連続番号であり、d(r)は例えば未知画像パッチおよびr番目の候補パッチ間のL2ノルム距離である。上記したように、1番目のパッチは最近傍パッチである。
Figure 0006443540
候補パッチのスコアを算出する式の別の例が、単にスコアおよびL2ノルム距離間の反比例関係を用いる、数2に示されている。
Figure 0006443540
スコア算出部208は、IDの各々について、位置の各々を囲む或る領域内で、同じIDと関連付けられた候補パッチのスコアの和を算出する(ステップS205)。上述のように、その「位置」は、未知顔画像パッチのうちのひとつを指していてもよい。この場合、スコア算出部208が、IDの各々について、未知顔画像パッチの各々を囲む或る領域内で同じIDと関連付けられた候補パッチのスコアの和を算出する。或る領域とは、例えば、選択された未知顔画像パッチを3×3個の未知顔画像パッチの中心として囲む、3×3個の未知顔画像パッチである。或る領域は、3×3個の未知顔画像パッチ以外であってよい。或る領域内の未知顔画像パッチを、以下において、「局所未知パッチ」とも記述される。
スコア算出部208は、選択されていない位置の中からひとつの位置を選択する(ステップS206)。上記したように、その「位置」とは、未知顔画像パッチのうちのひとつを指してもよい。ステップS206では、スコア算出部208は、選択されていない未知顔画像パッチの中からひとつの未知顔画像パッチを選択してもよい。
図8は、注目中のパッチの周辺の周囲領域のスコアの例を示す図である。四角形のグループ401は、入力画像に対する候補パッチに関する、対象IDの1つについてのスコアを表す。四角形402の各々は、スコアを表し、そのスコアは以下において「スコア402」と記述される。候補パッチの各々のIDの各々のスコア402は、例えば数1によって算出される。スコア算出部208は、注目中のパッチ403を囲むハッチングを付した四角形404として描かれている、或る領域内の候補パッチの各々のIDの各々についてのスコア402を合計する。対象IDの各々について、領域404におけるスコアの和がある。周囲領域404の領域のサイズは、任意に、または経験によって決定される。図8に示す例では、周囲領域は3×3のパッチである。未知顔画像パッチのそれぞれについて、スコア算出部208によって算出されたそのスコアの和が最も高いIDを、以下において、「最高スコアID」と記載する。
パッチ置換部209が、例えば、ステップS206、ステップS207およびステップS208の動作によって、選択された未知画像パッチの対象IDの中から、スコアが最も高い対象IDと関連付けられている候補パッチを選択する。
最高スコアIDが最近傍パッチのIDと同じでない場合(ステップS207でNO)、パッチ置換部209が、推定部207で推定された最近傍パッチを、スコア算出部208で算出された最高スコアをもつ、上記「ID」とも記述される対象IDから取得されるパッチで置換する(ステップS208)。ステップS208では、パッチ置換部209が、推定部207によって推定された最近傍パッチの代わりに、スコア算出部208で算出された最高スコアをもつ対象IDから取得されるパッチを選択する。最高スコアIDが、最近傍パッチのIDと同じであれば(ステップS207でYES)、パッチの置換なしに最近傍が選択される(ステップS209)。選択されていない位置があれば(ステップS210でNO)、画像処理装置200はステップS206からの動作を繰り返す。ステップS205からステップS210の動作は、画像上の全てのパッチについて繰り返される。
画像上の全てのパッチについてステップS206からステップS210の動作を繰り返すと(ステップS210でYES)、画像再構成部210は、ステップS208またはステップS209で選択される、選択パッチを組み合わせて高解像度画像を再構成する(S211)。画像再構成部210は、例えば、選択パッチの重複する領域において平均を取ることによって、または選択パッチの重複する領域の線形結合を取ることによって、選択パッチを組み合わせる。
パッチ置換部209が、選択パッチの重複する領域に細部を残しながら、いくつかの最近傍パッチを、少数のみの対象に由来するパッチで置換するので、第1の実施形態係る画像処理装置200によって、平均顔とはかけ離れた、より鮮明な高解像度画像を構成することが可能である。
スコア算出部208が、付加的な、対象IDおよび空間情報を用いて全ての候補パッチに対してスコアを算出し、高いスコアを有するパッチはほんの少数の対象に由来する傾向があるので、少数の対象に由来するパッチのみが、高解像度画像を再構成に用いられる。
鮮明な高解像度画像および元画像と同様の画像を再構成するために、画像処理装置200は、パッチの対象IDおよび空間情報の付加的な情報を用いる。
画像処理装置200は、訓練フェーズ中に画像パッチの対象IDを登録する。パッチ置換についての追加のステップがまた、再構成フェーズに追加される。パッチ置換ステップでは、対象ID情報および空間情報(入力クエリー画像上の各位置での周囲パッチ情報)を用いて、どの候補パッチが未知の観測パッチを最も良く説明するかを判定する。
入力クエリー画像上の各位置で、或る領域内(例えば、周囲の8個のパッチの領域)の周囲の候補パッチ全てに対して対象IDのスコアが算出される。注目中の領域内で最も高いスコアをもつ対象IDに由来するパッチに、他の候補パッチよりもより大きな重みが与えられることとなる。従って、周囲領域内で選択されるパッチをもつ対象IDに由来するパッチが、その位置で選択される可能性が高い。
画像処理装置200により、再構成画像は、背景技術として上で述べた文書に開示された方法で再構成されるものよりも、より鮮明となる。その理由は、画像処理装置200が、選択パッチ内の細部を保ちながら、同じ対象IDからより多くのパッチが選ばれるのを保証するからである。図1は、異なる対象IDをもつパッチによる再構成画像と、同じ対象IDをもつパッチによる再構成画像との差異を概略的に示す図である。図1に示すように、例えば、図の左側で、異なる対象IDから選択された他のパッチによって、重複の間に、黒いドット(細部)は平均化される一方、同じ対象IDから選択されたパッチは全て同じ位置にある黒いドット(細部)を有するので、黒いドットが保たれ、そのため細部は平均化されず、より鮮明な画像を生み出す。
画像処理装置200は、また、未知入力画像のグランドトゥルース(ground truth)に、より近い高解像度画像を生み出す。その理由は、画像処理装置200が、得られる画像が不鮮明であること(多すぎる対象IDからのパッチの混合からなること)を防ぐからである。同類(mate)画像がデータベース内に含まれれば、画像処理装置200は、主として同類画像からのパッチを用いてグランドトゥルースに近い高解像度画像を再構成することが可能である。同類画像がデータベース内に含まれていなければ、画像処理装置200は、やはり、ほんの少数の対象から選択されるパッチで鮮明な画像を再構成する。そのため、再構成に用いられる対象の数が、データベース内に同類のものが登録されているかどうかを判断する助けとなりうる。
<第2の実施形態>
本発明の第2の実施形態について、図面を参照しながら詳細に説明することとする。
図9は、本発明の第2の実施形態に係る画像処理装置500の構成を示すブロック図である。
画像処理装置500は、第1の実施形態の画像処理装置200に含まれる構成要素と同じ構成要素を含む。画像処理装置200に含まれる構成要素の符号と同じ符号が、画像処理装置200内に含まれる構成要素と同じ構成要素に割り当てられる。それらの構成要素の詳細な説明は省略する。画像処理装置500は、IDマップ作成部509および第2のスコア算出部510をさらに含む。
IDマップ作成部509が、低解像度未知入力画像のパッチの各々における、最高スコア対象IDを用いて、IDマップを作成する。第2のスコア算出部510が、対象IDの各々によって占有される領域を考慮に入れて、推定部207によって取得された全ての候補パッチのスコアを算出し直す。
次に、この実施形態による画像処理装置の動作について、図面を参照しながら詳細に説明することとする。
図10は、訓練フェーズにおける、画像処理装置500を示すブロック図である。訓練フェーズにおいて、画像処理装置200のうちで動作する部は、例えば、入力部201、画像合成部202、画像ID登録部203、画像分割部204および画像記憶部205の各部である。図10では、他の部は破線で描かれている。
図4は、訓練フェーズにおける、画像処理装置500の動作の例を示すフローチャートである。訓練フェーズにおける画像処理装置500の動作は、訓練フェーズにおける第1の実施形態による画像処理装置200の動作と同じである。従って、訓練フェーズにおける画像処理装置500の動作の詳細な説明は省略する。
図11は、再構成フェーズにおける、画像処理装置500を示すブロック図である。再構成フェーズにおいて、画像処理装置500内で動作する部は、例えば画像分割部204、画像記憶部205、未知画像入力部206、推定部207、スコア算出部208、IDマップ作成部509、第2のスコア算出部510、パッチ置換部209および画像再構成部210である。図11では、他の部は破線で描かれている。
図12は、再構成フェーズにおける、画像処理装置500の動作の例を示すフローチャートである。
図12に示すステップは、ステップS301、ステップS302およびステップS303を除いて、図6に示す第1の実施形態のステップと同じである。図6に示すステップの符号と同じ符号が図6に示すステップと同じステップに割り当てられており、それらのステップの詳細な説明は省略する。
スコア算出部208が、推定部207によって選択される全ての候補パッチのスコアを算出すると(ステップS204)、IDマップ作成部509が、注目中の未知顔画像パッチの周囲領域内で最高スコアをもつ対象IDで、未知顔画像パッチの各々にラベル付けする(ステップS301)。未知顔画像内の、位置、すなわち、未知顔画像パッチのそれぞれに関して、IDマップ作成部509は、未知顔画像パッチのラベルとして、未知顔画像パッチの周囲領域内で最高スコアをもつ対象IDを選択する。IDマップ作成部509は、未知入力画像の全ての未知顔画像パッチにラベル付けした後、IDマップ作成部509は、未知入力画像のための対象IDマップを作成、すなわち生成する(ステップS302)。対象IDマップは、未知顔画像パッチの各々について、未知顔画像パッチを、その未知顔画像パッチについて選択されている対象IDと関連付ける表であってよい。
図13は、対象IDマップの視覚化した例を示す図であり、同じパターンをもつ領域は、同じ対象IDでラベル付けされた領域を示す。
第2のスコア算出部510が、推定部207によって得られた候補パッチの各々のスコアを算出する(ステップS303)。数3は、候補パッチの各々のスコアの例を示す数式であり、各対象IDでラベル付けされた面積(area)に比例する重みと共に、GLVQの誤分類尺度で算出される。
Figure 0006443540
ここで、area(ID)は、IDマップにおいてIDでラベル付けされたパッチの数である。
第2のスコア算出部510が、対象IDによりラベル付けされた領域に比例する重みを用いるスコアを算出し直すので、第2の実施形態による画像処理装置500は、パッチが選択される対象の数をさらに限定する。未知入力画像上で、より大きな面積を占有する対象IDからのパッチは、第2のスコア算出部510においてより高いスコアを得る可能性が高いだろう。従って、画像再構成部210は、未知顔画像と比較してより鮮明な画像を再構成することができる。入力部201が同類画像を受信し、その後画像記憶部205が同類画像パッチを記憶する場合、第2の実施形態は、同類画像パッチから選択されるパッチを増やし、元の同類画像に近い画像を再構成する。
<第3の実施形態>
次に、本発明の第3の実施形態について、図面を参照しながら詳細に説明することとする。
本発明の実施形態においては、高解像度の細部が、訓練データベースに含まれる同類顔画像を用いて、縮小されぼかされた顔画像から推定される。
図9は、この実施形態による画像処理装置500の構成の例を示す図である。この実施形態による画像処理装置500は、第2の実施形態による画像処理装置500の構成と同じ構成を有する。この実施形態による画像処理装置500の各構成要素は、以下の違いを除き、第2の実施形態による画像処理装置500において同じ符号をもつ構成要素と同じである。
画像合成部202は、入力画像を正規化することによって、「訓練画像」と記述される正規化入力画像を生成する。画像合成部202は、さらに、正規化入力顔画像を劣化させることによって、すなわち、縮小すること及び/又はぼかすことによって、劣化訓練画像を生成する。画像合成部202は、劣化訓練画像の劣化レベルが、低解像度未知入力画像(すなわち、低解像度未知顔画像)と同様であるように、正規化入力顔画像を劣化させる(例えば、縮小させ、そして、ぼかす)。低解像度未知入力画像(低解像度未知顔画像)の劣化レベルは、例えば、M. Nishiyama, A. Hadid, H. Takeshima, J. Shotton, T. Kazakaya, O. Yamaguchi, "Facial Deblur Inference using subspace analysis for recognition of blurred faces", IEEE Trans. Pattern Anal. Mach. Intell., Vol. 44, no. 4, pp. 838-845, 2011に記載される部分空間解析によって推定できる。劣化レベルは、画像処理装置500と通信可能に接続される端末装置(図示せず)を介して、画像処理装置500の利用者によって手で決定されてもよい。
画像分割部204は、訓練画像を重複するパッチに分割する。訓練画像を分割することによって生成される重複するパッチは、以下において、「訓練パッチ」または「高解像度訓練パッチ」と記述される。画像分割部204は、さらに、劣化訓練画像を重複するパッチに分割する。劣化訓練パッチを分割することによって生成される重複するパッチは、以下において、「劣化訓練パッチ」と記述される。画像分割部204は、各劣化訓練パッチが、訓練パッチのうちのひとつの劣化画像であるように、訓練画像および劣化訓練画像を分割する。各劣化訓練パッチに関して、画像分割部204は、劣化訓練パッチと、劣化画像がその劣化訓練パッチである高解像度訓練パッチとのペアを生成する。劣化訓練パッチおよび訓練パッチのペアを、以下において、「パッチペア」と記載する。画像分割部204は、さらに、各訓練画像について、訓練画像から生成される各パッチペアを、その訓練画像の対象IDと関連付ける。画像分割部204は、対象IDと、それぞれが対象IDのうちのひとつと関連付けられる画像ペアとを、画像記憶部205に格納する。それらのパッチペアに含まれる1つのパッチペアと関連付けられる対象IDは、また、そのパッチペア内に含まれる劣化訓練パッチと訓練パッチとに関連付けられる。
画像記憶部205は、入力画像の対象IDと、それぞれ対象IDのうちのひとつと関連付けられるパッチペアとを記憶する。
推定部207は、入力クエリーパッチの各々について、画像記憶部205に格納されるパッチペアに含まれる劣化訓練パッチの中から、候補パッチのセットを選択する。入力クエリーパッチは、低解像度の未知顔画像(すなわち、入力クエリー画像)が、画像分割部204によって分割された、重複するパッチである。推定部207は、入力クエリーパッチの各々について、各対象IDと関連付けられる劣化訓練パッチの中で、入力クエリーパッチに最も類似する劣化訓練パッチを、その入力クエリーパッチのための候補パッチのひとつとして、選択してもよい。
画像再構成部210は、パッチ置換部209により置換されていない最近傍パッチおよび最高スコアをもつ置換されたパッチである、選択された劣化訓練パッチを含むパッチペアに含まれる訓練パッチを組み合わせて、高解像度画像を再構成する。
次に、この実施形態による画像処理装置500の動作について、図面を参照しながら詳細に説明することとする。
図14は、訓練フェーズにおける、この実施形態による画像処理装置500の動作の例を示すフローチャートである。図4に示すステップと同じであるステップに、同じ符号が割り当てられるものとし、それらのステップの説明は省略する。
画像合成部202は、正規化入力画像(すなわち、正規化された高解像度顔画像)を劣化させることによって訓練画像を生成する(ステップS401)。訓練画像は、正規化高解像度顔画像から取得される。訓練フェーズでは、画像合成部202は、劣化レベルが低解像度未知入力画像と同様であるように、訓練画像を縮小しそしてぼやけさせる。上述のように、低解像度画像の劣化レベルは、例えば、非特許文献2に記載される部分空間解析によって推定可能である。訓練画像は、任意の劣化レベルまで、手で縮小され、ぼかされてもよい。縮小し、ぼかした後、画像分割部204が、訓練画像を、重複するパッチすなわち高解像度訓練パッチ(訓練パッチ)に分割する(ステップS104)。画像分割部204は、また、劣化訓練画像を、重複するパッチに、すなわち劣化訓練パッチに分割する(ステップS402)。画像分割部204は、劣化訓練パッチの各々を関連する高解像度訓練パッチと紐付け、紐付けられた劣化訓練パッチと高解像度パッチとを含むパッチペアを作成する。訓練画像の各々の対象IDは、また、訓練パッチペアの各々が対象IDをもつように、訓練フェーズで画像ID登録部203によって登録される。対象IDは、訓練画像内の撮像された顔の識別情報に対応するように割り当てられることが可能である。対象IDは、例えば性別、年齢等の、画像の他の特徴に従って、割り当てられ、分類されてもよい。
図12は、再構成フェーズにおける、この実施形態による画像処理装置500の動作の例を示すフローチャートである。以下の説明は、主に、本実施形態に係る画像処理装置500の動作と第2の実施形態に係る画像処理装置500の動作との差異を中心に行う。第2の実施形態に係る画像処理装置500の動作と同じ動作の詳細な説明は省略する。
再構成フェーズにおいて、低解像度のぼかされた未知顔画像がシステムに入力される(ステップS201)。画像分割部204は、未知入力画像を、重複するパッチに、すなわち、入力クエリーパッチに分割する(ステップS202)。入力クエリーパッチの各々について、推定部207は、辞書(すなわち、画像記憶部205)内の劣化訓練パッチの中で入力クエリーパッチに最も近い候補パッチのセットを探索し選択する(ステップS203)。セット内の候補パッチの各々は、対象IDをもつ。入力クエリーパッチの各々について、スコア算出部208は、候補パッチのセット内の対象IDの各々のスコアを算出し、それにより、最後に入力クエリーパッチの各々における、対象IDの各々のスコアが得られる(ステップS204)。
スコア算出部208は、入力クエリーパッチの各々を囲む領域において、対象IDの各々のスコアの和を算出する(ステップS204)。その領域は、人手で、または経験によって決定可能である。例えば、和を算出される上記領域が、各入力クエリーパッチを囲む3×3パッチ内の領域であるように設定されうる。IDマップ作成部509は、注目中の領域においてスコアの和が最大である対象IDで、注目中の入力クエリーパッチをラベル付けする(ステップS301)。すなわち、IDマップ作成部509が、入力クエリーパッチの各々を囲む領域においてそのスコアの和が最大である対象IDを選択する。IDマップ作成部509が¥は、選択された対象IDおよび入力クエリーパッチの各々の位置に従って、対象IDマップを生成する(ステップS302)。全ての入力クエリーパッチがラベル付けされると、対象IDマップが得られる。
第2のスコア算出部510は、その後、対象IDマップ上の対象IDの面積でスコアを重み付けすることによって、入力クエリーパッチの各々における対象IDの各々の候補パッチのスコアを再計算する(ステップS303)。選択された入力クエリーパッチに関して、パッチ置換部209は、高解像度画像の再構成のために、最高スコアをもつ候補パッチを選択する(ステップS207)。この処理は、入力クエリー画像上の全ての入力クエリーパッチについて繰り返される(ステップS209)。画像再構成部210は、選択された候補パッチに対して高解像度画像を再構成する(ステップS211)。具体的には、画像再構成部210は、選択された候補パッチのうちのひとつを含むパッチペアにそれぞれ含まれる訓練パッチを組み合わせることによって、高解像度画像を再構成する。
再構成フェーズにおいて、パッチは、周囲の候補パッチおよびそれらの対象IDの情報をもって、より正確に選択される。特に、画像記憶部205に記憶されるパッチペアおよび関連する対象IDである、訓練データベース内の同類対象の顔画像によれば、背景技術として上で述べた文献に開示される方法(すなわち、最近傍パッチを用いることのみによる)によって正確に選択されるパッチが一部のみであっても、誤って選択されたパッチは、画像全体の他のパッチの対象ID情報を用いて、正確なパッチで置換されうる。
<第3の実施形態の変形例>
第3の実施形態の変形例に係る画像処理装置200は、図2に示す第1の実施形態による画像処理装置200の構成と同じ構成を有してもよい。この場合、
訓練フェーズにおいて、変形例に係る画像処理装置200の画像合成部202、画像分割部204、画像記憶部205および画像再構成部210は、第3の実施形態による画像処理装置500のそれらと同じである。
訓練フェーズにおいて、本変形例に係る画像処理装置200は、第3の実施形態に係る画像処理装置500と同様に動作する。再構成フェーズにおいて、本変形例に係る画像処理装置200は、図6に示すステップS211を除き、第1の実施形態に係る画像処理装置200と同様に動作する。ステップS211では、変形例に係る画像処理装置200は、第3の実施形態に係る画像処理装置500と同様に動作する。
<第4の実施形態>
次に、第4の実施形態について、図面を参照しながら詳細に説明する。
図15は、本実施形態に係る画像処理装置200Aの構成の例を示すブロック図である。
図15を参照すると、本発明の本実施形態に係る画像処理装置200Aは、ターゲット未知パッチを含む局所未知パッチの各々について、局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、局所未知パッチは未知画像の一部分から生成される画像であり、上記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、上記複数の入力画像の中で上記対象IDが割り当てられる入力画像から生成される上記入力パッチに関連付けられる、推定部207と、それらの複数の局所未知パッチの局所未知パッチに対する、複数の候補パッチの候補パッチの近さを表すスコアを算出するスコア算出部208と局所未知パッチの上記候補パッチ内で同じ対象IDと関連付けられている候補パッチのスコアを合計することにより、対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、ターゲット未知パッチについて選択された候補パッチから、スコア合計が最高である対象IDに関連付けられる候補パッチを選択するパッチ置換部209と、を備える。
本実施形態は、第1の実施形態と同様の効果を有する。上記効果の理由は、第1の実施形態のものと同様である。
<他の実施形態>
画像処理装置200、画像処理装置200Aおよび画像処理装置500のそれぞれは、コンピュータおよびそのコンピュータを制御するプログラム、専用ハードウェア、または、コンピュータ及びそのコンピュータを制御するプログラムと専用ハードウェアとの組合せを用いて実施可能である。
図16は、画像処理装置200、画像処理装置200Aおよび画像処理装置500を実現することができるコンピュータ1000のハードウェア構成の例を示すブロック図である。図16を参照すると、コンピュータ1000は、プロセッサ1001、メモリ1002、記憶装置1003およびI/O(Input/Output)インタフェース1004を含む。コンピュータ1000は、記憶媒体1005にアクセス可能である。メモリ1002および記憶装置1003のそれぞれは、例えばRAM(Random Access Memory)またはハードディスクドライブ等の記憶装置であってもよい。記憶媒体1005は、RAM、例えばハードディスクドライブ等の記憶装置、ROM(Read Only Memory)または可搬記憶媒体であってもよい。記憶装置1003が、記憶媒体1005として動作してもよい。プロセッサ1001は、メモリ1002及び記憶装置1003からのデータおよびプログラムを読み出すことができ、メモリ1002および記憶装置1003にデータおよびプログラムを書き込むことができる。プロセッサ1001は、I/Oインタフェース1004を介して端末装置(図示せず)等と通信できる。プロセッサ1001は、記憶媒体1005にアクセスできる。記憶媒体1005は、コンピュータ1000を画像処理装置200、画像処理装置200Aまたは画像処理装置500として動作させるプログラムを記憶する。
プロセッサ1001は、記憶媒体1005に格納されている、コンピュータ1000を画像処理装置200、画像処理装置200Aまたは画像処理装置500として動作させるプログラムを、メモリ1002にロードする。コンピュータ1000は、メモリ1002にロードされたプログラムを実行することによって、画像処理装置200、画像処理装置200Aまたは画像処理装置500として動作する。
入力部201、画像合成部202、画像ID登録部203、画像分割部204、未知画像入力部206、推定部207、スコア算出部208、パッチ置換部209、画像再構成部210、IDマップ算出部509および第2のスコア算出部510は、記憶媒体1005からメモリ1002にロードされた、上述の各部を実現できる専用プログラムと、その専用プログラムを実行するプロセッサ1001とによって実現できる。画像記憶部205は、メモリ1002、および/または、例えばハードディスク装置等の記憶装置によって実現できる。入力部201、画像合成部202、画像ID登録部203、画像分割部204、画像記憶部205、未知画像入力部206、推定部207、スコア算出部208、パッチ置換部209、画像再構成部210、IDマップ算出部509および第2のスコア算出部510の一部または全ては、上述の各部の機能を実現する専用回路によって実現できる。
上記した実施形態の一部または全ては、以下の付記に記載されうるが、以下に限定されない。
<付記1>
ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチに関連付けられる、推定手段と、
前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出する第1のスコア算出手段と、
前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択するパッチ置換手段と、
を備える画像処理装置。
<付記2>
前記候補パッチに割り当てられている前記対象IDについて、前記スコアに基づいて前記局所未知パッチのうちのいずれかひとつに最も近い前記候補パッチの数を集計し、前記候補パッチに割り当てられている前記対象IDについて、前記数に基づいて前記候補パッチの前記スコアを再計算する第2のスコア算出手段
をさらに備える付記1記載の画像処理装置。
<付記3>
重複を許容して分割することにより、前記入力画像から前記入力パッチを、前記未知画像から前記局所未知パッチを生成する画像分割手段と、
前記入力パッチの対象入力パッチを、前記対象入力パッチが生成された前記入力画像に割り当てられている前記対象IDと関連付ける画像ID登録手段と、
をさらに備え、付記1または2に記載の画像処理装置。
<付記4>
対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化する画像合成手段と、
選択された前記パッチを用いて、前記再構成画像を再構成する画像再構成手段と、
をさらに備え、
前記画像分割手段は、正規化された前記入力画像を、重複を許容して前記入力パッチに分割し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像である、
付記3記載の画像処理装置。
<付記5>
対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化し、正規化された前記入力画像を劣化させる画像合成手段
をさらに備え、
前記画像分割手段は、正規化され劣化されられた前記入力画像を、重複を許容して前記入力パッチに分割し、前記入力パッチのそれぞれと前記正規化された入力画像の一部分である再構成パッチとを含むパッチペアを、前記パッチペアの各々に含まれる前記入力パッチが当該パッチペアに含まれる前記再構成パッチの劣化画像に対応するように生成し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像であり、
前記画像処理装置は、
選択された前記パッチを含む前記パッチペアに含まれる前記再構成パッチを用いて、前記再構成画像を再構成する画像再構成手段
をさらに含む、付記3記載の画像処理装置。
<付記6>
前記複数の入力画像を受信する入力手段と、
前記未知画像を受信する未知画像入力手段と、
前記複数の入力パッチを記憶する画像記憶手段と
をさらに含み、
前記画像ID登録手段が、前記複数の入力画像のそれぞれに対して当該入力画像の識別情報に従って前記対象IDを割り当て、
前記画像分割手段が、前記画像記憶手段に前記複数の入力パッチを格納し、前記複数の入力パッチのそれぞれについて、当該入力パッチが生成された前記入力画像の前記対象IDは、前記入力パッチと関連付けられている、
付記3から5のいずれか一項に記載の画像処理装置。
<付記7>
ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチに関連付けられ、
前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出し、
前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択する
画像処理方法。
<付記8>
前記候補パッチに割り当てられている前記対象IDについて、前記スコアに基づいて前記局所未知パッチのうちのいずれかひとつに最も近い前記候補パッチの数を集計し、前記候補パッチに割り当てられている前記対象IDについて、前記数に基づいて前記候補パッチの前記スコアを再計算する
付記7記載の画像処理方法。
<付記9>
重複を許容して分割することにより、前記入力画像から前記入力パッチを、前記未知画像から前記局所未知パッチを生成し、
前記入力パッチの対象入力パッチを、前記対象入力パッチが生成された前記入力画像に割り当てられている前記対象IDと関連付ける、
付記7または8に記載の画像処理方法。
<付記10>
対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化し、
選択された前記パッチを用いて、前記再構成画像を再構成し、
正規化された前記入力画像を、重複を許容して前記入力パッチに分割し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像である、
付記9記載の画像処理方法。
<付記11>
対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化し、正規化された前記入力画像を劣化させ、
正規化され劣化されられた前記入力画像を、重複を許容して前記入力パッチに分割し、前記入力パッチのそれぞれと前記正規化された入力画像の一部分である再構成パッチとを含むパッチペアを、前記パッチペアの各々に含まれる前記入力パッチが当該パッチペアに含まれる前記再構成パッチの劣化画像に対応するように生成し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像であり、
選択された前記パッチを含む前記パッチペアに含まれる前記再構成パッチを用いて、前記再構成画像を再構成する
付記9記載の画像処理方法。
<付記12>
前記複数の入力画像を受信し、
前記未知画像を受信し、
前記複数の入力パッチを画像記憶手段に記憶し、
前記複数の入力画像のそれぞれに対して当該入力画像の識別情報に従って前記対象IDを割り当て、
前記画像記憶手段に前記複数の入力パッチを格納し、前記複数の入力パッチのそれぞれについて、当該入力パッチが生成された前記入力画像の前記対象IDは、前記入力パッチと関連付けられている、
付記9から11のいずれか一項に記載の画像処理方法。
<付記13>
コンピュータを、
ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチと関連付けられる、推定手段と、
前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出する第1のスコア算出手段と、
前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択するパッチ置換手段と
して動作させるプログラムを記憶する、コンピュータ読み取り可能な記憶媒体。
<付記14>
コンピュータを、
前記候補パッチに割り当てられている前記対象IDについて、前記スコアに基づいて前記局所未知パッチのうちのいずれかひとつに最も近い前記候補パッチの数を集計し、前記候補パッチに割り当てられている前記対象IDについて前記数に基づいて前記候補パッチの前記スコアを再計算する第2のスコア算出手段と
して動作させるプログラムを記憶する、付記13記載のコンピュータ読み取り可能な記憶媒体。
<付記15>
コンピュータを、
重複を許容して分割することにより、前記入力画像から前記入力パッチを、前記未知画像から前記局所未知パッチを生成する画像分割手段と、
前記入力パッチの対象入力パッチを、前記対象入力パッチが生成された前記入力画像に割り当てられている前記対象IDと関連付ける画像ID登録手段と
して動作させるプログラムを記憶する、付記13または14に記載のコンピュータ読み取り可能な記憶媒体。
<付記16>
コンピュータを、
対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化する画像合成手段と、
選択された前記パッチを用いて、前記再構成画像を再構成する画像再構成手段と、
正規化された前記入力画像を、重複を許容して前記入力パッチに分割し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像である、前記画像分割手段と、
して動作させるプログラムを記憶する、付記15記載のコンピュータ読み取り可能な記憶媒体。
<付記17>
コンピュータを、
対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化し、正規化された前記入力画像を劣化させる画像合成手段と、
正規化され劣化されられた前記入力画像を、重複を許容して前記入力パッチに分割し、前記入力パッチのそれぞれと前記正規化された入力画像の一部分である再構成パッチとを含むパッチペアを、前記パッチペアの各々に含まれる前記入力パッチが当該パッチペアに含まれる前記再構成パッチの劣化画像に対応するように生成し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像である前記画像分割手段と、
選択された前記パッチを含む前記パッチペアに含まれる前記再構成パッチを用いて、前記再構成画像を再構成する画像再構成手段と、
して動作させるプログラムを記憶する、付記15記載のコンピュータ読み取り可能な記憶媒体。
<付記18>
コンピュータを、
前記複数の入力画像を受信する入力手段と、
前記未知画像を受信する未知画像入力手段と、
前記複数の入力パッチを記憶する画像記憶手段と
前記複数の入力画像のそれぞれに対して当該入力画像の識別情報に従って前記対象IDを割り当てる前記画像ID登録手段と、
前記画像記憶手段に前記複数の入力パッチを格納し、前記複数の入力パッチのそれぞれについて、当該入力パッチが生成された前記入力画像の前記対象IDは、前記入力パッチと関連付けられている、前記画像分割手段と、
して動作させるプログラムを記憶する、付記15から17のいずれか一項に記載のコンピュータ読み取り可能な記憶媒体。
特にその実施形態を参照しながら本発明を示し記載したが、この発明はこれら実施形態に限定されない。請求項によって既定される、本発明の精神およびスコープから逸脱することなく、形態および詳細に様々な変更がなされうることは当業者によって理解されるであろう。
本発明は、通常低解像度でありぼやけている監視カメラ画像から、高解像度画像を再構成するために利用することが可能である。本発明はまた、対象画像がデータベースに登録されるという条件で、オクルージョンや低解像度等を伴う顔画像での顔認識に利用することが可能である。
200 画像処理装置
200A 画像処理装置
201 入力部
202 画像合成部
203 画像ID登録部
204 画像分割部
205 画像記憶部
206 未知画像入力部
207 推定部
208 スコア算出部
209 パッチ置換部
210 画像再構成部
401 パッチのスコア
402 スコア
403 注目中のパッチ
404 周囲領域
500 画像処理装置
509 IDマップ作成部
510 第2のスコア算出部
1000 コンピュータ
1001 プロセッサ
1002 メモリ
1003 記憶装置
1004 I/Oインタフェース
1005 記憶媒体

Claims (10)

  1. ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチに関連付けられる、推定手段と、
    前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出する第1のスコア算出手段と、
    前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択するパッチ置換手段と、
    を備える画像処理装置。
  2. 前記候補パッチに割り当てられている前記対象IDについて、前記スコアに基づいて前記局所未知パッチのうちのいずれかひとつに最も近い前記候補パッチの数を集計し、前記候補パッチに割り当てられている前記対象IDについて、前記数に基づいて前記候補パッチの前記スコアを再計算する第2のスコア算出手段
    をさらに備える請求項1記載の画像処理装置。
  3. 重複を許容して分割することにより、前記入力画像から前記入力パッチを、前記未知画像から前記局所未知パッチを生成する画像分割手段と、
    前記入力パッチの対象入力パッチを、前記対象入力パッチが生成された前記入力画像に割り当てられている前記対象IDと関連付ける画像ID登録手段と、
    をさらに備え、請求項1または2に記載の画像処理装置。
  4. 対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化する画像合成手段と、
    選択された前記候補パッチを用いて、前記再構成画像を再構成する画像再構成手段と、
    をさらに備え、
    前記画像分割手段は、正規化された前記入力画像を、重複を許容して前記入力パッチに分割し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像である、
    請求項3記載の画像処理装置。
  5. 対応する特徴点が、前記入力画像間で同じ位置であるように、前記入力画像を正規化し、正規化された前記入力画像を劣化させる画像合成手段
    をさらに備え、
    前記画像分割手段は、正規化され劣化されられた前記入力画像を、重複を許容して前記入力パッチに分割し、前記入力パッチのそれぞれと前記正規化された入力画像の一部分である再構成パッチとを含むパッチペアを、前記パッチペアの各々に含まれる前記入力パッチが当該パッチペアに含まれる前記再構成パッチの劣化画像に対応するように生成し、前記未知画像を、重複を許容して未知パッチに分割し、前記未知パッチは、前記局所未知パッチを含む画像であり、
    前記画像処理装置は、
    選択された前記候補パッチを含む前記パッチペアに含まれる前記再構成パッチを用いて、前記再構成画像を再構成する画像再構成手段
    をさらに含む、請求項3記載の画像処理装置。
  6. 前記複数の入力画像を受信する入力手段と、
    前記未知画像を受信する未知画像入力手段と、
    前記複数の入力パッチを記憶する画像記憶手段と
    をさらに含み、
    前記画像ID登録手段が、前記複数の入力画像のそれぞれに対して当該入力画像の識別情報に従って前記対象IDを割り当て、
    前記画像分割手段が、前記画像記憶手段に前記複数の入力パッチを格納し、前記複数の入力パッチのそれぞれについて、当該入力パッチが生成された前記入力画像の前記対象IDは、前記入力パッチと関連付けられている、
    請求項3から5のいずれか一項に記載の画像処理装置。
  7. ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチに関連付けられ、
    前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出し、
    前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択する
    画像処理方法。
  8. コンピュータを、
    ターゲット未知パッチを含む複数の局所未知パッチの各々について、前記局所未知パッチに対する類似性に基づいて複数の入力パッチから複数の候補パッチを選択し、前記局所未知パッチは未知画像の一部分から生成される画像であり、前記複数の入力パッチは複数の入力画像から生成される画像であり、対象ID(Identifier)は、前記複数の入力画像の中で前記対象IDが割り当てられる入力画像から生成される前記入力パッチと関連付けられる、推定手段と、
    前記複数の局所未知パッチの局所未知パッチに対する、前記複数の候補パッチの候補パッチの近さを表すスコアを算出する第1のスコア算出手段と、
    前記局所未知パッチの前記候補パッチ内で同じ対象IDと関連付けられている前記候補パッチのスコアを合計することにより、前記対象IDに関するスコア合計を算出し、再構成画像の再構成に用いられる選択パッチとして、前記ターゲット未知パッチについて選択された前記候補パッチから、前記スコア合計が最高である前記対象IDに関連付けられる候補パッチを選択するパッチ置換手段と
    して動作させるプログラム。
  9. コンピュータを、
    前記候補パッチに割り当てられている前記対象IDについて、前記スコアに基づいて前記局所未知パッチのうちのいずれかひとつに最も近い前記候補パッチの数を集計し、前記候補パッチに割り当てられている前記対象IDについて前記数に基づいて前記候補パッチの前記スコアを再計算する第2のスコア算出手段と
    して動作させる請求項8に記載のプログラム。
  10. コンピュータを、
    重複を許容して分割することにより、前記入力画像から前記入力パッチを、前記未知画像から前記局所未知パッチを生成する画像分割手段と、
    前記入力パッチの対象入力パッチを、前記対象入力パッチが生成された前記入力画像に割り当てられている前記対象IDと関連付ける画像ID登録手段と
    して動作させる請求項8または9に記載のプログラム。
JP2017510420A 2014-09-03 2014-09-03 画像処理装置、画像処理方法および記憶媒体 Active JP6443540B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/004511 WO2016035107A1 (en) 2014-09-03 2014-09-03 Image processing device, image processing method and storage medium

Publications (2)

Publication Number Publication Date
JP2017531244A JP2017531244A (ja) 2017-10-19
JP6443540B2 true JP6443540B2 (ja) 2018-12-26

Family

ID=55439218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017510420A Active JP6443540B2 (ja) 2014-09-03 2014-09-03 画像処理装置、画像処理方法および記憶媒体

Country Status (3)

Country Link
US (1) US10225575B2 (ja)
JP (1) JP6443540B2 (ja)
WO (1) WO2016035107A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10798387B2 (en) * 2016-12-12 2020-10-06 Netflix, Inc. Source-consistent techniques for predicting absolute perceptual video quality
CN112016623A (zh) * 2020-08-28 2020-12-01 佳都新太科技股份有限公司 一种人脸聚类方法、装置、设备及存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6496184B1 (en) 1998-11-30 2002-12-17 William T. Freeman Method for inferring scenes from test images and training data using probability propagation in a markov network
US9111146B2 (en) * 2008-02-15 2015-08-18 Tivo Inc. Systems and methods for semantically classifying and normalizing shots in video
EP2131594B1 (en) * 2008-06-06 2013-08-14 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Method and device for image compression
US8538200B2 (en) * 2008-11-19 2013-09-17 Nec Laboratories America, Inc. Systems and methods for resolution-invariant image representation
JP5506274B2 (ja) * 2009-07-31 2014-05-28 富士フイルム株式会社 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム
EP2469468A4 (en) 2009-08-18 2014-12-03 Univ Osaka Prefect Public Corp OBJECT DETECTION METHOD
WO2011061943A1 (ja) * 2009-11-20 2011-05-26 日本電気株式会社 画像修復システム、画像修復方法及び画像修復プログラム
EP2666291A1 (en) * 2011-01-21 2013-11-27 Thomson Licensing Method and device for extracting an epitome
WO2013089261A1 (ja) 2011-12-12 2013-06-20 日本電気株式会社 画像処理システム及び画像処理方法
JP6015670B2 (ja) * 2011-12-12 2016-10-26 日本電気株式会社 画像処理装置及び画像処理方法
WO2013089265A1 (ja) * 2011-12-12 2013-06-20 日本電気株式会社 辞書作成装置、画像処理装置、画像処理システム、辞書作成方法、画像処理方法及びプログラム
US8675999B1 (en) * 2012-09-28 2014-03-18 Hong Kong Applied Science And Technology Research Institute Co., Ltd. Apparatus, system, and method for multi-patch based super-resolution from an image
JP6102938B2 (ja) * 2012-11-06 2017-03-29 日本電気株式会社 画像処理装置、及び、画像処理方法
US9117262B2 (en) * 2012-11-30 2015-08-25 Adobe Systems Incorporated Learned piece-wise patch regression for image enhancement
EP2930684B1 (en) * 2012-12-06 2021-03-03 NEC Corporation Image processing device and image processing method
WO2014162690A1 (ja) * 2013-04-05 2014-10-09 日本電気株式会社 情報処理装置、及び、画像処理方法
WO2014192487A1 (ja) * 2013-05-29 2014-12-04 日本電気株式会社 多眼撮像システム、取得画像の合成処理方法、及びプログラム
KR102091136B1 (ko) * 2013-07-02 2020-03-19 삼성전자주식회사 영상 화질 개선 방법, 장치 및 기록 매체
WO2015022771A1 (ja) * 2013-08-15 2015-02-19 日本電気株式会社 画像処理を実行する情報処理装置及び画像処理方法

Also Published As

Publication number Publication date
US10225575B2 (en) 2019-03-05
WO2016035107A1 (en) 2016-03-10
JP2017531244A (ja) 2017-10-19
US20170280158A1 (en) 2017-09-28

Similar Documents

Publication Publication Date Title
EP3333768A1 (en) Method and apparatus for detecting target
WO2016054779A1 (en) Spatial pyramid pooling networks for image processing
Ryu et al. Detecting trace of seam carving for forensic analysis
JP6512100B2 (ja) 画像処理を実行する情報処理装置及び画像処理方法
Dietlmeier et al. How important are faces for person re-identification?
JP5936561B2 (ja) 画像における外観及びコンテキストに基づく物体分類
JP6937508B2 (ja) 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム
Demir et al. Clustering-based extraction of border training patterns for accurate SVM classification of hyperspectral images
Lee et al. Video saliency detection based on spatiotemporal feature learning
JP2020135465A (ja) 学習装置、学習方法、プログラムおよび認識装置
US20180047158A1 (en) Chest radiograph (cxr) image analysis
Thanh et al. An adaptive local thresholding roads segmentation method for satellite aerial images with normalized HSV and lab color models
JP6443540B2 (ja) 画像処理装置、画像処理方法および記憶媒体
Major et al. Interpreting medical image classifiers by optimization based counterfactual impact analysis
Cristani et al. Person re-identification
JP2005253000A (ja) 画像処理装置
JP6434718B2 (ja) 顔画像認識装置及び顔画像認識プログラム
Amelio et al. An evolutionary approach for image segmentation
CN111428612A (zh) 行人重识别方法、终端、装置及存储介质
CN113160199B (zh) 影像识别方法、装置、计算机设备和存储介质
US9536144B2 (en) Automatic image classification
Dong et al. GIAD: Generative inpainting-based anomaly detection via self-supervised learning for human monitoring
US20240005507A1 (en) Image processing method, apparatus and non-transitory computer readable medium for performing image processing
US11200676B2 (en) Shift invariant loss for deep learning based image segmentation
Yan et al. Robust online tracking via adaptive samples selection with saliency detection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181112

R150 Certificate of patent or registration of utility model

Ref document number: 6443540

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150