JP2017146840A - 画像処理装置およびプログラム - Google Patents

画像処理装置およびプログラム Download PDF

Info

Publication number
JP2017146840A
JP2017146840A JP2016029066A JP2016029066A JP2017146840A JP 2017146840 A JP2017146840 A JP 2017146840A JP 2016029066 A JP2016029066 A JP 2016029066A JP 2016029066 A JP2016029066 A JP 2016029066A JP 2017146840 A JP2017146840 A JP 2017146840A
Authority
JP
Japan
Prior art keywords
image
size
recognition target
learning model
candidate area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016029066A
Other languages
English (en)
Inventor
福井 基文
Motofumi Fukui
基文 福井
尾崎 良太
Ryota Ozaki
良太 尾崎
加藤 典司
Noriji Kato
典司 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2016029066A priority Critical patent/JP2017146840A/ja
Priority to US15/211,647 priority patent/US9886646B2/en
Publication of JP2017146840A publication Critical patent/JP2017146840A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

【課題】認識対象画像から候補領域を切り出して対象物が含まれているか否かを判定する認識処理を高速化する。
【解決手段】学習モデル生成部31は、学習画像から切り出された識別対象領域の画像を予め定められた一定のサイズに統一した後に画像特徴を抽出して学習モデルを生成する。候補領域決定部35は、認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する。画像サイズ選択部36は、認識対象画像格納部34に格納されている複数の画像サイズの認識対象画像の中から、決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが学習モデルを生成の際に識別対象領域の画像を統一したサイズに最も近くなる画像サイズの認識対象画像を選択する。画像特徴抽出部37は、選択された画像サイズの認識対象画像から候補領域の画像の特徴を示す画像特徴を抽出する。
【選択図】図2

Description

本発明は、画像処理装置およびプログラムに関する。
特許文献1には、画像データから所定の特徴ベクトルを抽出して画像を複数の分類項目に分類し、検索できるようにする際に、画像データから異なる解像度で特徴量を抽出する画像検索装置が開示されている。
特許文献2には、識別対象のコンテンツ(正例コンテンツ)の特徴量と識別対象外のコンテンツ(負例コンテンツ)の特徴量に基づいた学習を行うことにより学習モデルを構築するようにしたコンテンツ識別装置が開示されている。
特許文献3には、対象物を含む複数の学習用画像に対して、当該学習用画像内の対象物の大きさに応じて輪郭部分の階調差が異なるような前処理を行い、前処理された各学習用画像に基づいて、対象物の特徴を示す学習モデルを生成するようにした学習モデル生成装置が開示されている。
特許文献4には、画像を複数の領域に分割して、各領域が人物領域とどの程度重なり合っているのかを判定することにより、高速に画像中の人物を検出できるようにした人物検出装置が開示されている。
特許文献5には、画像の領域特徴及びそれらのスコアを算出し、画像の領域を囲むことで最大のスコアの領域を探索するようにした画像処理装置が開示されている。
特許文献6には、画像をスコアにより閾値処理することで識別対象外のグループを複数作成し、そのグループに対する学習モデルを構築することで画像に対する学習モデルの識別能力を向上させるようにした画像識別装置が開示されている。
非特許文献1には、スライディングウィンドウ形式でテンプレートマッチングを行う手法が開示されている。
非特許文献2には、窓枠を画像全体で走査するのではなく、オブジェクト候補領域を認識処理前に抽出し、その候補領域を認識対象とする手法が提案されている。
特開2003−256427号公報 特開2006−099565号公報 特開2009−289189号公報 特開2010−102396号公報 特開2012−164226号公報 特開2014−135014号公報
P.Felzenszwalb, R.Girshick, D.McAllester, and D.Ramanan, "Object Detection with Discriminatively Trained Part Based Models.", PAMI, 2010. JRR. Uijlings, KEA. Van de Sande, T. Gevers, and AWM. Smeulders, "Selective Search for Object Recognition.", IJCV, 2013.
画像から特定のオブジェクト(対象物)を認識するオブジェクト認識を行う場合、従来は、スライディングウィンドウ形式でのテンプレートマッチングが行われていた。
このテンプレートマッチングとは、認識したいオブジェクトに対応したテンプレートを画像全体にわたって走査して、このテンプレート毎に画像特徴を抽出して、事前に学習した学習モデルを用いることにより認識したいオブジェクトを判定するものであった。認識対象のオブジェクトの種類が顔や人など比較的サイズやアスペクト比に変動がない場合、これらテンプレートの種類が少ない場合でも問題は生じなかった。
しかし、画像内の任意の複数種類のオブジェクトを検出したい場合、各オブジェクトのサイズやアスペクト比は様々であるため、オブジェクトのサイズに応じてテンプレートを拡大・縮小して画像特徴を抽出する必要があり、探索空間が広がることによりオブジェクトの認識に時間がかかる場合があった。
そのため、テンプレートマッチングにより画像全体を走査するのではなく、オブジェクトが存在すると思われる候補領域を画像から複数抽出し、抽出した複数の候補領域を認識対象としてそこから画像特徴を抽出してオブジェクト認識を行う方法が提案されている(非特許文献2参照)。
この方法では、認識対象となる候補領域が例えば1000程度と限定されるため、スライディングウィンドウ形式でのテンプレートマッチングによりオブジェクト認識を行う場合と比較して、候補領域抽出を高速に行えるのであればオブジェクト認識を高速化することが可能となる。
しかし、候補領域から抽出された画像特徴によりオブジェクトか否かの判定を行うための学習モデルは、予め登録しておく学習画像から対象物が含まれている識別対象領域を切り出して、切り出した識別対象領域のサイズを固定サイズに伸縮し、固定サイズとなった識別領域の画像から抽出される画像特徴を用いて構築されている。
そのため、認識対象画像から切り出された候補領域から画像特徴を抽出する際には、切り出された候補領域の画像サイズを固定サイズに合わせる必要がある。
しかし、切り出された全ての候補領域のサイズを拡大または縮小して一定の固定サイズに合わせてから画像特徴を抽出したのでは、画像処理に要する計算負荷が大きくなり、オブジェクトの認識に時間がかかるという問題が発生する。
本発明の目的は、認識対象画像から抽出された候補領域のサイズを、学習モデルを作成する際の固定サイズに合わせて拡大または縮小処理してから画像特徴を抽出する場合と比較して、対象物の認識処理を高速化することが可能な画像処理装置およびプログラムを提供することである。
[画像処理装置]
請求項1に係る本発明は、認識対象の対象物が含まれているか否かが既知の学習画像から切り出された識別対象領域の画像を予め定められた一定のサイズに統一する統一手段と、
前記統一手段により一定のサイズに統一された後の識別対象領域の画像から抽出された特徴情報に基づいて生成され、画像に対象物が含まれている可能性を判定するための学習モデルを記憶する記憶手段と、
異なる複数の画像サイズに変換された認識対象画像を格納する格納手段と、
認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する決定手段と、
前記格納手段に格納されている複数の画像サイズの認識対象画像の中から、前記決定手段により決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズに最も近くなる画像サイズの認識対象画像を選択する選択手段と、
前記選択手段により選択された画像サイズの認識対象画像から、前記決定手段により決定された位置及びサイズの候補領域の画像の特徴を示す特徴情報を抽出する抽出手段と、
前記抽出手段により抽出された特徴情報と前記記憶手段に記憶されている学習モデルとを用いて、候補領域の画像に含まれる対象物を判定する判定手段とを備えた画像処理装置である。
請求項2に係る本発明は、前記抽出手段が、前記格納手段に格納されている複数の画像サイズの認識対象画像全体の特徴情報を予め抽出しておき、前記選択手段により選択された画像サイズの認識対象画像全体の特徴情報を用いて、前記切出手段により切り出された候補領域の画像の特徴情報を生成する請求項1記載の画像処理装置である。
請求項3に係る本発明は、認識対象画像を予め異なる複数の画像サイズに変換する変換手段をさらに備え、
前記変換手段は、認識対象画像における候補領域の画像サイズのばらつき度合いに基づいて、前記認識対象画像を変換する複数の画像サイズを決定する請求項1または2記載の画像処理装置である。
請求項4に係る本発明は、前記変換手段が、認識対象画像における候補領域の画像サイズの最大値及び最小値を用いて、前記認識対象画像を変換する複数の画像サイズを決定する請求項3記載の画像処理装置である。
請求項5に係る本発明は、前記変換手段が、認識対象画像における候補領域の画像サイズのうち頻度が高いものが、前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズとなるような倍率で前記認識対象画像を拡大又は縮小する請求項3記載の画像処理装置である。
請求項6に係る本発明は、前記変換手段が、学習画像から切り出された識別対象領域の個数を等分するようなものが、前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズとなるような倍率で前記認識対象画像を拡大又は縮小する請求項3記載の画像処理装置である。
請求項7に係る本発明は、認識対象の対象物が含まれているか否かが既知の学習画像から切り出された識別対象領域の画像を予め定められた一定のサイズに統一する統一手段と、
前記統一手段により一定のサイズに統一された後の識別対象領域の画像から抽出された特徴情報に基づいて生成され、画像に対象物が含まれている可能性を判定するための学習モデルを記憶する記憶手段と、
異なる複数の画像サイズに変換された認識対象画像を格納する格納手段と、
認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する決定手段と、
前記格納手段に格納されている複数の画像サイズの認識対象画像の中から、前記決定手段により決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズに最も近くなる画像サイズの認識対象画像を選択する選択手段と、
前記格納手段に格納されている複数の画像サイズの認識対象画像全体の対象物を含む可能性を示す指標を前記記憶手段に記憶されている学習モデルを用いて予め算出しておき、前記選択手段により選択された画像サイズの認識対象画像全体の指標の値を用いて、前記決定手段により決定された位置及びサイズの候補領域の画像の指標の値を算出するする算出手段と、
前記算出手段により算出された指標の値に基づいて、候補領域の画像に含まれる対象物を判定する判定手段とを備えた画像処理装置である。
[プログラム]
請求項8に係る本発明は、認識対象の対象物が含まれているか否かが既知の学習画像から切り出された識別対象領域の画像を予め定められた一定のサイズに統一する統一ステップと、
前記統一ステップにおいて一定のサイズに統一された後の識別対象領域の画像から抽出された特徴情報に基づいて生成され、画像に対象物が含まれている可能性を判定するための学習モデルを記憶する記憶ステップと、
異なる複数の画像サイズに変換された認識対象画像を格納する格納ステップと、
認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する決定ステップと、
前記格納ステップにおいて格納された複数の画像サイズの認識対象画像の中から、前記決定ステップにおいて決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズに最も近くなる画像サイズの認識対象画像を選択する選択ステップと、
前記選択ステップにおいて選択された画像サイズの認識対象画像から、前記決定ステップにおいて決定された位置及びサイズの候補領域の画像の特徴を示す特徴情報を抽出する抽出ステップと、
前記抽出ステップにおいて抽出された特徴情報と前記記憶ステップにおいて記憶された学習モデルとを用いて、候補領域の画像に含まれる対象物を判定する判定ステップとをコンピュータに実行させるためのプログラムである。
請求項1に係る本発明によれば、認識対象画像から抽出された候補領域のサイズを、学習モデルを作成する際の固定サイズに合わせて拡大または縮小処理してから画像特徴を抽出する場合と比較して、対象物の認識処理を高速化することが可能な画像処理装置を提供することができる。
請求項2に係る本発明によれば、認識対象画像から切り出された候補領域の画像から直接特徴情報を抽出する場合と比較して、特徴情報の抽出処理を高速化することが可能な画像処理装置を提供することができる。
請求項3に係る本発明によれば、認識対象画像から切り出された候補領域の画像サイズが、識別対象領域の画像を統一した一定のサイズと近似することによって高速化を実現することが可能な画像処理装置を提供することができる。
請求項4に係る本発明によれば、認識対象画像から切り出された候補領域の画像サイズが、識別対象領域の画像を統一した一定のサイズと近似することによって高速化を実現することが可能な画像処理装置を提供することができる。
請求項5に係る本発明によれば、認識対象画像から切り出された候補領域の画像サイズが、識別対象領域の画像を統一した一定のサイズと近似することによって高速化を実現することが可能な画像処理装置を提供することができる。
請求項6に係る本発明によれば、認識対象画像から切り出された候補領域の画像サイズが、識別対象領域の画像を統一した一定のサイズと近似することによって高速化を実現することが可能な画像処理装置を提供することができる。
請求項7に係る本発明によれば、認識対象画像から抽出された候補領域のサイズを、学習モデルを作成する際の固定サイズに合わせて拡大または縮小処理してから、その画像が対象物を含む可能性を示す指標を算出する場合と比較して、対象物の認識処理を高速化することが可能なプログラムを提供することができる。
請求項8に係る本発明によれば、認識対象画像から抽出された候補領域のサイズを、学習モデルを作成する際の固定サイズに合わせて拡大または縮小処理してから画像特徴を抽出する場合と比較して、対象物の認識処理を高速化することが可能なプログラムを提供することができる。
本発明の一実施形態の画像処理装置10のハードウェア構成を示すブロック図である。 本発明の一実施形態の画像処理装置10の機能構成を示すブロック図である。 学習画像と識別対象領域の一例を示す図である。 学習画像から識別対象領域の画像を切り出す様子を説明するための図である。 学習モデル生成部31が学習画像の識別対象領域から画像特徴を抽出する処理の流れを説明するためのフローチャートである。 学習モデル生成部31が、各識別対象領域から抽出された画像特徴に基づいて学習モデルを生成する際の処理を説明するためのフローチャートである。 学習モデル生成部31により生成される学習モデルの一例を示す図である。 認識対象画像と候補領域の一例を示す図である。 画像サイズ変換部33により生成された候補領域の短辺長の頻度分布の一例を示す図である。 候補領域の短辺長の頻度分布における最小値、中間値、最大値をそれぞれY1、Y2、Y3として取得する様子を説明するための図である。 倍率Z1、Z2、Z3の計算例を説明するための図である。 候補領域の短辺長の頻度分布のグラフから、頻度の高い3つの短辺長をそれぞれY1、Y2、Y3として取得する様子を説明するための図である。 候補領域の短辺長の頻度分布のグラフにおける短辺長の数を3等分して、3等分したそれぞれの短辺長の平均値をそれぞれY1、Y2、Y3として取得する様子を説明するための図である。 画像サイズ変換部33が算出された倍率Z1、Z2、Z3を用いて、認識対象画像を拡大または縮小する様子を説明するための図である。 本発明の一実施形態の画像処理装置10のオブジェクト認識処理の動作を説明するためのフローチャートである。 画像サイズ選択部36が、候補領域の短辺長が50に最も近くなる画像サイズを選択する様子を説明するための図である。 (w1、h1)、(w2、h2)で囲まれる矩形の候補領域60の画像特徴を計算により求める様子を説明するための図である。 左上を(0、0)、右下を(w2、h2)とする矩形の画像特徴f(w2、h2)を計算する様子を説明するための図である。 左上を(0、0)、右下を(w1、h2)とする矩形の画像特徴f(w1、h2)を計算する様子を説明するための図である。 左上を(0、0)、右下を(w2、h1)とする矩形の画像特徴f(w2、h1)を計算する様子を説明するための図である。 左上を(0、0)、右下を(w1、h1)とする矩形の画像特徴f(w1、h1)を計算する様子を説明するための図である。 本発明の一実施形態の画像形成装置10の変形例である画像処理装置10aの機能構成を示すブロック図である。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
図1は本発明の一実施形態の画像処理装置10のハードウェア構成を示すブロック図である。
本発明の一実施形態の画像処理装置10は、図1に示されるように、CPU11、メモリ12、ハードディスクドライブ(HDD)等の記憶装置13、ネットワークを介して外部の装置等との間でデータの送信及び受信を行う通信インタフェース(IF)14、タッチパネル又は液晶ディスプレイ並びにキーボードを含むユーザインタフェース(UI)装置15を有する。これらの構成要素は、制御バス16を介して互いに接続されている。
CPU11は、メモリ12または記憶装置13に格納された制御プログラムに基づいて所定の処理を実行して、画像処理装置10の動作を制御する。なお、本実施形態では、CPU11は、メモリ12または記憶装置13内に格納された制御プログラムを読み出して実行するものとして説明したが、当該プログラムをCD−ROM等の記憶媒体に格納してCPU11に提供することも可能である。
図2は、上記の制御プログラムが実行されることにより実現される画像処理装置10の機能構成を示すブロック図である。
本実施形態の画像処理装置10は、図2に示されるように、学習モデル生成部31と、学習モデル記憶部32と、画像サイズ変換部33と、認識対象画像格納部34と、候補領域決定部35と、画像サイズ選択部36と、画像特徴抽出部37と、判定部38とを備えている。
学習モデル生成部31は、認識対象のオブジェクト(対象物)が含まれているか否かが既知の学習画像から切り出された識別対象領域(関心領域)の画像を予め定められた一定のサイズに統一する。そして、学習モデル生成部31は、予め定められた一定のサイズに統一された後の識別対象領域の画像から画像特徴(特徴情報)を抽出して学習モデルを生成する。
この学習画像と識別対象領域の一例を図3に示す。この図3では、学習画像中に、バスや木や人間の画像を囲む識別対象領域51〜54が設定されている。なお、学習画像に対して、識別対象領域の位置やサイズを設定し、その識別対象領域の画像が何の画像であるかを示すラベル情報を付与する方法としては、人手によるマニュアル操作による方法が考えられる。
例えば、識別対象領域51の画像には「バス」というラベル情報が付与され、識別対象領域52の画像には「木」というラベル情報が付与され、識別対象領域53、54の画像には「人」というラベル情報が付与される。
ラベル情報としては、「犬」、「木」、「車」というようなオブジェクト名だけでなく、「かわいい」、「赤い」、「大きい」というような感性表現、「屋外」、「空」、「海」というような風景名が用いられることもある。
また、1つの識別対象領域の画像に対して1つのラベル情報のみが付与される場合だけでなく、1つの画像に対して複数のラベル情報が付与されることもあり得る。
次に、学習モデル生成部31は、このようにして設定された識別対象領域から切り出された画像を一定のサイズに統一するように拡大または縮小処理を行う。例えば、識別対象領域を矩形とした場合には、学習モデル生成部31は、図4に示すように、学習画像から切り出された識別対象領域の画像の短辺長(短辺サイズ)が予め定められた長さXとなるように拡大または縮小処理を行う。この際に、学習モデル生成部31は、アスペクト比が保持されるよう識別対象領域の画像の拡大または縮小処理を行う。
なお、以下の説明では、学習モデル生成部31は、学習画像の識別対象領域から切り出された画像の短辺長が50ピクセル(画素)となるように、画像の拡大または縮小を行うものとして説明する。
そして、学習モデル生成部31は、このように短辺長が50ピクセルに統一された識別対象領域の画像から、画像特徴を抽出する。ここで画像特徴としては、局所特徴及び領域特徴を用いることができる。
局所特徴を画像特徴として用いる場合には、識別対象領域ごとに局所特徴のヒストグラムであるBOF(Bag Of Features)を作成して、これを画像特徴として用いるようにしても良い。また、画像の部分領域から1つの画像特徴を抽出して、その部分領域の中心が識別対象領域内に存在する場合、その画像特徴を選択するようにしても良い(領域特徴)。画像の部分領域とは例えば領域分割によって作成されたSuperpixelや元画像を格子状に分割したものである。このような領域特徴を画像特徴として用いる場合、1つの識別対象領域から抽出される画像特徴の個数は複数となる。
ここで、識別対象領域を統一したサイズであるX(=50ピクセル)の値は、画像サイズ変換部33に出力される。
また、画像から抽出される画像特徴の具体的な例としては、画像データから抽出された色情報やエッジ情報、SIFT(Scale-Invariant Feature Transform)と呼ばれる勾配方向のヒストグラム情報等を用いることができる。また、識別対象領域の各画素の平均色値を画像特徴とすることも可能である。
この学習モデル生成部31が学習画像の識別対象領域から画像特徴を抽出する処理の流れを図5のフローチャートを参照して説明する。
上記でも説明したように、学習モデル生成部31は、学習モデルを生成する際には、先ず学習画像から切り出された各識別対象領域のサイズを短辺がX(例えば50ピクセル)となるように拡大・縮小する(ステップS101)。次に、学習モデル生成部31は、短辺がXに揃えられた各識別対象領域から、画像特徴を抽出する(ステップS102)。そして、学習モデル生成部31は、抽出した画像特徴と、識別対象領域に付与されたラベル情報とを対応付ける(ステップS103)。
そして、学習モデル生成部31は、抽出された各識別対象領域の画像特徴及びその識別対象領域に付与されたラベル情報を用いて、画像に対象物が含まれている可能性を判定するための学習モデルを生成する。
学習モデルとしては、SVM(Support Vector Machine:サポートベクターマシーン)、Adaboost(Adaptive boosting)、kNNなどの識別器や、単純ベイズ分類器(Naive Bayes Classifier)等の生成モデルを使用することができる。
学習モデルとして識別器を用いる場合には、画像特徴f(もしくは1つの識別対象領域から複数の画像特徴を抽出する場合には画像特徴群F)を与えた場合のラベル情報cの条件付き確率P(c|f)(もしくはP(f|c))を計算することができる。また、学習モデルとして識別器ではなく生成モデル(P(f|c))を生成する場合には、ベイズの定理を用いてP(c|f)を求めることができる。
この学習モデルは、画像特徴を入力として、ある認識対象の対象物が画像中に含まれる度合いであるスコアを算出するものである。
例えば、認識対象のオブジェクトが「犬」である学習モデルは、その画像が「犬」の画像を含む確率をスコアとして算出するものである。
次に、学習モデル生成部31が、各識別対象領域から抽出された画像特徴に基づいて学習モデルを生成する際の処理を図6のフローチャートを参照して説明する。この図6に示したフローチャートは、SVMを学習モデルとして生成する場合の処理の流れを示すものである。
以下の説明では、様々な認識対象オブジェクトを判定するための複数の学習モデルを生成する場合を用いて説明する。例えば、認識対象の画像中に「犬」の画像が含まれている可能性を判定するための学習モデル、「猫」の画像が含まれている可能性を判定するための学習モデル、「人」の画像が含まれている可能性を判定するための学習モデル等の複数の学習モデルをそれぞれ生成する場合を用いて説明する。
まず、学習モデル生成部31は、認識対象オブジェクトの種類を示すiの値を0に設定する(ステップS201)。例えば、このi=0の場合には、認識対象のオブジェクトが「犬」であるものとして説明する。
そして、学習モデル生成部31は、ラベル情報c0、つまりラベル情報として「犬」という情報が付与された画像特徴の集合Fc0を収集する(ステップS202)。また、学習モデル生成部31は、ラベル情報c0、つまりラベル情報として「犬」という情報が付与されていない画像特徴の集合Gc0を収集する(ステップS203)。
次に、学習モデル生成部31は、この「犬」というラベル情報が付与された画像特徴の集合Fc0と「犬」以外のラベル情報が付与された画像特徴の集合Gc0を分割する境界を有する学習モデルを生成する(ステップS204)。
そして、学習モデル生成部31は、生成した学習モデルを学習モデル記憶部32に記憶させる(ステップS205)。
そして、学習モデル生成部31は、認識対象の全ての学習モデルを作成済みであれば処理を終了する(ステップS206においてyes)。しかし、認識対象の全ての学習モデルが作成済みでない場合、例えば「猫」の学習モデルをまだ生成していない場合(ステップS206においてno)、学習モデル生成部31は、iに1を加算して(ステップS207)、ステップS202〜S206の処理を繰り返す。
このようにして生成される学習モデルの一例を図7に示す。図7では、説明を簡単にするために2つの画像特徴f1、f2により表現された2次元のデータ空間上に、認識対象のオブジェクトが含まれる画像データである正例データと、認識対象のオブジェクトが含まれない画像データである負例データとが存在している。
そして、図7の学習モデル例では、この正例データと負例データとを分割するための境界線が設けられており、判定対象の画像の画像特徴f1、f2の値をこの学習モデルと比較することにより、その判定対象の画像が認識対象のオブジェクトを含む画像であるのか、含まない画像であるかが判定可能となっている。
学習モデル記憶部32は、学習モデル生成部31により生成された学習モデルを記憶する。
画像サイズ変換部33は、ラベル情報がまだ付与されていない認識対象画像を予め異なる複数の画像サイズに変換する。ここで、画像サイズ変換部33は、認識対象画像を予め設定されている画像サイズとなるよう変換するようにしても良いし、認識対象画像における候補領域の画像サイズのばらつき度合いに基づいて、認識対象画像を変換する複数の画像サイズを自動的に決定するようにしても良い。
ここで、画像サイズ変換部33は、認識対象画像における候補領域の画像サイズのばらつき度合いに基づいて、認識対象画像を変換する複数の画像サイズを決定する際には、認識対象画像における候補領域の画像サイズの最大値及び最小値を用いて、認識対象画像を変換する複数の画像サイズを決定するようにしても良い。
また、画像サイズ変換部33は、認識対象画像における候補領域の画像サイズのうち頻度が高いものが、学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズとなるような倍率で認識対象画像を拡大又は縮小するようにしても良い。
また、画像サイズ変換部33は、学習画像から切り出された識別対象領域の画像の個数を等分するようなものが、学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズとなるような倍率で認識対象画像を拡大又は縮小するようにしても良い。
認識対象画像格納部34は、異なる複数の画像サイズに変換された認識対象画像を格納する。
ここで、画像サイズ変換部33において、認識対象画像を予め異なる画像サイズに変換しておく複数の倍率を決定する方法を、図8〜図14を参照して説明する。
先ず、認識対象画像と候補領域の一例を図8に示す。図8では、電車の画像が含まれる認識対象画像から、数多くの候補領域が抽出された場合が示されている。まず、画像サイズ変換部33は、このように認識対象画像から抽出された複数の候補領域の短辺長(短辺サイズ)のヒストグラム(頻度分布)を作成する。
このようにして画像サイズ変換部33により生成された候補領域の短辺長の頻度分布の一例を図9に示す。図9に示すグラフでは、横軸が候補領域の短辺長となり、縦軸がその頻度(個数)となっている。
なお、この候補領域の短辺長の頻度分布を生成する際に、1つの認識対象画像から抽出された候補領域の短辺長だけを用いて頻度分布を生成しても良いし、複数の認識対象画像から抽出された数多くの候補領域の短辺長を用いて頻度分布を生成しても良い。
ここで、画像サイズ変換部33は、このような短辺長の頻度分布と、学習モデル生成部31から送信されてきた識別対象領域のサイズを統一した際のXの値とを用いて、認識対象画像を縮小又は拡大するための倍率を算出する。
なお、以下の説明では、画像サイズ変換部33は、認識対象画像を3種類の画像サイズの画像に変換する場合を用いて説明する。
例えば、画像サイズ変換部33は、図10に示すように、候補領域の短辺長の頻度分布における最小値、中間値、最大値をそれぞれY1、Y2、Y3として取得する。ここでは、一例として、Y1=25(ピクセル)、Y2=50(ピクセル)、Y3=100(ピクセル)という値が取得されたものとして説明する。
すると、画像サイズ変換部33は、認識対象画像を拡大または縮小するための倍率Z1、Z2、Z3を、それぞれZk=X/Yk(k=1〜3)という式により算出する。
ここでは、識別対象領域のサイズを統一した際の短辺長Xは50ピクセルであるため、図11に示すように、倍率Z1、Z2、Z3は、それぞれ、2.0、1.0、0.5と算出される。
また、画像サイズ変換部33は、図12に示すように、候補領域の短辺長の頻度分布のグラフから、頻度の高い3つの短辺長をそれぞれY1、Y2、Y3として取得するようにしても良い。
さらに、画像サイズ変換部33は、図13に示すように、候補領域の短辺長の頻度分布のグラフにおける短辺長の数を3等分して、3等分したそれぞれの短辺長の平均値をそれぞれY1、Y2、Y3として取得するようにしても良い。
そして、画像サイズ変換部33は、図14に示すように、上記のような方法で算出した倍率Z1、Z2、Z3を用いて、認識対象画像を拡大または縮小する。
図14を参照すると、変換前の認識対象画像が600×300ピクセルの画像サイズであったものが、画像サイズ変換部33により画像サイズが変換されて、1200×600ピクセル、600×300ピクセル、300×150ピクセルの画像となっているのが分かる。
なお、ここでは、Z2がたまたま1.0となっているため、画像サイズ変換処理後でも同じサイズとなっているが1.0以外の倍率であれば、認識対象画像は異なるサイズに変換されることになる。
候補領域決定部35は、認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する。ここで、認識対象画像から候補領域の位置やサイズを決定する方法としては、自動的に決定する方法や人手による操作により決定する方法を用いることも可能である。なお、候補領域の位置やサイズを自動的に決定する方法では、1つの画像から約1000程度の領域が候補領域として抽出されるのが一般的である(例えば非特許文献2など)。
画像サイズ選択部36は、認識対象画像格納部34に格納されている複数の画像サイズの認識対象画像の中から、候補領域決定部35により決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズ、例えば短辺長がX(50ピクセル)に最も近くなる画像サイズの認識対象画像を選択する。
なお、このように学習モデルを生成した際の識別対象領域の短辺長と、候補領域の短辺長をできるだけ揃えるようにしているのは、学習モデルを生成した際の画像のサイズと認識対象画像のサイズが異なると、認識精度が劣化してしまうからである。
画像特徴抽出部37は、画像サイズ選択部36により選択された画像サイズの認識対象画像から、候補領域決定部35により決定された位置及びサイズの候補領域の画像の特徴を示す画像特徴を抽出する。
また、画像特徴抽出部37は、認識対象画像格納部34に格納されている複数の画像サイズの認識対象画像全体の画像特徴を予め抽出しておき、画像サイズ選択部36により選択された画像サイズの認識対象画像全体の画像特徴を用いて、候補領域の画像特徴を生成する。
判定部38は、画像特徴抽出部37により抽出された画像特徴と学習モデル記憶部32に記憶されている学習モデルとを用いて、候補領域の画像に含まれる対象物を判定する。
次に、本実施形態の画像処理装置10の動作について図面を参照して詳細に説明する。
図15は、本実施形態の画像処理装置10のオブジェクト認識処理の動作を説明するためのフローチャートである。
ここで、図15に示すフローチャートの処理が実行される前に、画像サイズ変換部33では、認識対象画像を拡大または縮小するための倍率Z1〜Z3が決定されており、この倍率Z1〜Z3により画像サイズが変換された3種類の認識対象画像が認識対象画像格納部34に格納されているものとして説明する。なお、画像サイズ変換部33により画像サイズが変換される前の元の認識対象画像も認識対象画像格納部34に格納されている。
さらに、画像特徴抽出部37は、認識対象画像格納部34に格納されている画像サイズが異なる3種類の認識対象画像全体の画像特徴を予め抽出しているものとする。
そして、このような状態で候補領域決定部35は、認識対象画像における候補領域を決定する(ステップS301)。
すると、画像サイズ選択部36は、決定した候補領域の、オリジナルの認識対象画像における短辺長Yを算出する(ステップS302)。そして、画像サイズ選択部36は、Lk=Y×Zk(k=1〜3)という演算を行うことにより、画像サイズが変換された後のそれぞれの認識対象画像における候補領域の短辺長を算出する(ステップS303)。
そして、画像サイズ選択部36は、識別対象領域のサイズを統一する際に揃えた短辺長50(ピクセル)との差の絶対値|X−Lk|を算出し、この値が最も小さくなる画像サイズを候補領域毎に選択する(ステップS304)。
具体的には、画像サイズ選択部36は、図16に示すように、各画像サイズの認識対象画像における候補領域の短辺長が、50に最も近くなる画像サイズを選択する。図16に示した例では、候補領域として家の画像が選択され、2番目のサイズの認識対象画像における候補領域の短辺長が60であるため、この2番目のサイズの認識対象画像が選択された場合が示されている。
そして、画像特徴抽出部37は、画像サイズ選択部36により選択された画像サイズの認識対象画像における候補領域から画像特徴を抽出する(ステップS305)。
最後に、判定部38は、学習モデル記憶部32に記憶されている学習モデルと、画像特徴抽出部37により抽出された画像特徴とを用いて、各オブジェクトがこの候補領域に含まれるスコア(確率値)を算出し、このスコアに基づいて候補領域に含まれるオブジェクトを判定する(ステップS305)。そして、この判定部38における判定結果に基づいて、候補領域に付与するラベル情報を決定する。
このラベル情報を決定する際に、算出されたスコアが最も高かったオブジェクト名をその候補領域のラベル情報として設定してもよいし、予め設定された閾値以上のスコアとなったオブジェクト名の全てをラベル情報とするようにしても良い。逆にすべてのオブジェクトに対するスコアが閾値以下であれば、その候補領域には何のラベル情報も付与しないようにしても良い。各候補領域riでの最大のスコアとなるオブジェクトをciとし、そのスコアをP(ci|ri)と記述した場合、各P(ci|ri)の上位N個を選び最終的な認識結果としてもよいし、閾値以上のP(ci|ri)のみを選択してもよい。また候補領域に対してラベル情報を付与するのではなく、最終的な認識結果を認識対象画像全体に対して付与する場合には、上述の方法で選択したオブジェクトciを画像全体のラベル情報として設定することにより実現することができる。
なお、画像特徴抽出部37は、画像サイズ変換部33により画像サイズが変換された後の3つの認識対象画像の画像全体の画像特徴を予め計算して保持している。ここで、画像特徴抽出部37では、認識対象画像が矩形領域で、左上を(0、0)、右下を(wi、hi)とする矩形状の候補領域の画像特徴をf(wi、hi)という関数により算出できるようにして予め画像全体の特徴を算出しているものとする。すると、画像特徴部37は、候補領域の位置とサイズが指定されれば、その候補領域の画像特徴を再度計算することなく算出することができる。
具体的には、図17に示すように、認識対象画像がW×Hピクセルの画像であり、上記のように左上を(0、0)、右下を(wi、hi)とする矩形状の候補領域の画像特徴を全て予め計算してある場合、(w1、h1)、(w2、h2)で囲まれる矩形の候補領域60の画像特徴は、f(w2、h2)−f(w1、h2)−f(w2、h1)+f(w1、h1)により計算することができる。
そのため、画像特徴抽出部37は、画像サイズ選択部36により選択された画像サイズの認識対象画像中の候補領域の画像特徴を抽出する際でも、候補領域の画像から画像特徴を算出せずに、予め計算されている認識対象画像全体の画像特徴を用いることにより少ない計算量で候補領域の画像特徴を得ることができる。
このようにして候補領域の画像特徴を計算することできる理由を図18〜図21を参照して説明する。
まず、左上を(0、0)、右下を(w2、h2)とする矩形の画像特徴は、図18に示すようにf(w2、h2)により計算される。そして、左上を(0、0)、右下を(w1、h2)とする矩形の画像特徴は、図19に示すようにf(w1、h2)により計算される。そして、左上を(0、0)、右下を(w2、h1)とする矩形の画像特徴は、図20に示すようにf(w2、h1)により計算される。そして、左上を(0、0)、右下を(w1、h1)とする矩形の画像特徴は、図21に示すようにf(w1、h1)により計算される。
そのため、図17に示すような候補領域60の画像の画像特徴は、面積を計算するのと同じ方法により、画像特徴f(w2、h2)から画像特徴f(w1、h2)、f(w2、h1)を減算し、画像特徴f(w1、h1)を加算することにより算出することができる。
なお、上記で説明した本実施形態の画像処理装置10では、認識対象の学習画像から切り出した数多くの識別対象領域の画像サイズを、図4に示したように予め定めたサイズXになるように拡大・縮小して、拡大・縮小後の画像から特徴量を抽出するのではなく、予め認識対象画像を3種類の画像サイズに変換しておき、この3種類のサイズの画像から画像特徴を算出するようにした点に特徴を有する。
認識対象の学習画像から切り出した数多くの識別対象領域の画像サイズを、予め定めたサイズになるように拡大・縮小してから画像を抽出しようとすると、1つの認識対象画像から例えば1000の識別対象領域が切り出された場合、この1000の識別対象領域のそれぞれに対して拡大・縮小倍率を計算して拡大・縮小処理を行い、その後に画像特徴を抽出する必要がある。そのため、このような方法を用いて画像特徴の抽出を行った場合、画像処理に要する計算負荷が大きくなり、オブジェクトの認識に時間がかかるという問題が発生する。
そのため、本実施形態の画像処理装置10では、予め認識対象画像を3種類の画像サイズに変換しておき、各識別対象領域の画像に対して、この3種類のサイズの画像の中からから1つの画像を選択して、その選択した画像について予め抽出しておいた画像特徴を用いて、識別対象領域の画像の画像特徴を算出するようにしている。
そして、上記でも説明したように、固定サイズの画像全体の画像特徴量を予め抽出しておけば、その固定サイズの画像に含まれる部分画像の画像特徴を算出するのは少ない画像処理負荷ですむ。
そのため、本実施形態の画像処理装置10によれば、認識対象画像から切り出した識別対象領域の画像ごとに拡大・縮小を行って画像特徴を抽出する場合と比較して、各識別対象領域の画像の画像特徴を少ない画像処理負荷で算出することができる。
[変形例]
上記実施形態では、候補領域から画像特徴を抽出して、抽出された画像特徴に基づいて各オブジェクトに対するスコアを計算して、候補領域に含まれるオブジェクトの判定を行う場合を用いて説明したが、画像特徴として領域特徴を用いる場合、画像特徴を抽出せずに直接スコアの算出を行うような構成とすることも可能である。
このような処理を行う場合の画像処理装置10aの機能構成を図22に示す。
この画像処理装置10aは、図22に示すように、図2に示した画像処理装置10に対して、画像特徴抽出部37をスコア算出部40に置き換え、判定部38が判定部38aに置き換えられた構成となっている。
このような構成におけるスコア算出部40は、認識対象画像格納部34に格納されている複数種類の画像サイズの認識対象画像に対して、左上を(0、0)、右下を(Wi、Hi)とする矩形状の部分領域Piを作成しPiにその中心が含まれる領域画像特徴群Fi(=f1、f2、・・・、fn)及び学習モデルからスコアS(Fi|ci)を計算しておく。ここで、このスコアS(Fi|ci)は下記のような式により計算することができる。
ここで、学習モデルとして生成モデルを採用すればP(f|c)を計算することができ、P(c)はオブジェクトcの事前確率を意味するので、上記に示したような式によりスコアS(Fi|ci)の計算が可能である。
そして、予め上述したような計算を行っておくことにより、スコア算出部40は、画像サイズ選択部36により選択された画像サイズの認識対象画像の候補領域のスコアを直接計算する。このような構成によれば、候補領域が決定され画像サイズの選択と同時にスコアを計算することができるため、より高速な認識処理が実現できる。そして、判定部38aでは、スコア算出部40により算出された認識対象のオブジェクトのスコアに基づいて、上記で説明したのと同様な方法によりこの候補領域の画像に付与するラベル情報を決定する。
10、10a 画像処理装置
11 CPU
12 メモリ
13 記憶装置
14 通信インタフェース(IF)
15 ユーザインタフェース(UI)装置
16 制御バス
31 学習モデル生成部
32 学習モデル記憶部
33 画像サイズ変換部
34 認識対象画像格納部
35 候補領域決定部
36 画像サイズ選択部
37 画像特徴抽出部
38、38a 判定部
39 スコア算出部
51〜54 識別対象領域

Claims (8)

  1. 認識対象の対象物が含まれているか否かが既知の学習画像から切り出された識別対象領域の画像を予め定められた一定のサイズに統一する統一手段と、
    前記統一手段により一定のサイズに統一された後の識別対象領域の画像から抽出された特徴情報に基づいて生成され、画像に対象物が含まれている可能性を判定するための学習モデルを記憶する記憶手段と、
    異なる複数の画像サイズに変換された認識対象画像を格納する格納手段と、
    認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する決定手段と、
    前記格納手段に格納されている複数の画像サイズの認識対象画像の中から、前記決定手段により決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズに最も近くなる画像サイズの認識対象画像を選択する選択手段と、
    前記選択手段により選択された画像サイズの認識対象画像から、前記決定手段により決定された位置及びサイズの候補領域の画像の特徴を示す特徴情報を抽出する抽出手段と、
    前記抽出手段により抽出された特徴情報と前記記憶手段に記憶されている学習モデルとを用いて、候補領域の画像に含まれる対象物を判定する判定手段と、
    を備えた画像処理装置。
  2. 前記抽出手段は、前記格納手段に格納されている複数の画像サイズの認識対象画像全体の特徴情報を予め抽出しておき、前記選択手段により選択された画像サイズの認識対象画像全体の特徴情報を用いて、候補領域の画像の特徴情報を生成する請求項1記載の画像処理装置。
  3. 認識対象画像を予め異なる複数の画像サイズに変換する変換手段をさらに備え、
    前記変換手段は、認識対象画像における候補領域の画像サイズのばらつき度合いに基づいて、前記認識対象画像を変換する複数の画像サイズを決定する請求項1または2記載の画像処理装置。
  4. 前記変換手段は、認識対象画像における候補領域の画像サイズの最大値及び最小値を用いて、前記認識対象画像を変換する複数の画像サイズを決定する請求項3記載の画像処理装置。
  5. 前記変換手段は、認識対象画像における候補領域の画像サイズのうち頻度が高いものが、前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズとなるような倍率で前記認識対象画像を拡大又は縮小する請求項3記載の画像処理装置。
  6. 前記変換手段は、学習画像から切り出された識別対象領域の個数を等分するようなものが、前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズとなるような倍率で前記認識対象画像を拡大又は縮小する請求項3記載の画像処理装置。
  7. 認識対象の対象物が含まれているか否かが既知の学習画像から切り出された識別対象領域の画像を予め定められた一定のサイズに統一する統一手段と、
    前記統一手段により一定のサイズに統一された後の識別対象領域の画像から抽出された特徴情報に基づいて生成され、画像に対象物が含まれている可能性を判定するための学習モデルを記憶する記憶手段と、
    異なる複数の画像サイズに変換された認識対象画像を格納する格納手段と、
    認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する決定手段と、
    前記格納手段に格納されている複数の画像サイズの認識対象画像の中から、前記決定手段により決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズに最も近くなる画像サイズの認識対象画像を選択する選択手段と、
    前記格納手段に格納されている複数の画像サイズの認識対象画像全体の対象物を含む可能性を示す指標を前記記憶手段に記憶されている学習モデルを用いて予め算出しておき、前記選択手段により選択された画像サイズの認識対象画像全体の指標の値を用いて、前記決定手段により決定された位置及びサイズの候補領域の画像の指標の値を算出するする算出手段と、
    前記算出手段により算出された指標の値に基づいて、候補領域の画像に含まれる対象物を判定する判定手段と、
    を備えた画像処理装置。
  8. 認識対象の対象物が含まれているか否かが既知の学習画像から切り出された識別対象領域の画像を予め定められた一定のサイズに統一する統一ステップと、
    前記統一ステップにおいて一定のサイズに統一された後の識別対象領域の画像から抽出された特徴情報に基づいて生成され、画像に対象物が含まれている可能性を判定するための学習モデルを記憶する記憶ステップと、
    異なる複数の画像サイズに変換された認識対象画像を格納する格納ステップと、
    認識対象画像における認識対象の対象物が含まれている可能性のある候補領域の位置及びサイズを決定する決定ステップと、
    前記格納ステップにおいて格納された複数の画像サイズの認識対象画像の中から、前記決定ステップにおいて決定された位置及びサイズの候補領域を切り出した場合、切り出した候補領域のサイズが前記学習モデルを生成する際に識別対象領域の画像を統一した一定のサイズに最も近くなる画像サイズの認識対象画像を選択する選択ステップと、
    前記選択ステップにおいて選択された画像サイズの認識対象画像から、前記決定ステップにおいて決定された位置及びサイズの候補領域の画像の特徴を示す特徴情報を抽出する抽出ステップと、
    前記抽出ステップにおいて抽出された特徴情報と前記記憶ステップにおいて記憶された学習モデルとを用いて、候補領域の画像に含まれる対象物を判定する判定ステップとをコンピュータに実行させるためのプログラム。
JP2016029066A 2016-02-18 2016-02-18 画像処理装置およびプログラム Pending JP2017146840A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016029066A JP2017146840A (ja) 2016-02-18 2016-02-18 画像処理装置およびプログラム
US15/211,647 US9886646B2 (en) 2016-02-18 2016-07-15 Image processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016029066A JP2017146840A (ja) 2016-02-18 2016-02-18 画像処理装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2017146840A true JP2017146840A (ja) 2017-08-24

Family

ID=59631219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016029066A Pending JP2017146840A (ja) 2016-02-18 2016-02-18 画像処理装置およびプログラム

Country Status (2)

Country Link
US (1) US9886646B2 (ja)
JP (1) JP2017146840A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019079283A (ja) * 2017-10-25 2019-05-23 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、および、プログラム
KR20190119864A (ko) * 2018-04-13 2019-10-23 인하대학교 산학협력단 딥러닝 기반의 소형 물체 검출 기법
JP2020042816A (ja) * 2018-09-07 2020-03-19 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 物体検出方法、装置、機器、記憶媒体及び車両
JP2020532347A (ja) * 2017-09-06 2020-11-12 ヴェリリー ライフ サイエンシズ エルエルシー 外科用認識システム
WO2023148968A1 (ja) * 2022-02-07 2023-08-10 日本電気株式会社 画像処理システム、画像処理方法、およびコンピュータ可読媒体

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6333871B2 (ja) * 2016-02-25 2018-05-30 ファナック株式会社 入力画像から検出した対象物を表示する画像処理装置
JP6542824B2 (ja) 2017-03-13 2019-07-10 ファナック株式会社 入力画像から検出した対象物の像の尤度を計算する画像処理装置および画像処理方法
CN110378330B (zh) * 2018-04-12 2021-07-13 Oppo广东移动通信有限公司 图片分类方法及相关产品
US11720621B2 (en) * 2019-03-18 2023-08-08 Apple Inc. Systems and methods for naming objects based on object content
CN110097005A (zh) * 2019-04-30 2019-08-06 内蒙古科技大学 基于深度学习的牛体尺测量系统中站姿纠偏的方法
CN111931754B (zh) * 2020-10-14 2021-01-15 深圳市瑞图生物技术有限公司 一种样本中目标物的识别方法、系统和可读存储介质
TWI825633B (zh) * 2022-03-24 2023-12-11 緯創資通股份有限公司 影像處理方法、影像處理裝置及影像處理系統
CN115661592B (zh) * 2022-10-11 2023-08-01 中建三局第一建设工程有限责任公司 焊缝识别方法、装置、计算机设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4082043B2 (ja) 2002-02-27 2008-04-30 富士ゼロックス株式会社 画像検索装置
JP4553300B2 (ja) 2004-09-30 2010-09-29 Kddi株式会社 コンテンツ識別装置
JP5220482B2 (ja) 2008-05-30 2013-06-26 株式会社豊田中央研究所 対象物検出装置及びプログラム
JP5231159B2 (ja) 2008-10-21 2013-07-10 Necソフト株式会社 人物検出装置及び方法、学習モデル作成装置及び方法、並びにプログラム
JP5742267B2 (ja) * 2011-02-08 2015-07-01 富士ゼロックス株式会社 画像処理プログラム及び画像処理装置
JP5880454B2 (ja) * 2013-01-11 2016-03-09 富士ゼロックス株式会社 画像識別装置及びプログラム
JP2017010251A (ja) * 2015-06-22 2017-01-12 富士フイルム株式会社 画像抽出装置、画像抽出方法、プログラムおよび記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020532347A (ja) * 2017-09-06 2020-11-12 ヴェリリー ライフ サイエンシズ エルエルシー 外科用認識システム
JP2019079283A (ja) * 2017-10-25 2019-05-23 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、および、プログラム
JP7254440B2 (ja) 2017-10-25 2023-04-10 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、および、プログラム
KR20190119864A (ko) * 2018-04-13 2019-10-23 인하대학교 산학협력단 딥러닝 기반의 소형 물체 검출 기법
KR102073162B1 (ko) 2018-04-13 2020-03-02 인하대학교 산학협력단 딥러닝 기반의 소형 물체 검출 기법
JP2020042816A (ja) * 2018-09-07 2020-03-19 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 物体検出方法、装置、機器、記憶媒体及び車両
US11379699B2 (en) 2018-09-07 2022-07-05 Apollo Intelligent Driving Technology (Beijing) Co., Ltd. Object detection method and apparatus for object detection
WO2023148968A1 (ja) * 2022-02-07 2023-08-10 日本電気株式会社 画像処理システム、画像処理方法、およびコンピュータ可読媒体

Also Published As

Publication number Publication date
US20170243077A1 (en) 2017-08-24
US9886646B2 (en) 2018-02-06

Similar Documents

Publication Publication Date Title
JP2017146840A (ja) 画像処理装置およびプログラム
KR102103984B1 (ko) 깊이 영상 처리 방법 및 장치
KR101479387B1 (ko) 얼굴 검출을 위한 방법 및 장치
US11301509B2 (en) Image search system, image search method, and program
JP5063632B2 (ja) 学習モデル生成装置、対象物検出システム、及びプログラム
JP4588575B2 (ja) デジタル画像の複数対象物検出方法および装置並びにプログラム
JP5500024B2 (ja) 画像認識方法及び装置並びにプログラム
CN112488999B (zh) 一种图像中小目标检测方法、系统、存储介质及终端
JP2018206252A (ja) 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム
US10891740B2 (en) Moving object tracking apparatus, moving object tracking method, and computer program product
WO2011096010A1 (ja) パターン認識装置
JP2020087165A (ja) 学習データ生成プログラム、学習データ生成装置、及び学習データ生成方法
KR20120075626A (ko) 웹 기반 서비스에서의 전자해도 처리 장치 및 방법
KR20200134813A (ko) 기계 학습을 위한 이미지 처리 장치 및 방법
JP2013008142A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6044138B2 (ja) 画像領域分割装置、方法、およびプログラム
KR102306319B1 (ko) 포즈 추정 매핑 데이터를 생성하는 방법, 프로그램 및 컴퓨팅 장치
KR102444172B1 (ko) 영상 빅 데이터의 지능적 마이닝 방법과 처리 시스템
JP5083162B2 (ja) 画像データ判定装置、画像データ判定システム、及びプログラム
US11373313B2 (en) Image processing apparatus and image processing method
JP6419560B2 (ja) 検索装置、方法及びプログラム
US20240037449A1 (en) Teaching device, teaching method, and computer program product
JP6453618B2 (ja) 算出装置、方法及びプログラム
JP2011076575A (ja) 画像処理装置、画像処理方法及びプログラム
KR102572995B1 (ko) 폴리곤 간소화 방법 및 이를 수행하는 장치