JP2010045613A - 画像識別方法および撮像装置 - Google Patents

画像識別方法および撮像装置 Download PDF

Info

Publication number
JP2010045613A
JP2010045613A JP2008208407A JP2008208407A JP2010045613A JP 2010045613 A JP2010045613 A JP 2010045613A JP 2008208407 A JP2008208407 A JP 2008208407A JP 2008208407 A JP2008208407 A JP 2008208407A JP 2010045613 A JP2010045613 A JP 2010045613A
Authority
JP
Japan
Prior art keywords
image
category
block
program
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008208407A
Other languages
English (en)
Other versions
JP4772839B2 (ja
Inventor
Yasuyo Yasuda
泰代 安田
Tetsuya Hamada
哲也 浜田
Takashi Suzuki
敬 鈴木
Tadamoto Hiraga
督基 平賀
Yasushi Tanase
寧 棚瀬
Hiroki Shiino
寿樹 椎野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Morpho Inc
Original Assignee
NTT Docomo Inc
Morpho Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc, Morpho Inc filed Critical NTT Docomo Inc
Priority to JP2008208407A priority Critical patent/JP4772839B2/ja
Priority to CN200910165538.7A priority patent/CN101650783B/zh
Priority to KR1020090070825A priority patent/KR101324268B1/ko
Priority to US12/462,869 priority patent/US8363933B2/en
Priority to EP09167695A priority patent/EP2154630A1/en
Publication of JP2010045613A publication Critical patent/JP2010045613A/ja
Application granted granted Critical
Publication of JP4772839B2 publication Critical patent/JP4772839B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • H04N23/632Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/634Warning indications

Abstract

【課題】撮像装置で撮影された画像のブロック画像の特徴量を用いて対象を識別する際に、CPUの処理コストを抑えて、高精度に対象を識別すること。
【解決手段】画像データを複数のブロックに分割してブロック画像を生成し、ブロック画像の色空間情報および周波数成分によって夫々のブロック画像の特徴量を演算する。また、予め教師データとして、カテゴリごとの画像特徴量を演算して、この特徴量を用いてカテゴリを識別する境界となる分離超平面を計算しておき、新たに取得した画像についても同様にブロック画像の画像特徴量を計算し、各カテゴリの分離超平面からの距離によって、当該ブロック画像の属するカテゴリを判定する。
【選択図】 図2

Description

本発明は、画像中の対象(カテゴリ)を特定する技術に係り、特に撮影時において風景等のシーン検出を精度良く行い適切なカメラ設定を可能にする画像識別方法および撮像装置に関する。
デジタルカメラあるいはカメラ付き携帯電話の普及に伴い、ユーザがそうした機器を用いてさまざまなシーンで撮影する機会が増えている。こうしたシーンの中には、被写体を認識して的確なカメラパラメータを設定することにより高品質な写真を得ることができる場合が多い。
特許文献1には、撮像画像から得られる情報に加えて、カメラ内の時計や温度計、GPS画像から得られる情報などから、撮像者がその条件であれば一番多用するであろう撮影モードを推定し撮像者に提示する機能をもった画像処理装置が開示されている。
また、この文献中には被写体を認識し、その種類によって撮影シーンの推定をすることも開示されている。
特開2007−184733号公報
しかしながら、特許文献1の画像処理装置では撮影モードの推定のための情報を得るためにセンサやGPSなどのハードウェア構成が必要となることから、既存のカメラモジュールへ組み込むことが難しい。また、デジタルカメラの小型化や携帯電話への搭載時の物理的あるいはコスト的な制約をクリアすることが難しい。
一方、一般の被写体認識技術として、テンプレートマッチングや特徴点抽出による形状(輪郭)認識などの手法がある。しかし、山や空など人間が風景と認識するような被写体(以下、風景被写体という。)を認識しようとする場合には、それらの風景被写体には特定の形状が存在しないため、正確に認識することは容易ではない。また、すべてのパターンに対応しようとすると、テンプレートデータが膨大になるという問題がある。
本発明は、上述の係る事情に鑑みてなされたものであり、ハードウェアなどの構成を必
要とせず、画像処理のみによる撮影シーンの判別が可能であり、さらに、膨大なテンプレ
ートデータを用いることなく、高精度に風景被写体を認識することのできる画像識別方法
を提供することを目的とする。
上記課題を解決するため本発明に係わる画像識別方法は、コンピュータ処理によって、入力した画像データのブロック画像の特徴量をもとに該ブロック画像を予め定められた複数のカテゴリに分類する画像識別方法であって、画像データを複数のブロックに分割してブロック画像を生成するブロック画像生成ステップと、ブロック画像の色空間情報および周波数成分によって夫々のブロック画像の特徴量を演算する画像特徴量演算ステップと、ブロックごとにカテゴリが付された教師データ画像を読み込ませ、教師データ画像のブロックごとに画像特徴量を演算して、各カテゴリを識別する境界となる分離超平面を学習する分離超平面演算ステップと、新たに取得した画像についてブロック画像生成ステップと画像特徴量演算ステップを実行してブロック画像の画像特徴量を計算し、各カテゴリの分離超平面からの距離によって、当該ブロック画像の属するカテゴリを判定するカテゴリ判定ステップと、を含むことを特徴とする。
本発明では、ブロック画像の色空間情報のみならず周波数成分を用いこれらを特徴量として、予め教師データによって得た分離超平面からの距離に基づいてカテゴリを判定する。
ブロックごとにカテゴリが付されたサンプル画像を教師データとして、画像特徴量空間におけるカテゴリごとの分離超平面を演算し、この分離超平面データを基準にして新たに取得した画像のカテゴリをブロックごとに判別する。
好ましくは、画像特徴量演算ステップは、ブロック画像を色空間上で複数の階層に分割し階層ごとの出現度数を検出すると共にブロック内のピクセル間標準偏差を演算する一方、該ブロック画像をさらに複数の小ブロックに分け、該小ブロックの濃淡変化を表す周波数成分を計算し、該周波数成分をもとに該小ブロックの属するブロック内について水平方向と垂直方向のうち少なくとも一方向について周波数成分の偏りを演算し、出現度数、ピクセル間標準偏差、周波数成分および周波数成分の偏りを画像特徴量として演算すると良い。
ブロック画像の色成分のみでなく、ブロック内の周波数成分の偏りを用いることによって、ブロック分割数を抑制して精度の高い識別を可能にする。
本発明に係わる画像識別方法は、さらに、カテゴリ間の不整合条件を保存しておき、この不整合条件と周囲のブロック画像のカテゴリとに基づいて、新たに取得した画像のブロック画像のカテゴリを変更した後、隣接する同一カテゴリのブロックをグループ化し、該グループ化されたブロック群について不整合条件に基づいてカテゴリ判定の正当性の有無を評価する整合チェックステップを含むことを特徴とする。
この不整合条件は、ブロック画像単体に対する不整合条件と、ブロック画像のグループに対する不整合条件からなる。たとえば、一ブロックのみ周囲の隣接するブロックとカテゴリが異なっていた場合は周囲のブロックのカテゴリに合わせる、というものである。このとき、分離超平面からの距離に基づいて、正の距離が大きい場合は変更しないというように分離超平面からの距離をその条件に加えると、より正確な修正が可能となる。
ブロック群に対する不整合条件は、たとえば、「空」の上に「海」は来ないというような位置関係の矛盾を判定する条件である。
そして、この整合チェックステップの結果、正当性有りと評価されたブロック群のカテゴリを出力する。これによりブロック群のカテゴリの精度の高い識別が可能となる。
なお、上記の画像特徴量を用いればブロック分割数は一定でも判定精度は高いが、異なるカテゴリの境界のブロックについては、さらに小ブロックに分割してカテゴリ判定をすることによって、より精密な判定が可能となる。なお、画像処理においては、異なるカテゴリのブロック群の境界でエッジやコーナを検出することによって画像処理を効率的に行うことができる。
また、本発明に係わる撮像装置は、上記の画像識別方法によって画像のカテゴリを識別する撮像装置であって、カテゴリごとに撮像装置のパラメータの設定条件と撮影後の画像処理方法を記憶する撮影条件保存手段と、撮影の際、上記画像識別方法によって出力された撮影対象画像のカテゴリに基づいて撮像装置のパラメータを設定して撮影して撮像画像を取得する撮像手段と、該撮像画像に対して該カテゴリに対する画像処理方法によって画像処理を実行する画像処理手段と、を備えたことを特徴とする。
本発明では、いわゆるプレビューで得た画像のカテゴリ判定の結果を用いて、カメラパラメータ(たとえば、自動/手動モード、シャッタースピード、露出)などの調整をして撮影し、撮影後はさらに、そのカテゴリに応じた画像処理(たとえば、輪郭強調、色調補正など)を行う。また、画像のカテゴリ判定の結果を用いて、最適な撮影モードをユーザに提示することにより、ユーザによる撮影モードの選択を補助することができる。
さらに、本発明に係わる撮像装置は、上記の画像識別方法によって画像のカテゴリを識別する撮像装置であって、カテゴリに関連付けて実行すべきプログラムを格納するプログラム格納手段と、上記画像識別方法によって識別されたカテゴリに関連付けられたプログラムがプログラム格納手段に格納されている場合は、当該プログラムを選択するプログラム選択手段と、プログラム選択手段によって選択されたプログラムを実行するプログラム実行手段と、を備えたことを特徴とする。
本発明では、画像識別方法によって判定されたカテゴリに対応するプログラムを自動的に、あるいは、モニタ画面への表示出力後のユーザの選択によって起動するようにして操作の簡略化・効率化を可能にする。
本発明によれば、色空間情報と周波数成分を画像特徴量とし、予め教師データを用いて、カテゴリごとの画像特徴量に基づいて分離超平面を計算しておき、カテゴリ判定の対象となる画像についてそのブロックの画像特徴量の各カテゴリの分離超平面からの距離によって、当該ブロックのカテゴリを判定するので、特徴的な一定の形状がなく、テンプレートマッチングが適さないような風景被写体であっても、高精度に対象を識別することができる。
以下、本発明の実施の形態を説明する。図1は、本実施の形態の画像識別方法を実現する判別器の概要説明図である。ここでは、風景被写体を山、空、海、紅葉、夕焼け、桜の6つにカテゴリ分けする場合を例に説明する。ただし、本発明はこれに限定されない。
図1において、判別器10は汎用のコンピュータシステムによって構成され、まず入力画像を受け付け、ブロックに分割する。そして、各ブロックから後述する画像特徴量を計算し、ブロック中にどの風景被写体が存在するか、あるいは不明か、という判定をブロックごとに行って、その判定結果を出力する。
判別器10には予め正解の風景画像をラベルに付けた画像ブロックを教師データとして与え、分類方法を学習させる。
たとえば、学習アルゴリズムとして広く使われている線形SVMの専用ライブラリliblinear(http://www.csie.ntu.edu.tw/~cjlin/liblinear)を利用して、カテゴリごとの画像特徴量を入力して、分離超平面を算出する。これを記憶しておき、新たに取得した認識対象の画像(以下、対象画像という。)についてその画像特徴量を求め、カテゴリごとに記憶している分離超平面からの距離を計算してその距離が最も大きな正の値となるカテゴリがそのブロックに該当するカテゴリであると判定する。
以下、判別器10の構成と動作について説明をする。
図2は、本実施の形態による判別器10の機能ブロック図である。ここで、判別器10は、データを記憶する記憶部20と演算処理を実行する演算部30を有している。演算部30は、画像データを入力して記憶部20へ格納する画像データ入力手段31、入力した画像データを予め定められた複数のブロックに分割するブロック画像生成手段32、ブロック画像の画像特徴量演算手段33、教師データをもとに分離超平面を演算する分離超平面演算手段34、入力画像の画像特徴量と分離超平面データからブロックの属するカテゴリを判定するカテゴリ判定手段35、カテゴリ分類されたブロックをグループ化してブロック群を形成するブロック画像グループ化手段36、夫々のブロックまたはブロック群に対して、そのカテゴリ同士の位置関係から矛盾がないかどうかをチェックする整合チェック手段、および、ブロックごとのカテゴリおよびグループ情報を出力する出力手段38を有している。各手段31〜38は、CPUの処理(ステップ)としてプログラムによって実行可能である。
<1.教師データによる分離超平面データの生成処理>
まず、判別器10に対して教師データを入力する。教師データは、正解のカテゴリをラベル付けした画像ブロックである。
上述の6種類の風景被写体のカテゴリに加え、人工物、黒、白、という3つのカテゴリを加える。これはたとえ風景被写体を識別させることが目的であっても、風景被写体が写っていない画像に対して無理にカテゴリ分類をすることを避けるためである。このような、いわゆる消極的カテゴリを加えることによって本来の識別対象である風景被写体のカテゴリ分類の精度を上げることができる。消極的カテゴリは、上記の例に限定されず任意に設定して良い。また、風景被写体以外を消極的カテゴリとして1つにまとめたカテゴリにしてもよい。
入力された教師データは、画像データ入力手段31を介して記憶部20の教師データ保存領域22に保存される。
次に、画像特徴量演算手段33によって、教師データの各ブロック画像に対する画像特徴量データを計算する。
以下、画像特徴量データの求め方について説明する。
(画像特徴量の求め方)
画像特徴量は、ブロックの色空間情報と周波数成分を用いて求める。
(1)色空間情報
色空間としては、YUV空間を用い、Y,U,Vそれぞれについて8段階の強さごとの
32x32ブロック中に出現する頻度を計測する。
なお、YUV値のピクセル間の標準偏差は、色のばらつきが大きい場合や、色の分布がいくつかのグループに分かれるような場合に大きな値を示し、人工物の認識には有効なため特徴量に加えるのが効果的である。
具体的には、図4に示すように、縦軸に度数、横軸に階級をとったヒストグラムを用い、各色成分値0〜255を8つのクラスタにわけ、出現度数を計測する。したがって、各色成分度数7自由度×3=21自由度、21次元空間が作られることになる。
(2)周波数情報
ブロックの複雑さや規則性を検出するのに空間周波数成分による分析が有効になる。たとえば、同じような色合いの空と海を比べた場合、一般に後者の高周波成分の方が多くなるため、色成分情報に加えて空間周波数成分を特徴量とすることによってカテゴリ分けをすることができる。
また、山肌と海は、色合いに両者でほとんど差が無く、高周波成分が多くなる傾向があるが、海の表面には波による水平方向の線が入ることが多く、垂直方向の周波数成分が水平方向と比べて有意に高くなるといった特徴があるため、垂直方向と水平方向のどちらに周波数成分が偏っているかを特徴量として取得することによりカテゴリ分けをすることができる。
周波数情報については、具体的には以下の処理を行う。
(S1)32x32ピクセルのブロックを、さらに8x8の16個の小ブロックに分割する。
(S2)8x8の小ブロックごとの周波数成分を取得する。
(S3)64個の各周波数成分を各小ブロックから取得し集計する。なお、周波数成分は、適宜間引いたり、近隣の周波数成分を平均化したりするなどして情報量を減らしてもよい。
周波数変換は既知の技術であるアダマール変換とDCT変換の手法のいずれを用いても良い。
次に、周波数の偏りの計算方法を説明する。
周波数成分にはX方向とY方向の周波数成分があるが、図3の斜線部分がX方向、灰色がY方向の成分である。本実施の形態ではX方向の成分の和とY方向の成分の和をとってその比率を計算する。
この演算結果により、比率が小さいとX方向とY方向の画像の複雑度が等しい、比率が大きい場合はどちらかに画像の複雑度が大きい、という判定が可能となる。たとえば、いずれかの方向の波模様のような画像、具体的にはY方向に縦縞のある模様はY方向の成分に対するX方向の成分の比率が大きいことになる。
次に、分離超平面演算手段34によって、上記のアルゴリズムによって求めた画像特徴量データと教師データのブロックごとのカテゴリ情報とを用いて分離超平面データを求め、分離超平面データ保存領域25に保存する。
(分離超平面データの求め方)
本実施例ではサポートベクターマシーン(以下SVM)を用いた例について説明する。
SVMは、与えられた教師データの集合を、夫々の教師データが属するカテゴリに応じて分離超平面を演算し、分離超平面で各カテゴリに分離する手法である。
分離超平面はカテゴリごとに演算される。ここでは例としてカテゴリ「海」の分離超平面を演算する場合を例に説明する。
所定数のサンプル画像取得後、画像特徴量演算手段33は、ブロックごとに特徴量を取得する。
このとき、教師データとなるサンプル画像内のブロックはそれぞれカテゴリ付けされており、「海」や「山」その他前出のカテゴリが付与されている。このとき消極的カテゴリが付与されていてもよい。
SVMは、「海」についての分類を学習する場合、d次元の特徴量空間において、「海」のカテゴリが付与された特徴量データの領域と、「海」以外のカテゴリが付与された特徴量データの領域の二つのクラスに分割するような分離平面を設定する。dを二次元とした場合の特徴量空間のイメージは図5のようになる。このとき、分離平面は複数設定されうるが、二つのクラスの最端の座標との距離が最大になる(いわゆるマージン最大になる)分離平面を演算する。このときの分離平面が求めるカテゴリ「海」についての分離超平面となる。
分離超平面はd次元の特徴量データをX=(x1,x2,…,xd)とし、ベクトル=(w1,w2,…,wd)、定数cとして以下のように表わされる。
w1x1+w2x2+…+wdxd+c=0 ・・・ (1)
判別対象となるブロックが後述のカテゴリ判定手段35に入力されたとき、画像特徴量演算手段33によって得られたd次元の特徴量データF=(x1,x2,…,xd)が算出され、式(1)であらわされるカテゴリごとの分離超平面との特徴量空間における距離によってどのカテゴリに属するかがか判定されることとなる。
分離超平面演算手段34は、各カテゴリについて上記の「海」の例と同様に分離超平面を求め、分離超平面データ保存領域25に保存する。図6は特徴量空間を二次元とし、「海」、「山」、「空」のカテゴリについて学習を行った場合の分離超平面のイメージ図である。
<2.対象画像のカテゴリ化処理>
(画像入力処理)
入力された対象画像は画像データ入力手段31によって、記憶部20の対象画像保存領域21に保存される。
(ブロック分割処理)
この入力画像は、ブロック画像生成手段32によって、予め定められた所定数、たとえば、32x32個のブロックに分割されブロック画像保存領域23に格納される。なお、ブロック画像は、元画像に関連付けて、各ブロックの先頭を示すアドレス情報のみを保存するようにしても良い。このブロックのサイズは、上述の教師データとして与えられているブロックのサイズと同じである。
(画像特徴量演算処理)
次に、上記の画像特徴量演算手段33による処理によってブロックごとの画像特徴量データが算出され画像特徴量データ保存領域24に格納される。図7は、ブロックごとの画像特徴量データの例である。ここで、x1,x2,x3・・・は、各特徴量データである。
(カテゴリ判定処理)
次に、カテゴリ判定手段35によって、入力画像の各ブロックの画像特徴量の分離超平面からの距離に基づいて、当該ブロックがどのカテゴリに属するかを判定する。
具体的には、カテゴリごとの上記(1)式の左辺に画像特徴量演算処理によって求めた特徴量データを代入して、分離超平面と特徴量空間における座標(x1,x2,・・・,xd)との間の符号付き距離を計算して分離超平面データ保存領域25に格納する(図8参照)。そして、その距離が最も大きな正の値になるカテゴリが当該ブロックの属するカテゴリであると判定し、その判定結果を結果ファイル26に保存する。図9は、結果ファイルのデータ構成例である。この図でブロックNO.は、対象画像の32x32に区分された各ブロック画像に対応している。また、ブロックごとに判定されたカテゴリが関連付けられている。
このとき、いずれのカテゴリに対しても負の距離をとるときや、消極的カテゴリに属する場合は、いずれのカテゴリにも属さないことをしめす「不明」に設定したり、カテゴリを空に設定する。
(整合チェック処理)
次に、この結果ファイル26の各ブロックのカテゴリは、整合性チェック手段37によってチェック修正される。
図10は、ブロック単位のカテゴリ修正手順を示すフローチャートである。
まず、あるブロックを着目ブロックとして、その着目ブロックに隣接するブロックのうち所定の数(たとえば、3方向)以上が着目ブロックのカテゴリとは異なるカテゴリであるか否かを判定し(S102)、YESの場合は、図11に示す修正閾値テーブルにアクセスして、そのカテゴリに対応する閾値となる分離超平面からの距離を抽出する(S103)。そして、着目ブロックの分離超平面からの距離は、抽出した閾値以上か以下かを判定し(S104)、閾値以下の場合は、着目ブロックを周囲のカテゴリと同じカテゴリに変更する(S105)。
分離超平面によるカテゴリ判定の際に、距離条件をあまり厳しくすると、本来そのカテゴリに属するものが、属さないという判定になる傾向が強くなる。一方、緩くすると、そのカテゴリに属さないものも、属するという誤認定の傾向が強くなる。整合チェックの閾値を調整することによって実用的なレベルに設定することができる。
ブロックごとのカテゴリの修正後、グループ化手段36によって隣接する同じカテゴリのブロックがグループ化され、ブロック群が形成される(図9および図12参照)。さらに、整合性チェック手段37は、このブロック群に対しても矛盾がないか否かを判定して、その判定結果を保存する。
図13は、整合チェック手段37のブロック群整合性判定手順を示すフローチャートである。
ある着目グループ群について、不整合条件テーブルにアクセスして不整合条件を順に取り出し、その条件に該当するか否かを判定する。不整合条件を図14に示す。この図で、不整合条件は、包含条件と上下関係の位置の条件からなっており、たとえば、条件NO.1の「海」について言えば、「海」は、「空」を包含することはない、というもので、もしカテゴリ「海」のブロックが「空」のカテゴリのブロックの周囲を蔽うならばカテゴリ判定にエラーがあった、すなわち不整合であると判定するものである。また、条件NO.2の「空」について言えば、「空」の上に「海」があり、かつ、空の下に「山」があるのは不整合があると判定するものである。これらの条件を各ブロック群について判定する。なお、この整合チェックの結果、不整合ありとなった場合は、その旨のメッセージを出力しても良いし、不整合のあったブロック群の境界のブロックについて、それぞれ分離超平面からの距離、あるいは修正閾値テーブルの閾値との差の大きい方のカテゴリに順に合わせ込んでいくという修正処理を行うようにしても良い。このほか、ブロック群に属するブロックの数が予めカテゴリごとに定めた所定値以下の場合は、そのブロック群のカテゴリを無効にするなどの処理を行うようにしても良い。
そして、この対象画像のカテゴリ情報、および判定結果は出力手段38を介して出力される。
以上、本実施の形態によれば、ブロック画像の色空間で強さによって複数段階に階層化し、階層ごとの出現度数、ピクセル間標準偏差、濃淡変化を表す周波数成分、およびブロック内の周波数成分の偏りを画像特徴量とするので、精度の良い識別が可能となる。
次に、本発明の第2の実施の形態を説明する。図15は、図2の判別器10を組み込んだ撮像装置のブロック図である。この図で、撮像装置1は、被写体の画像信号を生成する撮像素子2、シャッター操作を検知して画像蓄積指令を出力するシャッター操作検知手段4、シャッター操作検知手段4からの画像蓄積指令を受けて、撮像素子2から出力された画像信号を蓄積する蓄積手段5、蓄積されている画像データを補正する画像処理手段6、判別器10、および、判別器10から出力されたカテゴリデータに基づいて撮像素子2のパラメータを設定するパラメータ設定手段3から構成されている。
ここで、判別器10は、基本的に図2に示す構成を有しているが、撮像装置1への組み込みに際しては、予め別に算出した分離超平面データを保存しておくので、分離超平面演算手段34を省略することができる。
以下、上記の構成を有する撮像装置1の動作を説明する。
シャッター操作前のプレビューモードで撮像素子2から出力された画像信号は、判別器10に入力される。判別器10では、この画像信号に対して、第1の実施の形態で説明した動作を実行し、画像ブロック群に対するカテゴリを出力する。パラメータ設定手段3は、図16に示すカテゴリとパラメータとを関係付けたパラメータテーブルを備えており、このテーブルを参照して撮像素子2のシャッタースピードや露光時間、その他のモード設定を行う。
その後、シャッター操作検知手段4は、シャッターが押されたことを検知すると、そのタイミングを撮像素子2へ通知し、また撮像素子2から出力された画像信号を蓄積手段5に蓄積する。この蓄積された画像データは、画像処理手段6に読み込まれ、判別器10から出力されるこの画像のカテゴリデータをもとに図17に示すカテゴリと補正処理とを関係付けた補正処理テーブルにしたがって、該当する補正処理を実行する。
本実施の形態によれば、プレビューで得た画像データのカテゴリ判定の結果を用いて、撮像装置のパラメータを調整して撮影し、撮影後はさらに、そのカテゴリに応じた画像処理を行うので、ユーザに複雑なパラメータの設定操作をさせることなく、品質の高い撮像画像を生成することができる。
なお、本発明はその要旨を逸脱しない範囲で種々変形して実施をすることができる。たとえば、上記実施形態では、いわゆる風景被写体を例に挙げて説明したが、被写体が風景であるか否かに限らず、例えば、人や人工物などを含めあらゆるカテゴリに適用できることは明らかである。
また、図18のように、認識された風景被写体に応じてユーザが利用する可能性の高い撮影モードを提示し、選択させてもよい。選択されたモードに対応したパラメータ設定、画像処理をすることによりユーザの希望に応じた品質の高い画像を生成することができる。
次に、本発明の第3の実施の形態を説明する。図19は、本実施の形態による撮像装置のブロック図である。図15との違いは、パラメータ設定手段3の替わりに、カテゴリに関連付けてプログラムを格納するプログラム格納手段8、判別器10で判別されたカテゴリを入力して、プログラム格納手段8に保存されているプログラムの中で当該カテゴリに関連付けられているプログラムを選択するプログラム選択手段7、選択手段7によって選択されたプログラムを実行するプログラム実行手段9を設けたことである。
以下、図20(a)に示す二次元バーコード50を表示した名刺を撮影する場合を例にして撮像装置1の動作を説明する。
まず、予め判別器10に対して、第1の実施の形態で説明した方法によって二次元バーコードの教育データを用いて学習させ、その分離超平面データを保存しておくものとする。
この撮像装置1で二次元バーコード付きの名刺を撮影することによって、撮像素子2から出力された名刺の画像信号は、判別器10に入力される。判別器10では、この名刺画像に対して、第1の実施の形態で説明した動作を実行し、画像ブロック群ごとのカテゴリを出力する。判別器10は、二次元バーコードの分離超平面データを備えているので、この場合、図20(b)のA部の太枠で示したブロック群を二次元バーコードのカテゴリであると認識して、ブロック群とカテゴリ情報を出力する。
プログラム選択手段7は、このカテゴリデータを入力すると、プログラム格納手段8に保存されている二次元バーコード読取プログラムを選択して、プログラム実行手段9に渡す。そして、プログラム実行手段9は、プログラム選択手段7から渡された二次元バーコード読取プログラムを起動する。
二次元バーコード読取プログラムは、起動されると、撮像手段の設定を焦点距離の短いマクロ撮影モードに設定し、画像処理手段6に対して、二次元バーコード領域の画像データを要求する。画像処理手段6は、入力画像が二次元バーコードの画像データであるかを判断し、二次元バーコード領域の画像をプログラム実行手段9に渡す。プログラム実行手段9で実行されている二次元バーコード読取プログラムは、二次元バーコード画像を処理し、そこに含まれる情報を取得し、結果として出力する。
以上、二次元バーコードの場合について撮像装置1の動作を説明したが、カテゴリに対応して起動すべきプログラムが存在すれば、同様に動作可能である。
たとえば、文字情報のカテゴリに関連付けてOCRプログラムを格納しておけば、判別器10は、図20(b)のB部を文字情報として認識し、OCRプログラムが起動され、B部の文字情報を読み取ることができる。
本実施の形態によれば、カテゴリとプログラムとを対応付けて保存しておき、判別器から出力されたカテゴリデータに基づいて、対応するプログラムを実行させるので、操作性が向上する。さらに画像処理手段による補正処理と連動させることによって、プログラム処理の精度を上げることができる。
本発明の実施の形態による画像識別方法を実現する判別器の概要説明図である。 本発明の第1の実施の形態による判別器10の機能ブロック図である。 本発明の実施の形態による周波数成分処理の説明図である。 本発明の実施の形態によるヒストグラムを用いた色成分処理の説明図である。 本発明の実施の形態による特徴量空間と分離平面との関係を示す概要図である。 特徴量空間が二次元の場合における分離超平面の概要図である。 図2の画像特徴量データの構成例である。 図2の分離超平面データの構成例である。 図2の結果ファイルのデータ構成図である。 図2の整合チェック手段37のブロック単位のカテゴリ修正手順を示すフローチャートである。 図10の処理で用いられる修正閾値テーブルのデータ構成例である。 図9の画像上でのブロックグループの位置関係を例示する概要図である。 図2の整合チェック手段37のブロック群整合性判定手順を示すフローチャートである。 図13の処理で用いられる不整合条件テーブルである。 本発明の第2の実施の形態による撮像装置のブロック図である。 図15のパラメータ設定手段3の備えるパラメータテーブルのデータ例である。 図15の画像処理手段6の備える補正処理テーブルのデータ例である。 撮像装置の液晶モニタ上に表示される被写体と撮影モードの選択画面の一例を示す図である。 本発明の第3の実施の形態による撮像装置のブロック図である。 本発明の第3の実施の形態によるカテゴリ別ブロック群の説明図である。
符号の説明
1 撮像装置
2 撮像素子
3 パラメータ設定手段
4 シャッター操作検知手段
5 蓄積手段
6 画像処理手段
7 プログラム選択手段
8 プログラム格納手段
9 プログラム実行手段
10 判別器
20 記憶部
21 対象画像保存領域
22 教師データ保存領域
23 ブロック画像保存領域
24 画像特徴量データ保存領域
25 分離超平面データ保存領域
26 結果ファイル
30 演算部
31 画像データ入力手段
32 ブロック画像生成手段
33 画像特徴量演算手段
34 分離超平面演算手段
35 カテゴリ判定手段
36 グループ化手段
37 整合チェック手段
38 出力手段
50 二次元バーコード

Claims (6)

  1. コンピュータ処理によって、入力した画像データのブロック画像の特徴量をもとに該ブロック画像を予め定められた複数のカテゴリに分類する画像識別方法であって、
    前記画像データを複数のブロックに分割してブロック画像を生成するブロック画像生成ステップと、
    ブロック画像の色空間情報および周波数成分によって夫々の前記ブロック画像の特徴量を演算する画像特徴量演算ステップと、
    ブロックごとにカテゴリが付された教師データ画像を読み込ませ、前記教師データ画像のブロックごとに画像特徴量を演算して、各カテゴリを識別する境界となる分離超平面を学習する分離超平面演算ステップと、
    新たに取得した画像について前記ブロック画像生成ステップと前記画像特徴量演算ステップを実行してブロック画像の画像特徴量を計算し、特徴量空間における各カテゴリの分離超平面からの距離によって、当該ブロック画像の属するカテゴリを判定するカテゴリ判定ステップと、
    を含むことを特徴とする画像識別方法。
  2. 前記画像特徴量演算ステップは、前記ブロック画像を色空間上で複数の階層に分割し階層ごとの出現度数を検出すると共にブロック内のピクセル間標準偏差を演算する一方、該ブロック画像をさらに複数の小ブロックに分け、該小ブロックの濃淡変化を表す周波数成分を計算し、該周波数成分をもとに該小ブロックの属するブロック内について水平方向と垂直方向のうち少なくとも一方向について前記周波数成分の偏りを演算し、前記出現度数、前記ピクセル間標準偏差、前記周波数成分および前記周波数成分の偏りを画像特徴量として演算することを特徴とする請求項1記載の画像識別方法。
  3. カテゴリ間の不整合条件を保存しておき、前記新たに取得した画像のブロック画像の周囲のブロックを参照し、前記周囲のブロックの参照結果と前記不整合条件に基づいて前記新たに取得した画像のブロック画像のカテゴリを変更するステップと、
    隣接する同一カテゴリのブロックをグループ化し、該グループ化されたブロック群について前記不整合条件に基づいてカテゴリ判定の正当性の有無を評価する整合チェックステップとを含むことを特徴とする請求項1または2記載の画像識別方法。
  4. 前記整合チェックステップの結果、正当性有りと評価されたブロック群のカテゴリを出力することを特徴とする請求項3記載の画像識別方法。
  5. 請求項1乃至4のいずれかに記載の画像識別方法によって画像のカテゴリを識別する撮像装置であって、
    カテゴリごとに撮像装置のパラメータの設定条件と撮影後の画像処理方法を記憶する撮影条件保存手段と、
    撮影の際、前記画像識別方法によって出力された撮影対象画像のカテゴリに基づいて前記撮像装置のパラメータを設定し、撮像画像を取得する撮像手段と、
    該撮像画像に対して該カテゴリに対する前記画像処理方法によって画像処理を実行する画像処理手段と、
    を備えたことを特徴とする撮像装置。
  6. 請求項1乃至4のいずれかに記載の画像識別方法によって画像のカテゴリを識別する撮像装置であって、
    カテゴリに関連付けて実行すべきプログラムを格納するプログラム格納手段と、
    前記画像識別方法によって識別されたカテゴリに関連付けられたプログラムが前記プログラム格納手段に格納されている場合は、当該プログラムを選択するプログラム選択手段と、
    前記プログラム選択手段によって選択されたプログラムを実行するプログラム実行手段と、
    を備えたことを特徴とする撮像装置。
JP2008208407A 2008-08-13 2008-08-13 画像識別方法および撮像装置 Active JP4772839B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008208407A JP4772839B2 (ja) 2008-08-13 2008-08-13 画像識別方法および撮像装置
CN200910165538.7A CN101650783B (zh) 2008-08-13 2009-07-29 图像识别方法以及摄像装置
KR1020090070825A KR101324268B1 (ko) 2008-08-13 2009-07-31 화상 식별 방법 및 촬상장치
US12/462,869 US8363933B2 (en) 2008-08-13 2009-08-11 Image identification method and imaging apparatus
EP09167695A EP2154630A1 (en) 2008-08-13 2009-08-12 Image identification method and imaging apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008208407A JP4772839B2 (ja) 2008-08-13 2008-08-13 画像識別方法および撮像装置

Publications (2)

Publication Number Publication Date
JP2010045613A true JP2010045613A (ja) 2010-02-25
JP4772839B2 JP4772839B2 (ja) 2011-09-14

Family

ID=41228398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008208407A Active JP4772839B2 (ja) 2008-08-13 2008-08-13 画像識別方法および撮像装置

Country Status (5)

Country Link
US (1) US8363933B2 (ja)
EP (1) EP2154630A1 (ja)
JP (1) JP4772839B2 (ja)
KR (1) KR101324268B1 (ja)
CN (1) CN101650783B (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010147229A1 (en) * 2009-06-18 2010-12-23 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
JP2011150627A (ja) * 2010-01-25 2011-08-04 Ihi Corp 通路検出方法、装置、及びプログラム
JP2011150626A (ja) * 2010-01-25 2011-08-04 Ihi Corp 画像分類方法、装置、及びプログラム
JP2012004716A (ja) * 2010-06-15 2012-01-05 Sanyo Electric Co Ltd 撮像装置及び電子機器
EP2528017A1 (en) 2011-05-23 2012-11-28 Morpho, Inc. Image identification device, image identification method, image identification program, and recording medium
EP2528020A2 (en) 2011-05-23 2012-11-28 Morpho, Inc. Image identification device, image identification method, image identification program, and recording medium
JP2015514278A (ja) * 2012-06-14 2015-05-18 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation マルチキュー・オブジェクトの検出および分析のための方法、システム、製品、およびコンピュータ・プログラム(マルチキュー・オブジェクトの検出および分析)
JP2016099734A (ja) * 2014-11-19 2016-05-30 キヤノン株式会社 画像処理装置、情報処理方法及びプログラム
JP2019139497A (ja) * 2018-02-09 2019-08-22 株式会社日立ソリューションズ・クリエイト 画像処理システム及び画像処理方法
JP2019164450A (ja) * 2018-03-19 2019-09-26 株式会社Screenホールディングス 画像処理方法、コンピュータプログラムおよび記録媒体
CN110636217A (zh) * 2019-08-29 2019-12-31 高雪亚 自动化现场数据处理系统
WO2024024437A1 (ja) * 2022-07-27 2024-02-01 京セラ株式会社 学習データ生成方法、学習モデル、情報処理装置、及び情報処理方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4623388B2 (ja) * 2008-09-08 2011-02-02 ソニー株式会社 画像処理装置および方法、並びにプログラム
CN102156860A (zh) * 2011-04-25 2011-08-17 北京汉王智通科技有限公司 车辆检测方法和装置
GB2495269B (en) * 2011-08-15 2014-02-05 Qatar Foundation Real-time solar observations
US8477189B2 (en) 2011-08-16 2013-07-02 Qatar Foundation Real-time solar observations
US9053359B2 (en) * 2012-06-07 2015-06-09 Konica Minolta Laboratory U.S.A., Inc. Method and system for document authentication using Krawtchouk decomposition of image patches for image comparison
CN103679189B (zh) * 2012-09-14 2017-02-01 华为技术有限公司 场景识别的方法和装置
EP2709350B1 (en) * 2012-09-14 2015-06-03 Axis AB Configuration of image capturing settings
US9773231B2 (en) 2013-05-29 2017-09-26 Evernote Corporation Content associations and sharing for scheduled events
CN104424485A (zh) * 2013-08-22 2015-03-18 北京卓易讯畅科技有限公司 一种基于图像识别来获取特定信息的方法与装置
US10545638B2 (en) 2013-09-16 2020-01-28 Evernote Corporation Automatic generation of preferred views for personal content collections
CN103617432B (zh) * 2013-11-12 2017-10-03 华为技术有限公司 一种场景识别方法及装置
JP6471934B2 (ja) * 2014-06-12 2019-02-20 パナソニックIpマネジメント株式会社 画像認識方法、カメラシステム
CN104240213B (zh) * 2014-09-05 2017-12-15 京东方科技集团股份有限公司 一种显示方法及显示装置
CN104299196A (zh) * 2014-10-11 2015-01-21 京东方科技集团股份有限公司 一种图像处理装置及方法、显示设备
CN105160360A (zh) * 2015-09-29 2015-12-16 上海斐讯数据通信技术有限公司 一种国旗识别方法及移动终端
US11170215B1 (en) * 2016-04-28 2021-11-09 Reality Analytics, Inc. System and method for discriminating and demarcating targets of interest in a physical scene
JP6233824B1 (ja) * 2017-04-25 2017-11-22 合同会社ウイングビジョン 画像検査装置、生産システム、画像検査方法、プログラム及び記憶媒体
CN111382296B (zh) * 2018-12-28 2023-05-12 深圳云天励飞技术有限公司 数据处理方法、装置、终端及存储介质
CN111553422A (zh) * 2020-04-28 2020-08-18 南京新空间信息科技有限公司 手术器械自动识别回收方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06231254A (ja) * 1993-02-03 1994-08-19 Kokusai Denshin Denwa Co Ltd <Kdd> 動画像の高速認識検索方法
JPH07222175A (ja) * 1994-02-04 1995-08-18 Sony Corp 画像照合方法および装置
JP2000115557A (ja) * 1998-10-08 2000-04-21 Fuji Xerox Co Ltd 画像処理装置
JP2001145604A (ja) * 1999-11-19 2001-05-29 Nippon Telegr & Teleph Corp <Ntt> 眼底画像の動静脈識別方法及び装置
JP2002183145A (ja) * 2000-12-12 2002-06-28 Nec Corp 画像検索システムとその画像検索方法、及び画像検索プログラムを記録した記憶媒体
JP2008072410A (ja) * 2006-09-14 2008-03-27 Nec Saitama Ltd 撮像装置、携帯電話、撮像制御方法、撮像制御プログラムおよびプログラム記録媒体

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPN727295A0 (en) * 1995-12-21 1996-01-18 Canon Kabushiki Kaisha Zone segmentation for image display
US5963670A (en) * 1996-02-12 1999-10-05 Massachusetts Institute Of Technology Method and apparatus for classifying and identifying images
JP4267103B2 (ja) 1998-09-18 2009-05-27 株式会社日立製作所 外観画像分類装置およびその方法
JP2001005967A (ja) 1999-06-21 2001-01-12 Matsushita Electric Ind Co Ltd 画像送信装置及びニューラルネットワーク
US6301440B1 (en) * 2000-04-13 2001-10-09 International Business Machines Corp. System and method for automatically setting image acquisition controls
US7194134B2 (en) * 2001-01-02 2007-03-20 Microsoft Corporation Hierarchical, probabilistic, localized, semantic image classifier
JP4669150B2 (ja) 2001-04-09 2011-04-13 キヤノン株式会社 主被写体推定装置及び主被写体推定方法
US6996277B2 (en) * 2002-01-07 2006-02-07 Xerox Corporation Image type classification using color discreteness features
JP4062987B2 (ja) 2002-06-25 2008-03-19 松下電工株式会社 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム
JP4611069B2 (ja) * 2004-03-24 2011-01-12 富士フイルム株式会社 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
EP1802096B1 (en) * 2004-09-30 2019-10-23 FUJIFILM Corporation Image processing device, method, and image processing program
JP2006268820A (ja) 2004-11-02 2006-10-05 Matsushita Electric Ind Co Ltd 画像識別方法、画像処理方法、画像識別装置、画像識別プログラムおよび集積回路
WO2006090731A1 (ja) 2005-02-23 2006-08-31 Nec Corporation 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム
US7609885B2 (en) * 2005-08-04 2009-10-27 Sony Corporation System and method for effectively implementing a texture feature detector
JP4659569B2 (ja) 2005-09-13 2011-03-30 キヤノン株式会社 撮像装置
JP2007184733A (ja) 2006-01-05 2007-07-19 Fujifilm Corp 撮像装置及び撮影モード表示方法
US7840071B2 (en) * 2006-12-12 2010-11-23 Seiko Epson Corporation Method and apparatus for identifying regions of different content in an image
DE102007019057A1 (de) * 2007-04-23 2008-10-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bestimmen eines Kanten-Histogramms, Vorrichtung und Verfahren zum Ablegen eines Bildes in einer Bilddatenbank, Vorrichtung und Verfahren zum Auffinden von zwei ähnlichen Bildern und Computerprogramm
JP2009177272A (ja) * 2008-01-22 2009-08-06 Sony Corp 撮像装置、その制御方法およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06231254A (ja) * 1993-02-03 1994-08-19 Kokusai Denshin Denwa Co Ltd <Kdd> 動画像の高速認識検索方法
JPH07222175A (ja) * 1994-02-04 1995-08-18 Sony Corp 画像照合方法および装置
JP2000115557A (ja) * 1998-10-08 2000-04-21 Fuji Xerox Co Ltd 画像処理装置
JP2001145604A (ja) * 1999-11-19 2001-05-29 Nippon Telegr & Teleph Corp <Ntt> 眼底画像の動静脈識別方法及び装置
JP2002183145A (ja) * 2000-12-12 2002-06-28 Nec Corp 画像検索システムとその画像検索方法、及び画像検索プログラムを記録した記憶媒体
JP2008072410A (ja) * 2006-09-14 2008-03-27 Nec Saitama Ltd 撮像装置、携帯電話、撮像制御方法、撮像制御プログラムおよびプログラム記録媒体

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9852159B2 (en) 2009-06-18 2017-12-26 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
JP2011022991A (ja) * 2009-06-18 2011-02-03 Canon Inc 画像認識方法及び画像認識装置
US10891329B2 (en) 2009-06-18 2021-01-12 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
WO2010147229A1 (en) * 2009-06-18 2010-12-23 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
JP2011150627A (ja) * 2010-01-25 2011-08-04 Ihi Corp 通路検出方法、装置、及びプログラム
JP2011150626A (ja) * 2010-01-25 2011-08-04 Ihi Corp 画像分類方法、装置、及びプログラム
JP2012004716A (ja) * 2010-06-15 2012-01-05 Sanyo Electric Co Ltd 撮像装置及び電子機器
EP2528017A1 (en) 2011-05-23 2012-11-28 Morpho, Inc. Image identification device, image identification method, image identification program, and recording medium
EP2528020A2 (en) 2011-05-23 2012-11-28 Morpho, Inc. Image identification device, image identification method, image identification program, and recording medium
US8600162B2 (en) 2011-05-23 2013-12-03 Morpho, Inc. Image identification device, image identification method and recording medium
US8855368B2 (en) 2011-05-23 2014-10-07 Morpho, Inc. Image identification device, image identification method, and recording medium
US9171375B2 (en) 2012-06-14 2015-10-27 International Business Machines Corporation Multi-cue object detection and analysis
US9396548B2 (en) 2012-06-14 2016-07-19 International Business Machines Corporation Multi-cue object detection and analysis
US10037604B2 (en) 2012-06-14 2018-07-31 International Business Machines Corporation Multi-cue object detection and analysis
JP2015514278A (ja) * 2012-06-14 2015-05-18 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation マルチキュー・オブジェクトの検出および分析のための方法、システム、製品、およびコンピュータ・プログラム(マルチキュー・オブジェクトの検出および分析)
JP2016099734A (ja) * 2014-11-19 2016-05-30 キヤノン株式会社 画像処理装置、情報処理方法及びプログラム
JP2019139497A (ja) * 2018-02-09 2019-08-22 株式会社日立ソリューションズ・クリエイト 画像処理システム及び画像処理方法
JP2019164450A (ja) * 2018-03-19 2019-09-26 株式会社Screenホールディングス 画像処理方法、コンピュータプログラムおよび記録媒体
WO2019181072A1 (ja) * 2018-03-19 2019-09-26 株式会社Screenホールディングス 画像処理方法、コンピュータプログラムおよび記録媒体
JP7079631B2 (ja) 2018-03-19 2022-06-02 株式会社Screenホールディングス 画像処理方法、コンピュータプログラムおよび記録媒体
US11430130B2 (en) 2018-03-19 2022-08-30 SCREEN Holdings Co., Ltd. Image processing method and computer-readable recording medium having recorded thereon image processing program
CN110636217A (zh) * 2019-08-29 2019-12-31 高雪亚 自动化现场数据处理系统
WO2024024437A1 (ja) * 2022-07-27 2024-02-01 京セラ株式会社 学習データ生成方法、学習モデル、情報処理装置、及び情報処理方法

Also Published As

Publication number Publication date
US8363933B2 (en) 2013-01-29
JP4772839B2 (ja) 2011-09-14
KR20100020903A (ko) 2010-02-23
US20100142807A1 (en) 2010-06-10
KR101324268B1 (ko) 2013-11-01
EP2154630A1 (en) 2010-02-17
CN101650783B (zh) 2014-03-26
CN101650783A (zh) 2010-02-17

Similar Documents

Publication Publication Date Title
JP4772839B2 (ja) 画像識別方法および撮像装置
EP3477931B1 (en) Image processing method and device, readable storage medium and electronic device
AU2017261537B2 (en) Automated selection of keeper images from a burst photo captured set
EP3757890A1 (en) Method and device for image processing, method and device for training object detection model
EP3496383A1 (en) Image processing method, apparatus and device
JP6639113B2 (ja) 画像認識装置、画像認識方法及びプログラム
EP3480784B1 (en) Image processing method, and device
JP5549345B2 (ja) 画像収集装置に用いる天空検出装置及び方法
JP5779089B2 (ja) エッジ検出装置、エッジ検出プログラム、およびエッジ検出方法
JP2010045770A (ja) 画像処理装置及び画像処理方法
JP2015197745A (ja) 画像処理装置、撮像装置、画像処理方法及びプログラム
US8774551B2 (en) Image processing apparatus and image processing method for reducing noise
US9020269B2 (en) Image processing device, image processing method, and recording medium
US8670609B2 (en) Systems and methods for evaluating images
CN110490196A (zh) 主体检测方法和装置、电子设备、计算机可读存储介质
US20130293741A1 (en) Image processing apparatus, image capturing apparatus, and storage medium storing image processing program
US8538142B2 (en) Face-detection processing methods, image processing devices, and articles of manufacture
JP6063680B2 (ja) 画像生成装置、画像生成方法、撮像装置、および撮像方法
JP6776532B2 (ja) 画像処理装置、撮像装置、電子機器及び画像処理プログラム
JP2004145592A (ja) 移動ベクトル抽出装置及び方法及びプログラム及びその記録媒体
JP2004199200A (ja) パターン認識装置、撮像装置、情報処理システム、パターン認識方法、記録媒体、及びプログラム
CN116883461B (zh) 一种用于获取清晰文档图像的方法及其终端装置
JP2013197892A (ja) 被写体認識装置、被写体認識方法及び被写体認識用コンピュータプログラム
JP2010197968A (ja) 合焦評価装置、カメラおよびプログラム
JP2009163492A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110621

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110622

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4772839

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250