JP2008269027A - シーン識別装置、及び、シーン識別方法 - Google Patents
シーン識別装置、及び、シーン識別方法 Download PDFInfo
- Publication number
- JP2008269027A JP2008269027A JP2007107458A JP2007107458A JP2008269027A JP 2008269027 A JP2008269027 A JP 2008269027A JP 2007107458 A JP2007107458 A JP 2007107458A JP 2007107458 A JP2007107458 A JP 2007107458A JP 2008269027 A JP2008269027 A JP 2008269027A
- Authority
- JP
- Japan
- Prior art keywords
- partial
- scene
- image
- identification
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 76
- 238000011156 evaluation Methods 0.000 claims abstract description 127
- 238000004364 calculation method Methods 0.000 claims description 31
- 238000012706 support-vector machine Methods 0.000 description 87
- 230000008569 process Effects 0.000 description 56
- 238000012545 processing Methods 0.000 description 49
- 230000006870 function Effects 0.000 description 48
- 238000001514 detection method Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 17
- 239000006185 dispersion Substances 0.000 description 16
- 230000007246 mechanism Effects 0.000 description 15
- 239000013598 vector Substances 0.000 description 13
- 238000000926 separation method Methods 0.000 description 11
- 238000003702 image correction Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】識別対象画像の一部を構成する部分画像の部分特徴量を取得する特徴量取得部と、部分特徴量に基づいて部分画像が特定のシーンに属するか否かの評価を行う部分評価部と、部分評価部によって得られた評価値に応じて、前記識別対象画像が前記特定のシーンに属するか否かを判断する判断部と、画像全体領域内の部分領域毎に、当該部分領域に前記特定のシーンの特徴が表れる確率である存在確率と、当該部分領域に対応する部分画像が特定のシーンに属することを示す評価が部分評価部によって得られた場合に、その評価が正しい確率である正答率とを、演算した演算値を示す演算値情報、及び、演算値の高さの順位を示す演算値順位情報、の何れか一方(選択情報)が記憶される記憶部と、を備えたシーン識別装置であって、部分評価部は、選択情報に基づいて定めた部分画像について、評価を行う。
【選択図】図5
Description
(A)識別対象画像の一部を構成する部分画像の特徴を示す部分特徴量を取得する特徴量取得部と、
(B)前記特徴量取得部で取得された前記部分特徴量に基づいて、前記部分画像が特定のシーンに属するか否かの評価を行う部分評価部と、
(C)前記部分評価部によって得られた評価値に応じて、前記識別対象画像が前記特定のシーンに属するか否かを判断する判断部と、
(D)画像全体領域内の部分領域毎に、
(D1)当該部分領域に前記特定のシーンの特徴が表れる確率である存在確率と、
当該部分領域に対応する前記部分画像が前記特定のシーンに属することを示す評価結果が前記部分評価部によって得られた場合に、前記評価結果が正しい確率である正答率とを、
演算した演算値を示す演算値情報、及び、
(D2)前記演算値の高さの順位を示す演算値順位情報、
(D3)の何れか一方が記憶される記憶部と、
(E)を備えたシーン識別装置であって、
(F)前記部分評価部は、
前記記憶部から読み出される前記演算値情報及び前記演算値順位情報の何れか一方に基づいて定めた前記部分画像について評価を行う、シーン識別装置である。
このようなシーン識別装置によれば、存在確率と正答率の演算値が高い部分領域の部分画像から順に評価されるので、評価を効率よく行うことができる。
このようなシーン評価装置によれば、対象となるシーンの特徴が表れ易く、かつ、正確な評価が得られる部分領域を、効率よく選択できる。
このようなシーン識別装置によれば、複数のサンプル画像における部分画像の評価結果を用いて正答率を求めるので、正答率の精度を高めることができる。
このようなシーン識別装置によれば、所定の閾値の設定によって識別精度を調整することができる。
このようなシーン識別装置によれば、各特定のシーンに対する識別を効率的に行うことができる。
このようなシーン識別装置によれば、部分評価部毎に評価対象となる部分画像を最適化することができる。
このようなシーン識別装置によれば、特定のシーン毎に適した識別を行うことができる。
このようなシーン識別装置によれば、部分評価部毎に識別を行えるので、識別の確実性を高めることができる。
このようなシーン識別装置によれば、識別精度をより高めることができる。
すなわち、(A)画像全体領域内の部分領域毎に、(A1)当該部分領域に前記特定のシーンの特徴が表れる確率である存在確率と、当該部分領域に対応する前記部分画像が前記特定のシーンに属することを示す評価結果が得られた場合に、前記評価結果が正しい確率である正答率とを、演算した演算値を示す演算値情報、及び、(A2)前記演算値の高さの順位を示す演算値順位情報、(A3)の何れか一方を求めるステップと、(B)識別対象画像の一部を構成する部分画像の特徴を示す部分特徴量を取得するステップと、(C)前記部分画像が前記特定のシーンに属するか否かの、前記部分特徴量に基づく評価を、前記演算値情報及び前記演算値順位情報の何れか一方に基づいて定めた前記部分画像について行うステップと、(D)前記評価に応じて、前記識別対象画像が前記特定のシーンに属するか否かを判断するステップと、を有するシーン識別方法を、実現できることも明らかとされる。
このようなシーン識別方法によれば、複数のサンプル画像を用いて存在確率を求めることにより、存在確率の精度を高めることができる。
このようなシーン識別方法によれば、複数のサンプル画像における部分画像の評価結果を用いて正答率を求めるので、正答率の精度を高めることができる。
以下、本発明の実施の形態について説明する。なお、以下の説明は、図1に示す複合機1を例に挙げて行う。この複合機1は、媒体に印刷された画像を読み取って画像データを取得する画像読み取り部10と、画像データに基づいて媒体へ画像を印刷する画像印刷部20とを有している。画像印刷部20では、例えば、デジタルスチルカメラDCによる撮影で得られた画像データや画像読み取り部10で得られた画像データに基づき、画像を媒体に印刷する。加えて、この複合機1では、識別対象画像についてシーンの識別を行い、識別結果に応じて画像データを補正したり、補正した画像データをメモリカードMC等の外部メモリに記憶したりする。ここで、複合機1は、未知の識別対象画像のシーンを識別するシーン識別装置として機能する。また、複合機1は、識別されたシーンに基づいて画像データを補正するデータ補正装置や、補正後の画像データを外部メモリに記憶するデータ記憶装置としても機能する。
図2Aに示すように、画像印刷部20は、プリンタ側コントローラ30と印刷機構40とを有する。
次に、プリンタ側コントローラ30によって実現される各部について説明する。プリンタ側コントローラ30のCPU36は、動作プログラムを構成する複数の動作モジュール(プログラムユニット)毎に、異なる動作をする。このとき、CPU36とメモリ37を有するメインコントローラ31は、単体で、或いは制御ユニット32や駆動信号生成部33と組になって、動作モジュール毎に異なる機能を発揮する。便宜上、以下の説明では、プリンタ側コントローラ30を、動作モジュール毎の装置として表現することにする。
次に、シーン識別部30Bについて説明する。本実施形態のシーン識別部30Bは、顔識別部30Aではシーンが決定されなかった識別対象画像について、風景のシーン、夕景のシーン、夜景のシーン、花のシーン、紅葉のシーン、及び、その他のシーンの何れかに属するのかを識別する。図4に示すように、このシーン識別部30Bは、特徴量取得部30Eと、全体識別器30Fと、部分画像識別器30Gと、統合識別器30Hと、結果記憶部37jとを有する。これらの中で、特徴量取得部30E、全体識別器30F、部分画像識別器30G、及び、統合識別器30Hは、メインコントローラ31によって構成される。そして、全体識別器30F、部分画像識別器30G、及び、統合識別器30Hは、部分特徴量及び全体特徴量の少なくとも一方に基づき、識別対象画像の属するシーンの識別処理を行う識別処理部30Iを構成する。
特徴量取得部30Eは、識別対象画像の特徴を示す特徴量を対象画像データに基づいて取得する。この特徴量は、全体識別器30Fや部分画像識別器30Gでの識別で用いられる。図5に示すように、特徴量取得部30Eは、部分特徴量取得部51と全体特徴量取得部52とを有する。
次に、特徴量の取得について説明する。本実施形態の複合機1では、部分特徴量取得部51は、部分画像データ毎に部分特徴量を取得し、取得した部分特徴量を、メモリ37の特徴量記憶部37eに記憶する。全体特徴量取得部52は、特徴量記憶部37eに記憶された複数の部分特徴量を読み出して全体特徴量を取得する。そして取得した全体特徴量を特徴量記憶部37eに記憶する。このような構成をとることで、対象画像データに対する変換等の回数を抑えることができ、部分特徴量と全体特徴量を取得する構成に比べて、処理を高速化することができる。また、展開用のメモリの容量も必要最小限に抑えることができる。
次に、部分特徴量取得部51による部分特徴量の取得について説明する。図6に示すように、部分特徴量取得部51は、まず、対象画像データの一部を構成する部分画像データを、メモリ37の画像記憶部37cから読み出す(S11)。この実施形態において、部分特徴量取得部51は、QVGAサイズの1/64サイズのRGB画像データを部分画像データとして取得する。なお、対象画像データがJPEG形式等の圧縮された画像データの場合、部分特徴量取得部51は、対象画像データを構成する一部分のデータを画像記憶部37cから読み出し、読み出したデータを展開することで部分画像データを取得する。部分画像データを取得したならば、部分特徴量取得部51は、色空間の変換を行う(S12)。例えば、RGB画像データをYCC画像に変換する。
次に、全体特徴量取得部52による全体特徴量の取得(S15)について説明する。全体特徴量取得部52は、特徴量記憶部37eに記憶された複数の部分特徴量に基づき、全体特徴量を取得する。前述したように、全体特徴量取得部52は、対象画像データの色平均と色の分散とを全体特徴量として取得する。便宜上、対象画像データにおける色平均を、全体色平均ともいう。また、便宜上、対象画像データにおける色の分散を、全体色分散ともいう。そして、前述したj番目(j=1〜64)の部分画像データにおける部分色平均をxavjとした場合、全体色平均xavは、次式(4)で表すことができる。この式(4)において、mは部分画像の数を示す。また、全体色分散S2は、次式(5)で表すことができる。この式(5)により、全体色分散S2は、部分色平均xav、部分色分散Sj 2、及び、全体色平均xavに基づいて取得できることが判る。
ところで、識別処理部30Iの一部を構成する全体識別器30F及び部分画像識別器30Gでは、サポートベクターマシン(SVMとも記す。)を用いて識別を行っている。サポートベクターマシンについては後で説明するが、このサポートベクターマシンは、分散の大きな特徴量ほど識別に対する影響力(重み付けの度合い)が大きくなるという特性を有する。そこで、部分特徴量取得部51、及び、全体特徴量取得部52では、取得した部分特徴量及び全体特徴量について正規化を行っている。すなわち、それぞれの特徴量について平均と分散とを算出し、平均が値〔0〕となり、分散が値〔1〕となるように、正規化を行っている。具体的には、i番目の特徴量xiにおける平均値をμiとし、分散をσiとした場合、正規化後の特徴量xi´は、次式(9)で表すことができる。
部分特徴量取得部51は、部分特徴量として部分色平均と部分色分散とを取得し、全体特徴量取得部52は、全体特徴量として全体色平均と全体色分散とを取得している。これらの特徴量は、識別処理部30Iによる識別対象画像の識別処理で用いられる。このため、識別処理部30Iにおける識別精度を高めることができる。これは、識別処理において、識別対象画像の全体と部分画像のそれぞれで取得された、色合いの情報と色の局在化度合いの情報とが加味されるからである。
次に、識別処理部30Iについて説明する。まず、識別処理部30Iの概略について説明する。図4及び図5に示すように、識別処理部30Iは、全体識別器30Fと、部分画像識別器30Gと、統合識別器30Hとを有する。全体識別器30Fは、全体特徴量に基づいて、識別対象画像のシーンを識別する。部分画像識別器30Hは、部分特徴量に基づいて、識別対象画像のシーンを識別する。統合識別器30Hは、全体識別器30Fと部分画像識別器30Gでシーンが確定されなかった識別対象画像について、シーンを識別する。このように、識別処理部30Iは、特性の異なる複数種類の識別器を有している。これは、識別性を高めるためである。すなわち、識別対象画像の全体に特徴が表れがちなシーンについては、全体識別器30Fによって精度良く識別ができる。一方、識別対象画像の一部分に特徴が表れがちなシーンについては、部分画像識別器30Gによって精度良く識別ができる。その結果、識別対象画像の識別性を高めることができる。さらに、全体識別器30Fと部分画像識別器30Gでシーンが確定しなかった識別対象画像については、統合識別器30Hによってシーンを識別できる。この点でも識別対象画像の識別性を高めることができる。
全体識別器30Fは、識別可能なシーンに応じた種類の数のサブ識別器(便宜上、全体サブ識別器ともいう。)を有する。図5に示すように、全体識別器30Fは、全体サブ識別器として、風景識別器61と、夕景識別器62と、夜景識別器63と、花識別器64と、紅葉識別器65とを有する。各全体サブ識別器は、全体特徴量に基づいて、識別対象画像が特定のシーンに属することを識別する。また、各全体サブ識別器は、識別対象画像が特定のシーンに属さないことも識別する。
部分画像識別器30Gは、識別可能なシーンに応じた種類の数のサブ識別器(便宜上、部分サブ識別器とする。)を有する。各部分サブ識別器は、識別対象画像が特定のシーンに属するか否かを部分特徴量に基づいて識別する。
次に、部分サブ識別器(夕景部分サブ識別器71、花部分サブ識別器72、紅葉部分サブ識別器73)の構成について説明する。図5に示すように、各部分サブ識別器は、部分サポートベクターマシンと検出数カウンタと判断部をそれぞれ有する。すなわち、夕景部分サブ識別器71は、夕景用部分サポートベクターマシン71aと夕景検出数カウンタ71bと夕景判断部71cを有し、花部分サブ識別器72は、花用部分サポートベクターマシン72aと花検出数カウンタ72bと花判断部72cを有する。また、紅葉部分サブ識別器73は、紅葉用部分サポートベクターマシン73aと紅葉検出数カウンタ73bと紅葉判断部73cを有する。
サポートベクターマシンは、識別対象の特徴を示す特徴量に基づき、その識別対象が或るカテゴリーに属する確率の大小を示す確率情報を取得する。このサポートベクターマシンの基本形は、線形サポートベクターマシンである。線形サポートベクターマシンは、例えば、図8に示すように、2クラス分類トレーニングで定められる線形の識別関数であり、マージン(即ち、学習データとしてのサポートベクターが存在しない領域)が最大となるように定められた識別関数である。この図8において、白抜きの丸のうち分離超平面の決定に寄与する点(例えばSV11)が或るカテゴリーCA1に属するサポートベクターであり、斜線を付した丸のうち分離超平面の決定に寄与する点(例えばSV22)が他のカテゴリーCA2に属するサポートベクターである。カテゴリーCA1に属するサポートベクターとカテゴリーCA2に属するサポートベクターとを分離する分離超平面では、この分離超平面を定める識別関数(確率情報)が値[0]を示す。図8では、分離超平面の候補として、カテゴリーCA1に属するサポートベクターSV11及びSV12を通る直線に平行な分離超平面HP1と、カテゴリーCA2に属するサポートベクターSV21及びSV22を通る直線に平行な分離超平面HP2とを示している。この例では、分離超平面HP1の方が分離超平面HP2よりもマージン(サポートベクターから分離超平面までの間隔)が大きいので、線形サポートベクターマシンとして、分離超平面HP1に対応する識別関数が定められる。
各部分サブ識別器に備えられる部分サポートベクターマシン(風景用部分サポートベクターマシン71a、花用部分サポートベクターマシン72a、紅葉部分サポートベクターマシン73a)は、前述したような非線形サポートベクターマシンである。そして、各部分サポートベクターマシンは、異なるサポートベクターに基づく学習で、識別関数におけるパラメータが定められる。その結果、部分サブ識別器毎に特性を最適化でき、部分画像識別器30Gにおける識別性を向上させることができる。各部分サポートベクターマシンは、入力された画像に応じた数値、すなわち識別関数値を出力する。
各検出数カウンタ(夕景検出数カウンタ71b〜紅葉検出数カウンタ73b)は、メモリ37のカウンタ部37gにより機能するものである。
各検出数カウンタは、初期値が、例えば値[0]である。そして、対応するサポートベクターマシンで得られた識別関数値が正の値である評価結果(対応するシーンの特徴が他のシーンの特徴よりも強く表れている評価結果)が得られるごと、すなわち、部分画像が特定のシーンに属する旨の評価がされるごとに、カウントアップ(+1)する。要するに、各検出数カウンタは、識別対象である特定のシーンに属すると識別された部分画像の数をカウントしているといえる。そして、各検出数カウンタによるカウント値は、部分サポートベクターマシンでなされた評価を定量的に示す。このため、部分評価部によって得られた評価値に相当する。各検出数カウンタのカウント値は、例えば新たな識別対象画像についての処理を行う際にリセットされる。以下の説明において、各検出数カウンタのカウント値のことを検出画像数ともいう。
各判断部(夕景判断部71c、花判断部72c、紅葉判断部73c)は、例えばメインコントローラ31のCPU36によって構成され、対応する検出数カウンタの検出画像数(部分評価部によって得られた評価値)に応じて、識別対象画像が特定のシーンに属するか否かを判断する。このように、識別対象画像が特定のシーンに属するか否かを、検出画像数に応じて判断することにより、識別対象画像の一部分に特定のシーンの特徴が表れているような場合でも精度良く識別を行うことができる。よって識別精度を向上させることができる。なお、具体的には、各判断部は、検出画像数が、メモリ37の制御用パラメータ記憶部37bに記憶された所定の閾値を超えた場合、その識別対象画像が特定のシーンに属すると判断する。この所定の閾値は、識別対象画像が部分サブ識別器で扱われるシーンに属するとの肯定的な判断を与えるものである。従って、以下の説明において、このような肯定的な判断を与えるための閾値のことを肯定閾値(Positive Threshold)ともいう。この肯定閾値の値に応じて、識別対象画像が特定のシーンであると判断されるのに必要な部分画像数、つまり識別対象画像中における特定シーンの領域の割合が決まるので、肯定閾値の設定によって識別精度を調整することができる。なお、この判断を行うのに最適な検出画像数の個数は、処理速度および識別精度の点から、特定のシーン毎に異なることが考えられる。そこで、肯定閾値は、各部分サブ識別器における識別対象となる特定のシーンに応じて、それぞれ値が設定されている。この実施形態では、図10に示すように、夕景のシーンについて値[5]が、花のシーンについて[9]が、紅葉のシーンについて[6]が設定されている。すなわち、例えば夕景部分サブ識別器71において、夕景判断部71cは、夕景検出数カウンタ71bの検出画像数が値[5]を超えると、その識別対象画像が夕景のシーンに属すると判断する。このように、特定のシーン毎に肯定閾値を設定しているので、それぞれの特定のシーンに適した識別を行うことができる。
本実施形態の場合、部分画像識別器30Gの各部分サブ識別器で識別を行う部分画像は、図7で説明したように、識別対象画像の1/64サイズ(1200画素)である。すなわち、識別対象画像は、64個の部分画像を有する。なお、以下の説明でも、縦位置J(J=1〜8)、横位置I(I=1〜8)で特定される部分画像を、座標(I,J)で表す。
存在確率は、画像全体領域内の各部分領域毎に、特定のシーンの特徴が表れる確率である。この存在確率は、各部分領域において、実際に特定のシーンの特徴が表れている部分画像の個数を、サンプル画像の総数(部分画像の総数n個)で除算することで求められる。よって、サンプル画像において、特定のシーンの特徴が表れている部分画像が無い部分領域では、存在確率は最小値 [0]となる。一方、全ての部分画像に特定のシーンの特徴が表れている部分領域では、存在確率は最大値 [1]となる。サンプル画像はそれぞれ構図が異なっているので、存在確率の精度はサンプル画像の枚数に依存する。つまりサンプル画像の数が少ないと、特定のシーンの表れる領域の傾向を正確に求めることが出来ない可能性がある。本実施形態では、各部分画像の存在確率を求める際、構図の異なるn枚(例えば数千枚)のサンプル画像を用いているので、特定のシーンの特徴が表れやすい部分領域の位置の傾向をより正確に求めることができ、各部分領域毎の存在確率の精度を高めることができる。このようにして、サンプル画像から得られた各部分領域毎の存在確率を示すデータの一例を図13A〜図15Aに示す。なお、この64個の各部分領域は、図7に示す各部分画像にそれぞれ対応している。よって、各部分領域を部分画像と同じ座標(I,J)で表している。
正答率(Precisionともいう)は、各部分サブ識別器の部分評価部(部分サポートベクターマシン及び検出数カウンタ)による評価結果が正しい確率である。すなわち、部分評価部によって、対応する特定のシーンに属する確率が高いことを示す正の値の識別関数値(評価結果)が得られた部分画像に対し、実際にその特定のシーンの特徴が表れている確率を示すものである。
本実施形態の各部分サブ識別器の部分評価部では、存在確率と正答率とを部分領域毎に乗算した乗算値に基づき、特定のシーンに属するか否かの評価の対象となる部分画像を定める。例えば、乗算値の高い部分領域に対応する部分画像から、特定のシーンに属するか否かの評価を行う。なお、前述したように、本実施形態の各部分評価部は、部分特徴量に基づいて部分画像が特定のシーンに属するか否かを識別する。
統合識別器30Hは、前述したように、全体識別器30Fと部分画像識別器30Gのそれぞれでシーンが確定されなかった識別対象画像について、シーンを識別する。この実施形態における統合識別器30Hは、各全体サブ識別器(各サポートベクターマシン)で求められた確率情報に基づいてシーンを識別する。具体的には、統合識別器30Hは、メモリ37の確率情報記憶部37fに全体識別器30Fによる全体識別処理で記憶された複数の確率情報の中から、正の値の確率情報を選択的に読み出す。そして、読み出した確率情報の中から最も高い値を示すものを特定し、対応するシーンをその識別対象画像のシーンとする。このような統合識別器30Hを設けることにより、属するシーンについての特徴がそれほど表れていない識別対象画像であっても、妥当なシーンに識別できる。すなわち、識別性を高めることができる。
結果記憶部37jは、識別処理部30Iによる識別対象の識別結果を記憶する。例えば、全体識別器30Fや部分画像識別器30Gによる識別結果に基づき、肯定フラグ記憶部37hに肯定フラグが記憶された場合には、その識別対象が肯定フラグに対応するシーンに属する旨を記憶する。仮に、識別対象画像について、風景のシーンに属する旨を示す肯定フラグが設定された場合には、風景のシーンに属する旨の結果情報を記憶する。同様に、識別対象画像について、夕景のシーンに属する旨を示す肯定フラグが設定されていた場合には、夕景のシーンに属する旨の結果情報を記憶する。なお、全てのシーンについて否定フラグが記憶された識別対象画像については、その他のシーンに属する旨を示す結果情報を記憶する。結果情報記憶部37jに記憶された識別結果は、事後の処理で参照される。この複合機1では、画像補正部30C(図3を参照。)にて参照されて画像補正に使用される。例えば、識別されたシーンに応じて、コントラストや明るさ、カラーバランスなどが調整される。
次に、画像識別処理について説明する。この画像識別処理の実行において、プリンタ側コントローラ30は、顔識別部30A、及び、シーン識別部30B(特徴量取得部30E、全体識別器30F、部分画像識別器30G、統合識別器30H、結果記憶部37j)として機能する。この場合において、メインコントローラ31のCPU36はメモリ37に記憶されたコンピュータプログラムを実行する。従って、画像識別処理をメインコントローラ31の処理として説明する。そして、メインコントローラ31によって実行されるコンピュータプログラムは、画像識別処理を実現するためのコードを有する。
次に、部分画像識別処理について説明する。前述したように、この部分画像識別処理は、全体識別処理で識別対象画像の識別ができなかった場合に行なわれるものである。従って、部分画像識別処理が行われる段階で、肯定フラグ記憶部37hには肯定フラグが記憶されていないことになる。また、全体識別処理で識別対象画像が属さないと判断されたシーンには、否定フラグ記憶部37iの対応する領域に否定フラグが記憶されている。また、選択情報記憶部37kには、複数のサンプル画像を用いて求められた存在確率と正答率を部分領域毎に乗算した乗算値を示す乗算値情報(図13C、図14C、図15C参照)及び複数の部分領域に対する乗算値の順位を示す乗算値順位情報(図13D、図14D、図15D参照)の何れか一方が、特定のシーン毎に予め記憶されている。
本実施形態における各部分サブ識別器の部分評価部は、メモリ37の選択情報記憶部37から読み出される選択情報(乗算値情報及び乗算値順位情報の何れか一方)に基づいて、存在確率と正答率の乗算値の高い部分領域に対応する部分画像から順に、特定のシーンに属するか否かの評価を行っている。これによりシーン識別処理の速度を向上させることができる。
前述した実施形態において、識別対称は画像データに基づく画像であり、識別装置は複合機1である。ここで、画像を識別対象とする識別装置は、複合機1に限定されるものではない。例えば、デジタルスチルカメラDC、スキャナ、画像処理用のコンピュータプログラム(例えば、レタッチソフトウェア)を実行可能なコンピュータであってもよい。また、画像データに基づく画像を表示可能な画像表示装置、画像データを記憶する画像データ記憶装置であってもよい。
30 プリンタ側コントローラ,30A 顔識別部,30B シーン識別部,
30C 画像補正部,30D 機構制御部,30E 特徴量取得部,
30F 全体識別器,30G 部分画像識別器,30H 統合識別器,
30I 識別処理部,31 メインコントローラ,32 制御ユニット,
33 駆動信号生成部,34 インタフェース,35 メモリ用スロット,
36 CPU,37 メモリ,37a プログラム記憶部,
37b パラメータ記憶部,37c 画像記憶部,37d 付属情報記憶部,
37e 特徴量記憶部,37f 確率情報記憶部,37g カウンタ部,
37h 肯定フラグ記憶部,37i 否定フラグ記憶部,37j 結果記憶部,
37k 選択情報記憶部,40 印刷機構,41 モータ,42 センサ,
43 ヘッド制御部,44 ヘッド,
51 部分特徴量取得部,52 全体特徴量取得部,
61 風景識別器,61a 風景用サポートベクターマシン,
61b 風景用判断部,62 夕景識別器,
62a 夕景用サポートベクターマシン,62b 夕景用判断部,
63 夜景識別器,63a 夜景用サポートベクターマシン,
63b 夜景用判断部,64 花識別器,64a 花用サポートベクターマシン,
64b 花用判断部,65 紅葉識別器,
65a 紅葉用サポートベクターマシン,65b 紅葉用判断部,
71 夕景部分サブ識別器,71a 夕景用部分サポートベクターマシン,
71b 夕景検出数カウンタ,71c 夕景判断部,72 花部分サブ識別器,
72a 花用部分サポートベクターマシン,72b 花検出数カウンタ,
72c 花判断部,73 紅葉部分サブ識別器,
73a 紅葉用部分サポートベクターマシン,73b 紅葉検出数カウンタ,
73c 紅葉判断部,DC デジタルスチルカメラ,
MC メモリカード,BU バス
Claims (13)
- (A)識別対象画像の一部を構成する部分画像の特徴を示す部分特徴量を取得する特徴量取得部と、
(B)前記特徴量取得部で取得された前記部分特徴量に基づいて、前記部分画像が特定のシーンに属するか否かの評価を行う部分評価部と、
(C)前記部分評価部によって得られた評価値に応じて、前記識別対象画像が前記特定のシーンに属するか否かを判断する判断部と、
(D)画像全体領域内の部分領域毎に、
(D1)当該部分領域に前記特定のシーンの特徴が表れる確率である存在確率と、
当該部分領域に対応する前記部分画像が前記特定のシーンに属することを示す評価結果が前記部分評価部によって得られた場合に、前記評価結果が正しい確率である正答率とを、
演算した演算値を示す演算値情報、及び、
(D2)前記演算値の高さの順位を示す演算値順位情報、
(D3)の何れか一方が記憶される記憶部と、
(E)を備えたシーン識別装置であって、
(F)前記部分評価部は、
前記記憶部から読み出される前記演算値情報及び前記演算値順位情報の何れか一方に基づいて定めた前記部分画像について、評価を行う、シーン識別装置。 - 請求項1に記載のシーン識別装置であって、
前記部分評価部は、
前記演算値の高い前記部分領域に対応する前記部分画像から順に評価を行う、シーン識別装置。 - 請求項1または2に記載のシーン識別装置であって、
前記演算値は、
前記部分領域毎に前記存在確率と前記正答率とを乗算した値である、シーン識別装置。 - 請求項1から3の何れかに記載のシーン識別装置であって、
前記正答率は、
複数のサンプル画像における、或る部分領域の部分画像について、
前記特定のシーンに属することを示す評価結果が得られた部分画像の個数に対する、実際に前記特定のシーンに属する部分画像の個数の比率である、シーン識別装置。 - 請求項1から4の何れかに記載のシーン識別装置であって、
前記判断部は、
前記特定のシーンに属することを示す評価結果が得られた部分画像の個数が、所定の閾値を超えた場合に、
前記識別対象画像が前記特定のシーンに属すると判断する、シーン識別装置。 - 請求項1から5の何れかに記載のシーン識別装置であって、
前記記憶部には、前記演算値情報及び前記演算値順位情報のいずれか一方が、識別対象となる前記特定のシーンの種類毎に記憶される、シーン識別装置。 - 請求項6に記載のシーン識別装置であって、
前記特定のシーンの種類毎に前記部分評価部を有し、
各々の前記部分評価部は、
前記特定のシーンに対応して前記記憶部から読み出される前記演算値情報及び前記演算値順位情報のいずれか一方に基づき定められた前記部分画像について、評価を行う、シーン識別装置。 - 請求項7に記載のシーン識別装置であって、
複数の前記特定のシーンに対して、所定の閾値がそれぞれ設定され、
前記判断部は、
前記特定のシーンに属することを示す評価結果が得られた部分画像の個数が、当該特定のシーンに設定された前記所定の閾値を超えた場合に、
前記識別対象画像が当該特定のシーンに属すると判断する、シーン識別装置。 - 請求項7または8に記載のシーン識別装置であって、
前記判断部は、
或る部分評価部による評価値に基づいて、前記識別対象画像が或る特定のシーンに属することを判断できなかった場合に、
他の部分評価部に当該識別対象画像の評価を行わせる、シーン識別装置。 - 請求項1から9の何れかに記載のシーン識別装置であって、
前記特徴量取得部は、
前記識別対象画像の特徴を示す全体特徴量をさらに取得し、
前記部分評価部は、
前記部分特徴量と前記全体特徴量とに基づいて、前記部分画像が前記特定のシーンに属するか否かを識別する、シーン識別装置。 - (A)画像全体領域内の部分領域毎に、
(A1)当該部分領域に前記特定のシーンの特徴が表れる確率である存在確率と、
当該部分領域に対応する前記部分画像が前記特定のシーンに属することを示す評価結果が得られた場合に、前記評価結果が正しい確率である正答率とを、
演算した演算値を示す演算値情報、及び、
(A2)前記演算値の高さの順位を示す演算値順位情報、
(A3)の何れか一方を求めるステップと、
(B)識別対象画像の一部を構成する部分画像の特徴を示す部分特徴量を取得するステップと、
(C)前記部分画像が前記特定のシーンに属するか否かの、前記部分特徴量に基づく評価を、前記演算値情報及び前記演算値順位情報の何れか一方に基づいて定めた前記部分画像について行うステップと、
(D)前記評価に応じて、前記識別対象画像が前記特定のシーンに属するか否かを判断するステップと、
を有するシーン識別方法。 - 請求項11に記載のシーン識別方法であって、
複数のサンプル画像を用いて、前記画像全体領域内の前記部分領域毎に、前記存在確率を求めるステップを有するシーン識別方法。 - 請求項11または12に記載のシーン識別方法であって、
複数のサンプル画像における、或る部分領域に対応する部分画像について、当該部分画像が特定のシーンに属するか否かの評価を行ない、
前記特定のシーンに属することを示す評価結果が得られた部分画像の個数に対する、実際に前記特定のシーンに属する部分画像の個数の比率を求めることで、
前記正答率を求めるステップを有するシーン識別方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007107458A JP4826531B2 (ja) | 2007-04-16 | 2007-04-16 | シーン識別装置、及び、シーン識別方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007107458A JP4826531B2 (ja) | 2007-04-16 | 2007-04-16 | シーン識別装置、及び、シーン識別方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008269027A true JP2008269027A (ja) | 2008-11-06 |
JP4826531B2 JP4826531B2 (ja) | 2011-11-30 |
Family
ID=40048484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007107458A Expired - Fee Related JP4826531B2 (ja) | 2007-04-16 | 2007-04-16 | シーン識別装置、及び、シーン識別方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4826531B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243197A (ja) * | 2011-05-23 | 2012-12-10 | Morpho Inc | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP2012243196A (ja) * | 2011-05-23 | 2012-12-10 | Morpho Inc | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP2014092997A (ja) * | 2012-11-05 | 2014-05-19 | Toshiba Corp | 画像処理装置、方法、及びプログラム、並びに、画像表示装置 |
CN110458047A (zh) * | 2019-07-23 | 2019-11-15 | 北京理工大学 | 一种基于深度学习的越野环境场景识别方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004062605A (ja) * | 2002-07-30 | 2004-02-26 | Fuji Photo Film Co Ltd | シーン識別方法および装置ならびにプログラム |
JP2005310123A (ja) * | 2004-03-24 | 2005-11-04 | Fuji Photo Film Co Ltd | 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体 |
-
2007
- 2007-04-16 JP JP2007107458A patent/JP4826531B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004062605A (ja) * | 2002-07-30 | 2004-02-26 | Fuji Photo Film Co Ltd | シーン識別方法および装置ならびにプログラム |
JP2005310123A (ja) * | 2004-03-24 | 2005-11-04 | Fuji Photo Film Co Ltd | 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243197A (ja) * | 2011-05-23 | 2012-12-10 | Morpho Inc | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP2012243196A (ja) * | 2011-05-23 | 2012-12-10 | Morpho Inc | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
US8855368B2 (en) | 2011-05-23 | 2014-10-07 | Morpho, Inc. | Image identification device, image identification method, and recording medium |
JP2014092997A (ja) * | 2012-11-05 | 2014-05-19 | Toshiba Corp | 画像処理装置、方法、及びプログラム、並びに、画像表示装置 |
CN110458047A (zh) * | 2019-07-23 | 2019-11-15 | 北京理工大学 | 一种基于深度学习的越野环境场景识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP4826531B2 (ja) | 2011-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008282267A (ja) | シーン識別装置、及び、シーン識別方法 | |
JP2008234623A (ja) | カテゴリー識別装置、カテゴリー識別方法、及び、プログラム | |
JP2008234627A (ja) | カテゴリー識別装置、及び、カテゴリー識別方法 | |
US20080292181A1 (en) | Information Processing Method, Information Processing Apparatus, and Storage Medium Storing a Program | |
JP2009093334A (ja) | 識別方法及びプログラム | |
JP5040624B2 (ja) | 情報処理方法、情報処理装置及びプログラム | |
JP4826531B2 (ja) | シーン識別装置、及び、シーン識別方法 | |
US8644613B2 (en) | Image selection device and image selection method | |
JP2009080557A (ja) | 識別方法及びプログラム | |
JP2008282085A (ja) | シーン識別装置、及び、シーン識別方法 | |
JP4946750B2 (ja) | 設定方法、識別方法及びプログラム | |
US20080199084A1 (en) | Category Classification Apparatus and Category Classification Method | |
JP2008234624A (ja) | カテゴリー識別装置、カテゴリー識別方法、及び、プログラム | |
JP4992646B2 (ja) | 識別方法及びプログラム | |
JP4992519B2 (ja) | 情報処理方法、情報処理装置及びプログラム | |
JP2008284868A (ja) | 印刷方法、印刷装置及びプログラム | |
JP2008204091A (ja) | カテゴリー識別装置、及び、カテゴリー識別方法 | |
JP2008204092A (ja) | カテゴリー識別装置 | |
US20080199085A1 (en) | Category Classification Apparatus, Category Classification Method, and Storage Medium Storing a Program | |
JP2008269560A (ja) | シーン識別装置、及び、シーン識別方法 | |
JP2008242751A (ja) | 画像識別方法、画像識別装置及びプログラム | |
JP4882927B2 (ja) | カテゴリ識別方法 | |
JP2009080556A (ja) | 設定方法、識別方法及びプログラム | |
JP2008228086A (ja) | 情報処理方法、情報処理装置及びプログラム | |
JP2008271249A (ja) | 情報処理方法、情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110811 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110816 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110829 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4826531 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |