JP4606828B2 - 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体 - Google Patents

特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4606828B2
JP4606828B2 JP2004277577A JP2004277577A JP4606828B2 JP 4606828 B2 JP4606828 B2 JP 4606828B2 JP 2004277577 A JP2004277577 A JP 2004277577A JP 2004277577 A JP2004277577 A JP 2004277577A JP 4606828 B2 JP4606828 B2 JP 4606828B2
Authority
JP
Japan
Prior art keywords
scene
image
feature
images
scenes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004277577A
Other languages
English (en)
Other versions
JP2005122720A (ja
Inventor
貞登 赤堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2004277577A priority Critical patent/JP4606828B2/ja
Priority to US10/949,202 priority patent/US7202873B2/en
Publication of JP2005122720A publication Critical patent/JP2005122720A/ja
Application granted granted Critical
Publication of JP4606828B2 publication Critical patent/JP4606828B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本発明は、特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体に関し、特に、デジタル形式の画像データで表された画像をシーンごとに分類等するために、所望の特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体に関するものである。
近年、デジタル形式の画像データで表された画像を、シーンごとに分類したり、シーンごとに区別された補正処理やプリント処理を施すため、ある画像が特定シーンの画像であるか否かを自動的に識別して、画像を選別する手法の研究開発が行なわれ始めている。
たとえば、特許文献1には、人物の有無に関する情報と色ヒストグラムに関する情報の2つを共通の指標として、デジタルカメラにより取得した画像が、「ポートレイト」、「夕景」、「夜景」等の複数のシーンのいずれを撮影したものであるかを識別する手法が記載されている。
また、個々の特定シーンに特化した識別手法も種々提案されている。たとえば、特許文献2には、「夕焼け」のシーンであるか否かの識別に特化した手法として、対象画像の画像データのうち赤から黄色の範囲に属する画素のデータについて、色相と彩度の積および色相と明度の積をヒストグラム化し、それらの分散が一定基準より大きいものを「夕焼け」のシーンの画像であると判断する手法が記載されている。
特開2002−218480号公報 特開平11−298736号公報
しかしながら、ユーザーが指定し得る特定シーンは多種多様であり、また選別対象の画像も多種多様であるので、複数の特定シーンを共通の指標を用いて識別しようとすると、精度の高い選別が困難であるという問題があった。指標の数を多くすれば精度を向上させることも可能であるが、そうすると計算量が著しく多くなり、各特定シーンの識別に要する時間およびコストが多大となる。また、共通の指標の数を多くした場合、1つ1つの特定シーンとの関係で考えると、選別対象の画像が供給されるごとに、所望の特定シーンの識別にはあまり有用でない指標をも計算することになり、計算処理の無駄が多くなる。
一方、ユーザーが指定し得る個々の特定シーンに特化した識別アルゴリズムを1つ1つ設定し、それらを実装した装置やそれらの組合せからなるプログラムを使用することにより、無駄な計算処理を行なわずに様々なシーンの識別を高い精度で行ない、画像を選別する形態も考えられる。しかしながら、そのような形態では1つ1つの識別アルゴリズムの設定および実装に非常に多くの作業が必要となり、装置やプログラムの開発に要する時間およびコストが多大となる。また、識別基準の変更や、識別可能な特定シーンの追加にも、多くの時間およびコストがかかる。
本発明は、上記事情に鑑み、計算処理および開発の双方の負担が低減されたものでありながら、様々な特定シーンの画像を高い精度で選別することができる装置、プログラムおよびプログラムを記録した記録媒体を提供することを目的とするものである。
すなわち、本発明の特定シーンの画像を選別する装置は、所望の特定シーンの指定を受け付けるシーン指定受付手段と、選別対象の画像データの入力を受け付ける画像入力受付手段と、特定シーンとして指定され得る複数のシーンごとに、そのシーンの識別に用いる少なくとも1つの特徴量の種類と、それらの少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、上記のシーン指定受付手段において指定された特定シーンに基づいて参照して、上記の画像データから、その特定シーンの識別に用いる上記の少なくとも1つの特徴量を導出する特徴量導出手段と、その特徴量導出手段により導出された少なくとも1つの特徴量の各々に基づいて、上記の参照データが規定する対応する識別条件を参照し、上記の画像データが上記のシーン指定受付手段において指定された特定シーンの画像のデータであるか否かを識別する識別手段とを備えていることを特徴とするものである。
ここで、本発明において「特徴量」とは、画像の特徴を表すパラメータを指し、その画像の色の特徴、輝度の特徴、テクスチャーの特徴、奥行情報、その画像に含まれるエッジの特徴等、いかなる特徴を表すものであってもよい。また、これらの各特徴を表す指標値を複数組み合わせた重み付き加算値等を、「特徴量」として用いてもよい。
また、本発明において「識別条件」とは、1つの特徴量を指標とした、特定シーンの画像とそうでない画像とを識別する条件を指す。
上記の本発明の特定シーンの画像を選別する装置においては、上記の参照データが、特定シーンとして指定され得る複数のシーンの各々について、そのシーンであることが分かっている複数の画像とそのシーンでないことが分かっている複数の画像からなる重み付きサンプル画像群を、予め学習することにより決定されたものであって、それらの複数のシーンの各々についての学習が、上記の重み付きサンプル画像群をなす各画像の重みの初期値を等しい値に設定する工程と、上記の複数のシーンの識別に用いられ得る複数の特徴量の各々に対応する識別器のうち、重み付きサンプル画像群をなす現在の学習対象のシーンである複数の画像と現在の学習対象のシーンでない複数の画像とを識別するのに最も有効な識別器を選択する工程と、重み付きサンプル画像群をなす画像のうち、直前の上記の選択する工程で選択された識別器によっては正しく識別されない画像の重みがその画像の現在の重みよりも高くなり、かつ/またはその識別器によって正しく識別される画像の重みがその画像の現在の重みよりも低くなるように、各画像の重みを更新する工程と、上記の選択する工程および上記の更新する工程を、選択された識別器の組合せの正答率が所定の基準を超えるまで繰り返す工程と、選択された識別器に基づいて、現在の学習対象のシーンの識別に用いる上記の少なくとも1つの特徴量の種類と上記の識別条件を確定する工程とを含む方法によるものであってもよい。また、この場合において、上記の複数の特徴量の各々に対応する識別器は、現在の学習対象のシーンである複数の画像が示すその識別器に対応する特徴量の値のヒストグラムの各頻度値と、現在の学習対象のシーンでない複数の画像が示すその識別器に対応する特徴量の値のヒストグラムの各頻度値との、比または差分を表したヒストグラムであってもよい。
ここで、本発明において「識別器」とは、1つの特徴量を用いて特定シーンの画像とそうでない画像とを識別する基準を提供するものであって、上記の「識別条件」を確定する基となるものを指す。
また、上記の「選択する工程」は、各サンプル画像の重みも加味して、現在の学習対象のシーンである画像と現在の学習対象のシーンでない画像とを識別するのに最も有効な識別器を選択するものである。すなわち、各サンプル画像の重みが等しい場合は、単純に正しく識別されるサンプル画像の数が多くなる識別器が最も有効な識別器であるが、各サンプル画像の重みが異なる場合は、重みの低いサンプル画像よりも、重みの高いサンプル画像が正しく識別されることにより重点が置かれる。
さらに、上記の「組合せの正答率」とは、それまでに選択した識別器を組み合わせて使用して各サンプル画像が現在の学習対象のシーンの画像であるか否かを識別した結果が、実際に現在の学習対象のシーンの画像であるか否かの答えと一致する率を指す。また、上記には「繰り返す工程」とあるが、選択する工程および更新する工程を1回行っただけで組合せの正答率が所定の基準を超えた場合は、繰返し処理は行なわないこととなる。
また、上記の「比または差分を表したヒストグラム」とは、頻度値の比または差分の値をそのまま表したヒストグラムであってもよいし、それらの対数値等を表したヒストグラムであってもよい。
さらに、上記の本発明の特定シーンの画像を選別する装置は、上記の識別手段により正しい識別結果が得られなかった画像データについて、その画像データが示す正しいシーンの指定を受け付ける正解受付手段と、正しいシーンの指定が受け付けられた画像データを学習することにより、上記の参照データを更新する追加学習手段とをさらに備えているものであってもよい。
撮像装置は、撮像した画像データを取得する撮像手段と、
所望の特定シーンの指定を受け付けるシーン指定受付手段と、
前記特定シーンとして指定され得る複数のシーンごとに、該シーンの識別に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、前記シーン指定受付手段において指定された前記特定シーンに基づいて参照して、前記画像データから、該特定シーンの識別に用いる前記少なくとも1つの特徴量を導出する特徴量導出手段と、
前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記画像データが前記シーン指定受付手段において指定された前記特定シーンの画像のデータであるか否かを識別する識別手段とを備えていることを特徴とするものである。
また、前記撮像装置は、撮影時に前記シーンを特定する情報を取得するシーン特定情報取得手段をさらに有し、
前記シーン指定受付手段が、該シーン特定情報取得手段により取得された前記シーンを特定する情報に基づいてシーンの指定を受け付けるものであってもよい。
「シーンを特定する情報」とは、例えば、撮影時間等の画像が「夜景」の可能性があるか否かというような特定のシーンを判別するために参考にすることができる情報をいう。
本発明の特定シーンの画像を選別するためのプログラムは、コンピュータを、所望の特定シーンの指定を受け付けるシーン指定受付手段、選別対象の画像データの入力を受け付ける画像入力受付手段、特定シーンとして指定され得る複数のシーンごとに、そのシーンの識別に用いる少なくとも1つの特徴量の種類と、それらの少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、上記のシーン指定受付手段において指定された特定シーンに基づいて参照して、上記の画像データから、その特定シーンの識別に用いる上記の少なくとも1つの特徴量を導出する特徴量導出手段、および、その特徴量導出手段により導出された少なくとも1つの特徴量の各々に基づいて、上記の参照データが規定する対応する識別条件を参照し、上記の画像データが上記のシーン指定受付手段において指定された特定シーンの画像のデータであるか否かを識別する識別手段として機能させることを特徴とするものである。また、本発明の特定シーンの画像を選別するためのプログラムを記録したコンピュータ読取可能な記録媒体は、上記のようなプログラムを記録したものである。
これらの本発明の特定シーンの画像を選別するためのプログラムおよびプログラムを記録したコンピュータ読取可能な記録媒体は、プログラムの実行環境の計算能力および/または所望の処理速度に応じて、上記の特徴量導出手段が導出する上記の少なくとも1つの特徴量の種類および/または数を変更するものであってもよい。
本発明の特定シーンの画像を選別するための方法は、所望の特定シーンの指定を受け付けるシーン指定受付ステップと、
選別対象の画像データの入力を受け付ける画像入力受付ステップと、
前記特定シーンとして指定され得る複数のシーンごとに、該シーンの識別に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、前記シーン指定受付ステップにおいて指定された前記特定シーンに基づいて参照して、前記画像データから、該特定シーンの識別に用いる前記少なくとも1つの特徴量を導出する特徴量導出ステップと、
前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記画像データが前記シーン指定受付手段において指定された前記特定シーンの画像のデータであるか否かを識別する識別ステップとからなることを特徴とするものである。
本発明の特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体では、使用する特徴量の種類および識別条件を特定シーンごとに規定した参照データを用いているため、識別処理のアルゴリズム自体は所望の特定シーンにかかわらず共通のものとすることができ、装置の開発コストを低く抑えながら、各特定シーンに合った精度の高い識別により、画像の選別を行なうことができる。また、特定シーンごとに識別に使用する特徴量の種類および数を変更することができるため、特定シーンごとに最適な種類および数の特徴量を用い、無駄な計算処理を行なうことなく精度の高い識別による画像の選別を行なうことができる。さらに、複雑な識別アルゴリズムの変更、追加および実装等の作業を要することなく、参照データを改変するだけで、識別基準の変更や、識別可能な特定シーンの追加を、簡単に行なうことができる。
また、識別のための参照データとして、最も有効な識別器を選択する工程とサンプル画像の重みを更新する工程とを繰り返して、重み付きサンプル画像群を学習することにより決定された参照データを用いた場合には、先に選択した識別器では正しく識別できなかったサンプル画像を重要視して、それらの画像を正しく識別できる追加の識別器が順次選択され、それらの識別器に基づいて識別に用いる特徴量の種類と識別条件が確定されるため、多様な画像に対して、さらに精度が高く漏れの少ない識別による画像の選別を行なうことができる。
さらに、正しい識別結果が得られなかった画像データについて正しいシーンの指定を受け付けて、それらの画像データの追加学習による参照データの更新を行なうことを可能とした場合には、実際の選別対象画像に合わせて継続的に選別の精度を向上させていくことができる。また、ユーザーが頻繁に指定する特定シーンに関しては、参照データの内容が特に充実していくため、より高い識別精度を実現することができる。
また、本発明の撮像装置のように、前記のシーンの画像を選別する機能を備えるようにすれば、撮影した画像のシーンを識別して、各々の画像に対して適切な画像処理を施すことが可能になる。
さらに、撮像装置でシーンを特定する情報を取得するようにすることによって、識別の精度を高くすることが可能になる。
また、本発明のプログラムまたはプログラムを記録した記録媒体において、プログラムの実行環境の計算能力および/または所望の処理速度に応じて、選別対象の画像データから導出する特徴量の種類および/または数を変更できるようにした場合には、実行環境の計算能力および/または所望の処理速度の範囲内の最適な負荷により、最大限の高い選別精度を実現することができる。
以下、図面により、本発明の例示的な実施形態を詳細に説明する。
まず、図1から5を用いて、本発明の第1の実施形態に係る装置を説明する。図1は、本発明の第1の実施形態に係る特定シーンの画像を選別する装置10の構成を示したブロック図である。この図に示すように、装置10は、識別したい特定シーンの指定を受け付けるシーン指定受付部12と、選別対象の画像データの入力を受け付ける画像入力受付部14と、後述する参照データが格納されているメモリ16と、シーン指定受付部12および画像入力受付部14から入力を受け取り、メモリ16内の参照データを参照して必要な特徴量を導出する特徴量導出部18と、特徴量導出部18が導出した特徴量とメモリ16内の参照データに基づいて、入力された画像データが指定された特定シーンの画像のデータであるか否かを識別する識別部20を備えている。
メモリ16内に格納されている参照データは、識別したい特定シーンとして指定され得る複数のシーンごとに、そのシーンの識別に用いる特徴量の種類と、それらの特徴量の各々に対応する識別条件とを規定したものであり、たとえば図2に示す参照表形式等のデータである。図2の例には、説明のため、「水中」、「夕焼け」および「夜景」の3つのシーンに関するデータのみを示してあるが、実際の参照データは、通常、これよりずっと多くのシーンについてのデータからなる。識別に用いる特徴量の種類および数は、シーンごとに異なる。なお、図2の例において「平均値」とは、選別対象の画像全体に亘るある特性値(各色の濃度等)の平均値を指す。また、「n%点」(0<n<100)とは、選別対象の画像またはその縮小画像の各画素におけるある特性値を累積ヒストグラムで表した場合に、全画素数のn%の計数値に対応する特性値を指す。さらに、「(m%点)−(n%点)」(0<m,n<100)とは、m%点とn%点の差分値を指す。ただし、用いられる特徴量の種類は、図2の例に示したものに限られずいかなるものであってもよく、たとえば、各特性値の最大値や最小値を用いてもよいし、エッジ強度、テクスチャー、奥行情報に関する特徴量等を用いてもよい。また、異なる複数の特性値を組み合わせた重み付き加算値等を、特徴量として用いてもよい。各特徴量に対応する識別条件は、正負の値を取る数列の形式で表されている。
図2に示した参照データ中の特徴量の種類および識別条件は、シーンごとのサンプル画像群の学習により、予め決められたものである。以下、「水中」シーンに関する学習を例にとって、図3のフローチャートを参照しながら、サンプル画像群の学習手法の一例を説明する。
学習の対象となるサンプル画像群は、「水中」のシーンの画像であることが分かっている複数の画像と、「水中」のシーンの画像でないことが分かっている複数の画像からなる。各サンプル画像には、重みすなわち重要度が割り当てられる。まず、図3のステップ30において、すべてのサンプル画像の重みの初期値が、等しい値に設定される。
次に、ステップ32において、識別に使用され得る複数の特徴量について、「識別器」が作成される。ここで、それぞれの「識別器」とは、1つの特徴量を用いてあるシーンの画像とそうでない画像とを識別する基準を提供するものである。この例では、図4に導出方法を図示した各特徴量についてのヒストグラムを「識別器」として使用する。図4を参照しながら説明すると、まず、「水中」のシーンの画像であることが分かっている複数のサンプル画像について、一定間隔刻みのある特徴量(たとえば濃度Bの平均値)のヒストグラムが作成される。同様に、「水中」のシーンの画像でないことが分かっている複数のサンプル画像についても、ヒストグラムが作成される。これらの2つのヒストグラムが示す頻度値の比の対数値を取ってヒストグラムで表したものが、図4の一番右側に示す、識別器として用いられるヒストグラムである。この識別器のヒストグラムが示す各縦軸の値を、以下、「識別ポイント」と呼ぶことにする。この識別器によれば、正の識別ポイントに対応する特徴量の値を示す画像は「水中」のシーンの画像である可能性が高く、識別ポイントの絶対値が大きいほどその可能性は高まると言える。逆に、負の識別ポイントに対応する特徴量の値を示す画像は「水中」のシーンの画像でない可能性が高く、やはり識別ポイントの絶対値が大きいほどその可能性は高まる。ステップ32では、識別に使用され得る複数の特徴量、たとえば、濃度R、GならびにB、輝度Y、色差CrならびにCb、彩度および色相のそれぞれについての平均値、いくつかのn%点、およびいくつかの(m%点)−(n%点)のすべてについて、上記のヒストグラム形式の識別器が作成される。
続いて、ステップ34において、ステップ32で作成した識別器のうち、「水中」のシーンの画像を識別するのに最も有効な識別器が選択される。最も有効な識別器の選択は、各サンプル画像の重みを考慮して行なわれる。この例では、各識別器の重み付き正答率が比較され、最も高い重み付き正答率を示す識別器が選択される。すなわち、最初のステップ34では、各サンプル画像の重みは等しいので、単純に、その識別器によって「水中」のシーンの画像であるか否かが正しく識別されるサンプル画像の数が最も多いものが、最も有効な識別器として選択される。一方、後述するステップ40において各サンプル画像の重みが更新された後の2回目以降のステップ34では、たとえばあるサンプル画像Aの重みが別のサンプル画像Bの重みの2倍であるとすると、サンプル画像Aは、正答率の評価において、サンプル画像Bの2枚分相当として数えられる。これにより、2回目以降のステップ34では、重みの低いサンプル画像よりも、重みの高いサンプル画像が正しく識別されることにより重点が置かれる。
次に、ステップ36において、それまでに選択した識別器の組合せの正答率、すなわち、それまでに選択した識別器を組み合わせて使用して各サンプル画像が「水中」のシーンの画像であるか否かを識別した結果が、実際に「水中」のシーンの画像であるか否かの答えと一致する率が、所定の閾値を超えたか否かが確かめられる。ここで、組合せの正答率の評価に用いられるのは、現在の重みが付けられたサンプル画像群でも、重みが等しくされたサンプル画像群でもよい。所定の閾値を超えた場合は、それまでに選択した識別器を用いれば「水中」のシーンの画像を十分に高い確率で選別できるため、学習は終了する。所定の閾値以下である場合は、それまでに選択した識別器と組み合わせて用いるための追加の識別器を選択するために、図3の処理はステップ38へと進む。
ステップ38では、直近のステップ34で選択されたものに対応する識別器が再び選択されないようにするため、その識別器に対応する特徴量が除外される。
次に、ステップ40では、直近のステップ34で選択された識別器では「水中」のシーンの画像であるか否かを正しく識別できなかった各サンプル画像の重みが、そのサンプル画像の現在の重みよりも高くなるように更新される。一方、直近のステップ34で選択された識別器で「水中」のシーンの画像であるか否かを正しく識別できた各サンプル画像の重みは、そのサンプル画像の現在の重みよりも低くなるように更新される。この重みの更新を行なう理由は、次の識別器の選択において、既に選択された識別器では正しく識別できなかった画像を重要視し、それらの画像を正しく識別できる識別器が選択されるようにして、識別器の組合わせの効果を高めるためである。なお、正しく識別できなかったサンプル画像の重みと、正しく識別できたサンプル画像の重みとが相対的に変化させられれば十分であるので、上記の重みを高くする更新と重みを低くする更新とのいずれか一方のみを行なうこととしてもよい。
続いて、図3の処理はステップ32へと戻り、ステップ38で除外したものを除く各特徴量について、識別器が作成し直される。この2回目以降のステップ32における識別器の作成は、各サンプル画像の重みを考慮して行なわれる。たとえば、あるサンプル画像Aの重みが別のサンプル画像Bの重みの2倍であるとすると、サンプル画像Aは、図4の中央に示す識別器のもととなるヒストグラムの作成において、サンプル画像Bの2倍の頻度値を与える。計算量を減らすため、前回のステップ32で作成した識別器を更新する形で新たな識別器を作成してもよい。その後、ステップ34において、重み付き正答率を基準にして次に有効な識別器が選択される。
以上のステップ32から40を繰り返して、「水中」のシーンの画像の選別に適した識別器として、濃度Bの平均値、濃度Bの(80%点)−(20%点)の値および色差Cbの70%点の値の3つの特徴量に対応する識別器が選択されたところで、ステップ36で確認される正答率が閾値を超えたとすると、ステップ42において、「水中」のシーンの識別に用いる特徴量の種類と識別条件が、図2の参照データの上3行分に示すようなものに確定される。ここで、数列形式の識別条件は、選択された各識別器が示す識別ポイントを、小さい特徴量の値に対応するものから順番に列記したものである。
なお、上記の学習手法を採用する場合において、識別器は、1つの特徴量を用いて特定シーンの画像とそうでない画像を識別する基準を提供するものであれば、上記のヒストグラムの形式のものに限られずいかなるものであってもよく、たとえば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図4の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
また、上記の例では、最も有効な識別器が選択されるごとに、次に有効な識別器の選択に先立って、ステップ32で各サンプル画像の重みを考慮して識別器を作成し直すこととしたが、図3の処理をステップ40からステップ34へと戻すこととし、最初に作成した識別器の中から、重み付き正答率を基準にして有効な識別器を順番に選択することとしてもよい。なお、図3を用いて説明した例のように、最も有効な識別器が選択されるごとに各サンプル画像の重みを考慮して識別器を作成し直す態様においては、ステップ34における最も有効な識別器の選択は、重み付き正答率ではなく単純な正答率を基準としてもよい。あるいは、図4に示す比の対数を取る前の2つのヒストグラムの分布領域が明確に分かれており識別ポイントの絶対値の総和が大きい識別器ほど、「水中」のシーンの画像の識別に適していると言えるので、上記の絶対値が最も大きい識別器を選択することとしてもよい。また、識別器を作成しなおす場合にはサンプル画像の重みが更新されると各識別器も異なったものとなるため、選択された識別器に対応する特徴量を除外するステップ38を省略してもよい。
このほか、最も有効な識別器の選択には、適当な評価関数等を用いてもよい。
図1に戻って、特徴量導出部18は、入力された画像データから、シーンの識別に用いられ得るすべての特徴量を導出する能力を有するものである。すなわち、この実施形態では、特徴量導出部18は、少なくとも図2に示した参照データに含まれるすべての特徴量を導出する能力を有する。
次に、図5のフローチャートを参照しながら、本発明の第1の実施形態に係る図1に示す装置10が行なう具体的な処理の流れについて説明する。
まず、図5のステップ50において、「水中」、「夕焼け」および「夜景」等の特定シーンのうちユーザーが希望する特定シーンの指定が、シーン指定受付部12により受け付けられる。
次いで、ステップ52において、画像入力受付部14が、選別対象の画像を示す画像データの入力を受け付ける。多数の画像に関する一連の画像データを連続的に受け付けてもよい。受け付ける画像データは、たとえば、その画像をなす各画素ごとに濃度R、GおよびBの値を示すデータ等である。
続いて、ステップ54において、特徴量導出部18が、導出すべき特徴量の種類をメモリ16から読み出す。たとえば、ステップ50で指定された特定シーンが「水中」のシーンであるとすると、特徴量導出部18は、メモリ16中の図2に示す参照データを参照して、導出すべき特徴量が、濃度Bの平均値、濃度Bの(80%点)−(20%点)の値および色差Cbの70%点の3種類であることを認識する。
次に、ステップ56において、識別部20が、メモリ16から識別条件を読み出す。上記の「水中」のシーンが指定された例では、識別部20は、上記の3種類の特徴量に関する識別条件を、メモリ16中の図2に示す参照データから読み出す。
続いて、ステップ58において、特徴量導出部18が、ステップ52で入力された画像データから、指定された特定シーンの識別に使用される特徴量の1つを導出する。上記の「水中」のシーンが指定された例では、特徴量導出部18は、上記の3種類の特徴量のいずれかを、入力された画像データから導出する。
次に、ステップ60において、識別部20が、ステップ58で導出された特徴量に基づいて対応する識別条件を参照し、1つの識別ポイントを得る。たとえば、直前のステップ58において上記の3種類の特徴量のうち濃度Bの平均値が画像データから導出された場合は、識別部20は、ステップ56でメモリ16から読み出した濃度Bの平均値に関する識別条件のうちステップ58で導出した平均値に対応する部分を参照し、1つの識別ポイントを得る。ここで、図2に示した識別条件は、前述のとおり一定間隔刻みの特徴量の値に対応するデータ点の識別ポイントを列記したものであるので、ステップ60において得られる識別ポイントは、画像データから導出した特徴量の値に最も近いデータ点の識別ポイントや、データ点間の線形補間による識別ポイント等となる。
続いて、ステップ62において、導出すべきすべての特徴量が導出されたか否かが確認される。上記の「水中」のシーンが指定された例では、濃度Bの平均値、濃度Bの(80%点)−(20%点)の値および色差Cbの70%点の3種類の特徴量が導出されたか否かが確認され、これら3種類の特徴量の導出および対応する識別ポイントの獲得が完了するまで、ステップ58から62の処理が繰り返される。
導出すべきすべての特徴量の導出および対応する識別ポイントの獲得が完了すると、図5の処理はステップ64へと進み、識別部20が、獲得したすべての識別ポイントを総合して、入力された画像データが指定された特定シーンの画像であるか否かが識別される。この実施形態では、すべての識別ポイントを加算して、その加算値の正負によって識別を行なうものとする。たとえば、上記の「水中」のシーンが指定された例では、入力された画像データから導出された上記の3種類の特徴量に関する3つの識別ポイントの総和が正の値である場合には、その画像データは「水中」のシーンの画像を示すデータであると判断され、負の値である場合には、「水中」のシーンの画像を示すデータでないと判断される。
最後に、ステップ66において、識別部20から識別結果が出力され、図5の処理は終了する。
なお、上記の実施形態においては、参照データは装置10内のメモリ16に記憶されているものとしたが、特徴量導出部18および識別部20が参照データにアクセスできる限り、参照データは、装置10とは別個の装置やCD−ROM等の差替可能な媒体に記憶されたものであってもよい。
また、識別に用いる参照データは、識別する特定シーンとして指定され得る複数のシーンごとに、そのシーンの識別に用いる少なくとも1つの特徴量の種類と、それら少なくとも1つの特徴量の各々に対応する識別条件とを規定したものであれば、図2に示した形式のものに限らず、いかなるものであってもよい。たとえば、図2の識別条件の部分を、2値データ、単一の閾値または関数等としてもよい。それに伴い、識別部20による識別手法も、識別ポイントの加算値の正負によるものに限られない。
さらに、参照データを予め決定するための学習手法も、図3および4を用いて説明した上記の手法に限られず、他のいかなる手法であってもよい。たとえば、クラスタリングやブースティング等の名称で知られている、一般に用いられる機械的学習手法を用いてもよい。あるいは、参照データは、熟練した技術者により経験的に定められたものであってもよい。
また、上記の実施形態では、画像入力受付部14に入力される画像データは、対象画像をなす各画素ごとに濃度R、GおよびBの値を示すデータ等であり、特徴量導出部18は、そのような画像データから計算により特徴量を導出するものであったが、画像データを多数の特徴量からなる特徴量群の形式とし、特徴量導出部18を、単にその特徴量群の中からメモリ16内の参照データが指定するものを選択して識別部20に送るものとしてもよい。
上記の本発明の第1の実施形態に係る装置10では、識別に使用する特徴量の種類および識別条件を特定シーンごとに規定した参照データを用いているため、シーン指定受付部12、画像入力受付部14、特徴量導出部18および識別部20を動作させるアルゴリズム自体は所望の特定シーンにかかわらず共通のものとすることができ、装置の開発コストを低く抑えながら、各特定シーンに合った精度の高い識別による画像の選別を行なうことができるという効果が得られる。また、特定シーンごとに識別に使用する特徴量の種類および数を変更することができるため、特定シーンごとに最適な種類および数の特徴量を用い、無駄な計算処理を行なうことなく精度の高い識別による画像の選別を行なうことができる。さらに、複雑な識別アルゴリズムの変更、追加および実装等の作業を要することなく、参照データを改変するだけで、識別基準の変更や、識別可能な特定シーンの追加を、簡単に行なうことができる。
以上、本発明の第1の実施形態に係る装置10について説明したが、コンピュータを、上記のシーン指定受付部12、画像入力受付部14、特徴量導出部18および識別部20に対応する手段として機能させ、図5に示すような処理を行なわせるプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。これらの場合においても、参照データは、プログラム内あるいは同一の記録媒体内に含まれているものであってもよいし、外部の装置や別個の媒体から提供されるものであってもよい。
次に、図6を用いて、本発明の第2の実施形態に係る装置について説明する。図6は、本発明の第2の実施形態に係る特定シーンの画像を選別する装置70の構成を示したブロック図である。装置70に含まれるシーン指定受付部72、画像入力受付部74、参照データ用メモリ76、特徴量導出部78および識別部80の機能は、上記に説明した第1の実施形態に係る装置10の対応部分の機能と同様であり、それらが行なう識別処理も、上記の図5に示した処理と同様である。そこで、これらについては説明を省略し、以下、第1の実施形態に係る装置10と異なる部分についてのみ説明する。
第2の実施形態に係る装置70は、正解受付部82、追加学習データ用メモリ84および追加学習部86を備え、いわば自己学習機能を有する点で、第1の実施形態に係る装置10と異なる。識別部80から識別結果の出力を受けたユーザーが、選別されたあるいはされなかった画像をディスプレイに表示する等して確認したところ、選別結果が正しくなかった場合、ユーザーは、次回からはそれに類似した画像も正しく選別してほしいと考える。本実施形態の装置70は、そのような要請に応えるものである。
すなわち、ユーザーは、正しくない識別結果を受け取り、それを装置70に追加学習させたいと思った場合は、装置70の正解受付部82に対し、その画像に対する正解のシーンを指定して追加学習命令を与えることができる。たとえば、識別部80が「水中」のシーンの画像であると判断した画像が、実際には「夜景」のシーンの画像であった場合は、正解「夜景」を指定して追加学習命令を与える。追加学習命令および正解の指定を受け取った正解受付部82は、それらを識別部80に送る。識別部80は、これに応答して、識別結果が正しくないとされた画像の識別処理において特徴量導出部78が導出した各特徴量と、指定された正解とを、追加学習データ用メモリ84に送る。あるいは、指定された正解と導出された特徴量とに代えて、指定された正解ともとの画像データとを追加学習データ用メモリ84に送る構成としてもよい。追加学習データ用メモリ84には、参照データ用メモリ76に格納されている初期の参照データの導出に用いられた、各サンプル画像の特徴量または画像データも格納されているものとする。
装置70が繰返し使用され、追加学習データ用メモリ84に蓄積された追加学習すべきデータの量が予め定められた基準を超えると、追加学習データ用メモリ84に格納されているデータが追加学習部86に送られ、追加学習部86において、再度の学習および参照データの更新が行なわれる。本実施形態では、追加学習部86は、正解が指定された追加学習すべき各画像と、初期の参照データの導出に用いられた各サンプル画像とを合わせたすべての画像について、再度、図3に示す手法等により学習を行ない、新たな参照データを導出するものとする。
なお、追加学習部86が行なう学習手法は上記のものに限られず他のいかなる手法であってもよく、たとえば、クラスタリングやブースティング等の名称で知られている、一般に用いられる機械的学習手法を用いてもよい。また、上記のように、初期の参照データの導出に用いられた各サンプル画像の特徴量または画像データを追加学習用メモリ84に格納しておく手法にも限られず、正解が指定された追加学習すべき画像についてのみ学習を行なうこととしてもよい。その場合、たとえば、追加学習すべき画像のデータについて、各特定シーンごとかつ各特徴量ごとに図4を用いて説明したようなヒストグラムを作成して、それらのヒストグラムが示す識別条件と、参照データ用メモリ76にそれまで蓄積されていた参照データが示す識別条件との加重平均を取り、その加重平均された識別条件を新たな識別条件として参照データ用メモリ76内の参照データを更新する等の手法を用いることができる。また、追加学習用メモリ84を設けずに、追加学習すべき画像のデータが識別部80から直接に追加学習部86に送られる構成とし、参照データを順次更新するようにしてもよい。
また、上記の実施形態では、追加学習すべきデータの量が予め定められた基準を超えた際に追加学習および参照データの更新を行なうこととしたが、定期的にまたはユーザーからの命令により追加学習および参照データの更新を行なう構成としてもよい。
上記の本発明の第2の実施形態に係る装置70によれば、上記した第1の実施形態の装置10と同様の効果に加えて、実際の選別対象画像に合わせて継続的に選別の精度を向上させていくという効果をさらに得ることができる。また、ユーザーが頻繁に指定する特定シーンに関しては、参照データの内容が特に充実していくため、より高い識別精度を実現することができる。
以上、本発明の第2の実施形態に係る装置70について説明したが、コンピュータを、上記のシーン指定受付部72、画像入力受付部74、特徴量導出部78、識別部80、正解受付部82および追加学習部86に対応する手段として機能させるプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。
次に、図7から10を用いて、本発明の第3の実施形態に係るプログラムについて説明する。本発明の第3の実施形態に係るプログラムは、上記の各実施形態に関連して説明したのと同様の特定シーンの画像を選別する処理を、CPU(中央演算処理装置)の性能やメモリの容量等、プログラムの実行環境を考慮した最適な負荷で、コンピュータに実行させるものである。
図7は、本実施形態に係るプログラムがコンピュータに実行させる処理の流れを示したフローチャートである。以下、各ステップにおける処理について、詳細に説明する。
まず、ステップ90において、実行環境の計算能力が特定される。本実施形態では、使用するコンピュータのCPUの性能のみを、実行環境の計算能力を左右する要因として考慮するものとする。ステップ90では、使用しているコンピュータのCPUの種類を自動的に検出するようにしてもよいし、使用しているコンピュータの型番の指定等をユーザーに要求してCPUの種類を特定するようにしてもよい。
次に、ステップ92において、ステップ90で特定されたCPUの性能に基づいて実行環境−計算量データが参照され、計算量の限界値が設定される。本実施形態における実行環境−計算量データとは、図8に示すような、CPUの性能ごとに計算量の限界値を規定した参照表形式のデータである。図8の例では、高性能のCPUほど、対応する計算量の限界値は高くされている。この実行環境−計算量データは、プログラム内に含まれているものであってもよいし、外部の装置やCD−ROM等の別個の媒体から提供されるものであってもよい。
続いて、ステップ94および96において、第1の実施形態に関連して説明した図5に示す処理と同様に、所望の特定シーンの指定および選別対象の画像を示す画像データの入力が受け付けられる。さらに、ステップ98において、計算量の合計値の初期値が0に設定される。
次に、ステップ100において、参照データから、1組の特徴量の種類と識別条件が読み出される。本実施形態では、参照データは、第1の実施形態に関連して説明した図2に示す参照データと同様のものであるとする。たとえば、ステップ94で指定された特定シーンが「水中」のシーンであるとすると、ステップ100では、導出すべき濃度Bの平均値、濃度Bの(80%点)−(20%点)の値および色差Cbの70%点の3種類の特徴量のうち、「濃度Bの平均値」という特徴量の種類およびそれに対応する識別条件が読み出される。参照データは、プログラム内に含まれているものであってもよいし、使用しているコンピュータ内のメモリ、外部の装置または別個の媒体から提供されるものであってもよい。
続いて、ステップ102において、直前のステップ100で読み出したものに対応する特徴量が、ステップ96で入力された画像データから導出される。ここで、本実施形態に係るプログラムは、少なくとも図2に示した参照データに含まれるすべての特徴量について、その導出に必要な計算処理を規定している。
次に、ステップ104において、ステップ102で導出された特徴量に基づいて、ステップ100で読み出された対応する識別条件が参照され、1つの識別ポイントが得られる。ここでの処理は、第1の実施形態に関連して説明した図5のステップ60の処理と同様の手法によるものである。
続いて、ステップ106において、特徴量−計算量データが参照され、ステップ102で導出された特徴量に対応する計算量ポイントが、計算量の合計値に加算される。本実施形態における特徴量−計算量データとは、図9に示すような、識別に用いられ得る各特徴量ごとに計算量ポイントを規定した参照表形式のデータである。ここで、導出に必要な計算回数や反復処理の繰返し回数が多い特徴量ほど、高い計算量ポイントが与えられている。たとえば、ステップ96において入力される画像データが対象画像をなす各画素ごとに濃度R、GおよびBの値を示すデータである場合は、濃度R、GまたはB自体の平均値等は比較的少ない計算回数で導出できるが、エッジ強度、テクスチャー、奥行情報等に関する特徴量の導出には、各段に多くの計算回数が必要とされる。したがって、エッジ強度等の特徴量には、濃度Rの平均値等の特徴量よりも高い計算量ポイントが与えられている。特徴量−計算量データは、プログラム内に含まれているものであってもよいし、使用しているコンピュータ内のメモリ、外部の装置または別個の媒体から提供されるものであってもよい。
次に、ステップ108において、計算量の合計値が、ステップ92で設定された計算量の限界値以上となったか否かが確認される。ここで、計算量の合計値がまだ限界値に達していない場合は、さらにステップ110において、参照データが現在の特定シーンについて規定している、すべての特徴量を導出し終えたか否かが確認される。ここで、まだすべての特徴量を導出し終えていない場合は、図7の処理はステップ100へと戻り、計算量の合計値が限界値を超えるか、すべての特徴量を導出し終えるまで、ステップ100から110の処理が繰り返される。
計算量の合計値が限界値を超えるか、すべての特徴量を導出し終えると、図7の処理はステップ112へと進む。ステップ112では、すべての識別ポイントが総合され、入力された画像データが指定された特定シーンの画像であるか否かが識別される。本実施形態では、第1の実施形態に関連して説明した処理と同様に、すべての識別ポイントを加算することにより識別を行なうものとする。
最後に、ステップ114において識別結果が出力され、図7の処理は終了する。
なお、プログラムの実行環境を考慮した最適な負荷で処理を行なう手法は、上記に説明した手法に限られない。たとえば、変更例として、実行環境−計算量データおよび特徴量−計算量データを用いずに、図2に示すものに代えて図10に示すような参照データを使用することとしてもよい。図10に示す参照データは、図2に示すものと類似の参照表形式のデータを、CPUの性能ごとに規定したものである。図10に示すように、CPUの性能が高くなるほど、対応する参照表では各特定シーンの識別に用いる特徴量の数が多くされており、逆に、CPUの性能が低くなるほど、特徴量の数が少なくされている。これに代えてまたは加えて、低い性能に対応する参照表では、エッジ強度、テクスチャー、奥行情報等に関する特徴量のような、多くの計算を必要とする特徴量は用いないこととしてもよい。この図10に示すような参照データを使用した変更例による処理では、図7に示す処理のステップ92、98、106および108は不要となる。また、ステップ100では、参照データ中の、ステップ90で特定したCPUの性能に対応した参照表を参照することになる。
また、上記の第3の実施形態およびその変更例では、使用するコンピュータのCPUの性能のみを、実行環境の計算能力を左右する要因として考慮したが、これに代えてまたは加えて、メモリの容量等の他の要因を考慮してもよい。
例えば、デジタルカメラ等の撮像装置において、撮影者により指定された撮影モードが高画質モードであるか通常モードであるかに応じて、図11に示すような計算量ポイントの限界を定め、限界値に達するまで計算を行うようにしてもよい。
あるいは、図12に示すような特徴量と識別条件の参照表形式のデータを用意して、高画質モードが設定されているか通常モードが設定されているかに応じて読み込む参照データを切り替えるようにしてもよい。また、この参照は、ユーザーが望む処理を施すことができるようにユーザーごとに設定するようにしてもよい。
上記の本発明の第3の実施形態またはその変更例に係るプログラムによれば、上記した第1の実施形態の装置10と同様の効果に加えて、実行環境の計算能力を考慮に入れて、その計算能力の範囲内の最適な負荷により、最大限の高い選別精度を実現することができるという効果が得られる。さらに、実行環境の計算能力の特定を、ユーザーによる指定により行なう場合には、ユーザーは、処理の高速化を図るため、実行環境の計算能力が高い場合でも、所望の処理速度に応じた低い計算能力を指定してもよい。
なお、上記の第3の実施形態およびその変更例に係るプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。
次に、本発明の第4の実施形態について説明する。第1の実施の形態では、「水中」のシーンを識別する装置について説明したが、本実施の形態では、同様の識別手法を用いて、入力された画像が「水中」「夜景」「夕焼け」「その他」のいずれのシーンであるかに分類するシーン分類装置について具体的に説明する。
シーン分類装置11は、入力された画像データを特定シーンに画像を選別する装置10とその結果に応じて画像データを各シーンに分類する分類部25を備える。装置10は第1の実施の形態と略同様であるので詳細な説明は省略し、相違する点についてのみ詳細に説明する。
図13に示すように、識別部20は、「水中」「夜景」「夕焼け」の各シーンに対応した識別器を複数備えている。21は、「水中」のシーンの識別に用いられる複数の識別器(以下、複数の識別器を識別器群という)であり、22は、「夜景」のシーンの識別に用いられる識別器群であり、23は、「夕焼け」のシーンの識別に用いられる識別器群である。
第1の実施の形態で説明したように、「水中」のシーンを識別する際、まず、複数の識別器(各識別器は1つの特徴量に対応する)を用意し、学習の対象となるサンプル画像から得た特徴量を各識別器に入力して、複数の識別器から最も有効な識別器を1つ選択する。次に、その識別器が「水中」のシーンの画像であるか否かを正しく識別したサンプル画像の重みを現在の重みよりも低くし、正しく識別できなかったサンプル画像の重みを現在の重みより高くして選択されなかった残り識別器に入力し、その中から正解率の高い識別器をさらに選択するという処理を繰り返して正解率が所定の閾値を越えるまで、識別器を追加する(図3参照)。
このよう学習した結果、「水中」のシーンを識別するために識別器群21が選択され、識別部20は、この識別器群21を用いて入力された画像データが「水中」のシーンであるかを識別する。識別を行う画像データが入力されると、各識別器が獲得した各識別ポイントを総合して、入力された画像データが「水中」のシーンの画像であるか否かを識別する。例えば、図2に示す3種類の特徴量を用いる場合には、入力された画像データから導出された3つの識別ポイントの総和が正の値であれば、その画像データは「水中」のシーンの画像を示すデータであると判断され、負の値であれば、「水中」のシーンの画像を示すデータでないと判断される。
「夜景」のシーンについても、図3に示すフローチャートに示す方法を用いて「夜景」のサンプル画像を用いて、複数の識別器の中から「夜景」のシーンの識別に最も有効な特徴量を用いた識別器をまず1つ選択し、さらに、正解率が所定の閾値を越えるまで繰り返し残りの識別器の中から最適な識別器を追加選択して識別器群22を選択する。具体的には、例えば、図2に示す「夜景」シーンの4種類の特徴量に対応した識別器を4つ用意する。識別部20で、「夜景」のシーンであるか否かを識別する際には、「夜景」のサンプル画像に基づいて学習された結果得られた4つの識別器を用い、各識別器から得られた識別ポイントを加算して識別を行う。
同様に、「夕焼け」のシーンについても、「夕焼け」のサンプル画像を用いて識別器群23を選択し(具体的には、例えば、図2に示す「夕焼け」シーンの4種類の特徴量に対応した識別器を4つ用意する)、識別部20で「夕焼け」のシーンであるか否かを識別は、「夕焼け」のサンプル画像を学習した結果得られた識別器群23を用い、各識別器から得られた識別ポイントを加算して識別を行う。
図14は、本実施形態に係る分類部25が「水中」「夜景」「夕焼け」「その他」のいずれのシーンであるかに分類する流れの一例を示したフローチャートである。以下、各ステップにおける処理について、詳細に説明する。
まず、ステップ130において、画像入力受付部14から画像が入力され、ステップ131において、その入力された画像より特徴量導出部18を用いて「水中」のシーンを識別する濃度Bの平均値、濃度Bの(80%点)−(20%点)の値および色差Cbの70%点の値の3つの特徴量(図2参照)を算出し、「水中」のシーンを識別する識別器群21の各識別器から識別ポイントを獲得する。獲得したすべての識別ポイントを加算して、その加算値の正負によって「水中」のシーンであるか否かの識別を行なう。
ステップ132において、加算値が正の場合には、ステップ133で「水中」のシーンでと判定し、加算値が負の場合には、ステップ134に進み、「夜景」のシーンであるかの識別を行う。ステップ134において、特徴量導出部18を用いて「夜景」のシーンを識別する輝度Y平均値、彩度60%点、彩度(70%点)−(30%点)、濃度Bの平均値の4つの特徴量(図2参照)を算出し、「夜景」のシーンを識別する識別器群22の各識別器から識別ポイントを獲得し、その識別ポイントを加算した加算値によって「夜景」のシーンであるか否かの識別を行なう。
ステップ136において、加算値が正の場合にはステップ137で「夜景」のシーンであるものと判定し、加算値が負の場合には、ステップ138に進み、「夕焼け」のシーンであるか否かの判定を、上述と同様に、「夕焼け」のシーンを識別する濃度R70%点、輝度Y90%点、濃度R90%点、色差Cr平均値の4つの特徴量(図2参照)を算出し、「夕焼け」のシーンを識別する識別器群23を用いて「夕焼け」のシーンであるか否かを判定する。同様に、ステップ139において、加算値が正の場合には、ステップ140で「夜景」のシーンであるものと判定し、加算値が負の場合には、ステップ141で「その他」のシーンであるものと判定する。
上述では、「水中」「夜景」「夕焼け」の順番で識別を行う場合について説明したが、短い撮影間隔で撮影された画像データを判定する場合には、同一のシーンである可能性が高いので、前の画像で判定されたシーンを最初に識別するようするものが望ましい。例えば、撮影間隔が短い間隔で撮影された前の画像が「夕焼け」が判定された場合には、次の画像も「夕焼け」のシーンである可能性が高く、次の画像の判定をおこなう際に「夕焼け」の識別を最初に行うようにすることによって他の識別処理が不要となる可能性が高くなり、処理を効率化することが可能になる。
あるいは、図15のフローチャートに示すように、分類部25で「水中」「夜景」「夕焼け」のシーンの識別を並列に行うようにしてもよい。
そこで、ステップ142で画像が入力されると、ステップ142、ステップ144、ステップ146において、特徴量導出部18で算出した特徴量をそれぞれ識別器群21(「水中」のシーン)、22(「夜景」のシーン)、23(「夕焼け」のシーン)に入力して識別ポイントを算出し、ステップ148で入力された画像データは識別器群21、22、23から得た加算した識別ポイントが最大となるシーンであると判定する。ただし、このとき最大となる識別ポイントが所定の閾値を越えていない場合には、「その他」のシーンであると判断する。
ここでは第1の実施の形態で説明した方法を用いて、識別を行う場合について説明を行ったが、他のいかなる手法であってもよい。たとえば、クラスタリングやブースティング等の名称で知られている、一般に用いられる機械的学習手法を用いてもよい。また、特徴量は、本実施の形態で説明したものに限らず熟練した技術者により経験的に定められたものであってもよい。
また、本実施の形態に、第2の実施の形態で説明したように、追加学習を行う構成を追加するようにしてもよい。
次に、本発明の第5の実施形態について説明する。本実施の形態では、デジタルスチールカメラやカメラ付携帯電話などの撮像装置と、モニタやプリンタやラボに置かれる機器(フォトバンクのサーバなども含む)などの出力装置からなるシステムについて具体的に説明する。以下の実施の形態では、前述の実施の形態と同様のものには、同一符号を付して詳細な説明は省略する。
図16に示すように、本実施の形態のシステム150は、撮像装置152と出力装置154とを備える。また、撮像装置は、リナックスやTRONなどのOS(operating system)を備える構成とし、ファイル管理機能などOSで提供される機能を利用できるものが望ましい。
撮像装置152は、撮影して画像データを取得する撮像部156と、撮像部156で獲得された画像データを分類するシーン分類部(シーン分類装置)11と、画像データのシーンに応じて画像処理を施す画像処理部158とを備える。
画像処理部158は、ホワイトバランスの修正、明るさの調整、階調補正、シャープネス補正などの画像処理を画像データに自動的に施すが、シーン分類部11で分類されたシーンに応じた画像処理が画像データに施される。具体的には、例えば、ホワイトバランスを修正する際に、通常の画像(例えば、「水中」「夜景」「夕焼け」「その他」に分類する場合には、「その他」のシーンに分類された場合)に対しては、RGBのヒストグラムをそれぞれ求め、全体がグレーになるようにRGBの濃度を調整するが、「水中」のシーンと判定された画像は、ホワイトバランスが崩れて「B」の濃度が高い状態が正常な状態であるのでホワイトバランスの修正は行わないようにする。また、明るさを調整する処理では、「夜景」のシーンと判定された画像は全体が暗いのが通常の状態であるので、全体を明るくするような補正は行わないようにする。
出力装置154は、画像処理の施された画像データをネットワーク経由で受信したり、撮像装置152で一旦記録媒体に記録した画像データを出力装置154が読み取って、その画像を出力装置154の出力部153のモニタに表示したり、プリントを行ったり、ラボに置かれるフォトバンクなどの記憶手段に記憶して保管する。
あるいは、図17のシステム150aに示すように、画像処理部158を撮像装置152に設けず、出力装置154に設けるようにしてもよい。この場合、シーン分類部11によって得られたシーン情報を付帯情報付加部160で画像データに付帯情報(例えば、Exifのタグ情報など)として付加し、シーン情報が付帯された画像データを出力装置154に受け渡すようにしてもよい。このように出力装置154に画像処理部158を設けた構成にすることにより、出力装置154の特性に応じた画像処理を施すことが可能となる。
次に、本発明の第6の実施形態について説明する。本実施の形態では、デジタルスチールカメラやカメラ付携帯電話などの撮像装置と、PCなどの画像処理装置と、モニタやプリンタやラボに置かれる機器などの出力装置からなるシステムについて具体的に説明する。
図18に示すように、本実施の形態のシステム162は、撮像装置152と画像処理装置164と出力装置154とを備える。
撮像装置152は、撮影して画像データを取得する撮像部156を備え、画像処理装置162には、画像データを分類するシーン分類部11と、画像データのシーンに応じて画像処理を施す画像処理部158とを備える。
画像処理装置164は、画像データを撮像装置152からネットワーク経由で受信したり、撮像装置152で一旦記録媒体に記録した画像データを画像処理装置164が読み取ってシーン分類部11に受け渡し、画像処理部158で分類されたシーンに応じた画像処理を画像データに施す。
さらに、ネットワークや記録媒体を介して画像処理の施された画像データが画像処理装置164により出力装置154に送られ、出力装置154では、画像処理が施された画像データをモニタに表示したり、プリントしたり、ラボに置かれるフォトバンクなどの記憶手段に記憶するようにする。
あるいは、図19のシステム162aに示すように、画像処理部158を画像処理装置164に設けず、出力装置154に設けるようにしてもよい。この場合、シーン分類部11によって分類して得られたシーン情報を付帯情報付加部160で画像データの付帯情報(例えば、Exifのタグ情報など)として付加し、シーン情報が付帯された画像データを出力装置に受け渡すようにする。このように出力装置154に画像処理部158を設けた構成にすることにより、出力装置154の特性に応じた画像処理を施すことが可能となる。
さらに、図20のシステム162bに示すように、画像処理装置164がシーン分類部11のみを備える構成とし、画像処理装置164は画像データを撮像装置152からネットワーク経由などで受け取ってシーンを分類し、その結果得られたシーン情報のみをネットワーク経由などで再度撮像装置152に転送するようにしてもよい。
次に、本発明の第7の実施形態について説明する。本実施の形態では、デジタルスチールカメラやカメラ付携帯電話などの撮像装置と、モニタやプリンタやラボに置かれる機器などの出力装置からなるシステムについて説明するが、本実施の形態では、出力装置にシーン分類の機能を持たせる場合について説明する。
図21に示すように、本実施の形態のシステム166の撮像装置152は、撮影して画像データを取得する撮像部156のみを備え、出力装置154が、画像データを分類するシーン分類部11と、画像データのシーンに応じて画像処理を施す画像処理部158とを備える。
出力装置154は、ネットワークや記録媒体を介して撮像装置152から画像データを受け取り、シーン分類部11でのシーンを分類して、画像処理部158で分類されたシーンに応じた画像処理を画像データに施す。
以上、実施の形態5から7において、撮像装置、画像処理装置および出力装置のいずれかにシーンを分類するシーン分類部を設けた場合について説明したが、分類した画像データはシーンに分けて、撮像装置や画像処理装置や出力装置に装備される記憶装置(フォトバンクのサーバや記録媒体など)内で別のファルダに分けて記憶して管理するようにしてもよい。また、出力装置(例えば、具体的にはラボに置かれるフォトバンク用のサーバコンピュータなど)において画像データをフォルダに分けて管理している場合には、インデックスプリントをフォルダ別に作成するようにしてもよい。
また、前述の第3の実施の形態で説明したように、特定シーンの画像を選別する装置10をいずれの装置に設けるかによって、装置10のプログラムの実行環境に応じた計算能力や所望の処理速度に応じて識別器が用いる特徴量の種類や、装置10でシーンの識別に用いる特徴量の数を変更するようにしてもよい。
次に、本発明の第8の実施形態について説明する。本実施の形態では、デジタルスチールカメラやカメラ付携帯電話などの撮像装置にシーン分類の機能を持たせ、撮像装置で設定される撮影モードとの連動させる方法について具体的に説明する。
撮像装置152は、図22に示すように、撮影して画像データを取得する撮像部156と、撮像部156で獲得された画像データを分類するシーン分類部11と、画像データのシーンに応じて画像処理を施す画像処理部158と、撮影時に撮影モードなどシーンを特定する情報を取得するシーン特定情報取得部170とを備える。
デジタルスチールカメラなどの撮像装置152には、「夜景」モードや「夕焼け」モードなど撮影モードを指定する機能を備えたものがあり、撮影時に撮影者が撮影を行う周囲の状況を考慮して撮影モードを指定して、指定された撮影モードに応じた撮影が行なわれる。
シーン特定情報取得部170は、撮影者が指定した撮影モードのシーンを特定する情報として取得し、シーン分類部11はこの撮影モードに応じた画像であるか判定する。
図23は、本実施形態に係る撮像装置が実行する処理の流れを示したフローチャートである。以下、各ステップにおける処理について、詳細に説明する。
ステップ180において、撮像部156が画像データを取得したときの撮影モードが、撮影時に撮影者が自動撮影モードを選択している撮影している場合には(ステップ182)、ステップ184において、シーン分類部11で分類し、続いてステップ186において、画像処理部158で分類されたシーンに応じた画像処理を画像データに施す。
撮影者が、例えば「夜景」の撮影モードを選択して撮影を行った場合には(ステップ182)、ステップ188において、撮像部156が取得した画像データをシーン分類部11で分類し、分類結果が「夜景」のシーンであると判定された場合には(ステップ190)、そのままステップ192の「夜景」のシーンに応じた画像処理を施すが、分類結果が「夜景」のシーンではないと判定された場合には(ステップ190)、ステップ194において、デジタルスチールカメラのLCD表示部などに撮影モードの確認を促すように、「夜景モードで画像処理を行いますか」というような警告表示を行う。
ステップ196において、撮影者がそのまま夜景モードで画像処理を行うように指示した場合には、ステップ192の夜景モードの画像処理を行うが、撮影者から夜景モードで画像処理を行わないように指示された場合には、ステップ198の通常の画像処理を施す。
さらに、ステップ200において、分類されたモードに従って、画像データにシーン情報(例えば、Exifのタグ)を付帯して記録媒体や撮影装置のメモリ等に記録する。
上述のシーン分類部11は、「水中」「夜景」「夕焼け」「その他」のいずれかのシーンに分類するものであってもよいし、「夜景」であるか否かのみを判断するものであってもよい。
上述では撮影者が設定した撮影モードに応じて、モードの設定と撮影された画像が一致しているかについて連動させる場合について説明したが、撮影者が設定した撮影モード以外に撮影時間やストロボONで撮影したがなどの情報をシーン特定情報取得部170においてシーンを特定する情報として取得するようにしてもよい。
例えば、撮像装置内に備えた時計の示す撮影時刻が夜であれば、「夜景」のシーンの可能性はあるが、晴天の屋外で撮影された「青空」のシーンである可能性は低い。そこで、「夜景」のシーンを判定する閾値を下げたり、「夜景」のシーンの識別ポイントを増加させたりすることによって「夜景」のシーンに識別されやすくするようにしてもよい。さらに、「夜景」のシーンの可能性が高く、「晴天」のシーンの可能性がほとんどない場合には、「晴天」のシーンの判別は、スキップするようにしてもよい。
また、ストロボONで撮影された場合には、晴天のシーンである可能性は低いので「晴天」のシーンはスキップするようにしてもよい。
さらに、カメラに、時計と、撮影方向を検出するセンサーと、GPS等を用いて撮影位置を検出するような位置検出センサーとを設けるようにすれば、撮影時刻とカメラの撮影方向と撮影した位置から太陽とカメラの位置との関係を知ることができ、昼間に太陽の方向を向いていれば逆光で撮影された可能性があるかがわかる。そこで、これらの情報をシーンを特定する情報として取得し、シーンを識別する際に逆光で撮影されたときの情景に応じた識別を行うようにしてもよい。
このように、シーンを特定する情報を取得するようにすることにより、この情報を算用してシーンを判定する精度を上げることが可能になる。
また、撮像装置で得たシーンを特定する情報を付帯情報として画像に付加するようにしておけば、画像のシーンの識別を撮像装置以外の装置で行う場合であっても、このシーンを特定する情報を参照してシーンの判定精度を上げることが可能になる。
上述では、撮影して得られた自然画像について説明したが、特徴量を変えることによって、コンピュータグラッフィクなどで作成された人工画像と自然画像であるかの識別にも用いることが可能である。
以上、本発明の各実施形態およびその変更例について詳細に述べたが、これらを組み合わせた形態等も、当然ながら本発明の技術的範囲に含まれるものである。その他、上記の各実施形態および変更例は例示的なものに過ぎず、本発明の技術的範囲は、特許請求の範囲のみによって定められるべきものであることは言うまでもない。
本発明の第1の実施形態に係る特定シーンの画像を選別する装置の構成を示したブロック図 図1の装置が用いる参照データの例を示した図 図2に示した参照データを規定するための学習手法の流れを示したフローチャート 図2の識別条件を確定する基となる識別器の導出方法を示した図 図1の装置が行なう識別処理の流れを示したフローチャート 本発明の第2の実施形態に係る特定シーンの画像を選別する装置の構成を示したブロック図 本発明の第3の実施形態に係る特定シーンの画像を選別するプログラムが、コンピュータに実行させる処理の流れを示したフローチャート 図7の処理で使用される実行環境−計算量データの例を示した図 図7の処理で使用される特徴量−計算量データの例を示した図 本発明の第3の実施形態の変更例において使用される参照データの例を示した図 高画質モードと通常モードで使用される計算量データの限界値の例を示した図 高画質モードと通常モードの参照データの例を示した図 本発明の第4の実施形態に係るシーン分類装置の構成を示したブロック図 本発明の第4の実施形態に係るシーンを分類するプログラムが、コンピュータに実行させる処理の流れを示したフローチャート 本発明の第4の実施形態に係るシーンを分類するプログラムが、コンピュータに実行させる処理の変更例の流れを示したフローチャート 本発明の第5の実施形態に係るシステムの構成を示したブロック図 本発明の第5の実施形態に係るシステムの変更例の構成を示したブロック図 本発明の第6の実施形態に係るシステムの構成を示したブロック図 本発明の第6の実施形態に係るシステムの変更例の構成を示したブロック図(その1) 本発明の第6の実施形態に係るシステムの変更例の構成を示したブロック図(その2) 本発明の第7の実施形態に係るシステムの構成を示したブロック図 本発明の第8の実施形態に係る撮像装置の構成を示したブロック図 本発明の第8の実施形態に係る撮像装置で実行させる処理の流れを示したフローチャート
符号の説明
10 装置
11 シーン分類部
12 シーン指定受付部
14 画像入力受付部
16 メモリ
18 特徴量導出部
20 識別部
21、22、23 識別器群
152 撮像装置
153 出力部
154 出力装置
156 撮像部
158 画像処理部
160 付帯情報付加部
164 画像処理装置
170 シーン特定情報取得部

Claims (7)

  1. 所望の特定シーンの指定を受け付けるシーン指定受付手段と、
    選別対象の画像データの入力を受け付ける画像入力受付手段と、
    前記特定シーンとして指定され得る複数のシーンのそれぞれに対応した、各シーンの識別に用いる少なくとも1つの特徴量の種類と該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを記録した差替可能な記録媒体より前記参照データの入力を受け付ける参照データ入力受付手段と、
    前記複数のシーンの識別に用いられる全ての特徴量を前記画像データから算出可能な算出手段を有し、前記特定シーンに対応する参照データを参照して、該特定シーンの識別に用いる前記少なくとも1つの特徴量を前記算出手段を用いて導出する特徴量導出手段と、
    前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記画像データが前記シーン指定受付手段において指定された前記特定シーンの画像のデータであるか否かを識別する識別手段とを備え、
    前記参照データが、前記複数のシーンの各々について、該シーンであることが分かっている複数の画像と該シーンでないことが分かっている複数の画像からなる重み付きサンプル画像群を、予め学習することにより決定されたものであって、
    前記複数のシーンの各々についての前記学習が、
    前記重み付きサンプル画像群をなす各画像の重みの初期値を等しい値に設定する工程と、
    前記複数のシーンの識別に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記重み付きサンプル画像群をなす現在の学習対象のシーンである複数の画像と該現在の学習対象のシーンでない複数の画像とを識別するのに最も有効な識別器を選択する工程と、
    前記重み付きサンプル画像群をなす画像のうち、直前の前記選択する工程で選択された前記識別器によっては正しく識別されない画像の重みが該画像の現在の重みよりも高くなり、かつ/または該識別器によって正しく識別される画像の重みが該画像の現在の重みよりも低くなるように、各画像の前記重みを更新する工程と、
    前記選択する工程および前記更新する工程を、選択された前記識別器の組合せの正答率が所定の基準を超えるまで繰り返す工程と、
    選択された前記識別器に基づいて、前記現在の学習対象のシーンの識別に用いる前記少なくとも1つの特徴量の種類と前記識別条件を確定する工程とを含む方法によるものであり、
    前記複数の特徴量の各々に対応する識別器が、前記現在の学習対象のシーンである複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値と、前記現在の学習対象のシーンでない複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値との、比または差分に基づいて得られたグラフを前記識別条件とするものであることを特徴とする特定シーンの画像を選別する装置。
  2. 前記識別手段により正しい識別結果が得られなかった画像データについて、該画像データが示す正しいシーンの指定を受け付ける正解受付手段と、
    前記正しいシーンの指定が受け付けられた前記画像データを学習することにより、前記参照データを更新する追加学習手段とをさらに備えていることを特徴とする請求項1記載の特定シーンの画像を選別する装置。
  3. 撮像した画像データを取得する撮像手段と、
    所望の特定シーンの指定を受け付けるシーン指定受付手段と、
    前記特定シーンとして指定され得る複数のシーンのそれぞれに対応した、各シーンの識別に用いる少なくとも1つの特徴量の種類と該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを記録した差替可能な記録媒体より前記参照データの入力を受け付ける参照データ入力受付手段と、
    前記複数のシーンの識別に用いられる全ての特徴量を前記画像データから算出可能な算出手段を有し、前記特定シーンに対応する参照データを参照して、該特定シーンの識別に用いる前記少なくとも1つの特徴量を前記算出手段を用いて導出する特徴量導出手段と、
    前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記画像データが前記シーン指定受付手段において指定された前記特定シーンの画像のデータであるか否かを識別する識別手段とを備え、
    前記参照データが、前記複数のシーンの各々について、該シーンであることが分かっている複数の画像と該シーンでないことが分かっている複数の画像からなる重み付きサンプル画像群を、予め学習することにより決定されたものであって、
    前記複数のシーンの各々についての前記学習が、
    前記重み付きサンプル画像群をなす各画像の重みの初期値を等しい値に設定する工程と、
    前記複数のシーンの識別に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記重み付きサンプル画像群をなす現在の学習対象のシーンである複数の画像と該現在の学習対象のシーンでない複数の画像とを識別するのに最も有効な識別器を選択する工程と、
    前記重み付きサンプル画像群をなす画像のうち、直前の前記選択する工程で選択された前記識別器によっては正しく識別されない画像の重みが該画像の現在の重みよりも高くなり、かつ/または該識別器によって正しく識別される画像の重みが該画像の現在の重みよりも低くなるように、各画像の前記重みを更新する工程と、
    前記選択する工程および前記更新する工程を、選択された前記識別器の組合せの正答率が所定の基準を超えるまで繰り返す工程と、
    選択された前記識別器に基づいて、前記現在の学習対象のシーンの識別に用いる前記少なくとも1つの特徴量の種類と前記識別条件を確定する工程とを含む方法によるものであり、
    前記複数の特徴量の各々に対応する識別器が、前記現在の学習対象のシーンである複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値と、前記現在の学習対象のシーンでない複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値との、比または差分に基づいて得られたグラフを前記識別条件とするものであることを特徴とする撮像装置。
  4. 撮影時に前記シーンを特定する情報を取得するシーン特定情報取得手段をさらに有し、
    前記シーン指定受付手段が、該シーン特定情報取得手段により取得された前記シーンを特定する情報に基づいてシーンの指定を受け付けるものであることを特徴とする請求項記載の撮像装置。
  5. コンピュータを、
    所望の特定シーンの指定を受け付けるシーン指定受付手段、
    選別対象の画像データの入力を受け付ける画像入力受付手段、
    前記特定シーンとして指定され得る複数のシーンのそれぞれに対応した、各シーンの識別に用いる少なくとも1つの特徴量の種類と該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを記録した差替可能な記録媒体より前記参照データの入力を受け付ける参照データ入力受付手段、
    前記複数のシーンの識別に用いられる全ての特徴量を前記画像データから算出可能な算出手段を有し、前記特定シーンに対応する参照データを参照して、該特定シーンの識別に用いる前記少なくとも1つの特徴量を前記算出手段を用いて導出する特徴量導出手段、および
    前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記画像データが前記シーン指定受付手段において指定された前記特定シーンの画像のデータであるか否かを識別する識別手段として機能させる、特定シーンの画像を選別するためのプログラムであって、
    前記参照データが、前記複数のシーンの各々について、該シーンであることが分かっている複数の画像と該シーンでないことが分かっている複数の画像からなる重み付きサンプル画像群を、予め学習することにより決定されたものであって、
    前記複数のシーンの各々についての前記学習が、
    前記重み付きサンプル画像群をなす各画像の重みの初期値を等しい値に設定する工程と、
    前記複数のシーンの識別に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記重み付きサンプル画像群をなす現在の学習対象のシーンである複数の画像と該現在の学習対象のシーンでない複数の画像とを識別するのに最も有効な識別器を選択する工程と、
    前記重み付きサンプル画像群をなす画像のうち、直前の前記選択する工程で選択された前記識別器によっては正しく識別されない画像の重みが該画像の現在の重みよりも高くなり、かつ/または該識別器によって正しく識別される画像の重みが該画像の現在の重みよりも低くなるように、各画像の前記重みを更新する工程と、
    前記選択する工程および前記更新する工程を、選択された前記識別器の組合せの正答率が所定の基準を超えるまで繰り返す工程と、
    選択された前記識別器に基づいて、前記現在の学習対象のシーンの識別に用いる前記少なくとも1つの特徴量の種類と前記識別条件を確定する工程とを含む方法によるものであり、
    前記複数の特徴量の各々に対応する識別器が、前記現在の学習対象のシーンである複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値と、前記現在の学習対象のシーンでない複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値との、比または差分に基づいて得られたグラフを前記識別条件とするものであることを特徴とする特定シーンの画像を選別するためのプログラム。
  6. 請求項5記載の特定シーンの画像を選別するためのプログラムを記録したコンピュータ読取可能な記録媒体。
  7. 所望の特定シーンの指定を受け付けるシーン指定受付手段により前記特定シーンの指定を受け付けるステップと、
    選別対象の画像データの入力を受け付ける画像入力受付手段により前記画像データの入力を受け付けるステップと、
    前記特定シーンとして指定され得る複数のシーンのそれぞれに対応した、各シーンの識別に用いる少なくとも1つの特徴量の種類と該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを記録した差替可能な記録媒体より前記参照データの入力を受け付ける参照データ入力受付手段により前記参照データの入力を受け付けるステップと、
    前記複数のシーンの識別に用いられる全ての特徴量を前記画像データから算出可能な算出手段を有し、前記特定シーンに対応する参照データを参照して、該特定シーンの識別に用いる前記少なくとも1つの特徴量を前記算出手段を用いて導出する特徴量導出手段により前記特定シーンの識別に用いる前記少なくとも1つの特徴量を導出するステップと、
    前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記画像データが前記シーン指定受付手段において指定された前記特定シーンの画像のデータであるか否かを識別する識別手段により前記画像データが前記特定シーンの画像のデータであるか否かを識別するステップとからなり、
    前記参照データが、前記複数のシーンの各々について、該シーンであることが分かっている複数の画像と該シーンでないことが分かっている複数の画像からなる重み付きサンプル画像群を、予め学習することにより決定されたものであって、
    前記複数のシーンの各々についての前記学習が、
    前記重み付きサンプル画像群をなす各画像の重みの初期値を等しい値に設定する工程と、
    前記複数のシーンの識別に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記重み付きサンプル画像群をなす現在の学習対象のシーンである複数の画像と該現在の学習対象のシーンでない複数の画像とを識別するのに最も有効な識別器を選択する工程と、
    前記重み付きサンプル画像群をなす画像のうち、直前の前記選択する工程で選択された前記識別器によっては正しく識別されない画像の重みが該画像の現在の重みよりも高くなり、かつ/または該識別器によって正しく識別される画像の重みが該画像の現在の重みよりも低くなるように、各画像の前記重みを更新する工程と、
    前記選択する工程および前記更新する工程を、選択された前記識別器の組合せの正答率が所定の基準を超えるまで繰り返す工程と、
    選択された前記識別器に基づいて、前記現在の学習対象のシーンの識別に用いる前記少なくとも1つの特徴量の種類と前記識別条件を確定する工程とを含む方法によるものであり、
    前記複数の特徴量の各々に対応する識別器が、前記現在の学習対象のシーンである複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値と、前記現在の学習対象のシーンでない複数の画像の各々が示す該特徴量の値のヒストグラムの各頻度値との、比または差分に基づいて得られたグラフを前記識別条件とするものであることを特徴とする特定シーンの画像を選別する方法。
JP2004277577A 2003-09-25 2004-09-24 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体 Expired - Fee Related JP4606828B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004277577A JP4606828B2 (ja) 2003-09-25 2004-09-24 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
US10/949,202 US7202873B2 (en) 2003-09-25 2004-09-27 Specific scene image selecting apparatus, computer program and computer readable medium on which the computer program is recorded

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003333411 2003-09-25
JP2004277577A JP4606828B2 (ja) 2003-09-25 2004-09-24 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2005122720A JP2005122720A (ja) 2005-05-12
JP4606828B2 true JP4606828B2 (ja) 2011-01-05

Family

ID=34380366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004277577A Expired - Fee Related JP4606828B2 (ja) 2003-09-25 2004-09-24 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体

Country Status (2)

Country Link
US (1) US7202873B2 (ja)
JP (1) JP4606828B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9911067B2 (en) 2014-05-15 2018-03-06 Ricoh Company, Ltd. Image processing apparatus, method of processing image, and program

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7684640B2 (en) * 2005-10-20 2010-03-23 Sharp Laboratories Of America, Inc. Methods and systems for automatic digital image enhancement with local adjustment
US7684639B2 (en) * 2005-10-20 2010-03-23 Sharp Laboratories Of America, Inc. Methods and systems for automatic digital image enhancement
US7668369B2 (en) * 2006-04-26 2010-02-23 Hewlett-Packard Development Company, L.P. Using camera metadata to classify images into scene type classes
US7860320B2 (en) * 2006-06-26 2010-12-28 Eastman Kodak Company Classifying image regions based on picture location
JP2008234623A (ja) * 2007-02-19 2008-10-02 Seiko Epson Corp カテゴリー識別装置、カテゴリー識別方法、及び、プログラム
JP2008204091A (ja) * 2007-02-19 2008-09-04 Seiko Epson Corp カテゴリー識別装置、及び、カテゴリー識別方法
JP2008271249A (ja) * 2007-04-20 2008-11-06 Seiko Epson Corp 情報処理方法、情報処理装置及びプログラム
CN101315670B (zh) * 2007-06-01 2010-08-11 清华大学 特定被摄体检测装置及其学习装置和学习方法
US8525888B2 (en) 2008-01-17 2013-09-03 Nikon Corporation Electronic camera with image sensor and rangefinding unit
JP5181687B2 (ja) * 2008-01-17 2013-04-10 株式会社ニコン 電子カメラ
JP5263767B2 (ja) * 2008-09-26 2013-08-14 株式会社ザクティ 撮像装置及びモード適否判定方法
JP5238573B2 (ja) * 2009-03-25 2013-07-17 株式会社東芝 学習装置、方法及びプログラム
JP2011193066A (ja) * 2010-03-12 2011-09-29 Sanyo Electric Co Ltd 撮像装置
JP5556262B2 (ja) 2010-03-15 2014-07-23 オムロン株式会社 画像属性判別装置、属性判別支援装置、画像属性判別方法、属性判別支援装置の制御方法、および、制御プログラム
JP5836602B2 (ja) * 2011-02-03 2015-12-24 キヤノン株式会社 画像処理装置及び画像処理装置の制御方法
US8699752B2 (en) * 2011-09-29 2014-04-15 Nec Laboratories America, Inc. Adaptive cross partition for learning weak classifiers
JP5826237B2 (ja) * 2013-11-26 2015-12-02 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP6601725B2 (ja) * 2015-10-09 2019-11-06 大日本印刷株式会社 画像補正装置
JP6779683B2 (ja) * 2016-07-06 2020-11-04 オリンパス株式会社 画像検索装置、画像検索方法及びプログラム
JP6755161B2 (ja) * 2016-10-24 2020-09-16 株式会社デンソーテン 付着物検出装置および付着物検出方法
JP6722351B2 (ja) * 2017-04-26 2020-07-15 株式会社ソニー・インタラクティブエンタテインメント 学習装置、画像認識装置、学習方法及びプログラム
JP2019057024A (ja) * 2017-09-20 2019-04-11 株式会社Screenホールディングス 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000298318A (ja) * 1999-04-15 2000-10-24 Noritsu Koki Co Ltd 画像出力装置および画像判定方法
JP2001024887A (ja) * 1999-07-09 2001-01-26 Fuji Photo Film Co Ltd 類似シーンの判定方法
JP2002077805A (ja) * 2000-09-01 2002-03-15 Nippon Signal Co Ltd:The 撮影メモ機能付きカメラ
JP2002529858A (ja) * 1998-11-06 2002-09-10 ザ トゥルスティーズ オブ コロンビア ユニバーシティ イン ザ シティ オブニュー ヨーク 相互使用可能なマルチメディアコンテンツ記述のためのシステムおよび方法
JP2003244530A (ja) * 2002-02-21 2003-08-29 Konica Corp デジタルスチルカメラ、及びプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04116779A (ja) 1990-09-07 1992-04-17 Takayama:Kk データ処理装置
JPH05210763A (ja) * 1992-01-31 1993-08-20 Nec Corp 自動学習型文字認識装置
US5289276A (en) * 1992-06-19 1994-02-22 General Electric Company Method and apparatus for conveying compressed video data over a noisy communication channel
US5287178A (en) * 1992-07-06 1994-02-15 General Electric Company Reset control network for a video signal encoder
US5557688A (en) * 1992-11-18 1996-09-17 Fuji Photo Film Co., Ltd. Method of extracting characteristic image data and color data conversion device for image processing apparatus
US6301299B1 (en) * 1994-10-28 2001-10-09 Matsushita Electric Industrial Co., Ltd. Memory controller for an ATSC video decoder
EP0942380A3 (en) 1998-03-13 2001-01-10 Matsushita Electric Industrial Co., Ltd. Image distinguishing apparatus
JP4103056B2 (ja) * 1998-03-27 2008-06-18 リコーソフトウエア株式会社 画像識別のための特徴量の利用方法およびそのプログラムを格納した記録媒体
JPH11298736A (ja) 1998-04-14 1999-10-29 Minolta Co Ltd 画像処理方法、画像処理プログラムが記録された可読記録媒体及び画像処理装置
US6542632B1 (en) * 1999-02-01 2003-04-01 Sharp Laboratories Of America, Inc. Method for image characterization using color and texture statistics with embedded spatial information
US7062084B2 (en) * 2000-12-01 2006-06-13 Sharp Laboratories Of America, Inc. Method for image description using color and local spatial information
US7170633B2 (en) 2001-01-23 2007-01-30 Minolta Co., Ltd. Imaging apparatus
US6983068B2 (en) * 2001-09-28 2006-01-03 Xerox Corporation Picture/graphics classification system and method
US6985628B2 (en) * 2002-01-07 2006-01-10 Xerox Corporation Image type classification using edge features

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002529858A (ja) * 1998-11-06 2002-09-10 ザ トゥルスティーズ オブ コロンビア ユニバーシティ イン ザ シティ オブニュー ヨーク 相互使用可能なマルチメディアコンテンツ記述のためのシステムおよび方法
JP2000298318A (ja) * 1999-04-15 2000-10-24 Noritsu Koki Co Ltd 画像出力装置および画像判定方法
JP2001024887A (ja) * 1999-07-09 2001-01-26 Fuji Photo Film Co Ltd 類似シーンの判定方法
JP2002077805A (ja) * 2000-09-01 2002-03-15 Nippon Signal Co Ltd:The 撮影メモ機能付きカメラ
JP2003244530A (ja) * 2002-02-21 2003-08-29 Konica Corp デジタルスチルカメラ、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9911067B2 (en) 2014-05-15 2018-03-06 Ricoh Company, Ltd. Image processing apparatus, method of processing image, and program

Also Published As

Publication number Publication date
US7202873B2 (en) 2007-04-10
US20050069278A1 (en) 2005-03-31
JP2005122720A (ja) 2005-05-12

Similar Documents

Publication Publication Date Title
JP4606828B2 (ja) 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
JP4611069B2 (ja) 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
US7894673B2 (en) Image processing apparatus and method, and image processing computer readable medium for processing based on subject type
JP4335476B2 (ja) 画像の顕著性及びアピール性に基づいて写真印画の数、寸法、及び、倍率を変更する方法
JP4702635B2 (ja) オートホワイトバランス補正値算出装置、方法およびプログラムならびに撮像装置
EP1211637A2 (en) Digital image processing system and method for emphasizing a main subject of an image
JP2003153007A (ja) 画像重要度に基づく画像圧縮制御システム及び方法
CN102576461A (zh) 评估数字图像的美学质量
KR20070079331A (ko) 화상 처리 시스템, 화상 처리 장치 및 방법, 프로그램, 및기록 매체
US8437542B2 (en) Image processing apparatus, method, and program
JP4230730B2 (ja) 画像処理システム及び画像処理方法
JP2008234625A (ja) 情報処理方法、情報処理装置及びプログラム
CN108769543B (zh) 曝光时间的确定方法及装置
CN105512671B (zh) 基于模糊照片识别的照片管理方法
JP2009080557A (ja) 識別方法及びプログラム
JP2005100121A (ja) 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP4397667B2 (ja) 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP4946750B2 (ja) 設定方法、識別方法及びプログラム
JP2005100122A (ja) 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP2003248825A (ja) 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
JP4882927B2 (ja) カテゴリ識別方法
EP1519568B1 (en) Specific scene image selecting apparatus and method, computer program and computer readable medium on which the computer program is recorded
JP2009093335A (ja) 識別方法及びプログラム
JP2009080556A (ja) 設定方法、識別方法及びプログラム
CN110222207B (zh) 图片的整理方法、装置和智能终端

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101006

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees