JP4397667B2 - 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 - Google Patents

識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 Download PDF

Info

Publication number
JP4397667B2
JP4397667B2 JP2003346924A JP2003346924A JP4397667B2 JP 4397667 B2 JP4397667 B2 JP 4397667B2 JP 2003346924 A JP2003346924 A JP 2003346924A JP 2003346924 A JP2003346924 A JP 2003346924A JP 4397667 B2 JP4397667 B2 JP 4397667B2
Authority
JP
Japan
Prior art keywords
data
group
classifier
discriminator
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003346924A
Other languages
English (en)
Other versions
JP2005115525A (ja
Inventor
貞登 赤堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2003346924A priority Critical patent/JP4397667B2/ja
Publication of JP2005115525A publication Critical patent/JP2005115525A/ja
Application granted granted Critical
Publication of JP4397667B2 publication Critical patent/JP4397667B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像データ等の対象データが特定内容のデータであるか否かを識別する識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置に関するものである。
近年、画像データ等の対象データが特定内容のデータであるか否かを識別する識別処理に用いる基準を決定するために、サンプルデータ群を学習する種々の手法が提案されている。
たとえば、特許文献1には、人物の顔部分を含む画像と含まない画像とを識別する識別処理に用いるために、顔部分を含むことが分かっている複数のサンプル画像と顔部分を含まないことが分かっている複数のサンプル画像の各々から、輝度値等の決められた種類の特徴量を成分とする特徴ベクトルその他のパラメータを導出し記録しておく手法が記載されている。識別処理においては、すべてのサンプル画像についての上記のパラメータと対象画像から導出された特徴ベクトルの各成分とを変数とする評価関数を用いて、その評価関数値の正負に基づいて、対象画像が顔部分を含む画像であるか否かが識別される。
また、特許文献2には、放射線画像から濃度勾配の集中度等に基づいて抽出した候補領域の陰影が、悪性腫瘤等の陰影であるか否かを識別する識別処理に用いるために、悪性であることが分かっている陰影の複数のサンプル画像と悪性でないことが分かっている陰影の複数のサンプル画像の各々から、濃度ヒストグラムに基づく特徴量等の決められた種類の複数の特徴量を抽出して、ニューラルネットワーク等を用いた学習を行なう手法が記載されている。
さらに、非特許文献1等には、一般に用いられる機械的学習手法として、ブースティングと呼ばれる手法およびその変形であるエイダブースト(Adaboost)と呼ばれる手法が記載されている。たとえば、2つの特徴量xおよびxに対応する軸を有する特徴量平面上に分布するデータ点を、ある特定内容のデータを示すデータ点とそうでないデータ点との2つに分類するための学習について説明すると、ブースティングは、上記の特定内容のデータを示すことが分かっている複数のデータ点とそうでないことが分かっている複数のデータ点からなるサンプルデータ点群の中から、データ点の第1の組を選択し、それら第1の組のデータ点を最も良好に分類する特徴量平面上の第1の直線または比較的単純な曲線を特定し、次にその第1の直線または曲線では良好に分類できないデータ点の第2の組を選択し、それら第2の組のデータ点を最も良好に分類する第2の直線または曲線を特定し、・・・という処理を繰り返して学習を行なうものである。最後に、一連の処理で特定された複数の直線または曲線を総合して、多数決の手法等により、特徴量平面を分割する最適な線が決定される。一方、エイダブーストは、上記と同様のサンプルデータ点群をなす各データ点に重みを割り当て、すべてのデータ点を用いてそれらを最も良好に分類する特徴量平面上の第1の直線または曲線を特定し、その第1の直線または曲線では正しく分類できなかったデータ点の重みを高くし、次に各データ点の重みを加味してデータ点を最も良好に分類する第2の直線または曲線を特定し、・・・という処理を繰り返して学習を行なうものである。
特開2003−44853号公報 特開2002−74325号公報 Richard O. Duda, Peter E. Hart, David G. Stork著、江尻公一訳、「パターン識 別」、株式会社新技術コミュニケーションズ、2001年、p.484−488
しかしながら、1つまたは複数の特徴量を指標として対象データが特定内容のデータであるか否かを識別する識別処理を行なう場合、高い識別精度を実現する有用な特徴量の種類は、特定内容によって異なる。たとえば、画像データが特定シーンの画像のデータであるか否かを識別する識別処理の場合、特定シーンが全体的に暗い「夜景」のシーンであれば、輝度や明度に関する特徴量が最も有用な指標となるかもしれないが、特定シーンが「水中」のシーンであれば、輝度や明度よりも青色の濃度に関する特徴量等の方が有用であるかもしれない。ここで、特定内容ごとの識別に用いる特徴量の種類を、熟練した技術者が学習に先立って経験的に決定し、それらの決められた特徴量に関してのみ学習を行なってもよいが、実際にどの特徴量が最も有用な指標であるかを経験的に判断することは難しい。
特に、複数の特徴量を指標とする場合には、単に単独で見たときに有用な指標であるものから順に複数の特徴量を選択して組み合わせて用いても、必ずしも組合せの効果が高いとは言えない。たとえば、傾向が似ている特徴量ばかりを組み合わせて用いて識別処理を行なっても、各特徴量を単独で用いた場合と比べて組合せの効果はほとんどない。上記のとおり、単独で最も有用な指標となる特徴量ですら経験的に決定することは難しいため、複数の特徴量を用いる場合にどの特徴量を用いると組合せの効果が高いかを決定するとなると、経験的に行なうことは極めて困難である。
本発明は、上記事情に鑑み、識別処理に用いる識別条件を決定するための学習において、使用する特徴量の種類をも併せて自動的に選択し、しかも、高い組合せの効果が得られるようにそれらの特徴量の種類の選択を行なう装置、プログラムおよびプログラムを記録した記録媒体を提供することを目的とするものである。さらに、本発明は、組合せの効果が高い特徴量の種類と識別条件とを規定した参照データを用いて、所望の特定内容のデータを精度良く選別する装置を提供することも目的とするものである。
すなわち、本発明に係る識別処理に用いる特徴量の種類と識別条件を決定する装置は、対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、それらの特徴量の各々に対応する識別条件とを決定する装置であって、上記の識別処理に用いられ得る複数の特徴量から、各々少なくとも1つの特徴量からなる複数の特徴量群を規定する特徴量群規定手段と、それらの複数の特徴量群に対応する複数の識別器群であって、それらの複数の識別器群を構成する各識別器が、上記の特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなる第1のサンプルデータ群に基づいて作成されたものである、複数の識別器群を規定する識別器群規定手段と、上記の第1のサンプルデータ群をなすデータの全部または一部に対する複合識別精度が最も高い1つの識別器群を選択する識別器群選択手段と、所定数の識別器群もしくは複合識別精度が所定の基準を超えるすべての識別器群が選択されるまで、または選択された識別器群の正答率が所定の基準を超えるまで、上記の識別器群選択手段を繰返し動作させる手段と、上記の識別器群選択手段により選択されたすべての識別器群に基づいて、上記の識別処理に用いる少なくとも1つの特徴量の種類と識別条件とを決定する決定手段とを備えていることを特徴とするものである。
ここで、本発明において「対象データ」とは、特定内容のデータであるか否かを識別する識別処理の対象となるものであればいかなるデータであってもよく、例としては、以下に詳述する画像データのほか、特定人物の声であるか否か等の識別処理の対象となる音声データ等が挙げられる。また、対象データが画像データである場合、その画像データは1枚の画像全体に関するデータであっても、1枚の画像に含まれる一部の領域についてのデータであってもよい。したがって、以下に述べる特定シーンであるか否かを識別する処理のほか、たとえば、1枚の画像に含まれる1つの領域が、人物等のある特定の被写体に対応する領域であるか否かを識別する処理等も、上記の「識別処理」に含まれるものである。
また、本発明において「特徴量」とは、対象データの特徴を表すパラメータを指す。たとえば、対象データが画像データである場合には、その画像データが表す画像の色の特徴、輝度の特徴、テクスチャーの特徴、奥行情報、その画像に含まれるエッジの特徴その他の特徴を表すあらゆる指標値が、「特徴量」として使用され得る。また、これらの各特徴を表す指標値を複数組み合わせた重み付き加算値等を、「特徴量」として使用してもよい。
さらに、本発明において「識別条件」とは、1つの特徴量を指標とした、特定内容のデータとそうでないデータとを識別する条件を指す。
また、本発明において「識別器」とは、1つの特徴量を用いて特定内容のデータとそうでないデータとを識別する基準を提供するものであって、上記の「識別条件」を決定する基となるものを指す。さらに、本発明において「識別器群」とは、少なくとも1つの「識別器」からなる群を指す。
さらに、本発明において、「複合識別精度」とは、1つ1つの識別器の「識別精度」と区別するための語であり、各識別器群をなす識別器の組合せによる識別精度を指すものである。
また、本発明において、選択された識別器群の「正答率」とは、1回目の動作においては、識別器群選択手段の1回目の動作で選択された1つの識別器群を使用して、2回目以降の動作においてはそれまでの識別器群選択手段の動作により選択された複数の識別器群を組み合わせて使用して、各サンプルデータが特定内容のデータであるか否かを識別した結果が、実際に特定内容のデータであるか否かの答えと一致する率を指す。なお、正答率の評価には、第1のサンプルデータ群をなすデータの全部を使用してもよいし、一部のみを使用してもよい。
さらに、上記には「繰返し動作させる手段」とあるが、識別器群選択手段を1回動作させただけで動作を終了する条件が満たされた場合には、繰返し動作は行なわれないこととなる。また、識別器群選択手段の各動作において複合識別精度の評価に用いられるデータが第1のサンプルデータ群をなすデータの一部である場合には、使用される「データの一部」は、各繰返し動作ごとに異なるものであってもよい。なお、以下に述べるように識別器群選択手段の2回目以降の動作に先立って各識別器が更新される場合においては、繰返し動作において、すでに一度選択されているが識別器の更新により異なるものとなった識別器群が再度選択されてもよいものとする。
上記の本発明に係る特徴量の種類と識別条件を決定する装置においては、上記の第1のサンプルデータ群が、その第1のサンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、上記の識別器群選択手段が、各動作ごとに、上記の重みを加味した複合識別精度が最も高い1つの識別器群を選択するものであり、上記の識別器群選択手段の2回目以降の各動作に先立って、直前のその識別器群選択手段の動作により選択された1つの識別器群によっては正しく識別されない各データの重みがそのデータの現在の重みよりも高くなり、かつ/またはその1つの識別器群によって正しく識別される各データの重みがそのデータの現在の重みよりも低くなるように、上記の第1のサンプルデータ群をなす各データの重みを更新する重み更新手段がさらに備わっていてもよい。その場合においては、上記の識別器群選択手段の2回目以降の各動作に先立って、上記の重み更新手段により更新された各データの重みが、上記の複数の識別器群の各々をなす各識別器に加味されるように、各識別器を更新する手段がさらに備わっていてもよい。
ここで、上記のように識別器群選択手段が各動作ごとに「重みを加味した複合識別精度」が最も高い1つの識別器群を選択するものである場合は、各サンプルデータの重みが等しいときには、単純に正しく識別されるサンプルデータの数が最も多い1つの識別器群が選択されるが、各サンプルデータの重みが異なるときには、重みの低いサンプルデータよりも、重みの高いサンプルデータが正しく識別されることにより重点が置かれる。具体的には、たとえばあるサンプルデータAの重みが別のサンプルデータBの重みの2倍であるときには、サンプルデータAを、サンプルデータBの2つ分相当として数える等して、複合識別精度の評価を行なう。
また、上記の本発明に係る特徴量の種類と識別条件を決定する装置は、上記の識別器群選択手段の2回目以降の各動作に先立って、その識別器群選択手段の直前の動作により選択された1つの識別器群を以降の選択対象から除外する手段をさらに備えていてもよい。
さらに、上記の本発明に係る特徴量の種類と識別条件を決定する装置においては、上記の特徴量群規定手段は、上記の特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなる第2のサンプルデータ群に基づいて、上記の複数の特徴量の各々について、対応する識別器を作成する識別器作成手段と、上記の第2のサンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する動作を、所定数の識別器もしくは識別精度が所定の基準を超えるすべての識別器が選択されるまで、または選択された識別器の正答率が所定の基準を超えるまで、繰返し行なうことにより選択された各識別器に対応する特徴量を、1つの特徴量群を構成する特徴量として特定する特徴量特定手段とを備え、その特徴量特定手段を複数回動作させることにより、上記の複数の特徴量群の各々を構成する特徴量を特定するものであってもよい。
ここで、本発明において「第2のサンプルデータ群」は、第1のサンプルデータ群と同一のものであってもよいし、異なるものであってもよい。
また、本発明において選択された識別器の「正答率」とは、1回目の動作においては、1回目の選択する動作で選択された1つの識別器を使用して、2回目以降の動作においてはそれまでの選択する動作により選択された複数の識別器を組み合わせて使用して、各サンプルデータが特定内容のデータであるか否かを識別した結果が、実際に特定内容のデータであるか否かの答えと一致する率を指す。なお、正答率の評価には、第2のサンプルデータ群をなすデータの全部を使用してもよいし、一部のみを使用してもよい。
さらに、上記には選択する動作を「繰り返し行なう」とあるが、選択する動作を1回行なっただけで動作を終了する条件が満たされた場合には、繰返し動作は行なわれないこととなる。また、各選択する動作において識別精度の評価に用いられるデータが第2のサンプルデータ群をなすデータの一部である場合には、使用される「データの一部」は、各繰返し動作ごとに異なるものであってもよい。なお、以下に述べるように2回目以降の選択する動作に先立って各識別器が更新される場合においては、繰返し動作において、すでに一度選択されているが更新により異なるものとなった識別器が再度選択されてもよいものとする。
また、上記の第2のサンプルデータ群が、その第2のサンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、上記の特徴量特定手段が、上記の選択する動作ごとに、重みを加味した識別精度が最も高い1つの識別器を選択するものであり、2回目以降の上記の選択する動作に先立って、直前の選択する動作により選択された1つの識別器によっては正しく識別されない各データの重みがそのデータの現在の重みよりも高くなり、かつ/またはその1つの識別器によって正しく識別される各データの重みがそのデータの現在の重みよりも低くなるように、上記の第2のサンプルデータ群をなす各データの重みを更新するものであってもよい。その場合において、上記の特徴量特定手段は、2回目以降の上記の選択する動作に先立って、上記の第2のサンプルデータ群をなすデータの各々に割り当てられた更新された重みが、上記の識別器作成手段が作成した各識別器に加味されるように、各識別器を更新するものであってもよい。
ここで、上記のように各選択する動作ごとに「重みを加味した識別精度」が最も高い1つの識別器が選択される場合は、各サンプルデータの重みが等しいときには、単純に正しく識別されるサンプルデータの数が最も多い1つの識別器が選択されるが、各サンプルデータの重みが異なるときには、重みの低いサンプルデータよりも、重みの高いサンプルデータが正しく識別されることにより重点が置かれる。具体的には、たとえばあるサンプルデータAの重みが別のサンプルデータBの重みの2倍であるときには、サンプルデータAを、サンプルデータBの2つ分相当として数える等して、識別精度の評価を行なう。
また、上記の特徴量特定手段は、2回目以降の上記の選択する動作に先立って、直前の選択する動作により選択された1つの識別器を以降の選択対象から除外するものであってもよい。あるいは、上記の特徴量特定手段の2回目以降の各動作に先立って、その特徴量特定手段の直前の動作により1つの特徴量群を構成する特徴量として規定された特徴量に対応するすべての識別器を、以降の選択対象から除外する手段がさらに備わっていてもよい。
あるいは、上記の本発明に係る特徴量の種類と識別条件を決定する装置においては、上記の特徴量群規定手段は、上記の特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなる第2のサンプルデータ群に基づいて、上記の複数の特徴量の各々について、対応する識別器を作成する識別器作成手段と、その識別器作成手段が作成した識別器を対応する特徴量に応じて複数のカテゴリーに分け、それらの複数のカテゴリーごとに、上記の第2のサンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する動作を、所定数の識別器もしくは識別精度が所定の基準を超えるすべての識別器が選択されるまで、または選択された識別器の正答率が所定の基準を超えるまで、繰返し行なうことにより選択された各識別器に対応する特徴量を、1つの特徴量群を構成する特徴量として特定する特徴量特定手段とを備えているものであってもよい。
ここで、上記の第2のサンプルデータ群が、その第2のサンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、上記の特徴量特定手段が、各選択する動作ごとに、重みを加味した識別精度が最も高い1つの識別器を選択し、上記の複数のカテゴリーごとの2回目以降の上記の選択する動作に先立って、直前の選択する動作により選択された1つの識別器によっては正しく識別されない各データの重みがそのデータの現在の重みよりも高くなり、かつ/またはその1つの識別器によって正しく識別される各データの重みがそのデータの現在の重みよりも低くなるように、上記の第2のサンプルデータ群をなす各データの重みを更新するものであってもよい。その場合において、上記の特徴量特定手段は、上記の複数のカテゴリーごとの2回目以降の上記の選択する動作に先立って、上記の第2のサンプルデータ群をなすデータの各々に割り当てられた更新された重みが、そのカテゴリーをなす各識別器に加味されるように、そのカテゴリーをなす各識別器を更新するものであってもよい。
また、上記の特徴量特定手段は、上記の複数のカテゴリーごとの2回目以降の上記の選択する動作に先立って、直前の選択する動作により選択された1つの識別器を以降の選択対象から除外するものであってもよい。
さらに、上記の本発明に係る特徴量の種類と識別条件を決定する装置においては、上記の複数の識別器群をなす識別器の各々は、上記の第1のサンプルデータ群をなすデータのうち、上記の特定内容のデータであることが分かっている複数のデータが示すその識別器に対応する特徴量の値のヒストグラムの各頻度値と、上記の特定内容のデータでないことが分かっている複数のデータが示すその識別器に対応する特徴量の値のヒストグラムの各頻度値との、比または差分を表したヒストグラムであってもよい。
ここで、上記の「比または差分を表したヒストグラム」とは、頻度値の比または差分の値をそのまま表したヒストグラムであってもよいし、それらの対数値等を表したヒストグラムであってもよい。
また、上記の本発明に係る特徴量の種類と識別条件を決定する装置においては、上記の対象データおよび第1のサンプルデータ群をなす各データが画像データであり、上記の特定内容が、その対象データが示し得る特定シーンであってもよい。
本発明に係るプログラムは、対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、それらの特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、上記の識別処理に用いられ得る複数の特徴量から、各々少なくとも1つの特徴量からなる複数の特徴量群を規定する特徴量群規定手段、上記の複数の特徴量群に対応する複数の識別器群であって、それらの複数の識別器群を構成する各識別器が、上記の特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて作成されたものである、複数の識別器群を規定する識別器群規定手段、上記のサンプルデータ群をなすデータの全部または一部に対する複合識別精度が最も高い1つの識別器群を選択する識別器群選択手段、所定数の識別器群もしくは複合識別精度が所定の基準を超えるすべての識別器群が選択されるまで、または選択された識別器群の正答率が所定の基準を超えるまで、上記の識別器群選択手段を繰返し動作させる手段、および上記の識別器群選択手段により選択されたすべての識別器群に基づいて、上記の識別処理に用いる少なくとも1つの特徴量の種類と識別条件とを決定する決定手段として機能させることを特徴とするものである。また、本発明に係る記録媒体は、そのようなプログラムを記録したコンピュータ読取可能な記録媒体である。
本発明に係る特定内容のデータを選別する装置は、データの所望の特定内容の指定を受け付けるデータ内容指定受付手段と、選別対象である対象データの入力を受け付ける対象データ入力受付手段と、上記の特定内容として指定され得る複数の内容ごとに、上記の対象データがその内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と、それらの少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、上記のデータ内容指定受付手段において指定された特定内容に基づいて参照して、上記の対象データから、その特定内容のデータであるか否かの識別に用いる上記の少なくとも1つの特徴量を導出する特徴量導出手段と、その特徴量導出手段により導出された少なくとも1つの特徴量の各々に基づいて、上記の参照データが規定する対応する識別条件を参照し、上記の対象データが上記のデータ内容指定受付手段において指定された特定内容のデータであるか否かを識別する識別手段とを備えてなり、上記の参照データが、上記の複数の内容の各々について、その内容のデータであることが分かっている複数のデータと、その内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群を、予め学習することにより決定されたものであって、上記の複数の内容の各々についての学習が、上記の識別手段による識別処理に用いられ得る複数の特徴量から、各々少なくとも1つの特徴量からなる複数の特徴量群を規定する工程と、それらの複数の特徴量群に対応する複数の識別器群であって、それらの複数の識別器群を構成する各識別器が上記のサンプルデータ群に基づいて作成されたものである、複数の識別器群を規定する工程と、上記のサンプルデータ群をなすデータの全部または一部に対する複合識別精度が最も高い1つの識別器群を選択する工程と、所定数の識別器群もしくは複合識別精度が所定の基準を超えるすべての識別器群が選択されるまで、または選択された識別器群の正答率が所定の基準を超えるまで、上記の識別器群を選択する工程を繰り返す工程と、上記の選択する工程において選択されたすべての識別器群に基づいて、現在の学習内容のデータであるか否かの識別に用いる上記の少なくとも1つの特徴量の種類と識別条件とを決定する工程を含む方法によるものであることを特徴とするものである。
上記の本発明に係る特定内容のデータを選別する装置は、上記の識別手段により正しい識別結果が得られなかった対象データについて、その対象データが示す正しい内容の指定を受け付ける正解受付手段と、上記の正しい内容の指定が受け付けられた対象データを学習することにより、上記の参照データを更新する追加学習手段とをさらに備えているものであってもよい。
また、上記の本発明に係る特定内容のデータを選別する装置においては、上記の対象データおよびサンプルデータ群をなす各データが画像データであり、上記の特定内容が、上記の対象データが示し得る特定シーンであってもよい。
本発明に係る特徴量の種類と識別条件を決定する装置、プログラム、およびプログラムを記録した記録媒体によれば、識別処理に用いる識別条件のみならず、その識別処理に適した特徴量の種類をも併せて自動的に選択することができる。しかも、それらの特徴量の種類および識別条件は、複合識別精度が最も高い1つの識別器群を順次選択して、それらの識別器群をなす識別器に基づいて決定されるものであるので、所望の識別処理に応じた組合せの効果の高い特徴量の種類を選択することができ、後の識別処理において、極めて高い識別精度を実現することができる。
さらに、識別器群の規定に際し比較的識別精度の高い識別器に対応する特徴量を特定し、それらの特定された特徴量からなる特徴量群に対応する識別器群を規定するようにすれば、予め単独での識別精度が比較的低い識別器を除外して、識別処理に用いる特徴量の種類と識別条件とを効率良く決定することができる。
また、識別器群の選択および/または識別器群を構成する識別器に対応する特徴量の特定に際し、重みが与えられた重み付きサンプルデータ群を使用し、重みの更新を行ないながら、前に選択された識別器群および/または識別器では正しく識別されないサンプルデータを重要視して、追加の識別器群および/または識別器を選択するようにすれば、より組合せの効果の高い識別器を選択して特徴量の種類および識別条件を決定することができ、後の識別処理において、さらに高い識別精度を実現することができる。
また、本発明に係る特定内容のデータを選別する装置は、識別に使用する特徴量の種類および識別条件を特定内容ごとに規定した参照データを用いているため、装置を構成する各手段を動作させるアルゴリズム自体は所望の特定内容にかかわらず共通のものとすることができ、装置の開発コストを低く抑えながら、各特定内容に合った対象データの選別を行なうことができる。しかも、使用する参照データは、特定内容として指定され得る各内容ごとに、その特定内容の対象データであるか否かの識別に適した組合せの効果の高い特徴量の種類、およびそれらの特徴量の各々に対応する識別条件を規定したものであるので、いかなる特定内容に対しても、極めて高精度の識別によるデータの選別を行なうことができる。さらに、複雑な識別アルゴリズムの変更、追加および実装等の作業を要することなく、参照データを改変するだけで、識別基準の変更や、識別可能な特定内容の追加を、簡単に行なうことができる。
さらに、正しい識別結果が得られなかった対象データについて正しい内容の指定を受け付けて、それらの対象データの追加学習による参照データの更新を行なうことを可能とした場合には、実際の対象データに合わせて継続的に選別の精度を向上させていくことができる。また、ユーザーが頻繁に指定する特定内容に関しては、参照データの内容が特に充実していくため、より高い識別精度を実現することができる。
上記の本発明の効果は、多様性が高く、使用され得る特徴量の種類が膨大である画像データ等が対象データであり、識別処理に使用する特徴量の種類の有効な組合せを、特定内容ごとに経験的に決定することが極めて困難または煩雑である場合に、特に有効なものである。
以下、図面により、本発明の例示的な実施形態を詳細に説明する。
まず、図1から図8を用いて、本発明の第1の実施形態およびその変更例を説明する。図1は、本発明の第1の実施形態に係る、画像データが特定シーンのデータであるか否かを識別する識別処理に用いる特徴量の種類と識別条件とを決定するための、装置10の構成を示したブロック図である。装置10は、特定シーンの画像データであることが分かっている複数のサンプル画像データと、特定シーンの画像でないことが分かっている複数のサンプル画像データからなるサンプル画像データ群を学習することによって、識別処理に用いる特徴量の種類と、各特徴量に対応する識別条件とを決定するものであり、サンプル画像データの入力を順次受け付けるサンプル入力受付部12と、入力された各サンプル画像データを後述する重みと対応付けて格納するメモリ14とを備えている。装置10はさらに、メモリ14に格納されたサンプル画像データから複数の識別器を作成する識別器作成部16、複数の特徴量群の各々を構成する特徴量を特定する特徴量特定部18、特徴量特定部18が特定した特徴量からなる各特徴量群に対応する複数の識別器群を規定する識別器群規定部20、識別器群規定部20が規定した複数の識別器群の中から少なくとも1つを選択する識別器群選択部22、および識別器群選択部22が選択した識別器群に基づいて識別処理に使用する特徴量の種類と識別条件とを決定する識別条件決定部24とを備えている。
以下、図2および図3のフローチャートを参照しながら、特定シーンが「水中」のシーンである場合を例にとって、図1の装置10が行なう処理の詳細な工程について説明する。
まず、ステップS2において、サンプル入力受付部12が、「水中」のシーンの画像データであることが分かっている複数のサンプル画像データと、「水中」のシーンの画像データでないことが分かっている複数のサンプル画像データの入力を順次受け付ける。本実施形態では、各サンプル画像データは、そのサンプル画像をなす各画素ごとに濃度R、GおよびBの値を示したデータであるとする。
次に、ステップS4において、サンプル入力受付部12が、各サンプル画像データに等しい重みを初期値として割り当て、各サンプル画像データを、「水中」のシーンであるか否かのラベルおよび重みが付けられた状態で、メモリ14に格納する。
続いて、ステップS6において、識別器作成部16が、識別処理に使用され得る複数の特徴量について、「識別器」を作成する。ここでの「識別器」は、1つの特徴量を用いて「水中」のシーンの画像データとそうでない画像データとを識別する基準を提供するものである。本実施形態では、図4に導出方法を図示した各特徴量についてのヒストグラムを「識別器」として使用する。図4を参照しながら説明すると、識別器作成部16は、まず、「水中」のシーンの画像データであることが分かっている複数のサンプル画像データの各々から、ある特徴量(たとえばそのサンプル画像における濃度Bの平均値)を1つずつ導出し、その値の分布を示すヒストグラムを作成する。同様に、「水中」のシーンの画像データでないことが分かっている複数のサンプル画像データからも、ヒストグラムを作成する。その後、これらの2つのヒストグラムが示す頻度値の比の対数値を取って、図4の一番右側に示す、識別器として用いられるヒストグラムを作成する。このヒストグラムが示す各縦軸の値を、以下、「識別ポイント」と呼ぶことにする。このヒストグラム形式の識別器によれば、正の識別ポイントに対応する特徴量の値を示す画像は「水中」のシーンの画像である可能性が高く、識別ポイントの絶対値が大きいほどその可能性は高まると言える。逆に、負の識別ポイントに対応する特徴量の値を示す画像は「水中」のシーンの画像でない可能性が高く、やはり識別ポイントの絶対値が大きいほどその可能性は高まる。したがって、この識別器は、「水中」のシーンの画像データとそうでない画像データとを識別する基準を提供するものである。ステップS6において、識別器作成部16は、識別に使用され得る複数の特徴量、たとえば、濃度R、GならびにB、輝度Y、色差CrならびにCb、彩度、色相、エッジ強度および画像の縦横の勾配のそれぞれについての平均値、いくつかのn%点、およびいくつかの(m%点)−(n%点)のすべてについて、上記のヒストグラム形式の識別器を作成する。なお、「平均値」とは、1つのサンプル画像の全体に亘るある特性値(各色の濃度等)の平均値を、「n%点」(0<n<100)とは、1つのサンプル画像またはその縮小画像の各画素におけるある特性値を累積ヒストグラムで表した場合に、全画素数のn%の計数値に対応する特性値を、「(m%点)−(n%点)」(0<m,n<100)とは、m%点とn%点の差分値を指すものである。ただし、作成する識別器に対応する特徴量の種類は、これらに限られずいかなるものであってもよい。また、異なる複数の特性値を組み合わせた重み付き加算値等を、特徴量として用いてもよい。
次に、ステップS8において、特徴量特定部18が、識別器作成部16が作成した識別器の中から、各サンプル画像データの重みを加味した識別精度が最も高い1つの識別器を選択する。ここでは、全サンプル画像データを使用して、重みを加味した識別精度を評価する。すなわち、最初のステップS8では、各サンプル画像データの重みは等しいので単純に、その識別器によって「水中」のシーンであるか否かが正しく識別されるサンプル画像データの数が最も多い識別器が選択される。一方、後述するステップS14において各サンプル画像データの重みが順次更新された後の2回目以降のステップS8では、たとえばあるサンプル画像データAの重みが別のサンプル画像データBの重みの2倍であるとすると、サンプル画像データAは、識別精度の評価において、サンプル画像データBの2つ分相当として数えられる。これにより、2回目以降のステップS8では、重みの低いサンプル画像データよりも、重みの高いサンプル画像データが正しく識別されることにより重点を置いて、識別器が選択される。なお、本実施形態のステップS8では上記のとおり全サンプル画像データを使用するが、無作為に選択した一部のサンプル画像データのみを使用してもよい。
続いて、ステップS10において、特徴量特定部18は、現在のステップS8からS16の繰返し処理においてそれまでに選択された識別器の正答率が閾値を超えたか否かを確認する。ここでは、閾値として80%という値を用いるものとする。正答率の評価には、現在の重みが付けられたサンプル画像データ群を用いてもよいし、各データの重みが等しくされたサンプル画像データ群を用いてもよい。正答率がまだ閾値を超えていない場合は、追加の識別器を選択するため、図2の処理はステップS12へと進む。
ステップS12では、直近のステップS8で選択された識別器が再び選択されないようにするため、特徴量特定部18が、その識別器を以降のステップS8における選択対象から除外する処理を行なう。
続いて、ステップS14において、特徴量特定部18は、直近のステップS8で選択された識別器では「水中」のシーンの画像データであるか否かを正しく識別できなかったサンプル画像データの重みを、そのサンプル画像データの現在の重みよりも高くなるように更新する。一方、直近のステップS8で選択された識別器で「水中」のシーンの画像であるか否かを正しく識別できた各サンプル画像データの重みは、そのサンプル画像データの現在の重みよりも低くなるように更新される。この重みの更新を行なう理由は、次の識別器の選択において、既に選択された識別器では正しく識別できなかったサンプル画像データを重要視し、それらのサンプル画像データを正しく識別できる識別器が選択されやすくするためである。なお、正しく識別できなかったサンプル画像データの重みと、正しく識別できたサンプル画像データの重みとが相対的に変化させられれば十分であるので、上記の重みを高くする更新と重みを低くする更新とのいずれか一方のみを行なうこととしてもよい。
次に、ステップS16において、特徴量特定部18は、ステップS12で除外されたものを除く各識別器を更新する。この識別器の更新は、ステップS14で更新された各サンプル画像データの重みが識別器に加味されるように更新を行なうものである。本実施形態では、ステップS14における重みの更新後において、たとえば、あるサンプル画像データAの重みが別のサンプル画像データBの重みの2倍となっているとすると、サンプル画像データAをサンプル画像データBの2倍の頻度値を与えるものとして扱い、図4の中央に示す各識別器のもととなる2つのヒストグラムを作成しなおし、それらのヒストグラムが示す頻度値の比の対数値を取って、新たな識別器とするものとする。その後、2回目のステップS8において、重みを加味した識別精度を基準として、次の識別器が選択される。
以上のステップS8からS16を繰り返して、その繰返し処理で選択された識別器の正答率が閾値を超えると、図2の処理はステップS10からステップS18へと進む。
ステップS18では、特徴量特定部18は、直近のステップS8からS16の繰返し処理において選択された各識別器に対応する特徴量を、1つの特徴量群を構成する特徴量として特定する。
続いて、ステップS20において、さらに追加の特徴量群を規定すべきか否かを判断するため、一定数の特徴量群が規定されたか否かが確認される。なお、ここでの判断は、一定数の特徴量群が規定されたか否かを基準とするものに限られず、他のいかなる基準によるものでもよい。たとえば、それまでの特徴量群の規定において選択されたすべての識別器の正答率を基準としてもよい。あるいは、最初に規定された特徴量群がN個の特徴量により構成されるものである場合に、2N個の識別器を選択してもステップS10で確認される正答率が閾値を超えなくなったときに、識別器の選択を中止し、さらなる特徴量群の規定を取りやめる等の手法を用いることもできる。
まだ一定数の特徴量群が規定されておらず、追加の特徴量群を規定する必要がある場合には、図2の処理はステップS20からステップS22へと進む。ステップS22では、直近のステップS8で選択された識別器が以降の選択対象から除外され、各サンプル画像データに割り当てられた重みが等しい初期値にリセットされる。その後、ステップS8からステップS22の処理が、一定数の特徴量群が規定されるまで繰り返される。
一定数の特徴量群が規定されると、装置10が行なう処理は、識別器群の規定処理、および複合識別精度を基準とした、組合せの効果が高い識別器からなる識別器群の選択処理へと移る。
まず、図3のステップS24において、メモリ14に格納されている各サンプル画像データの重みが等しい初期値にリセットされる。
次に、ステップS26において、識別器群規定部20が、特徴量特定部18が各構成特徴量を特定して規定した各特徴量群に対応する、識別器群を規定する。本実施形態では、識別器群規定部20は、特徴量群ごとに、ステップS24で重みがリセットされたサンプル画像データに基づいて、その特徴量群を構成する各特徴量に対応する識別器を作成し(実際には、ステップS6で作成された初期の識別器をそのまま用いればよい)、それらの識別器からなる群を各々識別器群として規定する。
続いて、ステップS28において、識別器群選択部22が、識別器群規定部20が規定した識別器群の中から、各サンプル画像データの重みを加味した複合識別精度が最も高い1つの識別器群を選択する。ここでは、全サンプル画像データを使用して、重みを加味した複合識別精度を評価する。各識別器群の複合識別精度は、たとえば図5に示した識別器群Aについて説明すると、以下のようにして求められる。まず、1つのサンプル画像データから、濃度Bの平均値と濃度Bの(80%点)−(20%点)の値を導出し、それらの値に基づいて、識別器群Aをなす2つのヒストグラム形式の識別器(図4参照)の対応コラムを参照し、2つの識別ポイントを得る。前述のとおり、識別ポイントの値が正の値である画像は「水中」のシーンの画像である可能性が高く、負の値である画像は「水中」のシーンの画像でない可能性が高い。ここでは、識別器群A全体の複合識別精度を評価するため、上記で得た2つの識別ポイントを加算し、その加算値の正負が示す「水中」のシーンであるか否かの結果と、実際にそのサンプル画像が「水中」のシーンであるか否かの答えを比較する。このような比較を全サンプル画像データについて行い、全サンプル画像データに対する識別器群Aの複合識別精度を導出する。ここで、各サンプル画像データの重みが更新された2回目以降のステップS28では、たとえばあるサンプル画像データAの重みが別のサンプル画像データBの重みの2倍であるとすると、サンプル画像データAは、複合識別精度の評価において、サンプル画像データBの2つ分相当として数えられる。同様にして、他の識別器群についても複合識別精度が導出され、複合識別精度が最も高い1つの識別器群が選択される。なお、本実施形態のステップS28では上記のとおり全サンプル画像データを使用するが、無作為に選択した一部のサンプル画像データのみを使用してもよい。
続いて、ステップS30において、識別器群選択部22は、それまでに選択した識別器群の正答率が閾値を超えたか否かを確認する。閾値としては、ステップS10において識別器の選択に用いた閾値よりも高い水準の閾値を用いる。本実施形態では、ステップS10で用いた閾値が80%であるのに対し、ステップS30では95%という閾値を用いるものとする。正答率の評価には、現在の重みが付けられたサンプル画像データ群を用いてもよいし、各データの重みが等しくされたサンプル画像データ群を用いてもよい。正答率がまだ閾値を超えていない場合は、それまでに選択された識別器群とさらに組み合わせて用いる追加の識別器群を選択するため、図3の処理はステップS32へと進む。
ステップS32では、識別器群選択部22は、直近のステップS28で選択された識別器群が再び選択されないようにするため、その識別器群を以降のステップS28における選択対象から除外する処理を行なう。
次に、ステップS34において、識別器群選択部20は、直近のステップS28で選択された識別器群では「水中」のシーンの画像データであるか否かを正しく識別できなかったサンプル画像データの重みを、そのサンプル画像データの現在の重みよりも高くなるように更新する。一方、直近のステップS28で選択された識別器群で「水中」のシーンの画像であるか否かを正しく識別できた各サンプル画像データの重みは、そのサンプル画像データの現在の重みよりも低くなるように更新される。なお、正しく識別できなかったサンプル画像データの重みと、正しく識別できたサンプル画像データの重みとが相対的に変化させられれば十分であるので、上記の重みを高くする更新と重みを低くする更新とのいずれか一方のみを行なうこととしてもよい。
続いて、ステップS36において、識別器群選択部22は、ステップS32で除外された識別器群を構成する識別器を除く各識別器を更新する。この識別器の更新は、ステップS34で更新された各サンプル画像データの重みが識別器に加味されるように更新を行なうものであり、本実施形態では、ステップS16における識別器の更新と同様の手法により行なうものとする。その後、2回目のステップS28において、重みを加味した複合識別精度を基準として、次の識別器群が選択される。
以上のステップS28からS36を繰り返して、それまでのステップS28で選択された識別器群の全体の正答率が閾値を超えると、識別器群選択部22による識別器群の選択は終了し、図3の処理はステップS30からステップS38へと進む。
ステップS38では、識別条件決定部24が、識別器群選択部22が選択した各識別器群をなす識別器に基づいて、識別処理に使用する特徴量の種類と識別条件とを決定する。決定される特徴量の種類は、識別器群選択部22が選択した各識別器群をなす識別器に対応する特徴量の種類である。また、各特徴量の種類に対応する識別条件は、本実施形態では、各特徴量に対応する識別器のヒストグラム(図4の一番右側のヒストグラム参照)が示す識別ポイントを、小さい特徴量の値に対応するものから順番に列記した、正負の値をとる数列形式のものとする。たとえば、図5の例において、識別器群選択部22が識別器群Aと識別器群Cを選択したところで、2つの識別器群の組合せによる正答率が閾値を超えたとすると、識別条件決定部24が決定する特徴量の種類と識別条件とは、図5の右側の表に示すようになる。これらの特徴量の種類および識別条件を用いれば、対象の画像データが「水中」のシーンの画像データであるか否かの識別処理を行なうことができる。
以上、特定シーンが「水中」のシーンである場合を例にとって、図1の装置10が行なう処理の一例である図2および図3の処理について説明した。
次に、図6から図8を用いて、図1の装置10が行なう処理の変更例について説明する。この変更例では、特徴量特定部18が行なう処理が上記に説明したものと異なり、図2のステップS8からS22の処理に代えて、図6のステップS46からS62の処理が行なわれる。図6および図7のその他の各ステップにおける処理は、上記に説明した図2および図3の処理の対応ステップにおける処理と同様であるので、以下、それらについては説明を省略し、ステップS46からS62の処理についてのみ詳細に説明することとする。
まず、複数の特徴量について識別器が作成された後のステップS46において、特徴量特定部18が、識別器作成部16が作成した複数の識別器を、対応する特徴量に応じて複数のカテゴリーに分ける。この変更例では、特徴量特定部18は、「色に関するカテゴリー」、「テクスチャーおよびパターンに関するカテゴリー」および「輝度、明度および彩度に関するカテゴリー」の3つに、識別器作成部16が作成した識別器を分けるものとする。ここで、「色に関するカテゴリー」に分けられる識別器としては、RGBの各濃度や色差、色相等に関する特徴量に対応する各識別器が挙げられる。「テクスチャーおよびパターンに関するカテゴリー」に分けられる識別器としては、エッジ強度や画像の縦横の勾配等に関する特徴量に対応する各識別器が挙げられる。なお、このような特性に着目したカテゴリーに代えて、「平均値」、「90%点」、・・・、「10%点」、「(90%点)−(10%点)」、・・・、「(60%点)−(40%点)」等のカテゴリーを使用してもよい。
続いて、ステップS48から、上記3つのカテゴリーのうちの1つについての処理が開始される。
まず、ステップS50において、特徴量特定部18は、現在の処理対象のカテゴリーに含まれる識別器の中から、各サンプル画像データの重みを加味した識別精度が最も高い1つの識別器を選択する。ここでは、図2の処理のステップS8と同様に、全サンプル画像データを使用して、重みを加味した識別精度を評価するものとする。
次に、ステップS52において、特徴量特定部18は、現在のステップS50からS58の繰返し処理においてそれまでに選択された識別器の正答率が閾値を超えたか否かを確認する。ここでの閾値としては、後のステップS72で識別器群の正答率の評価に用いる閾値よりは十分低い値を用いるのが好ましい。この変更例では、後のステップS72で用いる閾値が95%であるとして、ステップS52では80%という閾値を用いることとする。正答率の評価には、現在の重みが付けられたサンプル画像データ群を用いてもよいし、各データの重みが等しくされたサンプル画像データ群を用いてもよい。正答率がまだ閾値を超えていない場合は、さらに追加の識別器を選択するために、図6の処理はステップS54へと進む。
ステップS54では、直近のステップS50で選択された識別器が再び選択されないようにするため、特徴量特定部18が、その識別器を以降のステップS50における選択対象から除外する処理を行なう。
続いて、ステップS56において、特徴量特定部18は、直近のステップS50で選択された識別器では「水中」のシーンの画像データであるか否かを正しく識別できなかったサンプル画像データの重みを、そのサンプル画像データの現在の重みよりも高くなるように更新する。一方、直近のステップS50で選択された識別器で「水中」のシーンの画像であるか否かを正しく識別できた各サンプル画像データの重みは、そのサンプル画像データの現在の重みよりも低くなるように更新される。なお、正しく識別できなかったサンプル画像データの重みと、正しく識別できたサンプル画像データの重みとが相対的に変化させられれば十分であるので、上記の重みを高くする更新と重みを低くする更新とのいずれか一方のみを行なうこととしてもよい。
次に、ステップS58において、特徴量特定部18は、現在のカテゴリーを構成する識別器のうち、ステップS54で除外されたものを除く各識別器を更新する。この識別器の更新は、ステップS54で更新された各サンプル画像データの重みが識別器に加味されるように更新を行なうものである。本実施形態では、図2の処理のステップS16における処理と同様の手法により、各識別器を更新するものとする。その後、2回目のステップS50において、重みを加味した識別精度を基準として、次の識別器が選択される。
以上のステップS50からS58を繰り返して、現在のカテゴリーからそれまでに選択された識別器の正答率が閾値を超えると、図6の処理はステップS52からステップS60へと進む。
ステップS60では、特徴量特定部18は、直近のステップS50からS58の繰返し処理により現在のカテゴリーから選択された各識別器に対応する特徴量を、1つの特徴量群を構成する特徴量として特定する。
続いて、特徴量特定部18は、ステップS62において、まだ識別器の選択および特徴量群の規定を行なっていないカテゴリーが残っているか否かを確認する。まだ次のカテゴリーが残っている場合は、図6の処理はステップS64へと進み、各サンプル画像データの重みが等しい初期値にリセットされた上で、次のカテゴリーからの識別器の選択および特徴量群の規定が行なわれる。すべてのカテゴリーからの識別器の選択および特徴量群の規定が終了すると、図6の処理は、図7のステップS66へと進み、図2および図3の処理と同様の処理により、識別器群の規定および選択が行なわれる。この変更例では、上記のとおり「色に関するカテゴリー」、「テクスチャーおよびパターンに関するカテゴリー」および「輝度、明度および彩度に関するカテゴリー」の3つを使用しているので、識別器群規定部20が規定する識別器群は、たとえば図8に示す識別器群A’、B’およびC’のようになる。また、その後のステップS70からS78の処理においてこれら3つの識別器群のうち識別器群A’およびC’の2つが選択されたとすると、ステップS80において決定される特徴量の種類および識別条件は、図8の右側の表に示すようになる。
上記の本発明の第1の実施形態およびその変更例に係る装置10によれば、識別処理に用いる識別条件のみならず、その識別処理に適した特徴量の種類をも、併せて自動的に選択することができる。しかも、上記の装置10は、複数の識別器群を規定し、最終的には個々の識別器の識別精度ではなく各識別器群全体の複合識別精度を基準に識別器群を選択し、選択された識別器群をなす識別器に基づいて識別処理に用いる特徴量の種類および識別条件を決定するものであるので、組合せの効果が高い識別器からなる識別器群を選択して特徴量の種類および識別条件を決定することができ、後の識別処理において、高い識別精度を実現することができる。また、上記の本発明の第1の実施形態およびその変更例は、重みの付けられたサンプル画像データ群を使用し、重みの更新および識別器の更新を行ないながら、前に選択された識別器群では正しく識別されないサンプル画像データを重要視して識別器群を順次選択していること、および識別器群をいくつ選択するかの決定に際し、それまでに選択された識別器群全体の正答率を基準としていることによっても、選択される識別器の組合せの効果を高めている。さらには、特徴量群の規定の際に、重みの付けられたサンプル画像データ群を使用し、重みの更新および識別器の更新を行ないながら識別器を選択していることによっても、選択される識別器の組合せの効果がさらに高められている。また、特徴量群の規定に際し比較的識別精度の高い識別器に対応する特徴量を選択し、それらの特徴量群に対応する識別器群を規定しているので、予め単独での識別精度が比較的低い識別器を除外して、識別処理に用いる特徴量の種類と識別条件とを効率良く決定することができる。
なお、上記において図面を参照して説明した第1の実施形態およびその変更例では、1つの識別器または識別器群が選択されるごとに、次の識別器または識別器群の選択に先立って、各サンプル画像データの重みを考慮して識別器を更新することとしたが(ステップS16およびS36等)、これらの識別器を更新する処理を行わずに、最初に作成した識別器の中から、重みを加味した識別精度または複合識別精度を基準にして識別器または識別器群を順次選択することとしてもよい。なお、図面を参照して説明した例のように、1つの識別器または識別器群が選択されるごとに識別器を更新する態様においては、識別器または識別器群の選択は、重みを加味した識別精度または複合識別精度ではなく単純な識別精度または複合識別精度を基準としてもよい。
また、上記において図面を参照して説明した第1の実施形態およびその変更例では、一度選択された識別器および識別器群を以降の選択対象から除外することとしたが(ステップS12およびS32等)、識別器の更新を行なう場合は、一度選択された識別器および識別器群も識別器の更新によりそれまでと異なったものとなるため、これらの除外する処理を行なわなくてもよい。あるいは、識別器の更新を行なう場合は、識別器の選択過程において、1つの識別器が選択されるごとにその識別器を以降の選択対象から除外する態様に代えて(ステップS12等)、1つの特徴量群を構成するすべての特徴量が特定された段階で、それらの特徴量に対応する識別器を以降の選択対象から除外する態様を用いてもよい。
さらに、ステップS22およびS24等における各サンプル画像データの重みをリセットする処理を行なわず、それまでに更新された重みを引き継いで、識別器または識別器群の選択を行なうこととしてもよい。
次に、図9から図11を用いて、本発明の第2の実施形態を説明する。図9は、本発明の第2の実施形態に係る、画像データが特定シーンのデータであるか否かを識別する識別処理に用いる特徴量の種類と識別条件とを決定するための、装置30の構成を示したブロック図である。図9の装置30の構成は、上記した第1の実施形態に係る装置10の構成と同様であるが、図9の装置30は重みの与えられていないサンプル画像データを用いるものであり、したがって、メモリ34と他の構成部分との間でサンプル画像データの重みに関する情報の受渡しがない点が、図1の装置10と異なる。
以下、図10および図11のフローチャートを参照しながら、特定シーンが「水中」のシーンである場合を例にとって、図9の装置30が行なう処理の詳細な工程について説明する。
まず、ステップS90において、サンプル入力受付部32が、「水中」のシーンの画像データであることが分かっている複数のサンプル画像データと、「水中」のシーンの画像データでないことが分かっている複数のサンプル画像データの入力を順次受け付ける。本実施形態では、各サンプル画像データは、そのサンプル画像をなす各画素ごとに濃度R、GおよびBの値を示したデータであるとする。入力された各サンプル画像データは、「水中」のシーンであるか否かのラベルが付けられた状態で、メモリ34に格納される。
次に、ステップS92において、識別器作成部36が、識別処理に使用され得る複数の特徴量について、識別器を作成する。本実施形態では、上記した第1の実施形態と同様に、濃度R、GならびにB、輝度Y、色差CrならびにCb、彩度、色相、エッジ強度および画像の縦横の勾配のそれぞれについての平均値、いくつかのn%点、およびいくつかの(m%点)−(n%点)等について、無作為に選択されたサンプル画像データの一部または全サンプル画像データに基づいて、図4に導出方法を図示したヒストグラム形式の識別器を作成するものとする。
続いて、ステップS94において、特徴量特定部38が、メモリ34中に格納されているサンプル画像データの一部を無作為に選択する。
次に、ステップS96において、特徴量特定部38は、識別器作成部36が作成した識別器の中から、ステップS94で選択したサンプル画像データの一部に対する識別精度が最も高い1つの識別器を選択する。
続いて、ステップS98において、特徴量特定部38は、現在のステップS96からS102の繰返し処理においてそれまでに選択された識別器の正答率が閾値を超えたか否かを確認する。ここでは、閾値として80%という値を用いるものとする。正答率の評価には、現在選択されている一部のサンプル画像データを用いてもよいし、全サンプル画像データを用いてもよい。正答率がまだ閾値を超えていない場合は、追加の識別器を選択するため、図2の処理はステップS100へと進む。
ステップS100では、直近のステップS96で選択された識別器が再び選択されないようにするため、特徴量特定部38が、その識別器を以降のステップS96における選択対象から除外する処理を行なう。
続いて、ステップS102において、特徴量特定部38は、次のステップS96における識別精度の評価に用いる新たなサンプル画像データの一部を、メモリ34内に格納されているサンプル画像データから選択する。ここでの選択は無作為に行なってもよいが、本実施形態では、それまでのステップS88で選択された識別器ではあまり高い識別精度が得られないようなサンプル画像データの集合、たとえばそれまでのステップS96で選択された識別器を用いると、「水中」のシーンのサンプル画像データであるか否かが正しく識別されるデータの数と誤って識別されるデータの数が同数となるようなサンプル画像データの集合を選択するものとする。これにより、次のステップS96では、既に選択された識別器では正しく識別できないサンプル画像データに対する識別精度が高い識別器が、選択されやすくなる。
以上のステップS96からS102を繰り返して、その繰返し処理で選択された識別器の正答率が閾値を超えると、図10の処理はステップS98からステップS104へと進む。
ステップS104では、特徴量特定部38は、直近のステップS96からS102の繰返し処理において選択された各識別器に対応する特徴量を、1つの特徴量群を構成する特徴量として特定する。
続いて、ステップS106において、さらに追加の特徴量群を規定すべきか否かを判断するため、一定数の特徴量群が規定されたか否かが確認される。なお、ここでの判断は、一定数の特徴量群が規定されたか否かを基準とするものに限られず、他のいかなる基準によるものでもよい。
まだ一定数の特徴量群が規定されておらず、追加の特徴量群を規定する必要がある場合には、図10の処理はステップS106からステップS108へと進む。ステップS108では、直近のステップS96で選択された識別器が以降の選択対象から除外され、再度、サンプル画像データの一部が無作為に選択される。その後、ステップS96からステップS108の処理が、一定数の特徴量群が規定されるまで繰り返される。
一定数の特徴量群が規定されると、装置30が行なう処理は、識別器群の規定処理、および複合識別精度を基準とした、組合せの効果が高い識別器からなる識別器群の選択処理へと移る。
まず、図3のステップS110において、識別器群規定部40が、特徴量特定部38が各構成特徴量を特定して規定した各特徴量群に対応する、識別器群を規定する。本実施形態では、識別器群規定部40は、特徴量群ごとに、その特徴量群を構成する各特徴量に対応する識別器を、無作為に選択されたサンプル画像データの一部または全サンプル画像データに基づいて作成し、それらの識別器からなる群を各々識別器群として規定するものとする。あるいは、ステップS92で作成された各識別器をそのまま用いて、各特徴量群に対応する識別器群を規定してもよい。
次に、ステップS112において、識別器群選択部42が、メモリ34中に格納されているサンプル画像データの一部を無作為に選択する。
続いて、ステップS114において、識別器群選択部42は、識別器群規定部40が規定した識別器群の中から、ステップS112で選択したサンプル画像データの一部に対する複合識別精度が最も高い1つの識別器群を選択する。各識別器群の複合識別精度の導出手法は、本実施形態では重みが加味されない点およびサンプル画像データの一部のみを用いる点を除けば、上記の第1の実施形態における導出手法と同様である。
次に、ステップS116において、識別器群選択部42は、それまでに選択した識別器群の正答率が閾値を超えたか否かを確認する。閾値としては、ステップS98において識別器の選択に用いた閾値よりも高い水準の閾値を用いる。本実施形態では、ステップS98で用いた閾値が80%であるのに対し、ステップS116では95%という閾値を用いるものとする。正答率の評価には、現在選択されている一部のサンプル画像データを用いてもよいし、全サンプル画像データを用いてもよい。正答率がまだ閾値を超えていない場合は、それまでに選択された識別器群とさらに組み合わせて用いる追加の識別器群を選択するため、図11の処理はステップS118へと進む。
ステップS118では、識別器群選択部42は、直近のステップS114で選択された識別器群が再び選択されないようにするため、その識別器群を以降のステップS114における選択対象から除外する処理を行なう。
次に、ステップS120において、識別器群選択部42は、次のステップS114における複合識別精度の評価に用いる新たなサンプル画像データの一部を、メモリ34内に格納されているサンプル画像データから選択する。ここでの選択は無作為に行なってもよいが、本実施形態では、それまでのステップS114で選択された識別器群ではあまり高い複合識別精度が得られないようなサンプル画像データの集合、たとえばそれまでのステップS114で選択された識別器群を用いると、「水中」のシーンのサンプル画像データであるか否かが正しく識別されるデータの数と誤って識別されるデータの数が同数となるようなサンプル画像データの集合を選択するものとする。これにより、次のステップS114では、既に選択された識別器群では正しく識別できないサンプル画像データに対する複合識別精度が高い識別器群が、選択されやすくなる。その後、図11の処理はステップS114へと戻り、次の識別器群が選択される。
以上のステップS114からS120を繰り返して、それまでのステップS114で選択された識別器群の全体の正答率が閾値を超えると、識別器群選択部42による識別器群の選択は終了し、図11の処理はステップS116からステップS122へと進む。
ステップS122では、識別条件決定部44が、識別器群選択部42が選択した各識別器群をなす識別器に基づいて、識別処理に使用する特徴量の種類と識別条件とを決定する。決定される特徴量の種類は、識別器群選択部42が選択した各識別器群をなす識別器に対応する特徴量の種類であり、各特徴量の種類に対応する識別条件は、上記した第1の実施形態と同様の、識別ポイントを数列形式で表したものであるとする。これらの特徴量の種類および識別条件を用いれば、対象の画像データが「水中」のシーンの画像データであるか否かの識別処理を行なうことができる。
以上、特定シーンが「水中」のシーンである場合を例にとって、本発明の第2の実施形態に係る装置30が行なう処理の一例である図10および図11の処理について説明した。なお、この第2の実施形態についても、上記の第1の実施形態の変更例として説明した図6および図7の処理のように、識別器作成部36が作成した識別器を複数のカテゴリーに分けて、カテゴリーごとに識別器群を規定する処理を行なう変更例が可能である。
上記の本発明の第2の実施形態に係る装置30によれば、識別処理に用いる識別条件のみならず、その識別処理に適した特徴量の種類をも、併せて自動的に選択することができる。しかも、上記の装置30は、複数の識別器群を規定し、最終的には個々の識別器の識別精度ではなく各識別器群全体の複合識別精度を基準に識別器群を選択し、選択された識別器群をなす識別器に基づいて識別処理に用いる特徴量の種類および識別条件を決定するものであるので、組合せの効果が高い識別器からなる識別器群を選択して特徴量の種類および識別条件を決定することができ、後の識別処理において、高い識別精度を実現することができる。また、上記の本発明の第2の実施形態は、識別器群の選択に際し、前に選択された識別器群ではあまり高い複合識別精度が得られないサンプル画像データの一部を用いて、識別器群を順次選択していること、および識別器群をいくつ選択するかの決定に際し、それまでに選択された識別器群全体の正答率を基準としていることによっても、選択される識別器の組合せの効果を高めている。さらには、特徴量群の規定の際に、前に選択された識別器ではあまり高い識別精度が得られないサンプル画像データの一部を用いて識別器を順次選択していることによっても、選択される識別器の組合せの効果がさらに高められている。また、特徴量群の規定に際し比較的識別精度の高い識別器に対応する特徴量を選択し、それらの特徴量群に対応する識別器群を規定しているので、予め単独での識別精度が比較的低い識別器を除外して、識別処理に用いる特徴量の種類と識別条件とを効率良く決定することができる。
以上、本発明の第1および第2の実施形態に係る、識別処理に用いる特徴量の種類と識別条件とを決定する装置について詳細に説明したが、これらの実施形態は例示的なものに過ぎず、既に説明した他にも様々な変更が可能である。
たとえば、上記の第1および第2の実施形態はいずれも、識別器群をいくつ選択するかの判断において、それまでに選択された識別器群の正答率を基準とするものであったが、所定数の識別器群が選択された時点や、複合識別精度が所定の基準を超えるすべての識別器群が選択された時点で、識別器群の選択を終了することとしてもよい。
また、上記の第1および第2の実施形態はいずれも、各特徴量群を構成する特徴量の特定に際した識別器の選択においても、それまでに選択された識別器の正答率を基準とするものであったが、所定数の識別器が選択された時点や、識別精度が所定の基準を超えるすべての識別器が選択された時点で、識別器の選択を終了することとしてもよい。それらの場合には、1つの特徴量群を構成する特徴量が特定されるごとに、所定数または所定の基準を緩和してもよい。たとえば、1つ目の特徴量群を構成する特徴量を特定する際には、識別精度が80%以上のすべての識別器を選択し、2つ目の特徴量群を構成する特徴量を特定する際には、識別精度が75%以上のすべての識別器を選択する等の態様が可能である。
さらには、上記の第1および第2の実施形態はいずれも、識別器群の規定に際し比較的識別精度の高い識別器に対応する特徴量を選択し、それらの選択された特徴量からなる特徴量群に対応する識別器群を規定するものであったが、識別器群規定後の識別器群の選択が複合識別精度に基づいて行なわれ、組合せの効果が高い識別器からなる識別器群が選択される限り、識別器群のもととなる特徴量群の規定自体は、たとえば識別処理に用いられ得る複数の特徴量を無作為に組み合わせて複数の特徴量群を規定するもの等であってもよい。
また、上記の第1および第2の実施形態では、各サンプル画像データは、そのサンプル画像をなす各画素ごとに濃度R、GおよびBの値を示したデータとしたが、これに限られず、そのサンプル画像から導出した特徴量群等であってもよい。その場合、識別器作成部は、特徴量の計算は行なわずに各特徴量から直接に識別器を作成することとなる。
さらに、上記の第1および第2の実施形態では、識別器の選択に用いたサンプル画像データと識別器群の選択に用いたサンプル画像データとは同一のものであったが、異なるサンプル画像データを使用してもよい。
また、上記の第1および第2の実施形態はヒストグラム形式の識別器を作成するものとしたが、ここでの識別器は、1つの特徴量を用いて特定シーンの画像データとそうでない画像データとを識別する基準を提供するものであればいかなるものであってもよく、たとえば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図4の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
さらに、上記の第1および第2の実施形態はいずれも装置の形態であったが、コンピュータを、上記の装置を構成する識別器作成部、特徴量特定部、識別器群規定部、識別器群選択部および識別条件決定部に対応する手段として機能させ、上記に説明したような処理を行なわせるプログラムも、本発明の実施形態に該当する。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態に該当する。
次に、図12から図14を用いて、本発明の第3の実施形態について説明する。図12は、本発明の第3の実施形態に係る特定シーンの画像データを選別する装置50の構成を示したブロック図である。この図に示すように、装置50は、識別したい特定シーンの指定を受け付けるシーン指定受付部52と、選別対象の画像データの入力を受け付ける画像入力受付部54と、識別のための参照データが格納されているメモリ56と、シーン指定受付部52および画像入力受付部54から入力を受け取り、メモリ56内の参照データを参照して必要な特徴量を導出する特徴量導出部58と、特徴量導出部58が導出した特徴量とメモリ56内の参照データに基づいて、入力された画像データが指定された特定シーンの画像のデータであるか否かを識別する識別部60を備えている。
メモリ96内に格納されている参照データは、識別したい特定シーンとして指定され得る複数のシーンごとに、そのシーンの識別に用いる特徴量の種類と、それらの特徴量の各々に対応する識別条件とを規定したものであり、本実施形態では、図13に示すような参照表形式のデータであるとする。ここで、図13には「水中」、「夕焼け」および「夜景」の3つのシーンに関するデータのみが示されているが、実際の参照データは、通常、これよりずっと多くのシーンについてのデータからなる。識別に用いる特徴量の種類は、シーンごとに異なっている。また、特徴量の数も、シーンごとに異なっていてもよい。
この参照データは、特定シーンとして指定され得る「水中」、「夕焼け」および「夜景」等のシーンごとに、そのシーンの画像データであることが分かっている複数のサンプル画像データと、そのシーンの画像データでないことが分かっている複数のサンプル画像データとからなる、サンプル画像データ群を予め学習することにより決定されたものである。各シーンについての学習は、上記の第1および第2の実施形態に係る装置が行なうものとして説明した処理あるいはそれらの変更例のいずれかに対応する手法により、行なわれたものとする。したがって、この参照データは、各シーンごとに、そのシーンの識別に適した組合せの効果の高い特徴量の種類、およびそれらの特徴量の各々に対応する識別条件を規定したものとなっている。
次に、図14のフローチャートを参照しながら、本発明の第3の実施形態に係る図12の装置50が行なう具体的な処理の流れについて説明する。
まず、図14のステップS130において、「水中」、「夕焼け」および「夜景」等の特定シーンのうちユーザーが希望する特定シーンの指定が、シーン指定受付部52により受け付けられる。
次いで、ステップS132において、画像入力受付部54が、選別対象の画像を示す画像データの入力を受け付ける。多数の画像に関する一連の画像データを連続的に受け付けてもよい。本実施形態では、受け付ける画像データは、その画像をなす各画素ごとに濃度R、GおよびBの値を示すデータとする。
続いて、ステップS134において、特徴量導出部58が、導出すべき特徴量の種類をメモリ56から読み出す。たとえば、ステップS130で指定された特定シーンが「水中」のシーンであるとすると、特徴量導出部58は、メモリ56中の図13に示す参照データを参照して、導出すべき特徴量が、濃度Bの平均値、濃度Bの(80%点)−(20%点)の値、輝度Yの80%点、色差Cbの(80%点)−(20%点)の値および彩度の60%点の5種類であることを認識する。
次に、ステップS136において、識別部60が、メモリ56から識別条件を読み出す。上記の「水中」のシーンが指定された例では、識別部60は、上記の5種類の特徴量に関する識別条件を、メモリ56中の図13に示す参照データから読み出す。
続いて、ステップS138において、特徴量導出部58が、ステップS132で入力された画像データから、指定された特定シーンの識別に使用される特徴量の1つを導出する。上記の「水中」のシーンが指定された例では、特徴量導出部58は、上記の5種類の特徴量のいずれかを、入力された画像データから導出する。
次に、ステップS140において、識別部60が、ステップS138で導出された特徴量に基づいて対応する識別条件を参照し、1つの識別ポイントを得る。たとえば、直前のステップS138において上記の5種類の特徴量のうち濃度Bの平均値が画像データから導出された場合は、識別部60は、ステップS136でメモリ56から読み出した濃度Bの平均値に関する識別条件のうちステップS138で導出した平均値に対応する部分を参照し、1つの識別ポイントを得る。ここで、図13に示した識別条件は、一定間隔刻みの特徴量の値に対応するデータ点の識別ポイントを列記したものであるので、ステップS140において得られる識別ポイントは、画像データから導出した特徴量の値に最も近いデータ点の識別ポイントや、データ点間の線形補間による識別ポイント等となる。
続いて、ステップS142において、導出すべきすべての特徴量が導出されたか否かが確認される。上記の「水中」のシーンが指定された例では、濃度Bの平均値、濃度Bの(80%点)−(20%点)の値、輝度Yの80%点、色差Cbの(80%点)−(20%点)の値および彩度の60%点の5種類の特徴量が導出されたか否かが確認され、これら5種類の特徴量の導出および対応する識別ポイントの獲得が完了するまで、ステップS138からS142の処理が繰り返される。
導出すべきすべての特徴量の導出および対応する識別ポイントの獲得が完了すると、図14の処理はステップS144へと進み、識別部60が、獲得したすべての識別ポイントを総合して、入力された画像データが指定された特定シーンの画像であるか否かを識別する。本実施形態では、すべての識別ポイントを加算して、その加算値の正負によって識別を行なうものとする。たとえば、上記の「水中」のシーンが指定された例では、入力された画像データから導出された上記の5種類の特徴量に関する5つの識別ポイントの総和が正の値である場合には、その画像データは「水中」のシーンの画像を示すデータであると判断され、負の値である場合には、「水中」のシーンの画像を示すデータでないと判断される。
最後に、ステップS146において、識別部60から識別結果が出力され、図14の処理は終了する。
なお、上記の第3の実施形態においては、参照データは装置50内のメモリ56に記憶されているものとしたが、特徴量導出部58および識別部60が参照データにアクセスできる限り、参照データは、装置50とは別個の装置やCD−ROM等の差替可能な媒体に記憶されたものであってもよい。
また、上記の第3の実施形態では、画像入力受付部54に入力される画像データは、対象画像をなす各画素ごとに濃度R、GおよびBの値を示すデータとしたが、これに限られず、たとえば特徴量群の形式等であってもよい。その場合、特徴量導出部58は、単にその特徴量群の中からメモリ56内の参照データが指定するものを選択して識別部60に送るものとなる。
上記の本発明の第3の実施形態に係る装置50では、識別に使用する特徴量の種類および識別条件を特定シーンごとに規定した参照データを用いているため、シーン指定受付部52、画像入力受付部54、特徴量導出部58および識別部60を動作させるアルゴリズム自体は所望の特定シーンにかかわらず共通のものとすることができ、装置の開発コストを低く抑えながら、各特定シーンに合った画像の選別を行なうことができる。しかも、使用する参照データは、特定シーンとして指定され得る各シーンごとに、そのシーンの画像データであるか否かの識別に適した組合せの効果の高い特徴量の種類、およびそれらの特徴量の各々に対応する識別条件を規定したものであるので、いかなる特定シーンに対しても、極めて高精度の識別による画像の選別を行なうことができる。さらに、複雑な識別アルゴリズムの変更、追加および実装等の作業を要することなく、参照データを改変するだけで、識別基準の変更や、識別可能な特定シーンの追加を、簡単に行なうことができる。
以上、本発明の第3の実施形態に係る装置50について説明したが、当業者であれば、上記の説明に基づいて、コンピュータを、上記のシーン指定受付部52、画像入力受付部54、特徴量導出部58および識別部60に対応する手段として機能させ、図14に示すような処理を行なわせるプログラムや、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、容易に作製することができるであろう。
次に、図15を用いて、本発明の第4の実施形態について説明する。図15は、本発明の第4の実施形態に係る特定シーンの画像を選別する装置70の構成を示したブロック図である。参照データ用メモリ76には、上記の第3の実施形態と同様に、図13に示すような参照表形式等の参照データが格納されているものとする。この参照データを決定するための各シーンについての学習は、上記の第1および第2の実施形態に係る装置が行なうものとして説明した処理あるいはそれらの変更例のいずれかに対応する手法により、行なわれたものとする。シーン指定受付部72、画像入力受付部74、特徴量導出部78および識別部80の機能は、上記に説明した第3の実施形態に係る装置50の対応部分の機能と同様であり、それらが行なう識別処理も、上記の図14に示した処理と同様である。そこで、これらについては説明を省略し、以下、第3の実施形態に係る装置50と異なる部分についてのみ説明する。
第4の実施形態に係る装置70は、正解受付部82、追加学習データ用メモリ84および追加学習部86を備え、いわば自己学習機能を有する点で、第3の実施形態に係る装置50と異なる。識別部80から識別結果の出力を受けたユーザーが、選別されたあるいはされなかった画像をディスプレイに表示する等して確認したところ、選別結果が正しくなかった場合、ユーザーは、次回からはそれに類似した画像も正しく選別してほしいと考える。本実施形態の装置70は、そのような要請に応えるものである。
すなわち、ユーザーは、正しくない識別結果を受け取り、それを装置70に追加学習させたいと思った場合は、装置70の正解受付部82に対し、その画像に対する正解のシーンを指定して追加学習命令を与えることができる。たとえば、識別部70が「水中」のシーンの画像であると判断した画像が、実際には「夜景」のシーンの画像であった場合は、正解「夜景」を指定して追加学習命令を与える。追加学習命令および正解の指定を受け取った正解受付部82は、それらを識別部80に送る。識別部80は、これに応答して、識別結果が正しくないとされた画像の識別処理において特徴量導出部78が導出した各特徴量と、指定された正解とを、追加学習データ用メモリ84に送る。あるいは、指定された正解と導出された特徴量とに代えて、指定された正解ともともとの画像データとを追加学習データ用メモリ84に送る構成としてもよい。追加学習データ用メモリ84には、参照データ用メモリ76に格納されている初期の参照データの導出に用いられた、各サンプル画像の特徴量または画像データも格納されているものとする。
装置70が繰返し使用され、追加学習データ用メモリ84に蓄積された追加学習すべきデータの量が予め定められた基準を超えると、追加学習データ用メモリ84に格納されているデータが追加学習部86に送られ、追加学習部86において、再度の学習および参照データの更新が行なわれる。本実施形態では、追加学習部86は、正解が指定された追加学習すべき各画像と、初期の参照データの導出に用いられた各サンプル画像とを合わせたすべての画像について、再度、図2と3、図6と7または図10と11に示す手法等により学習を行ない、新たな参照データを導出するものとする。
なお、追加学習部86が行なう学習および参照データの更新の手法は、上記のものに限られず他のいかなる手法によるものであってもよい。また、上記のように、初期の参照データの導出に用いられた各サンプル画像の特徴量または画像データを追加学習用メモリ84に格納しておく手法にも限られず、正解が指定された追加学習すべき画像についてのみ学習を行なうこととしてもよい。その場合、たとえば、追加学習すべき画像のデータについて、各特定シーンごとかつ各特徴量ごとに図4を用いて説明したようなヒストグラムを作成して、それらのヒストグラムが示す識別条件と、参照データ用メモリ76にそれまで蓄積されていた参照データが示す識別条件との加重平均を取り、その加重平均された識別条件を新たな識別条件として参照データ用メモリ76内の参照データを更新する等の手法を用いることができる。また、追加学習用メモリ84を設けずに、追加学習すべき画像のデータが識別部80から直接に追加学習部86に送られる構成とし、参照データを順次更新するようにしてもよい。
また、上記の実施形態では、追加学習データの量が予め定められた基準を超えた際に追加学習および参照データの更新を行なうこととしたが、定期的にまたはユーザーからの命令により追加学習および参照データの更新を行なう構成としてもよい。
上記の第4の実施形態に係る装置70によれば、上記した第3の実施形態の装置50と同様の効果に加えて、実際の選別対象画像に合わせて継続的に選別の精度を向上させていくという効果をさらに得ることができる。また、ユーザーが頻繁に指定する特定シーンに関しては、参照データの内容が特に充実していくため、より高い識別精度を実現することができる。
以上、本発明の第4の実施形態に係る装置70について説明したが、当業者であれば、上記の説明に基づいて、コンピュータを、上記のシーン指定受付部72、画像入力受付部74、特徴量導出部78、識別部80、正解受付部82および追加学習部86に対応する手段として機能させるプログラムや、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、容易に作製することができるであろう。
なお、上記に説明した本発明の第1から第4の実施形態およびそれらの変更例は、いずれも、画像データが特定シーンの画像データであるか否かを識別する識別処理のための特徴量の種類と識別条件の決定、または特定シーンの画像データの選別のための装置、プログラムまたはプログラムを記録した記録媒体に関するものであった。しかしながら、本発明は、対象データが特定内容のデータであるか否かを識別する識別処理のための特徴量の種類と識別条件の決定、または特定内容のデータの選別のための装置、プログラムまたはプログラムを記録した記録媒体であれば、いかなるものにも適用することができ、上記の画像データおよび特定シーンは、対象データおよび特定内容の一例に過ぎない。たとえば、本発明は、ある音声データが特定人物の声のデータであるか否かを識別する処理のための、特徴量の種類と識別条件の決定等にも適用することができる。また、同じ画像データを対象データとするものに限っても、上記のような1枚の画像全体が特定シーンを示すものであるか否かの識別処理に限られず、1枚の画像に含まれる1つの領域を表すデータが、人物等のある特定の被写体に対応する領域を表すデータであるか否かを識別する処理のための、特徴量の種類と識別条件の決定等にも適用することができる。
その他、上記の各実施形態および変更例を組み合わせた形態等も当然ながら本発明の技術的範囲に含まれるものであり、本発明の技術的範囲は、特許請求の範囲のみによって定められるべきものであることは言うまでもない。
本発明の第1の実施形態に係る、識別処理に用いる特徴量の種類と識別条件を決定する装置の構成を示したブロック図 図1の装置が行なう処理の一例を示したフローチャート 図2の処理の続きを示したフローチャート 図1の装置の識別器作成部による識別器の作成方法を示した図 図2および図3の処理により決定された特徴量の種類と識別条件の例を示した図 図1の装置が行なう処理の別の例を示したフローチャート 図6の処理の続きを示したフローチャート 図6および図7の処理により決定された特徴量の種類と識別条件の例を示した図 本発明の第2の実施形態に係る、識別処理に用いる特徴量の種類と識別条件を決定する装置の構成を示したブロック図 図9の装置が行なう処理の一例を示したフローチャート 図10の処理の続きを示したフローチャート 本発明の第3の実施形態に係る特定シーンの画像データを選別する装置の構成を示したブロック図 図12の装置が用いる参照データの例を示した図 図12の装置が行なう処理の一例を示したフローチャート 本発明の第4の実施形態に係る特定シーンの画像データを選別する装置の構成を示したブロック図

Claims (18)

  1. 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該特徴量の各々に対応する識別条件とを決定する装置であって、
    前記識別処理に用いられ得る複数の特徴量から、各々少なくとも1つの特徴量からなる複数の特徴量群を規定する特徴量群規定手段と、
    前記複数の特徴量群に対応する複数の識別器群であって、該複数の識別器群それぞれを構成する各識別器が、前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなる第1のサンプルデータ群に基づいて前記識別条件が定められたものであるとともに、前記第1のサンプルデータ群に基づいて該識別器群それぞれの正答率が所定の基準を超えるように作成されたものである、複数の識別器群を規定する識別器群規定手段と、
    前記第1のサンプルデータ群をなすデータの全部または一部に対する正答率が最も高い1つの識別器群を選択する識別器群選択手段と、
    所定数の識別器群もしくは正答率が所定の基準を超えるすべての識別器群が選択されるまで、または選択された識別器群を組み合わせて得られる正答率が所定の基準を超えるまで、前記識別器群選択手段を繰返し動作させる手段と、
    前記識別器群選択手段により選択されたすべての前記識別器群に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段とを備え
    前記第1のサンプルデータ群が、該第1のサンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、
    前記識別器群選択手段が、各動作ごとに、前記重みを加味した前記正答率が最も高い前記1つの識別器群を選択するものであり、
    前記識別器群選択手段の2回目以降の各動作に先立って、直前の該識別器群選択手段の動作により選択された前記1つの識別器群によっては正しく識別されない各データの重みが該データの現在の重みよりも高くなり、かつ/または該1つの識別器群によって正しく識別される各データの重みが該データの現在の重みよりも低くなるように、前記第1のサンプルデータ群をなす各データの前記重みを更新する重み更新手段と、
    前記識別器群選択手段の2回目以降の各動作に先立って、該識別器群選択手段の直前の動作により選択された前記1つの識別器群を以降の選択対象から除外する手段をさらに備えていることを特徴とする装置。
  2. 前記識別器群選択手段の2回目以降の各動作に先立って、前記重み更新手段により更新された各データの前記重みが、前記複数の識別器群の各々をなす各識別器に加味されるように、各識別器を更新する手段をさらに備えていることを特徴とする請求項記載の装置。
  3. 前記特徴量群規定手段が、
    前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなる第2のサンプルデータ群に基づいて、前記複数の特徴量の各々について、対応する識別器を作成する識別器作成手段と、
    前記第2のサンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する動作を、所定数の識別器もしくは識別精度が所定の基準を超えるすべての識別器が選択されるまで、または選択された識別器の正答率が所定の基準を超えるまで、繰返し行なうことにより選択された各識別器に対応する特徴量を、1つの特徴量群を構成する特徴量として特定する特徴量特定手段とを備え、
    前記特徴量特定手段を複数回動作させることにより、前記複数の特徴量群の各々を構成する特徴量を特定するものであることを特徴とする請求項1または2記載の装置。
  4. 前記第2のサンプルデータ群が、該第2のサンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、
    前記特徴量特定手段が、
    前記選択する動作ごとに、前記重みを加味した前記識別精度が最も高い前記1つの識別器を選択するものであり、
    2回目以降の前記選択する動作に先立って、直前の前記選択する動作により選択された前記1つの識別器によっては正しく識別されない各データの重みが該データの現在の重みよりも高くなり、かつ/または該1つの識別器によって正しく識別される各データの重みが該データの現在の重みよりも低くなるように、前記第2のサンプルデータ群をなす各データの前記重みを更新するものであることを特徴とする請求項記載の装置。
  5. 前記特徴量特定手段が、2回目以降の前記選択する動作に先立って、前記第2のサンプルデータ群をなすデータの各々に割り当てられた更新された前記重みが、前記識別器作成手段が作成した各識別器に加味されるように、各識別器を更新するものであることを特徴とする請求項記載の装置。
  6. 前記特徴量特定手段が、2回目以降の前記選択する動作に先立って、直前の前記選択する動作により選択された前記1つの識別器を以降の選択対象から除外するものであることを特徴とする請求項からいずれか1項記載の装置。
  7. 前記特徴量特定手段の2回目以降の各動作に先立って、該特徴量特定手段の直前の動作により前記1つの特徴量群を構成する特徴量として規定された特徴量に対応するすべての識別器を、以降の選択対象から除外する手段をさらに備えていることを特徴とする請求項からいずれか1項記載の装置。
  8. 前記特徴量群規定手段が、
    前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなる第2のサンプルデータ群に基づいて、前記複数の特徴量の各々について、対応する識別器を作成する識別器作成手段と、
    前記識別器作成手段が作成した前記識別器を対応する特徴量に応じて複数のカテゴリーに分け、前記複数のカテゴリーごとに、前記第2のサンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する動作を、所定数の識別器もしくは識別精度が所定の基準を超えるすべての識別器が選択されるまで、または選択された識別器の正答率が所定の基準を超えるまで、繰返し行なうことにより選択された各識別器に対応する特徴量を、1つの特徴量群を構成する特徴量として特定する特徴量特定手段とを備えていることを特徴とする請求項1または2記載の装置。
  9. 前記第2のサンプルデータ群が、該第2のサンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、
    前記特徴量特定手段が、
    各選択する動作ごとに、前記重みを加味した前記識別精度が最も高い前記1つの識別器を選択し、
    前記複数のカテゴリーごとの2回目以降の前記選択する動作に先立って、直前の前記選択する動作により選択された前記1つの識別器によっては正しく識別されない各データの重みが該データの現在の重みよりも高くなり、かつ/または該1つの識別器によって正しく識別される各データの重みが該データの現在の重みよりも低くなるように、前記第2のサンプルデータ群をなす各データの前記重みを更新するものであることを特徴とする請求項記載の装置。
  10. 前記特徴量特定手段が、前記複数のカテゴリーごとの2回目以降の前記選択する動作に先立って、前記第2のサンプルデータ群をなすデータの各々に割り当てられた更新された前記重みが、該カテゴリーをなす各識別器に加味されるように、該カテゴリーをなす各識別器を更新するものであることを特徴とする請求項記載の装置。
  11. 前記特徴量特定手段が、前記複数のカテゴリーごとの2回目以降の前記選択する動作に先立って、直前の前記選択する動作により選択された前記1つの識別器を以降の選択対象から除外するものであることを特徴とする請求項から10いずれか1項記載の装置。
  12. 前記複数の識別器群をなす識別器の各々が、前記第1のサンプルデータ群をなすデータのうち、前記特定内容のデータであることが分かっている前記複数のデータが示す該識別器に対応する特徴量の値のヒストグラムの各頻度値と、前記特定内容のデータでないことが分かっている前記複数のデータが示す該識別器に対応する特徴量の値のヒストグラムの各頻度値との、比または差分を表したヒストグラムであることを特徴とする請求項1から11いずれか1項記載の装置。
  13. 前記対象データおよび前記第1のサンプルデータ群をなす各データが画像データであり、
    前記特定内容が、該対象データが示し得る特定シーンであることを特徴とする請求項1から12いずれか1項記載の装置。
  14. 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、
    前記識別処理に用いられ得る複数の特徴量から、各々少なくとも1つの特徴量からなる複数の特徴量群を規定する特徴量群規定手段、
    前記複数の特徴量群に対応する複数の識別器群であって、該複数の識別器群それぞれを構成する各識別器が、前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて前記識別条件が定められたものであるとともに、前記サンプルデータ群に基づいて該識別器群それぞれの正答率が所定の基準を超えるように作成されたものである、複数の識別器群を規定する識別器群規定手段、
    前記サンプルデータ群をなすデータの全部または一部に対する正答率が最も高い1つの識別器群を選択する識別器群選択手段、
    所定数の識別器群もしくは正答率が所定の基準を超えるすべての識別器群が選択されるまで、または選択された識別器群を組み合わせて得られる正答率が所定の基準を超えるまで、前記識別器群選択手段を繰返し動作させる手段、および
    前記識別器群選択手段により選択されたすべての前記識別器群に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段として機能させるものであり、
    前記サンプルデータ群が、該サンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、
    前記識別器群選択手段が、各動作ごとに、前記重みを加味した前記正答率が最も高い前記1つの識別器群を選択するものであり、
    前記識別器群選択手段の2回目以降の各動作に先立って、直前の該識別器群選択手段の動作により選択された前記1つの識別器群によっては正しく識別されない各データの重みが該データの現在の重みよりも高くなり、かつ/または該1つの識別器群によって正しく識別される各データの重みが該データの現在の重みよりも低くなるように、前記サンプルデータ群をなす各データの前記重みを更新する重み更新手段と、
    前記識別器群選択手段の2回目以降の各動作に先立って、該識別器群選択手段の直前の動作により選択された前記1つの識別器群を以降の選択対象から除外する手段をさらに機能させることを特徴とするプログラム。
  15. 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、
    前記識別処理に用いられ得る複数の特徴量から、各々少なくとも1つの特徴量からなる複数の特徴量群を規定する特徴量群規定手段、
    前記複数の特徴量群に対応する複数の識別器群であって、該複数の識別器群それぞれを構成する各識別器が、前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて前記識別条件が定められたものであるとともに、前記サンプルデータ群に基づいて該識別器群それぞれの正答率が所定の基準を超えるように作成されたものである、複数の識別器群を規定する識別器群規定手段、
    前記サンプルデータ群をなすデータの全部または一部に対する正答率が最も高い1つの識別器群を選択する識別器群選択手段、
    所定数の識別器群もしくは正答率が所定の基準を超えるすべての識別器群が選択されるまで、または選択された識別器群を組み合わせて得られる正答率が所定の基準を超えるまで、前記識別器群選択手段を繰返し動作させる手段、および
    前記識別器群選択手段により選択されたすべての前記識別器群に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段として機能させるものであり、
    前記サンプルデータ群が、該サンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、
    前記識別器群選択手段が、各動作ごとに、前記重みを加味した前記正答率が最も高い前記1つの識別器群を選択するものであり、
    前記識別器群選択手段の2回目以降の各動作に先立って、直前の該識別器群選択手段の動作により選択された前記1つの識別器群によっては正しく識別されない各データの重みが該データの現在の重みよりも高くなり、かつ/または該1つの識別器群によって正しく識別される各データの重みが該データの現在の重みよりも低くなるように、前記サンプルデータ群をなす各データの前記重みを更新する重み更新手段と、
    前記識別器群選択手段の2回目以降の各動作に先立って、該識別器群選択手段の直前の動作により選択された前記1つの識別器群を以降の選択対象から除外する手段をさらに機能させることを特徴とするプログラムを記録したコンピュータ読取可能な記録媒体。
  16. データの所望の特定内容の指定を受け付けるデータ内容指定受付手段と、
    選別対象である対象データの入力を受け付ける対象データ入力受付手段と、
    前記特定内容として指定され得る複数の内容ごとに、前記対象データが該内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、前記データ内容指定受付手段において指定された前記特定内容に基づいて参照して、前記対象データから、該特定内容のデータであるか否かの識別に用いる前記少なくとも1つの特徴量を導出する特徴量導出手段と、
    前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記対象データが前記データ内容指定受付手段において指定された前記特定内容のデータであるか否かを識別する識別手段とを備えてなり、
    前記参照データが、前記複数の内容の各々について、該内容のデータであることが分かっている複数のデータと、該内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群を、予め学習することにより決定されたものであって、前記複数の内容の各々についての前記学習が、
    前記識別手段による識別処理に用いられ得る複数の特徴量から、各々少なくとも1つの特徴量からなる複数の特徴量群を規定する工程と、
    前記複数の特徴量群に対応する複数の識別器群であって、該複数の識別器群それぞれを構成する各識別器が前記サンプルデータ群に基づいて前記識別条件が定められたものであるとともに、前記サンプルデータ群に基づいて該識別器群それぞれの正答率が所定の基準を超えるように作成されたものである、複数の識別器群を規定する工程と、
    前記サンプルデータ群をなすデータの全部または一部に対する正答率が最も高い1つの識別器群を選択する工程と、
    所定数の識別器群もしくは正答率が所定の基準を超えるすべての識別器群が選択されるまで、または選択された識別器群を組み合わせて得られる正答率が所定の基準を超えるまで、前記識別器群を選択する工程を繰り返す工程と、
    前記選択する工程において選択されたすべての識別器群に基づいて、現在の学習内容のデータであるか否かの識別に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する工程を含むものであり、
    前記サンプルデータ群が、該サンプルデータ群をなすデータの各々に重みが与えられた重み付きサンプルデータ群であり、
    前記選択する工程が、各動作ごとに、前記重みを加味した前記正答率が最も高い前記1つの識別器群を選択するものであり、
    前記選択する工程の2回目以降の各動作に先立って、直前の該選択する工程の動作により選択された前記1つの識別器群によっては正しく識別されない各データの重みが該データの現在の重みよりも高くなり、かつ/または該1つの識別器群によって正しく識別される各データの重みが該データの現在の重みよりも低くなるように、前記サンプルデータ群をなす各データの前記重みを更新する工程と、
    前記選択する工程の2回目以降の各動作に先立って、該選択する工程の直前の動作により選択された前記1つの識別器群を以降の選択対象から除外する工程をさらに含む方法によるものであることを特徴とする、特定内容のデータを選別する装置。
  17. 前記識別手段により正しい識別結果が得られなかった対象データについて、該対象データが示す正しい内容の指定を受け付ける正解受付手段と、
    前記正しい内容の指定が受け付けられた前記対象データを学習することにより、前記参照データを更新する追加学習手段とをさらに備えていることを特徴とする請求項1記載の特定内容のデータを選別する装置。
  18. 前記対象データおよび前記サンプルデータ群をなす各データが画像データであり、
    前記特定内容が、前記対象データが示し得る特定シーンであることを特徴とする請求項1または1記載の特定内容のデータを選別する装置。
JP2003346924A 2003-10-06 2003-10-06 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 Expired - Fee Related JP4397667B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003346924A JP4397667B2 (ja) 2003-10-06 2003-10-06 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003346924A JP4397667B2 (ja) 2003-10-06 2003-10-06 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置

Publications (2)

Publication Number Publication Date
JP2005115525A JP2005115525A (ja) 2005-04-28
JP4397667B2 true JP4397667B2 (ja) 2010-01-13

Family

ID=34539686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003346924A Expired - Fee Related JP4397667B2 (ja) 2003-10-06 2003-10-06 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置

Country Status (1)

Country Link
JP (1) JP4397667B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7729533B2 (en) * 2006-09-12 2010-06-01 Boston Scientific Scimed, Inc. Systems and methods for producing classifiers with individuality
CN101315670B (zh) 2007-06-01 2010-08-11 清华大学 特定被摄体检测装置及其学习装置和学习方法
JP2010055194A (ja) * 2008-08-26 2010-03-11 Sony Corp 画像処理装置および方法、学習装置および方法、並びにプログラム
JP5414416B2 (ja) 2008-09-24 2014-02-12 キヤノン株式会社 情報処理装置及び方法
JP2014021901A (ja) * 2012-07-23 2014-02-03 Casio Comput Co Ltd 被写体検出装置、被写体検出方法及びプログラム
JP6160196B2 (ja) 2013-04-15 2017-07-12 オムロン株式会社 識別器更新装置、識別器更新プログラム、情報処理装置、および識別器更新方法
JP2018032071A (ja) 2016-08-22 2018-03-01 株式会社クレスコ 検証装置、検証方法及び検証プログラム
JP2018045673A (ja) * 2016-09-09 2018-03-22 株式会社Screenホールディングス 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP2018112839A (ja) 2017-01-10 2018-07-19 富士通株式会社 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法
JP7040624B2 (ja) * 2018-03-05 2022-03-23 オムロン株式会社 画像データの特徴データを判別する方法、装置、システム及びプログラム、並びに記憶媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3265701B2 (ja) * 1993-04-20 2002-03-18 富士通株式会社 多判定器によるパターン認識装置
JP3659914B2 (ja) * 2000-10-31 2005-06-15 松下電器産業株式会社 物体認識装置、物体を認識する方法、プログラムおよび記録媒体
EP1231565A1 (en) * 2001-02-09 2002-08-14 GRETAG IMAGING Trading AG Image colour correction based on image pattern recognition, the image pattern including a reference colour

Also Published As

Publication number Publication date
JP2005115525A (ja) 2005-04-28

Similar Documents

Publication Publication Date Title
JP4611069B2 (ja) 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
US6983068B2 (en) Picture/graphics classification system and method
JP4606828B2 (ja) 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
US7171042B2 (en) System and method for classification of images and videos
CN110298297B (zh) 火焰识别方法和装置
EP1873687A2 (en) Parameter learning method, parameter learning apparatus, pattern classification method, and pattern classification apparatus
JPH0573687A (ja) 自動分類方法
JP4588575B2 (ja) デジタル画像の複数対象物検出方法および装置並びにプログラム
JP2015087903A (ja) 情報処理装置及び情報処理方法
US6947597B2 (en) Soft picture/graphics classification system and method
JP4397667B2 (ja) 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP2003153007A (ja) 画像重要度に基づく画像圧縮制御システム及び方法
JP2007047965A (ja) デジタル画像の対象物検出方法および装置並びにプログラム
JPH1153525A (ja) 顔器官検出装置及び媒体
US7680357B2 (en) Method and apparatus for detecting positions of center points of circular patterns
JP2005100121A (ja) 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP2005100122A (ja) 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
CN108647696A (zh) 图片颜值确定方法及装置、电子设备、存储介质
CN111340124A (zh) 图像中实体类别的识别方法和装置
CN111814917B (zh) 一种存在模糊态的字轮图像数字识别方法
US20080247647A1 (en) Systems and methods for segmenting an image based on perceptual information
JP2020160543A (ja) 情報処理システムおよび情報処理方法
CN116095363B (zh) 基于关键行为识别的移动端短视频高光时刻剪辑方法
CN112258592A (zh) 一种人脸可见光图的生成方法及相关装置
JP2004192555A (ja) 情報管理方法、情報管理装置及び情報管理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060508

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090918

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091020

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091021

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees