JP2005100121A - 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 - Google Patents
識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 Download PDFInfo
- Publication number
- JP2005100121A JP2005100121A JP2003333412A JP2003333412A JP2005100121A JP 2005100121 A JP2005100121 A JP 2005100121A JP 2003333412 A JP2003333412 A JP 2003333412A JP 2003333412 A JP2003333412 A JP 2003333412A JP 2005100121 A JP2005100121 A JP 2005100121A
- Authority
- JP
- Japan
- Prior art keywords
- data
- identification
- discriminator
- classifier
- feature quantity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】 対象データが特定内容のデータであるか否かを識別する識別処理に用いる特徴量の種類と識別条件を、識別処理における識別精度と計算量の負担との所望のバランスに応じて決定する。
【解決手段】 特徴量の種類と識別条件を決定する装置10の識別器作成部16が、サンプルデータ群に基づいて、識別処理に用いられ得る複数の特徴量の各々について、対応する識別器を作成する。作成された識別器の各々について、識別精度特定部18と計算量特定部20が識別精度指標値と計算量指標値をそれぞれ特定する。識別器選択部22が、それらの指標値に基づいて総合評価値を導出し、良好な識別器を選択する。選択された識別器に基づいて、識別条件決定部24が、識別処理に用いる特徴量の種類と識別条件を決定する。
【選択図】 図1
【解決手段】 特徴量の種類と識別条件を決定する装置10の識別器作成部16が、サンプルデータ群に基づいて、識別処理に用いられ得る複数の特徴量の各々について、対応する識別器を作成する。作成された識別器の各々について、識別精度特定部18と計算量特定部20が識別精度指標値と計算量指標値をそれぞれ特定する。識別器選択部22が、それらの指標値に基づいて総合評価値を導出し、良好な識別器を選択する。選択された識別器に基づいて、識別条件決定部24が、識別処理に用いる特徴量の種類と識別条件を決定する。
【選択図】 図1
Description
本発明は、画像データ等の対象データが特定内容のデータであるか否かを識別する識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置に関するものである。
近年、画像データ等の対象データが特定内容のデータであるか否かを識別する識別処理に用いる基準を決定するために、サンプルデータ群を学習する種々の手法が提案されている。
たとえば、特許文献1には、人物の顔部分を含む画像と含まない画像とを識別する識別処理に用いるために、顔部分を含むことが分かっている複数のサンプル画像と顔部分を含まないことが分かっている複数のサンプル画像の各々から、輝度値等の決められた種類の特徴量を成分とする特徴ベクトルその他のパラメータを導出し記録しておく手法が記載されている。識別処理においては、すべてのサンプル画像についての上記のパラメータと対象画像から導出された特徴ベクトルの各成分とを変数とする評価関数を用いて、その評価関数値の正負に基づいて、対象画像が顔部分を含む画像であるか否かが識別される。
また、特許文献2には、放射線画像から濃度勾配の集中度等に基づいて抽出した候補領域の陰影が、悪性腫瘤等の陰影であるか否かを識別する識別処理に用いるために、悪性であることが分かっている陰影の複数のサンプル画像と悪性でないことが分かっている陰影の複数のサンプル画像の各々から、濃度ヒストグラムに基づく特徴量等の決められた種類の複数の特徴量を抽出して、ニューラルネットワーク等を用いた学習を行なう手法が記載されている。
さらに、非特許文献1等には、一般に用いられる機械的学習手法として、ブースティングと呼ばれる手法およびその変形であるエイダブースト(Adaboost)と呼ばれる手法が記載されている。たとえば、2つの特徴量x1およびx2に対応する軸を有する特徴量平面上に分布するデータ点を、ある特定内容のデータを示すデータ点とそうでないデータ点との2つに分類するための学習について説明すると、ブースティングは、上記の特定内容のデータを示すことが分かっている複数のデータ点とそうでないことが分かっている複数のデータ点からなるサンプルデータ点群の中から、データ点の第1の組を選択し、それら第1の組のデータ点を最も良好に分類する特徴量平面上の第1の直線または比較的単純な曲線を特定し、次にその第1の直線または曲線では良好に分類できないデータ点の第2の組を選択し、それら第2の組のデータ点を最も良好に分類する第2の直線または曲線を特定し、・・・という処理を繰り返して学習を行なうものである。最後に、一連の処理で特定された複数の直線または曲線を総合して、多数決の手法等により、特徴量平面を分割する最適な線が決定される。一方、エイダブーストは、上記と同様のサンプルデータ点群をなす各データ点に重みを割り当て、すべてのデータ点を用いてそれらを最も良好に分類する特徴量平面上の第1の直線または曲線を特定し、その第1の直線または曲線では正しく分類できなかったデータ点の重みを高くし、次に各データ点の重みを加味してデータ点を最も良好に分類する第2の直線または曲線を特定し、・・・という処理を繰り返して学習を行なうものである。
特開2003−44853号公報
特開2002−74325号公報
Richard O. Duda, Peter E. Hart, David G. Stork著、江尻公一訳、「パターン識 別」、株式会社新技術コミュニケーションズ、2001年、p.484−488
しかしながら、1つまたは複数の特徴量を指標として対象データが特定内容のデータであるか否かを識別する識別処理を行なう場合、高い識別精度を実現する有用な特徴量の種類は、特定内容によって異なる。たとえば、画像データが特定シーンの画像のデータであるか否かを識別する識別処理の場合、特定シーンが全体的に暗い「夜景」のシーンであれば、輝度や明度に関する特徴量が最も有用な指標となるかもしれないが、特定シーンが「水中」のシーンであれば、輝度や明度よりも青色の濃度に関する特徴量等の方が有用であるかもしれない。ここで、特定内容ごとの識別に用いる特徴量の種類を、熟練した技術者が学習に先立って経験的に決定し、それらの決められた特徴量に関して学習を行なってもよいが、実際にどの特徴量が最も有用な指標であるかを経験的に判断することは難しく、特に複数の特徴量を組み合わせて使用する場合には、どの特徴量を用いると組合せの効果が高いかを経験的に決定することは困難である。
さらに、選択される特徴量は、上記のとおり所望の特定内容に対して高い識別精度を実現するものであることが好ましいが、識別処理の実行環境の計算能力や所望の処理速度によっては、識別精度を多少犠牲にしても、識別処理において対象データから導出するのに要する計算量が少ない特徴量を選択した方がよい場合もある。特に、対象データが情報量の多い画像データ等である場合には、計算量の負担の問題は軽視できない。上記の特定内容ごとの識別精度に加えて、このような計算量の負担まで考慮して最適な特徴量を選択するとなると、技術者が経験的に行なうのは極めて困難である。しかも、識別精度と計算量との所望のバランスは、識別処理の目的や実行環境に応じてその都度異なるため、それらの目的や実行環境が変わるごとに、人手によって使用する特徴量の種類および対応する識別条件を検討し変更していたのでは、多大な労力と時間がかかることとなってしまう。
本発明は、上記事情に鑑み、識別処理に用いる識別条件を決定するための学習において、使用する特徴量の種類をも併せて自動的に選択し、しかもそれらの特徴量の種類の選択を識別精度と計算量との所望のバランスに応じて行なう装置、プログラムおよびプログラムを記録した記録媒体を提供することを目的とするものである。さらに、本発明は、識別精度と計算量との所望のバランスに応じて決定された参照データを用いて、特定内容のデータを選別する装置を提供することも目的とするものである。
すなわち、本発明に係る第1の識別処理に用いる特徴量の種類と識別条件を決定する装置は、対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、その少なくとも1つの特徴量の各々に対応する識別条件とを決定する装置であって、特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて、上記の識別処理に用いられ得る複数の特徴量の各々について、対応する識別器を作成する識別器作成手段と、それらの識別器の各々について、上記のサンプルデータ群をなすデータの全部または一部に対するその識別器による識別精度を表す指標値を特定する識別精度特定手段と、上記の識別器の各々について、その識別器に対応する特徴量を上記の対象データから導出するのに要する計算量を表す指標値を特定する計算量特定手段と、上記の識別器の各々について、上記の識別精度を表す指標値と上記の計算量を表す指標値から総合評価値を導出し、最も良好な総合評価値が導出された識別器から順に、少なくとも1つの識別器を選択する識別器選択手段と、識別器選択手段により選択された上記の少なくとも1つの識別器に基づいて、上記の識別処理に用いる少なくとも1つの特徴量の種類と識別条件とを決定する決定手段とを備えていることを特徴とするものである。
ここで、本発明において「対象データ」とは、特定内容のデータであるか否かを識別する識別処理の対象となるものであればいかなるデータであってもよく、例としては、以下に述べる画像データのほか、特定人物の声であるか否か等の識別処理の対象となる音声データ等が挙げられる。また、対象データが画像データである場合、その画像データは1枚の画像全体に関するデータであっても、1枚の画像に含まれる一部の領域についてのデータであってもよい。したがって、以下に述べる特定シーンであるか否かを識別する処理のほか、たとえば、1枚の画像に含まれる1つの領域が、人物等のある特定の被写体に対応する領域であるか否かを識別する処理等も、上記の「識別処理」に含まれるものである。
また、本発明において「特徴量」とは、対象データの特徴を表すパラメータを指す。たとえば、対象データが画像データである場合には、その画像データが表す画像の色の特徴、輝度の特徴、テクスチャーの特徴、奥行情報、その画像に含まれるエッジの特徴その他の特徴を表すあらゆる指標値が、「特徴量」として使用され得る。また、これらの各特徴を表す指標値を複数組み合わせた重み付き加算値等を、「特徴量」として使用してもよい。
さらに、本発明において「識別条件」とは、1つの特徴量を指標とした、特定内容のデータとそうでないデータとを識別する条件を指す。
また、本発明において「識別器」とは、1つの特徴量を用いて特定内容のデータとそうでないデータとを識別する基準を提供するものであって、上記の「識別条件」を決定する基となるものを指す。
上記の本発明に係る第1の識別処理に用いる特徴量の種類と識別条件を決定する装置においては、上記の識別器選択手段は、上記の識別処理の実行環境の計算能力および/または上記の識別処理の所望の処理速度に応じて、上記の総合評価値を導出する際の識別精度を表す指標値と計算量を表す指標値の比重を変更するものであることが好ましい。
ここで、上記の「比重を変更する」とは、識別精度を表す指標値と計算量を表す指標値とのどちらを総合評価値により強く反映させるかの比重を変更することを指す。すなわち、実行環境の計算能力が低い場合および/または速い処理速度が望まれる場合には、計算量を少なくすることがより優先されるように比重が変更され、実行環境の計算能力が高い場合および/または処理速度が遅くてもよい場合には、識別精度を高くすることがより優先されるように比重が変更される。
一方、本発明に係る第2の識別処理に用いる特徴量の種類と識別条件を決定する装置は、対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、その少なくとも1つの特徴量の各々に対応する識別条件とを決定する装置であって、特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて作成された、上記の識別処理に用いられ得る複数の特徴量の各々に対応する識別器のうち、上記のサンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する識別器選択手段と、識別器選択手段により選択された識別器の正答率、または識別器選択手段により選択された識別器に対応する特徴量を上記の対象データから導出するのに要する計算量の合計が、所定の基準を超えたか否かを判定し、その正答率または計算量の合計が所定の基準を超えるまで、識別器選択手段を繰返し動作させる判定手段と、識別器選択手段により選択された識別器に基づいて、上記の識別処理に用いる少なくとも1つの特徴量の種類と識別条件とを決定する決定手段とを備えていることを特徴とするものである。
ここで、本発明において「正答率」とは、判定手段の1回目の動作においては選択された1つの識別器を使用して、2回目以降の繰返し動作においてはそれまでに選択された複数の識別器を組み合わせて使用して、各サンプルデータが特定内容のデータであるか否かを識別した結果が、実際に特定内容のデータであるか否かの答えと一致する率を指す。なお、正答率の評価には、サンプルデータ群をなすデータの全部を使用してもよいし、一部のみを使用してもよい。
また、上記には「繰返し動作させる判定手段」とあるが、識別器選択手段を1回動作させただけで正答率または計算量の合計が所定の基準を超えた場合には、繰返し動作は行なわれないこととなる。さらに、各繰返し動作において識別器の選択に使用されるデータがサンプルデータ群をなすデータの一部である場合には、使用する「データの一部」は、繰返し動作ごとに異なるものであってもよい。
上記の本発明に係る第2の識別処理に用いる特徴量の種類と識別条件を決定する装置においては、上記のサンプルデータ群が、そのサンプルデータ群をなすデータの各々に、初期値が等しい重みが与えられた重み付きサンプルデータ群であって、上記の識別器選択手段が、各動作ごとに、重みを加味した識別精度が最も高い1つの識別器を選択し、その1つの識別器によっては正しく識別されない各データの重みがそのデータの現在の重みよりも高くなり、かつ/またはその1つの識別器によって正しく識別される各データの重みがそのデータの現在の重みよりも低くなるように、サンプルデータ群をなす各データの重みを更新するものであってもよい。
上記のように、識別器選択手段が各動作ごとに「重みを加味した識別精度」が最も高い1つの識別器を選択する場合、たとえば、各サンプルデータの重みが等しいときには、単純に正しく識別されるサンプルデータの数が最も多い識別器が選択される。一方、各サンプルデータの重みが異なるときには、重みの低いサンプルデータよりも、重みの高いサンプルデータが正しく識別されることにより重点が置かれる。
また、上記の本発明に係る第1および第2の識別処理に用いる特徴量の種類と識別条件を決定する装置においては、各識別器は、上記の特定内容のデータであることが分かっている複数のデータが示すその識別器に対応する特徴量の値のヒストグラムの各頻度値と、上記の特定内容のデータでないことが分かっている複数のデータが示すその識別器に対応する特徴量の値のヒストグラムの各頻度値との、比または差分を表したヒストグラムであってもよい。
ここで、上記の「比または差分を表したヒストグラム」とは、頻度値の比または差分の値をそのまま表したヒストグラムであってもよいし、それらの対数値等を表したヒストグラムであってもよい。
さらに、上記の本発明に係る第1および第2の識別処理に用いる特徴量の種類と識別条件を決定する装置においては、上記の対象データおよび上記のサンプルデータ群をなす各データが画像データであり、上記の特定内容が、その対象データが示し得る特定シーンであってもよい。
本発明に係る第1のプログラムは、対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、それらの少なくとも1つの特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて、上記の識別処理に用いられ得る複数の特徴量の各々について、対応する識別器を作成する識別器作成手段、それらの識別器の各々について、上記のサンプルデータ群をなすデータの全部または一部に対するその識別器による識別精度を表す指標値を特定する識別精度特定手段、上記の識別器の各々について、その識別器に対応する特徴量を上記の対象データから導出するのに要する計算量を表す指標値を特定する計算量特定手段、上記の識別器の各々について、上記の識別精度を表す指標値と上記の計算量を表す指標値から総合評価値を導出し、最も良好な総合評価値が導出された識別器から順に、少なくとも1つの識別器を選択する識別器選択手段、および、識別器選択手段により選択された上記の少なくとも1つの識別器に基づいて、上記の識別処理に用いる少なくとも1つの特徴量の種類と識別条件とを決定する決定手段として機能させることを特徴とするものである。また、本発明に係る第1の記録媒体は、上記のようなプログラムを記録したコンピュータ読取可能な記録媒体である。
一方、本発明に係る第2のプログラムは、対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、それらの少なくとも1つの特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、特定内容のデータであることが分かっている複数のデータと、特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて作成された、上記の識別処理に用いられ得る複数の特徴量の各々に対応する識別器のうち、上記のサンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する識別器選択手段、識別器選択手段により選択された識別器の正答率、または識別器選択手段により選択された識別器に対応する特徴量を上記の対象データから導出するのに要する計算量の合計が、所定の基準を超えたか否かを判定し、その正答率または計算量の合計が所定の基準を超えるまで、上記の識別器選択手段を繰返し動作させる判定手段、および、識別器選択手段により選択された識別器に基づいて、上記の識別処理に用いる少なくとも1つの特徴量の種類と識別条件とを決定する決定手段として機能させることを特徴とするものである。また、本発明に係る第2の記録媒体は、上記のようなプログラムを記録したコンピュータ読取可能な記録媒体である。
また、本発明に係る第1の特定内容のデータを選別する装置は、データの所望の特定内容の指定を受け付けるデータ内容指定受付手段と、選別対象である対象データの入力を受け付ける対象データ入力受付手段と、特定内容として指定され得る複数の内容ごとに、対象データがその内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と、それらの少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、上記のデータ内容指定受付手段において指定された特定内容に基づいて参照して、上記の対象データから、特定内容のデータであるか否かの識別に用いる少なくとも1つの特徴量を導出する特徴量導出手段と、特徴量導出手段により導出された上記の少なくとも1つの特徴量の各々に基づいて、上記の参照データが規定する対応する識別条件を参照し、上記の対象データが上記のデータ内容指定受付手段において指定された特定内容のデータであるか否かを識別する識別手段とを備えてなり、上記の参照データが、上記の複数の内容の各々について、その内容のデータであることが分かっている複数のデータと、その内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群を、予め学習することにより決定されたものであって、上記の複数の内容の各々についての学習が、上記のサンプルデータ群に基づいて、上記の識別手段による識別に用いられ得る複数の特徴量の各々について、対応する識別器を作成する工程と、それらの識別器の各々について、上記のサンプルデータ群をなすデータの全部または一部に対するその識別器による識別精度を表す指標値を特定する工程と、上記の識別器の各々について、その識別器に対応する特徴量を上記の対象データから導出するのに要する計算量を表す指標値を特定する工程と、上記の識別器の各々について、上記の識別精度を表す指標値と上記の計算量を表す指標値から総合評価値を導出し、最も良好な総合評価値が導出された識別器から順に、少なくとも1つの識別器を選択する工程と、選択された上記の少なくとも1つの識別器に基づいて、現在の学習内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と識別条件とを決定する工程とを含む方法によるものであることを特徴とするものである。
一方、本発明に係る第2の特定内容のデータを選別する装置は、データの所望の特定内容の指定を受け付けるデータ内容指定受付手段と、選別対象である対象データの入力を受け付ける対象データ入力受付手段と、特定内容として指定され得る複数の内容ごとに、対象データがその内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と、それらの少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、上記のデータ内容指定受付手段において指定された特定内容に基づいて参照して、上記の対象データから、特定内容のデータであるか否かの識別に用いる少なくとも1つの特徴量を導出する特徴量導出手段と、特徴量導出手段により導出された上記の少なくとも1つの特徴量の各々に基づいて、上記の参照データが規定する対応する識別条件を参照し、上記の対象データが上記のデータ内容指定受付手段において指定された特定内容のデータであるか否かを識別する識別手段とを備えてなり、上記の参照データが、上記の複数の内容の各々について、その内容のデータであることが分かっている複数のデータと、その内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群を、予め学習することにより決定されたものであって、上記の複数の内容の各々についての学習が、上記のサンプルデータ群に基づいて作成された、上記の識別手段による識別に用いられ得る複数の特徴量の各々に対応する識別器のうち、上記のサンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する工程と、その選択する工程において選択された識別器の正答率、またはその選択する工程において選択された識別器に対応する特徴量を上記の対象データから導出するのに要する計算量の合計が、所定の基準を超えるまで、上記の選択する工程を繰り返す工程と、上記の選択する工程において選択された識別器に基づいて、現在の学習内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と識別条件とを決定する工程とを含む方法によるものであることを特徴とするものである。
ここで、上記の本発明に係る第1および第2の特定内容のデータを選別する装置は、上記の識別手段により正しい識別結果が得られなかった対象データについて、その対象データが示す正しい内容の指定を受け付ける正解受付手段と、上記の正しい内容の指定が受け付けられた対象データを学習することにより、上記の参照データを更新する追加学習手段とをさらに備えているものであってもよい。
また、上記の本発明に係る第1および第2の特定内容のデータを選別する装置においては、上記の対象データおよび上記のサンプルデータ群をなす各データが画像データであり、上記の特定内容が、上記の対象データが示し得る特定シーンであってもよい。
本発明に係る識別処理に用いる特徴量の種類と識別条件とを決定する装置、プログラム、およびプログラムを記録した記録媒体によれば、識別処理に用いる識別条件のみならず、その識別処理に適した特徴量の種類をも併せて自動的に選択することができ、しかも、それらの特徴量の種類の選択を、識別処理における識別精度と計算量の負担との所望のバランスに応じて行なうことができる。
さらに、識別精度を表す指標値と計算量を表す指標値から総合評価値を導出して特徴量の種類と識別条件とを決定する場合において、識別処理の実行環境の計算能力および/または識別処理の所望の処理速度に応じて、総合評価値を導出する際の識別精度を表す指標値と計算量を表す指標値の比重を変更できるようにすれば、識別処理において、計算能力および/または所望の処理速度に応じた識別精度と計算量の負担との最適なバランスを実現することができる。
また、特徴量の種類と識別条件の決定に用いるサンプルデータ群をなす各データに重みを与え、重みを順次更新しながら、重みを加味した識別精度を基準として識別器を選択し、選択された識別器の正答率と計算量の合計とを基準にして特徴量の種類と識別条件を決定する場合には、先に選択した識別器では正しく識別できなかったサンプルデータを重要視して、それらのサンプルデータを正しく識別できる追加の識別器が順次選択され、それらの識別器に基づいて識別処理に用いる特徴量の種類と識別条件が決定されるため、後の識別処理において、多様な対象データに対して精度が高く漏れの少ない識別を行なうことが可能となる。
また、本発明に係る特定内容のデータを選別する装置は、識別に使用する特徴量の種類および識別条件を特定内容ごとに規定した参照データを用いているため、装置を構成する各手段を動作させるアルゴリズム自体は所望の特定内容にかかわらず共通のものとすることができ、装置の開発コストを低く抑えながら、各特定内容に合った対象データの選別を行なうことができる。しかも、使用する参照データは、識別精度と特徴量導出手段が行なう計算処理の計算量の負担とのバランスを考慮した学習手法により決定されたものであるため、装置の計算能力および/または所望の処理速度の範囲内で、最大限の高精度の識別による対象データの選別を行なうことができる。さらに、複雑な識別アルゴリズムの変更、追加および実装等の作業を要することなく、参照データを改変するだけで、識別基準の変更や、識別可能な特定内容の追加を、簡単に行なうことができる。
さらに、正しい識別結果が得られなかった対象データについて正しい内容の指定を受け付けて、それらの対象データの追加学習による参照データの更新を行なうことを可能とした場合には、実際の対象データに合わせて継続的に選別の精度を向上させていくことができる。また、ユーザーが頻繁に指定する特定内容に関しては、参照データの内容が特に充実していくため、より高い識別精度を実現することができる。
上記の本発明の効果は、識別の対象データが情報量の多い画像データ等であり、計算量の負担の問題が軽視できない場合において、特に有効なものである。
以下、図面により、本発明の例示的な実施形態を詳細に説明する。
まず、図1から図4を用いて、本発明の第1の実施形態を説明する。図1は、本発明の第1の実施形態に係る、画像データが特定シーンのデータであるか否かを識別する識別処理に用いる特徴量の種類と識別条件とを決定するための、装置10の構成を示したブロック図である。装置10は、特定シーンの画像データであることが分かっている複数のサンプル画像データと、特定シーンの画像でないことが分かっている複数のサンプル画像データからなるサンプル画像データ群を学習することによって、識別処理に用いる特徴量の種類と、各特徴量に対応する識別条件とを決定するものであり、サンプル画像データの入力を順次受け付けるサンプル入力受付部12と、入力されたサンプル画像データを格納するサンプル用メモリ14とを備えている。装置10はさらに、サンプル用メモリ14に格納されたサンプル画像データから複数の識別器を作成する識別器作成部16、識別器作成部16が作成した識別器の各々について識別精度を表す指標値を特定する識別精度特定部18、識別器作成部16が作成した識別器の各々について対応する特徴量の導出に必要な計算量を表す指標値を特定する計算量特定部20、識別精度特定部18および計算量特定部20からの入力に基づいて良好な識別器を選択する識別器選択部22、および識別器選択部22が選択した識別器に基づいて識別処理に使用する特徴量の種類と識別条件とを決定する識別条件決定部24とを備えている。
以下、図2のフローチャートを参照しながら、特定シーンが「水中」のシーンである場合を例にとって、図1の装置10が行なう処理の詳細な工程について説明する。
まず、ステップ30において、サンプル入力受付部12が、「水中」のシーンの画像データであることが分かっている複数のサンプル画像データと、「水中」のシーンの画像データでないことが分かっている複数のサンプル画像データの入力を順次受け付ける。本実施形態では、各サンプル画像データは、そのサンプル画像をなす各画素ごとに濃度R、GおよびBの値を示したデータであるとする。入力された各サンプル画像データは、「水中」のシーンであるか否かのラベルが付けられた状態で、サンプル用メモリ14に格納される。
次に、ステップ32において、識別器作成部16が、識別処理に使用され得る複数の特徴量について、「識別器」を作成する。ここでの「識別器」は、1つの特徴量を用いて「水中」のシーンの画像データとそうでない画像データとを識別する基準を提供するものである。本実施形態では、図3に導出方法を図示した各特徴量についてのヒストグラムを「識別器」として使用する。図3を参照しながら説明すると、識別器作成部16は、まず、「水中」のシーンの画像データであることが分かっている複数のサンプル画像データの各々から、ある特徴量(たとえばそのサンプル画像における濃度Bの平均値)を1つずつ導出し、その値の分布を示すヒストグラムを作成する。同様に、「水中」のシーンの画像データでないことが分かっている複数のサンプル画像データからも、ヒストグラムを作成する。その後、これらの2つのヒストグラムが示す頻度値の比の対数値を取って、図3の一番右側に示す、識別器として用いられるヒストグラムを作成する。このヒストグラムが示す各縦軸の値を、以下、「識別ポイント」と呼ぶことにする。このヒストグラム形式の識別器によれば、正の識別ポイントに対応する特徴量の値を示す画像は「水中」のシーンの画像である可能性が高く、識別ポイントの絶対値が大きいほどその可能性は高まると言える。逆に、負の識別ポイントに対応する特徴量の値を示す画像は「水中」のシーンの画像でない可能性が高く、やはり識別ポイントの絶対値が大きいほどその可能性は高まる。したがって、この識別器は、「水中」のシーンの画像データとそうでない画像データとを識別する基準を提供するものである。ステップ32において、識別器作成部16は、識別に使用され得る複数の特徴量、たとえば、濃度R、GならびにB、輝度Y、色差CrならびにCb、彩度および色相のそれぞれについての平均値、いくつかのn%点、およびいくつかの(m%点)−(n%点)のすべてについて、上記のヒストグラム形式の識別器を作成する。なお、「平均値」とは、1つのサンプル画像の全体に亘るある特性値(各色の濃度等)の平均値を、「n%点」(0<n<100)とは、1つのサンプル画像またはその縮小画像の各画素におけるある特性値を累積ヒストグラムで表した場合に、全画素数のn%の計数値に対応する特性値を、「(m%点)−(n%点)」(0<m,n<100)とは、m%点とn%点の差分値を指すものである。ただし、作成する識別器に対応する特徴量の種類は、これらに限られずいかなるものであってもよく、たとえば、各特性値の最大値や最小値を用いてもよいし、エッジ強度、テクスチャー、奥行情報に関する特徴量等を用いてもよい。また、異なる複数の特性値を組み合わせた重み付き加算値等を、特徴量として用いてもよい。
続いて、ステップ34において、識別精度特定部18が、各識別器について、その識別器の識別精度を表す指標値(以下、単に「識別精度指標値」と呼ぶ)を特定する。本実施形態では、識別精度指標値18は、全サンプル画像データに対する各識別器の誤識別率、すなわち、実際には「水中」のシーンであるのにその識別器を用いると「水中」のシーンでないものとして識別されてしまうサンプル画像データの数と、実際には「水中」のシーンでないのにその識別器を用いると「水中」のシーンであるものとして識別されてしまうサンプル画像データの数との、全サンプル画像データ数に対する割合を、識別精度指標値として算出するものとする。したがって、ここでは識別精度指標値が小さいほど、誤識別率が低く「水中」のシーンを識別するのに好ましい識別器ということになる。
一方、ステップ34と並行して行なわれるステップ36では、計算量特定部20が、各識別器について、その識別器に対応する特徴量を、後の識別処理の対象となる画像データから導出するのに要する計算量を表す指標値(以下、単に「計算量指標値」と呼ぶ)を特定する。本実施形態では、後の識別処理の対象となる画像データが対象画像の各画素ごとに濃度R、GおよびBの値を示したデータであるとし、そのようなデータから各識別器に対応する特徴量を導出するのに必要な計算回数を、計算量指標値として使用することとする。したがって、ここでは計算量指標値が小さいほど、識別処理に使用した際の計算量の負担が少なく、好ましい識別器ということになる。
次に、ステップ38において、識別器選択部22が、識別精度特定部18から各識別器と対応付けられた識別精度指標値を、計算量特定部20から各識別器と対応付けられた計算量指標値を入力として受け取り、各識別器について、総合評価値を導出する。本実施形態では、係数aおよびbを用いて、
(総合評価値)=a×(識別精度指標値)+b×(計算量指標値)
によって総合評価値を導出するものとする。係数aおよびbとしては、常に固定された値を用いてもよいが、後に行なう識別処理の実行環境の計算能力および/または識別処理の所望の処理速度に応じて、係数aおよびbを変更できるように識別器選択部22が構成されていることが好ましい。
(総合評価値)=a×(識別精度指標値)+b×(計算量指標値)
によって総合評価値を導出するものとする。係数aおよびbとしては、常に固定された値を用いてもよいが、後に行なう識別処理の実行環境の計算能力および/または識別処理の所望の処理速度に応じて、係数aおよびbを変更できるように識別器選択部22が構成されていることが好ましい。
続いて、ステップ40において、識別器選択部22が、ステップ38で導出した総合評価値が所定の閾値以下であるすべての識別器を、識別精度と計算量の負担のバランスを考慮した良好な識別器として選択する。
最後に、ステップ42において、識別条件決定部24が、識別器選択部22が選択した識別器に基づいて、識別処理に使用する特徴量の種類と識別条件とを決定する。決定される特徴量の種類は、識別器選択部22が選択した各識別器に対応する特徴量の種類である。また、各特徴量の種類に対応する識別条件は、本実施形態では、各特徴量に対応する識別器のヒストグラム(図3の一番右側のヒストグラム参照)が示す識別ポイントを、小さい特徴量の値に対応するものから順番に列記した、正負の値をとる数列形式のものとする。
以上、特定シーンが「水中」のシーンである場合を例にとって、図1の装置10が行なう処理の詳細な工程について説明した。さらに「夕焼け」や「夜景」等の他の特定シーンについても同様の処理による学習を行なうと、様々な特定シーンについて、図4に示すような、対象画像の画像データが特定シーンの画像データである否かの識別処理に用いる適当な特徴量の種類と、識別条件との対応表を導出することができる。
なお、識別精度指標値は、上記の誤識別率に限られずいかなるものであってもよく、たとえば適当な評価関数による評価値等であってもよい。あるいは、図3に示す比の対数を取る前の2つのヒストグラムの分布領域が明確に分かれており識別ポイントの絶対値の総和が大きい識別器ほど、「水中」のシーンの画像の識別に適していると言えるので、この絶対値の総和等を識別精度指標値としてもよい。さらに、上記の第1の実施形態では、識別精度特定部18は、全サンプル画像データに対する各識別器の識別精度を調べて識別精度指標値を特定するものとしたが、計算の負担を軽減するため、全サンプル画像データの中から無作為に選んだ一部のサンプル画像データに対する識別精度のみを調べるものとしてもよい。
また、計算量指標値も、上記の計算回数に限られずいかなるものであってもよく、たとえば、識別処理の対象となる画像データから特徴量を導出するアルゴリズムにおける反復処理の繰返し回数等を示す値を用いてもよい。
さらに、上記の第1の実施形態では、識別器選択部22は、総合評価値が所定の閾値以下である識別器を選択するものとしたが、これに限られず、たとえば総合評価値が小さいものから順に一定数の識別器を選択するもの等であってもよい。あるいは、識別器選択部22は、総合評価値が小さいものから順に識別器を1つずつ選択していき、選択された識別器の正答率が閾値を超えるか、選択された識別器に対応する特徴量を対象データから導出するのに要する計算量の合計が閾値を超えるまで、選択を繰り返すもの等であってもよい。
また、上記の第1の実施形態では、各サンプル画像データは、そのサンプル画像をなす各画素ごとに濃度R、GおよびBの値を示したデータとしたが、これに限られず、そのサンプル画像から導出した特徴量群等であってもよい。その場合、識別器作成部16は、特徴量の計算は行なわずに各特徴量から直接に識別器を作成することとなる。
さらに、上記の第1の実施形態ではヒストグラム形式の識別器を作成するものとしたが、ここでの識別器は、1つの特徴量を用いて特定シーンの画像データとそうでない画像データとを識別する基準を提供するものであればいかなるものであってもよく、たとえば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図3の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
上記の第1の実施形態に係る装置10によれば、識別処理に用いる識別条件のみならず、その識別処理に適した特徴量の種類をも、併せて自動的に選択することができる。しかも、上記の装置10は、各識別器の識別精度と対応する特徴量の計算量の負担とを併せて評価する総合指標値に基づいて識別器を選択して、それらの識別器に基づいて識別処理に用いる特徴量の種類および識別条件を決定するものであるので、装置10が決定した特徴量の種類および識別条件を用いれば、識別精度と計算量の負担とのバランスが極めてよい識別処理を行なうことができる。さらに、総合評価値の導出に用いる係数aおよびbを、後に行なう識別処理の実行環境の計算能力および/または識別処理の所望の処理速度に応じて変更できるものとすれば、識別処理において、計算能力および/または所望の処理速度に応じた識別精度と計算量の負担との最適なバランスを実現することができる。
以上、本発明の第1の実施形態に係る装置10について説明したが、コンピュータを、上記の識別器作成部16、識別精度特定部18、計算量特定部20、識別器選択部22および識別条件決定部24に対応する手段として機能させ、図2に示すような処理を行なわせるプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。
次に、図5および図6を用いて、本発明の第2の実施形態を説明する。図5は、本発明の第2の実施形態に係る、画像データが特定シーンのデータであるか否かを識別する識別処理に用いる特徴量の種類と識別条件とを決定するための、装置50の構成を示したブロック図である。装置50は、上記の第1の実施形態に係る装置10と同様に、特定シーンの画像データであることが分かっている複数のサンプル画像データと、特定シーンの画像データでないことが分かっている複数のサンプル画像データからなるサンプル画像データ群を学習することによって、識別処理に用いる特徴量の種類と、各特徴量に対応する識別条件とを決定するものであり、サンプル入力受付部52と、サンプル用メモリ54とを備えている。装置50はさらに、サンプル用メモリ54に格納されたサンプル画像データから複数の識別器を作成する識別器作成部56、識別精度を基準として良好な識別器を選択する識別器選択部58、選択した識別器の正答率および対応する特徴量の導出に必要な計算量の合計を基準としてさらに追加の識別器を選択するか否かを判定する判定部60、各特徴量の導出に必要な計算量に関するデータを格納した計算量データ用メモリ62、および選択された識別器に基づいて識別処理に使用する特徴量の種類と識別条件とを決定する識別条件決定部64とを備えている。
以下、図6のフローチャートを参照しながら、特定シーンが「水中」のシーンである場合を例にとって、図5の装置50が行なう処理の詳細な工程について説明する。
まず、ステップ70において、サンプル入力受付部52が、「水中」のシーンの画像データであることが分かっている複数のサンプル画像データと、「水中」のシーンの画像データでないことが分かっている複数のサンプル画像データの入力を順次受け付ける。本実施形態では、各サンプル画像データは、上記の第1の実施形態と同様に、そのサンプル画像をなす各画素ごとに濃度R、GおよびBの値を示したデータであるとする。
次に、ステップ72において、サンプル入力受付部52が、各サンプル画像データに等しい重みを初期値として割り当て、各サンプル画像データを、「水中」のシーンであるか否かのラベルおよび重みが付けられた状態で、サンプル用メモリ54に格納する。
続いて、ステップ74において、識別器作成部56が、サンプル用メモリ54中のサンプル画像データを用いて、識別処理に使用され得る複数の特徴量について「識別器」を作成する。本実施形態では、上記の第1の実施形態と同様のヒストグラム形式の識別器を作成するものとする。
次に、ステップ76において、識別器選択部58が、識別器作成部56が作成した識別器の中から、各サンプル画像データの重みを加味した識別精度が最も高い1つの識別器を選択する。ここでは、全サンプル画像データを使用して、重みを加味した識別精度を評価する。すなわち、最初のステップ76では、各サンプル画像データの重みは等しいので、単純に、その識別器によって「水中」のシーンであるか否かが正しく識別されるサンプル画像データの数が最も多い識別器が選択される。一方、後述するステップ84において各サンプル画像データの重みが更新された後の2回目以降のステップ76では、たとえばあるサンプル画像データAの重みが別のサンプル画像データBの重みの2倍であるとすると、サンプル画像データAは、識別精度の評価において、サンプル画像データBの2つ分相当として数えられる。これにより、2回目以降のステップ76では、重みの低いサンプル画像データよりも、重みの高いサンプル画像データが正しく識別されることにより重点を置いて、識別器が選択される。
続いて、ステップ78において、判別部60が、それまでに選択された識別器の正答率、すなわち、それまでに選択された識別器を使用して各サンプル画像が「水中」のシーンの画像であるか否かを識別した結果が実際に「水中」のシーンの画像であるか否かの答えと一致する率が、所定の閾値を超えたか否かを確かめる。ここで、正答率の評価に用いられるのは、現在の重みが付けられたサンプル画像データでも、重みが等しくされたサンプル画像データでもよい。正答率が所定の閾値を超えている場合は、それまでに選択された識別器を用いれば「水中」のシーンの画像であるか否かを十分に高い識別精度で識別できることを意味する。
ステップ78において正答率がまだ閾値を超えていないと確認された場合は、図6の処理はステップ80へと進む。ステップ80では、判別部60は、それまでに選択された識別器に対応する特徴量を後の識別処理の対象となる画像データから導出するのに要する計算量の合計が、所定の閾値を超えたか否かを確認する。各特徴量と、その特徴量を識別処理の対象となる画像データから導出するのに必要な計算量との対応関係を示したデータは、計算量データ用メモリ62に格納されており、判別部60はこの計算量データ用メモリ62内のデータを参照してステップ80の処理を行なう。ここで計算量の合計が所定の閾値を超えている場合は、さらに追加の識別器を選択して識別処理に用いる特徴量の種類を増やしてしまうと、識別処理における計算量の負担が過大となることを意味する。
ステップ80において計算量の合計がまだ閾値を超えていないと確認された場合は、図6の処理はステップ82へと進む。ステップ82では、直近のステップ76で選択されたものに対応する識別器が再び選択されないようにするため、その識別器に対応する特徴量が除外される。
次いで、ステップ84において、識別器選択部58が、直近のステップ76で選択された識別器では「水中」のシーンの画像データであるか否かを正しく識別できなかった各サンプル画像データの重みを、そのサンプル画像データの現在の重みよりも高くなるように更新する。一方、直近のステップ76で選択された識別器で「水中」のシーンの画像であるか否かを正しく識別できた各サンプル画像データの重みは、そのサンプル画像データの現在の重みよりも低くなるように更新される。この重みの更新を行なう理由は、次の識別器の選択において、既に選択された識別器では正しく識別できなかったサンプル画像データを重要視し、それらのサンプル画像データを正しく識別できる識別器が選択されるようにして、識別器の組合わせの効果を高めるためである。なお、正しく識別できなかったサンプル画像データの重みと、正しく識別できたサンプル画像データの重みとが相対的に変化させられれば十分であるので、上記の重みを高くする更新と重みを低くする更新とのいずれか一方のみを行なうこととしてもよい。
続いて、図6の処理はステップ74へと戻り、ステップ82で除外されたものを除く各特徴量について、識別器作成部56が、識別器を作成し直す。この2回目以降のステップ74における識別器の作成は、各サンプル画像データの重みを考慮して行なわれる。たとえば、あるサンプル画像データAの重みが別のサンプル画像データBの重みの2倍であるとすると、サンプル画像データAは、図3の中央に示す識別器のもととなるヒストグラムの作成において、サンプル画像データBの2倍の頻度値を与える。計算量を減らすため、前回のステップ74で作成した識別器を更新する形で新たな識別器を作成してもよい。その後、ステップ76において、重みを加味した識別精度を基準として、次の識別器が選択される。
以上のステップ74から84の処理が、正答率または計算量の合計が所定の閾値を超えるまで繰り返された後、図6の処理はステップ86へと進む。ステップ86では、識別条件決定部64が、識別器選択部58がそれまでに選択した識別器に基づいて、識別処理に使用する特徴量の種類と識別条件とを決定する。決定される特徴量の種類は、識別器選択部58が選択した各識別器に対応する特徴量の種類である。また、識別条件は、本実施形態でも、上記の第1の実施形態と同様の数列形式のものとする。
以上、特定シーンが「水中」のシーンである場合を例にとって、図5の装置50が行なう処理の詳細な工程について説明した。さらに「夕焼け」や「夜景」等の他の特定シーンについても同様の処理による学習を行なうと、第1の実施形態と同様に、様々な特定シーンについて、図4に示すような、特定シーン、識別処理に用いる適当な特徴量の種類、および識別条件の対応表を導出することができる。
なお、上記の第2の実施形態では、各サンプル画像データに重みを割り当て、識別器選択部58において重みを加味した識別精度を基準に識別器を選択することとしたが、サンプル画像データに重みを割り当てずに、図6のステップ72とステップ84を省略した処理を行なうこととしてもよい。その場合、図6のステップ76では、識別器選択部58は、重みを加味しない単純な識別精度に基づいて識別器を選択することとなる。
また、識別器選択部58は、適当な評価関数や、各識別器が示す識別ポイントの絶対値の総和等を用いて、識別精度が最も高い識別器を選択するものであってもよい。
さらに、上記の第2の実施形態では、識別器選択部58は、ステップ76において、全サンプル画像データに対する各識別器の識別精度に基づいて識別器を選択するものとしたが、サンプル画像データの一部に対する識別精度に基づいて識別器を選択するものとしてもよい。この場合、繰返し動作ごとに、サンプル画像データの異なる部分を使用してもよい。たとえば、1回目のステップ76では、全サンプル画像データの中から無作為に選んだサンプル画像データの集合を使用し、2回目のステップ76では、1回目のステップ76で選択した識別器ではあまりよい識別精度が得られないようなサンプル画像データの集合を選んで使用してもよい。
また、上記の第2の実施形態では、各サンプル画像データは、そのサンプル画像をなす各画素ごとに濃度R、GおよびBの値を示したデータとしたが、これに限られず、そのサンプル画像から導出した特徴量群等であってもよい。その場合、識別器作成部56は、特徴量の計算は行なわずに各特徴量から直接に識別器を作成することとなる。
さらに、上記の第2の実施形態ではヒストグラム形式の識別器を作成するものとしたが、ここでの識別器は、1つの特徴量を用いて特定シーンの画像データとそうでない画像データを識別する基準を提供するものであればいかなるものであってもよく、たとえば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図3の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
また、上記の例では、1つの識別器が選択されるごとに、次の識別器の選択に先立って、ステップ74で各サンプル画像データの重みを考慮して識別器を作成し直すこととしたが、図6の処理をステップ84からステップ76へと戻すこととし、最初に作成した識別器の中から、重みを加味した識別精度を基準にして識別器を順次選択することとしてもよい。なお、図6を用いて説明した例のように、1つの識別器が選択されるごとに各サンプル画像データの重みを考慮して識別器を作成し直す態様においては、ステップ76における識別器の選択は、重みを加味した識別精度ではなく単純な識別精度を基準としてもよい。
上記の第2の実施形態に係る装置50によれば、識別処理に用いる識別条件のみならず、その識別処理に適した特徴量の種類をも、併せて自動的に選択することができる。しかも、上記の装置50は、正答率が所定の閾値を超えた場合のみならず計算量の合計が所定の閾値を超えた場合にも、追加の識別器を選択する繰返し処理を終了するものであるので、装置50が決定した特徴量の種類および識別条件を用いれば、識別精度と計算量の負担とのバランスが極めてよい識別処理を行なうことができる。さらに、正答率および/または計算量の合計に関する閾値を調整することで、後に行なう識別処理の実行環境の計算能力および/または識別処理の所望の処理速度に応じた識別精度と計算量の負担との最適なバランスを実現することもできる。また、上記の図6を用いて説明したように、各サンプル画像データに重みを割り当て、重みを加味した識別精度を基準に識別器を選択し、各サンプル画像データの重みを順次更新していくこととすれば、先に選択した識別器では正しく識別できなかったサンプル画像データを重要視して、それらの画像データを正しく識別できる追加の識別器が順次選択され、それらの識別器に基づいて識別処理に用いる特徴量の種類と識別条件が決定されるため、後の識別処理において、多様な画像に対して精度が高く漏れの少ない識別を行なうことが可能となる。
以上、本発明の第2の実施形態に係る装置50について説明したが、コンピュータを、上記の識別器作成部56、識別器選択部58、判定部60および識別条件決定部64に対応する手段として機能させ、図6に示すような処理を行なわせるプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。
次に、図7および図8を用いて、本発明の第3の実施形態について説明する。図7は、本発明の第3の実施形態に係る特定シーンの画像データを選別する装置90の構成を示したブロック図である。この図に示すように、装置90は、識別したい特定シーンの指定を受け付けるシーン指定受付部92と、選別対象の画像データの入力を受け付ける画像入力受付部94と、識別のための参照データが格納されているメモリ96と、シーン指定受付部92および画像入力受付部94から入力を受け取り、メモリ96内の参照データを参照して必要な特徴量を導出する特徴量導出部98と、特徴量導出部98が導出した特徴量とメモリ96内の参照データに基づいて、入力された画像データが指定された特定シーンの画像のデータであるか否かを識別する識別部100を備えている。
メモリ96内に格納されている参照データは、識別したい特定シーンとして指定され得る複数のシーンごとに、そのシーンの識別に用いる特徴量の種類と、それらの特徴量の各々に対応する識別条件とを規定したものであり、本実施形態では、図4に示すような参照表形式等のデータであるとする。図4には、「水中」、「夕焼け」および「夜景」の3つのシーンに関するデータのみが示されているが、実際の参照データは、通常、これよりずっと多くのシーンについてのデータからなる。識別に用いる特徴量の種類および数は、シーンごとに異なっていてもよい。
この参照データは、特定シーンとして指定され得る「水中」、「夕焼け」および「夜景」等のシーンごとに、そのシーンの画像データであることが分かっている複数のサンプル画像データと、そのシーンの画像データでないことが分かっている複数のサンプル画像データとからなる、サンプル画像データ群を予め学習することにより決定されたものである。各シーンについての学習は、上記の第1および第2の実施形態に関連して説明した、図2または図6に示す処理あるいはそれらの変更例のいずれかに対応する手法により、行なわれたものとする。したがって、この参照データは、各シーンごとに、識別精度と上記の特徴量導出部98が行なう計算処理の計算量の負担とのバランスを考慮した、最適な特徴量の種類および識別条件を規定したものとなっている。
次に、図8のフローチャートを参照しながら、本発明の第3の実施形態に係る図7に示す装置90が行なう具体的な処理の流れについて説明する。
まず、図8のステップ110において、「水中」、「夕焼け」および「夜景」等の特定シーンのうちユーザーが希望する特定シーンの指定が、シーン指定受付部92により受け付けられる。
次いで、ステップ112において、画像入力受付部94が、選別対象の画像を示す画像データの入力を受け付ける。多数の画像に関する一連の画像データを連続的に受け付けてもよい。本実施形態では、受け付ける画像データは、その画像をなす各画素ごとに濃度R、GおよびBの値を示すデータとする。
続いて、ステップ114において、特徴量導出部98が、導出すべき特徴量の種類をメモリ96から読み出す。たとえば、ステップ110で指定された特定シーンが「水中」のシーンであるとすると、特徴量導出部98は、メモリ96中の図4に示す参照データを参照して、導出すべき特徴量が、濃度Bの平均値、濃度Bの(80%点)−(20%点)の値および色差Cbの70%点の3種類であることを認識する。
次に、ステップ116において、識別部100が、メモリ96から識別条件を読み出す。上記の「水中」のシーンが指定された例では、識別部100は、上記の3種類の特徴量に関する識別条件を、メモリ96中の図4に示す参照データから読み出す。
続いて、ステップ118において、特徴量導出部98が、ステップ112で入力された画像データから、指定された特定シーンの識別に使用される特徴量の1つを導出する。上記の「水中」のシーンが指定された例では、特徴量導出部98は、上記の3種類の特徴量のいずれかを、入力された画像データから導出する。
次に、ステップ120において、識別部100が、ステップ118で導出された特徴量に基づいて対応する識別条件を参照し、1つの識別ポイントを得る。たとえば、直前のステップ118において上記の3種類の特徴量のうち濃度Bの平均値が画像データから導出された場合は、識別部100は、ステップ116でメモリ96から読み出した濃度Bの平均値に関する識別条件のうちステップ118で導出した平均値に対応する部分を参照し、1つの識別ポイントを得る。ここで、図4に示した識別条件は、一定間隔刻みの特徴量の値に対応するデータ点の識別ポイントを列記したものであるので、ステップ120において得られる識別ポイントは、画像データから導出した特徴量の値に最も近いデータ点の識別ポイントや、データ点間の線形補間による識別ポイント等となる。
続いて、ステップ122において、導出すべきすべての特徴量が導出されたか否かが確認される。上記の「水中」のシーンが指定された例では、濃度Bの平均値、濃度Bの(80%点)−(20%点)の値および色差Cbの70%点の3種類の特徴量が導出されたか否かが確認され、これら3種類の特徴量の導出および対応する識別ポイントの獲得が完了するまで、ステップ118から122の処理が繰り返される。
導出すべきすべての特徴量の導出および対応する識別ポイントの獲得が完了すると、図8の処理はステップ124へと進み、識別部100が、獲得したすべての識別ポイントを総合して、入力された画像データが指定された特定シーンの画像であるか否かを識別する。本実施形態では、すべての識別ポイントを加算して、その加算値の正負によって識別を行なうものとする。たとえば、上記の「水中」のシーンが指定された例では、入力された画像データから導出された上記の3種類の特徴量に関する3つの識別ポイントの総和が正の値である場合には、その画像データは「水中」のシーンの画像を示すデータであると判断され、負の値である場合には、「水中」のシーンの画像を示すデータでないと判断される。
最後に、ステップ126において、識別部100から識別結果が出力され、図8の処理は終了する。
なお、上記の第3の実施形態においては、参照データは装置90内のメモリ96に記憶されているものとしたが、特徴量導出部98および識別部100が参照データにアクセスできる限り、参照データは、装置90とは別個の装置やCD−ROM等の差替可能な媒体に記憶されたものであってもよい。
また、上記の第3の実施形態では、画像入力受付部94に入力される画像データは、対象画像をなす各画素ごとに濃度R、GおよびBの値を示すデータとしたが、参照データ決定のための学習過程における計算量の評価に対応するデータであれば、これに限られない。
上記の本発明の第3の実施形態に係る装置90では、識別に使用する特徴量の種類および識別条件を特定シーンごとに規定した参照データを用いているため、シーン指定受付部92、画像入力受付部94、特徴量導出部98および識別部100を動作させるアルゴリズム自体は所望の特定シーンにかかわらず共通のものとすることができ、装置の開発コストを低く抑えながら、各特定シーンに合った画像の選別を行なうことができる。しかも、使用する参照データは、識別精度と特徴量導出部98が行なう計算処理の計算量の負担とのバランスを考慮した学習手法により決定されたものであるため、装置90の計算能力および/または所望の処理速度の範囲内で、最大限の高精度の識別による画像の選別を行なうことができる。さらに、複雑な識別アルゴリズムの変更、追加および実装等の作業を要することなく、参照データを改変するだけで、識別基準の変更や、識別可能な特定シーンの追加を、簡単に行なうことができる。
以上、本発明の第3の実施形態に係る装置90について説明したが、当業者であれば、上記の説明に基づいて、コンピュータを、上記のシーン指定受付部92、画像入力受付部94、特徴量導出部98および識別部100に対応する手段として機能させ、図8に示すような処理を行なわせるプログラムや、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、容易に作製することができるであろう。
次に、図9を用いて、本発明の第4の実施形態について説明する。図9は、本発明の第4の実施形態に係る特定シーンの画像を選別する装置130の構成を示したブロック図である。参照データ用メモリ136には、上記の第3の実施形態と同様に、図4に示すような参照表形式等の参照データが格納されているものとする。この参照データを決定するための各シーンについての学習は、上記の第1および第2の実施形態に関連して説明した、図2または図6に示す処理あるいはそれらの変更例のいずれかに対応する手法により、行なわれたものとする。シーン指定受付部132、画像入力受付部134、特徴量導出部138および識別部140の機能は、上記に説明した第3の実施形態に係る装置90の対応部分の機能と同様であり、それらが行なう識別処理も、上記の図8に示した処理と同様である。そこで、これらについては説明を省略し、以下、第3の実施形態に係る装置90と異なる部分についてのみ説明する。
第4の実施形態に係る装置130は、正解受付部142、追加学習データ用メモリ144および追加学習部146を備え、いわば自己学習機能を有する点で、第3の実施形態に係る装置90と異なる。識別部140から識別結果の出力を受けたユーザーが、選別されたあるいはされなかった画像をディスプレイに表示する等して確認したところ、選別結果が正しくなかった場合、ユーザーは、次回からはそれに類似した画像も正しく選別してほしいと考える。本実施形態の装置130は、そのような要請に応えるものである。
すなわち、ユーザーは、正しくない識別結果を受け取り、それを装置130に追加学習させたいと思った場合は、装置130の正解受付部142に対し、その画像に対する正解のシーンを指定して追加学習命令を与えることができる。たとえば、識別部140が「水中」のシーンの画像であると判断した画像が、実際には「夜景」のシーンの画像であった場合は、正解「夜景」を指定して追加学習命令を与える。追加学習命令および正解の指定を受け取った正解受付部142は、それらを識別部140に送る。識別部140は、これに応答して、識別結果が正しくないとされた画像の識別処理において特徴量導出部138が導出した各特徴量と、指定された正解とを、追加学習データ用メモリ144に送る。あるいは、指定された正解と導出された特徴量とに代えて、指定された正解ともともとの画像データとを追加学習データ用メモリ144に送る構成としてもよい。追加学習データ用メモリ144には、参照データ用メモリ136に格納されている初期の参照データの導出に用いられた、各サンプル画像の特徴量または画像データも格納されているものとする。
装置130が繰返し使用され、追加学習データ用メモリ144に蓄積された追加学習すべきデータの量が予め定められた基準を超えると、追加学習データ用メモリ144に格納されているデータが追加学習部146に送られ、追加学習部146において、再度の学習および参照データの更新が行なわれる。本実施形態では、追加学習部146は、正解が指定された追加学習すべき各画像と、初期の参照データの導出に用いられた各サンプル画像とを合わせたすべての画像について、再度、図2や図6に示す手法等により学習を行ない、新たな参照データを導出するものとする。
なお、追加学習部146が行なう学習および参照データの更新の手法は、上記のものに限られず他のいかなる手法によるものであってもよい。また、上記のように、初期の参照データの導出に用いられた各サンプル画像の特徴量または画像データを追加学習用メモリ144に格納しておく手法にも限られず、正解が指定された追加学習すべき画像についてのみ学習を行なうこととしてもよい。その場合、たとえば、追加学習すべき画像のデータについて、各特定シーンごとかつ各特徴量ごとに図3を用いて説明したようなヒストグラムを作成して、それらのヒストグラムが示す識別条件と、参照データ用メモリ136にそれまで蓄積されていた参照データが示す識別条件との加重平均を取り、その加重平均された識別条件を新たな識別条件として参照データ用メモリ136内の参照データを更新する等の手法を用いることができる。また、追加学習用メモリ144を設けずに、追加学習すべき画像のデータが識別部140から直接に追加学習部146に送られる構成とし、参照データを順次更新するようにしてもよい。
また、上記の実施形態では、追加学習すべきデータの量が予め定められた基準を超えた際に追加学習および参照データの更新を行なうこととしたが、定期的にまたはユーザーからの命令により追加学習および参照データの更新を行なう構成としてもよい。
上記の第4の実施形態に係る装置130によれば、上記した第3の実施形態の装置90と同様の効果に加えて、実際の選別対象画像に合わせて継続的に選別の精度を向上させていくという効果をさらに得ることができる。また、ユーザーが頻繁に指定する特定シーンに関しては、参照データの内容が特に充実していくため、より高い識別精度を実現することができる。
以上、本発明の第4の実施形態に係る装置130について説明したが、当業者であれば、上記の説明に基づいて、コンピュータを、上記のシーン指定受付部132、画像入力受付部134、特徴量導出部138、識別部140、正解受付部142および追加学習部146に対応する手段として機能させるプログラムや、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、容易に作製することができるであろう。
なお、上記に説明した本発明の第1から第4の実施形態およびそれらの変更例は、いずれも、画像データが特定シーンの画像データであるか否かを識別する識別処理のための特徴量の種類と識別条件の決定、または特定シーンの画像データの選別のための装置、プログラムまたはプログラムを記録した記録媒体に関するものであった。しかしながら、本発明は、対象データが特定内容のデータであるか否かを識別する識別処理のための特徴量の種類と識別条件の決定、または特定内容のデータの選別のための装置、プログラムまたはプログラムを記録した記録媒体であれば、いかなるものにも適用することができ、上記の画像データおよび特定シーンは、対象データおよび特定内容の一例に過ぎない。たとえば、本発明は、ある音声データが特定人物の声のデータであるか否かを識別する処理のための、特徴量の種類と識別条件の決定等にも適用することができる。また、同じ画像データを対象データとするものに限っても、上記のような1枚の画像全体が特定シーンを示すものであるか否かの識別処理に限られず、1枚の画像に含まれる1つの領域を表すデータが、人物等のある特定の被写体に対応する領域を表すデータであるか否かを識別する処理のための、特徴量の種類と識別条件の決定等にも適用することができる。
その他、上記の各実施形態および変更例を組み合わせた形態等も当然ながら本発明の技術的範囲に含まれるものであり、本発明の技術的範囲は、特許請求の範囲のみによって定められるべきものであることは言うまでもない。
Claims (14)
- 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを決定する装置であって、
前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて、前記識別処理に用いられ得る複数の特徴量の各々について、対応する識別器を作成する識別器作成手段と、
前記識別器の各々について、前記サンプルデータ群をなすデータの全部または一部に対する該識別器による識別精度を表す指標値を特定する識別精度特定手段と、
前記識別器の各々について、該識別器に対応する特徴量を前記対象データから導出するのに要する計算量を表す指標値を特定する計算量特定手段と、
前記識別器の各々について、前記識別精度を表す指標値と前記計算量を表す指標値から総合評価値を導出し、最も良好な前記総合評価値が導出された識別器から順に、少なくとも1つの識別器を選択する識別器選択手段と、
前記識別器選択手段により選択された前記少なくとも1つの識別器に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段とを備えていることを特徴とする装置。 - 前記識別器選択手段が、前記識別処理の実行環境の計算能力および/または前記識別処理の所望の処理速度に応じて、前記総合評価値を導出する際の前記識別精度を表す指標値と前記計算量を表す指標値の比重を変更するものであることを特徴とする請求項1記載の装置。
- 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを決定する装置であって、
前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて作成された、前記識別処理に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記サンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する識別器選択手段と、
前記識別器選択手段により選択された識別器の正答率、または前記識別器選択手段により選択された該識別器に対応する特徴量を前記対象データから導出するのに要する計算量の合計が、所定の基準を超えたか否かを判定し、該正答率または該計算量の合計が該所定の基準を超えるまで、前記識別器選択手段を繰返し動作させる判定手段と、
前記識別器選択手段により選択された前記識別器に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段とを備えていることを特徴とする装置。 - 前記サンプルデータ群が、該サンプルデータ群をなすデータの各々に、初期値が等しい重みが与えられた重み付きサンプルデータ群であって、
前記識別器選択手段が、各動作ごとに、前記重みを加味した前記識別精度が最も高い1つの識別器を選択し、該1つの識別器によっては正しく識別されない各データの重みが該データの現在の重みよりも高くなり、かつ/または該1つの識別器によって正しく識別される各データの重みが該データの現在の重みよりも低くなるように、前記サンプルデータ群をなす各データの前記重みを更新するものであることを特徴とする請求項3記載の装置。 - 前記識別器の各々が、前記特定内容のデータであることが分かっている前記複数のデータが示す該識別器に対応する特徴量の値のヒストグラムの各頻度値と、前記特定内容のデータでないことが分かっている前記複数のデータが示す該識別器に対応する特徴量の値のヒストグラムの各頻度値との、比または差分を表したヒストグラムであることを特徴とする請求項1から4いずれか1項記載の装置。
- 前記対象データおよび前記サンプルデータ群をなす各データが画像データであり、
前記特定内容が、該対象データが示し得る特定シーンであることを特徴とする請求項1から5いずれか1項記載の装置。 - 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、
前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて、前記識別処理に用いられ得る複数の特徴量の各々について、対応する識別器を作成する識別器作成手段、
前記識別器の各々について、前記サンプルデータ群をなすデータの全部または一部に対する該識別器による識別精度を表す指標値を特定する識別精度特定手段、
前記識別器の各々について、該識別器に対応する特徴量を前記対象データから導出するのに要する計算量を表す指標値を特定する計算量特定手段、
前記識別器の各々について、前記識別精度を表す指標値と前記計算量を表す指標値から総合評価値を導出し、最も良好な前記総合評価値が導出された識別器から順に、少なくとも1つの識別器を選択する識別器選択手段、および
前記識別器選択手段により選択された前記少なくとも1つの識別器に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段として機能させることを特徴とするプログラム。 - 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、
前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて作成された、前記識別処理に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記サンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する識別器選択手段、
前記識別器選択手段により選択された識別器の正答率、または前記識別器選択手段により選択された該識別器に対応する特徴量を前記対象データから導出するのに要する計算量の合計が、所定の基準を超えたか否かを判定し、該正答率または該計算量の合計が該所定の基準を超えるまで、前記識別器選択手段を繰返し動作させる判定手段、および
前記識別器選択手段により選択された前記識別器に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段として機能させることを特徴とするプログラム。 - 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、
前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて、前記識別処理に用いられ得る複数の特徴量の各々について、対応する識別器を作成する識別器作成手段、
前記識別器の各々について、前記サンプルデータ群をなすデータの全部または一部に対する該識別器による識別精度を表す指標値を特定する識別精度特定手段、
前記識別器の各々について、該識別器に対応する特徴量を前記対象データから導出するのに要する計算量を表す指標値を特定する計算量特定手段、
前記識別器の各々について、前記識別精度を表す指標値と前記計算量を表す指標値から総合評価値を導出し、最も良好な前記総合評価値が導出された識別器から順に、少なくとも1つの識別器を選択する識別器選択手段、および
前記識別器選択手段により選択された前記少なくとも1つの識別器に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段として機能させることを特徴とするプログラムを記録したコンピュータ読取可能な記録媒体。 - 対象データが特定内容のデータであるか否かを識別する識別処理に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを決定するためのプログラムであって、コンピュータを、
前記特定内容のデータであることが分かっている複数のデータと、前記特定内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群に基づいて作成された、前記識別処理に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記サンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する識別器選択手段、
前記識別器選択手段により選択された識別器の正答率、または前記識別器選択手段により選択された該識別器に対応する特徴量を前記対象データから導出するのに要する計算量の合計が、所定の基準を超えたか否かを判定し、該正答率または該計算量の合計が該所定の基準を超えるまで、前記識別器選択手段を繰返し動作させる判定手段、および
前記識別器選択手段により選択された前記識別器に基づいて、前記識別処理に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する決定手段として機能させることを特徴とするプログラムを記録したコンピュータ読取可能な記録媒体。 - データの所望の特定内容の指定を受け付けるデータ内容指定受付手段と、
選別対象である対象データの入力を受け付ける対象データ入力受付手段と、
前記特定内容として指定され得る複数の内容ごとに、前記対象データが該内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、前記データ内容指定受付手段において指定された前記特定内容に基づいて参照して、前記対象データから、該特定内容のデータであるか否かの識別に用いる前記少なくとも1つの特徴量を導出する特徴量導出手段と、
前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記対象データが前記データ内容指定受付手段において指定された前記特定内容のデータであるか否かを識別する識別手段とを備えてなり、
前記参照データが、前記複数の内容の各々について、該内容のデータであることが分かっている複数のデータと、該内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群を、予め学習することにより決定されたものであって、前記複数の内容の各々についての前記学習が、
前記サンプルデータ群に基づいて、前記識別手段による識別に用いられ得る複数の特徴量の各々について、対応する識別器を作成する工程と、
前記識別器の各々について、前記サンプルデータ群をなすデータの全部または一部に対する該識別器による識別精度を表す指標値を特定する工程と、
前記識別器の各々について、該識別器に対応する特徴量を前記対象データから導出するのに要する計算量を表す指標値を特定する工程と、
前記識別器の各々について、前記識別精度を表す指標値と前記計算量を表す指標値から総合評価値を導出し、最も良好な前記総合評価値が導出された識別器から順に、少なくとも1つの識別器を選択する工程と、
選択された前記少なくとも1つの識別器に基づいて、現在の学習内容のデータであるか否かの識別に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する工程とを含む方法によるものであることを特徴とする、特定内容のデータを選別する装置。 - データの所望の特定内容の指定を受け付けるデータ内容指定受付手段と、
選別対象である対象データの入力を受け付ける対象データ入力受付手段と、
前記特定内容として指定され得る複数の内容ごとに、前記対象データが該内容のデータであるか否かの識別に用いる少なくとも1つの特徴量の種類と、該少なくとも1つの特徴量の各々に対応する識別条件とを予め規定した参照データを、前記データ内容指定受付手段において指定された前記特定内容に基づいて参照して、前記対象データから、該特定内容のデータであるか否かの識別に用いる前記少なくとも1つの特徴量を導出する特徴量導出手段と、
前記特徴量導出手段により導出された前記少なくとも1つの特徴量の各々に基づいて、前記参照データが規定する前記対応する識別条件を参照し、前記対象データが前記データ内容指定受付手段において指定された前記特定内容のデータであるか否かを識別する識別手段とを備えてなり、
前記参照データが、前記複数の内容の各々について、該内容のデータであることが分かっている複数のデータと、該内容のデータでないことが分かっている複数のデータとからなるサンプルデータ群を、予め学習することにより決定されたものであって、前記複数の内容の各々についての前記学習が、
前記サンプルデータ群に基づいて作成された、前記識別手段による識別に用いられ得る複数の特徴量の各々に対応する識別器のうち、前記サンプルデータ群をなすデータの全部または一部に対する識別精度が最も高い1つの識別器を選択する工程と、
前記選択する工程において選択された前記識別器の正答率、または前記選択する工程において選択された前記識別器に対応する特徴量を前記対象データから導出するのに要する計算量の合計が、所定の基準を超えるまで、前記選択する工程を繰り返す工程と、
前記選択する工程において選択された前記識別器に基づいて、現在の学習内容のデータであるか否かの識別に用いる前記少なくとも1つの特徴量の種類と前記識別条件とを決定する工程とを含む方法によるものであることを特徴とする、特定内容のデータを選別する装置。 - 前記識別手段により正しい識別結果が得られなかった対象データについて、該対象データが示す正しい内容の指定を受け付ける正解受付手段と、
前記正しい内容の指定が受け付けられた前記対象データを学習することにより、前記参照データを更新する追加学習手段とをさらに備えていることを特徴とする請求項11または12記載の特定内容のデータを選別する装置。 - 前記対象データおよび前記サンプルデータ群をなす各データが画像データであり、
前記特定内容が、前記対象データが示し得る特定シーンであることを特徴とする請求項11から13いずれか1項記載の特定内容のデータを選別する装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003333412A JP2005100121A (ja) | 2003-09-25 | 2003-09-25 | 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003333412A JP2005100121A (ja) | 2003-09-25 | 2003-09-25 | 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005100121A true JP2005100121A (ja) | 2005-04-14 |
Family
ID=34461423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003333412A Withdrawn JP2005100121A (ja) | 2003-09-25 | 2003-09-25 | 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005100121A (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008204103A (ja) * | 2007-02-19 | 2008-09-04 | Yokohama National Univ | 画像認識システム |
JP2009064162A (ja) * | 2007-09-05 | 2009-03-26 | Fuji Heavy Ind Ltd | 画像認識システム |
WO2009057815A1 (en) * | 2007-11-01 | 2009-05-07 | Canon Kabushiki Kaisha | Information processing apparatus and information processing method |
JP2009151395A (ja) * | 2007-12-18 | 2009-07-09 | Canon Inc | パターン識別器生成方法、情報処理装置、コンピュータプログラム及び記憶媒体 |
JP2011113550A (ja) * | 2009-11-30 | 2011-06-09 | Canon Inc | 情報処理装置、情報処理方法、情報処理システム、プログラム及びデータ構造 |
JP2014194659A (ja) * | 2013-03-28 | 2014-10-09 | Brother Ind Ltd | 画像処理装置およびコンピュータプログラム |
US9053395B2 (en) | 2012-03-15 | 2015-06-09 | Omron Corporation | Image processor, image processing method, control program and recording medium |
JP2019033397A (ja) * | 2017-08-08 | 2019-02-28 | 富士通株式会社 | データ処理装置、プログラム及びデータ処理方法 |
JP2019057024A (ja) * | 2017-09-20 | 2019-04-11 | 株式会社Screenホールディングス | 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 |
CN111524017A (zh) * | 2019-02-01 | 2020-08-11 | 天津幸福生命科技有限公司 | 理赔数据的审核方法、装置及介质 |
CN111758116A (zh) * | 2018-03-14 | 2020-10-09 | 欧姆龙株式会社 | 脸部图像识别系统、识别器生成装置、识别装置、图像识别系统以及识别系统 |
WO2021111788A1 (ja) * | 2019-12-05 | 2021-06-10 | 日立Astemo株式会社 | ニューラルネットワーク縮約装置およびその方法 |
-
2003
- 2003-09-25 JP JP2003333412A patent/JP2005100121A/ja not_active Withdrawn
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008204103A (ja) * | 2007-02-19 | 2008-09-04 | Yokohama National Univ | 画像認識システム |
JP2009064162A (ja) * | 2007-09-05 | 2009-03-26 | Fuji Heavy Ind Ltd | 画像認識システム |
US8655057B2 (en) | 2007-11-01 | 2014-02-18 | Canon Kabushiki Kaisha | Information processing apparatus and information processing method |
WO2009057815A1 (en) * | 2007-11-01 | 2009-05-07 | Canon Kabushiki Kaisha | Information processing apparatus and information processing method |
JP2009116400A (ja) * | 2007-11-01 | 2009-05-28 | Canon Inc | 情報処理装置および情報処理方法 |
JP2009151395A (ja) * | 2007-12-18 | 2009-07-09 | Canon Inc | パターン識別器生成方法、情報処理装置、コンピュータプログラム及び記憶媒体 |
US8909561B2 (en) | 2009-11-30 | 2014-12-09 | Canon Kabushiki Kaisha | Information processing apparatus and information processing method |
JP2011113550A (ja) * | 2009-11-30 | 2011-06-09 | Canon Inc | 情報処理装置、情報処理方法、情報処理システム、プログラム及びデータ構造 |
US9053395B2 (en) | 2012-03-15 | 2015-06-09 | Omron Corporation | Image processor, image processing method, control program and recording medium |
JP2014194659A (ja) * | 2013-03-28 | 2014-10-09 | Brother Ind Ltd | 画像処理装置およびコンピュータプログラム |
JP2019033397A (ja) * | 2017-08-08 | 2019-02-28 | 富士通株式会社 | データ処理装置、プログラム及びデータ処理方法 |
JP2019057024A (ja) * | 2017-09-20 | 2019-04-11 | 株式会社Screenホールディングス | 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 |
CN111758116A (zh) * | 2018-03-14 | 2020-10-09 | 欧姆龙株式会社 | 脸部图像识别系统、识别器生成装置、识别装置、图像识别系统以及识别系统 |
CN111758116B (zh) * | 2018-03-14 | 2023-07-14 | 欧姆龙株式会社 | 脸部图像识别系统、识别器生成装置、识别装置与系统 |
CN111524017A (zh) * | 2019-02-01 | 2020-08-11 | 天津幸福生命科技有限公司 | 理赔数据的审核方法、装置及介质 |
CN111524017B (zh) * | 2019-02-01 | 2023-09-22 | 北京懿医云科技有限公司 | 理赔数据的审核方法、装置及介质 |
WO2021111788A1 (ja) * | 2019-12-05 | 2021-06-10 | 日立Astemo株式会社 | ニューラルネットワーク縮約装置およびその方法 |
JP2021089628A (ja) * | 2019-12-05 | 2021-06-10 | 日立Astemo株式会社 | ニューラルネットワーク縮約装置およびその方法 |
JP7229905B2 (ja) | 2019-12-05 | 2023-02-28 | 日立Astemo株式会社 | ニューラルネットワーク縮約装置およびその方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4606828B2 (ja) | 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体 | |
US7171042B2 (en) | System and method for classification of images and videos | |
CN105184763B (zh) | 图像处理方法和装置 | |
JP4708909B2 (ja) | デジタル画像の対象物検出方法および装置並びにプログラム | |
CN110298297B (zh) | 火焰识别方法和装置 | |
JP4588575B2 (ja) | デジタル画像の複数対象物検出方法および装置並びにプログラム | |
JP2015087903A (ja) | 情報処理装置及び情報処理方法 | |
JP2003153007A (ja) | 画像重要度に基づく画像圧縮制御システム及び方法 | |
JP2005100121A (ja) | 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 | |
CN101685542A (zh) | 电子设备、模糊图像分拣方法以及程序 | |
JPH0573687A (ja) | 自動分類方法 | |
CN107516102B (zh) | 图像数据分类与建立分类模型方法、装置及系统 | |
CN108320294B (zh) | 一种二代身份证照片的人像背景智能全自动替换方法 | |
CN111950389B (zh) | 一种基于轻量级网络的深度二值特征人脸表情识别方法 | |
CN110782448A (zh) | 渲染图像的评价方法及装置 | |
JP4397667B2 (ja) | 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 | |
CN107067022B (zh) | 图像分类模型的建立方法、建立装置和设备 | |
CN111027347A (zh) | 一种视频识别方法、装置和计算机设备 | |
JP2005100122A (ja) | 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 | |
JP2020160543A (ja) | 情報処理システムおよび情報処理方法 | |
CN108647696A (zh) | 图片颜值确定方法及装置、电子设备、存储介质 | |
CN111340124A (zh) | 图像中实体类别的识别方法和装置 | |
US8131077B2 (en) | Systems and methods for segmenting an image based on perceptual information | |
JP6988995B2 (ja) | 画像生成装置、画像生成方法および画像生成プログラム | |
CN103793714A (zh) | 多分类识别器、数据识别装置、多分类识别方法及数据识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20061205 |