JP5212007B2 - 画像分類学習装置、画像分類学習方法、および画像分類学習システム - Google Patents

画像分類学習装置、画像分類学習方法、および画像分類学習システム Download PDF

Info

Publication number
JP5212007B2
JP5212007B2 JP2008264058A JP2008264058A JP5212007B2 JP 5212007 B2 JP5212007 B2 JP 5212007B2 JP 2008264058 A JP2008264058 A JP 2008264058A JP 2008264058 A JP2008264058 A JP 2008264058A JP 5212007 B2 JP5212007 B2 JP 5212007B2
Authority
JP
Japan
Prior art keywords
image
classification
image data
class
representative image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008264058A
Other languages
English (en)
Other versions
JP2010092413A (ja
Inventor
酉華 木原
幸二 小林
浩久 稲本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008264058A priority Critical patent/JP5212007B2/ja
Publication of JP2010092413A publication Critical patent/JP2010092413A/ja
Application granted granted Critical
Publication of JP5212007B2 publication Critical patent/JP5212007B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像分類学習装置、画像分類学習方法、画像分類学習システムに関し、特に、機械学習を利用して画像データの分類を行う画像分類学習装置、画像分類学習方法、および画像分類学習システムに関するものである。
従来の機械学習方法は、N個のデータが一括して与えられ、そこからパラメータの決定などの学習を行う一括学習(Batch-Learning)と、データが1つずつ逐次的に与えられ、データが与えられるたびにパラメータを更新する逐次学習(Sequential-Learning)とに大別することができる。
上記した一括学習の代表例としては、SVM(Support Vector Machine)があり、マージン最大化、カーネル法に基づいて最適学習を実現し、現在、音声認識や文字認識、図形認識などのパターン認識分野や医療診断分野等々幅広い分野に応用されている。この一括学習を行う際には、分類を決定付ける識別関数を生成するため、十分かつ適切な事例を用意する必要があり、この事例の質によって分類の精度が大きく左右される。このように、従来から学習時に必要な事例を適切に選択したり、自ら生成したりする技術が用いられている。
例えば、一般の学習法では、訓練される側は学習に使用する事例を選択することなく、与えられた事例をそのまま使用して学習を行うのに対し、能動学習法では、訓練される側が、どの事例について正解が欲しいかを要求するステップを含むことで、より高い精度が得られるように改良されている。この能動学習法を用いて行われた学習結果に基づいて、SVMがデータ分類を行う方法を提供することにより、学習精度の向上を図るものがあった(特許文献1参照)。
また、検査領域から欠陥領域を抽出する際に、抽出程度の異なる複数の教師データを生成することにより、学習事例が少ない場合でも、抽出程度の変化に対する分類性能のロバスト性を確保するものがあった(特許文献2参照)。
さらに、画像に比べて十分に小さい領域(窓ともいう)を設定し、各窓から画像の正領域を切り出した部分画像の集合を作成して、切り出された全ての部分画像同士の間に非類似度に基づく順序関係を定義する。続いて、その順序関係に基づいて各部分画像を任意の距離空間における点へ写像し、その空間上で画像特徴量を定義する。このような処理を経て、画像の解像度の違い、対象物体の変化、オクルージョンや環境の突然の変化などに対してロバストなクラス分類学習システムを提供するものがあった(特許文献3参照)。
また、学習環境下において十分な数の事例が提供されていない場合には、適切な事例を収集する必要があるが、この収集処理を自動化したものとして、クエリとなるキーワードが与えられた時に、そのキーワードが持つ複数概念に応じた画像を、周辺の説明テキストの照合によりインターネット上から収集し、検索結果の画像の内容によって分類する画像分類方法がある。この画像分類方法は、シソーラス類似度が高く、画像特徴空間における分布の中心距離が閾値以下である画像を正事例とし、正事例の各画像から抽出した画像特徴量のうちバラツキが小さい特徴量の分布から負事例を決定するものであった(特許文献4参照)。
この画像分類方法を用いた場合は、学習に用いる正事例、負事例を生成することにより、概念に対応した画像を精度良く分類することが可能となる。しかし、この方法によって与えられる分類は、ユーザ固有の環境を考慮したものではない。一般に、ユーザの環境によって分類意図(対象/粒度/精度など)は様々であり、あるユーザにとって意味のある分類が、他のユーザにとっても同様に価値があるとは限らない。例えば、植物と動物とを識別する識別器は数多く提供されるが、趣味で植物の写真を収集するユーザにとっては花について粒度の細かい分類の方がより価値が高いかもしれない。このように、より多様なユーザーニーズに応えるためには、ユーザの環境に応じて識別関数をカスタマイズすることが求められている。
そこで、ユーザの環境に合わせた分類を行うようカスタマイズする例としては、画像の集合に対して、集合の名称はそのままで、その内容を種々の条件に応じて最適なものとするため、利用目的に応じた条件を指定し、その条件に従って画像を検出することにより分類を更新していくものがあった(特許文献5参照)。
特許第4034602号公報 特開2006−163608号公報 特開2006−039658号公報 特開2007−317133号公報 特開2006−201933号公報
しかしながら、上記従来例にあっては、大量の画像が蓄積された画像データベースでは、画像データの属性や画像特徴などの性質に基づいてクラスが分類され、整理されていると、検索時に必要なデータが取り出しやすくなるが、以下の3つの課題が存在する。
(1)ユーザ自身が分類指標を指定して分類を行うシステムにおいて、分類対象が画像データの場合は、分類条件を言葉で明確に表現することが難しいという課題があった。
(2)既存の分類クラスが予めシステム側で提供される場合、ユーザの意図しないクラスに分類されてしまう可能性が高く、蓄積された画像データがある1つのクラスに偏ったり、どのクラスに分類されたかがユーザ自身分からなくなったりするという課題があった。
(3)画像データベースに新しい画像が追加されたり、既存の画像データが削除されたりするなど、画像データベースの更新によって様態が変化するが、その変化に応じて分類を学習することができないという課題があった。
特に、特許文献5の場合、ユーザが目的に沿った分類を得るためには、利用する度に条件を指定する必要がある上、指定する条件が明確な場合には対応可能であるが、画像データの分類指標が不明確な場合には対応できないという課題があった。
本発明は、上記に鑑みてなされたものであって、ユーザ環境下の画像データに基づいて機械学習用の事例データを収集し、識別関数を生成して画像データを分類することにより、個々のユーザ環境に合った適切な分類を提供することができると共に、その分類方法を学習することが可能な機能を備えた画像分類学習装置、画像分類学習方法、および画像分類学習システムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明にかかる画像分類学習装置は、画像データ群の分類を学習する画像分類学習装置であって、分類対象となる前記画像データ群を取得する画像データ取得手段と、前記分類を行う各クラスを代表する代表画像を決定する代表画像決定手段と、前記決定した代表画像をクエリとして類似画像を検索し、学習事例として収集する事例収集手段と、前記決定した代表画像と前記収集した事例とに基づいて学習を行い、分類の判定基準となる識別関数を生成する識別関数生成手段と、前記識別関数に基づいて前記画像データ群を分類する分類手段と、前記各手段を制御する制御手段と、を備えたことを特徴とする。
また、本発明にかかる画像分類学習方法は、画像データ群の分類を学習する画像分類学習方法であって、画像データ取得手段が、分類対象となる前記画像データ群を取得するステップと、代表画像決定手段が、分類を行う各クラスを代表する代表画像を決定するステップと、事例収集手段が、前記決定した代表画像をクエリとして類似画像を検索し、学習事例として収集するステップと、識別関数生成手段が、前記決定した代表画像と前記収集した事例とに基づいて学習を行い、分類の判定基準となる識別関数を生成するステップと、分類手段が、前記識別関数に基づいて前記画像データ群を分類するステップと、を含むことを特徴とする。
また、本発明にかかる画像分類学習システムは、画像データ群の分類を学習する画像分類学習システムであって、分類対象となる前記画像データ群を取得する画像データ取得装置と、前記分類を行う各クラスを代表する代表画像を決定する代表画像決定装置と、前記決定した代表画像をクエリとして類似画像を検索し、学習事例として収集する事例収集装置と、前記決定した代表画像と前記収集した事例とに基づいて学習を行い、分類の判定基準となる識別関数を生成する識別関数生成装置と、前記識別関数に基づいて前記画像データ群を分類する分類装置と、を備えたことを特徴とする。
本発明によれば、ユーザ環境下の画像データに基づいて機械学習用の事例データを収集し、識別関数を生成して画像データを分類することにより、個々のユーザ環境に合った適切な分類を提供することができると共に、その分類方法を学習する機能を有するという効果を奏する。
以下に添付図面を参照して、この発明にかかる画像分類学習装置、画像分類学習方法、および画像分類学習システムの最良な実施の形態を詳細に説明する。
(第1の実施の形態)
図1は、第1の実施の形態にかかる画像分類学習装置の一構成例を示すブロック図である。図1に示す画像分類学習装置10は、大量の画像データが蓄積された画像データベース(DB)17から分類対象となる画像データ群を取得する画像データ取得手段としての画像取得部11、取得した画像データ群の中で分類クラスに対応した代表画像を決定する代表画像決定手段としての代表画像決定部12、決定した代表画像をクエリとしてインターネット24上で類似画像を検索する画像検索部13a、検索された画像データから学習用の事例データを抽出する事例データ抽出部13b、この画像検索部13aと事例データ抽出部13bとで事例収集手段としての事例収集部13を構成している。さらに、画像分類学習装置10は、事例データ抽出部13bで抽出された事例データをクラスごとに記憶させる事例データ記憶部16、事例データ記憶部16に記憶されている正事例および負事例を学習して識別関数を算出する識別関数生成手段としての識別関数生成部14、算出された識別関数を使用して画像データ群の中のデータを分類する分類手段としての識別処理部15、および上記各部の制御を行う制御手段としての制御部18、ユーザに対して操作情報を表示し、操作入力を行わせる操作表示部19などで構成されている。
検索フィールドとしての前記画像DB17は、インターネットや複数のユーザに公開されている画像DBなどを挙げることができる。
図2は、第1の実施の形態にかかる画像分類学習システムの一構成例を示すブロック図である。図2に示す画像分類学習システム20は、図1に示した画像分類学習装置10における各機能部をインターネット24などのネットワークを介して分散させ、システムとして構成することも可能である。図2では、インターネット24を介してクライアント端末21と、ウェブ検索エンジン22と、ウェブサイト23とが接続されて画像分類学習システム20を構成している。
クライアント端末21は、ユーザの検索要求である代表画像データを受付け、これをクエリとして画像検索を行い、検索された画像を提示するものである。
ウェブ検索エンジン22は、クエリとなる代表画像とウェブサイト23の画像データの中から類似するウェブ画像を検索するものである。
ウェブサイト23は、インターネット24上で公開されているウェブサイトであって、多数の画像データが公開されている。
例えば、画像データ群を保持するウェブサイト23に対してアクセスを行うクライアント端末21は、分類対象となる画像データ群を取得する画像データ取得装置を構成している。また、同一クライアント端末21内、あるいは、別のクライアント端末では、分類を行う各クラスの代表画像を決定する代表画像決定装置を構成している。ウェブ検索エンジン22は、代表画像決定装置で決定された代表画像をクエリとして、ウェブサイト23から類似画像を検索し、学習事例として収集する事例収集装置を構成している。そして、上記クライアント端末21内、あるいは、別のクライアント端末では、上記代表画像決定装置で決定された代表画像と、上記事例収集装置で収集された事例とに基づいて学習を行い、分類の判定基準となる識別関数を生成する識別関数生成装置を構成している。さらに、上記クライアント端末21内、あるいは、別のクライアント端末では、識別関数生成装置で生成された識別関数に基づいて画像データ群を分類する分類装置を構成している。
このように、図1に示す画像分類学習装置10、あるいは、図2に示す画像分類学習システム20を用いて、分類対象となる画像データ群の中から分類の各クラスに対応した代表画像を決定する場合について説明する。代表画像は、分類精度を左右する重要な情報であって、分類におけるクラスを象徴する画像が含まれている。分類対象となる画像データ群が写真などのようにテキスト情報を含まないデータの場合は、言葉によって分類意図を表現することが難しい場合が多い。このため、クラスをイメージしながら、各クラスの代表となる画像を選択することにより、分類を定義することが可能となる。
図3は、図1の代表画像決定部で代表画像を決定する場合のユーザインターフェース画面例を示す図である。図1の代表画像決定部12は、複数の画像サムネイルをあるルールに基づいて配置した一覧表示を、図1の操作表示部19のユーザインターフェース画面上に表示し、ユーザに提供する。ユーザは、このユーザインターフェース画面上で画像データ群の全容を把握しながら各クラスの代表画像を選択する。例えば、図3に示すように、クラスA〜Dの4つのクラスをイメージした場合、ユーザが各クラスの代表画像を一覧表示された画像データ群の中から指定する。このように、クラスの代表画像が一覧表示されたユーザインターフェース画面から代表画像を指定するだけで、自由に分類を定義することが可能となる。例えば、ユーザが所持する画像データ群が全て花の画像であった場合、花の形、色などユーザ好みの粒度で容易に分類定義を与えることが可能となる。このように、蓄積された画像データや分類粒度に拠らず、適応的な分類結果を提供することができる。
また、図1の事例データ抽出部13bでは、代表画像決定部12が決定した代表画像をクエリとして画像検索部13により類似画像を検索し、事例データを抽出する。代表画像をクエリとする検索手法としては、従来から知られているあらゆる手法を用いることができる。例えば、画像データから特徴量を抽出し、その特徴量と類似度の高い順に検索結果を提示するのが最も基本的な手法である。その場合、画像の概観に寄与する特徴量として、色ヒストグラム、配色、エッジ、テクスチャ、構図など複数の特徴量を予め設定しておいて、各画像からこれらの特徴量を抽出して多次元ベクトルを構成し、ユークリッド距離などの距離尺度を用いて類似度を評価する。
さらに、図1の識別関数生成部14では、代表画像決定部12が決定した代表画像と、事例データ抽出部13bが抽出した事例データとに基づいて学習を行い、識別関数を生成する。より具体的には、事例データ抽出部13bが抽出した事例データは、事例データ記憶部16に一旦記憶される。図1の事例データ記憶部16に示すように、クラス毎に収集した正事例および負事例を学習事例として識別関数生成部14に与えることにより、例えばSVMなどに代表される一括型の教師付学習を行って識別関数を生成する。SVMは、非線形空間で識別を行いながら、カーネルトリックという手法を用いることにより、計算に処理負荷をかけることなく、高速に複雑な識別を行うことができるという長所がある。学習時には、各代表画像と代表画像の類似画像検索でヒットした複数の画像を1つのクラスの学習用画像とする。まず、各クラスの学習用画像から特徴量ベクトルを算出して教師付学習データとしてSVMへ与える。この時の特徴量としては、上述の類似画像検索時に使用した全特徴量(色ヒストグラム、配色、エッジ、テクスチャ、構図など)について1つの特徴量ベクトルを生成する。SVMでは、特徴量ベクトルを構成する複数の特徴量のうち、識別への関与が大きい特徴量次元を学習の過程で判定することにより、識別関数を構成する。
また、別の方法としては、色ヒストグラム、配色、エッジ、テクスチャ、構図の各特徴量についてそれぞれ識別平面を生成し、最も識別精度の高い識別平面を採用する方法も考えられる。この場合、学習用画像から1つの特徴量について特徴ベクトルを作成し、識別関数を構成する作業を特徴量の数だけ繰り返すようにする。生成された識別平面の精度をCV(Cross-Validation)などの手法を用いて検査を行い、最も精度の高い特徴量に関する識別関数を以後利用するものがある。
図4は、第1の実施の形態にかかる画像分類学習装置の動作を説明するフローチャートである。まず、図4に示すように、画像分類学習装置10は、画像DB17から画像取得部11が分類対象となる画像データ群を取得し(ステップS100)、これを代表画像決定部12と操作表示部19とを使って、分類クラスに対応した代表画像を決定する(ステップS101:図3参照)。
続いて、画像検索部13aは、代表画像をクエリとして類似画像の検索を行い(ステップS102)、その検索で取得された画像データより特徴量を抽出して学習用の事例データを抽出する(ステップS103)。この時、各クラスについて、代表画像に類似する画像として検索された画像データから当該クラスの正事例を、その他のクラスの代表画像に類似する画像として検索された画像データから当該クラスの負事例を抽出し、事例データ記憶部16に記憶する。
続いて、識別関数生成部14は、収集した学習事例データに基づいて学習を行い、分類を判定する識別関数を算出する(ステップS104)。そして、識別処理部15は、算出した識別関数を用いて画像データ群をクラスに分類する(ステップS105)。
このように、大量の画像データ群を蓄積している画像DB17では、画像データの属性や画像特徴などの性質に基づいてクラス分類され整理されていれば、検索時に必要なデータを取り出し易くなる。しかし、画像データに関しては、分類のための条件を明確に定義することが難しく、分類意図もユーザによって異なる場合が多い。このため、第1の実施の形態によれば、ユーザ自身が意図するクラス分類をイメージしながら各クラスに対応した代表画像を決定し、その代表画像と類似した事例データを収集するようにしたため、分類のための条件が明確に定義できない場合であっても、蓄積データの傾向からユーザの環境に合った適切な分類を提供することが可能になる。また、第1の実施の形態によれば、分類方法の学習機能を備えているため、繰り返し利用することによって、より一層適切な分類が提供できるようになる。
さらに、大量の画像データ群を蓄積している画像DB17上で手動による分類を与え、各データを全て分類することはユーザにとって処理負荷の大きい作業である。このため、第1の実施の形態によれば、ユーザが所持する画像データ群の傾向を把握し、取得された画像データ群の中から適当数の画像データとクラス情報とをペアで指定手段としての操作表示部19を使って指定すると、代表画像決定12が指定された画像データをクラス情報が表すクラスの代表画像として決定すると、その内容から適当な分類クラスを自動で構成し、決定された分類クラスに基づいて学習事例データを収集して、以後は自動で分類学習が行われるため、ユーザの負荷を軽減しつつ、より適切な分類を提供することができる。
(第2の実施の形態)
第2の実施の形態では、自動で代表画像を選出する点に特徴がある。まず、代表画像を決定する場合、上記第1の実施の形態のようにユーザがクラスをイメージしながら各クラスの代表画像を指定する他、分類対象である画像データ群について、例えば色、テクスチャ、構図といった画像の概観に寄与する画像の特徴量を抽出し、それらの特徴量に関する分布のばらつきが、クラス内では小さく、クラス間では大きくなるような仮のクラスを構成し、各仮クラスから代表画像候補を選出するようにしても良い。具体的には、画像データ取得部11が取得した画像データ群にクラス情報が付与されていない場合、制御部18が、画像データ群から画像特徴量を抽出し、特徴ベクトルを生成する特徴ベクトル生成部を備えている。そして、代表画像決定部12は、その特徴ベクトル生成部によって生成された特徴量ベクトルについて、特徴空間における特徴ベクトルの分布のばらつきがクラス内では小さく、クラス間では大きくなる仮のクラスを構成して、各仮クラスについて1つ以上の画像データを代表画像候補とするものである。
さらに、学習時には、各クラスの代表画像と類似した画像データを事例データとして学習するため、代表画像に選ばれた画像は他の画像と比較すると識別精度が高くなる。従って、ユーザにとって価値のあるデータを代表画像候補からさらに絞り込むことにより、一層利用価値の高い画像データに関する識別精度を向上させることが可能となる。具体的には、図1の代表画像決定部12は、代表画像候補からアクセス回数情報を取得するアクセス回数情報取得部と、各クラスについて代表画像候補をアクセス回数順にソートするアクセス回数順ソート部と、ソートされた上位から予め指定された個数分の代表画像候補を選択して、各クラスの代表画像データとする第1の代表画像データ決定部とを備え、代表画像候補をアクセス回数により絞り込むようにする。また、代表画像決定部12は、代表画像候補から更新年月日を取得する更新年月日取得部と、各クラスについて代表画像候補を更新年月日順にソートする更新年月日順ソート部と、ソートされた上位から予め指定された個数分の代表画像候補を選択して、各クラスの代表画像データとする第2の代表画像データ決定部とを備え、代表画像候補を更新年月日により絞り込むようにする。さらに、代表画像決定部12は、代表画像候補から画像データの重要度を取得する重要度取得部と、各クラスについて代表画像候補を重要度順にソートする重要度順ソート部と、ソートされた上位から予め指定された個数分の代表画像候補を選択して、各クラスの代表画像データとする第3の代表画像データ決定部と、を備え、代表画像候補を重要度により絞り込むようにする。
このように、更新年月日でソートを行って、アクセス回数の高低、あるいは、更新年月日の新旧を考慮して代表画像を決定したり、ユーザが各画像に重要度を付与し、その重要度の高い画像を優先的に代表画像と決定したりする。
さらに、第2の実施の形態にかかる画像分類学習装置では、蓄積画像の中から代表画像を選択し、その代表画像をクエリとしてネットワークから検索を行うことにより、識別関数を構成するための学習事例データを収集する。その際、代表画像の個数は特に制約していないが、代表画像の個数が多くなればなるほど、クエリによる画像検索にかかる負荷が大きくなる。従って分類対象データの特徴空間上で分布に応じた適切な個数の代表画像を(代表画像候補の中から)選択することが望まれる。そこで、特徴空間においてクラス内分布のばらつきが大きい場合は、同一クラスに含まれるデータ間に広がりがあるため、多くの学習事例が必要になることを考慮して、分布における分散の大小に応じて各クラスの代表画像の個数を決定するようにする。
特徴量ベクトルの分布からクラスタを構成する手法としては、クラスタ数を徐々に増やしていく(もしくは減らしていく)階層的な手法と、予めクラスタ数を固定して分類を行う非階層的な手法(例えば、k−means法)とがある。第2の実施の形態では、予め適当な数のクラスタ数を決めた上でk−means法によりクラスタ分析を行い、仮のクラスを分類する方法について図5を用いて説明する。
図5は、第2の実施の形態にかかる動作を説明するフローチャートである。まず、図5に示すように、画像取得部11は、分類対象となる画像データ群を画像DB17から取得する(ステップS200)。代表画像決定部12は、各画像データ群から画像特徴量を取得し(ステップS201)、続いてクラスタ数を取得して(ステップS202)、画像特徴量データとクラスタ数とに基づいて、上記したk−means法により仮のクラスを決定し(ステップS203)、仮のクラスに対応する代表画像を決定する(ステップS204)。
続いて、事例収集部13の画像検索部13aは、仮のクラスに対応した代表画像をクエリとして類似画像を検索し(ステップS205)、事例データ抽出部14は、検索によって取得された画像データから特徴量を抽出して、学習用の事例データを抽出する(ステップS206)。この時、各クラスについて、代表画像に類似する画像として検索された画像データから当該クラスの正事例を、その他のクラスの代表画像に類似する画像として検索された画像データから当該クラスの負事例を抽出する。
続いて、識別関数生成部14は、抽出した学習用の事例データに基づいて学習を行い、分類を判定する識別関数を算出する(ステップS207)。識別処理部15は、算出された識別関数を使用して画像データをクラスに分類する(ステップS208)。
このように、第2の実施の形態によれば、大量に画像データが蓄積されている画像DB17上で手動により分類を与えて、各データを分類することはユーザにとって処理負荷の大きい作業である。そこで、第2の実施の形態にかかる画像分類学習装置では、ユーザが所持する画像データ群の傾向を把握し、その内容から適当な分類クラスを自動で構成し、さらに、決定された分類クラスに基づいて学習事例データを収集して、以後は自動で分類学習を行うようにしたため、ユーザの負荷を軽減しつつ、より適切な分類手段を提供することができる。
また、第2の実施の形態によれば、蓄積画像の中から代表画像を選択し、その代表画像をクエリとしてネットワークから検索することにより識別関数を構成するための学習事例データを抽出する。その際、代表画像の個数に特に制約はないが、個数が多くなるほど、クエリによる画像検索にかかる負荷が大きくなる。従って分類対象データの特徴空間上で分布に応じて適切な個数の代表画像を(代表画像候補の中から)選択することが望まれる。つまり、特徴空間における分布の分散が大きい場合は、より広範の事例データを抽出する必要があるが、分散が小さい場合は、事例データの抽出負荷を軽減するためにも代表画像の個数は必要最小限に止める必要がある。このため、第2の実施の形態によれば、分散度合いに応じて適応的に代表画像の個数を調整することができる。
さらに、第2の実施の形態によれば、ユーザの使用頻度の高い画像を代表画像とした上で、学習用の事例データを抽出して識別関数を構成することにより、ユーザが頻繁に利用する画像データへ容易にアクセスすることができる。
また、第2の実施の形態によれば、ユーザの使用頻度の高い画像を代表画像とした上で学習用の事例データを抽出して識別関数を構成することにより、最新のデータについて高い分類精度を持つことが可能となり、ユーザ環境を反映した分類学習を行うことができる。
また、第2の実施の形態によれば、画像の解析、またはユーザからの指定によって各画像の重要度を取得し、それらを代表画像とした上で学習用の事例データを抽出し、識別関数を構成することにより、ユーザにとって重要度の高い分類精度を持つことが可能となり、ユーザ環境を反映した分類学習を行うことができる。
(第3の実施の形態)
第3の実施の形態は、分類学習対象である画像データに予めクラス情報としてのクラスラベル(教師信号)が付与されている場合に、この分類に基づいて分類を学習する点に特徴がある。例えば、大量の画像データ群を蓄積している画像DB17において、画像データがいくつかのフォルダに分類されて保存されている場合でも、既に存在する分類意図を把握し、それ以後は、新しく画像DB17に登録される未知の画像データについて、自動で分類を付与し、適切なフォルダに保存して管理することを可能にする。
例えば、分類に大きく寄与する特徴量を見極め、その特徴量に基づいて事例データを抽出し、学習する方法が考えられる。具体的には、各画像データから、色、テクスチャ、構図など、画像の概観に影響する複数の特徴量を抽出し、作成された特徴量ベクトルに対して、分類に寄与する特徴量(以下、分類特徴量という)を見極めるため、フィッシャーの判別分析などを利用して次元削減することにより、適切に分類するための分類特徴量を生成する。代表画像の決め方としては、例えばこの特徴量に関する分布において、各クラスの中心近くに位置するデータを代表画像としても良い(図3参照)。具体的には、画像データ取得部11が取得した画像データ群にクラス情報が予め付与されている場合、代表画像決定部12は、クラス内でばらつきが小さく、クラス間でばらつきの大きい分類特徴量を取得する分類特徴量取得部と、分類特徴量の分布に基づいて各クラスから1つ以上の画像データを選択して代表画像候補とする代表画像候補決定部とを備えていて、事例収集部13が分類特徴量取得部による分類特徴量に関する類似度に基づいて事例を収集するようにする。
フィッシャーの判別分析を利用した次元削減方法の基本概念は、クラス内の分散が小さく、かつクラス間の分散が大きい射影行列を決定することであり、特徴ベクトルを前記射影行列で射影したベクトルを各画像データに対する分類特徴量とする。この射影行列の求め方について以下簡単に説明する。
Figure 0005212007
図6は、第3の実施の形態にかかる動作を説明するフローチャートである。まず、図6に示すように、画像取得部11は、分類対象となる画像データ群を画像DB17から取得する(ステップS300)。代表画像決定部12は、上述したフィッシャーの判別分析を利用した次元削減方法により分類特徴量を生成し(ステップS301)、各クラスから代表画像を決定する(ステップS302)。
続いて、事例収集部13の画像検索部13aは、決定した代表画像をクエリとして類似画像検索を行う(ステップS303)。その際、分類特徴量に関する類似度により類似画像検索が行われる。
続いて、事例収集部13の事例データ抽出部13bは、検索によって取得された画像データから分類特徴量を抽出して学習用の事例データを抽出し(ステップS304)、事例データ記憶部16に記憶させる。その際、各クラスについて、代表画像に類似する画像として検索された画像データの中から当該クラスの正事例を抽出し、その他のクラスの代表画像に類似する画像として検索された画像データから当該クラスの負事例を抽出する。
続いて、識別関数生成部14は、抽出した学習用の事例データに基づいて学習を行い、分類を判定する識別関数を算出する(ステップS305)。識別処理部16は、算出された識別関数を使用して画像データを各クラスに分類する(ステップS306)。
このように、第3の実施の形態によれば、画像DB17における画像データがフォルダごとに分類して保存され、蓄積されている画像データについて既に何らかのクラスラベルが付与されている場合は、それら既存の分類意図を把握し、学習用の事例データを抽出して、分類を決定付ける識別関数を生成するため、既存の分類に基づいて分類を学習することができる分類学習装置を提供することができる。
(第4の実施の形態)
第4の実施の形態にかかる画像分類学習装置は、機械学習を利用することにより汎化性能(学習に用いていない未知のデータに対して識別を行った際の性能)を持った識別関数を構成することが可能となる。しかし、画像DB17に対して新たに大量の画像が登録され、画像データが更新されたことにより登録内容が大きく変化する可能性がある。そのような状況下では、分類対象である画像データ群の様態が大きく変化したにも関わらず、既存の識別関数を使用すると分類精度が著しく低下することになる。
また、SVMなどに代表される一括学習は、多数の事例データに基づいて時には複雑な識別関数を生成する処理となるため、画像データベースが更新される度に学習を行うのはシステム上現実的ではない。例えば、SVMは、マージンの最大化が理論的に保証された優れた機械学習方法であるが、識別平面を決定するため2次計画問題を解くことになることから、最悪計算量はサンプルサイズの3乗のオーダーとなってしまい、処理負荷が非常に大きくなる。そこで、現在、SVMの学習用アルゴリズムであるSMO(Sequential Minimal Optimization)を使ったさまざまな高速化手法が提案されているが、逐次型の学習システムと比較すると、一括型の学習システムは処理負荷が大きいというデメリットがある。そこで、このような処理負荷の問題を軽減するため、学習を行うタイミングをシステム内で考慮する必要がある。
そこで、第4の実施の形態では、ユーザ環境である分類学習環境が変化した場合に、どのタイミングで再学習を行うかを判断し、学習を指示する機能を有している。具体的には、分類対象である画像データ群(画像DB17)の更新情報を取得した場合、再学習を行う必要があるか否かを判断する。その判断基準の一例としては、例えば分類時の重要な指標となる各クラスの代表画像が更新された場合、あるいは、予め指定された更新画像数や時間を指標として、再学習を行うタイミングを決定するようにしても良い。また、複数クラスのうち、1つのクラス内で更新が発生した場合は、全てのクラスについて事例データを更新しても良いが、処理負荷を考慮し、更新されたクラスについてのみ事例データを再度収集して再学習を行うようにしても良い。具体的には、制御部18は、画像データ群の分類学習環境に関する更新情報を取得する更新情報取得部と、取得した更新情報に基づいて、識別関数生成部14で再学習を行う必要があるか否かを判断し、必要な場合は識別関数生成部14に再学習を行わせて、新たな識別関数を生成するよう指示する分類学習管理部とを備えている。
第4の実施の形態にかかる画像分類学習装置において、再学習を行う場合など、画像データに対してクラスラベルと識別関数が与えられている場合に、識別精度を向上させるように学習する仕組みについて以下説明する。
図7は、第4の実施の形態において誤識別画像を代表画像としたりクラス単位の識別精度に応じて学習事例数を調整したりする場合の動作を説明するフローチャートである。識別精度を向上させるアプローチとして、誤識別画像を代表画像としたり、あるいは、クラス単位の識別精度に応じて学習事例数を調整したりすることが考えられる。具体的には、分類対象となる画像データ群に既存のクラス情報と識別関数とが存在する場合に、制御部18は、画像データ群を識別関数で識別して、誤識別となった画像データを代表画像決定部12により代表画像に追加し、かつ各クラスについて識別関数に関するクラス識別精度を算出するクラス識別精度算出部を備え、事例収集部13によってクラス識別精度の低いクラスの事例収集割合を多くすることにより、識別精度の向上を図るものである。
まず、図7に示すように、画像取得部11は、クラスごとに画像データ群を取得し(ステップS400)、代表画像決定部12は、既存の識別関数を使って各データを識別し(ステップS401)、クラスラベルと照合して正しく識別されたか否かを判定する(ステップS402)。その判定の結果、正しく識別されていない場合、即ち誤識別とされた画像データは、新たな代表画像として追加され(ステップS403)、ステップS404に移行する。
また、ステップS402における判定の結果、正しく識別されていると判定された場合は、ステップS404に移行し、処理対象クラスにおいて全ての画像の識別が終了したか否かを判定する。ここで、まだ識別していない画像が残っている場合は、ステップS401に戻り、次の画像データの識別が行われる。
また、ステップS404において、全ての画像の識別が終了した場合は、クラス識別精度を算出し(ステップS405)、クラスごとの学習事例数を決定する(ステップS406)。そして、ステップS407では、全てのクラスで処理が終了したかを判定し、まだ処理が終了していないクラスが残っている場合は、ステップS400に戻って、次のクラスについて同様の画像データ識別処理が繰り返される。ステップS407で、全てのクラスにおける識別処理が終了した場合は、処理を終了する。
このように、第4の実施の形態によれば、識別関数の生成に必要なデータの更新情報を取得すると、再学習を行う必要があるか否かを適切に判断し、必要な場合は再学習するように指示することで、学習処理の負荷を軽減しつつ、画像データ群の更新といったユーザ環境の変化にも対応可能な画像分類学習装置および画像分類学習システムを得ることができる。
また、第4の実施の形態によれば、既存の識別関数が存在し、再学習を行う場合に、現状の識別精度を把握することにより、学習事例データの内容を調整して、識別精度を向上させることができる。具体的には、誤識別となった画像データを代表画像とし、これと類似した画像データを収集して事例データを抽出するようにしたため、誤識別となった画像データの識別精度を向上させることができる。
さらに、第4の実施の形態によれば、既存の識別関数が存在し、再学習を行う場合に、現状の識別精度を把握することにより、学習事例データ数を調整して、識別精度を向上させることができる。具体的には、既存の識別関数を使用してクラス内識別精度を算出し、他のクラスの識別精度と比較して、識別精度の低いクラスについての事例データの抽出割合を高くすることにより、識別精度が低かったクラスの識別精度を向上させることができる。
(第5の実施の形態)
また、識別精度を向上させるもう1つのアプローチとしては、識別時の識別平面との距離を利用する方法が考えられる。SVMでは、学習時に決定される識別平面において平面上に存在する事例をサポートベクターと称して、識別時に重要な役割を果たすが、一般に識別平面からの距離が近いデータは、誤識別する可能性が高いと言える。このため、第5の実施の形態では、分類対象となる画像データ群に既存のクラス情報と識別関数とが存在する場合、制御部18は、各画像データ群の識別平面からの距離を算出し、その算出した距離が予め指定した閾値以下の画像データを代表画像として追加し、かつ制御部18が算出した識別平面からの距離に応じて、事例収集部13が事例の収集個数を決定するようにする。具体的には、事例の収集個数を識別平面からの距離が小さいほど多く設定し、誤識別しやすいデータに関する事例を確実に集めることによって、結果的に識別精度の向上を図るようにしたものである。
図8は、第5の実施の形態において識別時の識別平面との距離を利用する場合の動作を説明するフローチャートである。以下、図8を用いて、第5の実施の形態にかかる動作を説明する。
図8に示すように、画像取得部11は、画像データ群を取得し(ステップS500)、代表画像決定部12は、既存の識別関数に基づいて識別平面との距離を算出する(ステップS501)。ステップS502において算出した距離が閾値(Th)より大きいか否かを判定し(ステップS502)、算出した距離が閾値(Th)以下の場合は、画像データを代表画像に追加し(ステップS503)、ステップS504に移行する。また、ステップS502において算出した距離が閾値(Th)より大きい場合は、ステップS504に移行して、画像ごとに収集する学習事例数を決定する。
そして、ステップS505において、全てのクラスで処理が終了したか否かを判定し、まだ処理していないクラスが残っている場合は、上記ステップS500に戻り、次のクラスについて同様の処理が繰り返される。また、ステップS505において、全てのクラスでの処理が終了した場合は、処理を終了する。
このように、第5の実施の形態によれば、画像データの分類指標となる既存の識別関数が存在し、再学習を行う場合に、より精度の高い識別関数を構成するため、誤識別しやすい画像データに関する学習ウェイトを大きくすることにより、識別精度を向上させることができる。具体的には、既存の識別関数において、識別平面からの距離が近い画像データは誤識別する可能性が高いと言える。このため、そのような画像データと類似した事例の収集割合を多くし、学習時に与えることによって、識別精度を向上させることができる。
また、第5の実施の形態によれば、一括型の機械学習によって識別関数を算出する場合は、一般的に処理負荷が大きくなる。例えば、SVMの場合は、2次計画問題を解くことになるため、最悪計算量はサンプルサイズの3乗のオーダーとなる。そのため、画像DB17は、その内容が更新される度に学習を行うと登録に時間がかかることになる。そこで、分類の指標となる代表画像が更新されるタイミングに合わせて再学習を行うことにより、処理負荷を軽減しつつ、画像データ群の更新といったユーザ環境の変化にも対応可能な画像分類学習装置および画像分類学習システムを得ることができる。
(第6の実施の形態)
第6の実施の形態にかかる画像分類学習装置は、代表画像を決定し、その代表画像をクエリとしてインターネット上、もしくは適当な画像DB17内を検索して、学習用の事例データを収集する。代表画像は、ユーザによって指示することが可能であり、その代表画像に基づいてクエリ検索した結果、異なるクラスの事例に同一の画像データが含まれる可能性がある。そのような事例データを学習時に与えるのは適切でないため、第6の実施の形態では、収集した事例データのうち、異なるクラスに同一の事例データが含まれていることを制御部18が検出すると、当該事例データを削除するようにする。このように、不適切な事例データを除去することで、学習精度を向上させるものである。
図9は、第6の実施の形態にかかる動作を説明するフローチャートである。まず、図9に示すように、制御部18は、事例データ記憶部16から事例データを取得し(ステップS600)、当該事例データと別のクラスの事例データとを比較し(ステップS601)、別のクラスの事例データに一致するものがあるか否かを判定する(ステップS602)。一致しなければステップS603で次の事例データがあるか否かを判定し、ある場合はステップS601に戻る。次の事例データが無い場合は、ステップS605に移行する。
上記ステップS602において、別のクラスに同じ事例データがあった場合は、ステップS604に移行し、同じ事例データを削除して、ステップS605に移行する。ステップS605では、異なるクラスの全ての事例データと比較したか否かが判定され、まだ比較していない事例データがある場合は、ステップS600に戻り、新たな事例データと別のクラスの事例データとの比較処理が繰り返される。ステップS605において、異なるクラスの全ての事例データと比較した場合は、処理を終了する。
このように、第6の実施の形態によれば、分類クラスに対応した代表画像をクエリとして類似画像を検索し、クラス毎の事例データとして事例データ抽出部13bが抽出する場合に、制御部18は、異なるクラスの中に同じ事例データが含まれていると、当該事例データを不適切なデータとして削除するため、学習精度を向上させることができる。
第1の実施の形態にかかる画像分類学習装置の一構成例を示すブロック図である。 第1の実施の形態にかかる画像分類学習システムの一構成例を示すブロック図である。 図1の代表画像決定部で代表画像を決定する場合のユーザインターフェース画面例を示す図である。 第1の実施の形態にかかる画像分類学習装置の動作を説明するフローチャートである。 第2の実施の形態にかかる動作を説明するフローチャートである。 第3の実施の形態にかかる動作を説明するフローチャートである。 第4の実施の形態において誤識別画像を代表画像としたりクラス単位の識別精度に応じて学習事例数を調整したりする場合の動作を説明するフローチャートである。 第5の実施の形態において識別時の識別平面との距離を利用する場合の動作を説明するフローチャートである。 第6の実施の形態にかかる動作を説明するフローチャートである。
符号の説明
10 画像分類学習装置
11 画像取得部
12 代表画像決定部
13 事例収集部
13a 画像検索部
13b 事例データ抽出部
14 識別関数生成部
15 識別処理部
16 事例データ記憶部
17 画像データベース(DB)
18 制御部
19 操作表示部
20 画像分類学習システム
21 クライアント端末
22 ウェブ検索エンジン
23 ウェブサイト
24 インターネット

Claims (16)

  1. 画像データ群の分類を学習する画像分類学習装置であって、
    分類対象となる前記画像データ群を取得する画像データ取得手段と、
    前記分類を行う各クラスを代表する代表画像を決定する代表画像決定手段と、
    前記決定した代表画像をクエリとして類似画像を検索し、学習事例として収集する事例収集手段と、
    前記決定した代表画像と前記収集した事例とに基づいて学習を行い、分類の判定基準となる識別関数を生成する識別関数生成手段と、
    前記識別関数に基づいて前記画像データ群を分類する分類手段と、
    前記各手段を制御する制御手段と、
    を備えたことを特徴とする画像分類学習装置。
  2. 前記制御手段は、
    前記画像データ群の分類学習環境に関する更新情報を取得する更新情報取得部と、
    前記取得された更新情報に基づいて、前記識別関数生成手段で再学習を行う必要があるか否かを判断し、必要な場合は前記識別関数生成手段に再学習を行わせて、新たな識別関数を生成するように指示する分類学習管理部と、
    を備えたことを特徴とする請求項1に記載の画像分類学習装置。
  3. 前記分類対象となる画像データ群に既存のクラス情報と識別関数とが存在する場合、前記制御手段は、前記画像データ群を前記識別関数で識別し、誤識別となった画像データを前記代表画像決定手段により代表画像と決定させることを特徴とする請求項1または2に記載の画像分類学習装置。
  4. 前記分類対象となる画像データ群に既存のクラス情報と識別関数とが存在する場合、前記制御手段は、前記各クラスについて前記識別関数に関するクラス識別精度を算出するクラス識別精度算出部を備え、
    前記事例収集手段は、前記クラス識別精度の低いクラスの事例収集割合を多くすることを特徴とする請求項2に記載の画像分類学習装置。
  5. 前記分類対象となる画像データ群に既存のクラス情報と識別関数とが存在する場合、前記制御手段は、各画像データ群の識別平面からの距離を算出し、該算出された距離が予め指定された閾値以下の画像データを前記代表画像決定手段で代表画像と決定させることを特徴とする請求項1または2に記載の画像分類学習装置。
  6. 前記事例収集手段は、前記制御手段が算出した識別平面からの距離に応じて、事例の収集個数を決定することを特徴とする請求項5に記載の画像分類学習装置。
  7. 前記画像データ取得手段が取得した画像データ群にクラス情報が付与されていない場合、前記制御手段は、前記画像データ群から画像特徴量を抽出し、特徴ベクトルを生成する特徴ベクトル生成部を備え、
    前記代表画像決定手段は、前記特徴ベクトル生成部によって生成された特徴量ベクトルについて、特徴空間における特徴ベクトルの分布のばらつきがクラス内では小さく、クラス間では大きくなる仮のクラスを構成し、各仮のクラスについて1つ以上の画像データを代表画像候補とすることを特徴とする請求項1に記載の画像分類学習装置。
  8. 前記画像データ取得手段が取得した画像データ群にクラス情報が予め付与されている場合、前記代表画像決定手段は、前記クラス内でばらつきが小さく、前記クラス間でばらつきの大きい分類特徴量を取得する分類特徴量取得部と、前記分類特徴量の分布に基づいて各クラスから1つ以上の画像データを選択して代表画像候補とする代表画像候補決定部とを備え、
    前記事例収集手段は、前記分類特徴量取得部による分類特徴量に関する類似度に基づいて事例を収集することを特徴とする請求項1に記載の画像分類学習装置。
  9. クラス内画像データの特徴空間における分布の分散度合いに応じて代表画像に選出する画像数を決定することを特徴とする請求項7または8に記載の画像分類学習装置。
  10. 前記画像データ取得手段により取得された画像データ群の中から適当数の画像データとクラス情報とをペアで指定する指定手段を備え、
    前記代表画像決定手段は、前記指定手段により指定された画像データを前記クラス情報が表すクラスの代表画像と決定することを特徴とする請求項1に記載の画像分類学習装置。
  11. 前記制御手段は、前記事例収集手段が収集した事例のうち、異なるクラスに同じ事例が含まれている場合は、当該事例を削除することを特徴とする請求項1に記載の画像分類学習装置。
  12. 前記代表画像決定手段は、
    前記代表画像候補からアクセス回数情報を取得するアクセス回数情報取得部と、
    各クラスにつき前記代表画像候補をアクセス回数順にソートするアクセス回数順ソート部と、
    ソートされた上位から予め指定された個数分の前記代表画像候補を選択して、前記各クラスの代表画像データとする第1の代表画像データ決定部と、
    を備え、前記代表画像候補をアクセス回数により絞り込むことを特徴とする請求項7または8に記載の画像分類学習装置。
  13. 前記代表画像決定手段は、
    前記代表画像候補から更新年月日を取得する更新年月日取得部と、
    各クラスにつき前記代表画像候補を更新年月日順にソートする更新年月日順ソート部と、
    ソートされた上位から予め指定された個数分の前記代表画像候補を選択して、前記各クラスの代表画像データとする第2の代表画像データ決定部と、
    を備え、前記代表画像候補を更新年月日により絞り込むことを特徴とする請求項7または8に記載の画像分類学習装置。
  14. 前記代表画像決定手段は、
    前記代表画像候補から画像データの重要度を取得する重要度取得部と、
    各クラスにつき前記代表画像候補を重要度順にソートする重要度順ソート部と、
    ソートされた上位から予め指定された個数分の前記代表画像候補を選択して、前記各クラスの代表画像データとする第3の代表画像データ決定部と、
    を備え、前記代表画像候補を重要度により絞り込むことを特徴とする請求項7または8に記載の画像分類学習装置。
  15. 画像データ群の分類を学習する画像分類学習方法であって、
    画像データ取得手段が、分類対象となる前記画像データ群を取得するステップと、
    代表画像決定手段が、分類を行う各クラスを代表する代表画像を決定するステップと、
    事例収集手段が、前記決定した代表画像をクエリとして類似画像を検索し、学習事例として収集するステップと、
    識別関数生成手段が、前記決定した代表画像と前記収集した事例とに基づいて学習を行い、分類の判定基準となる識別関数を生成するステップと、
    分類手段が、前記識別関数に基づいて前記画像データ群を分類するステップと、
    を含むことを特徴とする画像分類学習方法。
  16. 画像データ群の分類を学習する画像分類学習システムであって、
    分類対象となる前記画像データ群を取得する画像データ取得装置と、
    前記分類を行う各クラスを代表する代表画像を決定する代表画像決定装置と、
    前記決定した代表画像をクエリとして類似画像を検索し、学習事例として収集する事例収集装置と、
    前記決定した代表画像と前記収集した事例とに基づいて学習を行い、分類の判定基準となる識別関数を生成する識別関数生成装置と、
    前記識別関数に基づいて前記画像データ群を分類する分類装置と、
    を備えたことを特徴とする画像分類学習システム。
JP2008264058A 2008-10-10 2008-10-10 画像分類学習装置、画像分類学習方法、および画像分類学習システム Active JP5212007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008264058A JP5212007B2 (ja) 2008-10-10 2008-10-10 画像分類学習装置、画像分類学習方法、および画像分類学習システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008264058A JP5212007B2 (ja) 2008-10-10 2008-10-10 画像分類学習装置、画像分類学習方法、および画像分類学習システム

Publications (2)

Publication Number Publication Date
JP2010092413A JP2010092413A (ja) 2010-04-22
JP5212007B2 true JP5212007B2 (ja) 2013-06-19

Family

ID=42255037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008264058A Active JP5212007B2 (ja) 2008-10-10 2008-10-10 画像分類学習装置、画像分類学習方法、および画像分類学習システム

Country Status (1)

Country Link
JP (1) JP5212007B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109346187A (zh) 2010-10-19 2019-02-15 皇家飞利浦电子股份有限公司 利用表现出特殊特性的病例使患者数据库动态生长的系统与方法
KR101919831B1 (ko) 2012-01-11 2018-11-19 삼성전자주식회사 오브젝트 인식 장치, 분류 트리 학습 장치 및 그 동작 방법
JP5764080B2 (ja) * 2012-03-02 2015-08-12 株式会社栗本鐵工所 Web検索システムおよびWeb検索方法
US10977571B2 (en) * 2015-03-02 2021-04-13 Bluvector, Inc. System and method for training machine learning applications
JP6489005B2 (ja) * 2015-12-18 2019-03-27 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム
KR102359556B1 (ko) * 2016-11-11 2022-02-08 삼성전자주식회사 지문 영상을 이용한 사용자 인증 방법 및 사용자 인증을 위한 부호화 모델 생성 방법
JP6930277B2 (ja) * 2017-08-09 2021-09-01 沖電気工業株式会社 提示装置、提示方法、通信制御装置、通信制御方法及び通信制御システム
JP6501855B1 (ja) * 2017-12-07 2019-04-17 ヤフー株式会社 抽出装置、抽出方法、抽出プログラム及びモデル
JP7328144B2 (ja) * 2019-12-27 2023-08-16 五洋建設株式会社 切羽性状推定装置および推定方法
CN111666957B (zh) * 2020-07-17 2023-04-25 湖南华威金安企业管理有限公司 图像真实性的识别方法及装置
JP7341962B2 (ja) 2020-08-27 2023-09-11 株式会社東芝 学習データ収集装置、学習装置、学習データ収集方法およびプログラム
JP7200279B2 (ja) * 2021-03-03 2023-01-06 三菱電機インフォメーションシステムズ株式会社 検知装置、検知方法、検知プログラム及び検知システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4302799B2 (ja) * 1998-09-16 2009-07-29 シャープ株式会社 文書検索装置、方法および記録媒体
JP4034602B2 (ja) * 2002-06-17 2008-01-16 富士通株式会社 データ分類装置、データ分類装置の能動学習方法及び能動学習プログラム
JP4347226B2 (ja) * 2004-05-20 2009-10-21 富士通株式会社 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP4645288B2 (ja) * 2005-04-28 2011-03-09 日本電気株式会社 能動学習方法および能動学習システム
US20100005043A1 (en) * 2006-12-11 2010-01-07 Yoshiko Yamashita Active learning system, active learning method and program for active learning

Also Published As

Publication number Publication date
JP2010092413A (ja) 2010-04-22

Similar Documents

Publication Publication Date Title
JP5212007B2 (ja) 画像分類学習装置、画像分類学習方法、および画像分類学習システム
Zhao et al. Learning mid-level filters for person re-identification
CN110717534B (zh) 一种基于网络监督的目标分类和定位方法
WO2019015246A1 (zh) 图像特征获取
CN107203775B (zh) 一种图像分类的方法、装置和设备
JP2010504593A (ja) 分類手法を用いて画像からドミナントカラーを抽出する方法
WO2022126810A1 (zh) 文本聚类方法
EP2618289A2 (en) Method and apparatus to incorporate automatic face recognition in digital image collections
CN108121781B (zh) 基于高效样本选取与参数优化的相关反馈图像检索方法
WO2015035477A1 (en) Image searching method and apparatus
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
JP5346756B2 (ja) 画像分類装置
US20120020576A1 (en) Interactive image selection method
WO2020136586A1 (en) Marketing engine based on traits and characteristics of prospective consumers
CN111797267A (zh) 一种医学图像检索方法及系统、电子设备、存储介质
JP6680956B1 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
CN109271544B (zh) 自动挑选画家代表作的方法及装置
US20220083587A1 (en) Systems and methods for organizing an image gallery
Vu et al. An efficient density-based clustering with side information and active learning: a case study for facial expression recognition task
JP6764992B2 (ja) 検索システム、検索方法、及びプログラム
JP5929532B2 (ja) イベント検出装置、イベント検出方法およびイベント検出プログラム
JP2004192555A (ja) 情報管理方法、情報管理装置及び情報管理プログラム
CN116612307A (zh) 一种基于迁移学习的茄科病害等级识别方法
JP2018013886A (ja) 認識容易性指標算出装置、方法、及びプログラム
CN110941994B (zh) 一种基于元类基学习器的行人重识别集成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110811

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130211

R151 Written notification of patent or utility model registration

Ref document number: 5212007

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3