JP5157848B2 - 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 - Google Patents
画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 Download PDFInfo
- Publication number
- JP5157848B2 JP5157848B2 JP2008301386A JP2008301386A JP5157848B2 JP 5157848 B2 JP5157848 B2 JP 5157848B2 JP 2008301386 A JP2008301386 A JP 2008301386A JP 2008301386 A JP2008301386 A JP 2008301386A JP 5157848 B2 JP5157848 B2 JP 5157848B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- classification rule
- classified data
- classification
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
従来から、フラットベッドスキャナや、デジタルスチルカメラ等の、画像をデジタル信号へ変換し、PCへ取り込む画像入力機器がある。デジタル信号としてPCへ取り込まれた画像は、PC上での閲覧、画像処理ソフトウェアを用いる編集、又は、プリンタを用いる出力等に利用される。
以下の実施の形態では、Multi Function Printer(以下、「MFP」という。)を例に説明する。図1は、本実施の形態に係る分類規則生成装置1とその周辺機器とを示すブロック図である。図1の分類規則生成装置1は、MFP100、PC101、及び、表示装置102を有する。またPC101には、キーボード103とマウス104とが接続されている。
ユーザがPC101を操作することにより、MFP100内のハードディスクに蓄積された画像データへアクセスする。PC101には、キーボード103及びマウス104が接続しており、これらを用いてMFP100内のハードディスクに蓄積された画像を閲覧するアプリケーションを操作することが出来る。尚、操作の経過や閲覧している画像などは表示装置102に表示されるものとする。
図4は、画像が、MFP100の入力手段から入力されハードディスクに蓄積されるときの処理の概略を示すものである。入力手段により画像が入力されると、画像はMFP100内のハードディスク205に蓄積され、さらに、特徴量算出手段200によって特徴量が算出される。画像は、さらに、算出された特徴量に基づいて分類手段201によって分類される。分類された結果は図2に示す、画像ID、ファイル名、及び、特徴量と対応づけられてハードディスクに格納される。
特徴量算出手段200は、例えば、色、エッジ及び模様の3種類の特徴量を算出する。本実施の形態では、前提として、画像内の各画素の色情報が、R(レッド)、G(グリーン)、B(ブルー)の3原色の階調をそれぞれ0〜255の256階調で示しているものとする。3原色の階調が何れも0である場合には、その画素の色は黒となる。また、3原色の階調が何れも255である場合には、その画素の色は白となる。このように、各画素には、sRGB表色系の3次元の色情報が割り当てられる。
図7は、分類手段201の構成を説明する図である。特徴量算出手段200で出力された特徴量ベクトルを第1の分類手段300にて人物であるかどうかの判定を行い、同様に第2の分類手段301では風景、第3の分類手段302では生き物で有るかどうかの判定を行う。それぞれの判定手段からは−1〜1の値が出力され、値が大きい程信頼度が高いと考えられる。それぞれの判定手段の出力を比較手段303にて比較し、最も大きいものを判定結果とする。
次にSVMによる分類規則の生成方法について説明する。SVMは式(13)で示すように入力ベクトルと重みベクトルωの内積が特定の閾値を超えていればy=1を出力し、超えていなければy=−1を出力する識別器である。例えば、出力y=1のとき入力画像は文書画像であり、出力y=−1のとき、入力画像が写真画像であると判定する。つまり、SVMの学習とは前記重みベクトルω、及び閾値hを決定する作業である。尚、特許文献1に記載のSVMの学習の概要を以下で説明する。
図9は、分類規則を再生成する際の処理の概要を示す図である。図9の処理は、例えば、ユーザの操作によって開始される。
以下、ステップS400のAdaBoostによる分類規則生成とステップS401の特徴量とサンプル数削減について詳述する。
AdaBoostは本来、SVMと同様に分類規則の生成手段である。複数の貧弱な識別器の結果の重み付き多数決を採ることで高精度な判定結果を得ることができる。尚、ここでいう貧弱な識別器(弱識別器)と言う言葉は、それらを組み合わせて得られる高精度な識別器を強識別器と呼ぶのと対比するための言葉で、実際にはどんな識別器であっても構わない。弱識別器をどのように設計するかにもよるが、一般にAdaBoostはSVMよりも高速に分類、識別が行えると言われている。
サンプル重みを利用することでサンプル数を削減することが出来る。例えば図11に示すような2次元の特徴量分布が得られたとする。図11では、○が1のラベルが付けられたサンプル、×が−1のラベルが付けられたサンプルを示す。図11より、最終的に得たい分類規則の境界線が図中の点線になることは明らかである。
AdaBoostもSVMもこの境界線を求めて、入力されたベクトルがそれよりも内側に存在するか、外側に存在するかを判定する識別器である。
本実施の形態では、AdaBoostの学習過程で算出される重みの履歴を利用することで異なるラベルの付いたサンプルの境界付近に存在するサンプルを抽出することを特徴とする。以下、重みの履歴を利用することで境界付近に存在するサンプルが抽出できることを説明する。
本実施の形態では、サンプル数の削減による学習の高速化手段を提示しているが、本実施の形態で利用している弱識別器は、特定の次元にだけ着目する。そのため、学習により得られた各弱識別器が注目した次元により、分類に対して重要な特徴量と、重要でない特徴量とを分けることが出来る。一般に、今回算出した特徴量が全て分類に重要であることは少なく、実際にはもっと少ない次元の特徴量で、分類することが可能である。つまり、SVMによる学習時の特徴量を削減することが出来るので、より高速なSVMによる学習が行える。尚、この特徴量削減手法は、非特許文献4に述べられている手法と同様である。非特許文献4は、特徴量次元を削減することにより、識別時の高速化を図っている。一方、本実施の形態では学習時の高速化を図っている。
本発明の第2の実施の形態は、第1の実施の形態と、ほぼ構成を同じくするものであるが、学習サンプル数を削減する為の境界付近に存在するデータの抽出方法が異なる。第1の実施の形態ではAdaBoostを用いてサンプルを抽出したが、本実施の形態では、各サンプルの近傍に存在するサンプルのラベルを調べることでサンプルの抽出を行う。
なお、本発明の実施の形態に係る画像処理装置は、例えばパーソナルコンピュータ(PC)等で実現されてもよい。また、本発明の実施形態に係る画像処理方法は、例えば、CPUがROMやハードディスク装置等に記憶されたプログラムに従い、RAM等のメインメモリをワークエリアとして使用し、実行される。
22 画像表示部
102 表示装置
103 キーボード
104 マウス
200 特徴量算出手段
201 分類手段
205 ハードディスク
300 第一の分類手段
301 第二の分類手段
302 第三の分類手段
303 比較手段
Claims (8)
- 異なる複数の画像特徴のそれぞれを軸とする多次元空間に位置する複数の画像の観測データを、前記画像特徴に基づく複数のクラスに分類する分類規則を生成する画像処理装置であって、
前記画像特徴の情報を付与された前記観測データである分類済データのうち、一の前記クラスの境界の近傍の分類済データである境界データを検出するデータ検出手段と、
前記境界データにより、第1の分類規則を生成する第1の分類規則生成手段と、
第2の分類規則を生成する際の前記分類済データ毎の重要度である重みを付与された複数の前記分類済データに基づいて分類器を生成する分類器生成処理と、前記重みを付与された複数の前記分類済データを前記分類器がクラスに分類する分類処理と、前記分類済データの重みを更新する重み付け処理と、を含む分類規則生成処理を行い前記第2の分類規則を生成する第2の分類規則生成手段と、
を有し、
前記第2の分類規則生成手段は、前記分類規則生成処理を1回以上繰り返し、前記重み付け処理において、前記分類済データのうち、前記分類処理により分類されたクラスに対応する画像特徴の情報と、該分類済データが前記第2の分類規則生成手段に入力される前に既に付与されている画像特徴の情報と、が異なる分類済データに対する前記重要度が高くなる重みの更新を行い、
前記データ検出手段は、前記分類規則生成処理が繰り返される際の前記重みの更新の履歴に基づいて、前記境界データを検出する
ことを特徴とする画像処理装置。 - 前記重みの更新の履歴は、前記分類規則生成処理毎に付与される重みの平均値であり、
前記第2の分類規則生成手段は、繰り返される前記分類規則生成処理のうち一の前記分類規則生成処理において、前記平均値が第1の所定の値より大きい分類済データを選択して、前記一の分類規則生成処理を行うことを特徴とする請求項1記載の画像処理装置。 - 前記第2の分類規則生成手段は、繰り返される前記分類規則生成処理のうち一の前記分類規則生成処理において、前記平均値が第2の所定の値より大きい分類済データを、前記一の分類規則生成処理に用いないことを特徴とする請求項2記載の画像処理装置。
- 前記データ検出手段は、
異なる複数の前記分類済データの間の距離を算出する距離算出手段と、
前記距離算出手段により算出された距離に基づき、複数の前記分類済データのうち一の分類済データに最も近接する他の二以上の分類済データを抽出する近接データ抽出手段と、
前記一の分類済データの画像特徴の情報と前記他の二以上の分類済データの画像特徴の情報と、を比較することにより、該一の分類済データが境界データであるか否かを判定する判定手段と、
を有することを特徴とする請求項1ないし3何れか一項記載の画像処理装置。 - 異なる複数の画像特徴のそれぞれを軸とする多次元空間に位置する複数の画像の観測データを、前記画像特徴に基づく複数のクラスに分類する分類規則を生成する画像処理装置における画像処理方法であって、
前記画像特徴の情報を付与された前記観測データである分類済データのうち、一の前記クラスの境界の近傍の分類済データである境界データを検出するデータ検出ステップと、
前記境界データにより、第1の分類規則を生成する第1の分類規則生成ステップと、
第2の分類規則を生成する際の前記分類済データ毎の重要度である重みを付与された複数の前記分類済データに基づいて分類器を生成する分類器生成処理と、前記重みを付与された複数の前記分類済データを前記分類器がクラスに分類する分類処理と、前記分類済データの重みを更新する重み付け処理と、を含む分類規則生成処理を行い前記第2の分類規則を生成する第2の分類規則生成ステップと、
を有し、
前記第2の分類規則生成ステップにおいて、前記分類規則生成処理を1回以上繰り返し、前記重み付け処理において、前記分類済データのうち、前記分類処理により分類されたクラスに対応する画像特徴の情報と、該分類済データが前記第2の分類規則生成ステップにおいて入力される前に既に付与されている画像特徴の情報と、が異なる分類済データに対する前記重要度が高くなる重みの更新を行い、
前記データ検出ステップにおいて、前記分類規則生成処理が繰り返される際の前記重みの更新の履歴に基づいて、前記境界データを検出する
ことを有することを特徴とする画像処理方法。 - 前記データ検出ステップは、
異なる複数の前記分類済データの間の距離を算出する距離算出ステップと、
前記距離算出ステップにおいて算出された距離に基づき、複数の前記分類済データのうち一の分類済データに最も近接する他の二以上の分類済データを抽出する近接データ抽出ステップと、
前記一の分類済データの画像特徴の情報と前記他の二以上の分類済データの画像特徴の情報と、を比較することにより、該一の分類済データが境界データであるか否かを判定する判定ステップと、
を有することを特徴とする請求項5記載の画像処理方法。 - 請求項5、及び6記載の画像処理方法をコンピュータに実行させるためのコンピュータプログラム。
- 請求項7記載のコンピュータプログラムを記録したことを特徴とするコンピュータ読み取り可能な情報記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008301386A JP5157848B2 (ja) | 2008-11-26 | 2008-11-26 | 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008301386A JP5157848B2 (ja) | 2008-11-26 | 2008-11-26 | 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010128706A JP2010128706A (ja) | 2010-06-10 |
JP5157848B2 true JP5157848B2 (ja) | 2013-03-06 |
Family
ID=42329064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008301386A Expired - Fee Related JP5157848B2 (ja) | 2008-11-26 | 2008-11-26 | 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5157848B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5565190B2 (ja) * | 2010-08-11 | 2014-08-06 | 富士ゼロックス株式会社 | 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置 |
JP6961539B2 (ja) * | 2018-06-22 | 2021-11-05 | 株式会社ブリヂストン | 路面状態判別方法及び路面状態判別装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5017941B2 (ja) * | 2006-06-27 | 2012-09-05 | オムロン株式会社 | モデル作成装置および識別装置 |
JP2008027130A (ja) * | 2006-07-20 | 2008-02-07 | Seiko Epson Corp | オブジェクト認識装置およびオブジェクト認識方法ならびにオブジェクト認識用プログラム |
JP2008283361A (ja) * | 2007-05-09 | 2008-11-20 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
-
2008
- 2008-11-26 JP JP2008301386A patent/JP5157848B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010128706A (ja) | 2010-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4859025B2 (ja) | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 | |
US8699789B2 (en) | Document classification using multiple views | |
US8370338B2 (en) | Large-scale asymmetric comparison computation for binary embeddings | |
JP5149259B2 (ja) | ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置 | |
Kanan et al. | Color-to-grayscale: does the method matter in image recognition? | |
Ko et al. | Object-of-interest image segmentation based on human attention and semantic region clustering | |
US8879796B2 (en) | Region refocusing for data-driven object localization | |
US7623712B2 (en) | Image processing method and apparatus | |
Wang et al. | Visual saliency by selective contrast | |
US20110085728A1 (en) | Detecting near duplicate images | |
JP2007286767A (ja) | 画像検索システム、及び、画像検索サーバ及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2010140478A (ja) | 文書画像分類のための方法及びシステム | |
JP4772819B2 (ja) | 画像検索装置および画像検索方法 | |
JP6937508B2 (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
WO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および記録媒体 | |
JP4859054B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
WO2021129289A9 (zh) | 图像处理方法、装置、电子设备以及存储介质 | |
JP2006209353A (ja) | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 | |
US11410278B2 (en) | Automatic artifact removal in a digital image | |
JP5157848B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 | |
JP2020087165A (ja) | 学習データ生成プログラム、学習データ生成装置、及び学習データ生成方法 | |
US9424488B2 (en) | Applying a segmentation engine to different mappings of a digital image | |
Mohammed et al. | Proposed approach for automatic underwater object classification | |
JP6419560B2 (ja) | 検索装置、方法及びプログラム | |
KR101758869B1 (ko) | 멀티미디어 콘텐츠 분류장치 및 이를 이용한 분류방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121126 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |