JP5241590B2 - 情報処理装置及び識別方法 - Google Patents
情報処理装置及び識別方法 Download PDFInfo
- Publication number
- JP5241590B2 JP5241590B2 JP2009102277A JP2009102277A JP5241590B2 JP 5241590 B2 JP5241590 B2 JP 5241590B2 JP 2009102277 A JP2009102277 A JP 2009102277A JP 2009102277 A JP2009102277 A JP 2009102277A JP 5241590 B2 JP5241590 B2 JP 5241590B2
- Authority
- JP
- Japan
- Prior art keywords
- histogram
- feature amount
- image
- unit
- occurrences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
かかる構成することにより、画像中の複雑背景下における物体の識別精度を向上することができる。
また、本発明は、識別方法としてもよい。
図1は、情報処理装置の一例である物体識別装置の概略構成を示すブロック図である。物体識別装置は、半導体集積回路(LSI)を用いて実現される。
図1に示すように物体識別装置1は、画像入力部11、特徴量算出部12、ヒストグラム生成部13、学習部14、識別部15、制御部16を有する。これらの構成要素は物体識別装置1が果たす機能にそれぞれ対応している。
物体識別装置1が果たす機能を大別すると2つある。その一つは学習機能であり、学習部14で実行される。もう一つは識別機能であり、識別部15で実行される。このとき、画像入力部11、特徴量算出部12、ヒストグラム生成部13は、学習部14と、識別部15と、に共通して必要な機能を提供する。また、制御部16は、物体識別装置1の各構成要素の制御を行っている。
組合せ回路DMX111は、物体識別装置1の外部から入力される画像データIn11Aを、制御部16より入力される制御信号Ctrl11Aに基づいて、学習用画像データベース112と検定用画像データベース113とのどちらか一方に入力する。
組合せ回路MUX114は、制御部16より入力される制御信号Ctrl11Aに基づいて、学習用画像データベース112から出力される画像データOut112Aと検定用画像データベース113から出力される画像データOut113Aとのどちらか一方をOut11Bから出力する。
ここで制御部16は、物体識別装置1の学習時、画像データIn11Aを学習用画像データベース112に入力し、学習用画像データベース112からの出力画像データOut112AをOut11Bから学習部14に出力するように制御信号Ctrl11Aを用いて制御する。
また制御部16は、物体識別装置1の識別時、画像データIn11Aを検定用画像データベース113に入力し、検定用画像データベース113からの出力画像データOut113AをOut11Bから識別部15に出力するように制御信号Ctrl11Aを用いて制御する。
ペア点決定部121では、増分評価値を算出するためのペア点の位置を決定し、更に必要があれば、その位置における近似画素値を算出する。まずペア点決定のために、画像内における任意の着目点の位置をベクトルp=(x,y)Tで表すものとする。また、放射状の方向ベクトルdk(k=0,1,2,・・・,N)を定義する。ここでNはペア点の個数を表す。方向ベクトルdkを各々d0=(cos(2π・0/N),sin(2π・0/N))T,d1=(cos(2π・1/N),sin(2π・1/N))T,d2=(cos(2π・2/N),sin(2π・2/N))T,・・・,dn=(cos(2π・n/N),sin(2π・n/N))T,・・・,dN=(cos(2π・N/N),sin(2π・N/N))Tとする。つまり、方向ベクトルdkは、図6のように画面上で右水平方向から反時計回りに2π/N毎回転させた方向となる。
増分評価値算出部122では、ペア点決定部121で決定されたペア点を用いて着目点pの増分評価値b0(p)〜bN(p)を以下のように2値で与える。但し、f=f(x)は、画像中の任意の位置xにおける画素値を表す。
生成部131では、学習部14及び識別部15より入力されるM個の特徴値In13Aに対するヒストグラム(度数分布)を生成し、これをIn132Aとして変換部132に入力する。ここでMは、画像入力部11より学習部14に入力される画像一枚の総画素数(X×Y)に相当する。
学習用画像サイズ(X,Y)=(3,3)、特徴量算出部12におけるペア点の個数N=2の場合を考え、図9のように画像1、画像2、画像3に対する特徴値が与えられたとする。すると、生成部131は、図10のようなヒストグラムを生成し、このヒストグラムをIn132Aとして変換部132に出力する。
図10のようなヒストグラムIn132Aを変換部132により特徴値毎の生起回数に対するヒストグラムに変換すると図11のようになる。このとき、保存部133において保存されているヒストグラムOut133が図12のように与えられるとする。すると、変換部132は、変換した図11のヒストグラムと、保存部133に保存されている図12のヒストグラムと、に基づいて、最終的に図13のようなヒストグラムを生成し、これをIn133Aとして保存部133に入力する。
組合せ回路DMX1321は、変換部132から入力されるヒストグラムIn133Aを制御部16より入力される制御信号Ctrl132Aに基づいて、学習用ヒストグラムデータベース1332と検定用ヒストグラムデータベース1333のどちらか一方に入力する。
検定用ヒストグラムデータベース1333は、識別部15で用いられる検定用ヒストグラムを格納するものであり、図16のように所定サイズの検定用ヒストグラムを2N個格納できる。ここで個数Nは先の学習用ヒストグラムデータベース1332と同様、特徴量算出部12におけるペア点の個数Nと同等のものである。
組合せ回路MUX1334は、制御部16より入力される制御信号Ctrl132Aに基づいて、学習用ヒストグラムデータベース1332から出力されるヒストグラムOut1332と検定用ヒストグラムデータベース1333から出力されるヒストグラムOut1333とのどちらか一方をOut13Bから出力する。
制御部16は物体識別装置1の識別時、ヒストグラムIn133Aを検定用ヒストグラムデータベース1333に入力し検定用ヒストグラムデータベース1333からの出力画像データOut1333をOut13Bから識別部15に出力するように制御信号Ctrl132Aを用いて制御する。
このようなヒストグラムを複数生成することにより、後述する弱仮説の設定が容易になる。
弱仮説設定部141では、画像入力部11より入力される所定サイズ(X×Y)の対象画像及び非対象画像のOut11Bから特徴量算出部12を用いて、これらの画像全て画素の特徴値Ftr141Aを生成する。更に弱仮説設定部141は、特徴値Ftr141Aからヒストグラム生成部13を用いてヒストグラムHgm141Bを生成する。このとき、弱仮説設定部141は、図18のように特徴値毎に対象画像と非対象画像とを最も精度良く識別する生起回数に対する閾値ln(0<=n<2N)を設定し、弱仮説Lnを以下のような大小関係を用いて設定する。
強判別器生成部142では、弱仮説設定部141で生成された生起回数に対する弱仮説Ln(0<=n<2N)を用いて強判別器を生成する。強判別器を生成するためのより具体的方法としては、例えば以下の公知技術、「Friedman, J. H., Hastie, T. and Tibshirani, R. (1998). Additive logistic regression: a statistical view of boosting. Dept. of Statistics, Stanford University Technical Report.」等のBoosting学習を用いて実現される。その結果、弱仮説Lnに対する信頼度αnが生成され、Out142Aより識別部15に出力される。
図20は、検定画像の例を示す図である。解像度変換部151は、図20の(a)のような識別対象物体の処理画像中のサイズ変動に対応するため、画像入力部11より入力される検定画像Out11Bの解像度変換を行い、複数の検定画像を生成する。更に、解像度変換部151は、特徴量算出部12を用いてこれらの画像全てを特徴値Ftr151Bに変換する。但し、縮小倍率C及び解像度変換後の検定画像数nは、制御部16より入力される制御信号Ctrl15Aにより設定される。また、解像度変換を行うためのより具体的な方法としては、例えば以下の公知技術、ニアレストネイバー法、バイリニア法、バイキュービック法、等を用いて実現される。
上述した実施形態は、学習機能及び識別機能の両者を実行する物体識別装置に関するものであるが、学習機能及び照合機能の何れか一方のみを実行する物体識別装置についても本発明の実施形態に含まれる。
また、特徴量算出部12は、入力画像の輝度成分の平均を0、分散を1に変換する、分散正規化を用いてもよい。
また、特徴量算出部12は、入力画像の画素値に対する高次局所自己相関特徴を用いてもよい。
また、特徴量算出部12は、入力画像の画素値に対する増分符号相関特徴を用いてもよい。
また、上述した実施形態はソフトウェアを用いて実施されてもよい。
即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを、システム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体から読み出し実行することで実施形態の機能を実現することができる。
Claims (6)
- 画像データの領域内の特徴量を算出する算出手段と、
前記算出手段で算出された特徴量に基づいて、領域内の特徴量毎に、特徴量の生起回数に対するヒストグラムを生成する生成手段と、
前記生成手段で生成された複数のヒストグラムに基づいて生起回数を決定する決定手段と、
前記生成手段で生成された検定画像のヒストグラムと、前記決定手段で決定された生起回数と、に基づいて、前記検定画像中の物体を識別する識別手段と、
を有することを特徴とする情報処理装置。 - 前記生成手段は、前記算出手段で生成された特徴量に基づいて、領域内の特徴量毎に、特徴量に対するヒストグラムを生成し、該特徴量に対するヒストグラムに基づいて、特徴量の生起回数に対するヒストグラムを生成することを特徴とする請求項1に記載の情報処理装置。
- 前記決定手段は、前記生成手段で生成された、対象画像の領域内の特徴量の生起回数に対するヒストグラムと、非対象画像の領域内の特徴量の生起回数に対するヒストグラムと、に基づいて生起回数を決定することを特徴とする請求項1に記載の情報処理装置。
- 情報処理装置における識別方法であって、
画像データの領域内の特徴量を算出する算出ステップと、
前記算出ステップで算出された特徴量に基づいて、領域内の特徴量毎に、特徴量の生起回数に対するヒストグラムを生成する生成ステップと、
前記生成ステップで生成された複数のヒストグラムに基づいて生起回数を決定する決定ステップと、
前記生成ステップで生成された検定画像のヒストグラムと、前記決定ステップで決定された生起回数と、に基づいて、前記検定画像中の物体を識別する識別ステップと、
を有することを特徴とする識別方法。 - 前記生成ステップは、前記算出ステップで生成された特徴量に基づいて、領域内の特徴量毎に、特徴量に対するヒストグラムを生成し、該特徴量に対するヒストグラムに基づいて、特徴量の生起回数に対するヒストグラムを生成することを特徴とする請求項4に記載の識別方法。
- 前記決定ステップは、前記ヒストグラム生成ステップで生成された、対象画像の領域内の特徴量の生起回数に対するヒストグラムと、非対象画像の領域内の特徴量の生起回数に対するヒストグラムと、に基づいて生起回数を決定することを特徴とする請求項4に記載の識別方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009102277A JP5241590B2 (ja) | 2009-04-20 | 2009-04-20 | 情報処理装置及び識別方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009102277A JP5241590B2 (ja) | 2009-04-20 | 2009-04-20 | 情報処理装置及び識別方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250764A JP2010250764A (ja) | 2010-11-04 |
JP5241590B2 true JP5241590B2 (ja) | 2013-07-17 |
Family
ID=43312987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009102277A Active JP5241590B2 (ja) | 2009-04-20 | 2009-04-20 | 情報処理装置及び識別方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5241590B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2395779A (en) * | 2002-11-29 | 2004-06-02 | Sony Uk Ltd | Face detection |
JP2008217706A (ja) * | 2007-03-07 | 2008-09-18 | Tokyo Institute Of Technology | ラベリング装置、ラベリング方法及びプログラム |
-
2009
- 2009-04-20 JP JP2009102277A patent/JP5241590B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010250764A (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11734571B2 (en) | Method and apparatus for determining a base model for transfer learning | |
US11055571B2 (en) | Information processing device, recording medium recording information processing program, and information processing method | |
CN112800964B (zh) | 基于多模块融合的遥感影像目标检测方法及系统 | |
JP5861539B2 (ja) | 複数の画像の記述的情報を取得する方法及び装置、並びに画像マッチング方法 | |
US9619733B2 (en) | Method for generating a hierarchical structured pattern based descriptor and method and device for recognizing object using the same | |
JP6188976B2 (ja) | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 | |
CN106920245B (zh) | 一种边界检测的方法及装置 | |
WO2023116632A1 (zh) | 基于时空记忆信息的视频实例分割方法和分割装置 | |
CN110633711B (zh) | 训练特征点检测器的计算机装置、方法及特征点检测方法 | |
CN114758137B (zh) | 超声图像分割方法、装置及计算机可读存储介质 | |
CN111242925B (zh) | 针对ct影像数据的目标检测方法、装置及电子设备 | |
JP5747733B2 (ja) | 対象検出装置、対象検出方法、分類器作成装置及び分類器作成方法 | |
WO2019196718A1 (zh) | 元素图像生成方法、装置及系统 | |
CN116934747A (zh) | 眼底图像分割模型训练方法、设备和青光眼辅助诊断系统 | |
CN117474918B (zh) | 异常检测方法和装置、电子设备以及存储介质 | |
CN110866931A (zh) | 图像分割模型训练方法及基于分类的强化图像分割方法 | |
CN111124896A (zh) | 一种主次峰值比计算算法的蜕变测试系统 | |
CN111222558B (zh) | 图像处理方法及存储介质 | |
CN115661828B (zh) | 一种基于动态分层嵌套残差网络的文字方向识别方法 | |
JP5241590B2 (ja) | 情報処理装置及び識別方法 | |
US20150279039A1 (en) | Object detecting apparatus and method | |
Szijártó et al. | Design of a Machine Learning System to Predict the Thickness of a Melanoma Lesion in a Non-Invasive Way from Dermoscopic Images | |
JP7348945B2 (ja) | 情報処理方法、および、情報処理システム | |
CN115244574A (zh) | 检测结果分析装置、检测结果分析方法和检测结果分析程序 | |
CN110647826B (zh) | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130402 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |