JP2001092972A - 画像認識方法 - Google Patents

画像認識方法

Info

Publication number
JP2001092972A
JP2001092972A JP27009299A JP27009299A JP2001092972A JP 2001092972 A JP2001092972 A JP 2001092972A JP 27009299 A JP27009299 A JP 27009299A JP 27009299 A JP27009299 A JP 27009299A JP 2001092972 A JP2001092972 A JP 2001092972A
Authority
JP
Japan
Prior art keywords
search
model
image data
search model
models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP27009299A
Other languages
English (en)
Inventor
Mamoru Minami
護 見浪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCS Inc
Original Assignee
CCS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCS Inc filed Critical CCS Inc
Priority to JP27009299A priority Critical patent/JP2001092972A/ja
Priority to US09/536,710 priority patent/US6668084B1/en
Publication of JP2001092972A publication Critical patent/JP2001092972A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"

Abstract

(57)【要約】 【課題】 二値化処理を採用せずに、周辺環境の変動か
らくるノイズの影響を極力排除可能で、しかも応答性が
良く且つ認識精度の高い画像認識方法を提供する点にあ
る。 【解決手段】 本発明の画像認識方法は、対象物の形状
および輝度値分布をモデル化した探索モデルを画像デー
タとして記憶しておき、対象物を含む多階調画像データ
が入力すると(ステップ1)、この入力画像データの撮
像領域内に複数の探索モデルを分布させ(ステップ
2)、前記探索モデルの各々について対象物との相関を
示す適合度を算出し(ステップ3)、前記適合度に基づ
いて探索モデルを、並べ替え(ステップ5)、選択させ
(ステップ6)、交叉・再生させ(ステップ7)、突然
変異・再生させる(ステップ8)という遺伝的操作を実
行して、対象物の位置姿勢情報の最適解を探索するもの
である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像データに含ま
れる対象物の位置姿勢を探索して識別し得る画像認識方
法に関するものである。
【0002】
【従来の技術】従来から、画像データから特定の対象物
を識別する画像認識方法には種々のものが知られている
が、CCDカメラなどで撮像して得た多階調画像データ
(以下、生画像データと呼ぶ。)をメモリに格納し、こ
の生画像データを、対象物とこの対象物以外の背景画像
とに識別するため二値化処理した二値化画像を用いる方
法が一般的である。例えば、1画素が256階調の分解
能をもつCCDでは、CCDに入力する画像光は256
階調のデジタル信号としてサンプリングされた後、閾値
と比較判定されて、2種類のデジタル信号(例えば、"
0"または"1")に変換される。
【0003】
【発明が解決しようとする課題】しかしながら、二値化
画像を用いた画像認識方法には以下に示す問題があっ
た。
【0004】生画像中に対象物の影や鏡面反射光などが
含まれる場合、二値化処理の際に閾値の設定次第で対象
物の影や鏡面反射光などがノイズとなって増幅されてし
まい、対象物を誤認識する危険がある。例えば、図23
に示すように作業台の上に置かれた四角形状の対象物を
CCDカメラ(128×128画素)で撮像した場合、
その生画像は図24の立体グラフに示すような輝度値分
布を有するものとなる。図24に示す生画像では、対象
物とこの対象物の右斜め下方に配置した壁と作業台との
輝度値分布の違いは明瞭に現れている。しかし、図23
に示す生画像を二値化処理すると、図25に示すような
二値化画像となり、壁の輝度値が対象物と同一レベルに
まで増幅されてしまいノイズとなった壁と対象物とを識
別することが難しくなる。
【0005】そこで、ノイズ除去のために、二値化画像
に細線化処理などを施す方法があり、更に、二値化画像
に細線化処理を施した後に、骨格線の端点、分岐点およ
び長さ、骨格線同士の交差点や角度などを認識すること
により対象物の幾何学的特徴を抽出して対象物を識別す
るという画像認識方法もあるが、この種の方法は処理時
間が長大になるという欠点があった。また、前記ノイズ
の影響を減らすべく、予め2種類のレベル値を設定して
おき、これらレベル値間の画像信号のみを二値化処理す
る方法もあるが、レベル値の選択が難しく且つ長い処理
時間を要するため、リアルタイム性を要求される画像処
理には不向きであった。例えば、フィードバックループ
を採用したビジュアルサーボ機構では前記のような処理
方法を用いた場合、対象物の認識処理に時間がかかり過
ぎて、或る位置にいる移動対象物の認識処理を終了した
瞬間には、同移動対象物はすでに離れた位置に移動して
いることとなり、移動対象物を追跡するのが難しかっ
た。
【0006】また、上記処理方法では、対象物が移動す
るにつれて移動対象物への照射条件や背景画像が変化す
るのに伴い、設定した閾値レベルが不適当なものとな
り、対象物の誤認識を引き起こすという欠点もある。こ
のような場合、条件変動に合わせて最適な閾値を再演算
しなければならないが、その最適な閾値決定が難しいう
え処理時間が長大になり易い。
【0007】更に、CCD撮像素子を用いる場合は、周
辺の温度環境に応じてCCDの特性が変動し、すなわち
CCDの受光量に応じた蓄積電荷量が変動して出力画像
の輝度値が変わるので、一度設定した閾値レベルが不適
当なものとなる場合がある。このような場合は閾値を再
演算せねばならず、上記と同様に最適な閾値決定が難し
いうえ処理時間が長大になり易い。
【0008】本発明が以上の実状に鑑み解決しようとす
るところは、(1)二値化処理を行うこと無く、照明条
件などの周辺環境の変動などからくるノイズや対象物の
輝度値変化に関わらず、対象物の位置および姿勢情報を
正確に求め得て、(2)更には、非常に高速に且つ確実
に対象物を認識し得るリアルタイム性の高い画像認識方
法を提供する点にある。
【0009】
【課題を解決するための手段】前記課題を達成するため
に、本発明者らは、二値化処理をしない生画像データを
用いた画像処理方法を研究する中で、遺伝的アルゴリズ
ム(Genetic Algorithm手法、以下「GA手法」と呼
ぶ。)の手法に着目して鋭意研究した結果、本発明に到
達するに至った。
【0010】本発明に係る画像認識方法は、予め対象物
の全部または一部の形状および輝度値分布をモデル化し
た探索モデルを画像データとして記憶し、対象物を含む
入力画像データを取得し、前記入力画像データの領域内
に探索モデルを分布させて、前記探索モデルの各々に当
該位置姿勢情報を個体情報として付与し、前記探索モデ
ルの各々に前記対象物との相関を示す関数値を求め、且
つ、前記関数値に基づく遺伝的アルゴリズム手法を用い
て探索モデルを進化させることにより前記入力画像デー
タの中から少なくとも対象物の位置情報の解を探索する
ことを特徴とするものである。すなわち、予め探索モデ
ルを用意しておき、前記入力画像データの領域内に複数
の探索モデルを分布させることで、対象物と重複する探
索モデルが発生する。そこで、前記入力画像データに含
まれる対象物と探索モデルとの相関関係を評価する関数
値(遺伝的アルゴリズムではこの関数値を「適合度」と
呼ぶ。以下、同じ。)を求めて探索モデルがどの程度に
対象物と重複するのかを評価し、この適合度に基づいた
GA手法により探索モデルを進化させ、淘汰された探索
モデルの位置情報および姿勢情報の解を当該対象物の位
置情報および姿勢情報となすことにより、当該対象物を
認識できる。よって、多階調の入力画像データそのもの
を用いた画像処理が可能となるので、従来の方法のよう
に二値化処理の際に輝度値の変動に伴い閾値の最適値か
らのズレによって生ずるノイズの増幅を招くことなく、
スムーズに画像処理を実行することができ、対象物の位
置情報および姿勢情報を正確に認識することが可能とな
る。
【0011】ここで、前記入力画像データの領域内に複
数個の探索モデルを分布させる際、各探索モデルの位置
情報および姿勢情報をランダムに生成することにより、
探索モデルをランダムに分布させるのが好ましい。この
方法により入力画像データ全体を効率良く探索すること
が可能となる。
【0012】また、前記関数値としては、具体的には、
探索モデルの内部領域における前記入力画像データの輝
度値から導出される値の総和を用いることができる。こ
の方法により、簡単で素早い計算により関数値を求める
ことができる。
【0013】また、前記探索モデルの位置姿勢情報の進
化に制限条件を付し、前記入力画像データに含まれる対
象物の探索範囲を制限することも望ましい。この方法に
より、局所的な探索を非常に効率良く行うことができる
ため、対象物の認識処理時間が大幅に短縮される。
【0014】そして、更に、進化の収束を待つこと無く
所望の制御タイミングで最も高い関数値を有する探索モ
デルを最適解とみなすことが、対象物を超高速に認識で
き、また移動対象物を追跡できるために好ましい。
【0015】
【発明の実施の形態】図1は、本発明に係る画像認識装
置の一構成例を示す機能ブロック図である。本発明に係
る画像認識装置1は、撮像手段2により撮像して出力さ
れた多階調画像データ(以下、生画像データと呼ぶ。)
3を記憶する画像メモリ4と、予め対象物の形状および
輝度値分布をモデル化した探索モデルを作成する探索モ
デル作成部5と、生画像データ3の撮像領域内に複数の
探索モデルを分布させて、前記探索モデルの各々に当該
位置姿勢情報を付与する探索モデル分布手段6と、分布
した探索モデルの各々について遺伝的操作に基づく画像
処理を実行する遺伝的操作部7と、を備えて構成されて
おり、最終的に、生画像データに含まれる対象物の探索
結果を出力するものである。
【0016】前記探索モデル作成部5は、対象物形状を
多角形や三次元形状などにモデル化する形状モデル化手
段5aと、対象物の輝度値分布をモデル化する輝度値分
布モデル化手段5bと、を有しており、例えば、図2に
示す対象物たる魚8を識別したい場合は、その魚形状を
図示した三角形状9にモデル化し、その魚の輝度値分布
をその三角形内部やフレーム部分などに与えればよい。
【0017】また、前記遺伝的操作部7は、生画像デー
タに含まれる対象物と分布させた探索モデルとの相関を
示す適合度を算出する適合度算出手段7aと、前記適合
度に基づいて、探索モデルに優先度を付して並び替える
並び替え手段7bと、探索モデルを選択して生存させる
選択手段7cと、探索モデルの一組または複数組の位置
姿勢情報の一部を組み替えて交叉させる交叉手段7d
と、探索モデルの位置姿勢情報の一部または全部をラン
ダムに変えて突然変異させる突然変異手段7eと、前記
の交叉または突然変異される以前の探索モデルを再生さ
せる再生手段7fと、を備えて構成されるものである。
【0018】前記探索モデル分布手段6においては、図
3に例示されるように、探索モデルの重心位置(Xp
p)と姿勢角度θとをランダムに設定することで、生
画像データの撮像領域内に複数の探索モデル11a,1
1b,11c,…がランダムに分布される。これによ
り、対象物である魚8と重複する探索モデル11f,1
1gが生ずるのである。
【0019】次に、前記遺伝的操作部7の適合度算出手
段7aにおいて、探索モデルの適合度を算出する方法の
一例を説明する。今、図4に示すように、対象物12の
形状が四角形状であり、この対象物12の中の画素に相
当する升目12a,12b,12c,…に記した数字が
輝度値を表すものとする。また、前記対象物12の探索
モデルとしては、その形状および輝度値分布を前記対象
物12と同一にしたものを用いる。
【0020】また、図5(a),(b)に示すように輝
度値分布が1である背景画像13中に対象物12を含む
入力画像データがあり、この入力画像データに対象物1
2と重複する探索モデル14を分布させたとする。この
とき、探索モデル14の適合度は以下の手順で算出され
る。先ず、重複する各画素15,15,15,…におい
て入力画像データの輝度値と探索モデル14の輝度値と
の積を算出する。次に、当該探索モデル14の内部領域
における全ての画素についての輝度値の総和を算出し、
この輝度値の総和を適合度とする。よって、図5(a)
の場合、探索モデルの適合度は92であり、図5(b)
の場合、探索モデルの適合度は156である。また、対
象物と重複しない探索モデルの適合度は、図4に示した
対象物の輝度値の総和70と同じである。このようにし
て対象物と探索モデルとの相関すなわち重複程度が高け
れば高い程、高い適合度が得られ、対象物と探索モデル
とが一致したときに適合度のピークが生ずる。以上と同
じ手順で、図3に示したように探索モデル11a,11
b,…を入力画像データの撮像領域内に分布させた場
合、これら探索モデルの各々について適合度を算出する
ことができる。また、このように算出した適合度に基づ
き、後述するGA手法を用いて対象物の位置姿勢情報の
最適解を探索するのである。
【0021】次に、前記探索モデル分布手段6と適合度
算出手段7aにおける処理内容について更に詳説する。
最初に、探索モデルを入力画像データの撮像領域内に分
布させる数学的手法について述べる。図6は、二次元形
状の探索モデルを説明するための概略図である。尚、本
発明においては、探索モデルを二次元に限らず三次元空
間にも適用できることはいうまでもない。図6に示すよ
うに、撮像領域Ωは、Ω=[(X,Y)|0≦X≦Xmax,0≦Y≦Y
max ]と定義され、この撮像領域において原点に重心を
有する探索モデル10が作成されたと仮定する。本実施
例では、探索モデルの位置とは、当該探索モデルの重心
位置を示すものとする。更に、この探索モデル10の境
界を含む内部領域S内の点(X0, Y0)における輝度値m
は、以下の式で表現される。
【0022】
【数1】
【0023】また、本実施例における輝度値mは、探索
モデルの内部領域S(輪郭を含む)内では1の値をも
ち、それ以外では0の値をもつものとする。しかし本発
明ではこれに限らず、図5に示した探索モデルのように
陰影を表現できる多階調の値をもつものでも構わない。
【0024】次に、前記探索モデル10の内部領域Sを
撮像領域Ω内の図示した領域Spへ変換する手順を以下
に述べる。探索モデル10の内部領域S内の点(X0,
Y0)は、変換後の探索モデル11が位置P(Xp,Yp)に
おいて姿勢角度θをもつように、探索モデル11の内部
領域Sp内の点(X1, Y1)へ以下のように変換される。
【0025】
【数2】
【0026】同時に、上式(2)の変換式に従って、変
換前の輝度値m(X0,Y0)は、変換後の輝度値mp(X1, Y1)
の値へと引き渡される。本実施例の輝度値mp(X1, Y1)
は、探索モデル11の内部領域Sp内では1の値をも
ち、それ以外では0の値をもつこととなる。このように
位置座標(Xp, Yp)と姿勢角度θを指定することによ
り、上式(2)の変換式に従い入力画像データの撮像領
域内に探索モデルを分布させることができる。
【0027】また、入力画像データの撮像領域Ω内の多
階調の輝度値pは、p=p(X,Y)で表現されるものとする。
【0028】このとき、本発明に係る探索モデルの適合
度を演算する適合度関数F(Xp,Yp,θ)は、以下の式
(3)で定義される。
【0029】
【数3】
【0030】上式(3)中、dsは撮像領域Ωにおける面
積要素であり、また、その積分範囲は撮像領域Ωと探索
モデル11の内部領域Spとの共通領域とする。よっ
て、(X p,Yp,θ)を指定すると、撮像領域Ω内の任意
の点(Xp,Yp)に姿勢角度θで探索モデルを配置したと
きの適合度F(Xp,Yp,θ)を算出することが可能と
なる。尚、本実施例では、探索モデルと対象物との相関
関係を示す好適例として、上式(3)に示しように入力
画像データの輝度値と探索モデルの輝度値との積の積分
値を用いたが、これに限らず、前記入力画像データおよ
び探索モデルの輝度値から導出される値を用いて探索モ
デルと対象物との相関を示す適合度を求めることが可能
である。例えば、当該探索モデルにおける輝度値mの平
均値<m>を求め、この平均値<m>を用いて当該画素
における偏差の絶対値を求めて、その逆数の総和をもっ
て適合度としたり、より単純には、入力画像データpと
探索モデルの輝度値mとの和もしくは差の絶対値の総和
などを適合度としたりすることができる。
【0031】また、上記適合度の値は、探索モデルへの
輝度値分布の与え方によって変わるものである。好適な
探索モデルとしては、(1)対象物の輪郭を縁取ったフ
レームモデル、(2)対象物の形状と一致させた面モデ
ル、および(3)対象物周囲の明暗度による微分情報を
考慮するために前記面モデルの周囲に帯状の付加領域を
付した面−帯モデルが挙げられる。図7〜図9を参照し
つつ、これら各種モデルについて以下に詳説する。図7
は、フレームモデル、図8は、面モデル、図9は、面−
帯モデルを説明するための模式図である。
【0032】図7に示すフレームモデルでは、探索モデ
ルは、矩形状にモデル化されると同時にフレーム領域S
1のみに輝度値分布を有するものである。フレーム領域
1の各要素dS1,dS2,…,dSi,…における輝度
値は1、それ以外の領域における輝度値は0に設定され
る。したがって、上式(3)の適合度関数Fは、以下の
ように変形される。
【0033】
【数4】
【0034】上式(4)中、piは、フレーム領域S1
i番目の要素dSiに対応する撮像領域Ωの輝度値であ
り、mpiは、フレーム領域S1のi番目の要素dSiの輝
度値である。本実施例では、mpi=1に設定された。
【0035】次に、図8に示す面モデルでは、探索モデ
ルは、矩形状にモデル化されると同時に内部領域S2
輝度値分布を有するものである。内部領域S2の各要素
dS11,dS12,…,dS21,…における輝度値は1、
それ以外の領域における輝度値は0に設定される。した
がって、上式(3)の適合度関数Fは、以下のように変
形される。
【0036】
【数5】
【0037】上式(5)中、pijは、内部領域S2内の
i行j列目の要素dSijに対応する撮像領域Ωの輝度値
であり、mpijは、内部領域S2内のi行j列目の要素d
ijにおける輝度値である。本実施例では、mpij=1
に設定された。
【0038】次に、図9に示す面−帯モデルでは、探索
モデルは、矩形状にモデル化されると同時に前記面モデ
ルの内部領域S2の外周上に帯状の付加領域K1を加えた
ものであり、内部領域S2の各要素dS11,dS12,…
における輝度値は1、付加領域K1の各要素dK1、dK
2,…における輝度値は−1、それ以外の領域における
輝度値は0に設定される。したがって、上式(4),
(5)と同様にして、上式(3)の適合度関数Fは、以
下のように変形される。
【0039】
【数6】
【0040】上式(6)中、pijは、内部領域S2内の
i行j列目の要素dSijに対応する撮像領域Ωの輝度値
であり、pk'は、付加領域K1内のk番目の要素dKk
対応する撮像領域Ωの輝度値である。このように帯状の
付加領域を設けてこの付加領域における輝度値分布を負
の値に設定することにより、面−帯モデルの適合度関数
は、対象物周囲の輝度値の変化をも考慮したものとなる
から、対象物を精度良く検出することが可能となる。
【0041】尚、上記フレームモデル、面モデルおよび
面−帯モデルは、矩形状にモデル化したものであるが本
発明ではこれに限らず、三角形状や立体形状などの種々
の形状へのモデル化が可能である。また、本実施例では
探索モデルの輝度値として0、1、−1の3値を採用し
たが、本発明ではこれに限らず、陰影を表現できる多階
調の値でも構わない。このように探索モデルの輝度値が
多階調の値を有する場合、適合度は、上式(4),
(5),(6)では無く、探索モデルの輝度値mと入力
画像データの輝度値pとの積の総和から求めることがで
きる。
【0042】次に、以上のフレームモデル、面モデルお
よび面−帯モデルの効果を実証すべく、上式(4)〜
(6)の適合度関数を用いて、図10に示すように水槽
内を魚20が泳ぐ様子を上方から撮像した画像データ2
1(128×128画素)の適合度を各画素毎に算出
し、立体的にグラフ化した。尚、探索モデルの形状は、
図2に示したような三角形状となし、姿勢角度θはゼロ
に設定した。また、適合度には正規化した値を用いた。
その結果を、図11(フレームモデル)、図12(面モ
デル)、図13(面−帯モデル)に示す。
【0043】各図から、前記魚20の位置に探索モデル
が近づく程に適合度が高くなり、魚20と重なる位置で
ピークを形成していることが分かる。図11に示すフレ
ームモデルの結果では、対象物(魚)と背景画像(水
面)との適合度の差が小さいが、対象物周辺にピーク2
2が現れており、図12に示す面モデルの結果では、な
だらかなピーク23が現れているのに対し、図13に示
す面−帯モデルの結果では、鋭いピーク24が現れてい
る。従って、この場合、面−帯モデルが最も精確に対象
物の位置姿勢を検出できるが、ピークが鋭いことは、フ
レームモデルや面モデルと比べて位置姿勢の検出に時間
がかかることを意味する。これに対しピーク近辺に緩や
かな傾斜をもつ面モデルは、小さなずれに対しても柔軟
性をもつため、ピーク周辺の解を得るのに時間がかから
ない。
【0044】次に、上記遺伝的操作部7における遺伝的
操作、すなわちGA(遺伝アルゴリズム)の手法を用い
た探索方法について詳述する。GAとは、自然界の生物
システムの遺伝情報と自然選択とによる適応過程に着想
を得て、進化のメカニズムを模擬する人工モデルであ
り、米国のJ.Hollandらによって提唱された手法であ
る。GAに関する参考文献としては、「J.H.Holland:
Adaptation in Natural and Artificial Systems, Uni
v. of Michigan Press(1975), MIT Press(1992)」、
「D.E.Goldberg: Genetic Algorithms in Search, Opt
imization, and MachineLearning, Addison-Wesley(198
9)」、「安居院・長尾:ジェネティックアルゴリズム,
pp.53-81,昭晃堂(1993)」、「システム制御学会編 三
宮信夫・喜多一・玉置久・岩本貴司:遺伝アルゴリズム
と最適化,朝倉書店(1998)」などが挙げられる。
【0045】図14を参照しつつ、GAを用いた探索処
理の一例を以下に説明する。先ず、CCDカメラなどの
撮像手段から対象物を含む生画像データを取得し画像メ
モリに記憶させる(ステップ1)。次に、前記生画像デ
ータの撮像領域内にランダムに複数の探索モデルを分布
させ、これら探索モデルの各々に当該位置姿勢情報を個
体情報として付与し、これら探索モデルを第1世代の個
体とする(ステップ2)。具体的には、疑似乱数もしく
は物理乱数などを用いて、探索モデルの各々の位置と姿
勢とをランダムに生成し、第1世代の探索モデルの集合
を生成すればよい。例えば、探索モデルの各々につき、
図15に示すように23ビットの2進データ配列を用意
し、最初の7ビットをX方向位置(X)、次の7ビット
をY方向位置(Y)、最後の9ビットを姿勢(θ)に割
り当てて、これら(X,Y,θ)の数値をランダムに生
成するのである。
【0046】次に、前記探索モデルの各々につき、上記
適合度関数を用いて適合度を算出する(ステップ3)。
そして、後述する「GA終了条件」(ステップ4)にお
いて当該探索処理を終了させるか否かを判定し、当該探
索処理を続行する場合は、前記第1世代の探索モデルを
適合度の高い順に「並べ替え」(ステップ5)、適合度
の高い個体を「選択」して生き残らせる(ステップ
6)。また、選択した探索モデルのうち一組または複数
組の探索モデルの位置姿勢情報の一部を所定の確率で組
み替えて「交叉」させる(ステップ7)。ここで、交叉
された探索モデルに加えて、交叉される以前の探索モデ
ルの一部を「再生」してもよい(ステップ7)。
【0047】次に、このように交叉、再生された探索モ
デルの位置姿勢情報の一部または全部をランダムに変え
て「突然変異」させる(ステップ8)。ここで、突然変
異された探索モデルに加えて、突然変異される以前の探
索モデルの一部を「再生」させてもよい(ステップ
8)。例えば、図15に示した位置姿勢情報を例に挙げ
て説明すると、位置X,Yおよび姿勢θの各ビット列の
一部または全部を「突然変異」させるのである。特に、
位置X,Yの下位ビット列を突然変異する場合は、探索
範囲を制限した局所的な探索を行うのに有効であり、全
ビット列を突然変異する場合は、大域的な探索を行うの
に有効である。
【0048】以上の遺伝的操作の末に第2世代の個体が
生成される。次に、第2世代の個体をフィードバックさ
せ、上記したステップ3以降の遺伝的操作を繰り返し実
行する。ここで、「GA終了条件」(ステップ4)とし
ては、適合度がピークを形成する条件(当該位置姿勢情
報の解の周囲での適合度の勾配が負になる条件)に合致
した場合に探索処理を終了させるものが挙げられる。
尚、適合度がピークを形成する条件に合致しなくとも、
適合度が或る閾値以上に収束した場合に、探索処理を終
了させるものや、適合度の収束を待たずに第1世代〜数
世代の短サイクルを経た後に終了させる条件を設定して
もよい。特にリアルタイム性が要求される場合は、適合
度の収束を待たずに最も高い適合度を有する探索モデル
の位置姿勢情報を最適解とみなすことが好ましい。
【0049】尚、本実施例のように「並べ替え」、「選
択」、「交叉・再生」および「突然変異・再生」の順に
遺伝的操作をする必要は必ずしも無く、これらの中から
1種類または2種類以上の操作を適当な順番で組み合わ
せて使用しても構わない。
【0050】より具体的な実施例として、図16に、8
ビットの2進データ配列からなる位置姿勢情報を用いた
遺伝的操作を模式的に示して説明する。先ず、N番目世
代の探索モデルの位置姿勢情報G1,G2,…,G6があ
るとすると、これら探索モデルのうち適合度が上位3番
以内の位置姿勢情報G1,G4,G5を、優秀な個体情報
であるとして選択し、適合度の高い順に並べ替えて位置
姿勢情報G1'〜G3'を生成する。次いで、これら位置姿
勢情報G1'〜G3'の一部を相互に組み替えることにより
交叉して位置姿勢情報G4'',G5'',G6''を生成し、
同時に、交叉する以前の位置姿勢情報G1'〜G3'を再生
させて位置姿勢情報G1'',G2'',G3''を生成する。
そして、適当な確率により、位置姿勢情報G4''とG6''
が選択されて、G4''の下位3ビット目を"0"から"1"
に、G6''の下位1ビット目を"1"から"0"に突然変異
させて、N+1番目の世代の個体(探索モデル)を生成
するのである。
【0051】実際に、図10に示した多階調画像を用い
て、図14に示すようなフローに基づく遺伝的操作を実
行した。その結果を図17(フレームモデル),図18
(面モデル)および図19(面−帯モデル)に示す。各
図において、横軸は、遺伝子操作の「世代交代回数」を
示し、縦軸は、各世代の生存している探索モデルのうち
最も高い「適合度」を示している。図17に示すフレー
ムモデルのグラフは、緩やかな曲線をもって第130世
代付近で約0.8に収束しており、また、図18に示す
面モデルのグラフは、第70世代付近で約0.82に収
束し収束性が非常に良いことが分かる。これらに対し、
図19に示す面−帯モデルのグラフでは、第40世代付
近までの収束性は良好だが、それより後の世代では、非
常に緩やかな上昇曲線となるため収束性が劣る結果とな
った。尚、照明などの環境条件の変動にも関わらず、面
モデル、フレームモデルおよび面−帯モデルの何れにお
いても上記と同様に適合度のレベル変化に関係なく対象
物を捉えて適合度のピークを発生させることができた。
【0052】以上のように、本発明は、従来の探索方法
のように二値化画像を使わず、生画像データを使って対
象物の位置情報および姿勢情報の解を同時に探索し得る
ものである。
【0053】次に、図20〜図22を例示しつつ、分布
した探索モデルの位置姿勢情報の進化に制限条件を付
し、入力画像データに含まれる対象物の探索範囲を制限
する手法を以下に説明する。
【0054】図20に示すように、X−Y方向に駆動さ
れるマニピュレーターのハンド30に固定したCCDカ
メラ31を、水槽32内を泳ぐ魚33の直上において、
移動、追跡させるビジュアルサーボ機構がある。対象物
たる魚33は、常に動き回り、その動きを予測するのは
困難である。従って、個体(探索モデル)の適合度の収
束を一定時間待っていては、その指示値に基づいてハン
ド30を移動させてもそこに魚は存在しない可能性が高
い。よって、適合度の収束を待たずに第1世代〜数世代
の短いサイクルの探索モデルの中で最も高い適合度を与
える探索モデルを最適解とみなして解の探索速度を向上
させ、その位置姿勢情報をマニピュレーターに指示する
のが好ましい。
【0055】図21は、このようなビジュアルサーボ機
構の制御フローの一実施例である。先ず、CCDカメラ
31から出力された対象物を含む生画像データが入力さ
れると(ステップ20)、図22に例示されるように、
生画像データの撮像領域全体に多数の探索モデル33
a,33b,33c,33d,33eをランダムに分布
させる(ステップ21)。ここで、探索モデルの位置姿
勢情報には、図15に示したような23ビットからなる
2進データ配列を用い、位置Xに7ビット、位置Yに7
ビット、姿勢角度θに9ビットを割り当てた。次に、各
探索モデルについて適合度Fを算出し(ステップ2
2)、適合度の高い順に探索モデルに優先度を付して並
べ替え(ステップ23)、最も高い適合度を有する探索
モデルを最適解とみなして(ステップ24)、当該探索
モデルの位置姿勢情報をマニピュレータの制御系に指示
し(ステップ25)、CCDカメラ31を当該位置まで
移動させる。
【0056】次いで、前記探索モデルの各々について適
合度Fが予め設定した値Sを超えるか否かの条件判定を
行い(ステップ26)、適合度Fが値Sを超える場合、
当該探索モデルを有望な個体とみなして当該位置姿勢情
報のうち位置X,Yの各下位2ビットと、姿勢θの全ビ
ットとをランダムに変えて突然変異させ(ステップ2
7)、他方、適合度Fが閾値S以下の場合は、不要な個
体とみなして当該探索モデルの位置姿勢情報の全23ビ
ットをランダムに変えて突然変異させる(ステップ2
8)。すなわち、図22に例示するように、対象物8と
の重複程度が高い探索モデル33eの適合度Fは値Sを
十分に超えるように値Sを設定しておき、この条件に合
致する場合は、前記ステップ27において探索モデル3
3eの位置姿勢情報を局所的に突然変異させて、有望な
個体の近辺に二点鎖線で示した探索モデル34a,34
bを生成し、他方、対象物と重複しない探索モデル33
a,33b,33c,33dの適合度Fは値S未満であ
るから、前記ステップ28において探索モデル33a,
33b,33c,33dの位置姿勢情報全てを突然変異
させて、点線で示した探索モデル35a,35b,35
c,35dを新たに生成する。このようにステップ27
の突然変異は、局所的に対象物を探索するのに有効であ
り、ステップ28の突然変異は、大域的に対象物を探索
するのに有効である。
【0057】このようにして新たに生成した探索モデル
の集合を画像メモリに保存しておき、再度CCDカメラ
31から出力された生画像データが入力されると(ステ
ップ20)、前記画像メモリに保存した探索モデルをフ
ィードバックさせ、これら探索モデルについて適合度F
を算出し(ステップ22)、上記と同様にステップ2
3,24,・・・の処理を繰り返し実行する。このよう
なフィードバック制御によるビジュアルサーボ機構は、
大域的探索(ステップ27)と局所的探索(ステップ2
8)とを同時に実行し、且つ適合度の収束を待たずに最
適解を得る(ステップ24)ものであるから、非常に高
速に且つ確実に対象物を認識し追跡することが可能とな
る。
【0058】尚、以上の実施形態では、対象物全ての形
状および輝度値分布をモデル化した探索モデルを使用し
ていたが、本発明ではこれに限らず、対象物の形状およ
び輝度値分布のうち特徴点を含む一部を抽出してモデル
化したものを用いてもよい。
【0059】他の応用例として、本発明に係る画像認識
方法を人物の顔画像照合処理に適用することも可能であ
る。具体的には、対象物である顔画像を多階調の入力画
像データとして取り込み、この顔画像とデータベースに
登録された探索モデルとを、上記画像認識方法を用いて
パターンマッチングさせるのである。ここで、探索モデ
ルとしては、登録された顔画像について複数の特徴点
(鼻筋、目や口のラインなど)を抽出した探索モデルを
用意しておく。よって登録された顔画像の各々につい
て、複数の探索モデルが用意されることとなる。そし
て、対象物である顔画像と特徴点を含む探索モデルとを
順番にパターンマッチングさせる。本発明に係る画像認
識方法を用いると、二値化処理を含まずに高速に画像処
理できるから、膨大な数の登録された顔画像との照合処
理を非常に高速に行うことが可能である。
【0060】尚、上記の生画像としては、白黒画像に限
らず、多色信号を用いたカラー画像でも同様に処理でき
る。
【0061】また、上記生画像データとしては、CCD
カメラなどのデジタル機器から出力されたデジタル画像
データに限らず、ビデオなどから出力されたアナログ画
像データをA−D変換したものでも構わない。
【0062】
【発明の効果】以上の如く、本発明の画像認識方法によ
れば、入力画像データの領域内に分布した探索モデルの
各々について対象物との相関を示す関数値を求め、この
関数値に基づいた遺伝的アルゴリズム手法を用いて探索
モデルを進化させて淘汰することにより、前記入力画像
データの中から少なくとも対象物の位置情報の解を探索
するから、多階調の入力画像データを二値化処理する必
要が無く、二値化処理に伴うノイズの増幅を防ぐことが
でき、環境変化に伴う当該対象物の輝度値変化などに関
わらず正確に対象物の位置情報、更には姿勢情報を求め
て当該対象物を認識することができる。また、二値化に
伴う閾値設定処理や細線化処理などの幾何学的特徴の抽
出処理などを行わなくとも、生画像に含まれる対象物の
位置情報などを得ることができるため、スムーズな画像
処理を実行することが可能である。
【0063】また、探索モデルの位置姿勢情報の進化に
制限条件を付し、前記入力画像データに含まれる対象物
の探索範囲を制限する方法を採用することにより、局所
的に注視した素早い探索が可能となり、リアルタイム性
が要求される用途においても素早く対象物を認識するこ
とが可能となる。
【0064】更には、進化の収束を待つこと無く所望の
制御タイミングで最も高い関数値を有する探索モデルの
位置姿勢情報を最適解とみなすことにより、対象物を非
常に高速に探索することができ、特に移動対象物を正確
に認識し追跡することが可能となる。
【図面の簡単な説明】
【図1】本発明に係る画像認識装置の一構成例を示す機
能ブロック図である。
【図2】対象物たる魚とこの魚に対応した探索モデルと
を示す概略図である。
【図3】探索モデルをランダムに分布した状態を示す模
式図である。
【図4】四角形状の対象物とその輝度値分布の一例を示
す模式図である。
【図5】入力画像データ中の対象物と探索モデルとが重
複する状態を示す模式図である。
【図6】二次元形状の探索モデルについての概略説明図
である。
【図7】フレームモデルを説明するための模式図であ
る。
【図8】面モデルを説明するための模式図である。
【図9】面−帯モデルを説明するための模式図である。
【図10】水槽内を魚が泳ぐ様子を上方から撮像した画
像データである。
【図11】フレームモデルを用いて適合度を算出した結
果を示す立体グラフである。
【図12】面モデルを用いて適合度を算出した結果を示
す立体グラフである。
【図13】面−帯モデルを用いて適合度を算出した結果
を示す立体グラフである。
【図14】GAを用いた探索処理の一実施例を示すフロ
ーである。
【図15】探索モデルの位置姿勢情報の2進データ配列
を示す概略図である。
【図16】遺伝的操作の一実施例を示した概略説明図で
ある。
【図17】フレームモデルを用いたときの世代交代回数
に対する適合度を示すグラフである。
【図18】面モデルを用いたときの世代交代回数に対す
る適合度を示すグラフである。
【図19】面−帯モデルを用いたときの世代交代回数に
対する適合度を示すグラフである。
【図20】マニピュレータのハンドに固定したCCDカ
メラで水槽内の魚を捕捉、追跡している状態を示す概略
図である。
【図21】本発明に係るビジュアルサーボ機構の制御フ
ローの一実施例である。
【図22】探索モデルをランダムに分布した状態を示す
模式図である。
【図23】作業台の上に置かれた四角形状の対象物と壁
とを上方から撮像した画像である。
【図24】図23に示す多階調画像の輝度値分布を示す
グラフである。
【図25】図23に示す多階調画像を二値化処理した二
値化画像の輝度値分布を示すグラフである。
【符号の説明】
1 画像認識装置 2 撮像手段 3 生画像(多階調画像)データ 4 画像メモリ 5 探索モデル作成部 5a 形状モデル化手段 5b 輝度値分布モデル化手段 6 探索モデル分布手段 7 遺伝的操作部 7a 適合度算出手段 7b 並び替え手段 7c 選択手段 7d 交叉手段 7e 突然変異手段 7f 再生手段 8 魚(対象物) 9 魚のモデル形状 10 探索モデル 11 探索モデル 11a〜11j 探索モデル 12 対象物 13 背景画像 14 探索モデル 20 魚 21 画像データ 22 フレームモデルでの適合度のピーク 23 面モデルでの適合度のピーク 24 面−帯モデルでの適合度のピーク 30 マニピュレーターのハンド 31 CCDカメラ 32 水槽 33a,33b,33c,33d,33e 探索モデル 34a,34b 探索モデル 35a,35b,35c,35d 探索モデル
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5L096 AA09 FA14 FA34 FA67 FA69 GA59 HA08 JA09 JA16

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 予め対象物の全部または一部の形状およ
    び輝度値分布をモデル化した探索モデルを画像データと
    して記憶し、 対象物を含む入力画像データを取得し、 前記入力画像データの領域内に探索モデルを分布させ
    て、前記探索モデルの各々に当該位置姿勢情報を個体情
    報として付与し、 前記探索モデルの各々に前記対象物との相関を示す関数
    値を求め、 且つ、前記関数値に基づいた遺伝的アルゴリズム手法を
    用いて探索モデルを進化させることにより前記入力画像
    データの中から少なくとも対象物の位置情報の解を探索
    することを特徴とする画像認識方法。
  2. 【請求項2】 前記入力画像データの領域内に複数個の
    探索モデルをランダムに分布させてなる請求項1記載の
    画像認識方法。
  3. 【請求項3】 前記関数値として、探索モデルの内部領
    域における前記入力画像データの輝度値から導出される
    値の総和を用いてなる請求項1または2記載の画像認識
    方法。
  4. 【請求項4】 前記探索モデルの位置姿勢情報の進化に
    制限条件を付し、前記入力画像データに含まれる対象物
    の探索範囲を制限してなる請求項1〜3の何れか1項に
    記載の画像認識方法。
  5. 【請求項5】 進化の収束を待つこと無く所望の制御タ
    イミングで最も高い関数値を有する探索モデルの位置姿
    勢情報を最適解とみなしてなる請求項1〜4の何れか1
    項に記載の画像認識方法。
JP27009299A 1999-09-24 1999-09-24 画像認識方法 Pending JP2001092972A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP27009299A JP2001092972A (ja) 1999-09-24 1999-09-24 画像認識方法
US09/536,710 US6668084B1 (en) 1999-09-24 2000-03-28 Image recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27009299A JP2001092972A (ja) 1999-09-24 1999-09-24 画像認識方法

Publications (1)

Publication Number Publication Date
JP2001092972A true JP2001092972A (ja) 2001-04-06

Family

ID=17481430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27009299A Pending JP2001092972A (ja) 1999-09-24 1999-09-24 画像認識方法

Country Status (2)

Country Link
US (1) US6668084B1 (ja)
JP (1) JP2001092972A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019138834A (ja) * 2018-02-14 2019-08-22 日本電気株式会社 魚の心拍数測定システム、方法およびプログラム

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1149339A1 (en) 1998-12-09 2001-10-31 Network Ice Corporation A method and apparatus for providing network and computer system security
US7346929B1 (en) 1999-07-29 2008-03-18 International Business Machines Corporation Method and apparatus for auditing network security
US8006243B2 (en) 1999-12-07 2011-08-23 International Business Machines Corporation Method and apparatus for remote installation of network drivers and software
WO2001084775A2 (en) 2000-04-28 2001-11-08 Internet Security Systems, Inc. System and method for managing security events on a network
US9027121B2 (en) 2000-10-10 2015-05-05 International Business Machines Corporation Method and system for creating a record for one or more computer security incidents
US7130466B2 (en) * 2000-12-21 2006-10-31 Cobion Ag System and method for compiling images from a database and comparing the compiled images with known images
US20020147803A1 (en) 2001-01-31 2002-10-10 Dodd Timothy David Method and system for calculating risk in association with a security audit of a computer network
US7657419B2 (en) 2001-06-19 2010-02-02 International Business Machines Corporation Analytical virtual machine
JP3705180B2 (ja) * 2001-09-27 2005-10-12 セイコーエプソン株式会社 画像表示システム、プログラム、情報記憶媒体および画像処理方法
US7673137B2 (en) 2002-01-04 2010-03-02 International Business Machines Corporation System and method for the managed security control of processes on a computer system
US7068856B2 (en) * 2002-09-17 2006-06-27 Lockheed Martin Corporation Method and system for determining and correcting image orientation angle
US7913303B1 (en) 2003-01-21 2011-03-22 International Business Machines Corporation Method and system for dynamically protecting a computer system from attack
JP2004228948A (ja) * 2003-01-23 2004-08-12 Seiko Epson Corp 画像処理システム、プロジェクタ、プログラム、情報記憶媒体および画像処理方法
US7657938B2 (en) 2003-10-28 2010-02-02 International Business Machines Corporation Method and system for protecting computer networks by altering unwanted network data traffic
US20080089591A1 (en) * 2006-10-11 2008-04-17 Hui Zhou Method And Apparatus For Automatic Image Categorization
KR101634355B1 (ko) * 2009-09-18 2016-06-28 삼성전자주식회사 동작 검출 장치 및 방법
GB2476226B (en) * 2009-11-10 2012-03-28 Ingenia Holdings Ltd Optimisation
WO2011130614A1 (en) * 2010-04-15 2011-10-20 Pongr, Inc. Networked image recognition methods and systems
US8971561B2 (en) 2012-06-20 2015-03-03 Apple Inc. Earphone having a controlled acoustic leak port
JP6631641B2 (ja) * 2016-01-20 2020-01-15 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69322306T2 (de) * 1992-04-24 1999-04-29 Hitachi Ltd Gegenstandserkennungssystem mittels Bildverarbeitung
US6023530A (en) * 1995-11-13 2000-02-08 Applied Intelligent Systems, Inc. Vector correlation system for automatically locating patterns in an image
US6005978A (en) * 1996-02-07 1999-12-21 Cognex Corporation Robust search for image features across image sequences exhibiting non-uniform changes in brightness
JP3636809B2 (ja) * 1996-03-12 2005-04-06 株式会社リコー 画像処理方法
US5828769A (en) * 1996-10-23 1998-10-27 Autodesk, Inc. Method and apparatus for recognition of objects via position and orientation consensus of local image encoding
US6324299B1 (en) * 1998-04-03 2001-11-27 Cognex Corporation Object image search using sub-models
US6477272B1 (en) * 1999-06-18 2002-11-05 Microsoft Corporation Object recognition with co-occurrence histograms and false alarm probability analysis for choosing optimal object recognition process parameters

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019138834A (ja) * 2018-02-14 2019-08-22 日本電気株式会社 魚の心拍数測定システム、方法およびプログラム
JP7082331B2 (ja) 2018-02-14 2022-06-08 日本電気株式会社 魚の心拍数測定システム、方法およびプログラム

Also Published As

Publication number Publication date
US6668084B1 (en) 2003-12-23

Similar Documents

Publication Publication Date Title
JP2001092972A (ja) 画像認識方法
US11878433B2 (en) Method for detecting grasping position of robot in grasping object
CN110705425B (zh) 一种基于图卷积网络的舌象多标签分类方法
CN110738101A (zh) 行为识别方法、装置及计算机可读存储介质
CN111931764B (zh) 一种目标检测方法、目标检测框架及相关设备
CN112330593A (zh) 基于深度学习网络的建筑物表面裂缝检测方法
JP6895563B2 (ja) ロボットシステム、モデル生成方法、及びモデル生成プログラム
Li et al. Event-based robotic grasping detection with neuromorphic vision sensor and event-grasping dataset
CN115381335B (zh) 一种扫地机器人的路径控制方法、装置、设备及存储介质
CN115063447A (zh) 一种基于视频序列的目标动物运动追踪方法及相关设备
CN113781519A (zh) 目标跟踪方法和目标跟踪装置
JP2008198078A (ja) 画像検出装置
CN113205507B (zh) 一种视觉问答方法、系统及服务器
CN114548253A (zh) 一种基于图像识别及动态匹配的数字孪生模型构建系统
CN114359314B (zh) 面向仿人钢琴演奏机器人的实时视觉琴键检测与定位方法
CN116091784A (zh) 一种目标跟踪方法、设备及存储介质
CN114972335A (zh) 一种用于工业检测的图像分类方法、装置及计算机设备
CN109712124B (zh) 超声图像的标记去除方法及装置
CN113673478A (zh) 基于深度全景拼接的港口大型设备检测与识别方法
JP3164835B2 (ja) 人物画像認識における前処理方法および後処理方法
JPH08272971A (ja) 対象物認識方法
Wu et al. DeepShapeKit: accurate 4D shape reconstruction of swimming fish
Thalhammer et al. Towards object detection and pose estimation in clutter using only synthetic depth data for training
CN116363085B (zh) 基于小样本学习和虚拟合成数据的工业零件目标检测方法
CN114419451B (zh) 电梯内外识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040316