JP5754055B2

JP5754055B2 - 物体または形状の情報表現方法

Info

Publication number: JP5754055B2
Application number: JP2012545710A
Authority: JP
Inventors: 雄馬松田; 小川　雅嗣; 雅嗣小川; 雅文矢野; 川上　進; 進川上
Original assignee: Tohoku University NUC; NEC Corp
Current assignee: Tohoku University NUC; NEC Corp
Priority date: 2010-11-26
Filing date: 2011-11-11
Publication date: 2015-07-22
Anticipated expiration: 2031-11-11
Also published as: US9256802B2; US20130236108A1; WO2012070474A1; JPWO2012070474A1

Description

本発明は、物体または形状の情報表現方法に関する。

近年、デジタルカメラを始めとするデジタル映像機器の急速な普及に伴い、撮影された画像や映像のなかに、どのような物体が含まれているのかを認識する一般物体認識への期待が高まっている。一般物体認識は、データベース内に分類されずに格納されている画像データの適切な分類や、必要な画像データの検索、さらには動画像の中からの所望のシーンの抽出や、所望のシーンだけを切り取っての再編集など、様々な用途に応用できる可能性を有している。
物体認識に関する技術として、顔認識や指紋認識など様々な認識技術がこれまでに開発されてきたが、これらはすべて特定の用途に向けられたものである。このようなある一つの用途に特化した認識技術は、別の用途に利用しようとすると、途端に認識率が下がるなどの問題がある。このため、一般的な物体の認識を行う技術の開発が期待されている。
一般物体の認識を行うには、認識対象となる画像の特徴量を抽出することが必要となる。この特徴量を抽出する方法として、特許文献１や特許文献２に示される、画像に含まれる幾何学的特徴を用いる方法が、広く知られている。しかしながら、こうした特徴量のほとんどは、統計的学習やユーザーの経験によって、閾値などのパラメータを前もって設定しておかなければ計算できないものである。統計的学習やユーザーの経験を必要とする方法は、これまで学習が行われなかった画像に対して特徴量を計算することができず、誤った認識結果を与えるという問題がある。
統計的学習やユーザーの経験を必要とせずに特徴量を計算する方法として、非特許文献１に示される、画像の局所的な強度勾配を集積したヒストグラムを用いたＳＩＦＴ（ＳｃａｌｅＩｎｖａｒｉａｎｔＦｅａｔｕｒｅＴｒａｎｓｆｏｒｍ）という手法が広く認知されている。本技術を利用することによって、幾何変換や遮蔽を伴う同一画像を、同一であると認識することが可能である。しかしながら、本技術は二つの画像が同一であるか否かを判断するためのものであり、類似する二つの画像に対して、どの程度似ているのかについての情報を与えることができない。
また、非特許文献２に示される、画像輪郭を段階的に平滑化し、それぞれでの輪郭の変曲点の位置を用いて表現したＣＳＳ（ＣｕｒｖａｔｕｒｅＳｃａｌｅＳｐａｃｅ）という表現方法を用いた認識もまた、よく知られている。本技術で用いられている変曲点の位置情報は、同一画像或いは類似する画像において、よく似た出現パターンを持つということが知られている。従って、本技術を用いることによって、輪郭が同一の或いは類似する画像の認識、または、それらの幾何変換が施された画像を、同一である、或いは類似すると認識することが可能である。しかしながら、本技術は、変曲点以外の点の情報を全く利用せず、輪郭に関する情報の中の非常に限られた情報のみを用いる。それゆえ、輪郭が相互に類似する画像であっても、変曲点の位置情報が異なると「類似しない」と判定することがある。また、輪郭が相互に類似しない画像であっても、変曲点の位置情報が比較的類似していると、「類似する」と判定したりすることがある。すなわち、本技術は、類似度を輪郭の特徴によって算出することができていないと言える。
一方で、輪郭上の各点の曲率情報を用いて認識を行う手法もまた提案されている（特許文献３）。本技術は、輪郭上の点すべての曲率情報を用いており、輪郭形状が若干異なる輪郭に対しても、類似度を算出することが可能である。しかしながら、本技術は、形状の外形一周分の輪郭を比較することを前提にしている。このため、輪郭が途中で切れていたり、画像中の物体形状の一部が他の物体形状と重なっている場合には、本技術を用いることができない。

特開２００２−３５２２５２号公報特開２００５−３４６３９１号公報特開平１０−０５５４４７号公報

Ｌｏｗｅ，Ｄ．Ｇ．，Ｏｂｊｅｃｔｒｅｃｏｇｎｉｔｉｏｎｆｒｏｍｌｏｃａｌｓｃａｌｅｉｎｖａｒｉａｎｔｆｅａｔｕｒｅｓ，Ｐｒｏｃ．ｏｆＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，ｐｐ．１１５０−１１５７ＦＡＲＺＩＮＭＯＫＨＴＡＲＩＡＮＡＮＤＡＬＡＮＭＡＣＫＷＯＲＴＨ，Ｓｃａｌｅ−ｂａｓｅｄｄｅｓｃｒｉｐｔｉｏｎａｎｄＲｅｃｏｇｎｉｔｉｏｎｏｆＰｌａｎａｒｃｕｒｖｅｓａｎｄｔｗｏ−ｄｉｍｅｎｓｉｏｎａｌｓｐａｃｅｓ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＰａｔｔｅｒｎＡｎａｌｙｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅＶｏｌ．８，Ｎｏ．１ｐｐ．３４−４３

従来の物体認識方法は、統計的学習やユーザーの経験によって、抽出すべき特徴量を計算する際のパラメータの決定を行っていた。このため、学習していない画像の認識を行うことが困難であった。一方で、統計的学習やユーザーの経験を必要とせずに特徴量を計算する手法は、認識対象の形状が、完全な輪郭を有していない場合において、十分な情報を持つ類似度を計算することが困難であるということが課題であった。
そこで、本発明の目的は、異なる二つの画像に対してどの程度にているのかを示す類似度を求めることができ、幾何変換や遮蔽による画像改変に対してロバストな物体認識を可能にする物体または形状の情報表現方法を提供することにある。
本発明の一形態は、物体または形状を表現するための情報表現方法であって、前記物体または形状の全体または一部の輪郭形状をひとつまたは複数の曲線に分割し、前記輪郭形状を、前記分割された各曲線の曲がり具合と位置関係とを含むパラメータで表現することを特徴とする。
本発明の一形態による効果は、統計的学習やユーザーの経験を必要とすることなく、一般的な物体の認識を行う手法を提供することにある。特に、手書き文字などの、似ているけれども細部が異なる形状や、背景情報から全輪郭を取り出すことが困難な物体形状や、形状の一部が隠蔽されるなどの事情によって欠けているために全輪郭を取り出すことが困難な物体形状や、形状内が不連続であることから全輪郭を取り出すことが困難な物体形状など、一般的に存在する形状に対してロバストな認識を行う手法を提供することにある。

図１は、本発明の第１の実施の形態に係る画像処理装置の概略構成を示すブロック図である。
図２は、図１の画像処理装置に含まれる画像情報取得部によって取得される画像情報が表す画像の一例を示す図である。
図３は、図１の画像処理装置に含まれる輪郭抽出部によって抽出された輪郭情報が示す輪郭線の一例を示す図である。
図４は、ある平滑化レベルに平滑化された輪郭線の一例を示す図である。
図５は、図４に示す輪郭線をさらに高い平滑化レベルまで平滑化した例を示す図である。
図６は、図５に示す輪郭線をさらに高い平滑化レベルまで平滑化した例を示す図である。
図７は、幾何変換について説明するための図である。
図８は、図１の画像処理装置に含まれる輪郭弧長・曲率・位置出力部より出力される情報の一例を示す図である。
図９Ａ及び図９Ｂは、図１の画像処理装置において、類似／非類似の判定の対象となる２つの輪郭線の一例を示す図である。
図１０Ａ及び図１０Ｂは、図９Ａ及び図９Ｂの輪郭線から得た弧長情報と曲率情報とをプロファイル化した結果をそれぞれ示す図である。
図１１は、２種類のフォントの数字の輪郭線を複数段階に平滑化した例を示す図である。
図１２は、図１の画像処理装置の動作の一例を示すフローチャートである。
図１３は、本発明の第２の実施の形態に係る画像処理装置の概略構成を示すブロック図である。
図１４は、分割輪郭線における特徴的な面積を説明するための図である。
図１５は、図１３の画像処理装置の動作の一例を示すフローチャートである。
図１６は、本発明の第３の実施の形態に係る画像処理装置の概略構成を示すブロック図である。
図１７は、図１６の画像処理装置の動作の一例を示すフローチャートである。

以下、図面を参照して本発明の実施の形態について詳細に説明する。
本発明の第１の実施の形態に係る物体または形状を表現するための表現方法は、例えば、図１に示すような画像処理装置によって実現される。
図１の画像処理装置は、制御部１０と、メモリ２０と、入出力部３０と、画像情報取得部１０１と、輪郭抽出部１０２と、輪郭平滑化部１０３と、輪郭分割部１０４と、輪郭弧長計算部１０５と、輪郭曲率計算部１０６と、輪郭位置計算部１０７と、輪郭弧長・曲率・位置出力部１０８と、画像判定部１０９と、画像情報記憶部２０１と、輪郭弧長・曲率・位置情報記憶部２０２とを有している。
画像情報取得部１０１は、入出力部３０を用いてユーザーが指定する写真などの画像情報（画像データ）を、画像情報記憶部２０１から取り出す。或いは、画像情報取得部１０１は、図示しない画像入力部、例えばスキャナ等、から画像情報を入手してもよい。画像情報取得部１０１は、画像情報を取得する際にその後の処理を容易にするための変換処理、例えば、カラー・白黒変換を行ってもよい。図２に、画像情報取得部１０１によって取得される画像情報が表す画像の一例を示す。図２の画像には、物体（犬）が一つだけ含まれている。
輪郭抽出部１０２は、画像情報取得部１０１によって取得された画像情報から画像中に含まれる物体の輪郭情報（輪郭線）を抽出する。輪郭情報の抽出は、例えば、ラプラシアン・ガウシアンフィルタなどを用いて、色相・彩度・明度などが急激に変化する点を抽出することにより行うことができる。もちろん、輪郭情報抽出方法は、上記方法に限られるものではない。抽出された物体の輪郭情報は、例えば、直交座標系を用いて（ｘ，ｙ）などのように表現される輪郭点の集まりとして表現される。輪郭抽出部１０２によって抽出された輪郭情報が示す輪郭線の一例を図３に示す。
輪郭平滑化部１０３は、輪郭抽出部１０２によって抽出された輪郭線に対して段階的な多段階の平滑化を行う。この平滑化には、例えばガウシアンフィルタによる畳み込みなどを利用することができるが、それに限られない。平滑化は、まず、後の処理におけるノイズの影響を除去することを目的として行われ、続いて、段階的な（階層化された）複数の輪郭情報（平滑化輪郭線）を得るために行われる。後述するように、複数の段階的な輪郭情報のそれぞれについて、他の画像中の物体に関して求めた段階的な輪郭情報との類似度を求めることで、物品の形状の類似度をより高い精度で求めることができる。平滑化の度合い（平滑化レベル）は、平滑化回数や、後述する「変曲点」の数に基づいて決定する。変曲点の数を目安に多段階（階層的）に平滑化を行った例を図４から図６に示す。「変曲点」の数は、平滑化を繰り返すことにより減少し、やがてゼロに収束する（あらゆる閉曲面の輪郭は平滑化レベルがある程度以上になると凸図形となる）。
なお、この平滑化は、階層化を平滑化で行う場合は必要だが、その他の手法で階層化を行う場合は必ずしも行う必要はない。
輪郭分割部１０４は、輪郭平滑化部１０３により平滑化された各平滑化レベルの輪郭線を１つ以上の部分輪郭線に分割する分割手段として機能する。この分割は、平滑化輪郭線における曲がり具合に関して特徴的な点を分割点として行う。このような分割点を利用する結果、部分輪郭線は曲線となる。分割点が存在しない場合には、分割は行わない。この場合、分割後の分割輪郭線は、分割前の輪郭線全体に一致する。こうして、物体または形状の全体又は一部の輪郭形状はひとつまたは複数の曲線に分割される。
ここで、「曲がり具合」とは、ユークリッド曲率、ユークリッド曲率半径、アフィン曲率など、曲線の曲がりに関する特徴に基づいて定義される量であり、曲線が、直線に比較してどの程度歪んでいるかを記述する量である。これらの量のうち、どれを曲線の曲がり具合を定義する量として利用してもよいが、ここでは、ユークリッド曲率を利用するものとする。即ち、輪郭分割部１０４は、輪郭上のユークリッド曲率の変曲点を分割点として、輪郭線を分割する。
また、「変曲点」とは、輪郭線上で曲率の符号が変化する点を意味する。ユークリッド曲率の変曲点は、射影変換に対して不変であることから、幾何変換に対してロバストな点である。つまり、ユークリッド曲率の変曲点を分割点とすることにより、幾何変換に対してロバストな点を分割点とすることができる。
ここで、図７を参照して、幾何変換について説明する。図７において、「変換群」とは、各幾何変換を要素に持つ群である。図７から理解されるように、ユークリッド幾何変換（回転を内包）とは、回転・平行移動を伴う変換である。また、アフィン幾何変換（相似変換を内包）とは、ユークリッド幾何変換に拡大縮小・せん断変換を加えたものである。さらに、射影変換とは、アフィン幾何変換に扇形変換を加えたものである。したがって、射影変換⊃アフィン幾何変換⊃ユークリッド幾何変換、の関係が成立しており、射影変換はこの中で最も広義の幾何変換である。ユークリッド曲率の変曲点は、射影幾何変換に対しての不変量であるため、最も広義の幾何変換においてロバストであるということができる。つまり、ユークリッド曲率の変曲点を分割点とすれば、その分割点は、幾何変換に対してロバストな分割点である。
次に、ユークリッド曲率の変曲点を分割点とする輪郭線の分割方法について説明する。
まず、任意の一点を始点として輪郭線を一周するように輪郭点の座標ｔを取る。各輪郭点において、以下の数式（１）で定義されるユークリッド曲率κ（ｔ）を計算し、ユークリッド曲率の値がゼロとなる点を輪郭の分割点として抽出する。

前述のように、輪郭分割部１０４による輪郭線の分割を行う前に、その前処理として、ある程度の平滑化を行っておくことが望ましい。前処理として平滑化を行っておくことにより、ノイズの多い場合に局所的な曲がり具合に影響されずに輪郭線を分割することができる。また、輪郭線の分割は、複数の段階に平滑化された全ての平滑化レベルの平滑化輪郭線に対して行う。なお、輪郭線の長さが後の処理を行うのに十分でない場合は、その輪郭線全体を分割輪郭線とみなし、それ以上の分割を行わなくてもよい。
上記では、ユークリッド曲率の変曲点を用いた輪郭線の分割方法を示したが、輪郭の分割方法はこれに限らない。
輪郭弧長計算部１０５は、輪郭分割部１０４によって分割された分割輪郭線の各々の弧長を計算する。ここでの弧長は、ユークリッド弧長、アフィン弧長の何れであってもよいが、アフィン弧長を利用することが望ましい。アフィン弧長は、等積アフィン幾何変換（ユークリッド幾何変換を含む）に対しての不変量であり、幾何変換に対してよりロバストな量であるからである。アフィン弧長ｓは、以下の数式（２）によって定義される。

ここで、ｔ_１及びｔ_２は、各分割輪郭線の始点及び終点の座標をそれぞれ表している。なお、始点及び終点は、分割輪郭線の形状によって決定できる点である。
輪郭曲率計算部１０６は、輪郭分割部１０４によって分割された分割輪郭線の各々の曲率を計算する。ここでの曲率は、ユークリッド曲率、アフィン曲率の何れであってもよいが、アフィン曲率を利用することが望ましい。アフィン曲率は等積のユークリッド幾何変換を含む等積アフィン幾何変換に対しての不変量であり、幾何変換に対してよりロバストな量であるからである。アフィン曲率κ_Ａは、以下の数式（３）によって定義される。

二階微分及び三階微分をそれぞれ表す。
輪郭曲率計算部１０６によって計算される曲率情報は、分割輪郭線に含まれるすべての輪郭点についての曲率情報を、輪郭点数分の次元のベクトルとして定義してもよく、また、平均値や最大値・最小値などの値で代表させてもよい。分割輪郭線の弧長と曲率の両者を求める効果は、これらは共に等積アフィン変換に対しての不変量であるため、両者の比を取ることで、拡大縮小を伴うアフィン幾何変換に対しての不変量を提供できることである。なお、輪郭点は、分割輪郭線の形状によって決定できる点である。
輪郭弧長計算部１０５によって計算される弧長情報および輪郭曲率計算部１０６によって計算される曲率情報は、ともに、該当する分割輪郭線の曲がり具合を表現する特徴量（パラメータ）であり、これによって、輪郭の特徴がパラメータにより表現される。このように輪郭弧長計算部１０５及び輪郭曲率計算部１０６はそれぞれパラメータ算出手段として機能する。
輪郭位置計算部１０７は、輪郭分割部１０４によって分割された分割輪郭線の各々の位置（位置関係ともいう）を計算する。ここでの位置は、分割輪郭線の両端にある変曲点の座標を用いてもよく、また、分割輪郭線をなす各輪郭点座標を用いて計算される重心などの座標を用いてもよい。座標としては、直交座標系だけでなく、極座標系など様々な座標を用いることが可能である。極座標系を用いると、大きさを含む位置関係だけでなく、相対的な角度による位置関係を表現することも可能となる。
或いは、輪郭線に沿って時計回り又は反時計回りに順番に割り当てた番号を、位置に関する情報として採用してもよい。
さらに、分割輪郭線の位置に関する情報として、分割輪郭線の絶対的な位置や相対的な位置だけでなく、分割輪郭線の凸部が向く方位を含めてもよい。方位は、分割輪郭線に含まれる各点を楕円近似などで近似した際の長軸や短軸の向きとして記述できる。方位の記述方法は、楕円近似による方法に限定されることはなく、例えば、分割輪郭線の二つの端点の位置を結ぶ直線に垂直な向きとして記述する方法など、様々な手法が考えられる。また、こうして方位を定める手法以外にも、（全体の輪郭線に関して）単純な凹凸で記述する手法も考えられる。
輪郭位置計算部１０７による位置計算は、一の物体に関する分割輪郭線相互の位置関係を求めるためにも利用できる。また、一の画像に含まれる複数の輪郭線の相互位置関係を求めるためにも利用できる。複数の輪郭線の位置関係を見ることで、より正確な物体の認識が可能になり、また、輪郭線が物体の一部分を表している場合でもその物体を認識することが可能になる。さらに、一の物体について複数の輪郭線が抽出されるような場合にも有効である。
輪郭弧長・曲率・位置出力部１０８は、輪郭弧長計算部１０５、輪郭曲率計算部１０６及び輪郭位置計算部１０７によってそれぞれ計算された弧長情報、曲率情報及び位置情報を、各分割輪郭線の特徴量を表す情報として輪郭弧長・曲率・位置情報記憶部２０２に出力する。輪郭弧長・曲率・位置出力部１０８より出力される情報の一例を図８に示す。
図８において、画像識別子Ｆ１が付与された輪郭線は、平滑化によって変曲点数がＮ１となったものであり、３つの分割輪郭線Ｃ１〜Ｃ３に分割されている。分割輪郭線Ｃ１は、弧長Ｓ１、曲率Ｋ１、Ｘ座標Ｘ１、Ｙ座標Ｙ１及び方位Ｄ１を有している。分割輪郭線Ｃ２及びＣ３についても同様である。
画像判定部１０９は、輪郭弧長・曲率・位置情報記憶部２０２に格納されている情報（特徴量）に基づいて、２つの物体（画像）間の一致又は類似を判定する。この判定は、一の物体に最も類似する物体を検索するために利用することができる。また、一の物体を複数のグループのいずれかに分類するために、各グループを代表する物体と比較するために利用することができる。いずれにしても、画像判定部は、一の物体に関する情報と、それとは異なる比較用物体の情報とを、輪郭弧長・曲率・位置情報記憶部２０２から取り出して比較し、一致／不一致（類似／非類似）を判定する。
画像判定部１０９による判定は、弧長、曲率、位置及び方位に関する情報の全部又は一部を互いに比較することにより行われる。各情報が示す値又はそれら情報から求められた値の差（パラメータの距離）が予め定めた閾値を下回る場合に、「一致（類似）する」と判定し、そうでなければ「一致（類似）しない」と判定する。
図９Ａ，図９Ｂ，図１０Ａ及び図１０Ｂを参照して、２つの輪郭線の類似／非類似を判定する方法について具体的に説明する。ここでは２つの輪郭線として、互いに異なるフォントの数字“５”を表す２つの輪郭線を例示する。
図９Ａ及び図９Ｂは、互いに異なるフォントの数字“５”の輪郭線と、その輪郭線上の変曲点を示している。これらの輪郭線をそれぞれ複数の分割輪郭線に分割し、各分割輪郭線から弧長情報と曲率情報を得る。そして、得られた弧長情報と曲率情報をプロファイル化し、図１０Ａ及び図１０Ｂにそれぞれ示すようなプロファイルを得る。図１０Ａ及び図１０Ｂにおいて、横軸は分割輪郭線の弧長を累積した長さ、縦軸は各分割輪郭線に対応する曲率である。
以上のようにして得られた２つの輪郭線についてのプロファイルの差を求める。その差は、例えば、弧長の累積した長さが互いに等しいときの曲率の差を、全弧長の累積した長さについて求めて合計した結果として得ることができる。こうして得られた差を、予め設定した閾値と比較することにより、２つの輪郭線の類似／非類似を判定する。
なお、上記例では、判定の対象となる２つの輪郭線がそれぞれ一つの物体の全体を表わしている場合について説明したが、判定の対象となる２つの輪郭線の少なくとも一方が、一つの物体の一部分を表している場合であっても、判定は可能である。これは、本実施の形態では、輪郭分割部１０４によって輪郭線を１以上の部分輪郭線に分割し、その部分輪郭線それぞれについて、弧長・曲率・位置及び方位に関する情報を求めるようにしたためである。したがって、本実施に形態によれば、遮蔽された物体または形状についても判定を行うことが可能である。
また、上記例では、複数の分割輪郭線の全てについての弧長情報と曲率情報を用いて類似／非類似の判定を行う例について説明したが、複数の分割輪郭線のうちの一部についての弧長情報と曲率情報とを用いて類似／非類似の判定を行うようにしてもよい。その場合、例えば、比較する２つの輪郭線に関して、弧長の長いものから順番に所定数の分割輪郭線を選択し、同一順番の分割輪郭線の曲率の差を求める。そして、求めた曲率の差に、弧長の長さの順番に応じた重み付けを行い、重み付けされた曲率の差を合計する。こうして得られた合計に基づいて、２つの輪郭線の類似／非類似の判定を行う。この方法によれば、全ての情報を用いる必要がないので、計算量を低減でき、高速処理が可能になる。
上述した判定は、平滑化レベルごとに行われる。上述したように、各物体の輪郭線は、複数平滑化レベルに平滑化されており、各平滑化レベルの平滑化輪郭線についてそれぞれ特徴量が求められる。平滑化レベルの最も高いものから最も低いものまで、各レベル毎に特徴量を比較することにより物品の形状の類似度を求める。
平滑化レベルが高くなると、全ての図形（輪郭線）は凸図形に収束する。このため、平滑化レベルが高くなるに従い、２つの物体の形状は「一致（類似）する」と判定される可能性が高くなる。したがって、どの平滑化レベルで「一致（類似）する」と判定されたかによって、２つの物体の形状の類似度を表すことができる。例えば、同一の物体の輪郭線は、全ての平滑化レベルで「一致（類似）する」と判定される。また、よく似た物体の輪郭線は、平滑化レベルが比較的低い段階から「一致（類似）する」と判定される。また、ある程度似ている物体の形状は、平滑化レベルが高くなると「一致（類似）する」と判定される。そして、全く似ていない物体の形状は、平滑化レベルが高くなっても「一致（類似）しない」と判定される。このようにして、多段階の平滑化レベルを採用することによって、どの画像がどの画像と、どの程度「類似」しているかが判定できるようになる。
図１１に、２種類のフォントＡ，Ｂの数字“４”、“７”及び“３”をそれぞれ多段階のレベルに平滑化処理した例を示す。平滑化レベルは６段階であって、図の左側から右側に向かうほど平滑化レベルは高くなっている。
各数字の類似／非類似の判定結果は、使用される特徴量及び設定される閾値等によって異なる場合もあり得るが、例えば、以下のような判定結果となる。
平滑化レベル５及び６（図の右から１列目及び２列目）では、全ての数字が「類似」と判定される。
平滑化レベル４（図の右から３列目）では、数字“４”と数字“７”及び“３”とが、「非類似」と判定される。
平滑化レベル３（図の左から３列目）では、数字“７”と数字“３”とが、「非類似」と判定される。
平滑化レベル１（図の左から１列目）では、フォントＡの数字“４”とフォントＢの数字“４”、及びフォントＡの数字“３”とフォントＢの数字“３”が、それぞれ「非類似」と判定される。
以上の結果、類似度を平滑化レベル１〜６で表すものとすると、フォントＡの数字“７”とフォントＢの数字“７”の類似度は「１」、フォントＡの数字“４”とフォントＢの数字“４”及びフォントＡの数字“３”とフォントＢの数字“３”の類似度はそれぞれ「２」となる。また、フォントに関わらず、数字“７”と数字“３”の類似度は「４」となり、数字“４”と数字“７”又は“３”の類似度は「５」となる。
以上のようにして、画像判定部１０９は、２つの輪郭線の類似／非類似を、平滑化レベルごとに行うことで、それらの輪郭線がどの程度似ているかを表す類似度を求めることができる。
なお、画像判定部１０９による類似度の判定は、必ずしも平滑化を用いて行う必要はない。例えば、弧長の長い部分輪郭や、ある図形に特有の部分輪郭から多段階に比較していくなどの手法によっても、これを代用できる。
次に、図１の画像処理装置の動作例について説明する。
図１２は、図１の画像処理装置の動作の例を示すフローチャートである。図示のように、まず、画像処理装置の画像情報取得部１０１は、ユーザーが指定する画像情報を取得する（ステップＳ１００１）。画像情報の取得は、ユーザーの指定に限らず、自動的に取得するようにしてもよい。例えば、センサー等の検出結果に応じて撮像手段からの画像を取得する。
次に、指定されたすべての画像情報を取得したかどうかを確認する（ステップＳ１００２）。指定されたすべての画像情報の取得が完了していない場合（ステップＳ１００２でＮＯ）、指定されたすべての画像情報を取得するまでステップＳ１００１及びＳ１００２を繰り返す。指定されたすべての画像情報を取得すると（ステップＳ１００２でＹＥＳ）、画像情報取得部１０１は、取得した画像情報を輪郭抽出部１０２へ送る。
輪郭抽出部１０２は、画像情報取得部１０１から送られてきた画像情報に基づき、画像に含まれる輪郭情報を抽出する（ステップＳ１００３）。輪郭情報の抽出は、閾値以上の長さの輪郭線など、予めユーザーが設定する等した所定の基準を満たすもののみについて行うことができる。輪郭抽出部１０２が抽出した輪郭情報は、輪郭平滑化部１０３へ送られる。
次に、輪郭平滑化部１０３は、輪郭抽出部１０２からの輪郭情報に基づいて、輪郭線の平滑化を行う（ステップＳ１００４）。変曲点の数を検出し（ステップＳ１００５）、変曲点の数が予め設定された数（ある平滑化段階に対応）に減少したか否か判定する（ステップＳ１００６）。平滑化は、変曲点の数が予め設定された数に一致（減少）するまで繰り返される。複数段階の平滑化を行うため、ステップＳ１００６で使用される予め設定された数は、平滑化レベルに応じて異なる値とする。
輪郭分割部１０４は、ある段階に平滑化された輪郭線を１つ以上の分割輪郭線に分割する（ステップＳ１００７）。この分割は、平滑化輪郭線の曲がり具合に関して特徴的な点を分割点として行う。
輪郭分割部１０４で分割された分割輪郭線の各々について、輪郭弧長計算部１０５は、弧長を計算し（ステップＳ１００８）、輪郭曲率計算部１０６は、曲率を計算し（ステップＳ１００９）、輪郭位置計算部１０７は、位置を計算する（ステップＳ１０１０）。
輪郭弧長・曲率・位置出力部１０８は、ステップＳ１００５からＳ１００７で計算された弧長・曲率・位置情報を輪郭弧長・曲率・位置情報記憶部２０２へ出力し格納させる（ステップＳ１０１１）。
その後、又はステップＳ１００７〜Ｓ１０１１に並行して、輪郭平滑化部１０３は、変曲点の数がゼロまたはあらかじめ指定された個数以下になったか否か判定する（ステップＳ１０１２）。即ち、複数段階の全てについて平滑化輪郭線が得られたか否か判定する。全ての平滑化レベルの平滑化輪郭線が得られていない場合には、ステップＳ１００４に戻り、その後の処理を繰り返す。
次に、輪郭抽出部１０２は、画像情報取得部１０１からの画像情報に含まれる輪郭線の全てを抽出したか否か判定する（ステップＳ１０１３）。これは、複数の輪郭線が存在する場合、特に一つの物体が複数の輪郭線を持つ場合（複数のパーツからなる場合）、のための処理である。抽出されていない輪郭線が存在する場合には、ステップＳ１００３〜Ｓ１０１３を繰り返す。
ステップＳ１０１３においてＹＥＳと判定されると、画像判定部１０９は、輪郭弧長・曲率・位置情報記憶部２０２に格納されている情報に基づいて、ある画像が、他の１つ以上の画像と相互に類似するか否か判定を行う。この判定は、平滑化レベルごとに行われる。
例えば、ある画像（検索キー画像）に最も似ている画像を複数の画像（検索対象画像）の中から検索する場合、輪郭弧長・曲率・位置情報記憶部２０２に格納されている検索キー画像に関する情報と、検索対象画像に関する情報とを比較する。
まず、それぞれの画像について平滑化の度合いの最も低い（最上位の階層の）輪郭線から得た情報同士を比較する（ステップＳ１０１４）。一致（又は類似）する情報が存在する場合（ステップＳ１０１５でＹＥＳ）、その情報に対応するが検索画像を類似画像として出力する（ステップＳ１０１７）。
一致（又は類似）する情報が存在しない場合（ステップＳ１０１５でＮＯ）、一段階平滑化レベルを高めた（一段下の階層の）輪郭線から得た情報同士を比較する（ステップＳ１０１６）。一致（又は類似）する情報が存在する場合（ステップＳ１０１５でＹＥＳ）、その情報に対応するが検索画像を類似画像として出力する（ステップＳ１０１７）。一致（又は類似）する情報が存在しない場合（ステップＳ１０１５でＮＯ）、さらに一段平滑化レベルを高めた輪郭線から得た情報同士を比較する。以降、一致（又は類似）する情報が存在すると判定されるまで、又は、最も度合いの高い平滑化レベルについて判定を終えるまで、ステップＳ１０１５〜Ｓ１０１６が繰り返される。
なお、ここでは、最も類似する画像を出力する場合について説明したが、検索結果を類似度として出力するようにしてもよい。この場合、検索対象画像として、複数種類のグループの代表画像（判断基準画像）を用意しておくことで、検索キー画像がどのグループに属し、どの程度似ているかを、出力結果とすることができる。
以上のように、本実施の形態によれば、複数段階に平滑化した複数の平滑化輪郭線のそれぞれを一つ以上の曲線に分割し、分割された各曲線を曲がり具合と位置関係とを含むパラメータで表現し、平滑化レベルごとにパラメータ（特徴量）を比較するようにしたことで、２つの画像の類似度を適切に評価することができる。
また、複数の分割輪郭線をそれぞれパラメータで表現する（分割輪郭線ごとに特徴量を求める）ようにしたことで、遮蔽に対してロバストな画像認識を行うことができる。
さらに、分割点と、特徴量を適切に選択することで、幾何変換に対してロバストな画像認識を行うことができる。
次に、本発明の第２の実施の形態に係る物体または形状を表現するための表現方法の実現に用いられる画像処理装置について、図面を参照して詳細に説明する。
図１３は、本発明の第２の実施の形態に係る物体または形状を表現するための表現方法を実現に用いられる画像処理装置の構成を示すブロックである。図１の画像処理装置との相違は、輪郭曲率計算部１０６に代えて輪郭占有面積計算部１１１を、輪郭弧長・曲率・位置出力部１０８に代えて輪郭弧長・占有面積・位置出力部１１２を、それぞれ有している点である。また、これらの変更に伴い、輪郭弧長・曲率・位置記憶部２０２は、輪郭弧長・占有面積・位置情報記憶部２０３に名称変更されている。さらに、同一名称であっても、上記変更に対応するため、図１の画像処理装置とは異なる機能を有する要素も存在する。以下、図１の画像処理装置と異なる点ついて説明する。
輪郭占有面積計算部１１１は、輪郭分割部１０４によって分割された分割輪郭線のそれぞれについて特徴的な面積（輪郭占有面積ともいう）を計算する。第１の実施の形態において用いたアフィン曲率は、値の変動が激しく扱いが難しい。これに対して輪郭占有面積は、変動幅が限定的で扱いやすく、物体または形状の認識が容易となる。
ここで、特徴的な面積とは、例えば、図１４に示すように各分割輪郭線２０００１に依存して定まる面積である。つまり、各分割輪郭線の形状によって決定できる点を用いて計算される面積である。詳述すると、分割輪郭線２０００１の両端点２０００２及び２０００３と、分割輪郭線２０００１のアフィン弧長で表現された輪郭弧長を等分（ここでは、３等分）する点２０００４及び２０００５の４点を結ぶ四角形の面積を、特徴的な面積とすることができる。分割輪郭線２０００１の両端点２０００２及び２０００３を結ぶ直線と分割輪郭線２０００１とで囲まれた領域の面積を、特徴的な面積とすることもできる。しかしながら、四点２０００２〜２０００５で囲まれた領域の面積を用いる方が望ましい。これら四点は、射影変換に対して不変量である端点と、アフィン変換に対して不変量となるアフィン弧長を３等分する二点なので、これら四点に囲まれた面積は、等積アフィン変換に対して不変量となり、幾何変換に対してロバストな量となるためである。なお、アフィン弧長で表現された輪郭弧長の分割数は、２以上（２等分以上）であればよい。分割数が２の場合、輪郭占有面積計算部１１１は、分割輪郭線２０００１の両端点２０００２及び２０００３と、一つの分割点を結ぶ三角形の面積を輪郭占有面積として求める。
各分割輪郭線について輪郭占有面積を求めることにより、分割輪郭線が２個以上あれば、それぞれの相対関係を求めることが可能となり、第１の実施の形態よりもより部分的な形状しか検出できない場合の認識に有効となる。
輪郭弧長と輪郭占有面積は、共に等積アフィン変換に対しての不変量であるため、両者の比を取ることで、拡大縮小を伴うアフィン幾何変換に対しての不変量を提供することができる。
輪郭弧長・占有面積・位置出力部１１２は、輪郭弧長計算部１０５、輪郭占有面積計算部１１１、輪郭位置計算部１０７によってそれぞれ計算された弧長情報・占有面積情報・位置情報を、輪郭弧長・占有面積・位置情報記憶部２０３に出力する。輪郭弧長・占有面積・位置出力部１１２によって出力される情報は、輪郭弧長・曲率・位置出力部１０８によって出力される情報（図８）と同様である。ただし、曲率情報に代わって占有面積情報が含まれる。
なお、輪郭位置計算部１０７は、第１の実施の形態とは異なり、輪郭占有面積計算部１１１による占有面積の導出手法と同様の手法で、輪郭位置を計算するようにしてもよい。この手法を採用することによって、アフィン幾何変換に対して不変に位置関係を記述することが可能となる。
また、位置関係から計算される不変量を特徴量に加えてもよい。位置関係から計算される不変量とは、例えば、輪郭分割部１０４によって計算された各分割点（変曲点）のうち、代表的な四点を抽出し、その四点に囲まれる面積である。この量は、等積アフィン幾何変換に対しての不変量を提供する。さらに、この四点の対角線で分断される二つの三角形の面積の比を取ることによって、拡大縮小を伴うアフィン幾何変換に対しての不変量が得られる。
次に、図１５を参照し、図１３に示す画像処理装置の動作について説明する。図１２と異なる点は、ステップＳ１００９に代えて、輪郭占有面積計算部１１１が占有面積を計算する点（ステップＳ１１０１）である。これに伴い、ステップＳ１０１１も、輪郭弧長・占有面積・位置出力部１１２が、ステップＳ１００８、Ｓ１１０１及びＳ１０１０で計算された弧長・占有面積・位置情報を出力するステップＳ１１０２に変更されている。
本実施の形態によれば、アフィン曲率に変えて輪郭占有面積を用いたことで、第１の実施の形態による効果に加え、求めた特徴量が扱いやすく、物体または形状の認識を容易に行うことができる。
次に、本発明の第３の実施の形態に係る物体または形状を表現するための表現方法を実現に用いられる画像処理装置について、図面を参照して詳細に説明する。
図１６は、本発明の第３の実施の形態に係る物体または形状を表現するための表現方法の実現に用いられる画像処理装置の構成を示すブロックである。図１の画像処理装置との相違は、変曲点抽出部１２１、輪郭方位計算部１２２、座標変換部１２４を新たに加えた他、輪郭弧長・曲率・位置出力部１０８に代えて輪郭弧長・曲率・位置・方位出力部１２３を有している点である。さらに、同一名称であっても、上記変更に対応するため、図１の画像処理装置とは異なる機能を有する要素も存在する。以下、図１の画像処理装置と異なる点について説明する。
変曲点抽出部１２１は、第１の実施の形態における輪郭分割部１０４と同様の方法で輪郭上の変曲点を抽出する。ここで、変曲点が観測されない場合、抽出される変曲点の個数はゼロである。
輪郭分割部１０４は、第１の実施の形態における輪郭分割部１０４において、変曲点を輪郭分割点としていた方法とは異なり、変曲点間の領域（輪郭セグメントとする）をさらに分割する（輪郭サブセグメントとする）。輪郭セグメントを分割する方法は、例えば、一つの輪郭セグメント内の輪郭サブセグメントの個数が等しくなるようにし、一つの輪郭セグメント内での輪郭サブセグメントは、弧長が等しくなるように分割する。この、輪郭サブセグメントを生成する方法は、本手法のみに限らず、如何なる手法を用いてもよい。これに伴い、輪郭弧長計算部１０５以降の装置は、前記輪郭サブセグメントそれぞれに対して処理を行うものとする。
輪郭方位計算部１２２は、第１の実施の形態に対して、新たに加えられた処理部である。第１の実施の形態では、輪郭位置計算部１０７が方位を計算する場合があったが、第３の実施の形態では、輪郭方位計算部１２２がこれを行う。これに伴って、輪郭位置計算部１０７は、方位情報とは異なる位置を計算する。例えば、直交座標系を用い、画像内での二次元位置を特定するように位置を計算することができる。輪郭方位計算部１２２の追加に伴い、輪郭弧長・曲率・位置出力部１０８は、輪郭弧長・曲率・位置情報に加え、新たに方位をも出力する輪郭弧長・曲率・位置・方位出力部１２３に変更され、同様に、輪郭弧長・曲率・位置情報記憶部２０２は、輪郭弧長・曲率・位置・方位情報記憶部２０４に変更されている。
座標変換部１２４は、画像情報取得部１０１において取得された画像の座標を、画像情報記憶部２０１に含まれる画像のそれぞれに対応するように、適切に変換する。また、座標変換部１２４は、輪郭弧長・曲率・位置・方位出力部１２３から出力された輪郭弧長・曲率・位置・方位情報についても座標変換する。座標変換は、画像情報取得部１０１において取得された画像に関して出力された輪郭弧長・曲率・位置・方位情報が、画像情報記憶部２０１に含まれるそれぞれの画像に対応する輪郭弧長・曲率・位置・方位情報のそれぞれと、最も近似するように行われる。座標変換には、例えば二次元の直交座標系における並進、回転、拡大縮小、アフィン幾何変換、射影幾何変換などの線形変換を用いることができる。座標変換に用いる変換手段は線形変換・非線形変換を問わず、如何なる変換手段を用いてもよい。
次に、図１７を参照し、図１６に示す画像処理装置の動作について説明する。図１２と異なる点は、ステップＳ１０１０の後に、輪郭方位計算部１２２が、輪郭方位を計算する点（Ｓ１２０１）である。これに伴い、ステップＳ１０１１も、輪郭弧長・曲率・位置・方位出力部１２３が、ステップＳ１００８、Ｓ１００９、Ｓ１０１０、Ｓ１２０１で計算された弧長・曲率・位置・方位情報を出力するステップＳ１２０２に変更されている。さらに、図１７では、ステップＳ１００７において分割された部分輪郭は前記サブセグメントに対応する。また、ステップＳ１０１４における画像の探索は、座標変換部１２４における座標変換処理を伴う。
本実施の形態によれば、輪郭をセグメントおよびサブセグメントの二段階で分割したこと、並びに座標変換を用いたことで、第１の実施の形態による効果に加え、以下の効果が期待できる。
まず、セグメントは、二つの画像の対応点を高速に探索するのに寄与する。
次に、サブセグメントは、セグメント内（変曲点間）の局所的な輪郭の特徴を詳細に記述できる。
最後に、座標変換は、画像の歪みに関わらずロバストな画像認識を行うのに寄与する。
以上、本発明についていくつかの実施の形態に即して説明したが、本発明は上記実施の形態に限定されるものでなく、本発明の範囲を逸脱しない限りにおいて、種々の変更、変形が可能である。
例えば、上記実施の形態では、輪郭弧長計算部１０５と輪郭曲率計算部１０６または輪郭占有面積計算部１１１との組み合わせを例示したが、これら組合せに代えて、輪郭曲率計算部１０６と輪郭占有面積計算部１１１との組合せを用いることもできる。さらに、輪郭方位計算部１２２を組み合わせてもよい。これらの場合、他の関連する構成要素は、その組合せに応じて、適宜変更される。
また、上記実施の形態では、画像処理を専門に行う画像処理装置について説明したが、通常の計算機（コンピュータ）に上記処理を行うプログラムを実行させることにより、画像処理装置として動作させるようにしてもよい。即ち、本発明は、計算機に上述した画像処置方法を実行させるプラグラムとして提供され得る。あるいは、当該プログラムが記録されたコンピュータ読み取り可能な一時的でない情報記録媒体として提供され得る。通常の計算機を用いて、例えば、図１の画像処理装置として動作させる場合、計算機は、少なくとも制御部１０、メモリ２０及び入出力部３０を有していればよい。メモリ２０が、プログラムを格納するとともに、画像情報記憶部２０１と輪郭弧長・曲率・位置情報記憶部２０２を兼ねる。また、制御部１０が、プログラムを実行することにより、画像情報取得部１０１〜画像判定部１０９を兼ねる。必要により、情報記録媒体からプログラムを読み取り、読み取ったプログラムをメモリ２０等へ送る読取装置が設けられる。
また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
（付記１）画像データを処理することによって、前記画像データが表す画像に含まれる物体の輪郭線を特定し、前記輪郭線を段階的に平滑化して複数段階の平滑化輪郭線を得、前記複数段階の平滑化輪郭線の各々について特徴量を求め、求めた各段階の平滑化輪郭線についての特徴量と、予め比較用物体に関して求めておいた各段階に対応する特徴量とに基づいて、前記物体と前記比較用物体との類似度を求める、ことを特徴とする画像処理方法。
（付記２）前記特徴量を求める工程は、前記複数段階の平滑化輪郭線のそれぞれを１以上の部分輪郭線に分割し、前記分割輪郭線のそれぞれについて特徴量を求める、ことを特徴とする付記１に記載の画像処理方法。
（付記３）前記特徴量が、各部分輪郭線の位置と曲がり具合に関する情報を含むことを特徴とする付記２に記載の画像処理方法。
（付記４）前記曲がり具合に関する情報は、前記部分輪郭線上に存在する複数の点又は前記部分輪郭線の形状に依存して定まる複数の点を結ぶ直線に囲まれた領域の面積であることを特徴とする付記３に記載の画像処理方法。
（付記５）前記曲がり具合に関する情報は、前記部分輪郭線上に存在する複数の点又は前記部分輪郭線の形状に依存して定まる複数の点を結ぶ直線に囲まれた領域の面積、前記部分輪郭線の弧長、及び前記部分輪郭線の曲率のうち、いずれか２つ以上の組み合わせであることを特徴とする付記３に記載の画像処理方法。
（付記６）前記曲線の曲がり具合に関する情報は、前記曲線の弧長及び曲率の二つにより表されることを特徴とする付記５に記載の画像処理方法。
（付記７）前記弧長及び前記曲率は、それぞれアフィン弧長及びアフィン曲率であることを特徴とする付記６に記載の画像処理方法。
（付記８）前記部分輪郭線上に存在する複数の点及び前記部分輪郭線の形状に依存して定まる複数の点は、アフィン幾何変換に対して不変位置にあることを特徴とする付記４乃至７のいずれかに記載の画像処理方法。
（付記９）前記部分輪郭線への分割を行う分割点は、前記輪郭線上の曲率の符号が変化する変曲点を含むことを特徴とする付記２乃至８のいずれか記載の画像処理方法。
（付記１０）前記部分輪郭線への分割を行う方法は、前記輪郭線上の曲率の符号が変化する変曲点をもとに大域的に分割し、さらに、変曲点の間の領域を局所的に分割することによる、二段階の分割方法を用いることを特徴とする付記２乃至付記９の何れかに記載の画像処理方法。
（付記１１）前記面積は、前記部分輪郭線の両側の端点と、当該部分輪郭線をアフィン弧長に基づいて複数に分割したときの分割点とによって定まる領域の面積であることを特徴とする付記４乃至５のいずれかに記載の画像処理方法。
（付記１２）前記部分輪郭線の位置に関する情報は、アフィン幾何変換に対して不変な量であることを特徴とする付記３乃至１１のいずれかに記載の画像処理方法。
（付記１３）前記部分輪郭線の位置に関する情報は、前記輪郭線に沿って順番に付与される番号、又は座標であることを特徴とする付記３乃至１２のいずれかに記載の画像処理方法。
（付記１４）前記特徴量は、さらに各部分輪郭線の方位に関する情報を含むことを特徴とする付記１乃至１３のいずれかに記載の画像処理方法。
（付記１５）付記１乃至１４のいずれかに記載の画像処理方法を実行する画像処理装置。
（付記１６）付記１乃至１５のいずれかに記載の画像処理方法を計算機に実行させるプログラム。

本発明によれば、一般的な画像や動画内での物体の認識において、所望の画像の検索や、画像の分類といった用途に適用可能である。特に、類似するが異なる画像の検索や分類といった用途に適用可能である。
この出願は、２０１０年１１月２６日に出願された日本出願特願２０１０−２６３８７７号及び２０１１年９月２８日に出願された日本出願特願２０１１−２１３００５号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１０制御部
２０メモリ
３０入出力部
１０１画像情報取得部
１０２輪郭抽出部
１０３輪郭平滑化部
１０４輪郭分割部
１０５輪郭弧長計算部
１０６輪郭曲率計算部
１０７輪郭位置計算部
１０８輪郭弧長・曲率・位置出力部
１０９画像判定部
１１１輪郭占有面積計算部
１１２輪郭弧長・占有面積・位置出力部
１２１変曲点抽出部
１２２輪郭方位計算部
１２３輪郭弧長・曲率・位置・方位出力部
１２４座標変換部
２０４輪郭弧長・曲率・位置・方位情報記憶部
２０１画像情報記憶部
２０２輪郭弧長・曲率・位置情報記憶部
２０３輪郭弧長・占有面積・位置情報記憶部
２０００１分割輪郭線
２０００２，２０００３端点
２０００４，２０００５アフィン弧長で表現された輪郭弧長を等分する点

Claims

画像に含まれる物体または形状を表現するための情報表現方法であって、
画像処理装置を用いて、
前記画像から前記物体または形状の全体または一部の輪郭形状を抽出する処理と、
抽出した前記輪郭形状を一つまたは複数の曲線に分割する処理と、
前記輪郭形状を、前記分割された各曲線の曲がり具合と位置関係とを含むパラメータで表現する処理と、
を実行し、
前記曲線の曲がり具合は、前記曲線上または曲線の形状によって位置を決定できる複数の点を用いて計算された面積で表される
ことを特徴とする物体または形状の情報表現方法。
画像に含まれる物体または形状を表現するための情報表現方法であって、
画像処理装置を用いて、
前記画像から前記物体または形状の全体または一部の輪郭形状を抽出する処理と、
抽出した前記輪郭形状を一つまたは複数の曲線に分割する処理と、
前記輪郭形状を、前記分割された各曲線の曲がり具合と位置関係とを含むパラメータで表現する処理と、
を実行し、
前記曲線の曲がり具合は、前記曲線上または曲線の形状によって位置を決定できる複数の点を用いて計算された面積、前記曲線の弧長及び前記曲線の曲率のうち、何れか二つ以上により表される
ことを特徴とする物体または形状の情報表現方法。
前記曲線の曲がり具合は、
前記曲線の弧長及び前記曲線の曲率、
の二つにより表される
ことを特徴とする請求項２に記載の物体または形状の情報表現方法。
前記曲線の弧長及び前記曲線の曲率は、
それぞれアフィン弧長及びアフィン曲率である
ことを特徴とする請求項２または３に記載の物体または形状の情報表現方法。
前記曲線上または曲線の形状によって位置を決定できる複数の点の位置は、
アフィン幾何変換に対して不変な位置である
ことを特徴とする請求項１から４の何れかに記載の物体または形状の情報表現方法。
前記分割を行う分割点は、
輪郭上の曲率の符号が変化する変曲点を含む
ことを特徴とする請求項１から５の何れかに記載の物体または形状の情報表現方法。
前記分割を行う方法は、
輪郭上の曲率の符号が変化する変曲点をもとに大域的に分割し、
さらに、変曲点の間の領域を局所的に分割することによる、
二段階の分割方法を用いる、
ことを特徴とする請求項１から６の何れかに記載の物体または形状の情報表現方法。
前記曲線によって定義される面積は、
前記曲線を、曲線のアフィン弧長を指標として複数に等分割する分割点および曲線の端点のうちの三点以上を用いて導出される
ことを特徴とする請求項１から７の何れかに記載の物体または形状の情報表現方法。
前記曲線間の位置関係は、
アフィン幾何変換に対して不変な量で表される
ことを特徴とする請求項１から８の何れかに記載の物体または形状の情報表現方法。
前記曲線の位置関係は、
前記分割された各曲線の位置関係または、複数の前記輪郭形状における分割された各曲線の位置関係である
ことを特徴とする請求項１から９の何れかに記載の物体または形状の情報表現方法。
前記曲線の位置関係は、
前記各曲線の順番あるいは座標を含む客観的な指標から選択された一以上の指標により表される
ことを特徴とする請求項１から１０の何れかに記載の物体または形状の情報表現方法。
前記分割された各曲線は、
前記曲線の曲がり具合と位置関係とさらに方位とを含むパラメータで表現される
ことを特徴とする請求項１から１１の何れかに記載の物体または形状の情報表現方法。
前記分割された各曲線は、複数に階層化された情報で表現される、ことを特徴とする請求項１から１２の何れかに記載の物体または形状の情報表現方法。
二つの前記物体または形状を照合する際に、
前記情報表現は、幾何変換を伴う、ことを特徴とする請求項１から１３の何れかに記載の物体または形状の情報表現方法。
画像に含まれる物体または形状の全体または一部の輪郭形状を抽出する抽出手段と、抽出した前記輪郭形状を一つまたは複数の曲線に分割する分割手段、及び前記輪郭形状を、前記分割された各曲線の曲がり具合と位置関係とを含むパラメータで表現するパラメータ算出手段、を備え、前記パラメータ算出手段は、前記曲線の曲がり具合として、前記曲線上または曲線の形状によって位置を決定できる複数の点を用いて計算された面積を求めることを特徴とする物体または形状の情報表現するシステム。
画像に含まれる物体または形状の全体または一部の輪郭形状を抽出するステップ、抽出した前記輪郭形状を一つまたは複数の曲線に分割するステップ、及び前記輪郭形状を、前記分割された各曲線の曲がり具合と位置関係とを含むパラメータで表現するステップをコンピュータに実行させるプログラムであって、
前記パラメータで表現するステップは、前記曲線の曲がり具合として、前記曲線上または曲線の形状によって位置を決定できる複数の点を用いて計算された面積を求めるステップを含む
ことを特徴とするプログラム。
物体を含む画像を表す画像データを処理することにより、前記物体の輪郭線の少なくとも一部を一つ以上の曲線に分割し、前記一つ以上の曲線の各々を、曲がり具合を表す第１のパラメータと位置を表す第２のパラメータとを用いて表現する画像処理装置による物体形状の表現方法であって，
前記曲線の曲がり具合は、前記曲線上または曲線の形状によって位置を決定できる複数の点を用いて計算された面積で表される
ことを特徴とする物体形状の表現方法。