JP2014174780A - 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム - Google Patents

特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム Download PDF

Info

Publication number
JP2014174780A
JP2014174780A JP2013047506A JP2013047506A JP2014174780A JP 2014174780 A JP2014174780 A JP 2014174780A JP 2013047506 A JP2013047506 A JP 2013047506A JP 2013047506 A JP2013047506 A JP 2013047506A JP 2014174780 A JP2014174780 A JP 2014174780A
Authority
JP
Japan
Prior art keywords
coordinate
feature points
order
value
feature point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013047506A
Other languages
English (en)
Other versions
JP6154627B2 (ja
JP2014174780A5 (ja
Inventor
Nobuhiko Ido
伸彦 井戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2013047506A priority Critical patent/JP6154627B2/ja
Priority to PCT/JP2014/054642 priority patent/WO2014141881A1/ja
Priority to CN201480026530.1A priority patent/CN105190647B/zh
Publication of JP2014174780A publication Critical patent/JP2014174780A/ja
Priority to HK16102378.0A priority patent/HK1214388A1/zh
Publication of JP2014174780A5 publication Critical patent/JP2014174780A5/ja
Application granted granted Critical
Publication of JP6154627B2 publication Critical patent/JP6154627B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/754Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries involving a deformation of the sample pattern or of the reference pattern; Elastic matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】ストロークを要素とする手書き入力文字のような、特徴点を要素とするオブジェクトの2つを比較して、一方のオブジェクトの特徴点と他方のオブジェクトの特徴点とを対応付ける際に、オブジェクトの歪みによる変動や正規化の対象となる変動を吸収して、正確で高速な対応付けを行う。
【解決手段】特徴点の座標が定義されたN次元空間上に互いに平行でない複数の座標軸を定め、該座標軸での座標値によりソートした特徴点の列での出現順を表す整数値を該座標軸での該特徴点の順序座標値とし、特徴点間のコストに該順序座標値の差分に対して単調増加する計算値を含めて、このコストを小さくする対応付けを行う。特徴点のN次元空間上で小さな変動があっても順序座標値が変化しなかったり、一部の座標軸で順序座標値が変わっても他の座標軸で順序座標値が変わらなかったりすることで、変動は吸収される。
【選択図】図5

Description

本発明は、N( N は2 以上の自然数)次元空間のN個の座標値からなる座標を有する特徴点の集合であるオブジェクトの2つを比較して、一方の集合内の特徴点と他方の集合内の特徴点との対応を決定する、対応付け方法、対応付け装置ならびに対応付けプログラムに関する。
N次元( N は2 以上の自然数) 空間上の2つのオブジェクト内のそれぞれの特徴点を対応付ける技術は、様々な分野での応用がある。ここでいう特徴点とは、N 次元空間に対応するN個の座標値からなる座標を持つものであり、オブジェクトの要素となっているものを指す。特徴点には、座標以外に属性値があっても良い。
例えば2次元平面上のストロークにより表現された手書き入力文字と、これとの比較のために参照されるテンプレートの文字とをオブジェクトとし、双方の各ストロークの始点と終点とを特徴点と考えることが出来る。この場合の特徴点の対応付けは、特許文献1に見えるように、オンライン文字認識の分野で応用されている。
あるいは、周波数とその強さの2軸によるスペクトルの2次元平面上で表現された音声信号をオブジェクトとし、そのパス上の点を特徴点と考えることが出来る。この場合の二つの音声信号の特徴点の対応付けは、特許文献2に見えるように、音声認識の分野で応用されている。
上記いずれの応用分野も、教科書(非特許文献1)に記載される一般的な技術分野である。
これらの応用において2つの特徴点が対応付けられることは、その2つの特徴点がそれぞれのオブジェクトにおける他の特徴点との2次元平面上で相互位置関係が同じであるとことを意味している。つまり、他の特徴点に対しても対応付けが行われるので、それぞれのオブジェクトでの相互位置関係が同じであって始めて、全体として対応が付く。
また、これらの応用でのオブジェクトは個体ごとに“歪み”や“ずれ”と呼ぶ変動があり、対応付けを難しくしている。歪みやずれと呼ぶ変動を吸収して対応付けを行う方法としては、弾性マッピングと呼ぶ手法の一つであるDP(ダイナミックプログラミング)マッチングが知られている(特許文献1、非特許文献2)。
DPマッチングは、対応付けされる2つのオブジェクトの一方のオブジェクト内の特徴点と他方のオブジェクト内の特徴点との組み合わせのすべてにコストを定め、1対1の対応付けによるペアのコストの合計を最小化する最適化問題への解法である。非特許文献2(2.1項)にも“局所距離”と記されているように、このコストをしばしば距離とも呼ぶ。実際、コストの値には、2つの特徴点間のユークリッド距離も合算して含められている場合が多い。しかしながら、非特許文献4、もしくは、特許文献1にて従来技術として記されているように、形状の違いを距離と表現している場合もあり、距離という用語が必ずしも幾何学的な距離の定義に適うものを指している訳ではない。例えば、非特許文献3(5.1項)の“筆点移動方向”による値は距離に含められている。
非特許文献4のように、DPマッチングにおいて、2つの特徴点のN次元空間の座標により得られるユークリッド距離をコストに含める場合を考える。もしユークリッド距離が大きければコストは大きくなり、2つの特徴点を対応付けることには否定的になる。すなわち、それぞれのオブジェクトにおける他の特徴点との相互位置関係において、2つの特徴点で違いが大きいことを意味する。逆に、そのユークリッド距離が小さければ、2つの特徴点の前記相互位置関係に違いが少ないことを意味する。このようにDPマッチングのような対応付けにおいて、N次元空間上の座標により得られる特徴点間の距離は、オブジェクト内での特徴点の相互位置関係の違いの大きさの尺度として用いられていると解釈できる。以下では、このユークリッド距離のように、オブジェクト内での特徴点のN次元空間上での相互位置関係の違いの大きさの尺度として用いられているもののみを距離と呼ぶことする。もちろん、ユークリッド距離ばかりではなく、マンハッタン距離や、幾何学的な距離の定義を満たさないものでも距離と呼ぶことにする。非特許文献3に記された形状の違いを距離として評価するようなものは、距離とは呼ばないこととする。
前記の“歪み”や“ずれ”は、対応付けの観点からみると、特徴点のオブジェクト内での相互位置関係は変わらないにも関わらず、N次元空間の座標が変動し、結果として距離にも変動が生じる事象と捉え得る。
一方、どのような対応付けの手法を適用するかに依らず、対応付けに先立って対象のオブジェクトに対して何等かの前処理を行うことが一般的である。例えば、非特許文献3(5.1項)では、文字データに対して“正規化”が行われていることが記されている。非特許文献1(2.4.2項)にも、整合のための処理として、平行移動や拡大縮小処理が用いられることが記されている。例えば手書き入力した文字であれば、描画された字の位置や大きさは当然一律ではないので、大きさや位置などに関して補正は必要となる。すなわち、対応付けの対象となるオブジェクトには、一般的に正規化と呼ぶ処理の対象となる変動が含まれている。前記の特徴点間のユークリッド距離も、非特許文献3に記されたように、通常は正規化の後に算出される。
特開平9−179940号公報
特開平6−51793号公報
半谷 精一郎「バイオメトリクス教科書 ―原理からプログラミングまで―」、コロナ社、2012年7月、ISBN-978-4-339-00835-7
内田 誠一「DPマッチング概説 〜基本と様々な拡張」、電子情報通信学会 技術報告 PRM2006-166、 2006年12月
槇重弼、迫江博昭、「筆順・画数自由オンライン文字認識のための画対応決定法―多層キューブサーチ」 電子情報通信学会論文誌(D-2)、vol. J82-D-2、 no.2、 pp.230-239、 1999年2月
小高和己、若原徹、増田功、「筆順に依存しないオンライン手書き文字認識アルゴリズム」、電子情報通信学会論文誌(D)、vol. J65-D、 no.6、 pp.679-686、 1982年6月
非特許文献3に記された弾性マッピングを含む従来の対応付けでは、前記の歪みによる変動を含んだ座標値を取る座標系のN次元空間上で算出された距離が、上記コストとして用いられている。このために、対応付けにおいてDPマッチングなどの単純では無い手法が必要となる。
特徴点間の距離を算出する際に、歪みによる変動を含んだ座標値を取る座標系ではなく、前記相互位置関係の本質を表す座標値を取る座標系を用いれば、対応付けはより簡単な手法で可能となったり、あるいは、同じ手法を用いてもより正確で高速な処理となったりする効果が生まれる。さらに、正規化の対象となる変動についても、相互位置関係の本質を表す座標値を取る座標系を用いれば、吸収されることになる。
本発明は、歪みによる変動や正規化の対象となる変動を含む座標値を取る座標系から、相互位置関係の本質を表す新たな座標系に変換し、この新たな座標系上での距離を用いた特徴点の対応付け方法、装置、およびプログラムを提供することを目的とする。
本発明に係る特徴点の対応付け方法の第1の構成は、N( N は2 以上の自然数)次元空間のN個の座標値からなる座標を有する2つ以上の特徴点を要素とするオブジェクトの2つを比較して、第1の前記オブジェクトの前記特徴点と第2の前記オブジェクトの前記特徴点とを対応付ける際に、対応付けの対象となる前記特徴点の間のコストを定め、対応付けた前記特徴点の間の前記コストの合算値を小さくするよう対応付けを決定する特徴点対応付け方法において、前記N次元空間上の2つ以上の互いに平行でない複数座標軸を定め、前記複数座標軸の各々の座標軸ごとに、前記第1のオブジェクトの要素である前記特徴点の該座標軸上における座標値を求め、求めた該座標値により前記特徴点を昇順あるいは降順にソートして並べた特徴点の順序列を求め、前記特徴点の前記順序列における出現順を示す整数値をその前記特徴点の該座標軸における順序座標値として算出する第1の順序座標算出ステップと、前記第2のオブジェクトについてもその要素である前記特徴点の前記順序座標値を算出する第2の順序座標算出ステップと、前記第1のオブジェクトの前記特徴点と前記第2のオブジェクトの前記特徴点との2つの特徴点の間の前記コストを、前記複数座標軸の各々の座標軸での前記2つの特徴点の前記順序座標値の差分に対して単調増加する計算値を含ませて定める、コスト算出ステップと、前記コスト算出ステップで定めた前記コストを用いて対応付けを決定するステップとを有することを特徴とする。
この構成によれば、歪みによる変動は、次の2つの効果で吸収される。
一つめの効果は、歪みによる変動で座標値が少々変化しても、順序座標値は同じ値に保たれることである。
二つめの効果は、たとえ前記複数座標軸の一部の座標軸において順序座標値が変動することがあっても、残りの座標軸での順序座標値が保たれることで、全体としては算出されたコストの変動が小さく抑えられることである。
さらに、対応付けに先立つ大きさや位置の正規化も不要となる。歪みによる変動を吸収することと併せて、「順序座標値を用いることが、DPマッチングのような弾性マッピング相当の効果を有している」、あるいは、「弾性マッピングが扱うような歪みを取り除いた本質的な相互位置関係を、順序座標値は表している」と解釈出来る。
本発明に係る特徴点の対応付け方法の第2の構成は、前記第1の構成において、前記第1の順序座標算出ステップと前記第2の順序座標算出ステップは、前記特徴点の前記順序列における出現順を示す整数値に代わって、該整数値を単調関数によって変換した値を、前記順序座標値として用いることを特徴とする。
この構成によれば、たとえ前記第1のオブジェクトの要素である特徴点の数と、前記第2のオブジェクトの要素である特徴点の数とが大きくことなっている場合でも、合理的な対応付けを得ることが出来る。変換に用いる単調関数には、例えば数直線上の閉区間上に一定間隔で並ぶ点の値に対応づける関数を選べば、順序座標値は正規化されることになる。複雑な形に対して、これを簡略化した形への対応付けを行う際には、このように正規化された順序座標値を用いると都合がよい。
本発明に係る特徴点の対応付け方法の第3の構成は、前記第1または第2の構成において、前記オブジェクトは2次元平面上にひとつ以上のストロークとして表現された文字であり、前記特徴点は前記ストロークであり、前記特徴点の座標は前記ストロークの位置を表す前記2次元平面上の一つ以上の点の座標の座標値から構成されることを特徴とする。
この構成によれば、筆記に伴うさまざまな文字の個体差が吸収されるため、筆順に依存しないストロークの対応づけを効果的に行うことが出来る。
本発明に係る特徴点の対応付け装置の第1の構成は、N( N は2 以上の自然数)次元空間のN個の座標値からなる座標を有する2つ以上の特徴点を要素とするオブジェクトの2つを比較して、第1の前記オブジェクトの前記特徴点と第2の前記オブジェクトの前記特徴点とを対応付ける際に、対応付けの対象となる前記特徴点の間のコストを定め、対応付けた前記特徴点の間の前記コストの合算値を小さくするよう対応付けを決定する特徴点対応付け装置において、前記N次元空間上の2つ以上の互いに平行でない複数座標軸を定め、前記複数座標軸の各々の座標軸ごとに、前記第1のオブジェクトの要素である前記特徴点の該座標軸上における座標値を求め、求めた該座標値により前記特徴点を昇順あるいは降順にソートして並べた特徴点の順序列を求め、前記特徴点の前記順序列における出現順を示す整数値をその前記特徴点の該座標軸における順序座標値として算出する第1の順序座標算出手段と、前記第2のオブジェクトについてもその要素である前記特徴点の前記順序座標値を算出する第2の順序座標算出手段と、前記第1のオブジェクトの前記特徴点と前記第2のオブジェクトの前記特徴点との2つの特徴点の間の前記コストを、前記複数座標軸の各々の座標軸での前記2つの特徴点の前記順序座標値の差分に対して単調増加する計算値を含ませて定める、コスト算出手段と、前記コスト算出手段で定めた前記コストを用いて対応付けを決定する手段とを有することを特徴とする。
本発明に係る特徴点の対応付け装置の第2の構成は、前記第1の構成において、前記第1の順序座標算出手段と前記第2の順序座標算出手段は、前記特徴点の前記順序列における出現順を示す整数値に代わって、該整数値を単調関数によって変換した値を、前記順序座標値として用いることを特徴とする。
本発明に係る特徴点の対応付け装置の第3の構成は、前記第1または第2の構成において、前記オブジェクトは2次元平面上にひとつ以上のストロークとして表現された文字であり、前記特徴点は前記ストロークであり、前記特徴点の座標は前記ストロークの位置を表す2次元平面上の一つ以上の点の座標の座標値から構成されることを特徴とする。
本発明に係るプログラムの構成は、前記第1 乃至第3 の構成に係る特徴点の対応付け方法をコンピュータに実行させることを特徴とする。
以上説明したように、本発明によれば、歪みによる変動や正規化の対象となる変動が順序座標値への変換時に吸収されるため、この順序座標値による距離をコストとして対応付けに用いることで、特徴点の対応付けの手順自体を簡略化しても正確な対応付けを得ることが出来るという効果がある。また、簡略化しない手順を用いた場合にも、対応付けの正確さの向上や高速化の効果がある。
本発明の実施例に係る特徴点対応付け装置の概念的な構成図である。 数値例としての複数座標軸列と特徴点を2次平面上に図示したものである。 特徴点の対応付け手順である。 本発明の実施例に係る書き取り試験装置の概念的な構成図である。 書き取り試験装置の動作例である。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
なお、説明に当たっては、一般的なN次元空間ではなく、2次元平面での例を用いる。なお、以下の説明では、特に断らない限り、変数Nを第1のオブジェクトの特徴点の数として使用する。
図1 は、本発明の実施例に係る特徴点対応付け装置(100) の概念的な構成図であり、やりとりされるデータも図中に示している。特徴点対応付け装置(100)は、オブジェクト入力手段(110)、コスト算出手段(120)、対応付け決定手段(130)の3つから構成される。さらに、コスト算出手段(120)は距離コスト算出手段(121)と他のコスト算出手段(125)とから構成され、距離コスト算出手段(121)は順序座標値算出手段(122)と距離算出手段(123)と座標軸定義保持手段(124)とから構成されている。
なお、他のコスト算出手段(125)については、図4での説明において言及する。
図1中、オブジェクト入力手段(110)は、対応付けの対象となる特徴点を要素に持つ第1のオブジェクトと第2のオブジェクトとを入力する。例えば、ストロークで表現された手書き入力文字と正答として参照される文字とがこれにあたる。
オブジェクト入力手段(110)からコスト算出手段(120)中の順序座標値算出手段(122)へは、オブジェクトの要素である特徴点の2次元平面座標(191)がデータとして渡される。このデータを式(1)のように定義する。式(1)のようなデータが、第1のオブジェクトと第2のオブジェクトとのそれぞれについて入力される。
Figure 2014174780
以下の説明では、了解性向上のために定義に平行して具体的な数値例を示していく。式(1)の数値例として、式(2)を与える。
Figure 2014174780
順序座標値算出手段(122)では、座標軸定義保持手段(124)より複数座標軸定義(195)を入力して、特徴点の順序座標(192)を算出する。一般的な複数座標軸定義(195)を、式(3)に示す。式(3)ではK個の座標軸を座標軸列F=(f)としている。座標軸fは、その座標軸上で点(x、y)の座標値を与える関数で表すこととしている。すなわち、ベクトル(a、b)で与えられる座標軸fは、f=ax+byで表している。
Figure 2014174780
式(4)に、式(3)の数値例を示す。式(4)ではfがx軸であり、これをπ/4ずつ反時計回りに回転した座標軸が、f、f、fとなっている。どのような座標軸を定義すれば良いかは、適用分野によって決まる。
Figure 2014174780
なお、座標軸定義の関数に非線形な関数を用いるような拡張も想起されるが、事前に座標変換を行えば同等の効果が得られるため、本質的な拡張とはならない。
次に順序座標値算出手段(122)では、座標軸fごとに、特徴点pの座標値を計算して、その座標値による特徴点の集合のソート(昇順)を実施する。ソートした特徴点の列Ofk(P)を、式(5)に示す。
Figure 2014174780
式(6)に、式(5)の数値例を示す。この値について、図2を用いて説明する。図2は、数値例としての式(4)の複数座標軸列と式(2)の特徴点を2次平面上に図示したものである。たとえば、図2中のfのベクトルの方向で見ると、特徴点はp、p、p、pの順番で並んでいる。これが、式(6)中のOf1(P)の意味である。
Figure 2014174780
特徴点のOfk(P)における0から数えたpの順位をOfk(p)とすると、式(7)のように表現できる。但し、式(7)中の“[..]”は、”..”が真のとき”1”、偽のときに”0”の値を取るものとする。式(5)では座標値が同じ場合の順序の決め方を明示していないが、式(7)では右辺の第2項により特徴点の変数の添え字に従うこととしている。このようなタイブレークの方法には、(ア)少し座標軸を回転させた時の順序に従う、(イ)同じ順位として扱うなどの、別の方法も考えられる。同一直線上に3点以上が並ぶような配置が多い場合以外は、式(7)の方法でも問題ない。
Figure 2014174780
図1中の順序座標(192)を、式(7)のOfk(p)を用いて、式(8)のように定める。式(8)のような順序座標が、第1のオブジェクトと第2のオブジェクトのそれぞれについて順序座標値算出手段(122)にて算出される。
Figure 2014174780
式(9)に、式(8)の数値例を示す。例えば、O(p)の値の(0、2、3、3)は、式(6)でのpの順位がOf0(P)で“0”、Of1(P)で“2”、Of2(P)で“3”、Of3(P)で“3”となっていることを表す。
Figure 2014174780
式(9)のような順序座標を考えた時、方向が逆のベクトルによる座標軸は順序が逆になるだけであることから、式(4)で与える複数座標軸定義(195)は、原点を始点とした第一象限および第二象限に終点を持つ互いに平行でないベクトルに対応する座標軸のみを考えれば良いことが分かる。
第1と第2のオブジェクトそれぞれの特徴点の順序座標(192)を入力した距離算出手段(123)では、これを用いて特徴点間のコスト(193)を算出する。算出方法は、順序座標値の差分に基づくさまざまな計算方法を用いることが考えられる。本実施例では、式(10)に示す、 “順序座標値の差の合計”を採ることとして、コストdOを求める。式(10)以外にも、“順序座標値の差の相乗平均”や、“順序座標値の差の二乗和の平方”などの計算方法を用いる方法も考えられる。順序座標の差が増えればコストが増える関係になっていれば、すなわち、コストが順序座標の差に対して単調増加する計算値であれば良い。なお、式(10)中、Pを第1のオブジェクト、Qを第2のオブジェクトに対応させる。
Figure 2014174780
例えば、式(11)のような数値例を持つ第2のオブジェクトを考えると、第1のオブジェクト中の特徴点pと第2のオブジェクト中の点qとの距離によるコストd(p、q1)は、式(12)のようになる。さらに、第1のオブジェクト中の特徴点と第2のオブジェクト中の点とのすべての組み合わせについてのコスト{d(p、q)}は、表1のようになる。
Figure 2014174780
Figure 2014174780
Figure 2014174780
表1に示した数値例では、第1と第2とのオブジェクトで特徴点の数が同じであったが、これが異なる場合には、式(13)のような正規化を行うことで、例えば複雑な形に対して、これを簡略化した形へ対応付けることが可能となる。式(13)の分母をNではなくN−1としたのは、最下位の順位が”1”となるようにするためである。すなわち、正規化された順序座標値は整数値ではなく、閉区間[0、1]の有理数となる。正規化された場合も、順序距離の定義は式(10)に従う。
Figure 2014174780
式(13)では、順位Ofk(p)に対して線形関数によって正規化順序座標値を得ているが、必ずしも用いる関数は線形である必要はなく、単調関数であれば良い。例えば、式(14)の関数は単調であり、これを用いても良い。式(14)を用いた場合、順位の差は中央付近では敏感に正規化順序座標値に反映され、最上位もしくは最下位へ近づくほど反映される度合は小さくなり、順序座標値の差異についても同様に反映される。また、式(13)(14)はいずれも単調増加関数である。単調減少関数を用いても問題はないが、順位が逆になるだけで、あまり意味は無い。
Figure 2014174780

図1中、対応付け決定手段(130)は、表1の数値例のような式(10)による特徴点間のコスト(193){d(p、q)}を含むコストを入力して、対応付け(194)を決定する。本発明の特徴は順序座標値をコストの算出に用いることであり、対応付け決定手段(130)で使用される手順は特定のものである必要はない。本実施例では、図3に示す単純な特徴点の対応付け手順を採ることとする。図3の手順は、必ずしもコストの合計を最小とする最適な対応付けを得るものではない。しかしながら、順序座標値によるコストが有効に働くため、図3のような単純な対応付け手順を用いても正確な対応付けを得ることが出来る。
対応付け決定手段(130)が図3の手順を用いて表1の数値例のコストにより対応付けを行った場合、表1内に丸印で記したような対応付け(194)が得られる。
以上説明した実施例では、1対1の対応付けを行うことを前提として図3の対応付け手順を用いているが、必ずしも1対1の対応付けのみに本発明は制限される訳ではない。例えば、式(13)のような正規化を行うことで複雑な形を簡略化した形へ対応付ける場合、1対多の対応付けとなる。
次に、上述の実施例1の特徴点対応付け装置(100)を利用して、文字の画の対応付けを行うことで漢字の書き取り試験をタッチパネルを備えた装置上で行う実施例を説明する。
図4は、本発明の実施例に係る書き取り試験装置(400) の概念的な構成図であり、やりとりされるデータも図中に示している。なお、図4中では、図1に記した対応付け装置(100)を書き取り試験装置(400)が外部から利用する形態としているが、これは図1との一貫した説明のためにそのように記しているのであり、もちろん、対応付け装置(100)の機能相当が書き取り試験装置(400)内に組み込まれた形態でも良い。
書き取り試験装置(400)は、タッチパネル(410)中の位置入力手段(420)と表示手段(430)、手書き入力制御手段(440)、書き取り問題管理手段(450)、採点手段(460)から構成されている。さらに、採点手段(460)は、中点算出手段(461)、角度算出手段(462)、正誤判定手段(463)から構成されている。
図4中、書き取り問題管理手段(450)は、書き取りの設問(491)を表示手段(430)に出力し、利用者(499)はこれを視認(492)して、位置入力手段(420)に対して描画による入力(493)を実施する。これを受けて、位置入力手段(420)は描画入力の座標情報(494)を手書き入力制御手段(440)へ出力する。手書き入力制御手段(440)は、表示手段(430)により文字画像(495)を表示し、描画入力が終わり採点を始める時点で手書き入力文字のストローク情報(496)を採点手段(460)に出力する。
続いて採点手段(460)では、手書き入力文字のストローク情報(496)、および、書き取り問題管理手段(450)から入力した正答文字のストローク情報(497)に対して、中点算出手段(461)と角度算出手段(462)とによる処理を行う。中点算出手段(461)では、ストローク情報中の各ストロークの中点を求める。この中点のxy座標が、対応付け装置(100)に入力された際に、特徴点の座標値、すなわち、式(1)の値となる。
角度算出手段(462)では、ストローク情報中の各ストロークの始点と終点でのx軸に対する角度を求める。これは、対応付け装置(100)に入力された際に、図1中の他のコスト算出手段(125)でのコストの算出に用いられる。本発明においては、その特徴である順序座標値の差分に基づく距離によるコストに加えて、必要に応じてその他のコストも合算して対応付け手段(130)への入力とする。この始点と終点でのx軸に対する角度は、その例である。この実施例では、中点算出手段(461)で得たストロークの中点だけでは、例えば“十”の字の第1画と第2画とは区別が着かないため、他のコストとしてこのような角度によるコストが必要となる。式(15)に、角度によるコストdの定義を与える。
Figure 2014174780
図4中の対応付け装置(100)では、採点手段(460)中の中点算出手段(461)と角度算出手段(462)とによる処理が行われたストローク情報のうち、正答文字のストローク情報を第1のオブジェクトとして、手書き入力文字のストローク情報を第2のオブジェクトとして入力する。図1で説明した処理により対応付けを行うが、この際のコストは、式(10)と式(15)とを合算した、式(16)の値dを用いる。
Figure 2014174780
対応付け装置(100)による処理の結果として、対応付け(194)が採点手段(460)中の正誤判定手段(463)へ出力される。正誤判定手段では、対応付けられたストローク、または、ストローク間の関係を比較して、正答文字と手書き入力文字とが一定レベル以上で一致しているか否かを判定し、正答/誤答の判定結果(498)を表示手段(430)へ出力する。
図4を用いて説明した実施例では、ストロークから構成される文字をオブジェクトとし、特徴点であるストロークの中点の平面上の座標を用いて順序座標値を算出しているが、このように平面上の単独の点の座標を用いる以外の方法もある。例えば、ストロークの始点(xs、ys)と終点(xe、ye)とのxy座標を用いて、(xs、ys、xe、ye)の4次元空間上で順序座標値を算出しても良い。その場合、座標軸列としてF=(xs、xs+ys、ys、−xs+ys、xe、xe+ye、ye、−xe+ye)を取れば、始点と終点とを別々に順序付けしていることに相当する処理となる。
この4次元空間での例のように、特徴点の座標は、ストロークの位置を表す2次元平面上の座標値から構成すれば良い。すなわち、ストロークの中点の座標値を用いる場合のように、2次元平面上の単独の点の座標値だけを用いる必要は無い。2次元平面上の単独の点の座標値を用いる場合も、中点である必要は無い。
また、順序座標値によるコストを複数定義する方法もある。すなわち、図1中の他のコスト算出手段(125)でも順序座標値によるコストを算出しても良い。例えば文字をオブジェクトとする場合、始点に関して一つの距離コスト算出手段を設け、終点に関して別の距離コスト算出手段を設ける方法でも良い。この方法は、座標軸列F=(xs、xs+ys、ys、−xs+ys、xe、xe+ye、ye、−xe+ye)を用いた上記の例と類似するが、式(16)中の係数相当を設定できる点などが異なる。
図5に、図4で説明した書き取り試験装置の動作例を示す。図5中、正答の文字のイメージ(501)と、手書き入力文字のイメージ(502)とは、実際のタッチパネルを備えた書き取り試験装置上で手書き入力した文字である。それぞれ筆順に番号を施しており、この番号をインデックスとして対応付けを行う。
図5中、正答の文字のストロークのパス(SVG)(511)は、501に対応するパス情報を、HTML5でも採用されているSVG(Scalable Vector Graph)での記法により記したものである。同様に、512は502のパス情報である。これらのパス情報では、曲線は2次ベジェ曲線で表現されている。なお、SVGにおいては、y軸は文字の下の方に向いており、一般的なxy座標平面とは逆である。511と512のパス情報の座標値、および以下の説明で現れる座標値や順序座標値は、SVGのy軸方向に従っている。
図5中、ストロークの中点の座標と順序座標(520)は、511および512のパス情報から抽出される各ストローク(画)の中点の座標と、これらを式(8)等で定義した順序座標に変換した値である。なお、図5中の順序座標は、正規化を行っていない値を記している。また、中点の座標値には、処理の高速化のために近似値を用いている。
図5中のストローク間の順序距離(530)は、520の値に対して式(10)による順序距離を求めた結果の表である。表の縦方向に501に対応した正答の文字のストロークを、横方向に502に対応した手書き入力文字のストロークを記している。530の値に対して図3に示した対応付け手順を用いて対応付けられる画の組み合わせを、表中の丸印部分で示す。なお、書き取り試験装置が実用場面で動作する際には式(15)で示したコストを合算して対応付けを行うものであるが、式(15)は本発明に直接関わらないため省略した。
530の表の丸印部分のように、501と502との文字の特徴点であるストローク(の中点)が、正しく対応付けられていることが確認できる。502に示した手書き入力文字のイメージは相当歪んでいるが、図3に示した単純な手順によっても正しく対応付けが行われている。
以上説明した実施例では、手書き文字による書き取り試験装置を扱ったが、本発明による対応付け装置は、オンライン文字認識等にも類似した形態で利用可能である。もちろん、手書き文字以外にも、画像や音声信号、文章など、様々な対象をオブジェクトとして適用することも可能である。
画像や音声信号、文章など、様々な対象について、2つのオブジェクト間の対応付けに利用可能であり、認証、認識、検索などの用途に適用できる。
100 特徴点対応付け装置
110 オブジェクト入力手段
120 コスト算出手段
121 距離コスト算出手段
122 順序座標値算出手段
123 距離算出手段
124 座標軸定義保持手段
125 他のコスト算出手段
130 対応付け決定手段
191 特徴点の2次平面座標値
192 特徴点の順序座標
193 特徴点間のコスト
194 対応付け
195 複数座標軸定義
400 書き取り試験装置
410 タッチパネル
420 位置入力手段
430 表示手段
440 手書き入力制御手段
450 書き取り問題管理手段
460 採点手段
461 中点算出手段
462 角度算出手段
463 正誤判定手段
491〜498 データの流れを示す矢印
499 利用者
501 正答の文字のイメージ
502 手書き入力文字のイメージ
511 正答の文字のストロークのパス(SVG)
512 手書き入力文字のストロークのパス(SVG)
520 ストロークの中点の座標と順序座標
530 ストローク間の順序距離

Claims (7)

  1. N( N は2 以上の自然数)次元空間のN個の座標値からなる座標を有する2つ以上の特徴点を要素とするオブジェクトの2つを比較して、
    第1の前記オブジェクトの前記特徴点と第2の前記オブジェクトの前記特徴点とを対応付ける際に、
    対応付けの対象となる前記特徴点の間のコストを定め、対応付けた前記特徴点の間の前記コストの合算値を小さくするよう対応付けを決定する特徴点対応付け方法において、
    前記N次元空間上の2つ以上の互いに平行でない複数座標軸を定め、
    前記複数座標軸の各々の座標軸ごとに、前記第1のオブジェクトの要素である前記特徴点の該座標軸上における座標値を求め、求めた該座標値により前記特徴点を昇順あるいは降順にソートして並べた特徴点の順序列を求め、前記特徴点の前記順序列における出現順を示す整数値をその前記特徴点の該座標軸における順序座標値として算出する第1の順序座標算出ステップと、前記第2のオブジェクトについてもその要素である前記特徴点の前記順序座標値を算出する第2の順序座標算出ステップと、
    前記第1のオブジェクトの前記特徴点と前記第2のオブジェクトの前記特徴点との2つの特徴点の間の前記コストを、前記複数座標軸の各々の座標軸での前記2つの特徴点の前記順序座標値の差分に対して単調増加する計算値を含ませて定める、コスト算出ステップと、
    前記コスト算出ステップで定めた前記コストを用いて対応付けを決定するステップと、
    を有することを特徴とする特徴点の対応付け方法。
  2. 前記第1の順序座標算出ステップと前記第2の順序座標算出ステップは、前記特徴点の前記順序列における出現順を示す整数値に代わって、該整数値を単調関数によって変換した値を、前記順序座標値として用いることを特徴とした、請求項1 に記載の特徴点の対応付け方法。
  3. 前記オブジェクトは2次元平面上にひとつ以上のストロークとして表現された文字であり、前記特徴点は前記ストロークであり、前記特徴点の座標は前記ストロークの位置を表す前記2次元平面上の一つ以上の点の座標の座標値から構成されることを特徴とする、請求項1または請求項2に記載の特徴点の対応付け方法。
  4. N( N は2 以上の自然数)次元空間のN個の座標値からなる座標を有する2つ以上の特徴点を要素とするオブジェクトの2つを比較して、
    第1の前記オブジェクトの前記特徴点と第2の前記オブジェクトの前記特徴点とを対応付ける際に、
    対応付けの対象となる前記特徴点の間のコストを定め、対応付けた前記特徴点の間の前記コストの合算値を小さくするよう対応付けを決定する特徴点対応付け装置において、
    前記N次元空間上の2つ以上の互いに平行でない複数座標軸を定め、
    前記複数座標軸の各々の座標軸ごとに、前記第1のオブジェクトの要素である前記特徴点の該座標軸上における座標値を求め、求めた該座標値により前記特徴点を昇順あるいは降順にソートして並べた特徴点の順序列を求め、前記特徴点の前記順序列における出現順を示す整数値をその前記特徴点の該座標軸における順序座標値として算出する第1の順序座標算出手段と、前記第2のオブジェクトについてもその要素である前記特徴点の前記順序座標値を算出する第2の順序座標算出手段と、
    前記第1のオブジェクトの前記特徴点と前記第2のオブジェクトの前記特徴点との2つの特徴点の間の前記コストを、前記複数座標軸の各々の座標軸での前記2つの特徴点の前記順序座標値の差分に対して単調増加する計算値を含ませて定める、コスト算出手段と、
    前記コスト算出手段で定めた前記コストを用いて対応付けを決定する手段と、
    を有することを特徴とする特徴点の対応付け装置。
  5. 前記第1の順序座標算出手段と前記第2の順序座標算出手段は、前記特徴点の前記順序列における出現順を示す整数値に代わって、該整数値を単調関数によって変換した値を、前記順序座標値として用いることを特徴とした、請求項1 に記載の特徴点の対応付け装置。
  6. 前記オブジェクトは2次元平面上にひとつ以上のストロークとして表現された文字であり、前記特徴点は前記ストロークであり、前記特徴点の座標は前記ストロークの位置を表す2次元平面上の一つ以上の点の座標の座標値から構成されることを特徴とする、請求項1または請求項2に記載の特徴点の対応付け装置。
  7. 請求項1 乃至請求項3 に記載の特徴点の対応付け方法をコンピュータに実行させることを特徴とするプログラム。
JP2013047506A 2013-03-11 2013-03-11 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム Expired - Fee Related JP6154627B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2013047506A JP6154627B2 (ja) 2013-03-11 2013-03-11 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム
PCT/JP2014/054642 WO2014141881A1 (ja) 2013-03-11 2014-02-26 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム
CN201480026530.1A CN105190647B (zh) 2013-03-11 2014-02-26 特征点集合间的对应方法以及对应装置
HK16102378.0A HK1214388A1 (zh) 2013-03-11 2016-03-02 特徵點集合間的對應方法、對應裝置以及對應程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013047506A JP6154627B2 (ja) 2013-03-11 2013-03-11 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム

Publications (3)

Publication Number Publication Date
JP2014174780A true JP2014174780A (ja) 2014-09-22
JP2014174780A5 JP2014174780A5 (ja) 2016-03-24
JP6154627B2 JP6154627B2 (ja) 2017-06-28

Family

ID=51536556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013047506A Expired - Fee Related JP6154627B2 (ja) 2013-03-11 2013-03-11 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム

Country Status (4)

Country Link
JP (1) JP6154627B2 (ja)
CN (1) CN105190647B (ja)
HK (1) HK1214388A1 (ja)
WO (1) WO2014141881A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05250518A (ja) * 1992-03-10 1993-09-28 Hitachi Ltd 文字認識方法
JP2003018557A (ja) * 2001-07-04 2003-01-17 Monolith Co Ltd 画像処理方法および装置
JP2003514305A (ja) * 1999-11-12 2003-04-15 ゴー・センサーズ・エルエルシー マシン・ビジョンのための堅牢なランドマークと前記ランドマークを検出するための方法
JP2008171140A (ja) * 2007-01-10 2008-07-24 Omron Corp 画像処理装置および方法、並びに、プログラム
JP2010027025A (ja) * 2008-06-20 2010-02-04 Sony Corp 物体認識装置、物体認識方法及び物体認識方法のプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3871061B2 (ja) * 2003-03-25 2007-01-24 セイコーエプソン株式会社 画像処理システム、プロジェクタ、プログラム、情報記憶媒体および画像処理方法
KR20080040930A (ko) * 2006-11-06 2008-05-09 삼성전자주식회사 컴퓨터 시스템 및 그 제어방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05250518A (ja) * 1992-03-10 1993-09-28 Hitachi Ltd 文字認識方法
JP2003514305A (ja) * 1999-11-12 2003-04-15 ゴー・センサーズ・エルエルシー マシン・ビジョンのための堅牢なランドマークと前記ランドマークを検出するための方法
JP2003018557A (ja) * 2001-07-04 2003-01-17 Monolith Co Ltd 画像処理方法および装置
JP2008171140A (ja) * 2007-01-10 2008-07-24 Omron Corp 画像処理装置および方法、並びに、プログラム
JP2010027025A (ja) * 2008-06-20 2010-02-04 Sony Corp 物体認識装置、物体認識方法及び物体認識方法のプログラム

Also Published As

Publication number Publication date
CN105190647B (zh) 2018-09-14
CN105190647A (zh) 2015-12-23
HK1214388A1 (zh) 2016-07-22
JP6154627B2 (ja) 2017-06-28
WO2014141881A1 (ja) 2014-09-18

Similar Documents

Publication Publication Date Title
KR102326395B1 (ko) 다수의 객체 입력을 인식하기 위한 시스템 및 그 방법 및 제품
US10762674B2 (en) Beautifying freeform drawings using arc and circle center snapping
Blagojevic et al. The Power of Automatic Feature Selection: Rubine on Steroids.
CN103902098A (zh) 整形装置和整形方法
CN107169485A (zh) 一种数学公式识别方法和装置
US20120295231A1 (en) Realtime user guidance for freehand drawing
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
Ousmer et al. Recognizing 3D trajectories as 2D multi-stroke gestures
Costagliola et al. Recognition and autocompletion of partially drawn symbols by using polar histograms as spatial relation descriptors
Tormási et al. Single-stroke character recognition with fuzzy method
Phan et al. Triangulation based skeletonization and trajectory recovery for handwritten character patterns
Contreras Alejo et al. Recognition of a single dynamic gesture with the segmentation technique hs-ab and principle components analysis (pca)
JP6154627B2 (ja) 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム
Yang et al. A new descriptor for 3D trajectory recognition via modified CDTW
Magrofuoco et al. µV: An Articulation, Rotation, Scaling, and Translation Invariant (ARST) Multi-stroke Gesture Recognizer
CN109992106B (zh) 手势轨迹识别方法、电子设备及存储介质
Prematilake et al. Evaluation and prediction of polygon approximations of planar contours for shape analysis
Wang et al. Using fuzzy hybrid features to classify strokes in interactive sketches
Jian et al. RD-Hand: a real-time regression-based detector for dynamic hand gesture
Lawi A real time alphabets sign language recognition system using hands tracking
Stahovich Pen-based interfaces for engineering and education
Tang et al. 3D face recognition algorithm based on nose tip contour and radial curve
Giangreco-Maidana et al. Contour-point signature shape descriptor for point correspondence
Corr et al. Open source dataset and deep learning models for online digit gesture recognition on touchscreens
Salehin et al. Conics detection method based on pascal's theorem

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160203

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170602

R150 Certificate of patent or registration of utility model

Ref document number: 6154627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees