CN105190647A - 特征点集合间的对应方法、对应装置以及对应程序 - Google Patents
特征点集合间的对应方法、对应装置以及对应程序 Download PDFInfo
- Publication number
- CN105190647A CN105190647A CN201480026530.1A CN201480026530A CN105190647A CN 105190647 A CN105190647 A CN 105190647A CN 201480026530 A CN201480026530 A CN 201480026530A CN 105190647 A CN105190647 A CN 105190647A
- Authority
- CN
- China
- Prior art keywords
- coordinate
- unique point
- order
- point
- cost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/754—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries involving a deformation of the sample pattern or of the reference pattern; Elastic matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
如以笔画作为要素的手写输入文字这样的、将特征点作为要素的对象,对2个所述对象进行比较、使一个对象的特征点与另一个对象的特征点进行对应时,吸收对象中由失真产生的变动或作为规范化对象的变动,以进行正确高速的对应。进行的对应如下,即:确定定义有特征点坐标的N维空间上彼此不平行的多个坐标轴,将根据在该坐标轴上的坐标值而进行排序的特征点序列中表示出现顺序的整数值,作为该特征点在该坐标轴的顺序坐标值,使特征点间的成本包括对该顺序坐标值的差分进行单调增加而得的计算值,使该成本变小。即使特征点在N维空间上存在小的变动,顺序坐标值也不会变化,即使在一部分坐标轴上顺序坐标值产生变化,在其他坐标轴上顺序坐标值也不会变化,由此来吸收变动。
Description
技术领域
本发明涉及对作为特征点集合的2个对象进行比较,确定一个集合内的特征点与另一个集合内的特征点之间的对应的对应方法、对应装置以及对应程序,其中,所述特征点具有包括N(N为2以上的自然数)维空间中N个坐标值的坐标。
背景技术
使N维(N为2以上的自然数)空间中的2个对象内的每个特征点相对应的技术包括在各领域的应用。在此所述的特征点具有包括与N维空间相对应的N个坐标值的坐标,并成为对象的要素。特征点也可以具有除坐标之外的属性值。
例如,将2维平面上通过笔画来表现的手写输入文字以及为了与其进行比较而参照的模板文字作为对象,可以将双方各笔画的起点和终点考虑为特征点。如专利文献1所示,这种情况的特征点的对应被应用于联机文字识别的领域。
或者,可以将在由频率与信号强度这两轴形成的频谱的2维平面上表现的音声信号作为对象,并将其路径上的点考虑为特征点。如专利文献2所示,这种情况的2个音声信号的特征点的对应被应用于音声识别的领域。
上述任一应用领域均为教科书(非专利文献1)记载的一般性技术领域。
在这些应用中,2个特征点对应是指,该2个特征点与各自对象中其他特征点在2维平面上的相互位置关系是相同的。即,相对其他特征点也进行对应,因此,在各自对象中的相互位置关系相同,作为整体才会对应。
此外,对于这些应用中的对象,每个个体中存在被称为“失真”或“偏差”的变动,而使对应变难。作为吸收被称为失真或偏差的变动而进行对应的方法,已知有被称作弹性对应的手法之一的DP(动态规划)匹配(专利文献1、非专利文献2)。
DP匹配为最优化问题的解决方法,即,对被对应的2个对象中一个对象内的特征点与另一个对象内的特征点的所有组合确定成本,使1对1的对应所形成的组的成本总计最小化。如非专利文献2(2.1项)还记述有“局部距离”,该成本还经常被称为距离。实际上,成本值中,2个特征点间的欧几里德距离也合计包括在内的情形较多。但是,如非专利文献4或如专利文献1中作为以往技术而记述的,还存在将形状的差异表现为距离的情形,距离这一用语并非一定符合几何学距离的定义。例如,非专利文献3(5.1项)的“笔点移动方向”的值便包括在距离中。
如非专利文献4考虑在DP匹配中,将通过2个特征点的N维空间的坐标而得的欧几里德距离包括在成本内的情况。如果欧几里德距离大则成本会变大,2个特征点相对应便为否定的。即意味着,与各自对象中其他特征点的相互位置关系上,2个特征点差异大。反之,如果该欧几里德距离小,则意味着2个特征点在上述相互位置关系中差异较少。如此,在DP匹配这样的对应中可以解释为:由N维空间上的坐标而得的特征点间的距离被用作为在对象内特征点的相互位置关系的差异大小的尺度。以下仅将如该欧几里德距离这样被用作为在对象内特征点于N维空间上的相互位置关系的差异大小的尺度者称为距离。当然不仅欧几里德距离,还将曼哈顿距离或不满足几何学距离定义者也称为距离。而非专利文献3中记述的将形状差异作为距离来进行评价的情形则不称为距离。
上述“失真”或“偏差”从对应的观点来看,可以被理解为以下现象,即,虽然特征点在对象内的相互位置关系没有变化,但是N维空间的坐标却产生变动,作为结果距离也会产生变动。
另一方面,无论应用哪种对应方法,一般在对应之前要对对象客体进行某些预处理。例如,非专利文献3(5.1项)记述了对文字数据进行了“规范化”。非专利文献1(2.4.2项)还记述有:作为用于调整的处理,采用平行移动或放大缩小处理。例如,如果是手写输入的文字,所描绘的文字的位置或大小当然不是一律的,因此需要对大小或位置等进行修正。即,在作为对应对象的对象中包括变动,该变动作为一般被称作规范化的处理的对象。如非专利文献3所述,上述特征点间的欧几里德距离通常也在规范化后进行计算。
现有技术文献
专利文献
专利文献1:日本特开平9-179940号公报
专利文献2:日本特开平6-51793号公报
非专利文献1:半谷精一郎《生物识别技术教科书-从原理到编制程序-》日本CORONA出版社2012年7月ISBN-978-4-339-00835-7
非专利文献2:内田诚一《DP匹配概论~基础与各种扩充》日本电子情报通信学会技术报告PRM2006-1662006年12月
非专利文献3:槙重弼、迫江博昭《用于笔顺·笔画数自由联机文字识别的笔画对应确定法-多层次Cube检索》日本电子情报通信学会论文期刊(D-2)vol.J82-D-2no.2pp.230-2391999年2月
非专利文献4:小高和己、若原徹、增田功《不依赖于笔顺的联机手写文字识别运算法则》日本电子情报通信学会论文期刊(D)vol.J65-Dno.6pp.679-6861982年6月
发明内容
发明要解决的问题
在包括非专利文献3所述弹性对应的以往对应中,在取包含有上述由失真产生的变动的坐标值的坐标系中、于N维空间上计算出的距离被用作为上述成本。因此,对于对应则需要DP匹配等非单纯手法。
在计算特征点间的距离时,如果不使用取包含有由失真产生的变动的坐标值的坐标系,而是使用取表示上述相互位置关系本质的坐标值的坐标系,则会产生以下效果,即,能够通过更简单的手法来进行对应,或者即使采用相同的手法,也会为更准确高速的处理。并且,如果使用取表示相互位置关系本质的坐标值的坐标系的话,还会对作为规范化对象的变动进行吸收。
本发明的目的在于提供特征点的对应方法、装置以及程序,即为,从取包含由失真产生的变动、或包含作为规范化对象的变动的坐标值的坐标系,转换到表示相互位置关系本质的新坐标系,使用该新坐标系上的距离的、特征点的对应方法、装置以及程序。
解决问题的技术方案
本发明的特征点的对应方法的第1构成为:一种特征点的对应方法,构成为,将2个以上的特征点作为要素的对象,其中所述2个以上的特征点均具有包括N(N为2以上的自然数)维空间中N个坐标值的坐标,当对2个所述对象进行比较、使第1所述对象的所述特征点与第2所述对象的所述特征点进行对应时,确定作为对应对象的所述特征点之间的成本,使对应的所述特征点之间的所述成本的合计值变小,以确定对应,所述特征点的对应方法的特征在于,包括:第1顺序坐标计算步骤,确定所述N维空间上彼此不平行的2个以上的多个坐标轴,对所述多个坐标轴的每个坐标轴,求算作为所述第1对象要素的所述特征点在该坐标轴上的坐标值,求取根据求算出的该坐标值将所述特征点按升序或降序排序罗列的特征点序列,计算表示所述特征点在所述序列中的出现顺序的整数值,来作为所述特征点在该坐标轴的顺序坐标值;第2顺序坐标计算步骤,对所述第2对象,也对作为其要素的所述特征点的所述顺序坐标值进行计算;成本计算步骤,将所述第1对象的所述特征点与所述第2对象的所述特征点这2个特征点之间的所述成本确定为,包括对所述2个特征点在所述多个坐标轴的每个坐标轴上的所述顺序坐标值的差分进行单调增加而得的计算值;以及利用通过所述成本计算步骤确定的所述成本来确定对应的步骤。
根据该构成,通过以下2个效果来吸收由失真产生的变动。第1个效果为,即使坐标值由于由失真产生的变动而稍微产生变化,顺序坐标值也会保持为相同的值。
第2个效果为,在所述多个坐标轴中的一部分坐标轴上即使有时顺序坐标值产生变动,通过保持其余坐标轴上的顺序坐标值,从而使整体上计算出的成本的变动被抑制得较小。
并且,在对应之前不需要进行大小或位置的规范化。吸收由失真产生的变动,并且可以解释为,“利用顺序坐标值则具有相当于DP匹配这样的弹性对应的效果”,或“顺序坐标值体现了将如弹性对应所要处理的失真去除后的本质性相互位置关系”。
本发明的特征点的对应方法的第2构成的特征在于:对于所述第1构成,在所述第1顺序坐标计算步骤和所述第2顺序坐标计算步骤中,取代表示所述特征点在所述序列中的出现顺序的整数值,而是使用将该整数值通过单调函数进行转换而得的值来作为所述顺序坐标值。
根据该构成,即使在作为所述第1对象要素的特征点的数量与作为所述第2对象要素的特征点的数量存在较大差异的情形下,也能够获得合理的对应。对于用于转换的单调函数,例如如果选择对应于在实数直线上的闭区间上以一定间隔排列的点的值的函数,便会使顺序坐标值规范化。对于复杂的形态,会对将其简略化后的形态进行对应,此时,使用这样被规范化的顺序坐标值正合适。
本发明的特征点的对应方法的第3构成的特征在于:对所述第1构成或第2构成,所述对象为在2维平面上作为1个以上的笔画而表现的文字,所述特征点为所述笔画,所述特征点的坐标由所述2维平面上表示所述笔画位置的1个以上的点的坐标的坐标值而构成。
根据该构成,由于伴随书写而产生的各种文字个体差异被吸收,因此能够有效地进行不依赖于笔顺的笔画对应。
本发明的特征点的对应装置的第1构成为:一种特征点对应装置,构成为,将2个以上的特征点作为要素的对象,其中所述2个以上的特征点均具有包括N(N为2以上的自然数)维空间中N个坐标值的坐标,当对2个所述对象进行比较、使第1所述对象的所述特征点与第2所述对象的所述特征点进行对应时,确定作为对应对象的所述特征点之间的成本,使对应的所述特征点之间的所述成本的合计值变小,以确定对应,所述特征点的对应装置的特征在于,包括:第1顺序坐标计算装置,确定所述N维空间上彼此不平行的2个以上的多个坐标轴,对所述多个坐标轴的每个坐标轴,求算作为所述第1对象要素的所述特征点在该坐标轴上的坐标值,求取根据求算出的该坐标值将所述特征点按升序或降序排序罗列的特征点序列,计算表示所述特征点在所述序列中的出现顺序的整数值,来作为所述特征点在该坐标轴的顺序坐标值;第2顺序坐标计算装置,对所述第2对象,也对作为其要素的所述特征点的所述顺序坐标值进行计算;成本计算装置,将所述第1对象的所述特征点与所述第2对象的所述特征点这2个特征点之间的所述成本确定为,包括对所述2个特征点在所述多个坐标轴的每个坐标轴上的所述顺序坐标值的差分进行单调增加而得的计算值;以及利用通过所述成本计算装置确定的所述成本来确定对应的装置。
本发明的特征点的对应装置的第2构成的特征在于:对于所述第1构成,在所述第1顺序坐标计算装置和所述第2顺序坐标计算装置中,取代表示所述特征点在所述序列中的出现顺序的整数值,而是使用将该整数值通过单调函数进行转换而得的值来作为所述顺序坐标值。
本发明的特征点的对应装置的第3构成的特征在于:对所述第1构成或第2构成,所述对象为在2维平面上作为1个以上的笔画而表现的文字,所述特征点为所述笔画,所述特征点的坐标由2维平面上表示所述笔画位置的1个以上的点的坐标的坐标值而构成。
本发明的程序构成的特征在于,使计算机执行上述第1到第3构成的特征点的对应方法。
发明的效果
如上说明,根据本发明,由于在对顺序坐标值进行转换时会吸收由失真产生的变动或吸收作为规范化对象的变动,因此,在对应中作为成本使用依据该顺序坐标值的距离,由此具有即使使特征点对应程序自身简略化,也能够获得正确的对应这样的效果。此外,即使在采用了非简略化程序的情形下,也具有使对应的正确性提高或使其高速化的效果。
附图说明
图1是本发明实施例的特征点对应装置的概念性构成图。
图2是在2维平面上对作为数值例的多个坐标轴集合与特征点的图示。
图3是本发明实施例的书写考试装置的概念性构成图。
图4是书写考试装置的运作例。
具体实施方式
以下参照附图对用于实施本发明的最佳方式进行说明。
其中,在说明中,不使用一般的N维空间,而是使用在2维平面上的例子。并且,在以下说明中,在没有特别预告的情况下,使用变量N作为第1对象特征点的数量。
实施例1
图1是本发明实施例的特征点对应装置100的概念性构成图,待被交换的数据也表示在图中。特征点对应装置100构成为包括:对象输入装置110、成本计算装置120、以及对应确定装置130这3个装置。并且,成本计算装置120构成为包括:距离成本计算装置121和其他成本计算装置125;距离成本计算装置121构成为包括:顺序坐标值计算装置122、距离计算装置123、以及坐标轴定义保持装置124。
其中,在图3的说明中会提及其他成本计算装置125。
在图1中,对象输入装置110输入第1对象和第2对象,该第1对象和第2对象具备作为对应对象的特征点来作为要素。例如,使通过笔画来表现的手写输入文字和作为正确答案而参照的文字相当于第1对象和第2对象。
作为对象要素的特征点的2维平面坐标191作为数据从对象输入装置110向成本计算装置120中的顺序坐标值计算装置122进行传递。该数据被定义成如算式1所示。对第1对象和第2对象分别输入如算式1的数据。
[算式1]
P={p0,p1,…,pn,…,pN-1}pn=(xn,yn)(1)
在以下说明中,为了提高可理解性,将与定义并行示出具体的数值例。作为算式1的数值例,将提供算式2。
[算式2]
p0=(2,8),p1=(3,4),p2=(6,2),p3=(8,6)(2)
从坐标轴定义保持装置124输入多个坐标轴定义195,通过顺序坐标值计算装置122计算特征点的顺序坐标192。一般的多个坐标轴定义195表示为算式3。在算式3中,使K个坐标轴为坐标轴集合F=(fk)。对于坐标轴fk,通过在该坐标轴上付与点(x,y)坐标值的函数来表示该坐标轴。即,以矢量(a,b)给出的坐标轴f,通过f=ax+by来进行表示。
[算式3]
F=(f0,f1,…,fk,…,fk-1)fk=akx+bky(3)
算式4表示算式3的数值例。算式4中,f0为x轴,使其逆时针各旋转π/4后的坐标轴为f1、f2、f3。关于定义怎样的坐标轴,由应用领域而决定。
[算式4]
f0=x,f1=x+y,f2=y,f3=-x+y(4)
其中,还会想到使非线性函数用于坐标轴定义函数这样的扩展,但是如果事先进行坐标转换的话会获得同等的效果,因此,不会成为本质的扩展。
接下来在顺序坐标值计算装置122中,对每个坐标轴fk,计算特征点pn的坐标值,对该坐标值的特征点的集合实施排序(升序)。排序后的特征点序列Ofk(P)表示在算式5中。
[算式5]
算式6表示算式5的数值例。使用图2对该值进行说明。图2是在2维平面上对作为数值例的算式4中的多个坐标轴集合与算式2中的特征点的图示。例如,在图2中f1的矢量方向观察时,特征点按P1、P2、P0、P3的顺序排列。这便是算式6中Of1(P)的意思。
[算式6]
若将特征点的Ofk(P)中从0起计数的pn的位次记为Ofk(pn)的话,则可以如算式7所表示。不过,对于算式7中的“[..]”,当“..”真时取“1”值,当“..”伪时取“0”值。在算式5中虽未明示坐标值相同时顺序的确定方法,但是在算式7中,根据右边的第2项,顺序的确定方法遵从于特征点变量的脚标。在这样平局决胜的方法中,(A)遵从稍微使坐标轴旋转时的顺序;(B)也考虑作为相同位次来处理等其他的方法。除同一直线上排列3点以上这样的配置较多的情形之外,算式7的方法没有问题。
[算式7]
使用算式7的Ofk(pn),将图1中的顺序坐标192确定为如算式8所示。对于第1对象和第2对象,通过顺序坐标值计算装置122分别对如算式8的顺序坐标进行计算。
[算式8]
算式9表示算式8的数值例。例如,OF(p0)的值(0、2、3、3)表示算式6中的p0的位次在Of0(P)中为“0”,在Of1(P)中为“2”,在Of2(P)中为“3”,在Of3(P)中为“3”。
[算式9]
OF(p0)=(0,2,3,3)
OF(p1)=(1,0,1,2)
OF(p2)=(2,1,0,0)(9)
OF(p3)=(3,3,2,1)
在考虑如算式9这样的顺序坐标时,依据方向相反的矢量的坐标轴仅顺序变为相反,由此可知,对于算式4提供的多个坐标轴定义195,仅考虑与以原点为起点的、在第一象限以及第二象限具有终点的彼此不平行的矢量相对应的坐标轴即可。
对于输入有第1对象和第2对象各自的特征点的顺序坐标192的距离计算装置123,利用其计算特征点间的成本193。计算方法可以考虑利用基于顺序坐标值差分的各种计算方法。在本实施例中,采用算式10所示的“顺序坐标值之差的总计”来求算成本d0。除算式10以外,还可以考虑利用“顺序坐标值之差的几何平均”或“顺序坐标值之差的平方和的平方”等计算方法的方法。只要呈顺序坐标之差增加成本便增加的关系即可,即,只要使成本为相对于顺序坐标之差呈单调增加的计算值即可。其中,算式10中,使P对应第1对象,使Q对应第2对象。
[算式10]
d0(pn,qm)=Σf∈F|Of(pn)-Of(qm)|(10)
(pn∈P,qm∈Q)
例如,如考虑具有如算式11那样的数值例的第2对象,则依据第1对象中的特征点p1与第2对象中的点q2之间距离的成本d0(p1,q2)则如算式12所示。并且,对于第1对象中的特征点与第2对象中的点的所有组合,其成本{d0(pn,qm)}如表1所示。
[算式11]
[算式12]
d0(p1,q2)=|1-2|+|0-1|+|1-0|+|2-1|=4(12)
[表1]
在表1所示的数值例中,第1对象的特征点与第2对象的特征点的数量是相同的,在其不同的情况下,通过进行如算式13的规范化,例如对于复杂的形态,能够对将其简略化后的形态进行对应。使算式13的分母不为N而是为N-1,是为了使最低位次为“1”的缘故。即,规范化后的顺序坐标值不是整数值,而是闭区间[0、1]的有理数。在进行了规范化的情况下,顺序距离的定义也遵从算式10。
[算式13]
在算式13中,对位次Ofk(pn),通过线性函数获取规范化顺序坐标值,不过所使用的函数没有必要为线性,为单调函数也可以。例如,算式14的函数为单调函数,也可以使用该函数。在利用算式14时,位次之差在中央附近敏感地被反映在规范化顺序坐标值上,越接近最高位或越接近最低位,被反映的程度越小,顺序坐标值的差异也被同样地反映。此外,算式13算式14均为单调增加函数。使用单调减少函数虽然也没有问题,但不过是次序呈相反而已,没有什么意义。
[算式14]
在图1中,对应确定装置130输入成本以确定对应194,其中,该成本包含如表1数值例那样由算式10得出的特征点间的成本193{d0(pn,qm)}。本发明的特征在于在成本的计算上使用顺序坐标值,对应确定装置130使用的程序不需要为特定程序。在本实施例中,采用从成本最小者依次对应的单纯对应程序。即,采用如下程序,在pn和qm两者尚未对应时的成本{d0(pn,qm)}中选择最小者{d0(pn’,qm’)},反复对该pn’和qm’进行对应,直到所有的特征点被对应。该从成本最小者依次对应的程序未必是获得使成本总计最小的最优对应的程序。但是,依据顺序坐标值的成本会有效地发挥作用,因此,即使利用这样单纯的对应程序也能够获得正确的对应。
当对应确定装置130利用上述从成本最小者依次进行对应的程序、根据表1的数值例的成本而进行对应时,会获得如表1中用圆形记号标记的对应194。
以上说明的实施例,以进行1对1的对应作为前提,采用从成本最小者依次进行对应的程序,但是本发明并非一定仅限于1对1的对应。例如,对通过进行如算式13的规范化而将复杂的形态简略化后的形态进行对应,该情形则成为1对多的对应。
实施例2
接下来对以下实施例进行说明,即,利用上述实施例1的特征点对应装置100,通过进行文字笔画的对应,而在具备触控面板的装置上进行汉字书写考试。
图3是本发明实施例的书写考试装置300的概念性构成图,待被交换的数据也表示在图中。其中,图3为书写考试装置300从外部利用表记在图1中的对应装置100这样的形式,这是为了进行与图1一致的说明而这样表记的,当然也可以为将与对应装置100功能相当的装置安装于书写考试装置300内的形式。
书写考试装置300构成为包括:触控面板310中的位置输入装置320与显示装置330、手写输入控制装置340、书写问题管理装置350、评分装置360。并且,评分装置360构成为包括:中点计算装置361、角度计算装置362、正误判断装置363。
图3中,书写问题管理装置350向显示装置330输出书写的问题391,使用者399对该书写的问题391进行视觉确认392,并对位置输入装置320实施通过描绘进行的输入393。位置输入装置320接收上述输入,并向手写输入控制装置340输出描绘输入的坐标信息394。在通过显示装置330对文字图像395进行显示、描绘输入结束开始评分的时刻,手写输入控制装置340向评分装置360输出手写输入文字的笔画信息396。
接下来评分装置360对手写输入文字的笔画信息396、以及对从书写问题管理装置350输入的正确答案文字的笔画信息397,进行由中点计算装置361和角度计算装置362执行的处理。通过中点计算装置361,求算笔画信息中的各笔画的中点。该中点的xy坐标在被输入到对应装置100时,会成为特征点的坐标值,即,算式1的值。
通过角度计算装置362,求算在笔画信息中各笔画的起点和终点的、相对x轴的角度。该角度在被输入到对应装置100时,被用于图1中其他成本计算装置125中的成本计算。本发明除了作为其特征的、依据基于顺序坐标值差分的距离的成本之外,根据需要还会合计其他成本并输入于对应装置130。在该起点和终点的相对于x轴的角度便为此例。该实施例中,仅凭借通过中点计算装置361获取的笔画中点,例如无法将“十”字的第1笔和第2笔加以区别,因此,作为其他成本则需要这样依据角度的成本。在算式15中,对依据角度的成本ds赋予定义。
[算式15]
包括中点P的笔画在起点相对于x轴的角度(15)
包括中点P的笔画在终点相对于x轴的角度
在进行了由评分装置360中的中点计算装置361和角度计算装置362执行的处理后的笔画信息中,通过图3中的对应装置100,输入正确答案文字的笔画信息作为第1对象,输入手写输入文字的笔画信息作为第2对象。虽然通过图1说明的处理来进行对应,但此时的成本使用对算式10和算式15进行了合计的、算式16的值d。
[算式16]
d(pn,qm)=Codo(pn,qm)+Csds(pn,qm)
(Co,Cs:系数)(16)
作为由对应装置100实施的处理的结果,向评分装置360中的正误判断装置363输出对应194。正误判断装置对对应的笔画或笔画间的关系进行比较,判断正确答案文字与手写输入文字是否一定等级以上地相一致,并向显示装置330输出正确解答/错误解答的判断结果398。
在参照图3说明的实施例中,将由笔画构成的文字作为对象,使用作为特征点的笔画中点在平面上的坐标来计算顺序坐标值,不过除了使用这样平面上的单独点的坐标之外,还有方法。例如,可以使用笔画的起点(xs,ys)和终点(xe,ye)的xy坐标,在(xs,ys,xe,ye)4维空间上计算顺序坐标值。此时,作为坐标轴集合如果取F=(xs,xs+ys,ys,-xs+ys,xe,xe+ye,ye,-xe+ye),则成为相当于分别对起点和终点进行排序的处理。
如在该4维空间上的例子,特征点坐标构成为包括表示笔画位置的2维平面上的坐标值即可。即,如使用笔画中点的坐标值的情形,不必仅使用2维平面上的单独点的坐标值。而在使用2维平面上的单独点的坐标值的情形下也不必为中点。
此外,还具有多种对依据顺序坐标值的成本进行定义的方法。即,也可以通过图1中的其他成本计算装置125来计算依据顺序坐标值的成本。例如,将文字作为对象时,可以是对起点设定一个距离成本计算方式、对终点设定其他的距离成本计算方式的方法。该方法虽与上述使用坐标轴集合F=(xs,xs+ys,ys,-xs+ys,xe,xe+ye,ye,-xe+ye)的例子相似,但是能够对算式16中的系数相当值进行设定这点等,则不相同。
图4表示在图3说明的书写考试装置的运行例。图4中,正确答案文字的表象401和手写输入文字的表象402为实际在具备触控面板的书写考试装置上手写输入的文字。分别对笔顺施加号码,以该号码为标志来进行对应。
图4中,正确答案文字的笔画路径(SVG)411是通过HTML5也采用的SVG(ScalableVectorGraph)中的记述法,来记述对应于401的路径信息的。同样,412是402的路径信息。在这些路径信息中,曲线通过2次贝塞尔曲线来表示。其中,在SVG中,y轴朝向文字下方,与一般的xy坐标平面相反。411和412的路径信息的坐标值以及以下说明中出现的坐标值和顺序坐标值遵从SVG的y轴方向。
图4中,笔画中点的坐标和顺序坐标420为,从411以及412的路径信息中抽取的各笔画(画)的中点坐标、以及将其转化为由算式8等定义的顺序坐标后的值。其中,图4中的顺序坐标记述有未进行规范化的值。此外,对于中点的坐标值,为了处理的高速化而使用近似值。
图4中的笔画间的顺序距离430是对420的值求算出依据算式10的顺序距离的结果的表。表的纵向记录了对应于401的正确答案文字的笔画,横向记录了对应于402的手写输入文字的笔画。将利用上述从成本最小者依次对应的程序而对430的数值进行对应的笔画组合,用表中的圆形记号部分来进行表示。其中,当书写考试装置在实际使用情景中运行时,通过对算式15所示的成本进行合计而进行对应,但是由于算式15与本发明没有直接关系,因此对其省略。
如430的表中圆形记号部分,可以确认到,作为401和402文字特征点的笔画(的中点)被正确地对应。虽然402所示的手写输入文字的表象相当失真,但是通过上述从成本最小者依次对应的单纯的程序,也正确地进行了对应。
以上说明的实施例中,对通过手写文字进行的书写考试装置进行了说明,但是本发明的对应装置还能够以与联机文字识别等相类似的形式来进行利用。当然,除手写文字之外,还能够以图像、音声信号、文章等各种对象作为对象客体来进行应用。
产业上利用可能性
对于图像、音声信号、文章等各种对象,在2个对象间的对应上能够进行应用,可以适用认证、识别、检索等用途。
附图标记的说明
100…特征点对应装置;110…对象输入装置;120…成本计算装置;
121…距离成本计算装置;122…顺序坐标值计算装置;
123…距离计算装置;124…坐标轴定义保持装置;
125…其他成本计算装置;130…对应确定装置;
191…特征点的2维平面坐标值;192…特征点的顺序坐标;
193…特征点间的成本;194…对应;195…多个坐标轴定义;
300…书写考试装置;310…触控面板;320…位置输入装置;
330…显示装置;340…手写输入控制装置;350…书写问题管理装置;
360…评分装置;361…中点计算装置;362…角度计算装置;
363…正误判断装置;391~398…表示数据流程的箭头记号
399…使用者;401…正确答案文字的表象;402…手写输入文字的表象;
411…正确答案文字的笔画路径(SVG);
412…手写输入文字的笔画路径(SVG);
420…笔画中点的坐标和顺序坐标;430…笔画间的顺序距离。
Claims (7)
1.一种特征点的对应方法,构成为,将2个以上的特征点作为要素的对象,其中所述2个以上的特征点均具有包括N(N为2以上的自然数)维空间中N个坐标值的坐标,当对2个所述对象进行比较、使第1所述对象的所述特征点与第2所述对象的所述特征点进行对应时,确定作为对应对象的所述特征点之间的成本,使对应的所述特征点之间的所述成本的合计值变小,以确定对应,所述特征点的对应方法的特征在于,包括:
第1顺序坐标计算步骤,确定所述N维空间上彼此不平行的2个以上的多个坐标轴,对所述多个坐标轴的每个坐标轴,求算作为所述第1对象要素的所述特征点在该坐标轴上的坐标值,求取根据求算出的该坐标值将所述特征点按升序或降序排序罗列的特征点序列,计算表示所述特征点在所述序列中的出现顺序的整数值,来作为所述特征点在该坐标轴的顺序坐标值;
第2顺序坐标计算步骤,对所述第2对象,也对作为其要素的所述特征点的所述顺序坐标值进行计算;
成本计算步骤,将所述第1对象的所述特征点与所述第2对象的所述特征点这2个特征点之间的所述成本确定为,包括对所述2个特征点在所述多个坐标轴的每个坐标轴上的所述顺序坐标值的差分进行单调增加而得的计算值;以及,
利用通过所述成本计算步骤确定的所述成本来确定对应的步骤。
2.根据权利要求1所述的特征点的对应方法,其特征在于,
在所述第1顺序坐标计算步骤和所述第2顺序坐标计算步骤中,取代表示所述特征点在所述序列中的出现顺序的整数值,而是使用将该整数值通过单调函数进行转换而得的值来作为所述顺序坐标值。
3.根据权利要求1或2所述的特征点的对应方法,其特征在于,
所述对象为在2维平面上作为1个以上的笔画而表现的文字,
所述特征点为所述笔画,
所述特征点的坐标由所述2维平面上表示所述笔画位置的1个以上的点的坐标的坐标值而构成。
4.一种特征点的对应装置,构成为,将2个以上的特征点作为要素的对象,其中所述2个以上的特征点均具有包括N(N为2以上的自然数)维空间中N个坐标值的坐标,当对2个所述对象进行比较、使第1所述对象的所述特征点与第2所述对象的所述特征点进行对应时,确定作为对应对象的所述特征点之间的成本,使对应的所述特征点之间的所述成本的合计值变小,以确定对应,所述特征点的对应装置的特征在于,包括:
第1顺序坐标计算装置,确定所述N维空间上彼此不平行的2个以上的多个坐标轴,对所述多个坐标轴的每个坐标轴,求算作为所述第1对象要素的所述特征点在该坐标轴上的坐标值,求取根据求算出的该坐标值将所述特征点按升序或降序排序罗列的特征点序列,计算表示所述特征点在所述序列中的出现顺序的整数值,来作为所述特征点在该坐标轴的顺序坐标值;
第2顺序坐标计算装置,对所述第2对象,也对作为其要素的所述特征点的所述顺序坐标值进行计算;
成本计算装置,将所述第1对象的所述特征点与所述第2对象的所述特征点这2个特征点之间的所述成本确定为,包括对所述2个特征点在所述多个坐标轴的每个坐标轴上的所述顺序坐标值的差分进行单调增加而得的计算值;以及,
利用通过所述成本计算装置确定的所述成本来确定对应的装置。
5.根据权利要求4中所述的特征点的对应装置,其特征在于,
在所述第1顺序坐标计算装置和所述第2顺序坐标计算装置中,取代表示所述特征点在所述序列中的出现顺序的整数值,而是使用将该整数值通过单调函数进行转换而得的值来作为所述顺序坐标值。
6.根据权利要求4或5所述的特征点的对应装置,其特征在于,
所述对象为在2维平面上作为1个以上的笔画而表现的文字,
所述特征点为所述笔画,
所述特征点的坐标由2维平面上表示所述笔画位置的1个以上的点的坐标的坐标值而构成。
7.一种程序,其特征在于,
使计算机执行权利要求1至3中所述的特征点的对应方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013047506A JP6154627B2 (ja) | 2013-03-11 | 2013-03-11 | 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム |
JP2013-047506 | 2013-03-11 | ||
PCT/JP2014/054642 WO2014141881A1 (ja) | 2013-03-11 | 2014-02-26 | 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105190647A true CN105190647A (zh) | 2015-12-23 |
CN105190647B CN105190647B (zh) | 2018-09-14 |
Family
ID=51536556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480026530.1A Active CN105190647B (zh) | 2013-03-11 | 2014-02-26 | 特征点集合间的对应方法以及对应装置 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP6154627B2 (zh) |
CN (1) | CN105190647B (zh) |
HK (1) | HK1214388A1 (zh) |
WO (1) | WO2014141881A1 (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1536427A (zh) * | 2003-03-25 | 2004-10-13 | 精工爱普生株式会社 | 图像处理系统,投影机以及图像处理方法 |
US20080109763A1 (en) * | 2006-11-06 | 2008-05-08 | Samsung Electronics Co., Ltd. | Computer system and method thereof |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3196291B2 (ja) * | 1992-03-10 | 2001-08-06 | 株式会社日立製作所 | 文字認識方法および装置 |
JP2003514305A (ja) * | 1999-11-12 | 2003-04-15 | ゴー・センサーズ・エルエルシー | マシン・ビジョンのための堅牢なランドマークと前記ランドマークを検出するための方法 |
JP2003018557A (ja) * | 2001-07-04 | 2003-01-17 | Monolith Co Ltd | 画像処理方法および装置 |
JP4967666B2 (ja) * | 2007-01-10 | 2012-07-04 | オムロン株式会社 | 画像処理装置および方法、並びに、プログラム |
JP4569698B2 (ja) * | 2008-06-20 | 2010-10-27 | ソニー株式会社 | 物体認識装置、物体認識方法及び物体認識方法のプログラム |
-
2013
- 2013-03-11 JP JP2013047506A patent/JP6154627B2/ja not_active Expired - Fee Related
-
2014
- 2014-02-26 WO PCT/JP2014/054642 patent/WO2014141881A1/ja active Application Filing
- 2014-02-26 CN CN201480026530.1A patent/CN105190647B/zh active Active
-
2016
- 2016-03-02 HK HK16102378.0A patent/HK1214388A1/zh not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1536427A (zh) * | 2003-03-25 | 2004-10-13 | 精工爱普生株式会社 | 图像处理系统,投影机以及图像处理方法 |
US20080109763A1 (en) * | 2006-11-06 | 2008-05-08 | Samsung Electronics Co., Ltd. | Computer system and method thereof |
Also Published As
Publication number | Publication date |
---|---|
JP2014174780A (ja) | 2014-09-22 |
HK1214388A1 (zh) | 2016-07-22 |
JP6154627B2 (ja) | 2017-06-28 |
WO2014141881A1 (ja) | 2014-09-18 |
CN105190647B (zh) | 2018-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Harouni et al. | Online Persian/Arabic script classification without contextual information | |
Lifshits et al. | Lectures on Gaussian processes | |
Patle et al. | SVM kernel functions for classification | |
Bai et al. | Learning graph convolutional networks based on quantum vertex information propagation | |
CN109271441B (zh) | 一种高维数据可视化聚类分析方法及系统 | |
CN103745459A (zh) | 一种非结构化点云特征点检测方法及其提取方法 | |
CN103559476A (zh) | 一种指纹匹配方法和装置 | |
CN104317838A (zh) | 一种基于耦合鉴别性字典的跨媒体哈希索引方法 | |
He et al. | A linear tessellation model to identify spatial pattern in urban street networks | |
CN106919699A (zh) | 一种面向大规模用户的个性化信息推荐方法 | |
Cutura et al. | Hagrid: using Hilbert and Gosper curves to gridify scatterplots | |
Bacani et al. | On the First‐Order Shape Derivative of the Kohn‐Vogelius Cost Functional of the Bernoulli Problem | |
Wang et al. | Open-set specific emitter identification based on prototypical networks and extreme value theory | |
CN109255377A (zh) | 仪器识别方法、装置、电子设备及存储介质 | |
AU2015204339A1 (en) | Information processing apparatus and information processing program | |
CN104850820A (zh) | 一种脸部识别方法及装置 | |
CN106033546A (zh) | 基于自上而下学习的行为分类方法 | |
CN105190647A (zh) | 特征点集合间的对应方法、对应装置以及对应程序 | |
CN114186168A (zh) | 面向智能城市网络资源的相关性分析方法及装置 | |
Gai et al. | Clustering by sparse orthogonal NMF and interpretable neural network | |
CN109658489B (zh) | 一种基于神经网络的立体网格数据处理方法和系统 | |
Xiao et al. | Manifold embedding for shape analysis | |
CN112528016A (zh) | 一种基于低维球面投影的文本分类方法 | |
Guo et al. | A novel method for data glove-based dynamic gesture recognition | |
Chen et al. | An Improved K-means Algorithm Based on the Bayesian Inference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1214388 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |