CN103971109A - 用于提取特征以及用于识别轨迹的方法和设备 - Google Patents
用于提取特征以及用于识别轨迹的方法和设备 Download PDFInfo
- Publication number
- CN103971109A CN103971109A CN201310043353.5A CN201310043353A CN103971109A CN 103971109 A CN103971109 A CN 103971109A CN 201310043353 A CN201310043353 A CN 201310043353A CN 103971109 A CN103971109 A CN 103971109A
- Authority
- CN
- China
- Prior art keywords
- track
- unit
- point
- feature
- input sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了用于提取特征以及用于识别轨迹的方法和设备。用于提取用来识别轨迹的一个或更多个特征的该方法包括:a)获取包括多个输入采样点的轨迹的数据;b)基于定位点来预定义两个或更多个方向区域;c)基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来获取对于所述至少一个预定义的方向区域的分布;以及d)根据所述分布来获得一个或更多个特征。通过利用本发明,能够在没有复杂的邻域评估算法和较重的计算负荷的情况下提高轨迹识别的识别性能。
Description
技术领域
本发明涉及用于提取用来识别轨迹的一个或更多个特征的方法和设备,并且涉及用于识别轨迹的方法和设备。
背景技术
近年来,轨迹识别被广泛地用作手写字符识别和姿态(gesture)识别。为了提高轨迹识别的识别性能并且消除轨迹(尤其是具有类似轨迹形状的那些轨迹)之间的混淆,提出了许多考虑领域信息的轨迹识别方法。
美国专利公开US6453054B1已经提出了一种用于手写字符识别的方法,其包括:产生手写字符(例如数字“2”)的图像;将手写字符的该图像分割成水平交迭(horizontally-overlapping)的帧(像如图1所示的帧1、帧2),并且然后根据估计的虚拟书写线(像图1中示出的上部线(upper line)OL、下部线(lower line)UL和中心线(centre line)ML)将每个帧进一步再分割成多个垂直重叠(verically-superposed)的区域(像如图1所示的BO、BM、BMO、BMU和BU);并且从对于每个帧的这些区域中提取总共16个维度的特征向量。提前估计书写线,并且这些书写线对于手写字符的所有交迭的帧不改变。
除了上述专利文献之外,一些会议论文也已经提出了使用邻域特征的一些手写字符识别方法。例如,S.Jaeger等人的论文“NPEN++:AN ON-LINE HANDWRITING RECOGNITION SYSTEM,International Unipen Foundation,pp.249-260,2000”已经提到了在nPen++手写字符识别系统中的一些公知的邻域特征,诸如如图2所示的方位(aspect)、卷曲度(curliness)和线性(lineness)。在图2中用实心点标记的点是作为邻域的中心的当前手写采样点,并且由用空心点标记的3个先前采样点和3个随后采样点与当前采样点结合来定义邻域。邻域特征(诸如,方位、卷曲度和线性)被如下地定义:
方位
卷曲度 和
线性
美国专利申请公开US2011/0222726A1已经公开了一种用于通过计算每个帧中的手掌区域的重心来识别姿态的方法。在该方法中,对于多个帧中的重心的重心位置坐标的变化被用来辨别模式。这里,邻域被定义为包括所有重心的区域。
上面提到的现有技术文献中公开的方法的缺点被描述如下。在美国专利公开US6453054B1中,特征计算的有效性极大地依赖于虚拟的书写线的评估的可靠性。当评估虚拟的书写线的算法较差时,有效性可能损失。在S.Jaeger等人的论文中,与上述美国专利公开US6453054B1相比,邻域的长度或区域是固定并且简单的。因此,邻域评估算法不复杂。但是该方法的计算负荷非常大,因为在定义邻域之后的特征计算期间必须使用许多乘法和除法运算。在美国专利申请公开US2011/0222726A1中公开的方法中,邻域定义太简单,并且该方法仅仅定义了一个邻域区域。也就是说,该方法没有将多个帧中的所有重心分割成多于一个的邻域区域。另外,在累积了多个帧之后计算重心位置坐标的变化,并且不可能在每个帧中计算该变化,换句话说,不可能以实时方式计算该变化。因此,由于简单的邻域信息,该姿态识别方法的识别性能的提高是有限的。
发明内容
因此,存在对于新的特征提取方法和新的轨迹识别方法的需求,该新的特征提取方法和新的轨迹识别方法能够在没有复杂的邻域评估算法和较重的计算负荷的情况下提高识别性能。
为了解决上述技术问题,本发明提供了一种用于提取用来识别轨迹的一个或更多个特征的方法,其包括:a)获取包括多个输入采样点的轨迹的数据;b)基于定位点来预定义两个或更多个方向区域;c)基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来获取对于所述至少一个预定义的方向区域的分布;以及d)根据所述分布来获得一个或更多个特征。
根据本发明的另一个方面,本发明提供了一种用于提取用来识别轨迹的一个或更多个特征的设备,其包括:单元a),被配置为获取包括多个输入采样点的轨迹的数据;单元b),被配置为基于定位点来预定义两个或更多个方向区域;单元c),被配置为基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来获取对于所述至少一个预定义的方向区域的分布;以及单元d),被配置为根据所述分布来获得一个或更多个特征。
另外,为了解决上述技术问题,本发明提供了一种用于识别轨迹的方法,其包括:a)通过执行上述的用于提取用来识别轨迹的一个或更多个特征的方法来提取用来识别轨迹的一个或更多个特征;以及b)通过至少使用所提取的一个或更多个特征来识别轨迹。
根据本发明的另一个方面,本发明提供了一种用于识别轨迹的设备,其包括:上述的用于提取用来识别轨迹的一个或更多个特征的设备;以及单元b),被配置为通过至少使用所提取的一个或更多个特征来识别轨迹。
本发明简单地从轨迹的数据中获取分布来提取特征,这带来了如下的许多优点。为了获取分布,本发明的一些实施例产生方向直方图(direction histogram)。
第一,本发明的提取算法非常简单,并且因此提取速度非常快。第二,根据本发明的方法能够考虑轨迹数据的邻域信息、相对位置信息(即,空间信息)和持续时间信息(即,时间信息),因此该识别对于减少识别混淆而言非常有效。第三,根据本发明,能够以时变方式提取特征。因此,本发明能够容易地与当前流行的识别方法(例如,隐马尔可夫模型(Hidden Markov model,HMM))相结合,以识别时序特征序列。
鉴于上述内容,通过利用上述的根据本发明的方法和设备,能够在没有复杂的邻域评估算法和较重的计算负荷的情况下提高轨迹识别的识别性能。
根据参照附图的以下描述,本发明的其它特性特征和优点将变得清晰。
附图说明
并入说明书中并且构成说明书的一部分的附图示出了本发明的实施例,并且与描述一起用于说明本发明的原理。
图1示出了现有技术中的用于手写字符识别的方法,在该方法中,将手写字符的图像分割成水平交迭的帧,并且然后将每个帧进一步分割成多个垂直重叠的区域。
图2示出了在现有技术中使用的一些邻域特征,即方位A(t)、卷曲度C(t)和线性L(t)。
图3是示出能够实施本发明的实施例的计算机系统的硬件配置的框图。
图4是示出了根据本发明的示例性实施例的用于提取用来识别轨迹的一个或更多个特征的方法的流程图。
图5A-5D示例性地示出了用于提取手写字符识别中使用的特征的一种特定方法。
图6示例性地示出了被用作定位点的手写字符轨迹的均值点或中心点。
图7A-7H示例性地示出了预定义的方向区域的一些示例。
图8A-8B示例性地示出了在产生方向直方图的序列期间的定位点的位置。
图9A和图9B示例性地示出了分别以实时计数方式和非实时计数方式产生方向直方图的序列。
图10A-10D示例性地示出了以实时计数方式利用时不变的定位点在时间t1、t2、t3和t4处产生方向直方图的序列。
图11A-11D示例性地示出了以实时计数方式利用时变的定位点在时间t1、t2、t3和t4处产生方向直方图的序列。
图12A-12D示例性地示出了以非实时计数方式利用时变的定位点在时间t1、t2、t3和t4处产生方向直方图的序列。
图13A-13D示例性地示出了以非实时计数方式利用时不变的定位点在时间t1、t2、t3和t4处产生方向直方图。
图14是示出了根据本发明的示例性实施例的用于提取用来识别轨迹的一个或更多个特征的设备的框图。
图15是示出了根据本发明的示例性实施例的用于识别轨迹的方法的流程图。
图16是示出根据本发明的示例性实施例的用于识别轨迹的设备的框图。
图17示出了基准1与本发明的两个实施例之间的计算时间的比较。
图18示出了基准2与结合有基准2的特征的本发明的若干实施例之间的识别率的比较。
具体实施方式
下面将参考附图来详细描述本发明的优选的实施例。不是本发明必需的细节和功能被省略,以便不会混淆本发明的理解。
请注意,类似的参考数字和字母指的是图中的类似的项目,因而一旦在一幅图中定义了一个项目,就不需要在之后的图中讨论了。
在本公开中,术语“第一”、“第二”等仅仅被用来在元件或步骤之间进行区分,而并不意图表示时间顺序、优先级或重要性。
首先,将解释本公开的上下文中的一些术语的含义。
在本发明中,待识别的轨迹由多个输入采样点(sample point)表示。在手写字符识别的情况下,采样点可以是在手写期间在输入轨迹的二维平面或三维空间中以一定时间间隔捕获的点。在姿态识别的情况下,姿态可以被记录作为视频,并且采样点可以是从视频的各个帧中检测的代表点。该代表点可以简单地为例如各个帧中的手掌的重心。可替代地,该代表点可以为n维特征空间(n≥2)中的点。在手写字符识别中获取的采样点也可以是n维特征空间(n≥2)中的点。
根据本发明,定义采样点的n维空间(n≥2)(几何空间或特征空间)需要在以定位点(positioning point)作为基准的情况下被分割成两个或更多个区域(section),并且在本申请中所分割得到的区域被称为“方向区域(direction section)”。
在本申请中提到的“方向直方图(direction histogram)”被定义为代表轨迹的采样点在至少一个方向区域中的分布的直方图。该分布可以反映关于至少一个方向区域中的采样点的数量、位置、方向和/或类似性质的统计信息。
(计算机系统的硬件配置)
图3是示出能够实施本发明的实施例的计算机系统1000的硬件配置的框图。
如图3中所示,计算机系统包括计算机1110。计算机1110包括经由系统总线1121连接的处理单元1120、系统存储器1130、固定非易失性存储器接口1140、可移动非易失性存储器接口1150、用户输入接口1160、网络接口1170、视频接口1190和输出外围接口1195。
系统存储器1130包括ROM(只读存储器)1131和RAM(随机存取存储器)1132。BIOS(基本输入输出系统)1133驻留在ROM1131中。操作系统1134、应用程序1135、其它程序模块1136和某些程序数据1137驻留在RAM1132中。
诸如硬盘之类的固定非易失性存储器1141连接到固定非易失性存储器接口1140。固定非易失性存储器1141例如可以存储操作系统1144、应用程序1145、其它程序模块1146和某些程序数据1147。
诸如软盘驱动器1151和CD-ROM驱动器1155之类的可移动非易失性存储器连接到可移动非易失性存储器接口1150。例如,软盘1152可以被插入到软盘驱动器1151中,以及CD(光盘)1156可以被插入到CD-ROM驱动器1155中。
诸如麦克风1161和键盘1162之类的输入设备被连接到用户输入接口1160。
计算机1110可以通过网络接口1170连接到远程计算机1180。例如,网络接口1170可以经由局域网1171连接到远程计算机1180。或者,网络接口1170可以连接到调制解调器(调制器-解调器)1172,以及调制解调器1172经由广域网1173连接到远程计算机1180。
远程计算机1180可以包括诸如硬盘之类的存储器1181,其存储远程应用程序1185。
视频接口1190连接到监视器1191。
输出外围接口1195连接到打印机1196和扬声器1197。
图3所示的计算机系统仅仅是说明性的并且决不意图对本发明、其应用或用途进行任何限制。
图3所示的计算机系统可以被实施于任何实施例,可作为独立计算机,或者也可作为设备中的处理系统,可以移除一个或更多个不必要的组件,也可以向其添加一个或更多个附加的组件。
(用于提取用来识别轨迹的一个或更多个特征的方法和设备)
图4是示出了根据本发明一个实施例的用于提取用来识别轨迹的一个或更多个特征的方法的流程图。
如图4所示,在步骤410中,获取包括多个输入采样点的轨迹的数据。
如上所述,在轨迹代表手写字符的情况下,采样点可以是在手写期间在输入轨迹的二维平面或三维空间中以一定时间间隔捕获的点。在该情况下,所有采样点被定义在二维平面或三维空间中,该二维平面或三维空间然后将被分割成两个或更多个方向区域,如下所述。
在一种实现方式中,在轨迹代表姿态的情况下,步骤410可以包括:获取姿态的视频;以及检测对于所获取的视频的每一帧的代表点,作为轨迹的输入采样点。在该情况下,所有采样点也被定义在二维平面或三维空间中,该二维平面或三维空间然后也将被分割成两个或更多个方向区域,如下所述。然后,能够以与手写字符轨迹相同的方式来表征姿态的轨迹。
在步骤420中,基于定位点来预定义两个或更多个方向区域。
如上所述,通过在以定位点作为基准的情况下以预定义的方式分割定义采样点的n维空间(n≥2),来预定义方向区域。
在一种实现方式中,定位点可以与任一输入采样点重合。在另一种实现方式中,定位点可以是所获取的轨迹的数据的均值点(meanpoint)或者所获取的轨迹的数据的中心点(centre point)。定位点不一定是固定的点,而可以随着时间而变化,从而在方向直方图中反映时间信息,如稍后描述的。
在步骤430中,基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来获取对于至少一个预定义的方向区域的分布(例如,方向直方图)。
在一种实现方式中,步骤430可以包括:在形成轨迹期间实时地产生方向直方图,以便获得方向直方图的时序序列。在该情况下,对于每个方向直方图的定位点可以是时不变的(time-invariant)或者时变的(time-variant)。当在产生所述时序序列中的每个方向直方图中使用的定位点是时变的时,该定位点可以是在产生该方向直方图时的最新的输入采样点。
另外,实际上,当以实时方式产生方向直方图时,即使只有一个预定义的方向区域(也就是说,不分割定义采样点的n维空间),本发明的方法也可以是有用的。该仅仅一个方向区域为整个n维空间。方向直方图的序列能够反映关于该仅仅一个方向区域中的采样点的数量、位置、方向和/或类似性质的信息的时间变化,这也可以被用于识别轨迹。
在另一种实现方式中,可以以非实时方式产生一个或更多个方向直方图。也就是说,在轨迹的输入结束之后产生一个或更多个方向直方图。可以以非实时方式产生方向直方图的序列,并且在产生所述序列中的每个方向直方图中使用的定位点改变。当定位点是时不变的时,以非实时方式只能产生一个方向直方图。
如上所述,方向直方图可以反映关于至少一个方向区域中的采样点的数量、位置、方向和/或类似性质的统计信息。
在一种情况中,步骤430可以包括:对存在于至少一个预定义的方向区域中的每一个中的输入采样点进行计数;以及产生指示存在于至少一个预定义的方向区域中的每一个中的输入采样点的数量的方向直方图。在特定的示例中,对每个预定义的方向区域中的输入采样点进行计数。然后,将第一方向区域中的输入采样点的数量放入方向直方图的第一柱(bin)中,并且将第二方向区域中的输入采样点的数量放入方向直方图的第二柱中。在放入了所有方向区域中的输入采样点的所有数量之后,产生方向直方图。当然,可以通过仅仅使用部分的方向区域(至少一个方向区域)来产生方向直方图。
在另一种情况中,可以通过考虑输入采样点的位置信息(例如,通过将定位点和至少一个预定义的方向区域中的每一个中的各个输入采样点之间的距离或坐标求和)来产生方向直方图。
在另一种情况中,可以通过考虑输入采样点相对于定位点的方向信息来产生方向直方图。例如,可以通过将参考线(例如,识别空间中的水平线、垂直线或者任意直线)与连接定位点和至少一个预定义的方向区域中的每一个中的各个输入采样点的线之间的角度求和来产生方向直方图。
在另一种情况中,可以通过考虑采样点的数量信息、距离信息和方向信息中的两种或全部的组合来产生方向直方图。
另外,在一些情况下,该方法可以在产生方向直方图之前使所获取的轨迹的数据规整(normalize)。在一种实现方式中,该规整步骤可以包括:根据所获取的轨迹的数据得知输入速度;基于得知的输入速度来提取输入速度参数;以及基于所提取的输入速度参数来使轨迹的输入采样点规整。所获取的轨迹的数据可以包括输入采样点的数量、输入持续时间和输入采样点的坐标。该得知步骤可以包括:基于轨迹的输入采样点(诸如,输入采样点的数量、输入持续时间和输入采样点的坐标)来评估当前输入速度;以及通过使用历史输入速度来使当前输入速度平滑化。该平滑化可以通过使用以下公式来实现:
当前速度新=ρ*当前速度旧+(1-ρ)*历史速度
其中0≤ρ≤1。ρ的值可以是从实验获得的实验值。
在另一种实现方式中,该规整步骤还可以通过使用插值(interpolation)、删除或重新采样算法来改变轨迹的输入采样点来执行。
在步骤440中,根据上面获取的分布(例如,方向直方图)获得一个或更多个特征。
例如,方向直方图的所有柱可以被直接输出作为特征向量,即,用于识别轨迹的特征。在另一种情况中,方向直方图的一些柱可以被结合,然后结合得到的柱和其它未被结合的柱可以被用作特征向量。另外,在一些情况中,在根据方向直方图获得一个或更多个特征之后,可以通过使用特征规整方法、特征降维方法或特征选择方法来进一步处理所获得的特征。
接下来,为了便于理解本发明的该特征提取方法,给出了用于提取在手写字符识别中使用的特征的几个具体示例。在这些示例中,在二维平面中书写要被识别的字符,并且轨迹的输入采样点是在手写期间在该二维平面中以一定时间间隔捕获的输入点。另外,为了简单起见,在下面的示例中,通过对存在于每个预定义的方向区域中的输入采样点进行计数来产生方向直方图。本领域技术人员应明白,本发明不限于这些示例。
图5A示例性地示出了要被识别的手写的中文字符“人”的轨迹,其在英文中表示“people”。在图5B中用十字星标记的定位点P被定义为与采样点重合。如图5C中所例示的,通过在定位点P处交叉的垂直线“|”和水平线“-”来分割手写平面,从而预定义四个方向区域,即,s1、s2、s3和s4。通过分别对这四个方向区域中的采样点进行计数,产生图5D中示出的方向直方图。最终,可以获得特征向量[5,0,8,8]作为要被用在手写字符识别中的特征。可以通过该手写字符的采样点的总数来使该特征向量规整,并且在该情况下,特征向量可以为[5/21,0,8/21,8/21]。
在图5B中,定位点P与手写字符轨迹的采样点之一重合。然而,如上所述,定位点P的位置不限于此。定位点P可以位于手写平面中的任意点(诸如手写字符轨迹的采样点、或者如图6中所例示的手写字符轨迹的均值点或中心点)处。
方向区域的预定义是灵活的。图7A-7H示出了对于预定义的方向区域的一些示例。能够以各种方式来分割手写平面,从而定义许多种类的方向区域。在图7A中,一条水平线穿过手写平面中的定位点,因此,定义了两个方向区域,即,一个方向区域位于手写平面的上部,而另一个方向区域位于手写平面的下部。在图7B中,一条垂直线穿过定位点以便分割手写平面,因此一个方向区域位于手写平面的左侧,而另一个方向区域位于手写平面的右侧。在图7C中,一条水平线和一条垂直线两者都穿过定位点,从而定义4个方向区域,即s1、s2、s3和s4。除了穿过定位点的水平线和垂直线之外,图7D还使用相对于水平线的穿过定位点的45度的斜线(“/”)和穿过定位点的135度的斜线(“\”),因此,定义了8个方向区域。在图7E中,平面被一条穿过定位点的水平线和以定位点为中心的圆分割,从而定义了4个方向区域s1-s4。图7F和图7G分别使用具有固定间隔的三条平行的水平线和三条平行的垂直线,从而定义了4个方向区域。在图7H中,平面被三条平行的水平线和三条平行的垂直线分割,由此总共定义了16个方向区域。
如上所述,可以以实时方式或非实时方式产生方向直方图的序列,以便反映关于轨迹的时间信息。近年来,使用隐马尔可夫模型或者动态时间规整(Dynamic Time Warping)来识别时间依赖的特征序列的识别方法非常流行,并且其中产生方向直方图的序列的这种方法能够较好地与这些识别方法相结合。
在以实时方式产生方向直方图的序列的情况下,定位点可以是时变的或者时不变的。这同样适用于以非实时方式产生方向直方图的序列的情况。也就是说,存在用于产生方向直方图的序列的四种方式,即,具有时变的定位点的实时方式、具有时不变的定位点的实时方式、具有时变的定位点的非实时方式以及具有时不变的定位点的非实时方式。下面将给出产生方向直方图的序列的方法的具体示例。
在图8A中,在整个手写时间期间定位点是时不变的并且固定的。在图8B中,定位点是时变的,并且在不同的手写时间处变化。定位点以时间顺序从P1变为P4,并且字符被手写从P1逐渐到P2、P3并且最终到P4。因此,方向区域也以时变方式变化。
图9A和图9B示例性地示出了分别以实时计数方式和非实时计数方式产生方向直方图的序列。在实时计数方法中,定位点P处于当前手写采样点处,并且根据手写字符的手写顺序,仅仅过去的和当前的采样点被用于计数来产生方向直方图。在非实时计数方法中,当定位点处于采样点P处时,除了过去的和当前的手写采样点之外,未来的手写采样点也被用于计数。因此,计数必须被推迟直到手写字符的手写过程结束为止。很显然,实时计数方法的速度快于非实时计数方法。
图10A-10D示例性地示出了以实时计数方式利用时不变的定位点在时间t1、t2、t3和t4处产生方向直方图的序列。图11A-11D示例性地示出了以实时计数方式利用时变的定位点在时间t1、t2、t3和t4处产生方向直方图的序列。图12A-12D示例性地示出了以非实时计数方式利用时变的定位点在时间t1、t2、t3和t4处产生方向直方图的序列。图13A-13D示例性地示出了以非实时计数方式利用时不变的定位点在时间t1、t2、t3和t4处产生方向直方图。在图10A-10D、图11A-11D、图12A-12D和图13A-13D中的每一个中,上部示出当前时间处的轨迹、定位点和方向区域,而下部示出以计数方式产生的对应的方向直方图。这里,我们没有对与定位点重合的采样点进行计数。从图13A-13D中可以看到,在具有时不变的定位点的非实时计数方式的情况下,时间t1、t2、t3和t4处的方向直方图是彼此相同的。也就是说,在该情况下,没有必要产生在不同时间处的方向直方图的序列,而仅仅需要产生一个方向直方图。
图14是示出了根据本发明实施例的用于提取用来识别轨迹的一个或更多个特征的设备1400的框图。
如图14所示,用于提取用来识别轨迹的一个或更多个特征的设备1400包括:获取单元1410、预定义单元1420、产生单元1430和获得单元1440。
更具体地,获取单元1410被配置为获取包括多个输入采样点的轨迹的数据。
预定义单元1420被配置为基于定位点来预定义两个或更多个方向区域。
产生单元1430被配置为基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来产生对于所述至少一个预定义的方向区域的分布。
获得单元1440被配置为根据所述分布来获得一个或更多个特征。
该设备1400中的各个单元可以被配置为执行图4中的流程图所示出的各个步骤。
上述的方法和设备能够以简单的方式在高有效性和低计算负荷的情况下提取一个或更多个特征。所提取的特征能够被用来识别轨迹、训练要在识别轨迹中使用的模型等等。
接下来,我们将详细描述用于识别轨迹的方法和设备。
(用于识别轨迹的方法和设备)
图15是示出了根据本发明一个实施例的用于识别轨迹的方法的流程图。
如图15所示,在步骤1510中,通过执行已经参考上面图4讨论的用于提取特征的上述方法来提取用来识别轨迹的一个或更多个特征。
在步骤1520中,通过至少使用所提取的一个或更多个特征来识别轨迹。
在一些示例中,可以通过使用已知的识别器(诸如隐马尔可夫模型(HMM)识别器、动态时间规整识别器或者k近邻(k-nearestneighbour)识别器)来识别轨迹。结果,可以输出一个或更多个识别候选或者网格(lattice network)。
在一些示例中,在轨迹识别方法中,根据本发明提取的特征可以与其它公知的特征结合地使用。在步骤1520之前通过使用现有的特征提取方法来获得该其它公知的特征。
图16是示出根据本发明实施例的用于识别轨迹的设备1600的框图。
如图16所示,用于识别轨迹的设备1600包括:如图14所示的上述设备1400以及识别单元1610。
更具体地,上述设备1400被用于提取一个或更多个特征,该一个或更多个特征可以被用来识别轨迹。
识别单元1610被配置为通过至少使用所提取的一个或更多个特征来识别轨迹。
该设备1600中的各个单元可以被配置为执行图15中的流程图所示出的各个步骤。
(实验)
在下文中,将详细描述几个实验,其能够证明本发明的优于现有技术的技术效果。
在将79个书写者的手写数据用于训练和将20个书写者的手写数据用于评估的情况下进行实验。所使用的识别器基于HMM。
在前三个实验中,定位点是时变的并且与手写字符轨迹的数据中的每个采样点重合。
在第一个实验中,使用基于HMM的手写字符识别系统来验证本发明的有效性。基准1的系统使用公知的11维的nPen特征包(feature package),并且本发明的系统使用如图7D中所例示的预定义的方向区域。实验结果为,具有更小维度量(即,8维)的本发明的识别性能大于公知的11维的nPen特征,即,92.11%对比91.91%。
在第二个实验中,比较基准1与本发明的两个实施例之间的计算负荷。在图17中由“水平线+垂直线”指出的一个实施例使用如图7C中所例示的预定义的方向区域,而在图17中由“水平线+垂直线+45°斜线+135°斜线”指出的另一个实施例使用如图7D中所例示的预定义的方向区域。计数处理基于图9B中示出的非实时方式。总共56400个手写字符被用来累积总的计算时间。如图17所示,本发明的两个实施例的总的计算时间分别为9和11(单位:秒),其与基准1的总的计算时间(即,547)相比非常少。
在第三个实验中,为了验证与其它传统特征结合的本发明的有效性,使用利用从基本的(x,y)坐标导出的6维坐标特征向量的手写字符识别系统作为基准2。在图18中,由“垂直线”指示的实施例使用如图7B中所例示的预定义的方向区域,而由“水平线”指示的实施例使用如图7A中所例示的预定义的方向区域,由“水平线+垂直线”指示的实施例使用如图7C中所例示的预定义的方向区域,而由“水平线+垂直线+45°斜线+135°斜线”指示的实施例使用如图7D中所例示的预定义的方向区域。
评价图9A和图9B中分别示出的实时和非实时计数方法两者。示出的是,能够通过将基准2的特征与根据本发明中的任意类型的预定义的方向区域提取的特征组合,来提高识别性能(即,识别率)。最大的提高是从基准2的93.09%到本发明的使用非实时计数方法的“水平线+垂直线”系统的94.04%。通过添加根据本发明提取的特征,正确地识别了许多混淆的字符,诸如,“8”与“B”、“n”与“m”、“n”与“h”、“q”与“g”、以及“c”与“(”。
在第四个实验中,比较如图12A-12D中所例示的具有时变的定位点的第一种方法与如图13A-13D中所例示的具有时不变的定位点的第二种方法之间的识别性能。这两种方法都与上述的作为基准2的6维坐标特征向量结合。这两种方法都使用相同的如图7C中所例示的“水平线+垂直线”的预定义的方向区域。这两种方法都以非实时方式对采样点进行计数。区别仅仅在于定位点的位置。在第一种方法中,如图12A-12D中所示,定位点是时变的并且与手写字符轨迹的每个采样点重合。相反,在第二种方法中,定位点被固定于手写字符轨迹的均值点。实验结果为,识别性能是94.04%(第一种方法)对比90.44%(第二种方法)。与第二种方法相比,具有时变的定位点的第一种方法可以考虑更多的信息,因此可以进一步提高识别性能。
因此,实验结果证明了,通过使用根据本发明的方法,提高了识别性能,并且极大地减少了计算负荷。
以上描述的所有单元是用于实施本公开中描述的处理的示例性和/或优选的模块。这些单元可以是硬件单元(诸如现场可编程门阵列(FPGA)、数字信号处理器或专用集成电路等)和/或软件模块(诸如计算机可读程序)。以上并未详尽地描述用于实施各个步骤的单元。然而,只要有执行某个处理的步骤,就可以有用于实施同一处理的对应的功能模块或单元(由硬件和/或软件实施)。通过所描述的步骤以及与这些步骤对应的单元的所有组合限定的技术方案都被包括在本申请的公开内容中,只要它们构成的这些技术方案是完整并且可应用的。
可以通过许多方式来实施本发明的方法和设备。例如,可以通过软件、硬件、固件、或其任何组合来实施本发明的方法和设备。上述的方法步骤的次序仅是说明性的,本发明的方法步骤不限于以上具体描述的次序,除非以其它方式明确说明。此外,在一些实施例中,本发明还可以被实施为记录在记录介质中的程序,其包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于实现根据本发明的方法的程序的记录介质。
虽然已通过示例详细展示了本发明的一些具体实施例,但是本领域技术人员应当理解,上述示例仅意图是说明性的而不限制本发明的范围。本领域技术人员应该理解,上述实施例可以在不脱离本发明的范围和实质的情况下被修改。本发明的范围是通过所附的权利要求限定的。
Claims (23)
1.一种用于提取用来识别轨迹的一个或更多个特征的设备,包括:
单元a),被配置为获取包括多个输入采样点的轨迹的数据;
单元b),被配置为基于定位点来预定义两个或更多个方向区域;
单元c),被配置为基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来获取对于所述至少一个预定义的方向区域的分布;以及
单元d),被配置为根据所述分布来获得一个或更多个特征。
2.根据权利要求1所述的设备,其中,所述定位点为:
所获取的轨迹的数据的均值点,
所获取的轨迹的数据的中心点,或者
任一输入采样点。
3.根据权利要求1所述的设备,其中单元c)包括:
产生单元,被配置为基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来产生对于所述至少一个预定义的方向区域的方向直方图。
4.根据权利要求3所述的设备,其中所述产生单元被进一步配置为在形成轨迹期间实时地产生方向直方图,以便获得方向直方图的时序序列。
5.根据权利要求4所述的设备,其中所述定位点是时不变的。
6.根据权利要求4所述的设备,其中所述定位点是时变的。
7.根据权利要求6所述的设备,其中在产生所述时序序列中的每个方向直方图中使用的定位点是在产生该方向直方图时的最新的输入采样点。
8.根据权利要求3所述的设备,其中所述产生单元被进一步配置为以非实时方式产生方向直方图的序列,其中在产生所述序列中的每个方向直方图中使用的定位点改变。
9.根据权利要求3所述的设备,其中所述产生单元被进一步配置为在定位点是时不变的时以非实时方式产生一个方向直方图。
10.根据权利要求1-2中的任意一项所述的设备,其中单元c)包括:
计数单元,被配置为对存在于至少一个预定义的方向区域中的每一个中的输入采样点进行计数;以及
产生单元,被配置为产生指示存在于至少一个预定义的方向区域中的每一个中的输入采样点的数量的方向直方图。
11.根据权利要求3-9中的任意一项所述的设备,其中单元c)还包括计数单元,所述计数单元被配置为对存在于至少一个预定义的方向区域中的每一个中的输入采样点进行计数;以及
其中所述产生单元被进一步配置为产生指示存在于至少一个预定义的方向区域中的每一个中的输入采样点的数量的方向直方图。
12.根据权利要求1-9中的任意一项所述的设备,还包括:
单元e),被配置为在产生所述分布之前使所获取的轨迹的数据规整。
13.根据权利要求12所述的设备,其中单元e)包括:
单元e1),被配置为根据所获取的轨迹的数据得知输入速度;
单元e2),被配置为基于得知的输入速度来提取输入速度参数;以及
单元e3),被配置为基于所提取的输入速度参数来使轨迹的输入采样点规整。
14.根据权利要求13所述的设备,其中单元e1)包括:
评估单元,被配置为基于轨迹的输入采样点来评估当前输入速度;以及
平滑化单元,被配置为通过使用历史输入速度来使当前输入速度平滑化。
15.根据权利要求12所述的设备,其中单元e)包括:
被配置为使用插值、删除或重新采样算法来改变轨迹的输入采样点的单元。
16.根据权利要求1所述的设备,其中,在轨迹代表姿态的情况下,单元a)包括:
获取单元,被配置为获取姿态的视频;以及
检测单元,被配置为检测对于所获取的视频的每一帧的代表点,作为轨迹的输入采样点。
17.一种用于识别轨迹的设备,包括:
根据权利要求1-16中的任意一个所述的用于提取用来识别轨迹的一个或更多个特征的设备;以及
识别单元,被配置为通过至少使用所提取的一个或更多个特征来识别轨迹。
18.根据权利要求17所述的设备,还包括:
另一特征获得单元,被配置为在识别轨迹之前通过使用现有的特征提取方法来获得用来识别轨迹的另一特征;
其中所述识别单元包括:
被配置为通过与所获得的另一特征结合地使用所提取的一个或更多个特征来识别轨迹的单元。
19.一种用于提取用来识别轨迹的一个或更多个特征的方法,包括:
a)获取包括多个输入采样点的轨迹的数据;
b)基于定位点来预定义两个或更多个方向区域;
c)基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来获取对于所述至少一个预定义的方向区域的分布;以及
d)根据所述分布来获得一个或更多个特征。
20.根据权利要求19所述的方法,其中,所述定位点为:
所获取的轨迹的数据的均值点,
所获取的轨迹的数据的中心点,或者
任一输入采样点。
21.根据权利要求19或20所述的方法,其中步骤c)包括:
基于存在于至少一个预定义的方向区域中的每一个中的输入采样点来产生对于所述至少一个预定义的方向区域的方向直方图。
22.一种用于识别轨迹的方法,包括:
提取步骤,通过执行根据权利要求19-21中的任意一个所述的方法来提取用来识别轨迹的一个或更多个特征;以及
识别步骤,通过至少使用所提取的一个或更多个特征来识别轨迹。
23.根据权利要求22所述的方法,在所述识别步骤之前还包括:
另一特征获得步骤,通过使用现有的特征提取方法来获得用来识别轨迹的另一特征;
其中所述识别步骤包括:
通过与所获得的另一特征结合地使用所提取的一个或更多个特征来识别轨迹。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310043353.5A CN103971109A (zh) | 2013-02-04 | 2013-02-04 | 用于提取特征以及用于识别轨迹的方法和设备 |
JP2014017415A JP2014154151A (ja) | 2013-02-04 | 2014-01-31 | 特徴を抽出し、軌跡を認識する方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310043353.5A CN103971109A (zh) | 2013-02-04 | 2013-02-04 | 用于提取特征以及用于识别轨迹的方法和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103971109A true CN103971109A (zh) | 2014-08-06 |
Family
ID=51240580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310043353.5A Pending CN103971109A (zh) | 2013-02-04 | 2013-02-04 | 用于提取特征以及用于识别轨迹的方法和设备 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2014154151A (zh) |
CN (1) | CN103971109A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015184825A1 (zh) * | 2014-11-13 | 2015-12-10 | 中兴通讯股份有限公司 | 对电子标签做空间定位、3d签名及人机交互的方法、设备 |
CN111403021A (zh) * | 2020-03-11 | 2020-07-10 | 中国电子工程设计院有限公司 | 一种监测方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114978333B (zh) * | 2022-05-25 | 2024-01-23 | 深圳玩智商科技有限公司 | 一种识别设备、系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763515A (zh) * | 2009-09-23 | 2010-06-30 | 中国科学院自动化研究所 | 一种基于计算机视觉的实时手势交互方法 |
WO2012088626A1 (en) * | 2010-12-29 | 2012-07-05 | Technicolor (China) Technology Co., Ltd. | System and method for gesture recognition |
CN102592112A (zh) * | 2011-12-20 | 2012-07-18 | 四川长虹电器股份有限公司 | 基于隐马尔科夫模型判断手势运动方向的方法 |
-
2013
- 2013-02-04 CN CN201310043353.5A patent/CN103971109A/zh active Pending
-
2014
- 2014-01-31 JP JP2014017415A patent/JP2014154151A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763515A (zh) * | 2009-09-23 | 2010-06-30 | 中国科学院自动化研究所 | 一种基于计算机视觉的实时手势交互方法 |
WO2012088626A1 (en) * | 2010-12-29 | 2012-07-05 | Technicolor (China) Technology Co., Ltd. | System and method for gesture recognition |
CN102592112A (zh) * | 2011-12-20 | 2012-07-18 | 四川长虹电器股份有限公司 | 基于隐马尔科夫模型判断手势运动方向的方法 |
Non-Patent Citations (1)
Title |
---|
许杏: "基于隐马尔可夫模型的手势识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015184825A1 (zh) * | 2014-11-13 | 2015-12-10 | 中兴通讯股份有限公司 | 对电子标签做空间定位、3d签名及人机交互的方法、设备 |
CN105631375A (zh) * | 2014-11-13 | 2016-06-01 | 中兴通讯股份有限公司 | 对电子标签做空间定位、3d签名及人机交互的方法、设备 |
US10095896B2 (en) | 2014-11-13 | 2018-10-09 | Zte Corporation | Method and device for performing spatial positioning on electronic tag, 3D signing and human-computer interaction |
CN105631375B (zh) * | 2014-11-13 | 2021-05-14 | 中兴通讯股份有限公司 | 对电子标签做空间定位、3d签名及人机交互的方法、设备 |
CN111403021A (zh) * | 2020-03-11 | 2020-07-10 | 中国电子工程设计院有限公司 | 一种监测方法及装置 |
CN111403021B (zh) * | 2020-03-11 | 2023-12-05 | 中国电子工程设计院有限公司 | 一种监测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2014154151A (ja) | 2014-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102043958B (zh) | 一种高分辨率遥感图像多类目标检测识别方法 | |
EP3535689A1 (en) | Method and system for transforming handwritten text to digital ink | |
CN106156766A (zh) | 文本行分类器的生成方法及装置 | |
Saabni et al. | Language-independent text lines extraction using seam carving | |
CN101840514B (zh) | 图像对象分类装置及方法 | |
EP3264361A1 (en) | Method and device for calculating ridge distance | |
CN102609735A (zh) | 一种字符书写规范度评测的方法和装置 | |
CN104008405A (zh) | 手写字符识别方法和装置 | |
CN104809452A (zh) | 一种指纹识别方法 | |
CN102156884A (zh) | 一种直线段检测和提取方法 | |
CN113628291B (zh) | 基于边界提取与合并的多形状目标栅格数据矢量化方法 | |
CN104318263A (zh) | 一种实时高精度人流计数方法 | |
CN101996401A (zh) | 基于强度图像和深度图像的目标分析方法及设备 | |
CN102750531B (zh) | 用于票据文档定位格的手写体标记符号检测方法 | |
CN108460418B (zh) | 一种基于文字识别与语义分析的发票分类方法 | |
CN101315668A (zh) | 试卷卷面表格自动检测方法 | |
CN104951788A (zh) | 一种书法作品中单字笔画的提取方法 | |
CN103971109A (zh) | 用于提取特征以及用于识别轨迹的方法和设备 | |
CN113723328A (zh) | 一种图表文档面板分析理解方法 | |
CN101452531B (zh) | 一种自由手写拉丁字母识别方法 | |
CN101488182B (zh) | 一种用于手写汉字识别的图像特征提取方法 | |
CN102867174A (zh) | 一种人脸特征定位方法及装置 | |
Zheng et al. | QDetect: Time series querying based road anomaly detection | |
CN116681653A (zh) | 一种三维点云提取方法及提取系统 | |
CN103976749A (zh) | 一种实时疲劳提示的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20180727 |
|
AD01 | Patent right deemed abandoned |