CN110070053B - 一种字体特征提取方法和装置 - Google Patents

一种字体特征提取方法和装置 Download PDF

Info

Publication number
CN110070053B
CN110070053B CN201910336947.2A CN201910336947A CN110070053B CN 110070053 B CN110070053 B CN 110070053B CN 201910336947 A CN201910336947 A CN 201910336947A CN 110070053 B CN110070053 B CN 110070053B
Authority
CN
China
Prior art keywords
stroke
information
evaluated
evaluation
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910336947.2A
Other languages
English (en)
Other versions
CN110070053A (zh
Inventor
赵乃庸
谭韩成
董继文
孙丽萍
戎龙超
陈茂富
韩素娟
刘旭光
冯锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shengshi Xuanhe Information Technology Co ltd
Original Assignee
Beijing Shengshi Xuanhe Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shengshi Xuanhe Information Technology Co ltd filed Critical Beijing Shengshi Xuanhe Information Technology Co ltd
Priority to CN201910336947.2A priority Critical patent/CN110070053B/zh
Publication of CN110070053A publication Critical patent/CN110070053A/zh
Application granted granted Critical
Publication of CN110070053B publication Critical patent/CN110070053B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/37Writer recognition; Reading and verifying signatures based only on signature signals such as velocity or pressure, e.g. dynamic signature recognition
    • G06V40/382Preprocessing; Feature extraction
    • G06V40/388Sampling; Contour coding; Stroke extraction

Abstract

本发明提供了一种字体特征提取方法和装置,涉及数据处理的技术领域,包括:获取待测评文字,并提取待测评文字的特征信息,得到第一组特征信息;获取用于对待测评文字进行测评的标准文字,并提取标准文字的特征信息,得到第二组特征信息;基于第一组特征信息和第二组特征信息对待测评文字进行分析,得到测评结果,其中,测评结果包括:待测评文字的书写评分,待测评文字的书写评价信息,待测评文字的书写指导信息,本申请缓解了现有技术中对书法文字进行测评时测评效率较低的技术问题。

Description

一种字体特征提取方法和装置
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种字体特征提取方法和装置。
背景技术
中国文字史历史悠久,经过上千年的演变,中国文字的书写方式也是多种多样,人们书写文字的方式也是多种多样。为了书写出更加完美的文字,很多人开始练习书法,从而提高自身的书写水平。
但是,在现有的书法练习模式中,可以通过字帖的方式来进行练习,还可以通过线下教学的方式来进行练习。针对字帖的学习方式,用户得不到真正的锻炼,无法知晓自身的书写水平。针对线下教学的学习方式,用户通过教师的言传身教来进行学习,但是该学习方式具有一定的地域局限性,且该方法增加了老师的工作量,并且需要耗费大量的师资成本。
综上,现有技术在进行书法评测时,智能性差,人力成本高。
发明内容
有鉴于此,本发明的目的在于提供一种字体特征提取方法和装置,以缓解了现有技术中对书法文字进行测评时测评效率较低的技术问题。
第一方面,本发明实施例提供了一种字体特征提取方法,包括:获取待测评文字,并提取所述待测评文字的特征信息,得到第一组特征信息;获取用于对所述待测评文字进行测评的标准文字,并提取所述标准文字的特征信息,得到第二组特征信息;其中,所述第一组特征信息和所述第二组特征信息中均包含以下类型的特征信息:笔画轮廓特征信息、笔画行笔轨迹特征信息、笔画组成块特征信息、笔画书写方向特征信息、笔画起收笔特征信息和笔画分段特征信息;对所述第一组特征信息和所述第二组特征信息进行分析,得到测评结果,其中,所述测评结果包括:所述待测评文字的书写评分,所述待测评文字的书写评价信息,所述待测评文字的书写指导信息。
第二方面,本发明实施例还提供了一种字体特征提取装置,包括:第一获取单元,用于获取待测评文字,并提取所述待测评文字的特征信息,得到第一组特征信息;第二获取单元,用于获取用于对所述待测评文字进行测评的标准文字,并提取所述标准文字的特征信息,得到第二组特征信息;其中,所述第一组特征信息和所述第二组特征信息中均包含以下类型的特征信息:笔画轮廓特征信息、笔画行笔轨迹特征信息、笔画组成块特征信息、笔画书写方向特征信息、笔画起收笔特征信息和笔画分段特征信息;分析单元,用于基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果,其中,所述测评结果包括:所述待测评文字的书写评分,所述待测评文字的书写评价信息,所述待测评文字的书写指导信息。
在本发明实施例中,首先获取待测评文字,并提取待测评文字的特征信息,得到第一组特征信息;之后,获取用于对待测评文字进行测评的标准文字,并提取该标准文字的特征信息,得到第二组特征信息;最后,基于第一组特征信息和第二组特征信息对待测评文字进行分析,得到测评结果。通过上述描述可知,在本实施例中,通过将待测评文字的特征信息和标准文字的特征信息进行比对,从而得到待测评文字的测评结果的方式,缓解了现有技术中对书法文字进行测评时测评效率较低的技术问题,从而实现了提高书法文字的测评效率的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种字体特征提取方法的流程图;
图2(a)是根据本发明实施例的一种采用距离测评规则对带测评文字进行测评的评测结果的显示示意图;
图2(b)是根据本发明实施例的又一种采用距离测评规则对带测评文字进行测评的评测结果的显示示意图;
图2(c)是根据本发明实施例的又一种采用距离测评规则对带测评文字进行测评的评测结果的显示示意图;
图3(a)是根据本发明实施例的一种采用角度测评规则对带测评文字进行测评的评测结果的显示示意图;
图3(b)是根据本发明实施例的又一种采用角度测评规则对带测评文字进行测评的评测结果的显示示意图;
图3(c)是根据本发明实施例的又一种采用角度测评规则对带测评文字进行测评的评测结果的显示示意图;
图4是根据本发明实施例的一种采用位置测评规则对带测评文字进行测评的评测结果的显示示意图;
图5是根据本发明实施例的一种采用位置关系和距离测评规则对带测评文字进行测评的评测结果的显示示意图;
图6是根据本发明实施例的一种采用两点到线的两点到线的距离测评规则对带测评文字进行测评的评测结果的显示示意图;
图7是根据本发明实施例的一种采用两线段的长度比测评规则对带测评文字进行测评的评测结果的显示示意图;
图8(a)是根据本发明实施例的一种采用两线段夹角测评规则对带测评文字进行测评的评测结果的显示示意图;
图8(b)是根据本发明实施例的又一种采用两线段夹角测评规则对带测评文字进行测评的评测结果的显示示意图;
图8(c)是根据本发明实施例的又一种采用两线段夹角测评规则对带测评文字进行测评的评测结果的显示示意图;
图9(a)是根据本发明实施例的一种采用多个笔画之间平行情况的测评规则对带测评文字进行测评的评测结果的显示示意图;
图9(b)是根据本发明实施例的又一种采用多个笔画之间平行情况的测评规则对带测评文字进行测评的评测结果的显示示意图;
图10(a)是根据本发明实施例的一种采用多个笔画之间水平间距或竖直间距情况的测评规则对带测评文字进行测评的评测结果的显示示意图;
图10(b)是根据本发明实施例的又一种采用多个笔画之间水平间距或竖直间距情况的测评规则对带测评文字进行测评的评测结果的示意图;
图11(a)是根据本发明实施例的一种采用多个组成块之间长宽大小比例测评规则对带测评文字进行测评的评测结果的显示示意图;
图11(b)是根据本发明实施例的又一种采用多个组成块之间长宽大小比例测评规则对带测评文字进行测评的评测结果的显示示意图;
图12(a)是根据本发明实施例的一种采用多个组成块之间距离关系测评规则对带测评文字进行测评的评测结果的显示示意图;
图12(b)是根据本发明实施例的又一种采用多个组成块之间距离关系测评规则对带测评文字进行测评的评测结果的显示示意图;
图13是根据本发明实施例的一种字体特征提取装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种字体特征提取方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种字体特征提取方法的流程图。需要说明的是,在本实施例中,可以通过字体特征提取装置来实现,该字体特征提取装置可以为计算机,移动终端等具有一定运算能力的终端设备,本实施例对此不作具体限定。如图1所示,该方法包括如下步骤:
步骤S102,获取待测评文字,并提取所述待测评文字的特征信息,得到第一组特征信息。
在本实施例中,可以通过数据采集装置采集待测评文字,然后,通过通信装置将采集到的待测评文字传输至字体特征提取装置。字体特征提取装置在获取到该待测评文字的相关信息之后,就可以提取待测评文字的特征信息,得到第一组特征信息。
具体地,在该第一组特征信息中,包括以下信息:待测评文字的笔画轮廓特征信息、待测评文字的笔画行笔轨迹特征信息、待测评文字的笔画组成块特征信息、待测评文字的笔画书写方向特征信息、待测评文字的笔画起收笔特征信息和待测评文字的笔画分段特征信息。
步骤S104,获取用于对所述待测评文字进行测评的标准文字,并提取所述标准文字的特征信息,得到第二组特征信息。
在本实施例中,还可以通过字体特征提取装置获取待测评文字的标准文字,并提取该标准文字的特征信息,得到第二组特征信息。
具体地,在该第二组特征信息中,包括以下信息:标准文字的笔画轮廓特征信息、标准文字的笔画行笔轨迹特征信息、标准文字的笔画组成块特征信息、标准文字的笔画书写方向特征信息、标准文字的笔画起收笔特征信息和标准文字的笔画分段特征信息。
需要说明的是,在本实施例中,标准文字为预先设置的目标字体的标准文字。例如,用户练习书写的文字为楷体,那么该标准文字也为楷体,也就是说,待测评文字和标准文字为相同的字体。
在本实施例中,用户在练习之前设置对应的字体,除此之外,字体特征提取装置还可以通过分析该待测评文字来选择其对应的字体。
步骤S106,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果,其中,所述测评结果包括:所述待测评文字的书写评分,所述待测评文字的书写评价信息,所述待测评文字的书写指导信息。
在本发明实施例中,首先获取待测评文字,并提取待测评文字的特征信息,得到第一组特征信息;之后,获取用于对待测评文字进行测评的标准文字,并提取该标准文字的特征信息,得到第二组特征信息;最后,基于第一组特征信息和第二组特征信息对待测评文字进行测评,得到测评结果,进而根据该测评结果为用户确定指导建议。通过上述描述可知,在本实施例中,通过将待测评文字的特征信息和标准文字的特征信息进行比对,从而得到待测评文字的测评结果的方式,缓解了现有技术中对书法文字进行测评时测评效率较低的技术问题,从而实现了提高书法文字的测评效率的技术效果。
通过上述描述可知,在本实施例中,首先,获取待测评文字,然后,提取待测评文字的特征信息,得到第一组特征信息。
在一个可选的实施方式中,步骤S102,提取所述待测评文字的特征信息包括如下步骤:
步骤S11,提取所述待测评文字的笔画轮廓点列表,其中,所述笔画轮廓点列表中包括所述待测评文字的各个笔画的轮廓点坐标信息。
具体地,在用户书写待测评文字时,待测评文字的每个笔画书写形成的外形轮廓即为待测评文字的笔画轮廓。在本实施例中,字体特征提取装置可以在获取到待测评文字之后,确定待测评文字中每个笔画的笔画轮廓图,然后,对该笔画轮廓图进行二值化处理,得到该笔画的轮廓点坐标信息,从而将该轮廓点坐标信息确定为待测评文字的笔画轮廓点列表。也就是说,在该笔画轮廓点列表中包括所述待测评文字的各个笔画的轮廓点坐标信息(具体包括轮廓点的x,y坐标值)。
步骤S12,基于所述笔画轮廓点列表提取所述待测评文字的笔画轮廓特征信息;其中,所述待测评文字的笔画轮廓特征信息包括以下至少之一:笔画轮廓的正外接矩形、笔画轮廓的最小外接矩形、笔画轮廓中位于最左位置的坐标点、笔画轮廓中位于最右位置的坐标点、笔画轮廓中位于最上位置的坐标点、笔画轮廓中位于最下位置的坐标点、笔画轮廓的中心点、笔画轮廓的质心点、笔画轮廓的水平中线、笔画轮廓的竖直中线、笔画轮廓的周长、笔画轮廓的面积、笔画轮廓的中心线。
具体地,笔画轮廓的正外接矩形大小表示:根据笔画轮廓点列表计算的正外接矩形,包括中心点及矩形长宽大小。笔画轮廓的最小外接矩形大小表示:根据笔画轮廓点列表计算的最小外接矩形,包括中心点、长宽大小、矩形的倾斜角度。笔画轮廓的最左点表示:笔画轮廓点列表中x坐标值最小的点。笔画轮廓的最右点表示:笔画轮廓点列表中x坐标值最大的点。笔画轮廓的最上点表示:笔画轮廓点列表中y坐标值最小的点。笔画轮廓的最下点表示:笔画轮廓点列表中y坐标值最大的点。笔画轮廓的中心点表示:笔画轮廓的最小外接矩形的中心点。笔画轮廓的质心点表示:根据计算轮廓的矩,进一步求出的轮廓质心。笔画轮廓的水平中线表示:以中心点为基准,向左及右延长水平延长。笔画轮廓的竖直中线表示:以中心点为基准,向左及右延长水平延长。笔画轮廓的中心线表示:基于最小外接矩形的中点,平行矩形长方向做直线。笔画轮廓周长表示:笔画轮廓点列表线段长度和。笔画轮廓面积:笔画轮廓点列表所组成封闭矩形的面积。
在另一个可选的实施方式中,步骤S102,提取所述待测评文字的特征信息还包括如下步骤:
步骤S21,提取所述待测评文字的行笔轨迹点数据列表,其中,所述行笔轨迹点数据列表中包括每个待测评文字的每个笔画的行笔轨迹数据。
具体地,在用户书写待测评文字时,待测评文字的每个笔画在书写过程中的轨迹数据即为行笔轨迹数据。若一个待测评文字包括多个笔画,则多个笔画的行笔轨迹数据组成行笔轨迹点数据列表。
步骤S22,基于所述行笔轨迹点数据列表提取所述待测评文字的笔画行笔轨迹特征信息,和/或,所述待测评文字的笔画书写方向特征信息;其中,所述待测评文字的笔画行笔轨迹特征信息包括以下至少之一:笔画的行笔轨迹长度、笔画的行笔轨迹起点、笔画的行笔轨迹终点、笔画的行笔轨迹在水平方向的中点、笔画的行笔轨迹在竖直方向的中点、笔画的行笔轨迹最左点、笔画的行笔轨迹最右点、笔画的行笔轨迹最上点、笔画的行笔轨迹最下点、任意两个笔画行笔轨迹的交叉点、任意两个笔画行笔轨迹延长后交叉点。
具体地,在本实施例中,笔画行笔轨迹长度:对笔画行笔轨迹点列表数据进行简化后的线段长度。
笔画行笔轨迹起点表示:笔画行笔轨迹点数据列表的第一个点。笔画行笔轨迹终点表示:笔画行笔轨迹点数据列表的最后一个点。笔画行笔轨迹水平方向中点表示:遍历求出笔画行笔轨迹点数据列表中x坐标值中点。笔画行笔轨迹竖直方向中点表示:遍历求出笔画行笔轨迹点数据列表中y坐标值中点。笔画行笔轨迹最左点表示:遍历求出笔画行笔轨迹点数据列表中x坐标值最小点。笔画行笔轨迹最右点表示:遍历求出笔画行笔轨迹点数据列表中x坐标值最大点。笔画行笔轨迹最上点表示:遍历求出笔画行笔轨迹点数据列表中y坐标值最小点。笔画行笔轨迹最下点表示:遍历求出笔画行笔轨迹点数据列表中y坐标值最大点。两笔画行笔轨迹的交叉点表示:两笔画行笔轨迹点数据列表所形成线段的交叉点。两笔画行笔轨迹的延长后交叉点表示:两笔画行笔轨迹点列表延长后的交叉点。
需要说明的是,上述笔画组成块特征信息包括以下信息:
多个笔画组成块的长、宽:表示多个笔画所组成块的正外接矩形,获取其位置及长宽大小。多个笔画组成块的面积:表示多个笔画所组成块的正外接矩形面积大小。多个笔画组成块的最左点:表示多个笔画轮廓点列表中x坐标值最小点。多个笔画组成块的最右点:表示多个笔画轮廓点列表中x坐标值最大点。多个笔画组成块的最上点:表示多个笔画轮廓点列表中y坐标值最小点。多个笔画组成块的最下点:表示多个笔画轮廓点列表中y坐标值最大点。多各笔画组成块的中心点:表示多个笔画所组成块的正外接矩形中心点。
需要说明的是,在本实施例中,可以根据笔画的行笔轨迹点数据确定笔画书写方向特征信息。例如,可以将待测评文字的书写方向划分为8个方向,根据笔画行笔轨迹点数据的开始点及结束点计算这两点连线与水平方向的角度。若角度小于15度方向,则值为0代表向右方向;若角度小于75度方向,则值为1代表右下方向;若角度小于105度方向,则值为2代表向下方向;若角度小于165度方向,则值为3代表左下方向;若角度小于195度方向,则值为4代表向左方向;若角度小于255度方向,则值为5代表左上方向;若角度小于285度方向,则值为6代表向上方向;若角度小于345度方向,则值为7代表左上方向。例如,1,3表示笔画书写方向为先从左向右书写然后向左下方书写。
在另一个可选的实施方式中,步骤S102,提取所述待测评文字的特征信息还包括如下步骤:
步骤S31,提取所述待测评文字的行笔轨迹点数据列表,其中,所述行笔轨迹点数据列表中包括每个待测评文字的每个笔画的行笔轨迹数据。
步骤S32,利用道格拉斯普克算法对所述行笔轨迹点数据列表进行简化,并利用简化处理之后的行笔轨迹点数据对轨迹点曲线进行平滑化处理,得到辅助点。
需要说明的是,在本申请中,辅助点为中间过程中产生的数据,行笔轨迹点数据量大,有很多冗余,通过道格拉斯普克算法后能减少冗余,只保留骨架点信息,依次对骨架点连线并计算对应连线角度,该角度通过与预设的角度阈值(目前为160度)进行对比,如果大于阈值角度,则可判定行笔方向有大的变化,即对应笔画行笔过程中产生角度突变。
步骤S33,对所述辅助点进行处理,得到处理结果,其中,所述处理结果用于确定所述待测评文字的笔画是否产生角度突变。
其中,确定待测评文字的笔画是否产生角度突变的依据是确定角度是否超过160度。
步骤S34,根据所述处理结果标记出角点,并根据标记出的角点生成特征点列表。在本申请中,角点即为行笔轨迹数据中角度发生突变的行笔轨迹点,各个角点间形成的连线,即代表所书写笔画的笔画组成段。
步骤S35,根据所述特征点生成多条笔画段,并对所述多条笔画段中相邻且方向一致的笔画段进行合并,在合并后的笔画段中查找主笔画段。
具体地,在本实施例中,可以根据特征点生成多条笔画段,对相邻且方向一致的笔画段进行合并,并查找出大于阈值1.2倍笔宽大小的笔画段,并标记为主笔画段。
步骤S36,遍历所有的笔画段数据,根据笔画的转角信息对笔画的起笔及收笔处的主笔画段进行分析,得到所述笔画起收笔特征信息。
具体地,在本实施例中,可以遍历所有的笔画段数据,根据转角大于阈值60度,小于阈值150度来对笔画的起笔及收笔处的主笔画段进行分析,标注起笔、收笔的藏锋、露锋、顺锋情况,即得到笔画起收笔特征信息。
需要说明的是,在本实施例中,笔画分段特征信息包括一系列笔画段,每个笔画段包括对应的长度、角度、方向、是否为主笔、首位特征点坐标等数据信息,其计算方式与笔画的起收笔特征信息的计算方式类似,此处不再详细赘述。
在本实施例中,在提取到待测评文字的特征信息,得到第一组特征信息之后,就可以提取标准文字的特征信息,得到第二组特征信息。
需要说明的是,在本实施例中,标准文字的特征信息可以预先提取好,并存储在数据库中。在获取到待测评文字之后,可以直接从数据库中获取标准文字,并在数据库中提取标准文字的特征信息。除此之外,在获取到待测评文字之后,可以直接从数据库中获取标准文字,并按照上述所描述的提取第一组特征信息的方法提取标准文字的特征信息,得到第二组特征信息,此处不再详细赘述。
在本实施例中,在得到第一组特征信息和第二组特征信息之后,就可以基于第一组特征信息和第二组特征信息对待测评文字进行测评,得到测评结果,并根据测评结果确定待测评文字的测评结果。
在一个可选的实施方式中,步骤S106,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括如下步骤:
步骤S41,遍历所述待测评文字的实际书写笔画列表,并为所述实际书写笔画列表中的每个笔画查找对应的标准笔画;
步骤S42,比较所述实际书写笔画列表中待评测笔画与其对应的标准笔画之间的目标信息,得到比较结果,其中,所述目标信息包括以下至少之一:方向信息、长度信息、角度信息;
步骤S43,基于所述比较结果确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
在本实施例中,在对第一组特征信息和第二组特征信息进行分析时,可以进行笔画书写方向特征对比分析和笔画书写角度特征对比分析,具体可以分别描述如下:
针对方向信息:遍历待评测的实际书写笔画列表,查找其对应的标准笔画,依次对比各画段的方向信息。如果实际书写笔画列表中每个笔画与其对应的标准笔画之间的方向信息一致或接近一致,则判定其方向符合要求,否则记录笔画ID到错误方向笔画ID列表。
针对角度信息:遍历待评测的实际书写笔画列表,查找其对应的标准笔画,依次对比各画段的角度信息。如果实际书写笔画列表中每个笔画与其对应的标准笔画之间角度信息在阈值范围内,则判定其角度大小符合要求,否则记录笔画ID到错误角度笔画ID列表。
在本实施例中,在为所述实际书写笔画列表中的每个笔画查找对应的标准笔画之后,所述方法还包括如下步骤:
若所述实际书写笔画列表中笔画为简单笔画,则利用所述实际书写笔画列表中笔画的目标外接矩形和标准笔画的目标外接矩形,确定实际书写笔画列表中的笔画是否满足预设书写要求,其中,所述目标外接矩形包括:正外接矩形和/或最小外接矩形。
具体地,在本实施例中,可以遍历待评测的实际书写笔画列表中的简单笔画查找其对应的标准笔画。针对简单的笔画(例如,横竖撇捺),则直接根据笔画的最小外接矩形的长度进行对比。
针对复杂的笔画(例如,笔画包含多个转折情况),则可以根据笔画行笔轨迹特征信息中行笔轨迹长度进行对比;其对比判定原理描述如下:
可以根据笔画行笔轨迹特征信息计算实际笔画长度与标准笔画长度比。如果长度比在下偏差阈值A及上偏差阈值A范围内则长度符合预设书写要求。如果长度比满足以下条件,则不符合预设书写要求:长度比在下偏差阈值B及下偏差阈值A之间、长度比在下偏差阈值B以下、长度比在上偏差阈值B以上、长度比在上偏差阈值A及上偏差阈值B之间。
在本实施例中,在为所述实际书写笔画列表中的每个笔画查找对应的标准笔画之后,所述方法还包括如下步骤:
对比所述实际书写笔画列表中笔画的起收笔特征信息和标准笔画的起收笔特征信息;根据对比结果确定所述实际书写笔画列表中的笔画是否满足预设书写要求;若确定出不满足所述预设书写要求,则记录所述实际书写笔画列表中不满足预设书写要求的笔画的ID信息。
在本实施例中,可以遍历待评测的实际书写笔画列表中各笔画的起收笔特征信息,以及其标准笔画的起收笔特征信息。然后,将待评测的实际书写笔画列表中各笔画的起收笔特征信息和标准笔画的起收笔特征信息进行对比。如果起收笔特征信息分别对应一致,则符合预设书写要求,否则记录笔画ID到错误起收笔笔画ID列表。
在本实施例中,还可以分析待测评文字中单笔画书写填墨符合程度,具体分析过程描述如下:
遍历待评测的实际书写笔画列表,查找其对应的标准笔画,针对实际笔画轮廓点的正接多边形与标准笔画轮廓点的正接多边行进行交运算、异或运算,求出准确书写面积、未填充面积、超出面积。然后,通过公式(准确书写面积-未填充面积-超出面积)/标准笔画轮廓面积,来获取单笔画填墨符合百分比(也即,单笔画书写填墨符合程度):如果百分比大于85%则为优秀;如果百分比大于75%则为良好;如果百分比大于65%为一般;如果百分比大于45%为差;如果百分比小于45%为很差。
在本实施例中,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括如下步骤:
获取第一ID信息,其中,所述第一ID信息表示当前对所述待测评文字进行测评的测评规则为第一测评规则,所述第一测评规则包括:相似度测评规则;基于所述第一ID信息所表征的第一测评规则在所述第一组特征信息和所述第二组特征信息中提取第一特征信息,其中,所述第一特征信息为所述待测评文字的实际书写笔画图像信息,以及对应的标准笔画图像信息;利用图像相似度计算算法对所述实际书写笔画图像信息和所述标准笔画图像信息计算所述待测评文字的实际笔画轮廓与其对应的标准笔画轮廓之间的相似度信息;结合所述相似度信息和所述第一测评规则确定所述实际书写图像是否满足预设书写要求。
具体地,在本实施例中,可以根据第一ID信息在其对应的多维评测规则数据中查找第一测评规则;然后,根据第一测评规则在第一组特征信息和第二组特征信息中获取实际书写笔画图像信息及其对应的标准笔画图像信息;接下来,对实际笔画轮廓图像信息及标准笔画轮廓图像信息,采用图像相似度计算算法进行相似度分析并计算实际笔画轮廓与其对应的标准笔画轮廓的相似度百分比值(即,相似度信息),最后,结合相似度信息和第一测评规则确定实际书写图像是否满足预设书写要求。
在本实施例中,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括如下步骤:
获取第二ID信息,其中,所述第二ID信息表示当前对所述待测评文字进行测评的测评规则为第二测评规则,所述第二测评规则包括:距离测评规则、角度测评规则、位置测评规则、位置关系、距离测评规则、两点到线的距离测评规则、两线段的长度比测评规则、两线段夹角测评规则;基于所述第二ID信息所表征的第二测评规则在所述第一组特征信息和所述第二组特征信息中提取第二特征信息,其中,所述第二特征信息为所述待测评文字中实际笔画的特征点;根据所述特征点的坐标信息计算目标测评信息,其中,所述目标测评信息包括以下至少之一:所述待测评文字的实际笔画中至少两个第一特征点之间的第一目标值和标准笔画中至少两个第二特征点之间的第二目标值之间的对比值,所述目标值包括以下至少之一:距离值、位置值、角度值,所述第一特征点和所述第二特征点依次对应;所述待测评文字的实际笔画中特征点形成的线段长度和标准笔画中依次对应的特征点形成的线段长度的对比值;所述待测评文字的实际笔画中两个特征点到目标特征线的距离和标准笔画中依次对应的两个特征点到目标特征线的距离之间的对比值;所述待测评文字的实际笔画中两组4个特征点形成的两组线段角度和标准笔画中依次对应的两组4个特征点形成的两组线段角度的对比值;结合所述目标测评信息和所述第二测评规则确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
若目标测评信息为距离值,则上述处理过程可以描述为:
在本实施例中,首先根据第二ID信息在其对应的多维评测规则数据中查找第二测评规则中的距离测评规则,然后,根据第二测评规则中的距离测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点。然后,根据特征点的坐标信息计算实际笔画的第一特征点之间的距离(称之为实际距离)与标准笔画的第二特征点之间的距离(称之为标准距离),通过分析实际距离与标准距离之间的对比值(以下简称比值)确定实际书写笔画列表中的笔画是否满足预设书写要求。
若该比值在下偏差阈值A及上偏差阈值A范围内则间距符合预设书写要求。若该比值满足以下要求,则不满足预设书写要求:比值在下偏差阈值B及下偏差阈值A之间、比值在下偏差阈值B以下、比值在上偏差阈值B以上、比值在上偏差阈值A及上偏差阈值B之间。
例如,如图2(a)所示,“工”字两横间上下距离适中,符合预设书写要求。其中,两横间上下距离是指上横的特征点和下横的特征点之间的距离。如图2(b)所示,“非”字的两竖中心点左右距离适中,符合预设书写要求。其中,两竖中心点左右距离是指左边竖线的特征点和右边竖线特征点之间的距离。如图2(c)所示,“石”字左尖横的中心点与下部“口”的中心点上下距离适中,符合预设书写要求。
若目标测评信息为角度值,则上述处理过程可以描述为:
首先,根据第二ID信息在其对应的多维评测规则数据中查找第二测评规则中的角度测评规则,然后,根据第二测评规则中的角度测评规则在第一组特征数据和第二组特征数据中获取待测评文字中实际笔画的特征点;然后,根据特征点的坐标信息计算实际笔画各特征点间角度与标准笔画各特征点间角度。
需要说明的是,如果规则检测方向为水平则只分析实际角度及标准角度的水平情况。如果规则检测方向为竖直则只分析实际角度及标准角度的垂直情况。如果规则检测方向为全部或未指定则进行倾斜情况对比。
如果实际笔画各特征点间角度与标准笔画各特征点间角度之间的角度差大于2倍角度阈值则角度过斜;如果实际笔画各特征点间角度与标准笔画各特征点间角度之间的角度差大于角度阈值则角度稍斜;实际笔画各特征点间角度与标准笔画各特征点间角度之间的角度差小于等于角度阈值则符合要求。
例如,如图3(a)所示,“千”字撇的中点与横竖得交叉点上下垂直对正。如图3(b)所示,“非”字的两竖中心点左右水平对正。如图3(c)所示,“石”字字左尖横的中心点与下部“口”的中心点上下垂直对正。
若目标测评信息为位置值,则上述处理过程可以描述为:
首先,根据第二ID信息在其对应的多维评测规则数据中查找第二测评规则中的位置测评规则,然后,根据第二测评规则中的位置测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点(即,第二特征信息);然后根据特征点的坐标信息计算实际笔画及标准笔画的位置值,并根据该位置值确定实际书写笔画列表中的笔画是否满足预设书写要求。
需要说明的是,如果规则检测方向为水平则只分析X方向情况,即点的左右位置关系。如果规则检测方向为竖直则只分析y方向情况,即点的上下位置关系。如果规则检测方向为全部或未指定则X,Y方向均进行对比,即上下左右位置关系对比。如果实际评测点的位置关系与标准点的位置关系不一致,则输出相关提示信息。
如图4所示,“贵”字当两画收笔位置为等高或撇低点高时,撇画书写略低,应撇高点低,富有动势。
若目标测评信息为待测评文字的实际笔画和标准笔画之间的位置关系和距离值,则上述过程描述为:
首先,根据第二ID信息在其对应的多维评测规则数据中查找第二测评规则中的位置关系和距离测评规则,然后,根据第二测评规则中的位置关系和距离测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点获取待测评文字中实际笔画的特征点;然后,根据特征点的坐标信息计算实际笔画及标准笔画的位置关系及距离值。
需要说明的是,如果规则检测方向为水平则只分析X方向情况,即点的左右位置关系及X方向距离大小。如果规则检测方向为竖直则只分析Y方向情况,即点的上下位置关系及Y方向距离大小。如果规则检测方向为全部则X,Y方向均进行对比,即上下左右位置关系及距离对比。如果实际评测点的位置关系与标准点的位置关系不一致,则输出相关提示信息。
在本实施例中,多点间的位置及距离符合情况适用于既要分析点之间的位置关系又要分析点间的距离大小关系。
如图5所示,竖画的中点与另外部分的最低点的位置及距离大小关系,如“利”、“阴”、“陈”。
若目标参数信息为待测评文字的实际笔画中两个特征点到目标特征线的距离和标准笔画中依次对应的两个特征点到目标特征线的距离之间的对比值,则上述过程描述为:
首先,根据第二ID信息在其对应的多维评测规则数据中查找第二测评规则中的两点到线的两点到线的距离测评规则,然后,根据第二测评规则中的两点到线的距离测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后,根据对应的特征点描述参数获取两点及经过点的垂直或水平线(即,上述目标特征线)。如果规则检测方向为水平则仅检测两点分别到垂直线的X方向距离。如果规则检测方向为垂直则仅检测两点分别到水平线的Y方向距离。
在本实施例中,可以计算待测评文字在实际书写中两个特征点到目标特征线距离的比值,以及标准文字中两个特征点到标特征线距离的比值;然后,通过分析实际书写比值/标准比值来确定实际书写笔画列表中的笔画是否满足预设书写要求。若比值(实际书写比值/标准比值)在下偏差阈值A及上偏差阈值A范围内则间距符合预设书写要求。若比值(实际书写比值/标准比值)在下偏差阈值B及下偏差阈值A之间则实际书写间距稍小,则不符合预设书写要求。若比值(实际书写比值/标准比值)在下偏差阈值B以下则实际书写间距过小,则不符合预设书写要求。若比值(实际书写比值/标准比值)在上偏差阈值B以上则实际书写间距过大,则不符合预设书写要求。若比值(实际书写比值/标准比值)在上偏差阈值A及上偏差阈值B之间则实际书写间距稍大,则不符合预设书写要求。
在本实施例中,需要说明的是,两点到线的距离比符合情况适用于评测字组成中笔画的伸展情况。如图6所示,撇捺的舒展程度,如“奉”、“会”、“登”、“春”等字。
若目标参数信息为待测评文字的实际笔画中特征点形成的线段长度和标准笔画中依次对应的特征点形成的线段长度的对比值,则上述过程描述为:
首先,根据第二ID信息在其对应的多维评测规则数据中查找第二测评规则中的两线段的长度比测评规则,然后,根据第二测评规则中的两线段的长度比测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后根据对应的特征点描述参数获取线段的描述点;接下来,计算实际线段长度及标准线段长度,通过分析实际长度与标准长度的比值确定实际书写笔画列表中的笔画是否满足预设书写要求。若比值在下偏差阈值A及上偏差阈值A范围内则长度比符合要求。若比值在下偏差阈值B及下偏差阈值A之间则长度比稍小。若比值在下偏差阈值B以下则长度比过小。若比值在上偏差阈值B以上则长度比过大。若比值在上偏差阈值A及上偏差阈值B之间则长度比稍大。例如,如图7所示,两条线段的长度比值为“三”。
若目标参数信息为待测评文字的实际笔画中两组4个特征点形成的两组线段角度和标准笔画中依次对应的两组4个特征点形成的两组线段角度的对比值,则上述过程描述为:
首先,根据第二ID信息在其对应的多维评测规则数据中查找第二测评规则中的两线段夹角测评规则,然后,根据第二测评规则中的两线段夹角测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后,根据对应的特征点描述参数获取两条线段的描述点,分别计算实际两线段夹角及标准两线段夹角,通过分析实际夹角与标准夹角差确定实际书写笔画列表中的笔画是否满足预设书写要求。若实际夹角小于标准夹角,并且夹角差大于2倍夹角阈值,则提示夹角过小;若夹角差大于夹角阈值,则提示夹角稍小;否则夹角符合预设书写要求。若实际夹角大于标准夹角,并且夹角差大于2倍夹角阈值,则提示夹角过大;若夹角差大于夹角阈值,则提示夹角稍大;否则夹角符合预设书写要求。若实际夹角等于标准夹角则符合预设书写要求。例如,如图8(a)至8(c)所示,“合”字的撇捺夹角;“光”字的相向点夹角;“其”字的相背点夹角均符合预设书写要求。
在另一个可选的实施方式中,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括如下步骤:
获取第三ID信息,其中,所述第三ID信息表示当前对所述待测评文字进行测评的测评规则为第三测评规则,所述第三测评规则包括以下至少之一:多个笔画之间平行情况的测评规则、多个笔画之间水平间距或者竖直间距情况的测评规则;基于所述第三ID信息所表征的第三测评规则在所述第一组特征信息和所述第二组特征信息中提取第三特征信息,其中,所述第三特征信息为获取所述待测评文字中实际笔画的特征点描述参数;根据所述特征点描述参数确定目标笔画信息,其中,所述目标笔画信息包括以下至少之一:所述待测评文字中多个笔画之间的平行情况、所述待测评文字中多个笔画之间的水平间距信息或者竖直间距信息;结合所述目标笔画信息和所述第三测评规则确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
若目标笔画信息为待测评文字中多个笔画之间的平行情况,则上述过程可以描述为:
首先,根据第三ID信息在其对应的多维评测规则数据中查找第三测评规则中的多个笔画之间平行情况的测评规则,然后,根据第三测评规则中的多个笔画之间平行情况的测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后,根据对应的特征描述参数获取待分析的多个笔画的ID值,遍历笔画的分段特征信息数据,根据笔画ID分别查找其对应的分段特征数据。如果规则检测方向为水平则仅检测主笔水平方向的角度;如果规则检测方向为竖直则仅检测主笔垂直方向的角度。依次对比各笔画ID的角度,通过分析实际角度与标准角度之间的角度差确定实际书写笔画列表中的笔画是否满足预设书写要求。如果角度差大于2倍角度阈值,则提示方向偏差大;角度差大于角度阈值,则提示方向偏差稍大。如图9(a)和9(b)所示,多横平行,多线段水平方向角度一致,如书法“田”字;多竖平行,多线段垂直方向角度一致,如书法“川”字。
若目标笔画信息为待测评文字中多个笔画之间的水平间距信息或者竖直间距信息,则上述过程可以描述为:
首先,根据第三ID信息在其对应的多维评测规则数据中查找第三测评规则中的多个笔画之间水平间距或者竖直间距情况的测评规则,然后,根据第三测评规则中的多个笔画之间水平间距或者竖直间距情况的测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后,根据对应的特征点描述参数获取笔画的描述点。如果规则检测方向为水平则仅分别计算各笔画上特征点间X方向的距离;如果规则检测方向为竖直则仅分别计算各笔画上特征点间Y方向的距离;否则计算两点间距离。依次遍历实际笔画间的距离,与对应的标准距离;比较实际距离与标准距离之间的比值;若比值在下偏差阈值A及上偏差阈值A范围内则间距符合要求。若比值在下偏差阈值B及下偏差阈值A之间则间距稍小。若比值在下偏差阈值B以下则间距过小。若比值在上偏差阈值B以上则间距过大。若比值在上偏差阈值A及上偏差阈值B之间则间距稍大。如图10(a)和10(b)所示,多横等距,多线段水平方向间距一致,如书法“三”字;多竖等距,多线段垂直方向间距一致,如书法“州”字。
在另一个可选的实施方式中,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括如下步骤:
获取第四ID信息,其中,所述第四ID信息表示当前对所述待测评文字进行测评的测评规则为第四测评规则,所述第四测评规则包括以下至少之一:多个组成块之间长宽大小比例测评规则、多个组成块面积大小比例测评规则、多个组成块之间位置关系测评规则、多个组成块之间距离关系测评规则;基于所述第四ID信息所表征的第四测评规则在所述第一组特征信息和所述第二组特征信息中提取第四特征信息,其中,所述第四特征信息为所述待测评文字中实际笔画的特征点描述参数;根据所述特征点描述参数确定目标组成块信息,其中,所述目标组成块信息包括以下至少之一:所述待测评文字中多个组成块之间的长宽大小比例信息、所述待测评文字中多个组成块的面积大小比例信息、所述待测评文字中多个组成块之间的位置关系信息、所述待测评文字中多个组成块之间的距离关系信息;结合所述目标组成块信息和所述第四测评规则确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
若目标组成块信息为待测评文字中多个组成块之间的长宽大小比例信息,则上述过程描述为:
首先,根据第四ID信息在其对应的多维评测规则数据中查找第四测评规则中的多个组成块之间长宽大小比例测评规则,然后,根据第四测评规则中的多个组成块之间长宽大小比例测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后,根据对应的块描述参数获取对应的组成块面特征信息,遍历所有的组成块面,分别对比实际组成块面的长与标准中对应组成块面的长比值,实际组成块面的宽与标准中对应组成块面的宽比值。
若比值在下偏差阈值A及上偏差阈值A范围内则长度或宽度大小符合预设书写要求。若比值在下偏差阈值B及下偏差阈值A之间则长度或宽度大小稍小。若比值在下偏差阈值B以下则长度或宽度大小过小。若比值在上偏差阈值B以上则长度或宽度大小过大。若比值在上偏差阈值A及上偏差阈值B之间则长度或宽度大小稍大。例如,如图11所示,“羽”字部件之间的长度比例,左部书写稍长,整字应左短右长,左收右放;“出”字部件之间的宽度比例,上部书写稍宽,上部应比下部窄,参差变化。
若目标组成块信息为待测评文字中多个组成块之间的位置关系信息,则上述过程描述为:
首先,根据第四ID信息在其对应的多维评测规则数据中查找第四测评规则中的多个组成块之间位置关系测评规则,然后,根据第四测评规则中的多个组成块之间位置关系测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后,根据对应的组成块描述参数获取对应的组成块面特征信息,遍历所有的组成块面,分别计算实际组成块面间的位置关系及标准对应组成块面间的位置关系。如果规则检测方向为水平则只分析X方向情况,即组成块面间的左右位置关系。如果规则检测方向为竖直则只分析y方向情况,即组成块面间的上下位置关系。如果规则检测方向为全部或未指定则X,Y方向均进行对比,即上下左右位置关系对比。
若目标组成块信息为待测评文字中多个组成块之间的距离关系信息,则上述过程描述为:
首先,根据第四ID信息在其对应的多维评测规则数据中查找第四测评规则中的多个组成块之间距离关系测评规则,然后,根据第四测评规则中的多个组成块之间距离关系测评规则在第一组特征数据和第二组特征数据获取待测评文字中实际笔画的特征点描述参数;之后,根据对应的块描述参数获取对应的组成块面特征信息,遍历所有的组成块面,分别计算实际组成块面间的距离及标准对应组成块面间的距离,通过分析实际距离与标准距离之间的比值确定实际书写笔画列表中的笔画是否满足预设书写要求。若该比值在下偏差阈值A及上偏差阈值A范围内则间距符合预设书写要求。若该比值在下偏差阈值B及下偏差阈值A之间则间距稍大。若该比值在下偏差阈值B以下则间距过小。若该比值在上偏差阈值B以上则间距过大。若该比值在上偏差阈值A及上偏差阈值B之间则间距稍大。例如,如图12(a)和12(b)所示,“宇”字上部与下部的间距关系;“徵”字左中右之间的距离关系。
需要说明的是,在本实施例中,还可以计算待测评文字的图像和标准文字的图像的相似度。例如,可以使用图像平均哈希算法、感知哈希算法、SSIM结构相似性算法、图像模板匹配算法、SIFT算法、AKAZE算法、BRISK算法、ORB算法、SURF算法等。本实施例可以采用速度快的感知哈希算法及对旋转、尺度缩放、亮度变化保持不变性的SIFT算法进行加权计算相似度。
在采用上述分析方式得到测评结果之后,就可以根据测评结果确定待测评文字的测评结果,具体包括如下步骤:
利用公式
Figure BDA0002038642630000241
计算所述待测评文字的书写评分,其中,W为所述书写评分,M为多个维度规则相权重分,N为错误率,Q为错误权重,n为规则的数量。
假设,书写满分为100分,在本实施例中,可以采用扣分制,根据字的评测维度规则项及权重进行扣分。具体计算公式为:书写评分=100-多各维度规则相权重分*错误率*错误权重。维度权重分:指根据各个维度规则的重要程度设置的扣分值。错误率:只在某维度规则评测中,所涉及到的评测内容项错误率。错误权重:指不同错误的严重程度的比例值。
例如,待测评文字“千”有3个维度规则评估:
笔画的起收笔评测:3个笔画都需要评测起收笔,起收笔权重为4分,起笔或收笔错误总共2个,总共为3*2=6个评测内容,则扣分为4*(3*2-2)/3*2=2.67分。笔画间距离评测:间距权重为10分,间距过长或过短权重为0.8,稍长或短权重为0.5;这里为间距稍长,则扣10*0.5=5分。笔画垂直角度评测:垂直角度为10分,角度过大或过小扣10*0.8分=8分。总分=100-2.67-5-8=84.33。
测评文字的书写评价信息则是对用户书写的待评测字从总的方面进行概括评价,其书写评价好的内容来源于根据各维度中未扣分项及对应模板生成的内容;其书写评价一般的内容来源于根据各维度中扣分项少及对应模板生成的内容;其书写评价差内容来源于扣分项多(不达标项)及对应模板生成的内容。
书写指导信息是指针对用户书写的待评测字在评测中出现的错误,根据维度类型进行归类,通过正确的示意图及用户书写的错误示意图,结合问题分析评语生成的指导意见。
具体如下:
评测类型描述:根据评测规则的标题生成。正确示意图:字的标准数据结合评测规则中的评测要求,对检测项中特征通过不同颜色的点、线、色块在标准字图像上绘制正确示意图。错误示意图:待评测数据结合评测规则中的评测要求,对检测项特征中的错误部分通过不同颜色的点、线、色块在实际字图像上绘制错误示意图。指导评语:结合评测规则中的评测参数描述,生成检测项特征的描述语言,并结合检测结果生成指导评语。
实施例二:
本发明实施例还提供了一种字体特征提取装置,该字体特征提取装置主要用于执行本发明实施例上述内容所提供的字体特征提取方法,以下对本发明实施例提供的字体特征提取装置做具体介绍。
图13是根据本发明实施例的一种字体特征提取装置的示意图,如图13所示,该字体特征提取装置主要包括:
第一获取单元10,用于获取待测评文字,并提取所述待测评文字的特征信息,得到第一组特征信息;
第二获取单元20,用于获取用于对所述待测评文字进行测评的标准文字,并提取所述标准文字的特征信息,得到第二组特征信息;
其中,所述第一组特征信息和所述第二组特征信息中均包含以下类型的特征信息:笔画轮廓特征信息、笔画行笔轨迹特征信息、笔画组成块特征信息、笔画书写方向特征信息、笔画起收笔特征信息和笔画分段特征信息;
分析单元30,用于基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果,所述测评结果包括:所述待测评文字的书写评分,所述待测评文字的书写评价信息,所述待测评文字的书写指导信息。
在本发明实施例中,首先获取待测评文字,并提取待测评文字的特征信息,得到第一组特征信息;之后,获取用于对待测评文字进行测评的标准文字,并提取该标准文字的特征信息,得到第二组特征信息;最后,对第一组特征信息和第二组特征信息进行分析,得到测评结果。通过上述描述可知,在本实施例中,通过将待测评文字的特征信息和标准文字的特征信息进行比对,从而得到待测评文字的测评结果的方式,缓解了现有技术中对书法文字进行测评时测评效率较低的技术问题,从而实现了提高书法文字的测评效率的技术效果。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种字体特征提取方法,其特征在于,包括:
获取待测评文字,并提取所述待测评文字的特征信息,得到第一组特征信息;
获取用于对所述待测评文字进行测评的标准文字,并提取所述标准文字的特征信息,得到第二组特征信息;
其中,所述第一组特征信息和所述第二组特征信息中均包含以下类型的特征信息:笔画轮廓特征信息、笔画行笔轨迹特征信息、笔画组成块特征信息、笔画书写方向特征信息、笔画起收笔特征信息和笔画分段特征信息;
基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果,其中,所述测评结果包括:所述待测评文字的书写评分,所述待测评文字的书写评价信息,所述待测评文字的书写指导信息;
提取所述待测评文字的笔画轮廓点列表,其中,所述笔画轮廓点列表中包括所述待测评文字的各个笔画的轮廓点坐标信息;
基于所述笔画轮廓点列表提取所述待测评文字的笔画轮廓特征信息;
其中,所述待测评文字的笔画轮廓特征信息包括以下至少之一:笔画轮廓的正外接矩形、笔画轮廓的最小外接矩形、笔画轮廓中位于最左位置的坐标点、笔画轮廓中位于最右位置的坐标点、笔画轮廓中位于最上位置的坐标点、笔画轮廓中位于最下位置的坐标点、笔画轮廓的中心点、笔画轮廓的质心点、笔画轮廓的水平中线、笔画轮廓的竖直中线、笔画轮廓的周长、笔画轮廓的面积、笔画轮廓的中心线;
其中,若所述待测评文字的笔画包含多个转折情况,则可以根据笔画行笔轨迹特征信息中行笔轨迹长度进行对比;
若所述待测评文字的笔画不包含多个转折情况,则利用所述待测评文字的笔画的目标外接矩形和标准笔画的目标外接矩形,确定实际书写笔画列表中的笔画是否满足预设书写要求;
其中,所测评结果还包括所述测评文字中的单笔画书写填墨符合程度:遍历所述待测评的实际书写笔画列表,查找其所述待测评的标准笔画,针对所述待测评的实际笔画轮廓点的正接多边形与标准笔画轮廓点的正接多边行进行运算求出准确书写面积、未填充面积以及超出面积,基于所述准确书写面积、未填充面积以及超出面积确定出所述单笔画书写填墨符合程度;
基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括:
获取第一ID信息,其中,所述第一ID信息表示当前对所述待测评文字进行测评的测评规则为第一测评规则,所述第一测评规则包括:相似度测评规则;
基于所述第一ID信息所表征的第一测评规则在所述第一组特征信息和所述第二组特征信息中提取第一特征信息,其中,所述第一特征信息为所述待测评文字的实际书写笔画图像信息,以及对应的标准笔画图像信息;
利用图像相似度计算算法对所述实际书写笔画图像信息和所述标准笔画图像信息计算所述待测评文字的实际笔画轮廓与其对应的标准笔画轮廓之间的相似度信息;
结合所述相似度信息和所述第一测评规则确定所述实际书写图像是否满足预设书写要求。
2.根据权利要求1所述的方法,其特征在于,提取所述待测评文字的特征信息还包括:
提取所述待测评文字的行笔轨迹点数据列表,其中,所述行笔轨迹点数据列表中包括每个待测评文字的每个笔画的行笔轨迹数据;
基于所述行笔轨迹点数据列表提取所述待测评文字的笔画行笔轨迹特征信息,和/或,所述待测评文字的笔画书写方向特征信息;其中,所述待测评文字的笔画行笔轨迹特征信息包括以下至少之一:笔画的行笔轨迹长度、笔画的行笔轨迹起点、笔画的行笔轨迹终点、笔画的行笔轨迹在水平方向的中点、笔画的行笔轨迹在竖直方向的中点、笔画的行笔轨迹最左点、笔画的行笔轨迹最右点、笔画的行笔轨迹最上点、笔画的行笔轨迹最下点、任意两个笔画行笔轨迹的交叉点、任意两个笔画行笔轨迹延长后交叉点。
3.根据权利要求1所述的方法,其特征在于,提取所述待测评文字的特征信息还包括:
提取所述待测评文字的行笔轨迹点数据列表,其中,所述行笔轨迹点数据列表中包括每个待测评文字的每个笔画的行笔轨迹数据;
利用道格拉斯普克算法对所述行笔轨迹点数据列表进行简化,并利用简化处理之后的行笔轨迹点数据对轨迹点曲线进行平滑化处理,得到辅助点;
对所述辅助点进行处理,得到处理结果,其中,所述处理结果用于确定所述待测评文字的笔画是否产生角度突变;
根据所述处理结果标记出角点,并根据标记出的角点生成特征点列表;
根据所述特征点生成多条笔画段,并对所述多条笔画段中相邻且方向一致的笔画段进行合并,在合并后的笔画段中查找主笔画段;
遍历所有的笔画段数据,根据笔画的转角信息对笔画的起笔及收笔处的主笔画段进行分析,得到所述笔画起收笔特征信息;
对比实际书写笔画列表中笔画的起收笔特征信息和标准笔画的起收笔特征信息;
根据对比结果确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
4.根据权利要求1所述的方法,其特征在于,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括:
遍历所述待测评文字的实际书写笔画列表,并为所述实际书写笔画列表中的每个笔画查找对应的标准笔画;
比较所述实际书写笔画列表中待评测笔画与其对应的标准笔画之间的目标信息,得到比较结果,其中,所述目标信息包括以下至少之一:方向信息、长度信息、角度信息;
基于所述比较结果确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
5.根据权利要求1所述的方法,其特征在于,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括:
获取第二ID信息,其中,所述第二ID信息表示当前对所述待测评文字进行测评的测评规则为第二测评规则,所述第二测评规则包括:距离测评规则、角度测评规则、位置测评规则、位置关系、距离测评规则、两点到线的距离测评规则、两线段的长度比测评规则、两线段夹角测评规则;
基于所述第二ID信息所表征的第二测评规则在所述第一组特征信息和所述第二组特征信息中提取第二特征信息,其中,所述第二特征信息为所述待测评文字中实际笔画的特征点;
根据所述特征点的坐标信息计算目标测评信息,其中,所述目标测评信息包括以下至少之一:所述待测评文字的实际笔画中至少两个第一特征点之间的第一目标值和标准笔画中至少两个第二特征点之间的第二目标值之间的对比值,所述目标值包括以下至少之一:距离值、位置值、角度值,所述第一特征点和所述第二特征点依次对应;所述待测评文字的实际笔画中特征点形成的线段长度和标准笔画中依次对应的特征点形成的线段长度的对比值;所述待测评文字的实际笔画中两个特征点到目标特征线的距离和标准笔画中依次对应的两个特征点到目标特征线的距离之间的对比值;所述待测评文字的实际笔画中两组4个特征点形成的两组线段角度和标准笔画中依次对应的两组4个特征点形成的两组线段角度的对比值;
结合所述目标测评信息和所述第二测评规则确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
6.根据权利要求1所述的方法,其特征在于,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括:
获取第三ID信息,其中,所述第三ID信息表示当前对所述待测评文字进行测评的测评规则为第三测评规则,所述第三测评规则包括以下至少之一:多个笔画之间平行情况的测评规则、多个笔画之间水平间距或者竖直间距情况的测评规则;
基于所述第三ID信息所表征的第三测评规则在所述第一组特征信息和所述第二组特征信息中提取第三特征信息,其中,所述第三特征信息为所述待测评文字中实际笔画的特征点描述参数;
根据所述特征点描述参数确定目标笔画信息,其中,所述目标笔画信息包括以下至少之一:所述待测评文字中多个笔画之间的平行情况、所述待测评文字中多个笔画之间的水平间距信息或者竖直间距信息;
结合所述目标笔画信息和所述第三测评规则确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
7.根据权利要求1所述的方法,其特征在于,基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果包括:
获取第四ID信息,其中,所述第四ID信息表示当前对所述待测评文字进行测评的测评规则为第四测评规则,所述第四测评规则包括以下至少之一:多个组成块之间长宽大小比例测评规则、多个组成块面积大小比例测评规则、多个组成块之间位置关系测评规则、多个组成块之间距离关系测评规则;
基于所述第四ID信息所表征的第四测评规则在所述第一组特征信息和所述第二组特征信息中提取第四特征信息,其中,所述第四特征信息为所述待测评文字中实际笔画的特征点描述参数;
根据所述特征点描述参数确定目标组成块信息,其中,所述目标组成块信息包括以下至少之一:所述待测评文字中多个组成块之间的长宽大小比例信息、所述待测评文字中多个组成块的面积大小比例信息、所述待测评文字中多个组成块之间的位置关系信息、所述待测评文字中多个组成块之间的距离关系信息;
结合所述目标组成块信息和所述第四测评规则确定所述实际书写笔画列表中的笔画是否满足预设书写要求。
8.一种字体特征提取装置,其特征在于,包括:
第一获取单元,用于获取待测评文字,并提取所述待测评文字的特征信息,得到第一组特征信息;
第二获取单元,用于获取用于对所述待测评文字进行测评的标准文字,并提取所述标准文字的特征信息,得到第二组特征信息;
其中,所述第一组特征信息和所述第二组特征信息中均包含以下类型的特征信息:笔画轮廓特征信息、笔画行笔轨迹特征信息、笔画组成块特征信息、笔画书写方向特征信息、笔画起收笔特征信息和笔画分段特征信息;
分析单元,用于基于所述第一组特征信息和所述第二组特征信息对所述待测评文字进行测评,得到测评结果,其中,所述测评结果包括:所述待测评文字的书写评分,所述待测评文字的书写评价信息,所述待测评文字的书写指导信息;
其中,所述待测评文字的笔画轮廓特征信息包括以下至少之一:笔画轮廓的正外接矩形、笔画轮廓的最小外接矩形、笔画轮廓中位于最左位置的坐标点、笔画轮廓中位于最右位置的坐标点、笔画轮廓中位于最上位置的坐标点、笔画轮廓中位于最下位置的坐标点、笔画轮廓的中心点、笔画轮廓的质心点、笔画轮廓的水平中线、笔画轮廓的竖直中线、笔画轮廓的周长、笔画轮廓的面积、笔画轮廓的中心线;其中,若所述待测评文字的笔画包含多个转折情况,则可以根据笔画行笔轨迹特征信息中行笔轨迹长度进行对比;若所述待测评文字的笔画不包含多个转折情况,则利用所述待测评文字的笔画的目标外接矩形和标准笔画的目标外接矩形,确定实际书写笔画列表中的笔画是否满足预设书写要求;
所述分析单元,用于所测评结果还包括所述测评文字中的单笔画书写填墨符合程度:遍历所述待测评的实际书写笔画列表,查找其所述待测评的标准笔画,针对所述待测评的实际笔画轮廓点的正接多边形与标准笔画轮廓点的正接多边行进行运算求出准确书写面积、未填充面积以及超出面积,基于所述准确书写面积、未填充面积以及超出面积确定出所述单笔画书写填墨符合程度;
其中,所述分析单元,用于:
获取第一ID信息,其中,所述第一ID信息表示当前对所述待测评文字进行测评的测评规则为第一测评规则,所述第一测评规则包括:相似度测评规则;
基于所述第一ID信息所表征的第一测评规则在所述第一组特征信息和所述第二组特征信息中提取第一特征信息,其中,所述第一特征信息为所述待测评文字的实际书写笔画图像信息,以及对应的标准笔画图像信息;
利用图像相似度计算算法对所述实际书写笔画图像信息和所述标准笔画图像信息计算所述待测评文字的实际笔画轮廓与其对应的标准笔画轮廓之间的相似度信息;
结合所述相似度信息和所述第一测评规则确定所述实际书写图像是否满足预设书写要求。
CN201910336947.2A 2019-04-24 2019-04-24 一种字体特征提取方法和装置 Active CN110070053B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910336947.2A CN110070053B (zh) 2019-04-24 2019-04-24 一种字体特征提取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910336947.2A CN110070053B (zh) 2019-04-24 2019-04-24 一种字体特征提取方法和装置

Publications (2)

Publication Number Publication Date
CN110070053A CN110070053A (zh) 2019-07-30
CN110070053B true CN110070053B (zh) 2022-03-15

Family

ID=67368770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910336947.2A Active CN110070053B (zh) 2019-04-24 2019-04-24 一种字体特征提取方法和装置

Country Status (1)

Country Link
CN (1) CN110070053B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796065A (zh) * 2019-10-26 2020-02-14 深圳市锦上科技有限公司 基于图像识别的练字评分方法、系统以及计算机可读介质
CN111242219A (zh) * 2020-01-14 2020-06-05 北大方正集团有限公司 文字相似度确定方法、装置、电子设备及存储介质
CN112308745A (zh) * 2020-02-28 2021-02-02 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN112307866A (zh) * 2020-02-28 2021-02-02 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN111680761B (zh) * 2020-06-17 2022-05-10 北京字节跳动网络技术有限公司 信息反馈方法、装置和电子设备
CN111882536A (zh) * 2020-07-24 2020-11-03 富德康(北京)科技股份有限公司 一种基于图片对比实现散货数量监测的方法
CN113642543A (zh) * 2021-10-14 2021-11-12 北京许先网科技发展有限公司 一种基于ai技术的多方位字体智能测评系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN102708724A (zh) * 2012-05-14 2012-10-03 李清树 基于现代信息技术的电子书法练习方法
CN104573747A (zh) * 2013-10-17 2015-04-29 北大方正集团有限公司 文字评价方法及装置
CN104951811A (zh) * 2015-07-09 2015-09-30 北京盛世宣合信息科技有限公司 应用于毛笔书写的行笔路线识别方法和装置
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
CN106326907A (zh) * 2015-06-23 2017-01-11 王东锐 手写体自动评价方法和系统
CN109472249A (zh) * 2018-11-22 2019-03-15 京东方科技集团股份有限公司 一种确定书写体优劣等级的方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN102708724A (zh) * 2012-05-14 2012-10-03 李清树 基于现代信息技术的电子书法练习方法
CN104573747A (zh) * 2013-10-17 2015-04-29 北大方正集团有限公司 文字评价方法及装置
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
CN106326907A (zh) * 2015-06-23 2017-01-11 王东锐 手写体自动评价方法和系统
CN104951811A (zh) * 2015-07-09 2015-09-30 北京盛世宣合信息科技有限公司 应用于毛笔书写的行笔路线识别方法和装置
CN109472249A (zh) * 2018-11-22 2019-03-15 京东方科技集团股份有限公司 一种确定书写体优劣等级的方法及装置

Also Published As

Publication number Publication date
CN110070053A (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
CN110070053B (zh) 一种字体特征提取方法和装置
Tripathy et al. Handwriting segmentation of unconstrained Oriya text
Alaei et al. A new scheme for unconstrained handwritten text-line segmentation
Saabni et al. Language-independent text lines extraction using seam carving
JP5379085B2 (ja) スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
CN102982330B (zh) 文字图像中字符识别方法和识别装置
US7860313B2 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
US20050100214A1 (en) Stroke segmentation for template-based cursive handwriting recognition
JP5717691B2 (ja) 手書き文字検索装置、方法及びプログラム
SE519014C2 (sv) Metod och anordning för igenkänning av ett handskrivet mönster
CN109635687B (zh) 基于时序点集计算的汉字文本行书写质量自动评价方法和系统
JP2730665B2 (ja) 文字認識装置および方法
CN113191309A (zh) 一种手写汉字的识别、评分、纠错方法及系统
Viard-Gaudin et al. Recognition-directed recovering of temporal information from handwriting images
Tan An algorithm for online strokes verification of Chinese characters using discrete features
CN104346320A (zh) 手写文档处理装置、手写文档处理方法和手写文档处理程序
CN210038810U (zh) 智能评测设备及系统
CN107209862A (zh) 程序、信息存储介质以及识别装置
US9092688B2 (en) Assisted OCR
CN113392772B (zh) 一种面向文字识别的文字图像收缩变形增强方法
CN112861694A (zh) 一种基于模板的联机书写评分方法
US20160202899A1 (en) Handwritten music sign recognition device and program
CN111783737A (zh) 一种数学公式的识别方法和识别装置
CN111612045A (zh) 一种获取目标检测数据集的通用方法
JP6030172B2 (ja) 手書き文字検索装置、方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant