CN113420983B - 一种书写评价方法、装置、设备及存储介质 - Google Patents
一种书写评价方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113420983B CN113420983B CN202110700266.7A CN202110700266A CN113420983B CN 113420983 B CN113420983 B CN 113420983B CN 202110700266 A CN202110700266 A CN 202110700266A CN 113420983 B CN113420983 B CN 113420983B
- Authority
- CN
- China
- Prior art keywords
- text
- stroke
- writing
- candidate
- text unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 7
- 239000000779 smoke Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- COCAUCFPFHUGAA-MGNBDDOMSA-N n-[3-[(1s,7s)-5-amino-4-thia-6-azabicyclo[5.1.0]oct-5-en-7-yl]-4-fluorophenyl]-5-chloropyridine-2-carboxamide Chemical compound C=1C=C(F)C([C@@]23N=C(SCC[C@@H]2C3)N)=CC=1NC(=O)C1=CC=C(Cl)C=N1 COCAUCFPFHUGAA-MGNBDDOMSA-N 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本申请提供了一种书写评价方法、装置、设备及存储介质,其中,方法包括:获取目标对象进行书写的笔迹点数据;根据笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为书写文本中一文本单元的候选识别结果;从书写文本识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元;根据查找结果确定书写文本中内容书写正确的部分。本申请提供的书写评价方法可自动对目标对象书写的内容进行评价,并且不受书写位置和书写方向的影响,用户体验较好。
Description
技术领域
本申请涉及智能教育技术领域,尤其涉及一种书写评价方法、装置、设备及存储介质。
背景技术
在某些场景中,需要对用户书写的文本进行评价,比如,在针对学生的听写练习场景中,需要对学生根据指定听写内容书写的文本进行评价。
目前对书写文本进行进行评价的方案多为人工评价方案,即人工对书写文本进行评价。然而,人工评价方案较为耗时,且在待评价内容乱序、书写位置不确定的情况下,需要花费评价人员很多的精力,即人工评价方案较为耗时耗力。
发明内容
有鉴于此,本申请提供了一种书写评价方法、装置、设备及存储介质,用以解决现有技术中的人工评价方案较为耗时耗力的问题,其技术方案如下:
一种书写评价方法,包括:
获取目标对象进行书写的笔迹点数据;
根据所述笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,所述书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为所述书写文本中一文本单元的候选识别结果;
从所述书写文本识别结果中查找与所述书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元;
根据查找结果确定所述书写文本中内容书写正确的部分。
可选的,所述书写文本识别结果还包括:每个候选文本单元的位置信息;
所述根据查找结果确定所述书写文本中内容书写正确的部分,包括:
针对所述标准文本中每个词条,在查找到与该词条的每个文本单元匹配的候选文本单元的情况下:
若该词条中的每个文本单元均存在一个匹配的候选文本单元,则将与该词条的每个文本单元匹配的候选文本单元组成的词条,确定为所述书写文本中内容书写正确的词条;
若该词条中有至少一个文本单元存在多个匹配的候选文本单元,则根据与该词条的每个文本单元匹配的候选文本单元的位置信息,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条。
可选的,所述根据与该词条的每个文本单元匹配的候选文本单元的位置信息,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条,包括:
由与该词条的每个文本单元匹配的候选文本单元组成多个候选词条;
根据每个候选词条中候选文本单元的位置信息,计算每个候选词条中相邻候选文本单元之间的距离;
根据每个候选词条中相邻候选文本单元之间的距离,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条。
可选的,所述书写评价方法还包括:
从所述书写文本识别结果中确定未包含所述书写文本中内容书写正确的部分中各文本单元的候选文本单元组;
将确定出的每个候选文本单元组中识别得分最高的候选文本单元,确定为所述书写文本中内容书写错误的部分。
可选的,所述书写评价方法还包括:
针对所述书写文本中内容书写正确的部分中的每个文本单元:
根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征;
根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确。
可选的,所述根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征,包括:
根据该文本单元的笔迹点数据,获取该文本单元中每个笔画的八方向链码特征和每个笔画的骨架特征;
针对该文本单元的每个笔画,将该笔画的八方向链码特征与该笔画的骨架特征融合,融合后特征作为该笔画的笔画特征。
可选的,所述根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确,包括:
针对该文本单元的每个笔画,计算该笔画的笔画特征与该笔画对应的标准笔画的笔画特征的相似度,作为该笔画对应的相似度;
若该文本单元的各笔画分别对应的相似度均大于预设的相似度阈值,则确定该文本单元的笔顺正确;
若该文本单元的笔画中有至少一个笔画对应的相似度小于预设的相似度阈值,则确定该文本单元的笔顺错误。
可选的,所述书写评价方法还包括:
基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔;
其中,所述连笔判别模型以训练文本单元为训练样本,以所述训练文本单元是否存在连笔的指示信息为样本标签训练得到。
可选的,所述基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔,包括:
针对所述书写文本中内容书写正确的部分中的每个文本单元:
对该文本单元提取以下特征中的一种或多种:笔画的拐点信息、笔画的笔迹点的总数量、笔画的区域质心、笔画的外接矩形信息、笔画的凸多边形区域、笔画的空洞个数;
将提取的特征输入所述连笔判别模型,得到所述连笔判别模型输出的指示该文本单元是否存在连笔的判别结果。
一种书写评价装置,包括:笔迹点数据获取模块、书写文本识别模块、匹配文本单元查找模块和书写内容评价模块;
所述笔迹点数据获取模块,用于获取目标对象根据指定听写内容进行书写的笔迹点数据;
所述书写文本识别模块,用于根据所述笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,所述书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为所述书写文本中一文本单元的候选识别结果;
所述匹配文本单元查找模块,用于从所述书写文本识别结果中查找与所述书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元;
所述书写内容评价模块,用于根据查找结果确定所述书写文本中内容书写正确的部分。
可选的,所述书写评价装置还包括:笔顺评价模块;
所述笔顺评价模块,用于针对所述书写文本中内容书写正确的部分中的每个文本单元,根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征,根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确。
可选的,所述书写评价装置还包括:连笔评价模块;
所述连笔评价模块,用于基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔;
其中,所述连笔判别模型以训练文本单元为训练样本,以所述训练文本单元是否存在连笔的指示信息为样本标签训练得到。
一种书写评价设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述任一项所述的书写评价方法的各个步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一项所述的书写评价方法的各个步骤。
经由上述方案可知,本申请提供的书写评价方法、装置、设备及存储介质,首先获取目标对象进行书写的笔迹点数据,然后根据笔迹点数据对书写文本进行识别,得到书写文本识别结果,接着从书写文本识别结果中查找与书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元,最后根据查找结果确定书写文本中内容书写正确的部分。本申请提供的书写评价方法可自动对目标对象书写的文本进行评价,由于不需要人工参与,避免了人工评价所带来的问题,此外,本申请从整个书写文本识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元,进而根据查找结果确定书写文本中内容书写正确的部分,这使得本申请不受书写位置和书写方向的影响,即目标对象可自由书写,用户体验较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的书写评价方法的一流程示意图;
图2为本申请实施例提供的书写评价方法的另一流程示意图;
图3为本申请实施例提供的根据标准笔迹点数据绘出的图片以及根据用户书写的笔迹点数据绘出的图片;
图4为本申请实施例提供的根据标准笔迹点数据绘出的图片以及根据用户书写的笔迹点数据绘出的图片;
图5为本申请实施例提供的书写评价方法的又一流程示意图;
图6为本申请实施例提供的书写评价装置的结构示意图;
图7为本申请实施例提供的书写评价设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
鉴于人工评价方案存在诸多缺陷,本案发明人试图提出一种自动评价方案,并为此进行了研究,起初的思路是:
采用基于图像识别的评价方案,即,首先获取书写者书写的背景图像,在书写者书写完成后,再获取书写内容图像,然后对比获取的两幅图像,以获得书写区域,接着根据预先定义好的书写方向对书写区域进行检测识别,以获得识别结果,最后基于预先定义好的听写顺序或预先定义好的书写方向,将识别结果与标准答案进行对比,从而获得最终的书写评价结果。
本案发明人通过研究发现,基于图像识别的评价方案要求书写者必须按预先定义好的书写方向进行书写,然而,受书写者年龄、书写习惯、书写状态、环境等因素的影响,书写内容存在多样性,这导致在对待评价的书写内容进行评价时,无法基于预先定义好的听写顺序或者预先定义好的书写方向进行评价,这意味着,上述方法要求书写者必须按照预先定义好的书写方向进行书写,若用户不按照预先定义好的书写方向进行书写,上述基于图像识别的评价方案针对书写内容给出的评价结果不准确。
鉴于上述基于图像识别的评价方案存在的缺陷,本案继续进行研究,通过研究,最终提出了一种效果较好的书写评价方法,该方法不但可自动进行书写评价,而且不受书写方向、书写位置的影响,即不管书写者按何种方向、在何位置书写,经由该方法都能获得比较准确的评价结果。本申请提供的书写评价方法可应用于具有数据处理能力的电子设备,该电子设备可以为网络侧的服务器,也可以为用户侧使用的终端,比如PC、笔记本、智能手机、学习机、学办机等。接下来通过下述实施例对本申请提供的书写评价方法进行介绍。
第一实施例
请参阅图1,示出了本申请实施例提供的书写评价方法的流程示意图,该方法可以包括:
步骤S101:获取目标对象进行书写的笔迹点数据。
可选的,目标对象进行书写的笔迹点数据可以为目标对象根据指定听写内容进行书写的笔迹点数据。其中,指定听写内容可以包括一个词条,也可以包括多个词条,每个词条可以但不限定为单字、短语、句子等,每个词条可以但不限为中文词条、外文词条(比如英文词条)、中外文词条(比如英文词条)等。
考虑到对书写内容进行拍照,无法记录书写过程,故本实施例采用笔迹点采集设备对目标对象书写过程中的笔迹点进行采集,从而获得书写内容对应的笔迹点数据。
在对书写过程中的笔迹点进行采集时,可按预设的采集频率进行采集,本实施例中的采集频率指的是每秒采集的笔迹点个数。经试验论证,当采集频率为50,即每秒采集50个笔迹点时,效果最佳,既可以节省存储,提升效率,又不影响识别结果,有鉴于此,本实施例优选为按采集频率50对书写过程中的笔迹点进行采集。
需要说明的是,对于每个独立的字符,其是由若干个笔画组成的,有鉴于此,笔迹点数据可以包括:每个笔画点(针对笔画采集的点)的坐标、每个笔画点对应的书写时间,每个笔画的起始标记(用0表示)和结束标记(用1表示)等。
步骤S102:根据笔迹点数据对书写文本进行识别,得到书写文本识别结果。
在本实施例中,可基于笔迹点数据和预先建立的书写文本识别模型,对书写文本进行识别,具体的,首先对笔迹点数据进行特征提取,然后将对笔迹点数据提取的特征输入预先建立的书写文本识别模型,以得到书写文本识别结果。可选的,本实施例中的书写文本识别模型可以但不限定为基于seq2seq和attention机制的模型。
需要说明的,步骤S102中的“书写文本识别结果”并非书写文本的最终识别结果,而是书写文本的候选识别结果。步骤S102中的“书写文本识别结果”包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为书写文本中一文本单元的候选识别结果,即一个候选文本单元组中的一个候选文本单元为书写文本中一文本单元的一个候选文本单元。示例性的,书写文本为“炊烟”,经步骤S102获得的书写文本识别结果可包括两个候选文本单元组,其中一个为“炊”的候选识别结果[炊、忻、烦、…],另一个为“烟”的候选识别结果[火因、烟、…]。
可选的,步骤S102中的“书写文本识别结果”还可以包括每个候选文本单元组中每个候选文本单元的位置信息,还可以包括每个候选文本单元组中每个候选文本单元的识别得分,一个候选文本单元的识别得分能够表征该候选文本单元为书写文本中的文本单元的可能性大小。
需要说明的是,步骤S102中的“书写文本识别结果”可以为上述书写文本识别模型输出的识别结果,也可为书写文本识别模型输出的识别结果中得分较高的识别结果,比如,书写文本识别模型输出S个候选文本单元组,每个候选文本单元组包括M个候选文本单元,在一种可能的实现方式中,可将文本识别模型输出的S个候选文本单元组直接作为步骤S102中的“书写识别结果”,在一种可能的实现方式中,可将书写文本识别模型输出的每个候选文本单元组中识别得分最高的N(N小于M)个候选文本单元组成候选文本单元组作为步骤S102中的“书写文本识别结果”,为了能够获得较高的评价效率,本实施例优选为后者。
步骤S103:从书写文本识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元。
若目标对象进行书写的笔迹点数据为目标对象根据指定听写内容进行书写的笔迹点数据,则本步骤中的“标准文本”为指定听写内容对应的标准答案。
考虑到在做听写练习时,关注的只是听写的内容,对于多写、涂抹、乱涂乱画等信息是不关注的,为此,本实施例从整个书写文本识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元。需要说明的是,与标准文本中一词条的一文本单元匹配的候选文本单元为,与标准文本中该词条的该文本单元一致的候选文本单元。
步骤S104:根据查找结果确定书写文本中内容书写正确的部分。
若以词条为最小评价对象,则本步骤根据查找结果确定书写文本中内容书写正确的词条,若以文本单元为最小评价对象,则本步骤根据查找结果确定书写文本中内容书写正确的文本单元。需要说明的是,词条书写正确指的是词条中的各文本单元均书写正确。
示例性的,目标对象书写的文本中包括两个词条,分别为词条1和词条2,其中,词条1包括2个文本单元,分别为文本单元11和文本单元12,词条2也包括2个文本单元,分别为文本单元21和文本单元22,假设词条1的两个文本单元的内容均书写正确,词条2的文本单元21的内容书写正确,而文本单元22的内容书写错误,若以词条为最小评价对象,则文本单元11和文本单元12组成的词条为书写文本中内容书写正确的部分,若以文本单元为最小评价对象,则文本单元11、文本单元12和文本单元21为书写文本中内容书写正确的部分。
经由上述步骤可获得书写文本中内容书写正确的部分,在某些场景中,除了需要获知书写文本中内容书写正确的部分之外,还需要获知书写文本中内容书写错误的部分,可以理解的是,书写文本中除去内容书写正确的部分,剩余部分便为内容书写错误的部分,由于经由步骤S102获得的书写文本识别结果并非书写文本的最终识别结果,而是书写文本的候选识别结果,因此,需要从经由步骤S102获得的书写文本识别结果中确定出书写文本中内容书写错误的部分,本实施例采用如下策略从经由步骤S102获得的书写文本识别结果中确定出书写文本中内容书写错误的部分:
从识别结果中确定未包含目标对象书写正确的部分中的文本单元的候选文本单元组,将确定出的每个候选文本单元组中识别得分最高的候选文本单元,确定为书写文本中内容书写错误的部分。
示例性的,经由步骤S102获得的书写文本识别结果包括6个候选文本单元组,分别为Z1、Z2、Z3、Z4、Z5、Z6,假设书写文本中内容书写正确的部分包括4个文本单元,这4个文本单元分别位于Z1、Z2、Z3、Z4中,则将Z5中得分最高的候选文本单元和Z6中得分最高的候选文本单元确定为书写文本中内容书写错误的部分。
本申请实施例提供的书写评价方法,首先获取目标对象根据指定听写内容进行书写的笔迹点数据,然后根据笔迹点数据对书写文本进行识别,得到识别结果,接着从识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元,最后根据查找结果确定目标对象书写的文本中内容书写正确的部分。本申请实施例提供的书写评价方法可自动对目标对象书写的文本进行评价,由于不需要人工参与,避免了人工评价所带来的问题,此外,本申请实施例从整个书写文本识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元,进而根据查找结果确定书写文本中内容书写正确的部分,这使得本申请实施例提供的书写评价方法不受书写位置和书写方向的影响,即用户可自由书写,用户体验较好。
第二实施例
本实施例对上述实施例中的“步骤S104:根据查找结果确定书写文本中内容书写正确的部分”进行介绍。
鉴于实际应用场景中,在对书写文本进行评价时,一般以词条为最小评价对象进行评价,本实施例对根据查找结果确定书写文本中内容书写正确的词条的具体实现过程进行介绍。
根据查找结果确定书写文本中内容书写正确的词条的实现过程可以包括:针对标准文本中每个词条,在查找到与该词条的每个文本单元匹配的候选文本单元的情况下,执行:
步骤a:若该词条中的每个文本单元均存在一个匹配的候选文本单元,则将与该词条的每个文本单元匹配的候选文本单元组成的词条确定为书写文本中内容书写正确的词条。
步骤b:若该词条中有至少一个文本单元存在多个匹配的候选文本单元,则根据与该词条的每个文本单元匹配的候选文本单元的位置信息,从与该词条的各文本单元匹配的候选文本单元中确定书写文本中内容书写正确的词条。
具体的,根据与该词条的每个文本单元匹配的候选文本单元的位置信息,从与该词条的每个文本单元匹配的候选文本单元中确定书写文本中内容书写正确的词条的过程可以包括:
步骤b1、由与该词条的每个文本单元匹配的候选文本单元组成多个候选词条。
示例性的,标准文本中的一个词条为“撩逗”,与“撩逗”中“撩”匹配的候选文本单元为pos11位置的“撩”,与“逗”匹配的候选文本单元为pos21位置的“逗”、pos22位置的“逗”和pos23位置的“逗”,由pos11位置的“撩”与pos21位置的“逗”、pos22位置的“逗”和pos23位置的“逗”可组成三个候选词条,分别为由pos11位置的“撩”与pos21位置的“逗”组成的“撩逗”、由pos11位置的“撩”与pos22位置的“逗”组成的“撩逗”,由pos11位置的“撩”与pos23位置的“逗”组成的“撩逗”。
步骤b2、根据每个候选词条中候选文本单元的位置信息,计算每个候选词条中相邻候选文本单元之间的距离。
其中,一个候选文本单元的位置信息可表示为[x,y,w,h],其中,x为候选文本单元的位置坐标点的横坐标,y为候选文本单元的位置坐标点的纵坐标,w为候选文本单元的宽度,h为候选文本单元的高度。
在本实施例中,可计算候选词条中相邻候选文本单元的左右间距dis_x作为步骤b2中“相邻候选文本单元之间的距离”,也可计算候选词条中相邻候选文本单元的上下间距dis_y作为步骤b2中“相邻候选文本单元之间的距离”,还可计算候选词条中相邻候选文本单元的中心点间距dis_c作为步骤b2中“相邻候选文本单元之间的距离”。为了后续能够更加准确地确定出书写文本中内容书写正确的部分,本实施例优选为计算候选词条中相邻候选文本单元的左右间距dis_x、上下间距dis_y和中心点间距dis_c中的至少两个间距(优选计算三个间距),然后将计算得到的两个或三个间距融合,融合后间距作为步骤b2中“相邻候选文本单元之间的距离”,其中,将计算得到的两个或三个间距融合的方式可以但不限定为加权求和,假设计算候选词条中相邻候选文本单元的左右间距dis_x、上下间距dis_y和中心点间距dis_c,则可按下式对三个间距进行融合:
dis=(dis_x*w_x)+(dis_y*w_y)+(dis_c*w_c)
其中,w_x为dis_x的加权系数,w_y为dis_y的加权系数,w_c为dis_c的加权系数,w_x、w_y和w_c满足w_x+w_y+w_c=1,可选的,w_x取0.2,w_y取0.2,w_c取0.6。
需要说明的是,相邻候选文本单元的左右间距,通过相邻候选文本单元的位置信息中的x确定,相邻候选文本单元的上下间距,通过相邻候选文本单元的位置信息中的y确定,相邻候选文本单元的中心点间距,通过相邻候选文本单元的位置信息中的w和h确定。需要说的是,在通过相邻候选文本单元的位置信息中的w和h确定相邻候选文本单元的中心点间距时,先根据相邻候选文本单元的位置信息中的w和h确定相邻候选文本单元的中心点,然后根据相邻候选文本单元的中心点确定相邻候选文本单元的中心点间距。
对于上述示例中由pos11位置的“撩”与pos21位置的“逗”组成的“撩逗”,根据“撩”的位置信息pos11[x11,y11,w11,h11]和“逗”的位置信息pos21[x21,y21,w21,h21],可计算pos11位置的“撩”与pos21位置的“逗”之间的距离,具体的,可根据x11和x21确定左右间距dis_x,根据y11和y21确定上下间距dis_y,根据w11和h11确定pos11位置的“撩”的中心点c11,并根据w21和h21确定pos21位置的“逗”的中心点c21,根据中心点c11和中心点c21确定中心间距dis_c。可选的,间距的计算方法可采用欧式距离。在获得pos11位置的“撩”与pos21位置的“逗”的左右间距dis_x、上下间距dis_y和中心点间距dis_c后,可按上式(1)将三个间距融合,融合后得到的间距即为由pos11位置的“撩”与pos21位置的“逗”组成的候选词条中相邻候选文本单元之间的距离。
步骤b2、根据每个候选词条中相邻候选文本单元之间的距离,从多个候选词条中确定书写文本中内容书写正确的词条。
若多个候选词条中的每个候选词条只包含两个文本单元,则将相邻候选文本单元之间的距离最小的候选词条确定为目标对象书写正确的词条;若多个候选词条中的每个候选词条包含两个以上的文本单元,则针对每个候选词条,将相邻候选文本单元之间的距离求和,求和后距离作为目标距离,以得到每个候选词条的目标距离,将目标距离最小的候选词条确定为目标对象书写正确的词条。
针对标准文本中每个词条,上述步骤a和步骤b是在查找到与该词条的每个文本单元匹配的候选文本单元的情况下执行的,需要说的是,若未查找到与标准文本中该词条的各文本单元匹配的候选文本单元,或者,只查到与标准文本中该词条的部分文本单元匹配的候选文本单元,则可确定书写文本中与标准文本中该词条对应的部分书写错误。
另外,需要说明的是,本实施例可在每针对标准文本中的一词条,确定出书写文本中内容书写正确的词条后,将确定出的内容书写正确的词条中的文本单元从书写文本识别结果中去除,以便针对标准文本中的下一词条中的文本单元查找匹配的候选文本单元时,不再与已确定出的内容书写正确的词条中的文本单元进行匹配计算,从而提高书写评价效率。
示例性的,标准文本中包括两个词条,分别为词条1和词条2,假设两个词条均包含两个文本单元,书写文本识别结果包括4个候选文本单元组,分别为Z1、Z2、Z3、Z4,每个候选文本单元组均包括4个候选文本单元,首先针对词条1的文本单元11和文本单元12在4个候选文本单元组(即16个候选文本单元)中查找匹配的候选文本单元,假设在Z1中找到与文本单元11匹配的候选文本单元,在Z2中找到与文本单元12匹配的候选文本单元,通过上述步骤a或步骤b最终确定书写文本中内容书写正确的词条为由Z1中的候选文本单元z11和Z2中的候选文本单元z22组成的词条,为了提高文本评价效率,可将z11从Z1中删除,将z22从Z2中删除,如此在针对词条2中的文本单元查找匹配的候选文本单元时,只需从14个候选文本单元中查找。
第三实施例
经由上述实施例提供的书写评价方法可确定书写文本中内容书写正确的部分,可以理解的是,对于一个文本单元,内容书写正确并不意味着该文本单元书写正确,每个文本单元的笔顺是有一定标准的,内容书写正确的文本单元笔顺不一定正确,有鉴于此,本申请实施例提供了另一种书写评价方法,请参阅图2,示出了该书写评价方法的流程示意图,可以包括:
步骤S201:获取目标对象根进行书写的笔迹点数据。
步骤S202:根据笔迹点数据对书写文本进行识别,得到书写文本识别结果。
步骤S203:从书写识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元。
步骤S204:根据查找结果确定书写文本中内容书写正确的部分。
步骤S201~步骤S204的具体实现过程和相关解释说明可参阅上述第一实施例和第二实施例,本实施例在此不做赘述。
步骤S205:确定书写文本中内容书写正确的部分中每个文本单元的书写笔顺是否正确。
具体的,确定书写文本中内容书写正确的部分中每个文本单元的书写笔顺是否正确的过程可以包括:
针对书写文本中内容书写正确的部分中的每个文本单元,执行:
步骤S2051、根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征。
在一种可能的实现方式中,可根据该文本单元的笔迹点数据,获取该文本单元中各笔画的八方向链码特征,作为该文本单元中各笔画的笔画特征,在另一种可能的实现方式中,可根据该文本单元的笔迹点数据,获取该文本单元中各笔画的骨架特征,作为该文本单元中各笔画的笔画特征,在再一种可能的实现方式中,可根据该文本单元的笔迹点数据,获取该文本单元中各笔画的八方向链码特征和骨架特征,将每个笔画的八方向链码特征与骨架特征融合,融合后特征作为笔画特征,以得到该文本单元中各笔画的笔画特征。为了能够获得更为准确地评价结果,本实施例优选第三种实现方式。其中,一个笔画的八方向链码特征为该笔画的中心点的八方向链码特征,中心点的八方向链码特征能够表征中心点的八个预设方向上是否有笔迹点,一笔画的骨架特征可用该笔画的拐点信息表示。
步骤S2052、根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确。
其中,该文本单元中各笔画分别对应的标准笔画的笔画特征的确定方式为:从预先构建的标准笔迹数据库中获取该文本单元中各笔画分别对应的标准笔画的笔迹点数据,根据该文本单元中各笔画分别对应的标准笔画的笔迹点数据,获取该文本单元中各笔画分别对应的标准笔画的笔画特征。获取该文本单元中各笔画分别对应的标准笔画的笔画特征的方式与上述获取该文本单元中各笔画的笔画特征的方式相同。需要说明的是,标准笔迹数据库包括多个文本单元的标准笔迹点数据,一文本单元的标准笔迹点数据为按标准的书写笔画顺序书写该文本单元的笔迹点数据。
根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确的过程可以包括:针对该文本单元的每个笔画,计算该笔画的笔画特征与该笔画对应的标准笔画的笔画特征的相似度,作为该笔画对应的相似度;若该文本单元的各笔画分别对应的相似度均大于预设的相似度阈值,则确定该文本单元的笔顺正确;若该文本单元的笔画中有至少一个笔画对应的相似度小于预设的相似度阈值,则确定该文本单元的笔顺错误。
图3中的(a)图示出了根据标准笔迹点数据绘出的图片,图3中的(b)图示出了根据用户书写的笔迹点数据绘出的图片,由于用户书写的各个笔画的笔画特征分别与对应的标准笔画的笔画特征的相似度均大于预设的相似度阈值,因此,用户的书写笔顺正确,图4中的(a)图示出了根据标准笔迹点数据绘出的图片,图4中的(b)图示出了根据用户书写的笔迹点数据绘出的图片,由图4中的(a)图可以看出,“我”的第六个笔画应为撇,第七个笔画应为点,而图4中的(b)图中第六个笔画为点,第七个笔画为撇,由于书写的第六个笔画的笔画特征以及书写的第七个笔画的笔画特征分别与对应的标准笔画的笔画特征的相似度小于预设的相似度阈值,因此,用户的书写笔顺错误。
本申请实施例提供的书写评价方法,首先获取目标对象进行书写的笔迹点数据,然后根据笔迹点数据对书写文本进行识别,得到书写文本识别结果,接着从书写文本识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元,然后根据查找结果确定书写文本中内容书写正确的部分,最后确定书写文本中内容书写正确的部分中每个文本单元的书写笔顺是否正确。本申请实施例提供的书写评价方法不但可确定用户书写的文本中内容书写正确的部分,还能确定内容书写正确的部分中书写笔顺正确的文本单元。本申请实施例提供的书写评价方法可自动对目标对象书写的文本进行评价,由于不需要人工参与,避免了人工评价所带来的问题,此外,本申请实施例提供的书写评价方法不受书写位置和书写方向的影响,这使得用户可以自由书写,用户体验较好。
第四实施例
在某些应用场景中,可能还需要对用户书写的文本单元是否存在连笔进行评价,有鉴于此,本申请实施例提供了另一种书写评价方法,请参阅图5,示出了该书写评价方法的流程示意图,可以包括:
步骤S501:获取目标对象进行书写的笔迹点数据。
步骤S502:根据笔迹点数据对书写文本进行识别,得到书写文本识别结果。
步骤S503:从书写识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元。
步骤S504:根据查找结果确定书写文本中内容书写正确的部分。
步骤S501~步骤S504的具体实现过程和相关解释说明可参阅上述第一实施例和第二实施例,本实施例在此不做赘述。
步骤S505:确定书写文本中内容书写正确的部分中的每个文本单元是否存在连笔。
可以理解的是,只有内容书写正确的文本单元才有进行连笔判别的意义。
具体的,确定书写文本中内容书写正确的部分中的每个文本单元是否存在连笔的实现过程包括:基于预先建立的连笔判别模型,判别书写文本中内容书写正确的部分中的每个文本单元是否存在连笔。
更为具体的,基于预先建立的连笔判别模型,判别书写文本中内容书写正确的部分中的每个文本单元是否存在连笔的过程可以包括:针对书写文本中内容书写正确的部分中的每个文本单元,对该文本单元提取以下特征中的一种或多种:笔画的拐点信息、每个笔画的笔迹点的总数量、笔画的区域质心、笔画的外接矩形信息、笔画的凸多边形区域、笔画的空洞个数;将提取的特征输入连笔判别模型,得到连笔判别模型输出的指示该文本单元是否存在连笔的判别结果。
本案发明人在实现本案的过程中发现:存在连笔书写的文本单元的笔画数量一般比标准文本单元的笔画数量少;连笔书写一般是从前向后进行连笔;已知传统的汉字基本笔画有八种,即“点、横、竖、撇、捺、提、折、钩”;假设一个笔画只提取其拐点信息,其起始位置由空心圆表示,结束位置由实心圆表示,中间的拐点采用虚心圆表示,点与点之间的链接采用画线的形式进行连接,则八种笔画中只有折、钩会存在三个拐点;理论上连笔的书写,可以从起始位置任意的进行连接到接下来的笔画。在上述发现的基础上,本案发明人提出,针对待判别连笔的文本单元,可提取笔画的拐点信息、笔画的笔迹点的总数量、笔画的区域质心、笔画的外接矩形信息、笔画的凸多边形区域、笔画的空洞个数,从而以这些特征为判别依据判别文本单元是否存在连笔。需要说明的是,之所以利用上述的特征进行连笔判别,是因为正常笔画的上述特征,比如笔画的外接矩形,笔画的区域质心,笔画的凸多边形区域等都有一定的规律,较为规范,而在随意连笔时,这些特征会被打乱。
本实施例中的连笔判别模型以训练数据集中的训练文本单元为训练样本,以训练文本单元是否存在连笔的指示信息为样本标签训练得到。具体的,连笔判别模型的训练过程可以包括:从训练数据集中获取训练文本单元,对获取的训练文本单元提取特征,将提取的特征输入连笔判别模型,以得到连笔判别模型输出的连笔判别结果,根据连笔判别模型输出的连笔判别结果和输入的训练文本单元的样本标签确定连笔判别模型的预测损失,根据连笔判别模型的预测损失更新连笔判别模型的参数,按前述过程进行多次迭代训练,直至满足训练结束条件。为了获得较好的训练效果,可使训练数据集中正样本与负样本的比列为1:7,其中,正样本为不存在连笔的训练文本单元,负样本为存在连笔的训练文本单元,可选的,连笔判别模型可以但不限定为由空间变换网络STN和双向循环神经网络组成的神经网络模型。
需要说明的是,本实施例提供的书写评价方式是在确定出书写文本中内容书写正确的部分后,对书写文本中内容书写正确的部分中的每个文本单元进行连笔判别。在另一实施例中,在确定出书写文本中内容书写正确的部分后,可先对内容书写正确的部分中的每个文本单元进行书写笔顺正确与否的判别,然后再对书写笔顺正确的文本单元进行连笔判别。
本申请实施例提供的书写评价方法,首先获取目标对象根据指定听写内容进行书写的笔迹点数据,然后根据笔迹点数据对书写文本进行识别,得到书写文本识别结果,接着从书写文本识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元,然后根据查找结果确定书写文本中内容书写正确的部分,最后对书写文本中内容书写正确的部分中的每个文本单元进行连笔判别。本申请实施例提供的书写评价方法不但可确定用户书写的文本中内容书写正确的部分,还能确定出内容书写正确的部分中的每个文本单元是否存在连笔。本申请实施例提供的书写评价方法可自动对目标对象书写的文本进行评价,由于不需要人工参与,避免了人工评价所带来的问题,此外,本申请实施例提供的书写评价方法不受书写位置和书写方向的影响,这使得用户可以自由书写,用户体验较好。
第五实施例
本申请实施例还提供了一种书写评价装置,下面对本申请实施例提供的书写评价装置进行描述,下文描述的书写评价装置与上文描述的书写评价方法可相互对应参照。
请参阅图6,示出了本申请实施例提供的书写评价装置的结构示意图,可以包括:包括:笔迹点数据获取模块601、书写文本识别模块602、匹配文本单元查找模块603和书写内容评价模块604。
笔迹点数据获取模块601,用于获取目标对象根据指定听写内容进行书写的笔迹点数据。
书写文本识别模块602,用于根据所述笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,所述书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为所述书写文本中一文本单元的候选识别结果。
匹配文本单元查找模块603,用于从所述书写文本识别结果中查找与所述书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元。
书写内容评价模块604,用于根据查找结果确定所述书写文本中内容书写正确的部分。
可选的,所书写文本识别结果还包括:每个候选文本单元的位置信息;
所述匹配文本单元查找模块,具体用于针对所述标准文本中每个词条,在查找到与该词条的每个文本单元匹配的候选文本单元的情况下:
若该词条中的每个文本单元均存在一个匹配的候选文本单元,则将与该词条的每个文本单元匹配的候选文本单元组成的词条,确定为所述书写文本中内容书写正确的;若该词条中有至少一个文本单元存在多个匹配的候选文本单元,则根据与该词条的每个文本单元匹配的候选文本单元的位置信息,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条。
可选的,匹配文本单元查找模块603在根据与该词条的每个文本单元匹配的候选文本单元的位置信息,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条时,具体用于:
由与该词条的每个文本单元匹配的候选文本单元组成多个候选词条,根据每个候选词条中候选文本单元的位置信息,计算每个候选词条中相邻候选文本单元之间的距离,根据每个候选词条中相邻候选文本单元之间的距离,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条。
可选的,书写内容评价模块604,还用于从所述书写文本识别结果中确定未包含所述书写文本中内容书写正确的部分中各文本单元的候选文本单元组,将确定出的每个候选文本单元组中识别得分最高的候选文本单元,确定为所述书写文本中内容书写错误的部分。
可选的,本申请实施例提供的书写评价装置还可以包括:笔顺评价模块;
所述笔顺评价模块,用于针对所述书写文本中内容书写正确的部分中的每个文本单元,根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征,根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确。
可选的,所述笔顺评价模块在根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征时,具体用于:
根据该文本单元的笔迹点数据,获取该文本单元中每个笔画的八方向链码特征和每个笔画的骨架特征;针对该文本单元的每个笔画,将该笔画的八方向链码特征与该笔画的骨架特征融合,融合后特征作为该笔画的笔画特征。
可选的,所述笔顺评价模块在根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确时,具体用于:
针对该文本单元的每个笔画,计算该笔画的笔画特征与该笔画对应的标准笔画的笔画特征的相似度,作为该笔画对应的相似度;若该文本单元的各笔画分别对应的相似度均大于预设的相似度阈值,则确定该文本单元的笔顺正确;若该文本单元的笔画中有至少一个笔画对应的相似度小于预设的相似度阈值,则确定该文本单元的笔顺错误。
可选的,本申请实施例提供的书写评价装置还可以包括:连笔评价模块;
所述连笔评价模块,用于基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔。其中,所述连笔判别模型以训练文本单元为训练样本,以所述训练文本单元是否存在连笔的指示信息为样本标签训练得到。
可选的,连笔评价模块在基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔时,具体用于:
针对所述书写文本中内容书写正确的部分中的每个文本单元:对该文本单元提取以下特征中的一种或多种:笔画的拐点信息、笔画的笔迹点的总数量、笔画的区域质心、笔画的外接矩形信息、笔画的凸多边形区域、笔画的空洞个数;将提取的特征输入所述连笔判别模型,得到所述连笔判别模型输出的指示该文本单元是否存在连笔的判别结果。
本申请实施例提供的书写评价装置,首先获取目标对象根据指定听写内容进行书写的笔迹点数据,然后根据笔迹点数据对书写文本进行识别,得到识别结果,接着从识别结果中查找与标准文本中每个词条的每个文本单元匹配的候选文本单元,最后根据查找结果确定书写文本中内容书写正确的部分,在确定出书写文本中内容书写正确的部分后,还可判别书写文本中内容书写正确的部分中的每个文本单元的笔顺是否正确,也判别书写文本中内容书写正确的部分中的每个文本单元是否存在连笔。本申请实施例提供的书写评价装置可自动对目标对象书写的文本进行评价,由于不需要人工参与,避免了人工评价所带来的问题,此外,本申请实施例不受书写位置和书写方向的影响,这使得用户可以自由书写,用户体验较好。
第六实施例
本申请实施例还提供了一种书写评价设备,请参阅图7,示出了该书写评价的结构示意图,该书写评价可以包括:至少一个处理器701,至少一个通信接口702,至少一个存储器703和至少一个通信总线704;
在本申请实施例中,处理器701、通信接口702、存储器703、通信总线704的数量为至少一个,且处理器701、通信接口702、存储器703通过通信总线704完成相互间的通信;
处理器701可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器703可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取目标对象进行书写的笔迹点数据;
根据所述笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,所述书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为所述书写文本中一文本单元的候选识别结果;
从所述书写文本识别结果中查找与所述书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元;
根据查找结果确定所述书写文本中内容书写正确的部分。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
第七实施例
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获取目标对象进行书写的笔迹点数据;
根据所述笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,所述书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为所述书写文本中一文本单元的候选识别结果;
从所述书写文本识别结果中查找与所述书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元;
根据查找结果确定所述书写文本中内容书写正确的部分。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (13)
1.一种书写评价方法,其特征在于,包括:
获取目标对象进行书写的笔迹点数据;
根据所述笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,所述书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为所述书写文本中一文本单元的候选识别结果;
从所述书写文本识别结果中查找与所述书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元;
根据查找结果确定所述书写文本中内容书写正确的部分;
所述书写文本识别结果还包括:每个候选文本单元的位置信息;
所述根据查找结果确定所述书写文本中内容书写正确的部分,包括:
针对所述标准文本中每个词条,在查找到与该词条的每个文本单元匹配的候选文本单元的情况下:
若该词条中有至少一个文本单元存在多个匹配的候选文本单元,则由与该词条的每个文本单元匹配的候选文本单元组成多个候选词条;
根据每个候选词条中候选文本单元的位置信息,计算每个候选词条中相邻候选文本单元之间的距离;
根据每个候选词条中相邻候选文本单元之间的距离,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条。
2.根据权利要求1所述的书写评价方法,其特征在于,
针对所述标准文本中每个词条,在查找到与该词条的每个文本单元匹配的候选文本单元的情况下,所述方法还包括:
若该词条中的每个文本单元均存在一个匹配的候选文本单元,则将与该词条的每个文本单元匹配的候选文本单元组成的词条,确定为所述书写文本中内容书写正确的词条。
3.根据权利要求1~2中任意一项所述的书写评价方法,其特征在于,还包括:
从所述书写文本识别结果中确定未包含所述书写文本中内容书写正确的部分中各文本单元的候选文本单元组;
将确定出的每个候选文本单元组中识别得分最高的候选文本单元,确定为所述书写文本中内容书写错误的部分。
4.根据权利要求1~2中任意一项所述的书写评价方法,其特征在于,还包括:
针对所述书写文本中内容书写正确的部分中的每个文本单元:
根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征;
根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确。
5.根据权利要求4所述的书写评价方法,其特征在于,所述根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征,包括:
根据该文本单元的笔迹点数据,获取该文本单元中每个笔画的八方向链码特征和每个笔画的骨架特征;
针对该文本单元的每个笔画,将该笔画的八方向链码特征与该笔画的骨架特征融合,融合后特征作为该笔画的笔画特征。
6.根据权利要求4所述的书写评价方法,其特征在于,所述根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确,包括:
针对该文本单元的每个笔画,计算该笔画的笔画特征与该笔画对应的标准笔画的笔画特征的相似度,作为该笔画对应的相似度;
若该文本单元的各笔画分别对应的相似度均大于预设的相似度阈值,则确定该文本单元的笔顺正确;
若该文本单元的笔画中有至少一个笔画对应的相似度小于预设的相似度阈值,则确定该文本单元的笔顺错误。
7.根据权利要求1~2中任一项所述的书写评价方法,其特征在于,还包括:
基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔;
其中,所述连笔判别模型以训练文本单元为训练样本,以所述训练文本单元是否存在连笔的指示信息为样本标签训练得到。
8.根据权利要求7所述的书写评价方法,其特征在于,所述基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔,包括:
针对所述书写文本中内容书写正确的部分中的每个文本单元:
对该文本单元提取以下特征中的一种或多种:笔画的拐点信息、笔画的笔迹点的总数量、笔画的区域质心、笔画的外接矩形信息、笔画的凸多边形区域、笔画的空洞个数;
将提取的特征输入所述连笔判别模型,得到所述连笔判别模型输出的指示该文本单元是否存在连笔的判别结果。
9.一种书写评价装置,其特征在于,包括:笔迹点数据获取模块、书写文本识别模块、匹配文本单元查找模块和书写内容评价模块;
所述笔迹点数据获取模块,用于获取目标对象根据指定听写内容进行书写的笔迹点数据;
所述书写文本识别模块,用于根据所述笔迹点数据对书写文本进行识别,得到书写文本识别结果,其中,所述书写文本识别结果包括至少一个候选文本单元组,一个候选文本单元组包括多个候选文本单元,一个候选文本单元组为所述书写文本中一文本单元的候选识别结果;
所述匹配文本单元查找模块,用于从所述书写文本识别结果中查找与所述书写文本对应的标准文本中每个词条的每个文本单元匹配的候选文本单元;
所述书写内容评价模块,用于根据查找结果确定所述书写文本中内容书写正确的部分;
所述书写文本识别结果还包括:每个候选文本单元的位置信息;
所述书写内容评价模块具体用于:
针对所述标准文本中每个词条,在查找到与该词条的每个文本单元匹配的候选文本单元的情况下:
若该词条中有至少一个文本单元存在多个匹配的候选文本单元,则由与该词条的每个文本单元匹配的候选文本单元组成多个候选词条;
根据每个候选词条中候选文本单元的位置信息,计算每个候选词条中相邻候选文本单元之间的距离;
根据每个候选词条中相邻候选文本单元之间的距离,从与该词条的每个文本单元匹配的候选文本单元中确定所述书写文本中内容书写正确的词条。
10.根据权利要求9所述的书写评价装置,其特征在于,还包括:笔顺评价模块;
所述笔顺评价模块,用于针对所述书写文本中内容书写正确的部分中的每个文本单元,根据该文本单元的笔迹点数据,获取该文本单元中各笔画的笔画特征,根据该文本单元中各笔画的笔画特征,以及该文本单元中各笔画分别对应的标准笔画的笔画特征,确定该文本单元的笔顺是否正确。
11.根据权利要求9所述的书写评价装置,其特征在于,还包括:连笔评价模块;
所述连笔评价模块,用于基于预先建立的连笔判别模型,判别所述书写文本中内容书写正确的部分中的每个文本单元是否存在连笔;
其中,所述连笔判别模型以训练文本单元为训练样本,以所述训练文本单元是否存在连笔的指示信息为样本标签训练得到。
12.一种书写评价设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~8中任一项所述的书写评价方法的各个步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~8中任一项所述的书写评价方法的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110700266.7A CN113420983B (zh) | 2021-06-23 | 2021-06-23 | 一种书写评价方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110700266.7A CN113420983B (zh) | 2021-06-23 | 2021-06-23 | 一种书写评价方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113420983A CN113420983A (zh) | 2021-09-21 |
CN113420983B true CN113420983B (zh) | 2024-04-12 |
Family
ID=77717550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110700266.7A Active CN113420983B (zh) | 2021-06-23 | 2021-06-23 | 一种书写评价方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113420983B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113903045A (zh) * | 2021-10-22 | 2022-01-07 | 华中师范大学 | 一种手写汉字图像的笔顺识别方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05174187A (ja) * | 1991-12-25 | 1993-07-13 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
US9037967B1 (en) * | 2014-02-18 | 2015-05-19 | King Fahd University Of Petroleum And Minerals | Arabic spell checking technique |
CN109697905A (zh) * | 2017-10-20 | 2019-04-30 | 深圳市鹰硕技术有限公司 | 一种试卷批阅系统 |
CN110363194A (zh) * | 2019-06-17 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 基于nlp的智能阅卷方法、装置、设备及存储介质 |
CN111523455A (zh) * | 2020-04-22 | 2020-08-11 | 北京易文汉学科技有限公司 | 汉字书写的评价方法 |
CN111638807A (zh) * | 2020-04-29 | 2020-09-08 | 上海元趣信息技术有限公司 | 一种基于智能手写笔的学习辅助系统 |
CN112307748A (zh) * | 2020-03-02 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 用于处理文本的方法和装置 |
CN112487897A (zh) * | 2020-11-18 | 2021-03-12 | 深圳市鹰硕教育服务有限公司 | 笔迹内容评价方法、装置及电子设备 |
CN112990176A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI676919B (zh) * | 2018-08-02 | 2019-11-11 | 義守大學 | 一種電腦化寫字評估與訓練方法 |
-
2021
- 2021-06-23 CN CN202110700266.7A patent/CN113420983B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05174187A (ja) * | 1991-12-25 | 1993-07-13 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
US9037967B1 (en) * | 2014-02-18 | 2015-05-19 | King Fahd University Of Petroleum And Minerals | Arabic spell checking technique |
CN109697905A (zh) * | 2017-10-20 | 2019-04-30 | 深圳市鹰硕技术有限公司 | 一种试卷批阅系统 |
CN110363194A (zh) * | 2019-06-17 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 基于nlp的智能阅卷方法、装置、设备及存储介质 |
CN112307748A (zh) * | 2020-03-02 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 用于处理文本的方法和装置 |
CN111523455A (zh) * | 2020-04-22 | 2020-08-11 | 北京易文汉学科技有限公司 | 汉字书写的评价方法 |
CN111638807A (zh) * | 2020-04-29 | 2020-09-08 | 上海元趣信息技术有限公司 | 一种基于智能手写笔的学习辅助系统 |
CN112487897A (zh) * | 2020-11-18 | 2021-03-12 | 深圳市鹰硕教育服务有限公司 | 笔迹内容评价方法、装置及电子设备 |
CN112990176A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
Non-Patent Citations (4)
Title |
---|
A study of the usability of handwriting recognition for text entry by children;Janet C. Read;Interacting with Computers;第19卷(第1期);57-69 * |
兼顾连笔和笔顺的联机手写汉字识别方法;征荆, 丁晓青, 吴佑寿, 郭繁夏;清华大学学报(自然科学版)(第09期);全文 * |
几何信息与SIFT特征相结合的特定人手写关键词检测;张文超;吕岳;文颖;黄志敏;智能系统学报(第05期);全文 * |
郭军编著.《智能信息技术》.北京邮电大学出版社,1999,第72-74页. * |
Also Published As
Publication number | Publication date |
---|---|
CN113420983A (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304876B (zh) | 分类模型训练方法、装置及分类方法及装置 | |
KR101145986B1 (ko) | 세그먼트화-기반 인식 | |
CN104463101B (zh) | 用于文字性试题的答案识别方法及系统 | |
CN107305630B (zh) | 文本序列识别方法和装置 | |
CN111753767A (zh) | 一种作业自动批改的方法、装置、电子设备和存储介质 | |
CN107622271B (zh) | 手写文本行提取方法及系统 | |
CN111898642B (zh) | 关键点检测方法、装置、电子设备及存储介质 | |
CN103415825A (zh) | 用于手势识别的系统和方法 | |
CN104794485B (zh) | 一种识别书写字的方法及装置 | |
CN107644105A (zh) | 一种搜题方法及装置 | |
CN112651323B (zh) | 一种基于文本行检测的中文手写体识别方法及系统 | |
CN102663454A (zh) | 一种字符书写规范度评测的方法和装置 | |
CN111340020A (zh) | 一种公式识别方法、装置、设备及存储介质 | |
CN111753120A (zh) | 一种搜题的方法、装置、电子设备和存储介质 | |
CN112036362A (zh) | 图像处理方法、装置、计算机设备和可读存储介质 | |
CN113420983B (zh) | 一种书写评价方法、装置、设备及存储介质 | |
CN109472257B (zh) | 一种字符版面确定方法及装置 | |
CN113936181A (zh) | 一种粘连手写英文字符的识别方法 | |
CN110443577A (zh) | 一种基于人脸识别的校园考勤系统 | |
CN108230322B (zh) | 一种基于弱样本标记的眼底特征检测装置 | |
CN110008902B (zh) | 一种融合基本特征和形变特征的手指静脉识别方法及系统 | |
CN110222645B (zh) | 一种手势误识特征发现方法 | |
JP7293658B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN111652204B (zh) | 目标文本区域选择的方法、装置、电子设备和存储介质 | |
CN110533035B (zh) | 基于文本匹配的学生作业页码识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |