CN107507161B - 一种书写整洁度的评价方法及系统 - Google Patents

一种书写整洁度的评价方法及系统 Download PDF

Info

Publication number
CN107507161B
CN107507161B CN201610423085.3A CN201610423085A CN107507161B CN 107507161 B CN107507161 B CN 107507161B CN 201610423085 A CN201610423085 A CN 201610423085A CN 107507161 B CN107507161 B CN 107507161B
Authority
CN
China
Prior art keywords
writing
feature
lines
proportion
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610423085.3A
Other languages
English (en)
Other versions
CN107507161A (zh
Inventor
吴爱红
戴文娟
竺博
魏思
胡郁
刘庆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201610423085.3A priority Critical patent/CN107507161B/zh
Publication of CN107507161A publication Critical patent/CN107507161A/zh
Application granted granted Critical
Publication of CN107507161B publication Critical patent/CN107507161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种书写整洁度的评价方法及系统,该方法包括:预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;获取待评价书写图像;获取待评价书写图像中各书写区域的灰度图;从各灰度图中提取书写整洁度特征;将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。本发明提供的方法由于该书写整洁度特征能反映书写的整洁度信息,并且可以由计算机自动提取,使得本发明可以自动获取书写整洁度得分,且该书写整洁度得分客观公正。

Description

一种书写整洁度的评价方法及系统
技术领域
本发明涉及图像处理和教育信息化领域,具体涉及一种书写整洁度的评价方法及系统。
背景技术
随着计算机科学与技术的发展,自动化信息处理能力和水平也得到了显著的提高。教育模式也一步步向信息自动化方向发展,自动阅卷系统的出现将人从繁重的机械劳动中解放出来。机器阅卷不仅有利于对学生的成绩做出客观公正的评价,而且阅卷的结果容易保存、统计和查询。机器阅卷是智能化时代的必然趋势,但同时也存在一些不足,例如机器阅卷抹去了书写整洁度的因素:不同整洁程度的书写统一转写成文本格式,再根据文本进行批阅打分。然而,通过对书写整洁度的考核来提高学生的书写整洁度,也是对教育的一种要求。现有技术中,书写整洁度的评价是由人工进行评价,例如,人工阅卷给出的得分通常综合考虑了书写整洁度的影响,但是,人工评价过程中主观性较强、效率较低;此外,人工进行书写整洁度评价的准确性、公平性、稳定性等也有待提升。
发明内容
本发明实施例提供一种书写整洁度的评价方法及系统,以解决现有技术中机器阅卷忽略了书写整洁度影响因素的问题。
为此,本发明实施例提供如下技术方案:
一种书写整洁度的评价方法,包括:
预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;
获取待评价书写图像;
获取待评价书写图像中各书写区域的灰度图;
从各灰度图中提取书写整洁度特征;
将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
优选地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。
优选地,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
优选地,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
优选地,所述涂抹特征还包括:多涂画比例特征;
所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
优选地,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
优选地,所述预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型包括:
收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
提取所述训练数据各书写区域的灰度图的书写整洁度特征;
根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
优选地,所述方法还包括:
当所述待评价书写图像为考试内容,利用所述书写整洁度得分对试卷考试得分进行调整。
一种书写整洁度的评价系统,包括:
模型构建模块,用于预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;
图像获取模块,用于获取待评价书写图像;
灰度图获取模块,用于获取待评价书写图像中各书写区域的灰度图;
特征提取模块,用于从各灰度图中提取书写整洁度特征;
评价模块,用于将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
优选地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。
优选地,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
优选地,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
优选地,所述涂抹特征还包括:多涂画比例特征;
所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
优选地,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
优选地,所述模型构建模块包括:
数据收集单元,用于收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
特征提取单元,用于提取所述训练数据各书写区域的灰度图的书写整洁度特征;
模型训练单元,用于根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
优选地,当所述待评价书写图像为考试内容,所述系统还包括:
得分调整模块,用于利用所述书写整洁度得分对试卷考试得分进行调整。
本发明实施例提供的书写整洁度的评价方法及系统,从待评价书写图像中各书写区域的灰度图中提取出书写整洁度特征,然后利用预先构建的整洁度评价模型得到书写整洁度得分。由于该书写整洁度特征能反映书写的整洁度情况,并且可以由计算机自动提取,最终将所述书写整洁度特征输入所述整洁度评价模型,自动得到书写整洁度得分,且该书写整洁度得分客观公正。
进一步地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。上述特征能从多角度有效的反映书写整洁度,从而保证了最终获取的书写整洁度得分的客观准确度。
进一步地,本发明还提供了插入行特征、涂抹特征和粘连特征的子特征,并且给出了各子特征的定义,以便于计算机自动提取上述子特征,最终由计算机自动获取书写整洁度得分。
进一步地,本发明还提供了整洁度评价模型的构建方法,通过该方法可以构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型,以便于计算机利用该模型自动获取书写整洁度得分。
进一步地,本发明还提供了获取待评价书写图像中各书写区域的灰度图的方法,根据预先获取的书写位置信息,能准确有效的获取待评价书写图像中各书写区域子图像,以便于准确获取各书写区域子图像的灰度图。
进一步地,本发明还可以利用所述书写整洁度得分对试卷考试得分进行调整。解决了现有技术中机器阅卷忽略了书写整洁度影响因素的问题,使得机器阅卷给出的试卷考试得分能综合考虑书写整洁度影响因素。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的书写整洁度的评价方法的一种流程图;
图2(a)是现有技术中具有插入行的待评价书写图像的示意图;
图2(b)是现有技术中具有涂抹的待评价书写图像的示意图;
图2(c)是现有技术中具有粘连联通体的待评价书写图像的示意图;
图3(a)至图3(b)是本发明实施例提供的提取插入行的过程示意图;
图4(a)至图4(b)是本发明实施例提供的检测涂抹的过程示意图;
图5(a)至图5(b)是本发明实施例提供的从英语书写区域内提取粘连联通体的过程示意图;
图6(a)至图6(b)是现有技术中单线涂抹的示意图;
图6(c)至图6(d)是现有技术中多线涂抹的示意图;
图6(e)至图6(f)是现有技术中严实涂抹的示意图;
图7(a)至图7(b)是本发明实施例提供的中文书写区域内提取涂抹的过程示意图;
图8是本发明实施例提供的构建整洁度评价模型的方法的一种流程图;
图9是本发明实施例提供的书写整洁度的评价系统的一种结构示意图;
图10是本发明实施例提供的模型构建模块的一种结构示意图。
图11是本发明实施例提供的书写整洁度的评价系统的另一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明作进一步的详细说明。以下实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明提供的书写整洁度的评价方法及系统,获取待评价书写图像中各书写区域的灰度图,然后从各灰度图中提取书写整洁度特征,最后将提取的书写整洁度特征输入预先构建的整洁度评价模型,得到书写整洁度得分。由于灰度图即各灰度图的整洁度特征可以由计算机自动获取,然后将所述书写整洁度特征输入所述整洁度评价模型,即可自动得到书写整洁度得分。
为了更好的理解本发明的技术方案和技术效果,以下将结合流程图和具体的实施例进行详细的描述。
如图1所示,是本发明实施例提供的书写整洁度的评价方法的流程图,包括以下步骤:
步骤S01,预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型。
在本实施例中,所述整洁度评价模型可以为一种或多种模型的线性组合,其中,线性组合可以指:多个模型构成该整洁度评价模型,一些模型的输出作为另一些模型的输入,即至少部分模型为串联;此外,线性组合也可以指:多个模型构成该整洁度评价模型,至少部分模型的输出根据预设的权重等进行综合考虑,并给出一个输出结果,即至少部分模型为并联,例如,用循环神经网络(Recurrent Neural Networks,RNN)和深度神经网络(DeepNeural Networks,DNN)两种模型,分别得到各自书写整洁度的评价分值,然后将这两个分值进行加权求和,最后得到书写整洁度的评分;当然,线性组合还可以为部分模型之间为串联,部分模型之间为并联,并最终获取一个输出结果,在此不做限定。具体地,该整洁度评价模型可以包括以下任意一种或多种:支持向量机(Support Vector Machine,SVM),决策树(Decision Tree),DNN,RNN,高斯混合模型(Gaussian Mixture Model,GMM)。
具体训练时,将具有整洁度标注信息的训练数据的书写整洁度特征输入所述整洁度评价模型,通过调整整洁度评价模型的各参数,例如权重系数等,使得整洁度评价模型的输出结果趋近于训练数据的整洁度标注信息,当满足一定条件时,例如输出结果与标注信息的差值小于一定阈值,则认为整洁度评价模型构建完成。其中,训练数据的书写整洁度特征的提取过程可以与从待评价书写图像的灰度图中提取书写整洁度特征的过程相同,在说明书的其他部分进行详述。
步骤S02,获取待评价书写图像。
在本实施例中,待评价书写图像可以为手写的答案、作文、评论、信件、日记等的图片。需要强调的是,本发明尤其适用于以手写形式作答的考试的主观题部分的整洁度评价。通过对书写整洁度的考核来提高学生的书写整洁度,也是对教育的一种要求,同时,卷面整洁也从侧面表明学生的预先构思能力和逻辑性的强弱。
在实际应用中,待评价书写图像的获取多采用扫描仪、高拍仪、数码相机等设备来获取,当待评价书写图像为考试答案的图像时,该答案可以是作答在答题卡上,也可以是在试卷上,对此本案不作限定。当待评价书写图像中的书写区域仅为获取的整个图像的一部分时,可以通过图像处理等技术从待评价书写图像中将书写区域的图像提取出来,具体同现有技术,在此不再详述。
步骤S03,获取待评价书写图像中各书写区域的灰度图。
在本实施例中,待评价书写图像中书写区域可以是连成一个整体的区域,例如作文;也可以是分散位于书写图像的各分散区域,例如试卷上的问答题、答题卡上的作答等,各书写区域是一块、一块的,此时,可以根据已知的书写位置信息,从待评价书写图像中获取各书写区域子图像。其中,所述书写位置信息包括以下任意一种或多种信息:试卷布局信息、答题卡布局信息、版面设计信息、页面设计信息和通过图像识别获取的书写位置信息等。
需要说明的是,当待评价书写图像中包含多个书写区域子图像时,以每一个子图像为单位,获取各子图像的灰度图。
优选地,获取待评价书写图像中各书写区域的灰度图之前,对待评价书写图像进行定位及校准处理;当待评价书写图像中包含多个书写区域子图像时,获取各子图像的灰度图之后,对各书写区域各子图像进行降噪处理,然后再获取降噪后各书写区域子图像的灰度图。
在一个具体实施例中,首先对待评价书写图像进行定位及校准处理,接着根据已知的书写位置信息判断是否存在多个书写区域,如果是,则从待评价书写图像中获取各书写区域子图像,如果否,则以当前待评价书写图像为单位进行处理,然后,对书写图像中各书写区域的图像进行降噪,并进行灰度化处理,得到待评价书写图像中各书写区域的灰度图。其中,图像降噪及灰度化处理可以同现有技术,在此不再详述。
步骤S04,从各灰度图中提取书写整洁度特征。
在本实施例中,以书写图像中各书写区域的灰度图为对象进行书写整洁度特征提取,该特征用于表征书写整洁度,例如是否存在插入行及插入行数、是否存在涂抹及涂抹的数量、是否存在行与行之间的粘连及粘连的个数。如图2(a)所示为具有插入行的待评价书写图像的示意图,如图2(b)所示为具有涂抹的待评价书写图像的示意图,如图2(c)所示为具有粘连联通体的待评价书写图像的示意图。
优选地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。其中,插入行特征用来表征书写区域中是否存在漏写后的补写内容、写错在其他区域后进行补写等导致书面结构不美观的特征,具体可以包括以下任意一个或多个:插入的行数、插入行所占所有行的面积比例、插入行导致的书面空白比例等,该特征可以为一个多维向量;涂抹特征用来表征写错后涂抹导致书写不整洁的特征,具体可以包括以下任意一个或多个:存在涂抹行数所占所有行的比例、存在涂抹的行数、所有涂抹所占面积与所有行面积的比值等,该特征也可以为一个多维向量,其中涂抹的识别可以同现有技术;粘连特征用来表征相邻行的书写大小过大使得相邻行粘连,导致书写整体不美观的特征,具体可以包括以下任意一个或多个:存在粘连行数所占所有行的比例、存在粘连的行数、所有粘连联通体所占所有联通体的比例等,该特征也可以为一个多维向量。需要说明的是,所有行面积也可以为所有行中所有联通体所占的面积,具体可以为所有联通体包括的面积或所有联通体的前景所占的面积等,涂抹所占面积具体可以为:涂抹联通体所占面积或涂抹字符所占面积等,在此不做限定,以下相同。
在实际应用中,所述书写整洁度特征可以为一个多维向量,例如书写整洁度特征可以包括插入行特征、涂抹特征和粘连特征,其中插入行特征包括插入行行数比例特征和插入行面积比例特征,涂抹特征包括涂抹行数比例特征、涂抹面积比例特征和多涂画比例特征,粘连特征包括粘连行数比例特征和粘连数比例特征,则此时书写整洁度特征是一个7维的向量,根据各特征的自身特点获取各特征向量。例如插入行特征的提取过程可以包括:对各书写区域的图像进行行切分,提取出插入行,如图3(a)至图3(b)所示,并计算相关维度特征向量;涂抹特征的提取过程可以包括:对行切分后的每行图像进行涂抹检测,如图4(a)至图4(b)所示,然后计算相关维度特征向量;粘连特征的提取过程可以包括:对各书写区域的图像进行行切分,提取出粘连联通体,如图5(a)至图5(b)所示,并计算相关维度特征向量。当然,上述特征提取过程仅为示例性举例,现有技术中可以获取上述特征的方法都适用。
步骤S05,将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
在本实施例中,基于统计模型的方法对书写整洁程度进行评分,得到书写整洁程度得分g。以SVM为例,整洁度得分g的计算如式(1):
g=WX+b (1)
其中,W是权重系数向量,b是偏移向量,W和b为模型训练时获取的模型参数,具体可以通过离线收集大量数据进行训练得到,X为书写整洁度特征向量,X={x1,x2,x3,x4,x5,x6,x7…}。
在实际应用中,还可以对整洁度得分进行归一化处理,例如,可以根据预先设定的书写整洁度总分对整洁度得分进行归一化处理,得到归一化的整洁度得分T1,计算公式如式(2)所示:
T1=F(g)=S*g (2)
其中,S为书写整洁度总分。当然也可以采用其他归一化方法进行处理,在此不做限定。
进一步地,本发明还包括:当所述待评价书写图像为考试内容,利用所述书写整洁度得分对试卷考试得分进行调整,以实现通过对书写整洁度的考核来提高学生的书写整洁度。具体地,当待评价书写图像中仅包含一个书写区域时,利用整洁度得分g或归一化的整洁度得分T1对该书写区域的考试内容得分进行调整;当待评价书写图像中包含至少两个书写区域时,分别获取各书写区域的整洁度得分g或归一化的整洁度得分T1,分别对各书写区域的考试内容的得分进行调整,当然,也可以在分别获取各书写区域的整洁度得分g或归一化的整洁度得分T1之后,根据预先设定的各区域的权重等得到各书写区域的整洁度得分g或归一化的整洁度得分T1的综合整洁度得分,然后利用该综合整洁度得分对各书写区域的内容的总得分进行调整。
本发明实施例提供的书写整洁度的评价方法,通过从待评价书写图像中各书写区域的灰度图中提取书写整洁度特征,然后将所述书写整洁度特征输入预先构建的整洁度评价模型,得到书写整洁度得分。由于各书写整洁度特征可以由计算机自动提取,然后将各书写整洁度特征输入预先构建的整洁度评价模型,计算机即可自动给出书写整洁度得分。
在其它实施例中,对所述插入行特征、涂抹特征和粘连特征进行细化,以从更多角度表征书写整洁度,使得最终获取的整洁度评分更加客观公正。
优选地,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
具体地,对于插入行行数比例特征,该特征体现的是插入行数所占所有行数的比例对整体书写整洁度的影响,首先统计行切分后所有行数lineN,然后计算插入行(所述插入行一般为行切分后长度小于一定阈值的行,也可以为行高度小于预设阈值的行)的行数N1,则插入行行数比例特征值x1的计算公式如式(3)所示:
Figure BDA0001016313700000101
对于插入行面积比例特征,该特征体现的是插入行面积所占所有行面积的比例对整体书写整洁度的影响,首先计算所有插入行的前景像素(黑色像素)数N2,然后计算所有行的前景点数foreN,则插入行面积比例特征值x2的计算公式如式(4)所示:
Figure BDA0001016313700000111
优选地,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
具体地,对于涂抹行数比例特征,该特征体现的是存在涂抹的行数所占所有行数的比例对整体书写整洁度的影响,如图4(a)至图4(b)所示,为检测涂抹过程示意图。具体可以根据以下任意一种或多种特征:线条特征、交叉点特征、孔洞特征以及密度特征提取出书写区域中的涂抹,然后再统计出存在涂抹的行数N3,则涂抹行数比例特征值x3的计算公式如式(5)所示:
Figure BDA0001016313700000112
对于涂抹面积比例特征,该特征体现的是涂抹的面积所占所有行面积的比例对整体书写整洁度的影响,计算涂抹所占的前景数N4,则涂抹面积比例特征x4的计算公式如式(6)所示:
Figure BDA0001016313700000113
进一步地,考虑到不同涂抹类别带来的主观感觉不同,即不同涂抹对书写整洁度的影响程度不同,将涂抹进行分类:单线涂抹、多线涂抹和严实涂,如图6(a)至6(b)所示为单线涂抹,如图6(c)至6(d)所示为多线涂抹,如图6(e)至6(f)所示为严实涂抹。其中单线涂抹对整体书写整洁度影响较小,多线涂抹和严实涂对整体书写整洁度影响较大,故所述涂抹特征还可以包括:多涂画比例特征,所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
对于多涂画比例特征,该特征体现的是多线涂抹和严实涂抹所占行数与所有行数的比例对整体书写整洁度的影响,计算多线涂抹和严实涂画所占行数N5,则多涂画比例特征x5的计算公式如式(7)所示:
Figure BDA0001016313700000114
在实际使用中,涂抹的检测可以采用现有技术,在此不再详述。
优选地,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。如图5(a)至图5(b)所示,为英语书写区域内的粘连联通体提取过程示意图,如图7(a)至图7(b)所示,为中文书写区域内的粘连联通体提取过程示意图。
对于粘连行数比例特征,该特征体现的是存在粘连联通体的行数所占所有行数的比例对整体书写整洁度的影响,首先计算每个联通体所占的行数,然后滤除所占行数小于2的联通体,最后统计存在粘连联通体的行数N6,则粘连行数比例特征x6的计算公式如式(8)所示:
Figure BDA0001016313700000121
对于粘连行数比例特征,该特征体现的是存在粘连联通体的单词和/或字的总数所占所有单词和/或字的总数的比例对整体书写整洁度的影响,首先统计所有单词和/或字的总数wordN,然后统计每个单词和/或字中属于粘连联通体数N7,则粘连数比例特征x7的计算公式如式(9)所示:
Figure BDA0001016313700000122
在本发明实施例中,提供了插入行特征、涂抹特征和粘连特征的子特征,并且给出了各子特征的定义,以便于计算机从多角度自动提取上述子特征,使得最终由计算机自动给出的书写整洁度得分更加客观公正。
如图8所示,为根据本发明实施例提供的构建整洁度评价模型的方法的一种流程图,包括:
步骤S81,收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像。
在本实施例中,该训练数据可以是具有整洁度得分标注信息的书写图像,当然,也可以是具有手写内容的书写图像,然后由人工进行整洁度得分标注,在此不做限定。
步骤S82,提取所述训练数据各书写区域的灰度图的书写整洁度特征。
同步骤S04,在此不再详述。
步骤S83,根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
在本实施例中,具体训练时,输入为每个书写区域的卷面整洁度特征,输出为当前书写区域的书写整洁程度得分g或归一化后的书写整洁程度得分T1,通过调整模型参数使得计算机给出的书写整洁程度得分g或归一化后的书写整洁程度得分T1趋近于该训练数据的整洁度得分标注信息。
相应地,本发明还提供了书写整洁度的评价系统的一种结构示意图,如图9所示,该系统包括:
模型构建模块901,用于预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;
图像获取模块902,用于获取待评价书写图像;
灰度图获取模块903,用于获取待评价书写图像中各书写区域的灰度图;
特征提取模块904,用于从各灰度图中提取书写整洁度特征;
评价模块905,用于将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
其中,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。
进一步地,所述插入行特征、涂抹特征和粘连特征还可细化为相应的子特征,在本实施例中,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
此外,为了更体现多涂画对书写整洁度的影响,所述涂抹特征还包括:多涂画比例特征;
所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
如图10所示,为根据本发明实施例提供的模型构建模块101的一种结构示意图,可以包括:
数据收集单元9011,用于收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
特征提取单元9012,用于提取所述训练数据各书写区域的灰度图的书写整洁度特征;
模型训练单元9013,用于根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
进一步地,如图11所示,当所述待评价书写图像为考试内容,所述系统还包括:
得分调整模块116,用于利用所述书写整洁度得分对试卷考试得分进行调整。这样,可以通过得分调整模块116对试卷考试得分进行调整,能通过对书写整洁度的考核来提高学生的书写整洁度。
此外,该系统还可以进一步包括存储模块(未图示),用于保存模型参数、特征向量等相关信息。这样,以方便对待评价书写图像进行计算机自动处理。并存储书写整洁度得分。
本发明实施例提供的书写整洁度的评价系统,通过模型构建模块901预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型,在实际使用中,通过图像获取模块902获取待评价书写图像,然后由灰度图获取模块903获取待评价书写图像中各书写区域的灰度图,接着通过特征提取模块904从各灰度图中提取书写整洁度特征,最终由评价模块905将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。由于该书写整洁度特征能反映书写的整洁度信息,并且可以由计算机自动提取,最终由评价模块905自动给出书写整洁度得分,该书写整洁度得分的客观性及稳定性能得到有效保障。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及系统;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种书写整洁度的评价方法,其特征在于,包括:
预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征;其中,所述插入行特征表征补写内容,所述涂抹特征表征涂改内容,所述粘连特征表征相邻行的粘连内容;
获取待评价书写图像;
获取待评价书写图像中各书写区域的灰度图;
从各灰度图中提取书写整洁度特征;
将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
2.根据权利要求1所述的方法,其特征在于,
所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
3.根据权利要求1所述的方法,其特征在于,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
4.根据权利要求3所述的方法,其特征在于,所述涂抹特征还包括:多涂画比例特征;
所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
5.根据权利要求1所述的方法,其特征在于,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型包括:
收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
提取所述训练数据各书写区域的灰度图的书写整洁度特征;
根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
当所述待评价书写图像为考试内容,利用所述书写整洁度得分对试卷考试得分进行调整。
8.一种书写整洁度的评价系统,其特征在于,包括:
模型构建模块,用于预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征;其中,所述插入行特征表征补写内容,所述涂抹特征表征涂改内容,所述粘连特征表征相邻行的粘连内容;
图像获取模块,用于获取待评价书写图像;
灰度图获取模块,用于获取待评价书写图像中各书写区域的灰度图;
特征提取模块,用于从各灰度图中提取书写整洁度特征;
评价模块,用于将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
9.根据权利要求8所述的系统,其特征在于,
所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
10.根据权利要求8所述的系统,其特征在于,
所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
11.根据权利要求10所述的系统,其特征在于,
所述涂抹特征还包括:多涂画比例特征;
所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
12.根据权利要求8所述的系统,其特征在于,
所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
13.根据权利要求8至12任一项所述的系统,其特征在于,所述模型构建模块包括:
数据收集单元,用于收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
特征提取单元,用于提取所述训练数据各书写区域的灰度图的书写整洁度特征;
模型训练单元,用于根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
14.根据权利要求8至12任一项所述的系统,其特征在于,当所述待评价书写图像为考试内容,所述系统还包括:
得分调整模块,用于利用所述书写整洁度得分对试卷考试得分进行调整。
CN201610423085.3A 2016-06-14 2016-06-14 一种书写整洁度的评价方法及系统 Active CN107507161B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610423085.3A CN107507161B (zh) 2016-06-14 2016-06-14 一种书写整洁度的评价方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610423085.3A CN107507161B (zh) 2016-06-14 2016-06-14 一种书写整洁度的评价方法及系统

Publications (2)

Publication Number Publication Date
CN107507161A CN107507161A (zh) 2017-12-22
CN107507161B true CN107507161B (zh) 2020-06-16

Family

ID=60679220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610423085.3A Active CN107507161B (zh) 2016-06-14 2016-06-14 一种书写整洁度的评价方法及系统

Country Status (1)

Country Link
CN (1) CN107507161B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506360B (zh) * 2016-06-14 2020-09-11 科大讯飞股份有限公司 一种文章评分方法及系统
CN108573461A (zh) * 2018-04-23 2018-09-25 温州市鹿城区中津先进科技研究院 一种云阅卷数据分析系统
CN109359703A (zh) * 2018-12-19 2019-02-19 佛山科学技术学院 一种基于决策树的瓷砖等级分类方法
CN110555427A (zh) * 2019-09-09 2019-12-10 北京一起教育信息咨询有限责任公司 一种书写规范度的自动评分方法、系统、设备及存储介质
CN112434668A (zh) * 2020-12-14 2021-03-02 北京一起教育科技有限责任公司 一种评价整洁度的方法、装置及电子设备
CN118278385B (zh) * 2024-05-29 2024-09-17 暗物智能科技(广州)有限公司 一种基于篇章卷面分析的测试方法、装置及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251891A (zh) * 2008-02-29 2008-08-27 东莞市正欣科技有限公司 书写汉字结构规范性评价的方法和装置
CN101630362A (zh) * 2009-08-25 2010-01-20 华南理工大学 一种基于置信度的汉字书写质量评价方法
CN101976354A (zh) * 2010-11-10 2011-02-16 广东开心信息技术有限公司 一种书写汉字规范性评判的方法和装置
CN102081742A (zh) * 2011-01-17 2011-06-01 山东山大鸥玛软件有限公司 一种书写能力的自动评价方法
CN102609735A (zh) * 2012-02-06 2012-07-25 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251891A (zh) * 2008-02-29 2008-08-27 东莞市正欣科技有限公司 书写汉字结构规范性评价的方法和装置
CN101630362A (zh) * 2009-08-25 2010-01-20 华南理工大学 一种基于置信度的汉字书写质量评价方法
CN101976354A (zh) * 2010-11-10 2011-02-16 广东开心信息技术有限公司 一种书写汉字规范性评判的方法和装置
CN102081742A (zh) * 2011-01-17 2011-06-01 山东山大鸥玛软件有限公司 一种书写能力的自动评价方法
CN102609735A (zh) * 2012-02-06 2012-07-25 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法

Also Published As

Publication number Publication date
CN107507161A (zh) 2017-12-22

Similar Documents

Publication Publication Date Title
CN107507161B (zh) 一种书写整洁度的评价方法及系统
CN107506360B (zh) 一种文章评分方法及系统
CN107133616B (zh) 一种基于深度学习的无分割字符定位与识别方法
CN104463101B (zh) 用于文字性试题的答案识别方法及系统
CN108960245B (zh) 轮胎模具字符的检测与识别方法、装置、设备及存储介质
CN105787522B (zh) 基于手写笔迹的书写态度评价方法及系统
CN110503054B (zh) 文本图像的处理方法及装置
CN106650737B (zh) 图像自动裁剪方法
CN105046200B (zh) 基于直线检测的电子阅卷方法
CN110135282B (zh) 一种基于深度卷积神经网络模型的考生回头抄袭作弊检测方法
CN105989347A (zh) 客观题智能阅卷方法及系统
CN107622271B (zh) 手写文本行提取方法及系统
CN107103326A (zh) 基于超像素聚类的协同显著性检测方法
CN111695555B (zh) 一种基于题号的精准框题方法、装置、设备和介质
CN104834941A (zh) 基于计算机输入下的稀疏自编码的脱机手写体识别方法
CN107330455A (zh) 图像评价方法
CN111814798A (zh) 题目数字化处理方法和可读存储介质
CN111144270B (zh) 基于神经网络的手写文本工整度的评测方法与评测装置
CN115393861B (zh) 一种手写体文本精准分割方法
CN107341487B (zh) 一种涂抹字符的检测方法及系统
CN116403262A (zh) 一种基于机器视觉的在线学习专注度监测方法、系统及介质
CN114863125A (zh) 一种书法/美术作品智能评分方法及系统
CN110298236A (zh) 一种基于深度学习的盲文图像自动识别方法和系统
Fink et al. Grouping historical postcards using query-by-example word spotting
CN110516638A (zh) 一种基于轨迹和随机森林的手语识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant