CN111626297A - 文字书写质量评价方法、装置、电子设备和记录介质 - Google Patents
文字书写质量评价方法、装置、电子设备和记录介质 Download PDFInfo
- Publication number
- CN111626297A CN111626297A CN202010287201.XA CN202010287201A CN111626297A CN 111626297 A CN111626297 A CN 111626297A CN 202010287201 A CN202010287201 A CN 202010287201A CN 111626297 A CN111626297 A CN 111626297A
- Authority
- CN
- China
- Prior art keywords
- handwriting
- character
- feature
- image
- target image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000011156 evaluation Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003137 locomotive effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Character Discrimination (AREA)
Abstract
本发明属于人工智能技术领域,提供一种文字书写质量评价方法、装置、电子设备和记录介质,所述方法包括如下步骤:获取带有文字的目标图像;提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征;由特征库中提取所述至少一个文字对应的至少一个第二字迹特征;将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以对所述目标图像的文字书写质量进行评价。本发明的文字书写质量评价方法、装置、电子设备和记录介质,能够对手写汉字的手写质量进行评价,得到公正客观的评价结果。
Description
技术领域
本发明属于计算机信息处理技术领域,特别适用于人工智能和软件工程领域,更具体的是涉及一种文字书写质量评价方法、装置、电子设备和记录介质。
背景技术
随着经济全球化、文化多样化的急剧发展和中国经济的持续快速增长,汉语中国的交际工具和文化载体,正日渐受到世界上越来越多的教育机构的重视。加之随着互联网络的发展,越来越多的网络课程涌现,老师通过网络授课来传授知识也成了重要的学习方式,而老师在教学中板书的质量也极大地影响着学生的理解。每个人手写的汉字千差万别,想要评价一个人书写的汉字的质量,判断书写的是否工整,通过人来观察带有明显的主观性。基于以上多方面的原因,如何客观公正的对手写的汉字进行质量评价是目前的热点技术。
基于计算机辅助的汉字手写质量评价技术在近几年中取得不少进步,但由于汉字字符集庞大、结构复杂、变形多,汉字的书写质量如何能够智能地评价,现有技术还有很大的改善和发展空间。
发明内容
本发明旨在解决现有技术中对手工书写的汉字的质量评价难题,旨在提出一种能够高效客观快速方式对手工书写的汉字质量进行评价。为解决上述技术问题,本发明的一方面提出一种文字书写质量评价方法、装置、电子设备和记录介质。
根据本发明的一方面,提出一种文字书写质量评价方法,该方法包括:获取带有文字的目标图像;提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征;由特征库中提取所述至少一个文字对应的至少一个第二字迹特征;将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以对所述目标图像的文字书写质量进行评价。
在本开的一个实施例中,还包括:获取预设标准字库中多个文字对应的多个文字图像;基于所述多个文字图像生成多个第二字迹特征,所述字迹特征模型用于提取文字图像的字迹特征;通过所述多个第二字迹特征生成所述特征库。
在本开的一个实施例中,提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征,包括:为所述目标图像中的每一个文字生成外接矩形边框;基于所述外接矩形边框将所述目标图像分割为至少一个子图像;基于所述至少一个子图像生成所述至少一个第一字迹特征。
在本开的一个实施例中,基于所述外接矩形边框将所述目标图像分割至少一个子图像之后,还包括:对所述至少一个子图像进行图像预处理,所述图像预处理包括:中值滤波,图像灰度化,对比度拉伸中的至少一个步骤。
在本开的一个实施例中,为所述目标图像中的每一个文字生成外接矩形边框,包括:通过文字检测模型对所述目标图像进行检测以生成所述外接矩形边框。
在本开的一个实施例中,由标准特征库中提取所述至少一个文字对应的至少一个第二字迹特征,包括:获取预设标准字库中每个文字对应的至少一个文字图像;基于所述至少一个文字图像生成第二字迹特征,通过多个第二字迹特征生成所述特征库。
在本开的一个实施例中,将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以对所述目标图像的文字书写质量进行评价,包括:将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以生成至少一个评分;基于所述至少一个评分确定所述目标图像的文字书写质量的评分。
在本开的一个实施例中,将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以生成至少一个评分,包括:将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行相似度比较以生成至少一个评分。
在本开的一个实施例中,将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行相似度比较以生成至少一个评分,包括:基于所述至少一个第一字迹特征和所述至少一个第二字迹特征之间的余弦距离确定所述至少一个评分;基于所述至少一个第一字迹特征和所述至少一个第二字迹特征之间的欧氏距离确定所述至少一个评分;基于所述至少一个第一字迹特征和所述至少一个第二字迹特征之间的曼哈顿距离确定所述至少一个评分。
根据本发明的第二方面,提出一种文字书写质量评价装置,该装置包括:图像模块,用于获取带有文字的目标图像;第一字迹特征模块,用于提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征;第二字迹特征模块,用于由特征库中提取所述至少一个文字对应的至少一个第二字迹特征;评分模块,用于将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以对所述目标图像的文字书写质量进行评价。
本发明第三方面提出一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的方法。
本发明第四方面还提出一种记录介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的方法。
根据本发明的文字书写质量评价方法、装置、电子设备及计算机可读介质,通过提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征;由特征库中提取所述至少一个文字对应的至少一个第二字迹特征;将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以生成所述目标图像的文字书写质量评分的方式,能够通过简单的方式,快速的对手写汉字的手写质量进行评分,得到公正客观的评分结果。
附图说明
图1是本发明的一个实施例的一种文字书写质量评价方法的流程图。
图2是本发明的一个实施例的一种文字书写质量评价方法的示意图。
图3是本发明的一个实施例的一种文字书写质量评价方法的流程图。
图4是本发明的一个实施例的一种文字书写质量评价方法的流程图。
图5是本发明的一个实施例的一种文字书写质量评价方法的示意图。
图6是本发明的一个实施例的一种文字书写质量评价装置的框图。
图7是本发明的一个实施例的一种电子设备的示意图。
图8本发明的一个实施例的一种记录介质的示意图。
具体实施方式
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
每个人手写的汉字千差万别,想要评价一个人书写的汉字的质量,判断书写的是否工整,通过人来观察带有明显的主观性。现有的一些专利方法需要手写汉字文本行书写轨迹的点集数据,通过时序点集数据对手写汉字质量进行评定的方式需要获取用户书写的顺序,从而生成点集的时序进而进行计算,数据获取需要专门的装置,而且也需要占用大量的处理时间。而本发明中的文字书写质量评价方法及装置,只需要手写汉字的图片数据,数据更易获取,计算更加准确。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
图1是本发明的一个实施例的一种文字书写质量评价方法的流程图。文字书写质量评价方法10至少包括步骤S102至S108。
如图1所示,在S102中,获取带有文字的目标图像。其中,目标图像可为手写文字图像,具体地可为由教师书写的板书图像或者由用户书写的课后作业类的图像。
更具体的,可由摄像头中获取教师的板书图像以进行后续的文字书写质量评分;还可在预设软件中,由用户提交的作业图像或者教师课件中获取目标图像以进行后续的处理,本发明不以此为限。
在S104中,提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征。包括:为所述目标图像中的每一个文字生成外接矩形边框;基于所述外接矩形边框将所述目标图像分割为至少一个子图像;将所述至少一个子图像输入字迹特征模型以生成所述至少一个第一字迹特征。
在一个实施例中,为所述目标图像中的每一个文字生成外接矩形边框,包括:通过文字检测模型对所述目标图像进行检测以生成所述外接矩形边框。更具体的,可利用深度学习检测网络,检测出图片中所有单字的外接矩形边框,根据检测结果将图片分割成多个手写汉字单字图片。
更具体的,可将子图像输入训练好的字迹特征模型中,以提取出每个子图像中手写单字的笔迹特征。其中,字迹特征模型可通过深度学习神经网络模型训练生成。深度学习神经网络模型可包括:ResNet模型,或者是具有inception结构的深度学习神经网络等,需要说明的是,本发明不以此为限。
其中,ResNet是残差网络(Residual Network)的缩写,是一种作为许多计算机视觉任务主干的经典神经网络。inception是一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果,但层数的增加会带来很多负作用,比如过拟合、梯度消失、梯度爆炸等。inception的提出则从另一种角度来提升训练结果:能更高效的利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果。
在S106中,由特征库中提取所述至少一个文字对应的至少一个第二字迹特征。包括:对所述至少一个子图像进行文字识别以获取至少一个文字字符;基于所述至少一个文字字符由标准特征库中提取所述至少一个第二字迹特征。
文字识别技术是利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。常用的方法有模板匹配法和几何特征抽取法,卷积神经网络法,在本发明中,可利用以上几种文字识别技术中的任一种或者将多种技术相结合以进行目标图像的文字识别:
模板匹配法是将输入的文字与给定的各类别标准文字(模板)进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别结果;
几何特征抽取法是抽取文字的一些几何特征,如文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜等各方向的线段、闭合环路等,根据这些特征的位置和相互关系进行逻辑组合判断,获得识别结果。
卷积神经网络法是利用卷积神经网络获取文字的语义信息,利用最终的全连接层与softmax层获得该文字的最终识别结果。
在S108中,将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以对所述目标图像的文字书写质量进行评价。包括:将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以生成至少一个评分;基于所述至少一个评分确定所述目标图像的文字书写质量的评分。更具体的,可将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行相似度比较以生成至少一个评分。
“将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以对所述目标图像的文字书写质量进行评价”的具体内容将在图5对应的实施例中进行详细描述。
根据本发明的文字书写质量评价方法,通过将目标图像中的文字的第一字迹特征和标准库中的该文字的第二字迹特征进行对比的的方式确定目标图像中文字的书写质量,这种方式能够通过简单的方式快速的对手写汉字的手写质量进行评分,得到公正客观的评分结果。
在一个实施例中,将所述至少一个子图像输入字迹特征模型之前,还包括:对所述至少一个子图像进行图像预处理,所述图像预处理包括:中值滤波,图像灰度化,对比度拉伸。
更具体的,对于分割出的单字图片可先通过一个图像预处理模块进行预处理,图像预处理模块包含了中值滤波、图像灰度化、对比度拉伸操作,图像预处理的模块的作用是为了减少图像噪声、增强对比度,便于更好的提取特征。
预处理可包括:中值滤波处理,把数字图像中一点的值用该点的一个区域的中值来代替,将一个点的特定长度或形状的邻域成为窗口,本方法中的窗口大小为3*3。
预处理可包括:图像灰度化处理,将原始的RGB图对三个颜色分量进行亮度求平均值得到相应的灰度图。
Gray(i,j)=(R(i,j)+G(i,j)+B(i,j))/3;
预处理可包括:对比度拉伸,对比度拉伸是一种常见的图像增强方法,相应的转换公式如下,将灰度图拉伸到整个0-255的区间:
图2是本发明的一个实施例的一种文字书写质量评价方法的示意图。如2通过示意图的方式描述了本发明中的技术内容。首先在目标图像中获取一个单字的图像,将单字图像输入到训练完毕的字迹特征模型中进行计算,得到该单字图像的第一字迹特征值;然后可对单字图像进行文字识别,确定其对应的具体文字字符,可例如为字符“我”,在特征库中根据字符“我”确定出该字符对应的第二字迹特征值;最后,将第一字符特征值和第二字符特征值进行相似度比较,得到单字图像的文字书写质量评分。
应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施例。
图3是本发明的一个实施例的一种文字书写质量评价方法的流程图。图3所示的流程是对图1所示的流程中的特征库的描述。
如图3所示,在S302中,获取预设标准字库中每个文字对应的至少一个文字图像。可例如,获取GB3212一级字库(3755个)中的所有的字的单字图片,以作为特征库中的标准对比图像。更进一步的,还可获取其他字体库中的文字的单子图像,本发明不以此为限。
在S304中,基于所述至少一个文字图像生成第二字迹特征,更具体的,可将至少一个文字图像输入到字迹特征模型中,得到其对应的第二字迹特征值,其中,字迹特征模型可用于提取文字图像的字迹特征。
指的一提的是,在标准字库中,一个文字可能对应着多个文字图像。在一个文字对应多个文字图像时,可通过多个文字图像的平均第二特征值确定该文字对应的第二字迹特征。
在S306中,通过多个第二字迹特征生成所述特征库。可将第二字迹特征值和其对应的具体文字的字符进行关联,通过所有的GB3212一级字库中的文字的第二字迹特征生成特征库。
图4是本发明的一个实施例的一种文字书写质量评价方法的流程图。图4所示的流程是对图1所示的流程中S108“将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较对所述目标图像的文字书写质量进行评价”的详细描述。
如图4所示,在S402中,将目标图像中的第一字迹特征和特征库中的第二字迹特征进行相似度比较以生成评分。更具体的,可通过步骤S404至S408中的任一步骤来计算目标图像中的第一字迹特征和特征库中的第二字迹特征之间的相似度。
在一个实施例中,还可结合步骤S404至S408中的多种计算结果确定目标图像中的第一字迹特征和特征库中的第二字迹特征之间的相似度,本发明不以此为限。
在S404中,基于第一字迹特征和第二字迹特征之间的余弦距离确定所述评分。更具体的,可计算每个单字第一字迹特征与标准特征库的相应字的第二字迹特征之间的余弦距离以作为评分。
求取特征距离采用的是余弦距离来计算两个特征之间的相似度。假设两个特征分别为a(a1,a2,a3...an)和b(b1,b2,b3...bn),则两个特征的余弦距离为:
在S406中,基于第一字迹特征和第二字迹特征之间的欧氏距离确定所述评分。更具体的,可计算每个单字第一字迹特征与标准特征库的相应字的第二字迹特征之间的欧氏距离以作为评分。
其中,欧几里得度量(euclideanmetric)(也称欧氏距离)是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。
在S408中,基于第一字迹特征和第二字迹特征之间的曼哈顿距离确定所述评分。更具体的,可计算每个单字第一字迹特征与标准特征库的相应字的第二字迹特征之间的曼哈顿距离以作为评分。
其中,曼哈顿距离为任一两点在X方向上的距离加上在Y方向上的距离,即d(i,j)=|xi-xj|+|yi-yj|。曼哈顿距离不是距离不变量,当坐标轴变动时,点间的距离就会不同。曼哈顿距离可大大提高了运算速度,而且不管累计运算多少次,都不会有误差。
在S410中,基于上述评分确定所述目标图像的文字书写质量的评分。通过上述相似度比较方法,分别求出目标图像中每一个单字的评分,然后根据目标图像中所有单字的评分确定目标图像的评分。
图5是本发明的一个实施例的一种文字书写质量评价方法的示意图。图5示例性的描述了某个目标图像中部分单字的效果图,其中,分数越大表示手写汉字的手写质量越高。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图6是根据一示例性实施例示出的一种文字书写质量评价装置的框图。如图6所示,文字书写质量评价装置60包括:图像模块602,第一字迹特征模块604,第二字迹特征模块606,评分模块608。
图像模块602用于获取带有文字的目标图像;其中,目标图像可为手写文字图像,具体地可为由教师书写的板书图像或者由用户书写的课后作业类的图像。
第一字迹特征模块604用于提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征;第一字迹特征模块604还可用于为所述目标图像中的每一个文字生成外接矩形边框;基于所述外接矩形边框将所述目标图像分割为至少一个子图像;基于所述至少一个子图像生成所述至少一个第一字迹特征。
第二字迹特征模块606用于由特征库中提取所述至少一个文字对应的至少一个第二字迹特征;第二字迹特征模块606还用于对所述至少一个子图像进行文字识别以获取至少一个文字字符;基于所述至少一个文字字符由标准特征库中提取所述至少一个第二字迹特征。
评分模块608用于将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较对所述目标图像的文字书写质量进行评价。评分模块608还用于将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以生成至少一个评分;基于所述至少一个评分确定所述目标图像的文字书写质量的评分。
根据本发明的文字书写质量评价装置,通过将目标图像中的文字的第一字迹特征和标准库中的该文字的第二字迹特征进行对比的的方式确定目标图像中文字的书写质量,这种方式能够通过简单的方式快速的对手写汉字的手写质量进行评分,得到公正客观的评分结果。
图7是本发明的一个实施例的电子设备的结构示意图,该电子设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行基于旋转角监测的车辆智能助力推行方法。
如图7所示,电子设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体,也可以是多个实体设备的总和。
所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得电子设备能够执行本发明的方法,或者方法中的至少部分步骤。
所述存储器包括易失性存储器,例如随机存取存储单元(RAM)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(ROM)。
可选的,该实施例中,电子设备还包括有I/O接口,其用于电子设备与外部的设备进行数据交换。I/O接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
应当理解,图7显示的电子设备仅仅是本发明的一个示例,本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如,有些电子设备中还包括有显示屏等显示单元,有些电子设备还包括人机交互元件,例如按扭、键盘等。只要该电子设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的电子设备。
图8是本发明的一个实施例的记录介质的示意图。如图8所示,计算机可读记录介质中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明上述的基于旋转角监测的车辆智能助力推行方法。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等,本发明也可以由包含上述系统或部件的至少一部分的车辆来实现。本发明也可以由执行本发明的方法的计算机软件来实现,例如由机车端的微处理器、电子控制单元,客户端、服务器端等执行的控制软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现,例如计算机程序执行的某些方法步骤可以在机车端执行,另一部分可以在移动终端或智能头盔等中执行。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得电子设备执行根据本发明的方法。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种文字书写质量评价方法,其特征在于,所述方法包括如下步骤:
获取带有文字的目标图像;
提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征;
由特征库中提取所述至少一个文字对应的至少一个第二字迹特征;
将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较,以对所述目标图像的文字书写质量进行评价。
2.根据权利要求1所述的文字书写质量评价方法,其特征在于,还包括:
获取预设标准字库中每个文字对应的至少一个文字图像;
基于所述至少一个文字图像生成第二字迹特征,通过多个第二字迹特征生成所述特征库。
3.根据权利要求1至2任意一项所述的文字书写质量评价方法,其特征在于,提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征,包括:
为所述目标图像中的每一个文字生成外接矩形边框;
基于所述外接矩形边框将所述目标图像分割至少一个子图像;
基于所述至少一个子图像生成所述至少一个第一字迹特征。
4.根据权利要求1至3任意一项所述的文字书写质量评价方法,其特征在于,基于所述外接矩形边框将所述目标图像分割至少一个子图像之后,还包括:
对所述至少一个子图像进行图像预处理,所述图像预处理包括:
中值滤波,图像灰度化,对比度拉伸中的至少一个步骤。
5.根据权利要求1至4任意一项所述的文字书写质量评价方法,其特征在于,为所述目标图像中的每一个文字生成外接矩形边框,包括:
对所述目标图像进行检测,生成所述外接矩形边框,以对单个文字进行定位;
可选地,由标准特征库中提取所述至少一个文字对应的至少一个第二字迹特征,包括:
对所述至少一个子图像进行文字识别以获取至少一个文字字符;
基于所述至少一个文字字符由标准特征库中提取所述至少一个第二字迹特征。
6.根据权利要求1至5任意一项所述的文字书写质量评价方法,其特征在于,将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较,以对所述目标图像的文字书写质量进行评价,包括:
将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以生成至少一个评分;
基于所述至少一个评分确定所述目标图像的文字书写质量的评分。
7.根据权利要求1至6任意一项所述的文字书写质量评价方法,其特征在于,将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较以生成至少一个评分,包括:
将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行相似度比较以生成至少一个评分;
可选地,将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行相似度比较以生成至少一个评分,包括:
基于所述至少一个第一字迹特征和所述至少一个第二字迹特征之间的余弦距离确定所述至少一个评分;
基于所述至少一个第一字迹特征和所述至少一个第二字迹特征之间的欧氏距离确定所述至少一个评分;
基于所述至少一个第一字迹特征和所述至少一个第二字迹特征之间的曼哈顿距离确定所述至少一个评分。
8.一种文字书写质量评价装置,其特征在于,包括:
图像模块,用于获取带有文字的目标图像;
第一字迹特征模块,用于提取所述目标图像中包含的至少一个文字的至少一个第一字迹特征;
第二字迹特征模块,用于由特征库中提取所述至少一个文字对应的至少一个第二字迹特征;
评分模块,用于将所述至少一个第一字迹特征和所述至少一个第二字迹特征进行比较,以对所述目标图像的文字书写质量进行评价。
9.一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,其特征在于:
当所述计算机程序被所述处理器执行时,所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种记录介质,存储有计算机可执行程序,其特征在于,所述计算机可执行程序被执行时,实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010287201.XA CN111626297A (zh) | 2020-04-13 | 2020-04-13 | 文字书写质量评价方法、装置、电子设备和记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010287201.XA CN111626297A (zh) | 2020-04-13 | 2020-04-13 | 文字书写质量评价方法、装置、电子设备和记录介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111626297A true CN111626297A (zh) | 2020-09-04 |
Family
ID=72259706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010287201.XA Pending CN111626297A (zh) | 2020-04-13 | 2020-04-13 | 文字书写质量评价方法、装置、电子设备和记录介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111626297A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112486337A (zh) * | 2020-11-17 | 2021-03-12 | 深圳市鹰硕教育服务有限公司 | 笔迹图形分析方法、装置及电子设备 |
CN112990346A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
CN112990349A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
CN112990345A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
CN113191309A (zh) * | 2021-05-19 | 2021-07-30 | 杭州点望科技有限公司 | 一种手写汉字的识别、评分、纠错方法及系统 |
CN113253837A (zh) * | 2021-04-01 | 2021-08-13 | 作业帮教育科技(北京)有限公司 | 空中书写方法、装置、线上直播系统和计算机设备 |
CN113537801A (zh) * | 2021-07-23 | 2021-10-22 | 重庆晋才富熙科技有限公司 | 板书处理方法、装置、终端和存储介质 |
CN114332514A (zh) * | 2022-03-17 | 2022-04-12 | 北京许先网科技发展有限公司 | 一种字体测评方法及系统 |
CN114782964A (zh) * | 2022-06-20 | 2022-07-22 | 阿里巴巴(中国)有限公司 | 图像处理方法、存储介质以及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358237A (zh) * | 2017-07-21 | 2017-11-17 | 东南大学 | 一种去环境干扰的多仪表盘自动读数方法 |
CN108133205A (zh) * | 2018-02-05 | 2018-06-08 | 赵斌 | 复制图像中文本内容的方法及装置 |
CN109472249A (zh) * | 2018-11-22 | 2019-03-15 | 京东方科技集团股份有限公司 | 一种确定书写体优劣等级的方法及装置 |
CN109543777A (zh) * | 2018-11-28 | 2019-03-29 | 中国科学院自动化研究所 | 手写汉字书写质量评价方法及系统 |
CN110659702A (zh) * | 2019-10-17 | 2020-01-07 | 黑龙江德亚文化传媒有限公司 | 基于生成式对抗网络模型书法字帖评价系统及方法 |
-
2020
- 2020-04-13 CN CN202010287201.XA patent/CN111626297A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358237A (zh) * | 2017-07-21 | 2017-11-17 | 东南大学 | 一种去环境干扰的多仪表盘自动读数方法 |
CN108133205A (zh) * | 2018-02-05 | 2018-06-08 | 赵斌 | 复制图像中文本内容的方法及装置 |
CN109472249A (zh) * | 2018-11-22 | 2019-03-15 | 京东方科技集团股份有限公司 | 一种确定书写体优劣等级的方法及装置 |
CN109543777A (zh) * | 2018-11-28 | 2019-03-29 | 中国科学院自动化研究所 | 手写汉字书写质量评价方法及系统 |
CN110659702A (zh) * | 2019-10-17 | 2020-01-07 | 黑龙江德亚文化传媒有限公司 | 基于生成式对抗网络模型书法字帖评价系统及方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022104999A1 (zh) * | 2020-11-17 | 2022-05-27 | 深圳市鹰硕教育服务有限公司 | 笔迹图形分析方法、装置及电子设备 |
CN112486337A (zh) * | 2020-11-17 | 2021-03-12 | 深圳市鹰硕教育服务有限公司 | 笔迹图形分析方法、装置及电子设备 |
CN112486337B (zh) * | 2020-11-17 | 2023-11-24 | 深圳市鹰硕技术有限公司 | 笔迹图形分析方法、装置及电子设备 |
CN113253837A (zh) * | 2021-04-01 | 2021-08-13 | 作业帮教育科技(北京)有限公司 | 空中书写方法、装置、线上直播系统和计算机设备 |
CN112990346A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
CN112990349A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
CN112990345A (zh) * | 2021-04-09 | 2021-06-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
CN113191309A (zh) * | 2021-05-19 | 2021-07-30 | 杭州点望科技有限公司 | 一种手写汉字的识别、评分、纠错方法及系统 |
CN113537801A (zh) * | 2021-07-23 | 2021-10-22 | 重庆晋才富熙科技有限公司 | 板书处理方法、装置、终端和存储介质 |
CN113537801B (zh) * | 2021-07-23 | 2023-01-10 | 重庆晋才富熙科技有限公司 | 板书处理方法、装置、终端和存储介质 |
CN114332514B (zh) * | 2022-03-17 | 2022-06-07 | 北京许先网科技发展有限公司 | 一种字体测评方法及系统 |
CN114332514A (zh) * | 2022-03-17 | 2022-04-12 | 北京许先网科技发展有限公司 | 一种字体测评方法及系统 |
CN114782964A (zh) * | 2022-06-20 | 2022-07-22 | 阿里巴巴(中国)有限公司 | 图像处理方法、存储介质以及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111626297A (zh) | 文字书写质量评价方法、装置、电子设备和记录介质 | |
JP4745758B2 (ja) | テキストおよびグラフィクスの空間認識およびグループ化 | |
CN111563502B (zh) | 图像的文本识别方法、装置、电子设备及计算机存储介质 | |
US11783615B2 (en) | Systems and methods for language driven gesture understanding | |
CN112418216B (zh) | 一种复杂自然场景图像中的文字检测方法 | |
CN109214471A (zh) | 评价练字字帖中的书写字的方法及系统 | |
CN111507349B (zh) | 一种ocr识别模型训练中的动态数据增强方法 | |
CN112712273B (zh) | 一种基于骨架相似度的手写体汉字美观度评判方法 | |
CN112069900A (zh) | 基于卷积神经网络的票据文字识别方法及系统 | |
CN113762269A (zh) | 基于神经网络的中文字符ocr识别方法、系统、介质及应用 | |
Tan et al. | Performance analysis of Otsu thresholding for sign language segmentation | |
CN110659398A (zh) | 一种基于数学图表类数据集的视觉问答方法 | |
CN114445853A (zh) | 一种视觉手势识别系统识别方法 | |
CN111986117A (zh) | 一种算术作业批改系统及方法 | |
CN111985184A (zh) | 基于ai视觉下的书写字体临摹辅助方法、系统、装置 | |
CN112037239B (zh) | 基于多层次显式关系选择的文本指导图像分割方法 | |
CN115984875B (zh) | 一种硬笔楷书临摹作品的笔画相似性评价方法及系统 | |
CN114241486A (zh) | 一种提高识别试卷学生信息准确率的方法 | |
CN115019396A (zh) | 一种学习状态监测方法、装置、设备及介质 | |
CN113420760A (zh) | 一种基于分割和形变lstm的手写体蒙古文检测和识别方法 | |
CN112597925A (zh) | 手写字迹的识别/提取、擦除方法及擦除系统、电子设备 | |
CN112836467A (zh) | 一种图像处理方法及装置 | |
CN112749691A (zh) | 图像处理方法及相关设备 | |
Liu et al. | A Connected Components Based Layout Analysis Approach for Educational Documents | |
Snoussi et al. | Text lines segmentation of handwritten Arabic script using outer isothetic cover |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230607 Address after: 6001, 6th Floor, No.1 Kaifeng Road, Shangdi Information Industry Base, Haidian District, Beijing, 100085 Applicant after: Beijing Baige Feichi Technology Co.,Ltd. Address before: 100085 4001, 4th floor, No.1 Kaifa Road, Shangdi Information Industry base, Haidian District, Beijing Applicant before: XIAOCHUANCHUHAI EDUCATION TECHNOLOGY (BEIJING) CO.,LTD. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200904 |
|
RJ01 | Rejection of invention patent application after publication |