CN115661183B - 一种基于边缘计算的智能扫描管理系统及方法 - Google Patents

一种基于边缘计算的智能扫描管理系统及方法 Download PDF

Info

Publication number
CN115661183B
CN115661183B CN202211679176.5A CN202211679176A CN115661183B CN 115661183 B CN115661183 B CN 115661183B CN 202211679176 A CN202211679176 A CN 202211679176A CN 115661183 B CN115661183 B CN 115661183B
Authority
CN
China
Prior art keywords
handwriting
data
printing
block
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211679176.5A
Other languages
English (en)
Other versions
CN115661183A (zh
Inventor
杨兴中
黄利
周雨桐
张彦伟
杨胜
陈恩占
储晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Kungfu Bean Information Technology Co ltd
Original Assignee
Nanjing Kungfu Bean Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Kungfu Bean Information Technology Co ltd filed Critical Nanjing Kungfu Bean Information Technology Co ltd
Priority to CN202211679176.5A priority Critical patent/CN115661183B/zh
Publication of CN115661183A publication Critical patent/CN115661183A/zh
Application granted granted Critical
Publication of CN115661183B publication Critical patent/CN115661183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明涉及文字管理技术领域,具体为一种基于边缘计算的智能扫描管理系统及方法,包括以下步骤:S1:采集试卷扫描的图像信息;S2:存储所有采集到的数据;S3:利用边缘检测算法提取试卷的图像特征;S4:区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;S5:对分析的结果进行处理;S6:显示空白试卷内容并做打印处理;通过将扫描的页面数据分割成多个区块,将文字用区块限制,大大提高了数据分析的准确性;通过设计一个可以区分手写字迹和印刷字迹的同时能够替换需要修改的印刷字迹的系统,极大地优化了试卷翻新功能。

Description

一种基于边缘计算的智能扫描管理系统及方法
技术领域
本发明涉及文字管理技术领域,具体为一种基于边缘计算的智能扫描管理系统及方法。
背景技术
许多学生在做试卷时都会进行改错,而在原来的试卷上进行改错非常麻烦,不仅要使用不同颜色的笔,而且试卷的面积有限,大大制约了改错题的效果;因此,随着打印技术的不断更新与发展,产生了试卷翻新的功能,它可以实现字迹擦除功能,大大减少了学生在学习时改错题的时间,提高学习效率。
然而,在现有技术中,存在需要修改试卷题目等印刷字迹的现象,此时,若使用试卷翻新的功能时,修改题目的字迹也会消失,从而影响学生对试卷的二次使用率。
所以,人们需要一种基于边缘计算的智能扫描管理系统及方法来解决上述问题,通过设计一个可以区分手写字迹和印刷字迹的同时能够替换需要修改的印刷字迹的系统,极大地优化了试卷翻新功能,提高了学生对试卷的二次使用率。
发明内容
本发明的目的在于提供一种基于边缘计算的智能扫描管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于边缘计算的智能扫描管理方法,包括以下步骤:
S1:采集试卷扫描的图像信息;
S2:存储所有采集到的数据;
S3:利用边缘检测算法提取试卷的图像特征;
S4:区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
S5:对分析的结果进行处理;
S6:显示空白试卷内容并做打印处理。
进一步的,在步骤S1中:采集试卷扫描的图像信息,得到图像信息的像素点集合
Figure 496571DEST_PATH_IMAGE001
进一步的,在步骤S2中:存储所有采集到的数据,同时存储字体库。
进一步的,在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊,简化图像所 带的信息作为后续其它的图像处理,便于确认文字范围,有利于后续对图像中文字的识别: 建立二维平面坐标,则得到图像信息的像素点集合
Figure 472748DEST_PATH_IMAGE001
;根据公式:
Figure 389888DEST_PATH_IMAGE002
,进一步得到边缘模糊后的图像信息集合
Figure 966363DEST_PATH_IMAGE003
;其中,
Figure 627152DEST_PATH_IMAGE004
表示像素点
Figure 707103DEST_PATH_IMAGE005
对应的像素值,z表示滤波器大小,
Figure 77036DEST_PATH_IMAGE006
表示高斯滤波,
Figure 875228DEST_PATH_IMAGE007
表示 常数。
进一步的,在步骤S4中:系统从图像信息集合
Figure 339707DEST_PATH_IMAGE003
中获取试卷文字数据为
Figure 274165DEST_PATH_IMAGE008
;同时,利用DFS搜索算法将扫描的页面数据分割成
Figure 64266DEST_PATH_IMAGE009
个区块,将文字 用区块限制,使区块内的文字数量很少,相当于一两个词汇,便于对后续印刷字迹和手写字 迹的分析,大大提高了数据分析的准确性;则任意区块内的文字数据为
Figure 94627DEST_PATH_IMAGE010
,其中,
Figure 97218DEST_PATH_IMAGE011
Figure 151762DEST_PATH_IMAGE012
表示区块j的文字总个数;所述DFS搜索算法 属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:
S401:在区块内区分手写字迹和印刷字迹,步骤如下:
K1:将文字数据
Figure 112765DEST_PATH_IMAGE013
与字体库
Figure 354390DEST_PATH_IMAGE014
进行对比:通过遍历
Figure 176984DEST_PATH_IMAGE009
区块,提取文字数据
Figure 351613DEST_PATH_IMAGE010
,根据对比公式:
Figure 952359DEST_PATH_IMAGE015
,得到区块j的文字相似度集合
Figure 212439DEST_PATH_IMAGE016
;其中,
Figure 573144DEST_PATH_IMAGE017
表示区块j内每一个文字与字体库的相似度值;
K2:比较相似度
Figure 602280DEST_PATH_IMAGE017
大小,区分手写字迹和印刷字迹:通过遍历相似度集合
Figure 373927DEST_PATH_IMAGE016
,若
Figure 121303DEST_PATH_IMAGE018
,则表示区块j内的文字
Figure 534967DEST_PATH_IMAGE017
为印刷字迹,反之,若
Figure 169342DEST_PATH_IMAGE019
,则表示区 块j内的文字
Figure 377469DEST_PATH_IMAGE017
为手写字迹;
S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:
U1:比较相似度集合
Figure 346562DEST_PATH_IMAGE020
Figure 298338DEST_PATH_IMAGE021
的关系:若存在
Figure 36487DEST_PATH_IMAGE022
,说明相似度集合
Figure 166248DEST_PATH_IMAGE020
中 存在大于阈值
Figure 622637DEST_PATH_IMAGE021
和小于阈值
Figure 378103DEST_PATH_IMAGE021
的子集,则表示区块j内同时存在印刷字迹和手写字迹,说明区 块
Figure 970759DEST_PATH_IMAGE023
内的印刷字迹存在需要修改的可能性,此时,进入步骤U2;反之,若存在
Figure 537000DEST_PATH_IMAGE024
,则表示区块
Figure 480686DEST_PATH_IMAGE023
内的印刷字迹不需要修改;
U2:由步骤U1确定区块内同时存在印刷字迹和手写字迹,表示印刷字迹可能存在 修改,则遍历区块j的文字数据为
Figure 508684DEST_PATH_IMAGE025
,将
Figure 221425DEST_PATH_IMAGE026
Figure 207836DEST_PATH_IMAGE027
进行筛选分类,分别得 到印刷字迹集
Figure 123971DEST_PATH_IMAGE028
和手写字迹集
Figure 221240DEST_PATH_IMAGE029
;其中,
Figure 788487DEST_PATH_IMAGE030
表示区块j 的印刷字迹总个数,
Figure 945799DEST_PATH_IMAGE031
表示区块j的手写字迹总个数;
U3:计算印刷字迹和手写字迹的文字笔画相似度:将区块j内的印刷字迹集
Figure 614809DEST_PATH_IMAGE032
和手 写字迹集
Figure 250190DEST_PATH_IMAGE033
利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每 一个文字
Figure 671944DEST_PATH_IMAGE034
进行拆解,则得到文字笔画向量集
Figure 157DEST_PATH_IMAGE035
Figure 874572DEST_PATH_IMAGE036
;通 过遍历
Figure 613112DEST_PATH_IMAGE032
Figure 889373DEST_PATH_IMAGE033
中的每一个文字,根据公式:
Figure 388487DEST_PATH_IMAGE037
,得到相似度 集合
Figure 15778DEST_PATH_IMAGE038
;其中,
Figure 727382DEST_PATH_IMAGE039
Figure 140040DEST_PATH_IMAGE040
分别表示字迹笔画数,
Figure 810056DEST_PATH_IMAGE041
表示
Figure 659063DEST_PATH_IMAGE032
中每一个文字 与
Figure 439937DEST_PATH_IMAGE033
中每一个文字的相似度值;其中,所述Word Embedding算法属于本领域技术人员的常 规技术手段,因此,并未做出过多的赘述;
U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:通过遍历相似度 集合
Figure 690790DEST_PATH_IMAGE042
,若存在
Figure 282439DEST_PATH_IMAGE043
,其中,
Figure 884322DEST_PATH_IMAGE044
为所设阈值,则表示印刷字迹集
Figure 468887DEST_PATH_IMAGE032
中存在需要修改的文字
Figure 574246DEST_PATH_IMAGE045
, 此时,提取手写字迹集
Figure 336797DEST_PATH_IMAGE033
中相应的文字
Figure 160397DEST_PATH_IMAGE046
,确认修改数据为
Figure 283073DEST_PATH_IMAGE045
;反之,则表示区块j内的印 刷字迹集
Figure 508518DEST_PATH_IMAGE032
不需要修改。
进一步的,在步骤S5中:对分析的结果进行处理,具体包括以下步骤:
S501:由步骤U4确认需要修改的印刷字迹,将需要修改的印刷字迹
Figure 691238DEST_PATH_IMAGE045
替换为与之 对应的手写字迹
Figure 18445DEST_PATH_IMAGE046
S502:利用手写字迹模拟算法将手写字迹
Figure 679234DEST_PATH_IMAGE046
转换成印刷字体;其中,所述手写字迹 模拟算法属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
S503:当步骤U1和步骤U4确认区块内的印刷字迹不需要修改时,消除试卷页面的所有手写字迹,保留修改后的印刷字迹。
进一步的,在步骤S6中:显示修改数据后的空白试卷内容并做打印处理,通过对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题;
一种实现一种基于边缘计算的智能扫描管理方法的智能扫描管理系统,所述系统包括:数据采集模块、数据库、数据分析模块、数据处理模块和数据反馈模块;
所述数据采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述数据分析模块的输入端,所述数据分析模块的输出端连接所述数据处理模块的输入端,所述数据处理模块的输出端连接所述数据反馈模块的输入端;
通过所述数据采集模块采集试卷扫描的图像信息;
通过所述数据库存储所有采集到的数据;
通过所述数据分析模块区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
通过所述数据处理模块对所述数据分析模块分析的结果进行处理;
通过所述数据反馈模块显示空白试卷内容并做打印处理。
进一步的,所述数据分析模块包括方格划分单元、字迹识别单元和关联性分析单元;
所述方格划分单元用于利用DFS搜索算法将试卷扫描页面划分为多个区块,便于后续对印刷字迹是否需要修改的判断;所述字迹识别单元用于识别区块内是否同时存在手写字迹和印刷字迹,若存在,则进入所述关联性分析单元,反之,则进入所述数据处理模块;所述关联性分析单元用于利用相似性算法分析区块内手写字迹与印刷字迹的关联性,进一步判断印刷字迹是否需要修改。
进一步的,所述数据处理模块包括替换单元、字迹转换单元和选择单元;
所述替换单元用于将需要修改的印刷字迹替换为与之对应的手写字迹,并将替换的数据发送至所述字迹转换单元;所述字迹转换单元用于将替换后的手写字迹转换为印刷字迹;所述选择单元用于消除手写字迹,保留修改后的印刷字迹,并将数据发送至所述数据反馈模块。
进一步的,所述数据反馈模块包括显示单元和打印控制单元;
所述显示单元用于显示修改后的空白试卷;所述打印控制单元用于将试卷进行打印处理;对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
与现有技术相比,本发明所达到的有益效果是:
本发明通过利用边缘检测算法简化图像所带的信息作为后续其它的图像处理,便 于确认文字范围,更有利于后续对图像中文字的识别;通过将扫描的页面数据分割成
Figure 759185DEST_PATH_IMAGE009
个区块,将文字用区块限制,便于对后续印刷字迹和手写字迹的分析,大大提高了数据分析 的准确性;通过利用对比公式比较区块内字体相似度来区分手写字迹和印刷字迹,更有利 于提高对字迹识别的准确性;通过比较相似度集合与阈值的关系并将数据进行筛选分类, 更有利于后续对区块内的印刷字迹是否需要修改的判断;通过比较印刷字迹和手写字迹的 文字笔画相似度,进一步确认区块内的印刷字迹是否需要修改,极大地提高的数据判断的 准确性和严谨性;利用手写字迹模拟算法将手写字迹转换成印刷字体,避免后续对修改后 的字迹进行清理,提高了学生对试卷的二次使用率;解决了使用“试卷翻新”的功能时,修改 题目的字迹也会消失的问题,优化了数据,使功能更加完善。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于边缘计算的智能扫描管理系统的结构图;
图2是本发明一种基于边缘计算的智能扫描管理方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:一种基于边缘计算的智能扫描管理方法,包括以下步骤:
S1:采集试卷扫描的图像信息;
在步骤S1中:采集试卷扫描的图像信息,得到图像信息的像素点集合
Figure 378385DEST_PATH_IMAGE001
S2:存储所有采集到的数据;
在步骤S2中:存储所有采集到的数据,同时存储字体库作为训练样本集。
S3:利用边缘检测算法提取试卷的图像特征;
在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊,简化图像所带的信息 作为后续其它的图像处理,便于确认文字范围,有利于后续对图像中文字的识别:建立二维 平面坐标,则得到图像信息的像素点集合
Figure 910998DEST_PATH_IMAGE001
;根据公式:
Figure 126210DEST_PATH_IMAGE002
,进一步得到边缘模糊后的图像信息集合
Figure 326247DEST_PATH_IMAGE003
;其中,
Figure 116348DEST_PATH_IMAGE004
表示像素点
Figure 870678DEST_PATH_IMAGE005
对应的像素值,z表示滤波器大小,
Figure 420739DEST_PATH_IMAGE006
表示高斯滤波,
Figure 209703DEST_PATH_IMAGE007
表示 常数。
S4:区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
在步骤S4中:系统从图像信息集合
Figure 905127DEST_PATH_IMAGE003
中获取试卷文字数据为
Figure 677911DEST_PATH_IMAGE008
;同时,利用DFS搜索算法将扫描的页面数据分割成
Figure 484193DEST_PATH_IMAGE009
个区块,将文字 用区块限制,使区块内的文字数量很少,相当于一两个词汇,便于对后续印刷字迹和手写字 迹的分析,大大提高了数据分析的准确性;则任意区块内的文字数据为
Figure 143975DEST_PATH_IMAGE010
,其中,
Figure 275880DEST_PATH_IMAGE011
Figure 4801DEST_PATH_IMAGE012
表示区块j的文字总个数;所述DFS搜索算法 属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:
S401:在区块内区分手写字迹和印刷字迹,步骤如下:
K1:将文字数据
Figure 880353DEST_PATH_IMAGE013
与字体库P进行对比:通过遍历
Figure 643910DEST_PATH_IMAGE009
区块,提取文字数据
Figure 691588DEST_PATH_IMAGE010
,根据对比公式:
Figure 173385DEST_PATH_IMAGE015
,得到区块j的文字相似度集合
Figure 587049DEST_PATH_IMAGE016
;其中,
Figure 470691DEST_PATH_IMAGE017
表示区块j内每一个文字与字体库的相似度值;
K2:比较相似度
Figure 163972DEST_PATH_IMAGE017
大小,区分手写字迹和印刷字迹:通过遍历相似度集合
Figure 133065DEST_PATH_IMAGE016
,若
Figure 350420DEST_PATH_IMAGE018
,则表示区块j内的文字
Figure 88569DEST_PATH_IMAGE017
为印刷字迹,反之,若
Figure 467597DEST_PATH_IMAGE019
,则表示区 块j内的文字
Figure 674719DEST_PATH_IMAGE017
为手写字迹,其中,
Figure 164606DEST_PATH_IMAGE021
表示所设阈值;
S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:
U1:比较相似度集合
Figure 22841DEST_PATH_IMAGE020
Figure 838350DEST_PATH_IMAGE021
的关系:若存在
Figure 267188DEST_PATH_IMAGE022
,说明相似度集合
Figure 560766DEST_PATH_IMAGE020
中 存在大于阈值
Figure 273508DEST_PATH_IMAGE021
和小于阈值
Figure 259918DEST_PATH_IMAGE021
的子集,则表示区块j内同时存在印刷字迹和手写字迹,说明区 块
Figure 690899DEST_PATH_IMAGE023
内的印刷字迹存在需要修改的可能性,此时,进入步骤U2;反之,若存在
Figure 538901DEST_PATH_IMAGE024
,则表示区块内的印刷字迹不需要修改;
U2:由步骤U1确定区块内同时存在印刷字迹和手写字迹,表示印刷字迹可能存在 修改,则遍历区块j的文字数据为
Figure 840569DEST_PATH_IMAGE025
,将
Figure 997881DEST_PATH_IMAGE026
Figure 650579DEST_PATH_IMAGE027
进行筛选分类,分别得 到印刷字迹集
Figure 285960DEST_PATH_IMAGE028
和手写字迹集
Figure 724026DEST_PATH_IMAGE029
;其中,
Figure 52239DEST_PATH_IMAGE030
表示区块j 的印刷字迹总个数,
Figure 192233DEST_PATH_IMAGE031
表示区块j的手写字迹总个数;
U3:计算印刷字迹和手写字迹的文字笔画相似度:将区块j内的印刷字迹集
Figure 365726DEST_PATH_IMAGE032
和手 写字迹集
Figure 658298DEST_PATH_IMAGE033
利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每 一个文字
Figure 157412DEST_PATH_IMAGE034
进行拆解,则得到文字笔画向量集
Figure 519123DEST_PATH_IMAGE035
Figure 761886DEST_PATH_IMAGE036
;通 过遍历
Figure 423811DEST_PATH_IMAGE032
Figure 578980DEST_PATH_IMAGE033
中的每一个文字,根据公式:
Figure 427988DEST_PATH_IMAGE037
,得到相似度 集合
Figure 474441DEST_PATH_IMAGE038
;其中,
Figure 990873DEST_PATH_IMAGE039
Figure 566211DEST_PATH_IMAGE040
分别表示字迹笔画数,
Figure 647387DEST_PATH_IMAGE041
表示
Figure 231952DEST_PATH_IMAGE032
中每一个文字 与
Figure 602891DEST_PATH_IMAGE033
中每一个文字的相似度值;其中,所述Word Embedding算法属于本领域技术人员的常 规技术手段,因此,并未做出过多的赘述;
U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:通过遍历相似度 集合
Figure 631021DEST_PATH_IMAGE042
,若存在
Figure 454620DEST_PATH_IMAGE043
,其中,
Figure 577297DEST_PATH_IMAGE044
为所设阈值,则表示印刷字迹集
Figure 68321DEST_PATH_IMAGE032
中存在需要修改的文字
Figure 251041DEST_PATH_IMAGE045
, 此时,提取手写字迹集
Figure 47090DEST_PATH_IMAGE033
中相应的文字
Figure 973458DEST_PATH_IMAGE046
,确认修改数据为
Figure 318988DEST_PATH_IMAGE045
;反之,则表示区块j内的印 刷字迹集
Figure 672609DEST_PATH_IMAGE032
不需要修改。
S5:对分析的结果进行处理;
在步骤S5中:对分析的结果进行处理,具体包括以下步骤:
S501:由步骤U4确认需要修改的印刷字迹,将需要修改的印刷字迹
Figure 205222DEST_PATH_IMAGE045
替换为与之 对应的手写字迹
Figure 686013DEST_PATH_IMAGE046
S502:利用手写字迹模拟算法将手写字迹
Figure 886050DEST_PATH_IMAGE046
转换成印刷字体;其中,所述手写字迹 模拟算法属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
S503:当步骤U1和步骤U4确认区块内的印刷字迹不需要修改时,消除试卷页面的所有手写字迹,保留修改后的印刷字迹。
S6:显示空白试卷内容并做打印处理。
在步骤S6中:显示修改数据后的空白试卷内容并做打印处理,通过对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
一种实现一种基于边缘计算的智能扫描管理方法的智能扫描管理系统,所述系统包括:数据采集模块、数据库、数据分析模块、数据处理模块和数据反馈模块;
所述数据采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述数据分析模块的输入端,所述数据分析模块的输出端连接所述数据处理模块的输入端,所述数据处理模块的输出端连接所述数据反馈模块的输入端;
通过所述数据采集模块采集试卷扫描的图像信息;
所述数据采集模块通过扫描试卷页面,采集试卷的图像信息,并将采集到的信息发送至所述数据库。
通过所述数据库存储所有采集到的数据;
所述数据库用于存储所有采集到的数据,同时存储字体库作为训练样本集。
通过所述数据分析模块区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
所述数据分析模块包括方格划分单元、字迹识别单元和关联性分析单元;
所述方格划分单元用于利用DFS搜索算法将试卷扫描页面划分为多个区块,便于后续对印刷字迹是否需要修改的判断;所述字迹识别单元用于识别区块内是否同时存在手写字迹和印刷字迹,若存在,则进入所述关联性分析单元,反之,则进入所述数据处理模块;所述关联性分析单元用于利用相似性算法分析区块内手写字迹与印刷字迹的关联性,进一步判断印刷字迹是否需要修改。
通过所述数据处理模块对所述数据分析模块分析的结果进行处理;
所述数据处理模块包括替换单元、字迹转换单元和选择单元;
所述替换单元用于将需要修改的印刷字迹替换为与之对应的手写字迹,并将替换的数据发送至所述字迹转换单元;所述字迹转换单元用于将替换后的手写字迹转换为印刷字迹;所述选择单元用于消除手写字迹,保留修改后的印刷字迹,并将数据发送至所述数据反馈模块。
通过所述数据反馈模块显示空白试卷内容并做打印处理。
所述数据反馈模块包括显示单元和打印控制单元;
所述显示单元用于显示修改后的空白试卷;所述打印控制单元用于将试卷进行打印处理;对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
实施例一:
在步骤S1中:采集试卷扫描的图像信息,得到图像信息的像素点集合
Figure 144993DEST_PATH_IMAGE001
在步骤S2中:存储所有采集到的数据,同时存储字体库作为训练样本集。
在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊,简化图像所带的信息 作为后续其它的图像处理:建立二维平面坐标,则得到图像信息的像素点集合
Figure 430481DEST_PATH_IMAGE001
;根据公式:
Figure 698651DEST_PATH_IMAGE002
,进一步得到边缘模糊后 的图像信息集合
Figure 503927DEST_PATH_IMAGE003
;其中,
Figure 199351DEST_PATH_IMAGE004
表示像素点
Figure 706555DEST_PATH_IMAGE005
对应的像素值,z表示滤波器大 小,
Figure 778417DEST_PATH_IMAGE006
表示高斯滤波,
Figure 438199DEST_PATH_IMAGE007
表示常数。
在步骤S4中:系统从图像信息集合
Figure 304524DEST_PATH_IMAGE003
中获取试卷文字数据为
Figure 564604DEST_PATH_IMAGE008
;同时,利用DFS搜索算法将扫描的页面数据分割成
Figure 174577DEST_PATH_IMAGE047
个区块,则每 一个区块内的文字数据为
Figure 938134DEST_PATH_IMAGE048
,其中,
Figure 991671DEST_PATH_IMAGE011
区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:
S401:在区块内区分手写字迹和印刷字迹,步骤如下:
K1:将文字数据
Figure 207889DEST_PATH_IMAGE013
与字体库P进行对比:通过遍历
Figure 621553DEST_PATH_IMAGE047
区块,提取某一区块j内 文字数据,其中包含4个文字,
Figure 505195DEST_PATH_IMAGE049
,根据对比公式:
Figure 713323DEST_PATH_IMAGE015
,得到区块j的文字相似度集合
Figure 433148DEST_PATH_IMAGE050
K2:比较相似度
Figure 650503DEST_PATH_IMAGE017
大小,区分手写字迹和印刷字迹:通过遍历相似度集合
Figure 123073DEST_PATH_IMAGE016
,若
Figure 767681DEST_PATH_IMAGE051
,则表示区块j内的文字
Figure 958490DEST_PATH_IMAGE017
为印刷字迹,反之,若
Figure 724409DEST_PATH_IMAGE052
,则表示 区块j内的文字
Figure 317064DEST_PATH_IMAGE017
为手写字迹;
S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:
U1:比较相似度集合
Figure 866995DEST_PATH_IMAGE020
Figure 810680DEST_PATH_IMAGE021
的关系:由于
Figure 854990DEST_PATH_IMAGE053
,则表示区块
Figure 567731DEST_PATH_IMAGE023
内的印 刷字迹存在需要修改的可能性,此时,进入步骤U2;
U2:遍历区块j的文字数据
Figure 554142DEST_PATH_IMAGE049
,将
Figure 719544DEST_PATH_IMAGE054
Figure 551234DEST_PATH_IMAGE055
进行筛选分类,分别得到印刷字迹集
Figure 134793DEST_PATH_IMAGE056
和手写字迹集
Figure 292105DEST_PATH_IMAGE057
U3:计算印刷字迹和手写字迹的文字笔画相似度:将印刷字迹集
Figure 679224DEST_PATH_IMAGE032
和手写字迹集
Figure 580184DEST_PATH_IMAGE033
利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每一个文字
Figure 18249DEST_PATH_IMAGE034
进行拆解,则得到文字笔画向量集
Figure 346463DEST_PATH_IMAGE035
Figure 220878DEST_PATH_IMAGE036
;通过遍历
Figure 659949DEST_PATH_IMAGE032
Figure 201789DEST_PATH_IMAGE033
中的每一个文字,根据公式:
Figure 451636DEST_PATH_IMAGE037
,得到相似度集合
Figure 813347DEST_PATH_IMAGE058
U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:遍历相似度集合
Figure 56110DEST_PATH_IMAGE042
,由于存在
Figure 186877DEST_PATH_IMAGE059
,则表示印刷字迹集
Figure 856892DEST_PATH_IMAGE032
中存在需要修改的文字
Figure 722211DEST_PATH_IMAGE060
,此时,提取 手写字迹集
Figure 503086DEST_PATH_IMAGE033
中相应的文字
Figure 753938DEST_PATH_IMAGE061
,确认修改数据为
Figure 594855DEST_PATH_IMAGE060
在步骤S5中:对分析的结果进行处理,具体包括以下步骤:
S501:将需要修改的印刷字迹
Figure 947470DEST_PATH_IMAGE060
替换为与之对应的手写字迹
Figure 266456DEST_PATH_IMAGE061
S502:利用手写字迹模拟算法将手写字迹
Figure 637395DEST_PATH_IMAGE046
转换成印刷字体;
S503:消除试卷页面的所有手写字迹,保留修改后的印刷字迹。
在步骤S6中:显示修改数据后的空白试卷内容并做打印处理,通过对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于边缘计算的智能扫描管理方法,其特征在于:包括以下步骤:
S1:采集试卷扫描的图像信息;
S2:存储所有采集到的数据;
S3:利用边缘检测算法提取试卷的图像特征;
S4:获取步骤S3中的图像特征,根据图像特征区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
S5:对分析的结果进行处理;
S6:显示空白试卷内容并做打印处理;
在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊:建立二维平面坐标,则得到图像信息的像素点集合
Figure QLYQS_1
;根据公式:
Figure QLYQS_2
,进一步得到边缘模糊后的图像信息集合
Figure QLYQS_3
;其中,
Figure QLYQS_4
表示像素点
Figure QLYQS_5
对应的像素值,z表示滤波器大小,
Figure QLYQS_6
表示高斯滤波,
Figure QLYQS_7
表示常数;
在步骤S4中:系统从图像信息集合
Figure QLYQS_8
中获取试卷文字数据为
Figure QLYQS_9
;同时,利用DFS搜索算法将扫描的页面数据分割成
Figure QLYQS_10
个区块,则任意区块内的文字数据为
Figure QLYQS_11
,其中,
Figure QLYQS_12
Figure QLYQS_13
表示区块j的文字总个数;
区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:
S401:在区块内区分手写字迹和印刷字迹,步骤如下:
K1:将文字数据
Figure QLYQS_14
与字体库
Figure QLYQS_15
进行对比:通过遍历
Figure QLYQS_16
区块,提取文字数据
Figure QLYQS_17
,根据对比公式:
Figure QLYQS_18
,得到区块j的文字相似度集合
Figure QLYQS_19
;其中,
Figure QLYQS_20
表示区块j内每一个文字与字体库的相似度值;
K2:比较相似度
Figure QLYQS_21
大小,区分手写字迹和印刷字迹:通过遍历相似度集合
Figure QLYQS_22
,若
Figure QLYQS_23
,则表示区块j内的文字
Figure QLYQS_24
为印刷字迹,反之,若
Figure QLYQS_25
,则表示区块j内的文字
Figure QLYQS_26
为手写字迹,其中,
Figure QLYQS_27
为所设阈值;
S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:
U1:比较相似度集合
Figure QLYQS_28
Figure QLYQS_29
的关系:若存在
Figure QLYQS_30
,则表示区块
Figure QLYQS_31
内的印刷字迹存在需要修改的可能性,此时,进入步骤U2;反之,若存在
Figure QLYQS_32
,则表示区块
Figure QLYQS_33
内的印刷字迹不需要修改,此时,进入步骤S503;
U2:由步骤U1确定区块内同时存在印刷字迹和手写字迹,表示印刷字迹可能存在修改,则遍历区块j的文字数据为
Figure QLYQS_34
,将
Figure QLYQS_35
Figure QLYQS_36
的数据进行筛选分类,分别得到印刷字迹集
Figure QLYQS_37
和手写字迹集
Figure QLYQS_38
;其中,
Figure QLYQS_39
表示区块j的印刷字迹总个数,
Figure QLYQS_40
表示区块j的手写字迹总个数;
U3:计算印刷字迹和手写字迹的文字笔画相似度:将区块j内的印刷字迹集
Figure QLYQS_43
和手写字迹集
Figure QLYQS_47
利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每一个文字
Figure QLYQS_54
进行拆解,则得到文字笔画向量集
Figure QLYQS_44
Figure QLYQS_46
;通过遍历
Figure QLYQS_50
Figure QLYQS_53
中的每一个文字,根据公式:
Figure QLYQS_41
,得到相似度集合
Figure QLYQS_49
;其中,
Figure QLYQS_51
Figure QLYQS_52
分别表示字迹笔画数,
Figure QLYQS_42
表示
Figure QLYQS_45
中每一个文字与
Figure QLYQS_48
中每一个文字的相似度值;
U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:遍历相似度集合
Figure QLYQS_55
,若存在
Figure QLYQS_58
,则表示印刷字迹集
Figure QLYQS_62
中存在需要修改的文字
Figure QLYQS_57
,此时,提取手写字迹集
Figure QLYQS_59
中相应的文字
Figure QLYQS_60
,确认修改数据为
Figure QLYQS_61
,进入步骤S501;反之,则表示区块j内的印刷字迹集
Figure QLYQS_56
不需要修改,此时,进入步骤S503;
在步骤S5中:对分析的结果进行处理,具体包括以下步骤:
S501:由步骤U4确认需要修改的印刷字迹,将需要修改的印刷字迹
Figure QLYQS_63
替换为与之对应的手写字迹
Figure QLYQS_64
S502:利用手写字迹模拟算法将手写字迹
Figure QLYQS_65
转换成印刷字体;
S503:当步骤U1和步骤U4确认区块内的印刷字迹不需要修改时,消除试卷页面的所有手写字迹,保留修改后的印刷字迹。
2.一种实现权利要求1所述的一种基于边缘计算的智能扫描管理方法的智能扫描管理系统,其特征在于:所述系统包括:数据采集模块、数据库、数据分析模块、数据处理模块和数据反馈模块;
所述数据采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述数据分析模块的输入端,所述数据分析模块的输出端连接所述数据处理模块的输入端,所述数据处理模块的输出端连接所述数据反馈模块的输入端;
通过所述数据采集模块采集试卷扫描的图像信息;
通过所述数据库存储所有采集到的数据;
通过所述数据分析模块区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
通过所述数据处理模块对所述数据分析模块分析的结果进行处理;
通过所述数据反馈模块显示空白试卷内容并做打印处理。
3.根据权利要求2所述的智能扫描管理系统,其特征在于:所述数据分析模块包括方格划分单元、字迹识别单元和关联性分析单元;
所述方格划分单元用于利用DFS搜索算法将试卷扫描页面划分为多个区块;所述字迹识别单元用于识别区块内是否同时存在手写字迹和印刷字迹,若存在,则进入所述关联性分析单元,反之,则进入所述数据处理模块;所述关联性分析单元用于利用相似性算法分析区块内手写字迹与印刷字迹的关联性,进一步判断印刷字迹是否需要修改。
4.根据权利要求3所述的智能扫描管理系统,其特征在于:所述数据处理模块包括替换单元、字迹转换单元和选择单元;
所述替换单元用于将需要修改的印刷字迹替换为与之对应的手写字迹,并将替换的数据发送至所述字迹转换单元;所述字迹转换单元用于将替换后的手写字迹转换为印刷字迹;所述选择单元用于消除手写字迹,保留修改后的印刷字迹,并将数据发送至所述数据反馈模块。
5.根据权利要求4所述的智能扫描管理系统,其特征在于:所述数据反馈模块包括显示单元和打印控制单元;
所述显示单元用于显示修改后的空白试卷;所述打印控制单元用于将试卷进行打印处理。
CN202211679176.5A 2022-12-27 2022-12-27 一种基于边缘计算的智能扫描管理系统及方法 Active CN115661183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211679176.5A CN115661183B (zh) 2022-12-27 2022-12-27 一种基于边缘计算的智能扫描管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211679176.5A CN115661183B (zh) 2022-12-27 2022-12-27 一种基于边缘计算的智能扫描管理系统及方法

Publications (2)

Publication Number Publication Date
CN115661183A CN115661183A (zh) 2023-01-31
CN115661183B true CN115661183B (zh) 2023-03-21

Family

ID=85023104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211679176.5A Active CN115661183B (zh) 2022-12-27 2022-12-27 一种基于边缘计算的智能扫描管理系统及方法

Country Status (1)

Country Link
CN (1) CN115661183B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11977830B2 (en) * 2022-09-13 2024-05-07 International Business Machines Corporation Demand-based deployment of font server to an edge device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792425A (zh) * 2021-01-08 2022-07-26 苏州品智信息科技有限公司 一种基于人工智能算法的考生试卷照片错题自动整理方法及相关算法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008520152A (ja) * 2004-11-15 2008-06-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像中のテキストの検出および修正
JP5303865B2 (ja) * 2007-05-23 2013-10-02 株式会社リコー 情報処理装置、及び、情報処理方法
CN106485710A (zh) * 2016-10-18 2017-03-08 广州视源电子科技股份有限公司 一种元件错件检测方法和装置
CN112163529A (zh) * 2020-09-30 2021-01-01 珠海读书郎网络教育有限公司 一种试卷统分的系统及方法
CN114332901A (zh) * 2021-12-31 2022-04-12 上海临冠数据科技有限公司 一种自动组卷方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792425A (zh) * 2021-01-08 2022-07-26 苏州品智信息科技有限公司 一种基于人工智能算法的考生试卷照片错题自动整理方法及相关算法

Also Published As

Publication number Publication date
CN115661183A (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
US10846553B2 (en) Recognizing typewritten and handwritten characters using end-to-end deep learning
CN110210413B (zh) 一种基于深度学习的多学科试卷内容检测与识别系统及方法
Guo et al. Separating handwritten material from machine printed text using hidden markov models
JP5379085B2 (ja) スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
KR100412317B1 (ko) 문자인식/수정방법및장치
US7929769B2 (en) Script recognition for ink notes
US20100303356A1 (en) Method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
CN110555403A (zh) 一种手写字评价方法与系统
CN115661183B (zh) 一种基于边缘计算的智能扫描管理系统及方法
CN113901952A (zh) 一种基于深度学习的印刷体与手写体分开文字识别方法
CN112446259A (zh) 图像处理方法、装置、终端和计算机可读存储介质
Cheng et al. M6doc: A large-scale multi-format, multi-type, multi-layout, multi-language, multi-annotation category dataset for modern document layout analysis
US10586133B2 (en) System and method for processing character images and transforming font within a document
Bhattacharya et al. Understanding contents of filled-in Bangla form images
Al Ghamdi A novel approach to printed Arabic optical character recognition
CN116822634A (zh) 一种基于布局感知提示的文档视觉语言推理方法
Almohri et al. A real-time DSP-based optical character recognition system for isolated Arabic characters using the TI TMS320C6416T
Shtaiwi et al. End-to-End Machine Learning Solution for Recognizing Handwritten Arabic Documents
US20220237397A1 (en) Identifying handwritten signatures in digital images using ocr residues
Kumar et al. Line based robust script identification for indianlanguages
Qi et al. Deeperase: Weakly supervised ink artifact removal in document text images
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
Ghotekar et al. Handwritten Hindi digit recognition
Huang et al. DeepErase: weakly supervised ink artifact removal in document text images
Vidhyavani et al. A Survey on Recognition of Ancient Tamil Brahmi Characters from Epigraphy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant