CN114463567A - 一种基于区块链的智慧教育作业大数据防抄袭方法与系统 - Google Patents
一种基于区块链的智慧教育作业大数据防抄袭方法与系统 Download PDFInfo
- Publication number
- CN114463567A CN114463567A CN202210376249.7A CN202210376249A CN114463567A CN 114463567 A CN114463567 A CN 114463567A CN 202210376249 A CN202210376249 A CN 202210376249A CN 114463567 A CN114463567 A CN 114463567A
- Authority
- CN
- China
- Prior art keywords
- similarity
- plagiarism
- jobs
- job
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于区块链的智慧教育作业大数据防抄袭方法与系统,涉及智慧教育的技术领域。包括对完成的作业进行扫描,并记录时间信息,将扫描图像以及时间信息上传至后台终端;与后台终端连接的智能设备均记录上传者信息以及时间信息;所有作业完成上传后,基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度或局部相似度过高,认定两份作业之间存在抄袭情况。其能够为有效判断作业的抄袭,减轻教职员工的负担。
Description
技术领域
本发明涉及智慧教育的技术领域,具体而言,涉及一种基于区块链的智慧教育作业大数据防抄袭方法与系统。
背景技术
智慧教育在国家的重点扶持下,在减轻家长、教师以及学生任务负担或压力的问题上,发挥着越来越重要的作用。但有些问题依然没有得到妥善解决。其中,学生作业抄袭的问题仍然经常出现,由此对于作业抄袭进行检测,便成为了一个亟待解决的问题。传统的抄袭检测往往依赖于老师或其他教职人员主观判断的方式进行,其不仅消耗了巨大的人力资源,而且还无法保持较高的精准度。尽管有些学校已经采用了图像识别、图像比对等技术,仍然存在一定的误检率。因此,急需一种基于区块链的智慧教育作业大数据防抄袭方法与系统。
发明内容
本发明的目的在于提供一种基于区块链的智慧教育作业大数据防抄袭方法,其能够为有效判断作业的抄袭,减轻教职员工的负担。
本发明的实施例是这样实现的:
第一方面,本申请实施例提供一种基于区块链的智慧教育作业大数据防抄袭方法,其包括利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于智能设备上的学生客户端,将扫描图像以及时间信息上传至后台终端;与后台终端连接的智能设备均记录作业扫描图像的上传者信息以及时间信息;所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步;利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况;当两份作业之间被认定抄袭之后,后台终端检索两份作业的提交记录;根据提交的时间信息,判定后提交的作业为抄袭。
在本发明的一些实施例中,认定两份作业之间存在抄袭情况后的步骤还包括:后台终端将两份作业向教师客户端发送,在教师人工进行判别后,将教师的判断结果上传至后台终端。
在本发明的一些实施例中,所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步的步骤包括:利用SIFT特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第一相似度;利用GIST特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第二相似度;利用HOG特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第三相似度;第一相似度、第二相似度和第三相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;若任意一个相似度结果超过预设第一阈值,则继续下一步。
在本发明的一些实施例中,利用SIFT特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第一相似度的步骤包括:对两份作业扫描图像分别进行特征点检测提取关键点,将关键点进行描述,分别获得两个目标特征点集,对两个目标特征点集进行特征点匹配,然后进行矫正操作;再定位关键点并确定特征方向,生成特征向量,通过各关键点的特征向量,而后进行比较;找出相互匹配的特征点,建立景物间的对应关系;最后利用欧式距离计算它们之间的相似度。
在本发明的一些实施例中,利用GIST特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第二相似度的步骤包括:创建gabor滤波器组,对原彩色的两份作业扫描图像分别求均值转为灰度图像,对灰度图像进行预滤波,并缩放局部对比度,分块计算gabor特征并组合成特征向量,根据特征向量利用欧式距离计算两份作业扫描图像之间的第二相似度。
在本发明的一些实施例中,利用HOG特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第三相似度的步骤包括:将两份作业扫描图像分别进行分割,得到分割图像;将分割图像的伽马空间和颜色空间进行归一化处理;而后计算分割图像横坐标和纵坐标方向的梯度,并根据梯度数据,计算梯度方向;构建方向梯度直方图,并对分割图像进行区域的梯度直方图归一化处理;生成特征向量,根据特征向量利用欧式距离计算两份作业扫描图像之间的第三相似度。
在本发明的一些实施例中,利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况的步骤包括:将两份作业的作业扫描图像分别进行OCR识别,而对识别结果进行比对,若相似度大于或等于第二阈值,直接认定两份作业存在抄袭;反之,继续进行下一步;将两份作业扫描图像在同样的位置分别分割成第一预设数量的区域,分别对每幅图像的区域单独进行OCR识别,计算两份作业扫描图像上对应区域的相似度,若任一区域的相似度等于或高于预设第三阈值,则直接认定两份作业存在抄袭,反之,继续进行下一步;将两份作业扫描图像在同样的位置分别分割成第二预设数量的区域,第二预设数量大于第一预设数量;计算两份作业扫描图像上对应区域的相似度,若任一区域的相似度等于或高于预设第三阈值,则直接认定两份作业存在抄袭,反之,两份作业不存在局部抄袭。
第二方面,本申请实施例提供一种基于区块链的智慧教育作业大数据防抄袭系统,其包括扫描上传模块,用于利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于智能设备上的学生客户端,将扫描图像以及时间信息上传至后台终端;与后台终端连接的智能设备均记录作业扫描图像的上传者信息以及时间信息;相似性初级判断模块,用于所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步;相似性二级判断模块,利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况;抄袭判断模块,当两份作业之间被认定抄袭之后,后台终端检索两份作业的提交记录;根据提交的时间信息,判定后提交的作业为抄袭。
第三方面,本申请实施例提供一种电子设备,包括至少一个处理器、至少一个存储器和数据总线;其中:处理器与存储器通过数据总线完成相互间的通信;存储器存储有可被处理器执行的程序指令,处理器调用程序指令以执行一种基于区块链的智慧教育作业大数据防抄袭方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现一种基于区块链的智慧教育作业大数据防抄袭方法。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
利用基于多特征算子的相似度计算方法优先进行相似度计算,提前准确判别出两份作业之间是否存在抄袭的情况,显著地降低了计算资源消耗;利用基于多空间区域的OCR 相似度计算方法计算相似度,对相似度计算过程中的空间位置充分地进行考虑,由此提出‘整体相似度’和‘局部相似度’的问题(即局部抄袭的问题),进行判断。同时在判断的过程中引入了区块链技术,让更多的人作为见证人,显著地提升了结果的可靠性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明中一种基于区块链的智慧教育作业大数据防抄袭方法的流程图;
图2为本发明中多特征算子的相似度计算方法的流程示意图;
图3为本发明中基于多空间区域的OCR相似度计算方法的流程示意图;
图4为本发明中一种基于区块链的智慧教育作业大数据防抄袭系统的结构示意图;
图5为本发明中一种电子设备的结构示意图。
图标:1、扫描上传模块;2、相似性初级判断模块;3、相似性二级判断模块;4、抄袭判断模块;5、处理器;6、存储器;7、数据总线。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本申请的描述中,需要说明的是,术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
实施例1
请参阅图1,为本申请实施例提供的一种基于区块链的智慧教育作业大数据防抄袭方法,利用基于多特征算子的相似度计算方法优先进行相似度计算,提前准确判别出两份作业之间是否存在抄袭的情况,显著地降低了计算资源消耗;利用基于多空间区域的OCR 相似度计算方法计算相似度,对相似度计算过程中的空间位置充分地进行考虑,由此提出‘整体相似度’和‘局部相似度’的问题(即局部抄袭的问题),进行判断。同时在判断的过程中引入了区块链技术,让更多的人作为见证人,显著地提升了结果的可靠性。
S1:利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于智能设备上的学生客户端,将扫描图像以及时间信息上传至后台终端;与后台终端连接的智能设备均记录作业扫描图像的上传者信息以及时间信息;
例如,某一同学做完作业之后(以小明在8:00完成了数学作业为例),利用智能设备(如手机、平板电脑等等)扫描已完成作业,并将图像上传到学校网络系统(即后台终端)中。此时,所在学校的教师、同学利用区块链技术,在各自的智能设备上共同记录晚上8:00小明提交了作业。所有同学完成作业之后均按照此方法,将作业图像上传到学校网络系统中;
S2:所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步;
所有同学完成作业上传之后,对于任意两位同学(后面会以张三和李四为例),计算它们作业之间的相似度;利用基于多特征算子的相似度计算方法计算张三和李四两位同学作业的相似度。如果相似度较低(即相似度均未超过预设第一阈值),直接认定张三和李四之间不存在抄袭情况;如果相似度较高(相似度均超过预设第一阈值),则继续进行下一步;
S3:利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况;
利用基于多空间区域的OCR相似度计算方法,来判断张三和李四两位同学作业图像的相似度;如果存在整体相似度较高(整体相似度等于或高于预设第二阈值)或局部相似度较高(局部相似度等于或高于预设第三阈值),认定张三和李四之间存在抄袭情况;反之,认定张三和李四之间不存在抄袭情况;
S4:当两份作业之间被认定抄袭之后,后台终端检索两份作业的提交记录;根据提交的时间信息,判定后提交的作业为抄袭。
认定抄袭之后,在网络系统(即后台终端)中检索提交记录。以提交时间为基础,如果张三先提交,说明李四抄袭张三;如果李四先提交,说明张三抄袭李四;并根据这种两两比较的方式,逐步进行全体学生的检查。
在本发明的一些实施例中,认定两份作业之间存在抄袭情况后的步骤还包括:后台终端将两份作业向教师客户端发送,在教师人工进行判别后,将教师的判断结果上传至后台终端。
对于抄袭的情况,在前期进行大量的智能计算后,将计算的后判定的作业再发送给教师或教职员工进行确认,避免误判的情况。同时对于抄袭的作业,老师也能进行针对地进行教育,提高了教学效率。
请参阅图2,在本发明的一些实施例中,所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步的步骤包括:
S201:利用SIFT特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第一相似度;
SIFT即尺度不变特征变换,是用于图像处理领域的一种描述。这种描述具有尺度不变性,可在图像中检测出关键点,对局部特征相似度的对比具有较高的识别。
S202:利用GIST特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第二相似度;
GIST特征算子,也称为全局特征信息,为场景的低维签名向量。采用全局特征信息对场景进行识别与分类不需要对图像进行分割和局部特征提取,可以实现快速场景识别与分类。
S203:利用HOG特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第三相似度;
HOG表示边缘的结构特征,可以描述局部的形状信息。位置和方向空间的量化一定程度上可以抑制平移和旋转带来的影响。采用归一化,可以抵消光照带来的变化,使得识别更为精确。
S204:第一相似度、第二相似度和第三相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;若任意一个相似度结果超过预设第一阈值,则继续下一步。
上述三种相似度的计算均是为了相互之间弥补各自缺点,由此在三种相似度均未超过预设第一阈值时,直接认定两份作业之间不存在抄袭情况。反之则继续进行判定。
其中,利用SIFT特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第一相似度的步骤包括:对两份作业扫描图像分别进行特征点检测提取关键点,将关键点进行描述,分别获得两个目标特征点集,对两个目标特征点集进行特征点匹配,然后进行矫正操作;再定位关键点并确定特征方向,生成特征向量,通过各关键点的特征向量,而后进行比较;找出相互匹配的特征点,建立景物间的对应关系;最后利用欧式距离计算它们之间的相似度。
其中,利用GIST特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第二相似度的步骤包括:
创建gabor滤波器组,对原彩色的两份作业扫描图像分别求均值转为灰度图像,对灰度图像进行预滤波,并缩放局部对比度,分块计算gabor特征并组合成特征向量,根据特征向量利用欧式距离计算两份作业扫描图像之间的第二相似度。
其中,利用HOG特征算子对两份作业的作业扫描图像进行表征,并利用欧式距离计算两份作业扫描图像之间的第三相似度的步骤包括:
将两份作业扫描图像分别进行分割,得到分割图像;将分割图像的伽马空间和颜色空间进行归一化处理;而后计算分割图像横坐标和纵坐标方向的梯度,并根据梯度数据,计算梯度方向;构建方向梯度直方图,并对分割图像进行区域的梯度直方图归一化处理;生成特征向量,根据特征向量利用欧式距离计算两份作业扫描图像之间的第三相似度。
请参阅图3,在本发明的一些实施例中,利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况的步骤包括:
S301:将两份作业的作业扫描图像分别进行OCR识别,而对识别结果进行比对,若相似度大于或等于第二阈值,直接认定两份作业存在抄袭;反之,继续进行下一步;
对于OCR技术的利用主要是为了进行局部个整体相似度的识别,其中图像识别中,除了技术自身的问题,还会存在作业出现局部抄袭的问题,故而先进行图片整体OCR识别,若整体存在相似度大于或等于第二阈值,则直接认定两份作业存在抄袭,若整体存在相似度低于第二阈值,则进行局部相似度检测。
S302:将两份作业扫描图像在同样的位置分别分割成第一预设数量的区域,分别对每幅图像的区域单独进行OCR识别,计算两份作业扫描图像上对应区域的相似度,若任一区域的相似度等于或高于预设第三阈值,则直接认定两份作业存在抄袭,反之,继续进行下一步;
局部相似度检测的原理则是将图片分割成更小的区域,并将两份作业扫描图像分割后的区域对应比较,从而进行更为细分的对比,检测出更为详细的某道题抄袭的情况。例如:将张三作业图像和李四作业图像分别进行4区域,分别对每幅图像的4个区域进行OCR识别,分别计算4个区域的识别结果相似度(左上对应左上,右下对应右下等)。如果4个区域中有任意一个相似度很高,直接认定二者局部相似度较高;如果所有区域相似度都较低,继续进行下一步;
S303:将两份作业扫描图像在同样的位置分别分割成第二预设数量的区域,第二预设数量大于第一预设数量;计算两份作业扫描图像上对应区域的相似度,若任一区域的相似度等于或高于预设第三阈值,则直接认定两份作业存在抄袭,反之,两份作业不存在局部抄袭。
而对于像语文这种,题目内容较多,相同划分更小的情况,则直接继续将原来的作业扫描图像划分区域增加;例如:将张三作业图像和李四作业图像分别进行16等分,分别对每幅图像的16个区域进行OCR识别,分别计算16个区域的识别结果相似度(左上对应左上,右下对应右下等)。如果16个区域中有任意一个相似度很高,直接认定二者局部相似度较高;如果所有区域相似度都较低,认定二者不存在局部较高相似度。至于具体划分区域的数量可根据需要进行预设。
实施例2
请参阅图4,为本发明提供的一种基于区块链的智慧教育作业大数据防抄袭系统,包括:扫描上传模块1,用于利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于智能设备上的学生客户端,将扫描图像以及时间信息上传至后台终端;与后台终端连接的智能设备均记录作业扫描图像的上传者信息以及时间信息;相似性初级判断模块2,用于所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步;相似性二级判断模块3,利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况;抄袭判断模块4,当两份作业之间被认定抄袭之后,后台终端检索两份作业的提交记录;根据提交的时间信息,判定后提交的作业为抄袭。
实施例3
请参阅图5,为本发明提供的一种电子设备,包括至少一个处理器5、至少一个存储器6和数据总线7;其中:处理器5与存储器6通过数据总线7完成相互间的通信;存储器6存储有可被处理器5执行的程序指令,处理器5调用程序指令以执行一种基于区块链的智慧教育作业大数据防抄袭方法。例如实现:
利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于智能设备上的学生客户端,将扫描图像以及时间信息上传至后台终端;与后台终端连接的智能设备均记录作业扫描图像的上传者信息以及时间信息;所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步;利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况;当两份作业之间被认定抄袭之后,后台终端检索两份作业的提交记录;根据提交的时间信息,判定后提交的作业为抄袭。
实施例4
本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器5执行时实现一种基于区块链的智慧教育作业大数据防抄袭方法。例如实现:
利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于智能设备上的学生客户端,将扫描图像以及时间信息上传至后台终端;与后台终端连接的智能设备均记录作业扫描图像的上传者信息以及时间信息;所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份作业之间不存在抄袭情况;反之继续下一步;利用基于多空间区域的OCR相似度计算方法,判断两份作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份作业之间存在抄袭情况;反之,认定两份作业之间不存在抄袭情况;当两份作业之间被认定抄袭之后,后台终端检索两份作业的提交记录;根据提交的时间信息,判定后提交的作业为抄袭。
其中,存储器6可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器5可以是一种集成电路芯片,具有信号处理能力。该处理器5可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种基于区块链的智慧教育作业大数据防抄袭方法,其特征在于,包括:
利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于所述智能设备上的学生客户端,将所述扫描图像以及所述时间信息上传至后台终端;与所述后台终端连接的智能设备均记录所述作业扫描图像的上传者信息以及所述时间信息;
所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份所述作业之间不存在抄袭情况;反之继续下一步;
利用基于多空间区域的OCR相似度计算方法,判断两份所述作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份所述作业之间存在抄袭情况;反之,认定两份所述作业之间不存在抄袭情况;
当两份所述作业之间被认定抄袭之后,所述后台终端检索两份所述作业的提交记录;根据提交的所述时间信息,判定后提交的作业为抄袭。
2.如权利要求1所述的一种基于区块链的智慧教育作业大数据防抄袭方法,其特征在于,认定两份所述作业之间存在抄袭情况后的步骤还包括:
所述后台终端将两份所述作业向教师客户端发送,在教师人工进行判别后,将教师的判断结果上传至后台终端。
3.如权利要求1所述的一种基于区块链的智慧教育作业大数据防抄袭方法,其特征在于,所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份所述作业之间不存在抄袭情况;反之继续下一步的步骤包括:
利用SIFT特征算子对两份所述作业的作业扫描图像进行表征,并利用欧式距离计算两份所述作业扫描图像之间的第一相似度;
利用GIST特征算子对两份所述作业的作业扫描图像进行表征,并利用欧式距离计算两份所述作业扫描图像之间的第二相似度;
利用HOG特征算子对两份所述作业的作业扫描图像进行表征,并利用欧式距离计算两份所述作业扫描图像之间的第三相似度;
所述第一相似度、所述第二相似度和所述第三相似度均未超过预设第一阈值,直接认定两份所述作业之间不存在抄袭情况;若任意一个相似度结果超过预设第一阈值,则继续下一步。
4.如权利要求3所述的一种基于区块链的智慧教育作业大数据防抄袭方法,其特征在于,利用SIFT特征算子对两份所述作业的作业扫描图像进行表征,并利用欧式距离计算两份所述作业扫描图像之间的第一相似度的步骤包括:
对两份所述作业扫描图像分别进行特征点检测提取关键点,将关键点进行描述,分别获得两个目标特征点集,对两个所述目标特征点集进行特征点匹配,然后进行矫正操作;再定位关键点并确定特征方向,生成特征向量,通过各关键点的特征向量,而后进行比较;找出相互匹配的特征点,建立景物间的对应关系;最后利用欧式距离计算它们之间的相似度。
5.如权利要求3所述的一种基于区块链的智慧教育作业大数据防抄袭方法,其特征在于,利用GIST特征算子对两份所述作业的作业扫描图像进行表征,并利用欧式距离计算两份所述作业扫描图像之间的第二相似度的步骤包括:
创建gabor滤波器组,对原彩色的两份所述作业扫描图像分别求均值转为灰度图像,对所述灰度图像进行预滤波,并缩放局部对比度,分块计算gabor特征并组合成特征向量,根据所述特征向量利用欧式距离计算两份所述作业扫描图像之间的第二相似度。
6.如权利要求1所述的一种基于区块链的智慧教育作业大数据防抄袭方法,其特征在于,利用HOG特征算子对两份所述作业的作业扫描图像进行表征,并利用欧式距离计算两份所述作业扫描图像之间的第三相似度的步骤包括:
将两份所述作业扫描图像分别进行分割,得到分割图像;
将所述分割图像的伽马空间和颜色空间进行归一化处理;
而后计算所述分割图像横坐标和纵坐标方向的梯度,并根据所述梯度数据,计算梯度方向;
构建方向梯度直方图,并对分割图像进行区域的梯度直方图归一化处理;生成特征向量,根据所述特征向量利用欧式距离计算两份所述作业扫描图像之间的第三相似度。
7.如权利要求1所述的一种基于区块链的智慧教育作业大数据防抄袭方法,其特征在于,利用基于多空间区域的OCR相似度计算方法,判断两份所述作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份所述作业之间存在抄袭情况;反之,认定两份所述作业之间不存在抄袭情况的步骤包括:
将两份所述作业的作业扫描图像分别进行OCR识别,而对识别结果进行比对,若相似度大于或等于第二阈值,直接认定两份所述作业存在抄袭;反之,继续进行下一步;
将两份作业扫描图像在同样的位置分别分割成第一预设数量的区域,分别对每幅图像的区域单独进行OCR识别,计算两份作业扫描图像上对应区域的相似度,若任一区域的相似度等于或高于预设第三阈值,则直接认定两份所述作业存在抄袭,反之,继续进行下一步;
将两份作业扫描图像在同样的位置分别分割成第二预设数量的区域,所述第二预设数量大于第一预设数量;计算两份作业扫描图像上对应区域的相似度,若任一区域的相似度等于或高于预设第三阈值,则直接认定两份所述作业存在抄袭,反之,两份作业不存在局部抄袭。
8.一种基于区块链的智慧教育作业大数据防抄袭系统,其特征在于,包括:
扫描上传模块,用于利用智能设备对完成的作业进行扫描,得到作业扫描图像,并记录时间信息,通过设置于所述智能设备上的学生客户端,将所述扫描图像以及所述时间信息上传至后台终端;与所述后台终端连接的智能设备均记录所述作业扫描图像的上传者信息以及所述时间信息;
相似性初级判断模块,用于所有作业完成上传之后,利用基于多特征算子的相似度计算方法,计算任意两份作业之间的相似度;若多个特征算子计算的相似度均未超过预设第一阈值,直接认定两份所述作业之间不存在抄袭情况;反之继续下一步;
相似性二级判断模块,利用基于多空间区域的OCR相似度计算方法,判断两份所述作业的作业扫描图像的相似度;如果存在整体相似度等于或高于预设第二阈值,或局部相似度等于或高于预设第三阈值,认定两份所述作业之间存在抄袭情况;反之,认定两份所述作业之间不存在抄袭情况;
抄袭判断模块,当两份所述作业之间被认定抄袭之后,所述后台终端检索两份所述作业的提交记录;根据提交的所述时间信息,判定后提交的作业为抄袭。
9.一种电子设备,其特征在于,包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210376249.7A CN114463567B (zh) | 2022-04-12 | 2022-04-12 | 一种基于区块链的智慧教育作业大数据防抄袭方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210376249.7A CN114463567B (zh) | 2022-04-12 | 2022-04-12 | 一种基于区块链的智慧教育作业大数据防抄袭方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114463567A true CN114463567A (zh) | 2022-05-10 |
CN114463567B CN114463567B (zh) | 2022-11-11 |
Family
ID=81417557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210376249.7A Active CN114463567B (zh) | 2022-04-12 | 2022-04-12 | 一种基于区块链的智慧教育作业大数据防抄袭方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114463567B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115114588A (zh) * | 2022-07-26 | 2022-09-27 | 北京师范大学 | 基于区块链的智慧教育学术成果讨论防剽窃方法及系统 |
CN115171144A (zh) * | 2022-09-05 | 2022-10-11 | 北京吉道尔科技有限公司 | 一种基于区块链的智慧教育试卷大数据评阅方法及系统 |
CN115205866A (zh) * | 2022-09-16 | 2022-10-18 | 北京吉道尔科技有限公司 | 一种基于区块链的科技论文大数据抄袭检测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446540A (zh) * | 2018-03-19 | 2018-08-24 | 中山大学 | 基于源代码多标签图神经网络的程序代码抄袭类型检测方法与系统 |
US20200226206A1 (en) * | 2019-01-15 | 2020-07-16 | International Business Machines Corporation | Using computer-implemented analytics to determine plagiarism or heavy paraphrasing |
CN112749326A (zh) * | 2019-11-15 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机设备及存储介质 |
CN113011154A (zh) * | 2021-03-16 | 2021-06-22 | 华南理工大学 | 一种基于深度学习的作业查重方法 |
CN113971402A (zh) * | 2021-10-22 | 2022-01-25 | 北京字节跳动网络技术有限公司 | 内容识别方法、装置、介质及电子设备 |
-
2022
- 2022-04-12 CN CN202210376249.7A patent/CN114463567B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446540A (zh) * | 2018-03-19 | 2018-08-24 | 中山大学 | 基于源代码多标签图神经网络的程序代码抄袭类型检测方法与系统 |
US20200226206A1 (en) * | 2019-01-15 | 2020-07-16 | International Business Machines Corporation | Using computer-implemented analytics to determine plagiarism or heavy paraphrasing |
CN112749326A (zh) * | 2019-11-15 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机设备及存储介质 |
CN113011154A (zh) * | 2021-03-16 | 2021-06-22 | 华南理工大学 | 一种基于深度学习的作业查重方法 |
CN113971402A (zh) * | 2021-10-22 | 2022-01-25 | 北京字节跳动网络技术有限公司 | 内容识别方法、装置、介质及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115114588A (zh) * | 2022-07-26 | 2022-09-27 | 北京师范大学 | 基于区块链的智慧教育学术成果讨论防剽窃方法及系统 |
CN115114588B (zh) * | 2022-07-26 | 2022-11-04 | 北京师范大学 | 基于区块链的智慧教育学术成果讨论防剽窃方法及系统 |
CN115171144A (zh) * | 2022-09-05 | 2022-10-11 | 北京吉道尔科技有限公司 | 一种基于区块链的智慧教育试卷大数据评阅方法及系统 |
CN115205866A (zh) * | 2022-09-16 | 2022-10-18 | 北京吉道尔科技有限公司 | 一种基于区块链的科技论文大数据抄袭检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114463567B (zh) | 2022-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114463567B (zh) | 一种基于区块链的智慧教育作业大数据防抄袭方法与系统 | |
US8750573B2 (en) | Hand gesture detection | |
RU2608261C2 (ru) | Автоматическое генерирование тега на основании содержания изображения | |
US20120027252A1 (en) | Hand gesture detection | |
US11455831B2 (en) | Method and apparatus for face classification | |
WO2018233055A1 (zh) | 保单信息录入的方法、装置、计算机设备及存储介质 | |
Molina-Moreno et al. | Efficient scale-adaptive license plate detection system | |
WO2020038138A1 (zh) | 样本标注方法及装置、损伤类别的识别方法及装置 | |
CN113837151B (zh) | 表格图像处理方法、装置、计算机设备及可读存储介质 | |
Detsing et al. | Detection and facial recognition for investigation | |
CN111461143A (zh) | 一种图片翻拍识别方法和装置及电子设备 | |
US10445620B2 (en) | Method and system for object tracking in multiple non-linear distortion lenses | |
CN114220103B (zh) | 图像识别方法、装置、设备及计算机可读存储介质 | |
CN110689028A (zh) | 现场图测评方法、现场勘查记录测评方法及其装置 | |
CN112651996B (zh) | 目标检测跟踪方法、装置、电子设备和存储介质 | |
CN115984968A (zh) | 一种学生时空动作识别方法、装置、终端设备及介质 | |
US20220036114A1 (en) | Edge detection image capture and recognition system | |
CN114927236A (zh) | 一种面向多重目标图像的检测方法及系统 | |
CN110674817B (zh) | 一种基于双目摄像头的车牌防伪的方法及装置 | |
JPWO2007069393A1 (ja) | オブジェクト認識装置、オブジェクト認識方法、およびオブジェクト認識プログラム | |
CN111914844A (zh) | 一种图像识别方法、装置、电子设备及存储介质 | |
CN116737982B (zh) | 一种基于数据分析的图片搜索结果智能筛选管理系统 | |
JP7420578B2 (ja) | 帳票仕分システム、帳票仕分方法、及びプログラム | |
CN114092743B (zh) | 敏感图片的合规性检测方法、装置、存储介质及设备 | |
CN116052220B (zh) | 行人重识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221026 Address after: 065200 Hongyuan Entrepreneurship and Innovation Industry Base 3 # - 1, west of East Ring Road and south of Shenwei North Road, Yanjiao Development Zone, Sanhe, Langfang, Hebei Applicant after: Photonic Cloud (Sanhe) Network Technology Co.,Ltd. Address before: Room 222, 3-16, floors 2-3, No. 3, Maizidian West Road, Chaoyang District, Beijing 100020 Applicant before: Beijing jidaoer Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |