CN112667692A - 一种数据处理方法、装置及电子设备 - Google Patents

一种数据处理方法、装置及电子设备 Download PDF

Info

Publication number
CN112667692A
CN112667692A CN201910983788.5A CN201910983788A CN112667692A CN 112667692 A CN112667692 A CN 112667692A CN 201910983788 A CN201910983788 A CN 201910983788A CN 112667692 A CN112667692 A CN 112667692A
Authority
CN
China
Prior art keywords
data
analyzed
information
similar
characteristic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910983788.5A
Other languages
English (en)
Inventor
耿卉卉
周威
张弦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yiyi Education Information Consulting Co ltd
Original Assignee
Beijing Yiyi Education Information Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yiyi Education Information Consulting Co ltd filed Critical Beijing Yiyi Education Information Consulting Co ltd
Priority to CN201910983788.5A priority Critical patent/CN112667692A/zh
Publication of CN112667692A publication Critical patent/CN112667692A/zh
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据处理方法、装置及电子设备,获取目标数据以及所述目标数据在预设特征维度下的第一特征信息,获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息,基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据,对所述类似数据进行数据推送。通过本发明可以筛选出与目标数据特征相似的类似数据,在目标数据为用户错题时,类似数据即为与用户错题类似的类题,通过将类题推送给用户,能够使得用户不断复习该知识点,进而确保用户真正掌握了相应的知识点。

Description

一种数据处理方法、装置及电子设备
技术领域
本发明涉及数据处理领域,更具体的说,涉及一种数据处理方法、装置及电子设备。
背景技术
用户在教学软件(如微信小程序)上答题会产生错题,系统以用户个体为单位来收集用户的一段时间内的全部错题,形成可以在线作答的错题本。用户可以在错题本上订正错题,查漏补缺,提高学习效果。但是,光是订正错题原题,是不能确保用户真正掌握了相应的知识点,需要用举一反三的方式来检验和巩固用户的错误知识点,使得用户牢记知识点。
发明内容
有鉴于此,本发明提供一种数据处理方法、装置及电子设备,以解决需要一种辅助用户掌握错题知识点的方法的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种数据处理方法,包括:
获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
对所述类似数据进行数据推送。
可选地,在所述获取目标数据之前,还包括:
确定预设数据库中存储的初始数据在预设特征维度下的特征信息;
基于所述初始数据在所述预设特征维度下的特征信息,对所述初始数据进行分类,得到不同类别的初始数据;其中,在所述预设特征维度下的特征信息完全相同的初始数据作为一类初始数据;
依次将同一类别的所述初始数据作为所述目标数据。
可选地,所述第一特征信息和所述特第二特征信息均包括知识点信息、考法信息、解法信息和难度值;
基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据,包括:
根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息、所述考法信息和所述解法信息,计算所述待分析数据与所述目标数据的知识点相似度;
根据所述第一特征信息和所述第二特征信息分别包括的难度值,计算所述待分析数据与所述目标数据的难度相似度;
根据所述知识点相似度和所述难度相似度得到所述待分析数据与所述目标数据的综合相似度;
基于所述综合相似度,从所述待分析数据中确定出与所述目标数据相似的待分析数据,并作为类似数据。
可选地,根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息、所述考法信息和所述解法信息,计算所述待分析数据与所述目标数据的知识点相似度,包括:
根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考点相似度;
根据所述第一特征信息和所述第二特征信息分别包括的所述考法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考法相似度;
根据所述第一特征信息和所述第二特征信息分别包括的所述解法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的解法相似度;
根据所述考点相似度、所述考法相似度和所述解法相似度得到所述知识点相似度。
可选地,所述难度相似度的计算公式为:
难度相似度=(目标数据的难度值的平均值-待分析数据的难度值)/比例系数。
可选地,所述对所述类似数据进行数据推送,包括:
获取所述目标数据对应的历史出错时间;
确定所述目标数据对应的历史出错时间位于所有的所述目标数据中的历史出错时间中的第一排序值;
依据所述第一排序值,将所述类似数据进行数据推送;或,
获取所述目标数据对应的历史推荐次数;
确定所述目标数据对应的历史推荐次数位于所有的所述目标数据中的历史推荐次数中的第二排序值;
依据所述第二排序值,将所述类似数据进行数据推送;或,
若所述目标数据为预设目标数据,将所述目标数据对应的类似数据按照难度值进行分类,得到不同难度类别的类似数据;
从每类不同难度类别的类似数据中筛选出与所述难度类别相匹配的数量的类似数据,并进行数据推送;或,
获取数据推送总数量;
从所述类似数据中筛选出小于所述数据推送总数量的类似数据,并进行推送。
一种数据处理装置,包括:
第一数据获取模块,用于获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
第二数据获取模块,用于获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
第一数据确定模块,用于基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
数据推送模块,用于对所述类似数据进行数据推送。
可选地,还包括:
信息确定模块,用于确定预设数据库中存储的初始数据在预设特征维度下的特征信息;
数据分类模块,用于基于所述初始数据在所述预设特征维度下的特征信息,对所述初始数据进行分类,得到不同类别的初始数据;其中,在所述预设特征维度下的特征信息完全相同的初始数据作为一类初始数据;
第二数据确定模块,用于依次将同一类别的所述初始数据作为所述目标数据。
一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的数据处理方法。
一种计算机设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
对所述类似数据进行数据推送。
相较于现有技术,本发明具有以下有益效果:
本发明提供了一种数据处理方法、装置及电子设备,通过本发明可以筛选出与目标数据特征相似的类似数据,在目标数据为用户错题时,类似数据即为与用户错题类似的类题,通过将类题推送给用户,能够使得用户不断复习该知识点,进而确保用户真正掌握了相应的知识点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种数据处理方法的方法流程图;
图2为本发明实施例提供的一种原题的特征信息的场景示意图;
图3为本发明实施例提供的另一种原题的特征信息的场景示意图;
图4为本发明实施例提供的再一种原题的特征信息的场景示意图;
图5为本发明实施例提供的另一种数据处理方法的方法流程图;
图6为本发明实施例提供的一种目标数据的场景示意图;
图7为本发明实施例提供的一种难度值分布的场景示意图;
图8为本发明实施例提供的再一种数据处理方法的方法流程图;
图9为本发明实施例提供的一种数据处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前的在线教育应用软件app给学生提供的错题本都是学生的错题原题(输入来源有三类:①内部题库。②O2O考试。③拍照搜题),极少有错题原题的类题功能(其中,类题即为错题的相似题,如均为计算三角形面积的题),其难点在于:①来源众多,难以汇总(占比41%);②抄录费时费力(占比40%);③难以查找(占比37%);④难以归类(占比32%);⑤想不起来回顾(占比27%),即鲜有给学生提供类题推荐功能。
本发明的发明人经过对上述应用场景的研究发现,如果可以给学生提供类题推荐功能,将有以下优势:
(1)错题原题覆盖了全渠道(2)易收集(3)知识体系完备且统一(4)有学生基本信息。因此,在这个优势背景下,本发明的发明人设计出类题推荐功能,以辅助学生巩固错误知识点。
本发明实施例提供了一种数据处理方法,用于实现错题类题推荐功能,参照图1,具体可以包括:
S11、获取目标数据以及所述目标数据在预设特征维度下的第一特征信息。
在实际应用中,收集学生全部渠道的错题原题(下文简称原题),将原题作为目标数据,得到目标数据之后,需要确定目标数据的特征,此处称为第一特征信息,即为在预设特征维度下的维度信息。
预设特征维度,也可以称为标签或特征,共有至少三种,分别为:
(1)知识点KP(2)考法TM(3)解法SM,这三种标签,由教研人员人工标注在每一个题目上,每一个题目上的标签个数不定。即对于每一原题,可能有多个知识点KP,多个考法TM或多个解法SM。人工确定标签之后,会给每一原题打上标签,此后,可以直接获取到目标数据在预设特征维度下的第一特征信息。若预设特征维度为知识点KP,则对应的第一特征信息为知识点信息;若预设特征维度为考法TM,则对应的第一特征信息为考法信息;若预设特征维度为解法SM,则对应的第一特征信息为解法信息。
对于每一原题,多种原题之间可能具有相同的第一特征信息,也可能具有不同的第一特征信息,参照图2-图4,图2为每一原题的知识点信息、考法信息、解法信息均不同,即多个原题之间特征完全不同。图3为原题1和2具有相同的知识点信息、考法信息和解法信息,多个原题之间特征完全相同。图4为原题1和2具有相同的知识点信息,但考法信息和解法信息不同,即多个原题之间部分特征相同。
由于多个原题之间具有上述特征完全相同、部分相同或完全不同三种情形,为了便于对原题进行管理以及后续分类确定类题,现对原题进行管理,具体的,参照图5,可以包括:
S21、确定预设数据库中存储的初始数据在预设特征维度下的特征信息。
本实施例中的初始数据即为多个原题,多个原题存储在预设数据库中,对于每一原题,确定上述的预设特征维度的特征信息,即知识点KP、考法TM和解法SM分别对应的特征信息,其中,特征信息和第一特征信息的内容一致,只是在名称上进行了区分。
S22、基于所述初始数据在所述预设特征维度下的特征信息,对所述初始数据进行分类,得到不同类别的初始数据。
在实际应用中,在所述预设特征维度下的特征信息完全相同的初始数据作为一类初始数据。
参照图3,预设特征维度下的特征信息完全相同是指:知识点KP、考法TM和解法SM分别对应的特征信息分别相同,图3中的原题1和原题2的知识点KP、考法TM和解法SM对应的特征信息KP1、TM1和SM1均相同,则将原题1和原题2作为一类初始数据。
参照图2和图4,图2中,原题1、原题2和原题3的知识点KP、考法TM和解法SM对应的特征信息完全不同,图4中,原题1、原题2的知识点KP对应的特征信息相同,但是考法TM和解法SM对应的特征信息不同,这两种情况均不能将原题1、原题2和原题3作为一类初始数据,即只有知识点KP、考法TM和解法SM对应的特征信息完全相同时,才认为是一类初始数据。参照图6,图6中的情形1中,原题1、原题2和原题3的特征信息不同,原题1、原题2和原题3均作为一类初始数据,情形2中,原题1和原题2的特征信息相同,可以作为一类初始数据,原题3与原题1的特征信息不同,单独作为一类初始数据,情形3中,原题1、原题2和原题3的特征信息不完全相同,均单独作为一类初始数据。
S23、依次将同一类别的所述初始数据作为所述目标数据。
在将初始数据分类之后,依据将同一类别的初始数据作为步骤S11中的目标数据,即目标数据为具有相同的知识点KP、考法TM和解法SM对应的特征信息的至少一道原题。
此外,需要说明的是:
预设特征维度还可以包括难度,难度对应的第一特征信息为难度值,难度值基于统计的所有学生历史出错率得到,若一原题的历史出错率较高,则难度值较大,若一原题的历史出错率较低,则难度值较小。在实际应用中,可以将难度值设置为1-5五个难度档位,1档位为难度值较低,5档位为难度值较高。此外,预设特征维度还可以包括题型、作答时长等等。
S12、获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息。
其中,待分析数据即为上述中的预设数据库中的除目标数据之外的每一类初始数据,即待分析数据同目标数据一样,也包括具有相同的知识点KP、考法TM和解法SM对应的特征信息的至少一道原题。
S13、基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据。
其中,特征相似是指从知识点KP、考法TM和解法SM三个特征分析,三个特征的特征点的综合相似度较大,即可作为类似数据。其中,对于一目标数据,其对应的类似数据可以不止一类初始数据。
S14、对所述类似数据进行数据推送。
在进行数据推送时,可以将全部的类似数据进行推送,也可以是有策略的进行推送,推送策略可以有如下四种,在实际应用中,可以任选一种推送策略进行数据推送,也可以选择至少两种推送策略进行数据推送。
一、所述对所述类似数据进行数据推送,可以包括:
1)获取所述目标数据对应的历史出错时间。
2)确定所述目标数据对应的历史出错时间位于所有的所述目标数据中的历史出错时间中的第一排序值。
3)依据所述第一排序值,将所述类似数据进行数据推送。
在实际应用中,若存在多个目标数据对应的类似数据时,为了确定优先推送哪一目标数据的类似数据,此时可以按照出错时间进行排序,即按照历史出错时间进行排序,新出错的目标数据对应的类似数据优先,即新出错的知识点优先,以前出错的知识点退后,这样设置的原因是:根据学习的记忆衰减曲线理论,“趁热打铁”巩固新出错的知识点,能更有效。
二、所述对所述类似数据进行数据推送,可以包括:
1)获取所述目标数据对应的历史推荐次数。
2)确定所述目标数据对应的历史推荐次数位于所有的所述目标数据中的历史推荐次数中的第二排序值。
3)依据所述第二排序值,将所述类似数据进行数据推送。
在时间应用中,为了确保推荐结果的多样性和新鲜度,可以按照历史推荐次数进行推送,历史推送次数少的优先推送,历史推送次数多的后续在推送。
三、所述对所述类似数据进行数据推送,可以包括:
1)若所述目标数据为预设目标数据,将所述目标数据对应的类似数据按照难度值进行分类,得到不同难度类别的类似数据。
2)从每类不同难度类别的类似数据中筛选出与所述难度类别相匹配的数量的类似数据,并进行数据推送。
预设目标数据可以是英语类数据,由于英语类题(即英语类数据对应的类似数据)整体难度偏低,为了可安全确保整体难度的配比符合预期设定。本实施例增加难度档位策略,即强制规定不同难度档位的题目的数量比例,能确保类题的难度不会过于简单以及难度分布均匀,上述介绍了难度值共分为1-5五个难度档位,五个档位的优先级从高到低分别为3、4、2、5和1。若每次推荐题的数量为12道,则各个难度的题推荐的个数参照图7,即优先级为1,难度为3的,期望取题量为6,剩余优先级的参照图7即可。
四、所述对所述类似数据进行数据推送,可以包括:
1)获取数据推送总数量。
2)从所述类似数据中筛选出小于所述数据推送总数量的类似数据,并进行推送。
在实际应用中,在进行推荐时,要保证一次推荐的n个题目,知识点均衡,否则答题者一次答题无法覆盖更多的知识点,不仅不能更多地覆盖薄弱点,还会造成用户体验不好,即在进行题目推荐时,需要实现知识点均衡,此时则需要将类似数据推荐的数量小于数据推送总数量,以保证还可以推荐其余知识点的题目。
通过本发明实施例可以筛选出与目标数据特征相似的类似数据,在目标数据为用户错题时,类似数据即为与用户错题类似的类题,通过将类题推送给用户,能够使得用户不断复习该知识点,进而确保用户真正掌握了相应的知识点,帮助让学生订正错题和巩固类题,从而实现提高学生能力即“结果更好”和有效学习即“过程更有效”。
上述简单介绍了所述待分析数据中确定出与所述目标数据特征相似的待分析数据,现对其进行详细介绍,参照图8,步骤S13可以包括:
S31、根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息、所述考法信息和所述解法信息,计算所述待分析数据与所述目标数据的知识点相似度。
在实际应用中,步骤S31的具体实现方式可以包括:
1)根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考点相似度。
2)根据所述第一特征信息和所述第二特征信息分别包括的所述考法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考法相似度。
3)根据所述第一特征信息和所述第二特征信息分别包括的所述解法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的解法相似度。
4)根据所述考点相似度、所述考法相似度和所述解法相似度得到所述知识点相似度。
具体的,假设目标数据A与待分析数据B的知识点相似度:simk=x1+x2+x3,x1为考点相似度,也即考察的知识点的相似度,x2为考法相似度,x3为解法相似度,simk为知识点相似度。
x1=|Akp∩Bkp|/|Akp∪Bkp|
x2=|Atm∩Btm|/|Atm∪Btm|
x3=|Asm∩Bsm|/|Asm∪Bsm|
其中,kp表示知识点,tm表示考法,sm表示解法。A∩B表示交集个数信息,A∪B表示并集个数信息,举例来说,Akp∩Bkp表示A和B具有相同的知识点对应的知识点信息的个数,Akp∪Bkp表示A和B所有的知识点对应的知识点信息的个数。
详细来说,每一种类预设特征维度的特征信息的具体个数也不定,可能为1~N个(例如有的题目有10个知识点1个考法,有的题目有1个知识点1个解法)。
假设目标数据A有知识点KP1,KP2考法TM1 TM2,解法SM1 SM2SM3,待分析数据B有知识点KP1考法TM2 TM3,解法SM4 SM5
x 1=|Akp∩Bkp|/|Akp∪Bkp|=1/2
其中,分子1是指A和B的共有的KP的个数即KP1,为1个,分母2是指A和B的全部的KP的并集的个数即KP1 KP2,共2个。
同理,x2=|Atm∩Btm|/|Atm∪Btm|=1/3
分子1是指A和B的共有的TM的个数即TM2,为1个,分母2是指A和B的全部的TM的并集的个数即TM1 TM2 TM3,共3个。
同理,x3=|Asm∩Bsm|/|Asm∪Bsm|=0/5
分子0是指A和B的共有的SM的个数0即无交集,分母2是指A和B的全部的SM的并集的个数即SM1 SM2 SM3 SM4 SM5,共5个。
分别计算得到x1、x2和x3之后,将其相加,即可得到simk,即知识点相似度。
S32、根据所述第一特征信息和所述第二特征信息分别包括的难度值,计算所述待分析数据与所述目标数据的难度相似度。
其中,难度相似度diffd=(目标数据的难度值的平均值-待分析数据的难度值)/比例系数。由于目标数据可能不止一道题目,所以此处取目标数据中所有的题目的难度值的平均值,若待分析数据为一道,则直接获取其难度值,若为多道,也可以取其平均值,难度值的分类如上所述,分为1-5五个档位。
S33、根据所述知识点相似度和所述难度相似度得到所述待分析数据与所述目标数据的综合相似度。
综合相似度score=1000*simk-500*diffd,即将知识点相似度和所述难度相似度进行加权求和,即可得到综合相似度,加权系数分别为100和500。
S34、基于所述综合相似度,从所述待分析数据中确定出与所述目标数据相似的待分析数据,并作为类似数据。
计算得到综合相似度,就可以将待分析数据按照综合相似度进行排序,并筛选得到排名靠前的数据作为类似数据,如可以取前10道题作为类似数据,并按照上述的数据推送方法进行数据推送。
本实施例中,从知识点相似度和难度相似度两个方面,对待分析数据和目标数据进行匹配和筛选,就可以得到与目标数据难度值相似且知识点相似的类题。
可选的,在上述数据处理方法的实施例的基础上,本发明的另一实施例提供了一种数据处理装置,其特征在于,包括:
第一数据获取模块11,用于获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
第二数据获取模块12,用于获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
第一数据确定模块13,用于基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
数据推送模块14,用于对所述类似数据进行数据推送。
进一步,还包括:
信息确定模块,用于确定预设数据库中存储的初始数据在预设特征维度下的特征信息;
数据分类模块,用于基于所述初始数据在所述预设特征维度下的特征信息,对所述初始数据进行分类,得到不同类别的初始数据;其中,在所述预设特征维度下的特征信息完全相同的初始数据作为一类初始数据;
第二数据确定模块,用于依次将同一类别的所述初始数据作为所述目标数据。
数据推送模块14用于对所述类似数据进行数据推送时,具体用于:
获取所述目标数据对应的历史出错时间;
确定所述目标数据对应的历史出错时间位于所有的所述目标数据中的历史出错时间中的第一排序值;
依据所述第一排序值,将所述类似数据进行数据推送;或,
获取所述目标数据对应的历史推荐次数;
确定所述目标数据对应的历史推荐次数位于所有的所述目标数据中的历史推荐次数中的第二排序值;
依据所述第二排序值,将所述类似数据进行数据推送;或,
若所述目标数据为预设目标数据,将所述目标数据对应的类似数据按照难度值进行分类,得到不同难度类别的类似数据;
从每类不同难度类别的类似数据中筛选出与所述难度类别相匹配的数量的类似数据,并进行数据推送;或,
获取数据推送总数量;
从所述类似数据中筛选出小于所述数据推送总数量的类似数据,并进行推送。
通过本发明实施例可以筛选出与目标数据特征相似的类似数据,在目标数据为用户错题时,类似数据即为与用户错题类似的类题,通过将类题推送给用户,能够使得用户不断复习该知识点,进而确保用户真正掌握了相应的知识点,帮助让学生订正错题和巩固类题,从而实现提高学生能力即“结果更好”和有效学习即“过程更有效”。
需要说明的是,本实施例中的各个模块的工作过程请参照上述实施例中的相应说明,在此不再赘述。
可选的,在上述数据处理装置的实施例的基础上,所述第一特征信息和所述特第二特征信息均包括知识点信息、考法信息、解法信息和难度值;
相应的,第一数据确定模块13可以包括:
第一计算子模块,用于根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息、所述考法信息和所述解法信息,计算所述待分析数据与所述目标数据的知识点相似度;
第二计算子模块,用于根据所述第一特征信息和所述第二特征信息分别包括的难度值,计算所述待分析数据与所述目标数据的难度相似度;
第三计算子模块,用于根据所述知识点相似度和所述难度相似度得到所述待分析数据与所述目标数据的综合相似度;
确定子模块,用于基于所述综合相似度,从所述待分析数据中确定出与所述目标数据相似的待分析数据,并作为类似数据。
进一步,第一计算子模块可以包括:
第一计算单元,用于根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考点相似度;
第二计算单元,用于根据所述第一特征信息和所述第二特征信息分别包括的所述考法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考法相似度;
第三计算单元,用于根据所述第一特征信息和所述第二特征信息分别包括的所述解法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的解法相似度;
第四计算单元,用于根据所述考点相似度、所述考法相似度和所述解法相似度得到所述知识点相似度。
进一步,所述难度相似度的计算公式为:
难度相似度=(目标数据的难度值的平均值-待分析数据的难度值)/比例系数。
本实施例中,从知识点相似度和难度相似度两个方面,对待分析数据和目标数据进行匹配和筛选,就可以得到与目标数据难度值相似且知识点相似的类题。
需要说明的是,本实施例中的各个模块、子模块和单元的工作过程请参照上述实施例中的相应说明,在此不再赘述。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述数据处理方法。
本发明实施例提供了一种计算机设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
对所述类似数据进行数据推送。
通过本发明实施例可以筛选出与目标数据特征相似的类似数据,在目标数据为用户错题时,类似数据即为与用户错题类似的类题,通过将类题推送给用户,能够使得用户不断复习该知识点,进而确保用户真正掌握了相应的知识点,帮助让学生订正错题和巩固类题,从而实现提高学生能力即“结果更好”和有效学习即“过程更有效”。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
对所述类似数据进行数据推送。
2.根据权利要求1所述的数据处理方法,其特征在于,在所述获取目标数据之前,还包括:
确定预设数据库中存储的初始数据在预设特征维度下的特征信息;
基于所述初始数据在所述预设特征维度下的特征信息,对所述初始数据进行分类,得到不同类别的初始数据;其中,在所述预设特征维度下的特征信息完全相同的初始数据作为一类初始数据;
依次将同一类别的所述初始数据作为所述目标数据。
3.根据权利要求1或2所述的数据处理方法,其特征在于,所述第一特征信息和所述特第二特征信息均包括知识点信息、考法信息、解法信息和难度值;
基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据,包括:
根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息、所述考法信息和所述解法信息,计算所述待分析数据与所述目标数据的知识点相似度;
根据所述第一特征信息和所述第二特征信息分别包括的难度值,计算所述待分析数据与所述目标数据的难度相似度;
根据所述知识点相似度和所述难度相似度得到所述待分析数据与所述目标数据的综合相似度;
基于所述综合相似度,从所述待分析数据中确定出与所述目标数据相似的待分析数据,并作为类似数据。
4.根据权利要求3所述的数据处理方法,其特征在于,根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息、所述考法信息和所述解法信息,计算所述待分析数据与所述目标数据的知识点相似度,包括:
根据所述第一特征信息和所述第二特征信息分别包括的所述知识点信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考点相似度;
根据所述第一特征信息和所述第二特征信息分别包括的所述考法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的考法相似度;
根据所述第一特征信息和所述第二特征信息分别包括的所述解法信息的交集个数信息与并集个数信息,计算所述待分析数据与所述目标数据的解法相似度;
根据所述考点相似度、所述考法相似度和所述解法相似度得到所述知识点相似度。
5.根据权利要求3所述的数据处理方法,其特征在于,所述难度相似度的计算公式为:
难度相似度=(目标数据的难度值的平均值-待分析数据的难度值)/比例系数。
6.根据权利要求1所述的数据处理方法,其特征在于,所述对所述类似数据进行数据推送,包括:
获取所述目标数据对应的历史出错时间;
确定所述目标数据对应的历史出错时间位于所有的所述目标数据中的历史出错时间中的第一排序值;
依据所述第一排序值,将所述类似数据进行数据推送;或,
获取所述目标数据对应的历史推荐次数;
确定所述目标数据对应的历史推荐次数位于所有的所述目标数据中的历史推荐次数中的第二排序值;
依据所述第二排序值,将所述类似数据进行数据推送;或,
若所述目标数据为预设目标数据,将所述目标数据对应的类似数据按照难度值进行分类,得到不同难度类别的类似数据;
从每类不同难度类别的类似数据中筛选出与所述难度类别相匹配的数量的类似数据,并进行数据推送;或,
获取数据推送总数量;
从所述类似数据中筛选出小于所述数据推送总数量的类似数据,并进行推送。
7.一种数据处理装置,其特征在于,包括:
第一数据获取模块,用于获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
第二数据获取模块,用于获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
第一数据确定模块,用于基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
数据推送模块,用于对所述类似数据进行数据推送。
8.根据权利要求7所述的数据处理装置,其特征在于,还包括:
信息确定模块,用于确定预设数据库中存储的初始数据在预设特征维度下的特征信息;
数据分类模块,用于基于所述初始数据在所述预设特征维度下的特征信息,对所述初始数据进行分类,得到不同类别的初始数据;其中,在所述预设特征维度下的特征信息完全相同的初始数据作为一类初始数据;
第二数据确定模块,用于依次将同一类别的所述初始数据作为所述目标数据。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至6中任意一项所述的数据处理方法。
10.一种计算机设备,其特征在于,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取目标数据以及所述目标数据在预设特征维度下的第一特征信息;
获取待分析数据以及所述待分析数据在所述预设特征维度下的第二特征信息;
基于所述第一特征信息和所述第二特征信息,从所述待分析数据中确定出与所述目标数据特征相似的待分析数据,并作为类似数据;
对所述类似数据进行数据推送。
CN201910983788.5A 2019-10-16 2019-10-16 一种数据处理方法、装置及电子设备 Withdrawn CN112667692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910983788.5A CN112667692A (zh) 2019-10-16 2019-10-16 一种数据处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910983788.5A CN112667692A (zh) 2019-10-16 2019-10-16 一种数据处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN112667692A true CN112667692A (zh) 2021-04-16

Family

ID=75400684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910983788.5A Withdrawn CN112667692A (zh) 2019-10-16 2019-10-16 一种数据处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112667692A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377799A (zh) * 2021-06-07 2021-09-10 广州智伴人工智能科技有限公司 错题智能分析与打印系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870463A (zh) * 2012-12-10 2014-06-18 中国电信股份有限公司 测试题目的选择方法与系统
CN107562769A (zh) * 2017-05-24 2018-01-09 广东工业大学 一种在线答题题目推荐方法及装置
CN108376132A (zh) * 2018-03-16 2018-08-07 中国科学技术大学 相似试题的判定方法及系统
CN109635100A (zh) * 2018-12-24 2019-04-16 上海仁静信息技术有限公司 一种相似题目的推荐方法、装置、电子设备及存储介质
JP6558786B1 (ja) * 2018-09-28 2019-08-14 学校法人東北工業大学 標的の特性の予測を行うための方法、コンピュータシステム、プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870463A (zh) * 2012-12-10 2014-06-18 中国电信股份有限公司 测试题目的选择方法与系统
CN107562769A (zh) * 2017-05-24 2018-01-09 广东工业大学 一种在线答题题目推荐方法及装置
CN108376132A (zh) * 2018-03-16 2018-08-07 中国科学技术大学 相似试题的判定方法及系统
JP6558786B1 (ja) * 2018-09-28 2019-08-14 学校法人東北工業大学 標的の特性の予測を行うための方法、コンピュータシステム、プログラム
CN109635100A (zh) * 2018-12-24 2019-04-16 上海仁静信息技术有限公司 一种相似题目的推荐方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377799A (zh) * 2021-06-07 2021-09-10 广州智伴人工智能科技有限公司 错题智能分析与打印系统

Similar Documents

Publication Publication Date Title
CN110069607B (zh) 用于客户服务的方法、装置、电子设备、计算机可读存储介质
CN111915148B (zh) 一种基于信息技术的课堂教学评价方法和系统
CN103617435B (zh) 一种主动学习图像分类方法和系统
CN106127634B (zh) 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统
CN112699283B (zh) 试卷生成方法及装置
WO2021180249A1 (zh) 职业推荐方法、装置、设备和介质
CN110659311B (zh) 题目推送方法、装置、电子设备及存储介质
CN115222566A (zh) 国际金融与金融计量学教学用学习方法及其系统
CN114913729B (zh) 一种选题方法、装置、计算机设备和存储介质
CN111144215A (zh) 图像处理方法、装置、电子设备及存储介质
WO2022193040A1 (zh) 一种理科教学系统及其使用方法、计算机可读存储介质
CN112529750A (zh) 基于图神经网络模型的学习事件推荐方法及系统
CN106611058A (zh) 一种试题搜索方法及装置
CN116823028A (zh) 教学质量评价系统及方法
CN116775879A (zh) 大语言模型的微调训练方法、合同风险评审方法及系统
CN111552796A (zh) 组卷方法、电子设备及计算机可读介质
CN112667692A (zh) 一种数据处理方法、装置及电子设备
CN110363245B (zh) 在线课堂的精彩图片筛选方法、装置及系统
CN110765278A (zh) 一种查找相似习题的方法、计算机设备及存储介质
CN114936281A (zh) 基于大数据的试题动态分类方法、装置、设备及存储介质
CN114971962A (zh) 学生作业的评价方法、装置、电子设备及存储介质
CN115713441A (zh) 基于AHP-Fuzzy算法和神经网络的教学质量评价方法与系统
CN113918588A (zh) 一种基于知识点的错题动态智能管理系统
Wizsa et al. Decision-Making System for KIP IAIN Bukittinggi Scholarship Recipients Using the SAW and TOPSIS Methods
CN111815179A (zh) 一种考试互评方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210416