CN111709551B - 基于相似度的学生测试数据处理方法、系统、装置及介质 - Google Patents
基于相似度的学生测试数据处理方法、系统、装置及介质 Download PDFInfo
- Publication number
- CN111709551B CN111709551B CN202010394452.8A CN202010394452A CN111709551B CN 111709551 B CN111709551 B CN 111709551B CN 202010394452 A CN202010394452 A CN 202010394452A CN 111709551 B CN111709551 B CN 111709551B
- Authority
- CN
- China
- Prior art keywords
- test
- score data
- student
- test score
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 397
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims description 23
- 238000005259 measurement Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Educational Technology (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于相似度的学生测试数据处理方法、系统、装置及介质。该方法获取待测试题和其对应的知识点;根据知识点,获取和所述待测试题相关的试题集合;然后根据当届学生对所述试题集合的第一测试得分数据和往届学生对所述试题集合的第二测试得分数据进行相似度匹配,并将匹配到的往届学生对所述待测试题的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出。本申请实施例给出的预测结果结合了过往学习者的实测成绩,更能贴近真实的测试情况,能够提高学生成绩预测的可靠性,该预测结果有助于学生或者教师判断当下的学习进度和成果,方便针对性地对某些知识点进行复习。本申请可广泛应用于大数据技术领域内。
Description
技术领域
本申请涉及大数据技术领域,尤其是一种基于相似度的学生测试数据处理方法、系统、装置及介质。
背景技术
当今社会处于大数据时代,各个行业都在加强对数据的有效管理,人们越来越认识到进行大数据整理的重要性和必要性。在学校的各项管理工作中,学生的信息数据也需要利用大数据进行智能化处理,从而更方便高效地开展学生工作。例如通过预测学生在某个科目或者知识点下的测试成绩,帮助学生有效地认识到自身的学习状况,使其能够及时调整查缺补漏,同时也方便教师对症下药,在某些知识点针对学生的成绩预测情况进行补习、帮扶,就是一项很有效的处理方案。
但是现有的学生成绩预测方法,主要是从学习者自身以往的测试数据出发,建立机器学习模型(如深度知识跟踪)来预测,但是在这种情况下,都是仅仅考虑到了学生的因素,没有考虑到试题难度的变化,因为不同的知识点差异可能很大,所以预测的精度较低。例如,碰到比较难的知识点,可能以往成绩较好的学生也难以取得高分。换句话说,目前现有技术中的学生成绩预测方法数据利用的程度较低,取得的预测效果很差,难以起到良好的学习指导作用。
发明内容
本申请的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
为此,本申请实施例的一个目的在于提供一种基于相似度的学生测试数据处理方法,通过该方法能够更加精确、有效地预测学生对试题的测试成绩,有助于学生或者教师判断当下的学习进度和成果,方便进行有针对性的学习。
本申请实施例的另一个目的在于提供一种基于相似度的学生测试数据处理系统。
为了达到上述技术目的,本申请实施例所采取的技术方案包括:
第一方面,本申请实施例提供了一种基于相似度的学生测试数据处理方法,包括以下步骤:
获取待测试题和所述待测试题对应的知识点;
根据所述知识点,获取和所述待测试题相关的试题集合;
获取当届学生对所述试题集合的第一测试得分数据、往届学生对所述试题集合的第二测试得分数据和往届学生对所述待测试题的第三测试得分数据;
根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届学生进行匹配;
将所述往届学生的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出。
另外,根据本申请上述实施例的基于相似度的学生测试数据处理方法,还可以具有以下附加的技术特征:
进一步地,在本申请的一个实施例中,获取往届学生对所述试题集合的第二测试得分数据这一步骤,其具体包括:
根据所述第二测试得分数据是否包括所述试题集合中所有的试题得分数据,将所述第二测试得分数据分为第四测试得分数据和第五测试得分数据;其中,所述第四测试得分数据包括所述试题集合中所有的试题得分数据,所述第五测试得分数据不包括所述试题集合中所有的试题得分数据;
根据所述第五测试得分数据和所述第四测试得分数据的相似度,对所述第五测试得分数据和所述第四测试得分数据所对应的往届学生进行匹配;
根据匹配结果和所述第四测试得分数据,对所述第五测试得分数据进行填补;
将所述第四测试得分数据和填补后的所述第五测试得分数据作为所述第二测试得分数据。
进一步地,在本申请的一个实施例中,所述根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届进行匹配这一步骤,其具体包括:
确定所述第二测试得分数据和所述第一测试得分数据的欧氏距离;
对欧氏距离最小的第二测试得分数据和第一测试得分数据所分别对应的往届学生和当届学生进行匹配。
进一步地,在本申请的一个实施例中,所述方法还包括以下步骤:
将学生对同一试题多次测试得分数据的均值作为所述学生对所述试题的测试得分数据进行输出;所述学生包括当届学生和往届学生。
第二方面,本申请实施例提出了一种基于相似度的学生测试数据处理系统,包括:
第一获取模块,用于获取待测试题和所述待测试题对应的知识点;
第一处理模块,用于根据所述知识点,获取和所述待测试题相关的试题集合;
第二获取模块,用于获取当届学生对所述试题集合的第一测试得分数据、往届学生对所述试题集合的第二测试得分数据和往届学生对所述待测试题的第三测试得分数据;
匹配模块,用于根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届进行匹配;
输出模块,用于将所述往届学生的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出。
另外,根据本申请上述实施例的基于相似度的学生测试数据处理系统,还可以具有以下附加的技术特征:
进一步地,在本申请的一个实施例中,所述第二获取模块包括:
分类子模块,用于根据所述第二测试得分数据是否包括所述试题集合中所有的试题得分数据,将所述第二测试得分数据分为第四测试得分数据和第五测试得分数据;其中,所述第四测试得分数据包括所述试题集合中所有的试题得分数据,所述第五测试得分数据不包括所述试题集合中所有的试题得分数据;
匹配子模块,用于根据所述第五测试得分数据和所述第四测试得分数据的相似度,对所述第五测试得分数据和所述第四测试得分数据所对应的往届学生进行匹配;
填补子模块,用于根据匹配结果和所述第四测试得分数据,对所述第五测试得分数据进行填补;
输出子模块,用于输出所述第四测试得分数据和填补后的所述第五测试得分数据作为所述第二测试得分数据。
进一步地,在本申请的一个实施例中,所述匹配模块具体用于确定所述第二测试得分数据和所述第一测试得分数据的欧氏距离,并对欧氏距离最小的第二测试得分数据和第一测试得分数据所分别对应的往届学生和当届学生进行匹配。
进一步地,在本申请的一个实施例中,所述系统还包括:
第二处理模块,用于将学生对同一试题多次测试得分数据的均值作为所述学生对所述试题的测试得分数据进行输出;所述学生包括当届学生和往届学生。
第三方面,本申请实施例提供了一种基于相似度的学生测试数据处理装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现上述的基于相似度的学生测试数据处理方法。
第四方面,本申请实施例还提供了一种介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现上述的基于相似度的学生测试数据处理方法。
本申请的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到:
本申请实施例通过获取待测试题和所述待测试题对应的知识点,基于该知识点获取和所述待测试题相关的试题集合,然后根据当届学生对所述试题集合的第一测试得分数据和往届学生对所述试题集合的第二测试得分数据进行相似度匹配,并将匹配到的往届学生对所述待测试题的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出;本申请实施例给出的预测结果结合了过往学习者的实测成绩,更能贴近真实的测试情况,能够提高学生成绩预测的可靠性,该预测结果有助于学生或者教师判断当下的学习进度和成果,方便针对性地对某些知识点进行复习。
附图说明
为了更清楚地说明本申请实施例或者现有技术中的技术方案,下面对本申请实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本申请的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1为根据本申请实施例提供的一种基于相似度的学生测试数据处理方法的流程示意图;
图2为根据本申请实施例提供的一种基于相似度的学生测试数据处理系统的结构示意图;
图3为根据本申请实施例提供的一种基于相似度的学生测试数据处理装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
下面参照附图,详细描述根据本申请实施例提出的基于相似度的学生测试数据处理方法和系统,首先将参照附图描述根据本申请实施例提出的基于相似度的学生测试数据处理方法。
参照图1,本申请实施例中提供的基于相似度的学生测试数据处理方法,主要包括以下步骤:
S1、获取待测试题和所述待测试题对应的知识点;
本申请实施例中,首先获取到需要进行测试得分预测的试题,记为试题p,该测试试题可以是涵盖各个行业、学科的任一试题,试题的获取形式可以是从某些学校的数据库导入,也可以是从网络数据库中获取,可选地,例如某些教材试题就可以作为本申请中的试题p。对应地,在各个领域内,该试题归属于某个上位的知识点,例如就教材书籍而言,其内的试题归属于各个章节,则章节即可作为该试题对应的知识点。当然,以上仅为知识点的一种可选实施方案,实际设置知识点的方式是多种多样的,例如按照试题所属的学科进行知识点分类也是可行的方案;另一种可选的实施方式,也可以通过大数据结合神经网络算法等技术,由计算机自动进行所有试题的知识点分类。
S2、根据所述知识点,获取和所述待测试题相关的试题集合;
本申请实施例中,在获取到试题p对应的知识点后,基于该知识点获取其他的多个试题,组成试题集合,记为试题集合Q,Q={q1,q2,q3,q4...qm},其中,q1,q2,q3,q4...qm为m个和试题p相关的试题。具体地,例如,对于章节作为试题p对应的知识点情况,可以选择该章节下其他的试题组成试题集合Q,试题集合Q中试题的总数m可以尽量地多,以提高最终预测结果的准确性。应当说明的是,本申请实施例中试题集合Q内的试题,应当优选为被测学生已经测试过的试题。
S3、获取当届学生对所述试题集合的第一测试得分数据、往届学生对所述试题集合的第二测试得分数据和往届学生对所述待测试题的第三测试得分数据;
本申请实施例中,需要预测的是当届学生对试题p的测试得分,因此首先获取当届学生对所述试题集合的第一测试得分数据。而在大数据范围内,学生的学习效果是有一定相似性的,即可以根据过往学习者的成绩预测当前学习者的学习效果。所以本申请实施例中,还获取了往届学生的一些测试数据,即往届学生对所述试题集合的第二测试得分数据和往届学生对所述待测试题的第三测试得分数据,从而通过对比当届学生和往届学生的学习相似度,来基于往届学生的成绩对当届学生进行预测,以更好地指导当届学生的学习行为,为有针对性地教师教学、学生自查提供可靠的数据支持。应当理解的是,本申请实施例中所述的当届学生、往届学生,当届学生指的是需要进行预测试题p的测试得分的学生,往届学生则是已经做过试题p,并且记录有对试题p得分数据的学生。一般来说,往届学生可以理解为指当届学生的上一届或者上多届学生。
S4、根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届学生进行匹配;
本申请实施例中,根据当届学生和往届学生对同一组试题集合,即前述试题集合Q的测试得分数据进行相似度计算。具体地,可以通过计算当届学生的第一测试得分数据和往届学生的第二测试得分数据之间的欧氏距离,然后选取欧氏距离最小的往届学生作为与当届学生最接近的相似学习者,从而完成匹配。
S5、将所述往届学生的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出;
完成上述的当届学生和往届学生匹配任务后,本申请实施例即可根据往届学生对试题p的真实成绩作为当届学生对试题p的预测成绩进行输出,从而有效地得到更普适、宽泛的成绩预测结果,该结果是根据大数据下相似学习者的学习效果接近得到的。相对于单独依照学习者自身来判断,本申请实施例给出的预测结果结合了过往学习者的实测成绩,会基于试题本身的难度变化,更能贴近真实的情况,有助于学生或者教师判断当下的学习进度和成果,方便针对性地对某些知识点进行提高。
作为一种可选的实施方式,本申请实施例中获取往届学生对所述试题集合的第二测试得分数据这一步骤,其具体包括:
S301、根据所述第二测试得分数据是否包括所述试题集合中所有的试题得分数据,将所述第二测试得分数据分为第四测试得分数据和第五测试得分数据;其中,所述第四测试得分数据包括所述试题集合中所有的试题得分数据,所述第五测试得分数据不包括所述试题集合中所有的试题得分数据;
S302、根据所述第五测试得分数据和所述第四测试得分数据的相似度,对所述第五测试得分数据和所述第四测试得分数据所对应的往届学生进行匹配;
S303、根据匹配结果和所述第四测试得分数据,对所述第五测试得分数据进行填补;
S304、将所述第四测试得分数据和填补后的所述第五测试得分数据作为所述第二测试得分数据。
本申请实施例中,在实际获取到的往届学生对试题集合Q的测试得分数据里面,因为要照顾到试题集合Q使其尽可能包括更多的试题,所以得到的第二测试得分数据很可能会出现数据维度不完整的情况。例如某教学模块有10道题,A学生(当届学生)完成了1,2,3,4,8,10道题,成绩分别是60,70,80,80,50,50,60;以往的成绩记录有某位B学生(往届学生)完成了第1,2,3,5,8,10道试题,成绩是60,70,79,88,49,59。A学生、B学生两位学生的相似度是很高,但B学生的第二测试得分维度并没有完全覆盖A学生,所以通过B学生去预测A学生的成绩存在一定困难。而上述数据缺失的问题其实是非常普遍的,一方面可能是往届学生的相关数据记录不全,另一方面,也有可能是往届学生没有做过对应的试题。鉴于以上问题,本申请实施例中又通过往届学生之间的相似度,提出了一种数据样本维度补齐的方法。具体地,本申请实施例中,先根据每个往届学生的所述第二测试得分数据是否包括所述试题集合Q中所有的试题得分数据,将所述第二测试得分数据分为第四测试得分数据和第五测试得分数据,其中,如果往届学生的所述第二测试得分数据包括所述试题集合中所有的试题得分数据,即对应试题集合Q,Q={q1,q2,q3,q4...qm}中的各个试题q,均有得分的记录,则将该部分往届学生所对应的第二测试得分数据标定为第四测试得分数据;如果往届学生的所述第二测试得分数据不包括所述试题集合中所有的试题得分数据,例如对应试题集合Q,某位往届学生C缺少了第k道题目qk的得分记录(k为1~m之间的整数),则将该往届学生C的第二测试得分数据标定为第五测试得分数据。
然后,由于第四得分数据覆盖了第五得分数据中的所有试题,因此可以对所述第五测试得分数据和所述第四测试得分数据进行相似度计算。具体地,可以通过计算往届学生的第四测试得分数据和往届学生的第五测试得分数据之间的欧氏距离,然后选取欧氏距离最小的两名往届学生作为最接近的相似学习者,从而完成匹配,例如对于前述的往届学生C,匹配到往届学生D的第四测试得分数据和往届学生C的第五测试得分数据最接近,既可以将往届学生D对于第k道题目qk的得分数据作为往届学生C对于第k道题目qk的得分数据,从而使得所有的第二测试得分数据维度都完整包括所有的试题q,以更方便地用于评估预测当届学生的成绩。
作为一种可选的实施方式,本申请实施例还包括以下步骤:
将学生对同一试题多次测试得分数据的均值作为所述学生对所述试题的测试得分数据进行输出;所述学生包括当届学生和往届学生。
本申请实施例中,当届学生和往届学生对于试题集合Q或者往届学生对于待测试题p,有可能会存在多次测试,含有多个测试结果的情况。因此本申请实施例中采用每个学生对同一试题多次测试得分数据的均值作为该学生对所述试题的测试得分数据进行输出,使得测试数据更具可靠性,从而提高预测结果的精度。
其次,参照附图描述根据本申请实施例提出的基于相似度的学生测试数据处理系统。
图2是本申请一个实施例的基于相似度的学生测试数据处理系统结构示意图。
所述系统具体包括:
第一获取模块101,用于获取待测试题和所述待测试题对应的知识点;
第一处理模块102,用于根据所述知识点,获取和所述待测试题相关的试题集合;
第二获取模块103,用于获取当届学生对所述试题集合的第一测试得分数据、往届学生对所述试题集合的第二测试得分数据和往届学生对所述待测试题的第三测试得分数据;
匹配模块104,用于根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届进行匹配;
输出模块105,用于将所述往届学生的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出。
可选地,在本申请的一个实施例中,所述第二获取模块103包括:
分类子模块,用于根据所述第二测试得分数据是否包括所述试题集合中所有的试题得分数据,将所述第二测试得分数据分为第四测试得分数据和第五测试得分数据;其中,所述第四测试得分数据包括所述试题集合中所有的试题得分数据,所述第五测试得分数据不包括所述试题集合中所有的试题得分数据;
匹配子模块,用于根据所述第五测试得分数据和所述第四测试得分数据的相似度,对所述第五测试得分数据和所述第四测试得分数据所对应的往届学生进行匹配;
填补子模块,用于根据匹配结果和所述第四测试得分数据,对所述第五测试得分数据进行填补;
输出子模块,用于输出所述第四测试得分数据和填补后的所述第五测试得分数据作为所述第二测试得分数据。
可选地,在本申请的一个实施例中,所述匹配模块104具体用于确定所述第二测试得分数据和所述第一测试得分数据的欧氏距离,并对欧氏距离最小的第二测试得分数据和第一测试得分数据所分别对应的往届学生和当届学生进行匹配。
可选地,在本申请的一个实施例中,所述系统还包括:
第二处理模块106,用于将学生对同一试题多次测试得分数据的均值作为所述学生对所述试题的测试得分数据进行输出;所述学生包括当届学生和往届学生。
可见,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
参照图3,本申请实施例提供了一种基于相似度的学生测试数据处理装置,包括:
至少一个处理器201;
至少一个存储器202,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器201执行时,使得所述至少一个处理器201实现所述的基于相似度的学生测试数据处理方法。
同理,上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
本申请实施例还提供了一种存储介质,其中存储有处理器201可执行的指令,所述处理器201可执行的指令在由处理器201执行时用于执行所述的基于相似度的学生测试数据处理方法。
同理,上述方法实施例中的内容均适用于本存储介质实施例中,本存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本申请的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本申请,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本申请是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本申请。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本申请的范围,本申请的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的物体销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件物体的形式体现出来,该计算机软件物体存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施方式,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同物限定。
以上是对本申请的较佳实施进行了具体说明,但本申请并不限于所述实施例,熟悉本领域的技术人员在不违背本申请精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (8)
1.一种基于相似度的学生测试数据处理方法,其特征在于,包括以下步骤:
获取待测试题和所述待测试题对应的知识点;
根据所述知识点,获取和所述待测试题相关的试题集合;
获取当届学生对所述试题集合的第一测试得分数据、往届学生对所述试题集合的第二测试得分数据和往届学生对所述待测试题的第三测试得分数据;
根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届学生进行匹配;
将所述往届学生的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出;
获取往届学生对所述试题集合的第二测试得分数据这一步骤,其具体包括:
根据所述第二测试得分数据是否包括所述试题集合中所有的试题得分数据,将所述第二测试得分数据分为第四测试得分数据和第五测试得分数据;其中,所述第四测试得分数据包括所述试题集合中所有的试题得分数据,所述第五测试得分数据不包括所述试题集合中所有的试题得分数据;
根据所述第五测试得分数据和所述第四测试得分数据的相似度,对所述第五测试得分数据和所述第四测试得分数据所对应的往届学生进行匹配;
根据匹配结果和所述第四测试得分数据,对所述第五测试得分数据进行填补;
将所述第四测试得分数据和填补后的所述第五测试得分数据作为所述第二测试得分数据。
2.根据权利要求1所述的一种基于相似度的学生测试数据处理方法,其特征在于,所述根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届进行匹配这一步骤,其具体包括:
确定所述第二测试得分数据和所述第一测试得分数据的欧氏距离;
对欧氏距离最小的第二测试得分数据和第一测试得分数据所分别对应的往届学生和当届学生进行匹配。
3.根据权利要求1所述的一种基于相似度的学生测试数据处理方法,其特征在于,还包括以下步骤:
将学生对同一试题多次测试得分数据的均值作为所述学生对所述试题的测试得分数据进行输出;所述学生包括当届学生和往届学生。
4.一种基于相似度的学生测试数据处理系统,其特征在于,包括:
第一获取模块,用于获取待测试题和所述待测试题对应的知识点;
第一处理模块,用于根据所述知识点,获取和所述待测试题相关的试题集合;
第二获取模块,用于获取当届学生对所述试题集合的第一测试得分数据、往届学生对所述试题集合的第二测试得分数据和往届学生对所述待测试题的第三测试得分数据;
匹配模块,用于根据所述第二测试得分数据和所述第一测试得分数据的相似度,对所述当届学生和所述往届进行匹配;
输出模块,用于将所述往届学生的所述第三测试得分数据作为匹配到的所述当届学生对所述待测试题的预测成绩进行输出;
所述第二获取模块包括:
分类子模块,用于根据所述第二测试得分数据是否包括所述试题集合中所有的试题得分数据,将所述第二测试得分数据分为第四测试得分数据和第五测试得分数据;其中,所述第四测试得分数据包括所述试题集合中所有的试题得分数据,所述第五测试得分数据不包括所述试题集合中所有的试题得分数据;
匹配子模块,用于根据所述第五测试得分数据和所述第四测试得分数据的相似度,对所述第五测试得分数据和所述第四测试得分数据所对应的往届学生进行匹配;
填补子模块,用于根据匹配结果和所述第四测试得分数据,对所述第五测试得分数据进行填补;
输出子模块,用于输出所述第四测试得分数据和填补后的所述第五测试得分数据作为所述第二测试得分数据。
5.根据权利要求4所述的一种基于相似度的学生测试数据处理系统,其特征在于:
所述匹配模块具体用于确定所述第二测试得分数据和所述第一测试得分数据的欧氏距离,并对欧氏距离最小的第二测试得分数据和第一测试得分数据所分别对应的往届学生和当届学生进行匹配。
6.根据权利要求4所述的一种基于相似度的学生测试数据处理系统,其特征在于,还包括:
第二处理模块,用于将学生对同一试题多次测试得分数据的均值作为所述学生对所述试题的测试得分数据进行输出;所述学生包括当届学生和往届学生。
7.一种基于相似度的学生测试数据处理装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-3中任一项所述的方法。
8.一种计算机可读存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于实现如权利要求1-3中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010394452.8A CN111709551B (zh) | 2020-05-11 | 2020-05-11 | 基于相似度的学生测试数据处理方法、系统、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010394452.8A CN111709551B (zh) | 2020-05-11 | 2020-05-11 | 基于相似度的学生测试数据处理方法、系统、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111709551A CN111709551A (zh) | 2020-09-25 |
CN111709551B true CN111709551B (zh) | 2023-04-25 |
Family
ID=72537387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010394452.8A Active CN111709551B (zh) | 2020-05-11 | 2020-05-11 | 基于相似度的学生测试数据处理方法、系统、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111709551B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113077872A (zh) * | 2021-03-29 | 2021-07-06 | 山东思正信息科技有限公司 | 基于量表测试数据的群体心理状态多指标预测系统及装置 |
CN114742463A (zh) * | 2022-05-09 | 2022-07-12 | 精华教育科技股份有限公司 | 一种基于高校学生的学业预警分析系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108171358A (zh) * | 2017-11-27 | 2018-06-15 | 科大讯飞股份有限公司 | 成绩预测方法及装置、存储介质、电子设备 |
CN110274995A (zh) * | 2019-06-18 | 2019-09-24 | 深圳市美兆环境股份有限公司 | 填充数据的确定方法、装置及计算机设备 |
CN110443427A (zh) * | 2019-08-12 | 2019-11-12 | 浙江蓝鸽科技有限公司 | 基于认知知识谱的成绩预测方法及其系统 |
CN110765362A (zh) * | 2019-09-04 | 2020-02-07 | 广东工业大学 | 一种基于学习情况相似度的协同过滤个性化学习推荐方法 |
-
2020
- 2020-05-11 CN CN202010394452.8A patent/CN111709551B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108171358A (zh) * | 2017-11-27 | 2018-06-15 | 科大讯飞股份有限公司 | 成绩预测方法及装置、存储介质、电子设备 |
CN110274995A (zh) * | 2019-06-18 | 2019-09-24 | 深圳市美兆环境股份有限公司 | 填充数据的确定方法、装置及计算机设备 |
CN110443427A (zh) * | 2019-08-12 | 2019-11-12 | 浙江蓝鸽科技有限公司 | 基于认知知识谱的成绩预测方法及其系统 |
CN110765362A (zh) * | 2019-09-04 | 2020-02-07 | 广东工业大学 | 一种基于学习情况相似度的协同过滤个性化学习推荐方法 |
Non-Patent Citations (1)
Title |
---|
狄晓娇 ; .基于数据挖掘技术的学生成绩分析.现代商贸工业.2018,(17),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111709551A (zh) | 2020-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Perez et al. | Identifying productive inquiry in virtual labs using sequence mining | |
CN108121702B (zh) | 数学主观题评阅方法及系统 | |
CN110909035B (zh) | 个性化复习题集生成方法、装置、电子设备及存储介质 | |
CN105448152A (zh) | 一种在线教学系统 | |
CN111709551B (zh) | 基于相似度的学生测试数据处理方法、系统、装置及介质 | |
WO2019218427A1 (zh) | 基于行为特征对比的关注度检测方法以及装置 | |
US10984672B2 (en) | Tutoring agent improvement recommendation | |
CN105159924A (zh) | 学习资源推送方法和系统 | |
CN112199598A (zh) | 网络课程的推荐方法、装置及计算机设备 | |
CN115358897B (zh) | 一种基于电子学生证的学生管理方法、系统、终端及存储介质 | |
CN109697988A (zh) | 一种语音评价方法及装置 | |
CN111597305B (zh) | 实体标记方法、装置、计算机设备和存储介质 | |
Moore et al. | Is instructor (faculty) modeling an effective practice for teacher education? Insights and supports for new research | |
CN110489455A (zh) | 学习资源推荐方法、装置、电子设备和存储介质 | |
CN111460101A (zh) | 知识点类型的识别方法、装置及处理器 | |
Aggarwal et al. | Principles for using machine learning in the assessment of open response items: Programming assessment as a case study | |
CN113806500A (zh) | 信息处理方法、装置和计算机设备 | |
CN107844531B (zh) | 答案输出方法、装置和计算机设备 | |
CN110688409A (zh) | 学习状态的挖掘方法、推荐方法及电子设备 | |
US10665123B2 (en) | Smart examination evaluation based on run time challenge response backed by guess detection | |
Tan et al. | Does informativeness matter? Active learning for educational dialogue act classification | |
Maxwell | Defining standards for the 21st century | |
KR101199029B1 (ko) | 언어 영역의 학습 정도를 진단하기 위한 시스템 및 방법 | |
TWI453703B (zh) | 學習診斷分析方法及學習診斷分析系統 | |
CN117635381B (zh) | 一种基于人机对话的计算思维品质评估方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |