CN110659352B - 试题考点识别方法及其系统 - Google Patents
试题考点识别方法及其系统 Download PDFInfo
- Publication number
- CN110659352B CN110659352B CN201910960223.5A CN201910960223A CN110659352B CN 110659352 B CN110659352 B CN 110659352B CN 201910960223 A CN201910960223 A CN 201910960223A CN 110659352 B CN110659352 B CN 110659352B
- Authority
- CN
- China
- Prior art keywords
- examination
- question
- target test
- knowledge
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 479
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012545 processing Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000009411 base construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 244000273256 Phragmites communis Species 0.000 description 2
- 235000014676 Phragmites communis Nutrition 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 229910052900 illite Inorganic materials 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- VGIBGUSAECPPNB-UHFFFAOYSA-L nonaaluminum;magnesium;tripotassium;1,3-dioxido-2,4,5-trioxa-1,3-disilabicyclo[1.1.1]pentane;iron(2+);oxygen(2-);fluoride;hydroxide Chemical compound [OH-].[O-2].[O-2].[O-2].[O-2].[O-2].[F-].[Mg+2].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[K+].[K+].[K+].[Fe+2].O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2 VGIBGUSAECPPNB-UHFFFAOYSA-L 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Educational Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及教学领域,公开了一种试题考点识别方法及其系统。该方法包括:提取目标试题中的各知识点;判定该目标试题的考查目的,并确定该各知识点与该考查目的的相关性;根据该相关性,计算该各知识点中的每个知识点的重要程度;根据该每个知识点的重要程度确定该目标试题的考点。本申请的实施方式能够准确、快速地识别试题的考点,且可靠性强,给教学提供了更好的便利。
Description
技术领域
本申请涉及教学领域,特别涉及试题考点识别技术。
背景技术
在智能组卷、个性化学习、在线教育等教学应用系统中,题库是资源的核心部分,其中试题中所包含的知识点是贯穿各类教学应用系统的基本元素。然而,要实现试题资源精准化推荐,只对试题中的知识点进行标识远远不够,还需对试题中核心考核知识点(即考点)进行标识。
目前,试题的考点标识主要是靠人工操作,但由于不同人的知识储备和教学经验不同,以及人为主观因素等影响,导致试题的考点提取差异性大、准确性不高;而已有的计算机自动标识方式,只是对试题中的知识点进行标识,并未对试题中的考点(即试题核心考核的知识点)和一般知识点(非试题考核要求的其它知识点)进行区分。
发明内容
本申请的目的在于提供一种试题考点识别方法及其系统,能够准确、快速地识别试题的考点,且可靠性强,给教学提供了更好的便利。
本申请公开了一种试题考点识别方法,包括:
提取目标试题中的各知识点;
判定所述目标试题的考查目的,并确定所述各知识点与所述考查目的的相关性;
根据所述相关性,计算所述各知识点中的每个知识点的重要程度;
根据所述每个知识点的重要程度确定所述目标试题的考点。
在一个优选例中,所述判定所述目标试题的考查目的,进一步包括:
根据所述目标试题的题型,确定所述目标试题对应的各考查目的;
根据所述各考查目的,从所述目标试题中提取对应的特征词;
根据所述各考查目的对应的特征词,获取包含所述特征词的样本试题;
如果各所述样本试题同属一个考查目的,则判定该考查目的为所述目标试题的考查目的,否则计算各所述样本试题与所述目标试题的相似度,判定所述相似度最大的样本试题的考查目的为所述目标试题的考查目的,其中所述样本试题与所述目标试题的相似度是根据两试题中特征词的交集个数和所述两试题之间特征词最多的个数确定。
在一个优选例中,所述根据所述目标试题的题型,确定所述目标试题对应的各考查目的之前,还包括:
对所述目标试题的题型进行识别并标识;
所述提取目标试题中的各知识点,进一步包括:
提取目标试题中的各知识点,并确定所述各知识点所属专题和主题;
所述确定所述各知识点与所述考查目的的相关性,进一步包括:
根据所述考查目的对应的专题和主题,确定所述各知识点中属于该专题和主题的知识点与所述考查目的相关,其他知识点与所述考查目的不相关;
所述根据所述相关性,计算所述各知识点中的每个知识点的重要程度,进一步包括:
根据所述各知识点与所述考查目的相关或不相关情况,计算所述各知识点中的每个知识点的重要程度。
在一个优选例中,所述提取目标试题中的各知识点之后,还包括:
根据所述目标试题的题型,判定所述目标试题的考点分布位置;
根据所述考点分布位置,计算所述各知识点中的每个知识点的重要程度;
所述根据所述每个知识点的重要程度确定所述目标试题的考点,进一步包括:
根据所述考查目的对应的所述每个知识点的重要程度和所述考点分布位置对应的所述每个知识点的重要程度,确定所述目标试题的考点。
在一个优选例中,所述考点分布位置包括篇章、题干、正确选项、非正确选项、答案和答题点;
所述提取目标试题中的各知识点之前,还包括:
对所述目标试题的试题结构进行划分并标识,所述试题结构包括篇章、题干信息、选项信息、答案信息;
对所述目标试题中的答题点进行标识;
所述根据所述目标试题的题型,判定所述目标试题的考点分布位置之前,还包括:
对所述目标试题的题型进行识别并标识。
在一个优选例中,所述提取目标试题中的各知识点之后,还包括:
根据所述目标试题的题型,判断所述目标试题中是否存在特殊格式;
如果所述目标试题中存在特殊格式,则确定所述特殊格式对应的知识点,计算所述各知识点中每个知识点的重要程度;
所述根据所述考查目的对应的所述每个知识点的重要程度和所述考点分布位置对应的所述每个知识点的重要程度,确定所述目标试题的考点,进一步包括:
根据所述考查目的对应的所述每个知识点的重要程度、所述考点分布位置对应的所述每个知识点的重要程度和所存在的特殊格式对应的所述每个知识点的重要程度,确定所述目标试题的考点。
在一个优选例中,所述特殊格式包括内容格式和文本特殊样式;
所述提取目标试题中的各知识点之前,还包括:
将所述目标试题中各内容格式转化为文本信息并标识;
对所述目标试题中的文本特殊样式进行标识;
所述根据所述目标试题的题型,判断所述目标试题中是否存在特殊格式之前,还包括:
对所述目标试题的题型进行识别并标识。
在一个优选例中,所述提取目标试题中的各知识点之前,还包括:
根据教学大纲和各类考试考纲,获取各类知识点,并进行属性信息标注,构建知识点库,所述属性信息包括每个知识点的唯一标识和其对应的专题和主题;
根据不同题型的考核要求,收集各类题型的样本试题集,统计每类题型下的各样本试题的考查目的、考点分布位置、特殊格式,并提取各考查目的对应的特征词,以获取每类题型的特征信息,构建试题特征库;
所述提取各考查目的对应的特征词,进一步包括:
对于每类题型对应的考查目的,收集每个考查目的对应的样本试题集,并对每个样本试题进行分词处理,得到所述每个考查目的所有样本试题的字词集合;
计算所述每个考查目的对应的字词集合中的各字词的重要程度,选取重要程度大于预设阈值的字词为该考查目的的特征词,其中每个字词的重要程度是根据该字词在所属考查目的对应的样本试题集中出现的频率和该字词在所有考查目的对应的所有样本试题集中出现的情况确定的。
在一个优选例中,所述提取目标试题中的各知识点,并确定所述各知识点所属专题和主题,进一步包括:
基于所述知识点库,提取目标试题中的各知识点,确定各知识点所属专题和主题;
所述判定所述目标试题的考查目的、所述判定所述目标试题的考点分布位置或所述判断所述目标试题中存在的特殊格式的各步骤,分别进一步包括:
基于所述试题特征库,根据所述目标试题的题型判定所述目标试题的考查目的;
基于所述试题特征库,根据所述目标试题的题型判定考点分布位置;
基于所述试题特征库,根据所述目标试题的题型所涉及的特殊格式判断所述目标试题中是否存在特殊格式。
本申请还公开了一种试题考点识别系统包括:
提取模块,用于提取目标试题中的各知识点;
判断模块,用于判定所述目标试题的考查目的,并确定所述各知识点与所述考查目的的相关性;
计算模块,用于根据所述相关性,计算所述各知识点中的每个知识点的重要程度,用于根据所述每个知识点的重要程度确定所述目标试题的考点。
本申请还公开了一种试题考点识别系统包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现如前文描述的方法中的步骤。
本申请还公开了一种计算机可读存储介质所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本申请实施方式中,通过对目标试题的考查目的维度进行特征分析和判定,来评估该目标试题中各知识点的重要程度,从而准确地识别出该目标试题的考点。并且可以针对不同题型的目标试题,同时结合该目标试题的考点位置分布关系和/或各种特殊格式的特征分析和判定,进而从多个维度来评估该目标试题中各知识点的重要程度,从而更加准确且可靠地识别出试题的考点。
并且,预先构建的知识点库和试题特征库为提取目标试题知识点和判定目标试题的考查目的、考点分布位置和存在的特殊格式提供特征分析和判定基础,使得特征分析和判定过程更加可靠、快速地进行,除进一步提高目标试题考点的识别准确性和可靠性以外,还使得识别速度快,实用性强。
进一步地,在构建知识点库时,各知识点唯一标识可以根据知识点的属性信息“学科、水平阶段、知识点类型、专题、主题等”统一规范性编码生成的,后续计算机处理过程中,只需根据知识点唯一标识即可获取知识点相应属性信息,有利于减少数据查询工作量。例如:获取试题的考查目的对应的专题、主题下的知识点,不需按照“考查目的→专题→主题→知识点”索引目录去搜索相应的知识点,只需根据试题中的知识点唯一标识即可获取。
同时,在构建试题特征库时,可以根据不同题型试题的考核要求,收集各类题型的样本试题集,对不同题型试题的考查目的、考点位置、存在的特殊格式进行统计与特征分析,提取各题型的特征信息。其中根据字词在所属考查目的样本试题集中出现频率的和非所属考查目的样本试题集出现的情况,可有效地提取代表性强的特征词,并且随着各考查目的输入的样题量的不断增加,特征词的提取越来越准确、客观,有利于提高试题考点识别的准确性和可靠性。
进一步地,在该目标试题进行考点识别之前,预先对该目标试题的试题内容进行标准化处理,例如包括:识别并标识其题型,划分并标识其试题结构,标识其中存在特殊格式、答题点信息等,便于系统快速读取该目标试题的各相关信息。并且,对试题内容的标准化处理过程还可进行任务分解,系统可以多线程处理每一道待识别目标试题的多个任务、以及可以多线程处理多道待识别的目标试题,这种多线程并行处理方式有利于提高总体数据处理速度。
进一步地,鉴于现有的计算机自动标识方式未对试题中的考点和一般知识点进行区分标注,本申请的实施方式根据目标试题中所有知识点的重要性,按照重要性从高到低进行排序,对该目标试题中的主要考点、次要考点、一般知识点进行划分并标识,并将其属性信息存储在对应的属性文件中。一方面可以将各考点信息显示到计算机系统的人机交互界面,供人工查看;另一方面各类教学应用系统在获取相应考点或知识点的试题时,可以根据各试题的知识点属性信息实现精准推荐;除此之外,根据本申请的实施方式识别的考点信息可大数据统计考点分布情况,以及考点之间关联性等,给教学提供了更好的便利。
经过对比验证,与经验丰富的教研人员相比,根据本申请的实施方式对各参与验证的试题的考点识别准确率高达97%,符合各类智能化教学的应用需要。
本申请的说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本申请上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均因视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相组合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
附图说明
图1是根据本申请第一实施方式的试题考点识别方法流程示意图
图2是根据本申请第一实施方式的一个实施例的判定该目标试题的考查目的过程流程示意图
图3是根据本申请第一实施方式的一个实施例的流程示意图
图4是根据本申请第一实施方式的一个实施例的流程示意图
图5是根据本申请第一实施方式的一个实施例的流程示意图
图6是根据本申请第一实施方式的一个实施例的流程示意图
图7是根据本申请第一实施方式的一个具体实施例的流程示意图
图8是根据本申请第二实施方式的试题考点识别系统结构示意图
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
部分概念的说明:
知识点类型:表示的是知识点的形态,不同学科的知识点类型各有不同。就语文学科而言,包括:汉语拼音、汉语笔画、汉语部首、汉语标点、汉语词汇、汉语成语、汉语句法、汉语诗词等。
专题:根据学科知识体系,将学科知识划分为几大类。例如:就语文学科而言,既要培养学生听、说、读、写的语言能力,还要传授并使学生掌握一定的汉语文学知识。因此,本发明将知识专题划分为:拼音、笔画、部首、字词、熟语、句法、文言词汇、文言句式等。
主题:针对各知识专题,对每项专题进行进一步的知识细划分,划分成若干个主题。例如:就语文学科而言,本发明将熟语专题进一步划分为:成语、惯用语、歇后语、谚语、格言警句等;将文言句式专题进一步划分为:古汉语被动句、古汉语倒装句、古汉语省略句、古汉语否定句、古汉语固定结构等。
注意:专题、主题和知识点类型之间没有关系,专题、主题指的是知识点的类别归属,知识点类型指的是知识点的形态。
考查目的:指试题的侧重考查方向,即试题的核心测试目的,各考查目的在学科知识体系中均有明确的考查专题、及其对应的相应主题。
主要考点:指试题中核心考核的知识点。
次要考点:指试题中与主要考点有直接或间接关联性的知识点,对该部分知识点的理解和掌握,可以加深对主要考点知识点的学习和记忆。
一般知识点:指试题中没有任何考核要求的其它知识点。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请的实施方式作进一步地详细描述。
本申请的第一实施方式涉及一种试题考点识别方法,其流程如图1所示,该方法包括以下步骤101~104:
在步骤101中,提取目标试题中的各知识点。需要说明的是:该各知识点是指目标试题中包含的所有知识点。
可选地,上述步骤101之前还包括:预先构建知识点库和试题特征库。
在一个实施例中,“构建知识点库”可以进一步包括以下步骤:
根据教学大纲和各类考试考纲,获取各类知识点,并进行属性信息标注,构建知识点库,该属性信息包括每个知识点的唯一标识和其对应的专题和主题。在其他实施例中,该属性信息还可以包括知识点唯一标识、学科、水平阶段、知识点类型等,且不限于此。例如下表1为一个示例知识点库的内容组成。
表1
可选地,基于该知识点库,该步骤101可以进一步包括以下步骤:
基于该知识点库,读取该目标试题的文本信息,对该目标试题进行分段、分句、分词,产生一系列的分割后的字、词片段,将这些字、词片段与该知识点库中的知识点元素进行匹配,从而获取试题中的所有知识点,即各种类别的知识点,包括:字、词、句法等。
在一个实施例中,“构建试题特征库”可以进一步包括以下步骤:根据不同题型的考核要求,收集各类题型的样本试题集,统计每类题型下的各样本试题的考查目的、考点分布位置、特殊格式,并提取各考查目的对应的特征词,以获取每类题型的特征信息,构建试题特征库,其中,每个考查目的还包括其对应的专题、以及主题,且该专题、主题与该知识点库中知识点所属专题、主题一致。可选地,一个考查目的对应的专题包含1个或多个,一个专题对应的主题包含0个、1个或多个。例如下表2为一个示例试题特征库的内容组成。
表2
可选地,上述“构建试题特征库”的过程中的“提取各考查目的对应的特征词”的步骤可以进一步实现为:首先,对于每类题型对应的考查目的,收集每个考查目的对应的样本试题集,并对每个样本试题进行分句、分词处理,获取各样题分词后的字词集合,得到该每个考查目的所有样本试题的字词集合;然后,计算该每个考查目的对应的字词集合中的各字词的重要程度,选取重要程度大于预设阈值的字词作为该考查目的的特征词,其中每个字词的重要程度是根据该字词在所属考查目的对应的样本试题集中出现的频率和该字词在所有考查目的对应的所有样本试题集中出现的情况确定的。在一个实施例中,每个字词的重要程度其中,Ti,j表示j考查目的中i字词对其重要性;n为j考查目的样本试题集中所有字词个数,ui,j表示j考查目的样本试题集中i字词出现的次数;R表示所有考查目的中的样题个数,ri表示包含i字词的样题个数;但不限于此。/>
可选地,该步骤101之前还包括以下步骤①②③④:
①将该目标试题中各内容格式转化为文本信息并标识;
②对该目标试题的试题结构进行划分并标识,该试题结构包括篇章、题干信息、选项信息、答案信息;
③对该目标试题中的答题点、文本特殊样式进行标识;
④对该目标试题的题型进行识别并标识。此处是对目标试题进行标准化预处理,给后续读取试题相关信息提供基础。
之后,进入步骤102,判定该目标试题的考查目的,并确定该各知识点与该考查目的的相关性。
在一个实施例中,如图2所示,上述步骤102中“判定该目标试题的考查目的”进一步包括以下步骤201~206:在步骤201中,根据该目标试题的题型,确定该目标试题对应的各考查目的;之后进入步骤202,根据该各考查目的,从该目标试题中提取对应的特征词;之后进入步骤203,根据该各考查目的对应的特征词,获取包含该特征词的样本试题;之后进入步骤204,判断各该样本试题同属一个考查目的?如果各该样本试题同属一个考查目的,则进入步骤205,判定该考查目的为该目标试题的考查目的;否则进入步骤206,计算各该样本试题与该目标试题的相似度,判定该相似度最大的样本试题的考查目的为该目标试题的考查目的。该样本试题与该目标试题的相似度可以但不限于根据两试题中特征词的交集个数和该两试题之间特征词最多的个数来确定。
可选地,该步骤202中“根据该各考查目的,从该目标试题中提取对应的特征词”可以进一步包括以下步骤:
基于该试题特征库,根据该各考查目的,从该目标试题中提取对应的特征词。
并且,该步骤206中“计算各该样本试题与该目标试题的相似度”的方法有多种。在一个实施例中,可以根据两试题中特征词的交集个数和该两试题之间特征词最多的个数确定;例如但不限于,该样本试题与该目标试题的相似度其中i为该试题,j为样题,mij为两个试题的特征词相似度,si、sj分别是i试题和j样题中的特征词个数,Min(si,sj)为两试题特征词的交集个数,Max(si,sj)为两试题之间特征词最多的个数。在其他实施例中,可以只根据两试题中特征词的交集个数等。
该步骤102中的该各知识点与该考查目的的相关性可以包括多种判断结果。可选地,可以包括相关和不相关两种判断结果。可选地,可以包括相关程度不同的多种相关结果,例如该不同的多种相关结果可以按照百分比表示。
之后,进入步骤103,根据该相关性,计算该各知识点中的每个知识点的重要程度。
可选地,该步骤103可以进一步包括以下步骤:首先,根据所确定该各知识点与该考查目的的相关性分别进行分配权重值,然后,根据所分配的权重值计算该各知识点中的每个知识点的重要程度。需要说明的是,该权重值的分配方法可以按照重要程度的从高到低进行赋值,重要程度越高,所赋权重值越大。
在一个实施例中,如图3所示,上述步骤101可以进一步包括步骤301,上述步骤102可以进一步包括步骤302,上述步骤103可以进一步包括步骤303。其中,在该步骤301中,提取目标试题中的各知识点,并确定该各知识点所属专题和主题;在该步骤302中,根据该目标试题的题型,判定该目标试题的考查目的,根据该考查目的对应的专题和主题,确定该各知识点中属于该专题和主题的知识点与该考查目的相关,其他知识点与该考查目不相关;在该步骤303中,根据该各知识点与该考查目的相关或不相关情况,计算该各知识点中的每个知识点的重要程度。
需要指出:在该步骤301中,可以例如但不限于基于该知识点库和知识点特征匹配方式来提取目标试题中的各知识点,并确定该各知识点所属专题和主题。在该步骤302中,可以例如但不限于基于该试题特征库,根据该目标试题的题型确定该考查目的对应的专题和主题。
之后,进入步骤104,根据该每个知识点的重要程度确定该目标试题的考点。
可选地,该步骤104还可以进一步包括以下步骤A和B:
A.按照该目标试题中所有知识点的重要程度从高到低进行排序;
B.根据排序结果进行划分重要性等级,其中重要性等级个数根据需要进行设置。例如,根据排序结果进行划分成3个重要性等级(主要考点、次要考点、一般知识点),将排序靠后的重要程度为0的知识点划分为一般知识点;统计该目标试题中除一般知识点的知识点数量,若该数量符合该题型考点数量要求,取全部非一般知识点的知识点为主要考点,若该数量超出该题型考点数量上限,按照知识点重要性从高到低取知识点作为主要考点,直到考点数量达到该题型上限,其它知识点则划分为次要考点。需要说明的是,该各题型考点数量要求是根据现有试题库中的试题数据,对各题型试题考点的数量进行统计与分析,获取不同题型试题的考点数量范围。
可选地,如图4所示,上述步骤101之后还包括以下步骤401~402:在步骤401中,根据该目标试题的题型,判定该目标试题的考点分布位置;之后进入步骤402,根据该考点分布位置,计算该各知识点中的每个知识点的重要程度。在一个实施例中,该步骤401可以进一步包括以下步骤:基于该试题特征库,根据该目标试题的题型判定考点分布位置。
进一步可选地,如图4所示,基于该步骤101~103和该步骤401~402,该步骤104可以进一步包括以下步骤403:根据该考查目的对应的该每个知识点的重要程度和该考点分布位置对应的该每个知识点的重要程度,确定该目标试题的考点。
需要说明的是,对于不同题型的试题,考点核心分布位置和关联性位置可以不同,例如,在单项选择题中,正确选项、题干为考点核心分布位置,非正确选项为关联性位置;在填空题中,答案和答题点所在句子为考点核心分布位置,题干为关联性位置等。而且,一个目标试题的考点分布位置可对应1个或多个,考点分布位置不限于包括篇章、题干、正确选项、非正确选项、答案和答题点等。
可选地,如图5所示,上述步骤101之后还包括以下步骤501~502:在步骤501中,根据该目标试题的题型,判断该目标试题中是否存在对应的特殊格式?如果该目标试题中存在对应的特殊格式,则进入步骤502,确定该特殊格式对应的知识点,计算该各知识点中每个知识点的重要程度;否则该目标试题中不存在特殊格式。在一个实施例中,该步骤501可以进一步包括以下步骤:基于该试题特征库,根据该目标试题的题型所涉及的特殊格式判断该目标试题中是否存在特殊格式。
进一步可选地,如图5所示,基于该步骤101~103和该步骤501~502,该步骤104可以进一步包括以下步骤503:根据该考查目的对应的该每个知识点的重要程度和所存在的特殊格式对应的该每个知识点的重要程度,确定该目标试题的考点。
在又一个实施例中,如图6所示,基于该步骤102~103、该步骤401~402和该步骤501~502,该步骤104可以进一步包括以下步骤601:根据该考查目的对应的该每个知识点的重要程度、该考点分布位置对应的该每个知识点的重要程度和所存在的特殊格式对应的该每个知识点的重要程度,确定该目标试题的考点。
需要说明的是,对于不同题型的试题,特殊格式可以不同,例如看图写作题型中的图片格式为特殊格式,单选题中字或词加点的格式为特殊格式。并且一个试题可以包含0个、1个或多个特殊格式,该特殊格式不限于包括内容格式和文本特殊样式等。
图7是本实施方式的一个具体实施例。该实施例中,通过判定试题的考查目的,确定与该试题考查目的一致的相关知识点;而且根据试题题型的考点位置分布关系,确定考核位置的相关知识点;此外,还结合试题中的各种特殊格式,确定特殊内容对应的相关知识点。进一步地,该示例结合了目标试题的考查目的、目标试题的考点位置分布情况和目标试题中各种特殊格式的三个维度,计算目标试题中各知识点的重要程度,并根据重要程度最终确定目标试题中的考点。如图7所示,具体包括以下(1)、(2)、(3)和(4)的内容:
(1)考查目的的判定和知识点权重分配:
根据该目标试题的题型判定该目标试题的考查目的,并根据该目标试题的考查目的对应的专题、主题,取该目标试题中属于该专题、主题下的知识点作为重点考核知识点,其权重值分配为1,该目标试题中其它知识点权重值为0;进一步地,假设R1n为该目标试题中的第n个知识点,an为第n个知识点的权重值,a1、a2……、an取值为1或0。进一步地,该所有知识点中的各知识点的重要程度依次a1R11,a2R12,……,anR1n,则与该目标试题考查目的相关的知识点集合为R1={a1R11,a2R12,……,anR1n},。
(2)考点位置分布判定及知识点权重分配:
基于试题特征库,根据该目标试题的题型确定该目标试题的考点分布位置,包括篇章、题干、正确选项、非正确选项、答案、答题点、答题点等所在句子处;然后根据不同题型试题的考点位置分布,处于核心位置的知识点权重值为1、关联性位置权重值为0.5、其它位置权重值为0;进一步地,假设R1n为该目标试题中的第n个知识点,bn为第n个知识点的权重值,b1、b2……、bn取值为1、0.5或0,则该所有知识点中的各知识点的重要程度依次b1R11,b2R12,……,bnR1n,则与该目标试题考点位置分布相关的知识点集合为R2={b1R11,b2R12,……,bnR1n}。
(3)特殊格式判定及知识点权重分配:
首先基于试题特征库,根据该目标试题的题型所涉及的内容格式和文本特殊样式,读取该目标试题的内容格式(表格、图片等)和特殊格式(加点、加粗、引号等)标识,确定特殊格式所对应的知识点;然后根据该目标试题中的特殊格式内容对应的知识点权重值分配为1,其它知识点权重值为0;进一步地,假设R1n为该目标试题中的第n个知识点,bn为第n个知识点的权重值,b1、b2……、bn取值为1或0,则该所有知识点中的各知识点的重要程度依次c1R11,c2R12,……,cnR1n,则与该目标试题特殊格式相关的知识点集合为R3={c1R11,c2R12,……,cnR1n}。
(4)计算试题知识点重要性:
综合计算试题中各知识点的重要程度,计算公式如下:
F(F1,F2,……,Fn)=α·R1+β·R2+δ·R3
其中,α、β、δ分别为上述三个维度的权重值,且α>β>δ,α+β+δ=1。其中α、β、δ具体的赋值情况根据目标试题本身考核特点以及实际实验数据确定,例如α、β、δ可以分别设置为0.5、0.3、0.2。
为了能够更好地理解本申请的技术方案,下面以一道试题(如表3)为例分析试题中的考点来进行说明,该例子中罗列的细节主要是为了便于理解,不作为对本申请保护范围的限制。
表3
试题内容 |
默写题:蒹葭苍苍,白露为霜。所谓伊人,______。(《诗经·蒹葭》) |
答案:在水一方 |
解析:考查对古诗文的识记能力,所谓伊人,在水一方。 |
首先,识别该示例试题的题型为:默写题(注:默写题考点通常为1个,若有n个答题点,对应n个考点,即本发明所说的主要考点);
之后,识别该示例试题的特征词有:对题干、答案、解析进行特征词识别,识别的特征词为“诗经”、“古诗文”;
之后,判定该示例试题的考查目的:特征词对应的考查目的为“诗句的理解”,对应的专题为“诗、词、曲、文言名句”,以及专题下对应的主题为“诗”;
之后,判定该示例试题的考点分布位置有:根据默写题题型,考点核心位置分布在答案、答题点所在句子,关联性位置分布在题干其它位置;
之后,判定该示例试题的特殊格式有:存在书名号。
最后判定该试题的考点为:主要考点为“诗经《蒹葭》,诗句:所谓伊人,在水一方”;次要考点为“诗经《蒹葭》,诗句:蒹葭苍苍,白露为霜”。
本申请的第二实施方式涉及一种试题考点识别系统,其结构如图8所示,该试题考点识别系统包括提取模块、判断模块和计算模块。
具体的,该提取模块用于提取目标试题中的各知识点。
可选地,该试题考点识别系统还包括预处理模块,用于ⅰ将该目标试题中各内容格式转化为文本信息并标识,ⅱ对该目标试题的试题结构进行划分并标识,ⅲ该试题结构包括篇章、题干信息、选项信息、答案信息,ⅳ对该目标试题中的答题点、文本特殊样式进行标识,ⅴ以及对该目标试题的题型进行识别并标识。优选地,该预处理模块还用于将目标试题进行任务分解,多线程方式处理以上ⅰ、ⅱ、ⅲ、ⅳ和ⅴ等多个内容,并针对目标试题的结构特点将其分解为篇章、题干、选项、答案等若干个部分,一方面为了后续考点识别,另一方面为了对各部分进行并行数据处理,有利于提高总体数据处理速度。
可选地,该试题考点识别系统还包括缓存模块,用于为每道目标试题生成HashCode,根据HashCode可从缓存区搜寻是否存在相同试题及其对应考点信息。一方面避免重复处理同一试题,减少数据处理量;另一方面将各试题数据处理信息暂存在其HashCode标识的缓存区,有利于提高数据查询速度。其中,HashCode标识的缓存区存储的信息包括试题的结构、内容格式、文本格式、题型以及后续处理获得的知识点、考点信息等。
可选地,该试题考点识别系统还包括构建模块和存储模块,该构建模块包括知识点库构建子模块和试题特征库构建子模块。
可选地,该知识点库构建子模块用于根据教学大纲和各类考试考纲,获取各类知识点,并进行属性信息标注,构建知识点库,该属性信息包括每个知识点的唯一标识和其对应的专题和主题。在其他实施例中,该属性信息还可以包括知识点唯一标识、学科、水平阶段、知识点类型等,且不限于此。例如上表1为一个示例知识点库的内容组成。
可选地,该试题特征库构建子模块用于根据不同题型的考核要求,收集各类题型的样本试题集,统计每类题型下的各样本试题的考查目的、考点分布位置、特殊格式,并提取各考查目的对应的特征词,以获取每类题型的特征信息,构建试题特征库,其中,每个考查目的还包括其对应的专题、以及主题,且该专题、主题与该知识点库中知识点所属专题、主题一致。需要说明的是,一个考查目的对应的专题包含1个或多个,一个专题对应的主题包含0个、1个或多个。例如上表2为一个示例试题特征库的内容组成。
可选地,该构建模块还包括分词子模块和计算子模块,该分词子模块用于对于每类题型对应的考查目的,收集每个考查目的对应的样本试题集,并对每个样本试题进行分词处理,得到该每个考查目的所有样本试题的字词集合;该计算子模块用于计算该每个考查目的对应的字词集合中的各字词的重要程度,选取重要程度大于预设阈值的字词为该考查目的的特征词,其中每个字词的重要程度是根据该字词在所属考查目的对应的样本试题集中出现的频率和该字词在所有考查目的对应的所有样本试题集中出现的情况确定的。
在一个实施例中,该计算子模块还用于根据计算每个字词的重要程度,其中,Ti,j表示j考查目的中i字词对其重要性;n为j考查目的样本试题集中所有字词个数,ui,j表示j考查目的样本试题集中i字词出现的次数;R表示所有考查目的中的样题个数,ri表示包含i字词的样题个数;但不限于此。
可选地,该提取模块还用于基于该知识点库,读取试题的文本信息,对该目标试题进行分段、分句、分词,产生一系列的分割后的字、词片段(此过程可以通过调用上述分词子模块实现),将这些字、词片段与该知识点库中的知识点元素进行匹配,从而获取试题中的所有知识点,即各种类别的知识点,包括:字、词、句法等。
可选地,该提取模块还用于基于该知识点库,提取目标试题中的各知识点,确定各知识点所属专题和主题。
进一步地,该判断模块用于判定该目标试题的考查目的,并确定该各知识点与该考查目的的相关性;并且该计算模块用于根据该相关性,计算该各知识点中的每个知识点的重要程度,以及根据该每个知识点的重要程度确定该目标试题的考点。
可选地,该判断模块还用于,基于该试题特征库,根据该目标试题的题型判定该目标试题的考查目的。
可选地,该判断模块,还用于根据该目标试题的题型,确定该目标试题对应的各考查目的;根据该各考查目的,从该目标试题中提取对应的特征词;根据该各考查目的对应的特征词,获取包含该特征词的样本试题;如果各该样本试题同属一个考查目的,则判定该考查目的为该目标试题的考查目的,否则计算各该样本试题与该目标试题的相似度,判定该相似度最大的样本试题的考查目的为该目标试题的考查目的,其中该样本试题与该目标试题的相似度是根据两试题中特征词的交集个数和该两试题之间特征词最多的个数确定。
在一个实施例中,该判断模块可以根据两试题中特征词的交集个数和该两试题之间特征词最多的个数确定样本试题与该目标试题的相似度;例如但不限于,该判断模块根据确定样本试题与该目标试题的相似度,其中i为该试题,j为样题,mij为两个试题的特征词相似度,si、sj分别是i试题和j样题中的特征词个数,Min(si,sj)为两试题特征词的交集个数,Max(si,sj)为两试题之间特征词最多的个数。在其他实施例中,该判断模块可以只根据两试题中特征词的交集个数确定样本试题与该目标试题的相似度等。
在一个实施例中,该提取模块还用于提取目标试题中的各知识点,并确定该各知识点所属专题和主题;该判断模块,还用于根据该考查目的对应的专题和主题,确定该各知识点中属于该专题和主题的知识点与该考查目的相关,其他知识点与该考查目的不相关;以及该计算模块还用于根据该各知识点与该考查目的相关或不相关情况,计算该各知识点中的每个知识点的重要程度。可选地,该提取模块还用于基于该知识点库,根据提取目标试题中的各知识点,确定各知识点所属专题和主题。
在一个实施例中,该判断模块还用于根据该目标试题的题型,判定该目标试题的考点分布位置;该计算模块还用于根据该考点分布位置,计算该各知识点中的每个知识点的重要程度,以及根据该考查目的对应的该每个知识点的重要程度和该考点分布位置对应的该每个知识点的重要程度,确定该目标试题的考点。可选地,该判断模块还用于基于该试题特征库,根据该目标试题的题型判定考点分布位置。
需要说明的是,对于不同题型的试题,考点核心分布位置和关联性位置可以不同,例如,在单项选择题中,正确选项、题干为考点核心分布位置,非正确选项为关联性位置;在填空题中,答案和答题点所在句子为考点核心分布位置,题干为关联性位置等。而且,一个目标试题的考点分布位置可对应1个或多个,考点分布位置不限于包括篇章、题干、正确选项、非正确选项、答案和答题点等。
在另一个实施例中,该判断模块还用于根据该目标试题的题型,判断该目标试题中是否存在特殊格式;该计算模块还用于确定该特殊格式对应的知识点,计算该各知识点中每个知识点的重要程度,以及根据该考查目的对应的该每个知识点的重要程度和所存在的特殊格式对应的该每个知识点的重要程度,确定该目标试题的考点。
在又一个实施例中,该判断模块还用于根据该目标试题的题型,判断该目标试题中是否存在特殊格式;该计算模块还用于确定该特殊格式对应的知识点,计算该各知识点中每个知识点的重要程度,以及根据该考查目的对应的该每个知识点的重要程度、该考点分布位置对应的该每个知识点的重要程度和所存在的特殊格式对应的该每个知识点的重要程度,确定该目标试题的考点。可选地,该判断模块还用于基于该试题特征库,根据该目标试题的题型所涉及的特殊格式判断该目标试题中是否存在特殊格式。
需要说明的是,对于不同题型的试题,特殊格式可以不同,例如看图写作题型中的图片格式为特殊格式,单选题中字或词加点的格式为特殊格式。并且一个试题可以包含0个、1个或多个特殊格式,该特殊格式不限于包括内容格式和文本特殊样式等。
可选地,该计算模块还用于根据所确定该各知识点与该考查目的的相关性分别进行分配权重值,根据所分配的权重值计算该各知识点中的每个知识点的重要程度。需要说明的是,该权重值的分配方法可以按照重要程度的从高到低进行赋值,重要程度越高,所赋权重值越大。
可选地,该计算模块还用于按照该目标试题中所有知识点的重要程度从高到低进行排序,以及根据排序结果进行划分重要性等级,其中重要性等级个数根据需要进行设置。
举例说明:该计算模块根据排序结果进行划分成3个重要性等级(主要考点、次要考点、一般知识点)。具体的,该计算模块将排序靠后的重要程度为0的知识点划分为一般知识点;以及该计算模块统计该目标试题中除一般知识点的知识点数量,若该数量符合该题型考点数量要求,取全部非一般知识点的知识点为主要考点,若该数量超出该题型考点数量上限,按照知识点重要性从高到低取知识点作为主要考点,直到考点数量达到该题型上限,其它知识点则划分为次要考点。需要指出:该各题型考点数量要求是根据现有试题库中的试题数据,对各题型试题考点的数量进行统计与分析,获取不同题型试题的考点数量范围。
可选地,该试题考点系统还包括输入模块和输出模块。其中该输入模块用于导入目标试题;该输出模块用于将所识别的考点输出到人机交互界面例如电脑显示屏等。
第一实施方式是与本实施方式相对应的方法实施方式,第一实施方式中的技术细节可以应用于本实施方式,本实施方式中的技术细节也可以应用于第一实施方式。
需要说明的是,本领域技术人员应当理解,上述试题考点识别系统的实施方式中所示的各模块的实现功能可参照前述试题考点识别方法的相关描述而理解。上述试题考点识别系统的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本申请实施例上述试题考点识别系统如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
相应地,本申请实施方式还提供一种计算机可读存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本申请的各方法实施方式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于,相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
此外,本申请实施方式还提供一种试题考点识别系统,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。其中,该处理器可以是中央处理单元(CentralProcessing Unit,简称“CPU”),还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,简称“DSP”)、专用集成电路(Appl ication Specific IntegratedCircuit,简称“ASIC”)等。前述的存储器可以是只读存储器(read-only memory,简称“ROM”)、随机存取存储器(random access memory,简称“RAM”)、快闪存储器(Flash)、硬盘或者固态硬盘等。本发明各实施方式所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在本申请提及的所有文献都被认为是整体性地包括在本申请的公开内容中,以便在必要时可以作为修改的依据。此外应理解,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
Claims (10)
1.一种试题考点识别方法,其特征在于,包括:
提取目标试题中的各知识点;
判定所述目标试题的考查目的,并确定所述各知识点与所述考查目的的相关性;
根据所述相关性,计算所述各知识点中的每个知识点的重要程度;
根据所述每个知识点的重要程度确定所述目标试题的考点;
所述判定所述目标试题的考查目的,进一步包括:根据所述目标试题的题型,确定所述目标试题对应的各考查目的;根据所述各考查目的,从所述目标试题中提取对应的特征词;根据所述各考查目的对应的特征词,获取包含所述特征词的样本试题;如果各所述样本试题同属一个考查目的,则判定该考查目的为所述目标试题的考查目的,否则计算各所述样本试题与所述目标试题的相似度,判定所述相似度最大的样本试题的考查目的为所述目标试题的考查目的,其中所述样本试题与所述目标试题的相似度是根据两试题中特征词的交集个数和所述两试题之间特征词最多的个数确定;
所述根据所述目标试题的题型,确定所述目标试题对应的各考查目的之前,还包括:对所述目标试题的题型进行识别并标识;
所述提取目标试题中的各知识点,进一步包括:提取目标试题中的各知识点,并确定所述各知识点所属专题和主题;
所述确定所述各知识点与所述考查目的的相关性,进一步包括:根据所述考查目的对应的专题和主题,确定所述各知识点中属于该专题和主题的知识点与所述考查目的相关,其他知识点与所述考查目的不相关;
所述根据所述相关性,计算所述各知识点中的每个知识点的重要程度,进一步包括:根据所述各知识点与所述考查目的相关或不相关情况,计算所述各知识点中的每个知识点的重要程度。
2.如权利要求1所述的试题考点识别方法,其特征在于,所述提取目标试题中的各知识点之后,还包括:
根据所述目标试题的题型,判定所述目标试题的考点分布位置;
根据所述考点分布位置,计算所述各知识点中的每个知识点的重要程度;
所述根据所述每个知识点的重要程度确定所述目标试题的考点,进一步包括:
根据所述考查目的对应的所述每个知识点的重要程度和所述考点分布位置对应的所述每个知识点的重要程度,确定所述目标试题的考点。
3.如权利要求2所述的试题考点识别方法,其特征在于,所述考点分布位置包括篇章、题干、正确选项、非正确选项、答案和答题点;
所述提取目标试题中的各知识点之前,还包括:
对所述目标试题的试题结构进行划分并标识,所述试题结构包括篇章、题干信息、选项信息、答案信息;
对所述目标试题中的答题点进行标识;
所述根据所述目标试题的题型,判定所述目标试题的考点分布位置之前,还包括:
对所述目标试题的题型进行识别并标识。
4.如权利要求2所述的试题考点识别方法,其特征在于,所述提取目标试题中的各知识点之后,还包括:
根据所述目标试题的题型,判断所述目标试题中是否存在特殊格式;
如果所述目标试题中存在特殊格式,则确定所述特殊格式对应的知识点,计算所述各知识点中每个知识点的重要程度;
所述根据所述考查目的对应的所述每个知识点的重要程度和所述考点分布位置对应的所述每个知识点的重要程度,确定所述目标试题的考点,进一步包括:
根据所述考查目的对应的所述每个知识点的重要程度、所述考点分布位置对应的所述每个知识点的重要程度和所存在的特殊格式对应的所述每个知识点的重要程度,确定所述目标试题的考点。
5.如权利要求4所述的试题考点识别方法,其特征在于,所述特殊格式包括内容格式和文本特殊样式;
所述提取目标试题中的各知识点之前,还包括:
将所述目标试题中各内容格式转化为文本信息并标识;
对所述目标试题中的文本特殊样式进行标识;
所述根据所述目标试题的题型,判断所述目标试题中是否存在特殊格式之前,还包括:
对所述目标试题的题型进行识别并标识。
6.如权利要求5所述的试题考点识别方法,其特征在于,所述提取目标试题中的各知识点之前,还包括:
根据教学大纲和各类考试考纲,获取各类知识点,并进行属性信息标注,构建知识点库,所述属性信息包括每个知识点的唯一标识和其对应的专题和主题;
根据不同题型的考核要求,收集各类题型的样本试题集,统计每类题型下的各样本试题的考查目的、考点分布位置、特殊格式,并提取各考查目的对应的特征词,以获取每类题型的特征信息,构建试题特征库;
所述提取各考查目的对应的特征词,进一步包括:
对于每类题型对应的考查目的,收集每个考查目的对应的样本试题集,并对每个样本试题进行分词处理,得到所述每个考查目的所有样本试题的字词集合;
计算所述每个考查目的对应的字词集合中的各字词的重要程度,选取重要程度大于预设阈值的字词为该考查目的的特征词,其中每个字词的重要程度是根据该字词在所属考查目的对应的样本试题集中出现的频率和该字词在所有考查目的对应的所有样本试题集中出现的情况确定的。
7.如权利要求6所述的试题考点识别方法,其特征在于,所述提取目标试题中的各知识点,并确定所述各知识点所属专题和主题,进一步包括:
基于所述知识点库,提取目标试题中的各知识点,确定各知识点所属专题和主题;
所述判定所述目标试题的考查目的、所述判定所述目标试题的考点分布位置或所述判断所述目标试题中存在的特殊格式的各步骤,分别进一步包括:
基于所述试题特征库,根据所述目标试题的题型判定所述目标试题的考查目的;
基于所述试题特征库,根据所述目标试题的题型判定考点分布位置;
基于所述试题特征库,根据所述目标试题的题型所涉及的特殊格式判断所述目标试题中是否存在特殊格式。
8.一种试题考点识别系统,其特征在于,包括:
提取模块,用于提取目标试题中的各知识点;
判断模块,用于判定所述目标试题的考查目的,并确定所述各知识点与所述考查目的的相关性;
计算模块,用于根据所述相关性,计算所述各知识点中的每个知识点的重要程度,用于根据所述每个知识点的重要程度确定所述目标试题的考点;
所述判定模块还用于:根据所述目标试题的题型,确定所述目标试题对应的各考查目的;根据所述各考查目的,从所述目标试题中提取对应的特征词;根据所述各考查目的对应的特征词,获取包含所述特征词的样本试题;如果各所述样本试题同属一个考查目的,则判定该考查目的为所述目标试题的考查目的,否则计算各所述样本试题与所述目标试题的相似度,判定所述相似度最大的样本试题的考查目的为所述目标试题的考查目的,其中所述样本试题与所述目标试题的相似度是根据两试题中特征词的交集个数和所述两试题之间特征词最多的个数确定;
所述根据所述目标试题的题型,确定所述目标试题对应的各考查目的之前,还包括:对所述目标试题的题型进行识别并标识;
所述提取目标试题中的各知识点,进一步包括:提取目标试题中的各知识点,并确定所述各知识点所属专题和主题;
所述确定所述各知识点与所述考查目的的相关性,进一步包括:根据所述考查目的对应的专题和主题,确定所述各知识点中属于该专题和主题的知识点与所述考查目的相关,其他知识点与所述考查目的不相关;
所述根据所述相关性,计算所述各知识点中的每个知识点的重要程度,进一步包括:根据所述各知识点与所述考查目的相关或不相关情况,计算所述各知识点中的每个知识点的重要程度。
9.一种试题考点识别系统,其特征在于,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现如权利要求1至7中任意一项所述的方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至7中任意一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910960223.5A CN110659352B (zh) | 2019-10-10 | 2019-10-10 | 试题考点识别方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910960223.5A CN110659352B (zh) | 2019-10-10 | 2019-10-10 | 试题考点识别方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110659352A CN110659352A (zh) | 2020-01-07 |
CN110659352B true CN110659352B (zh) | 2023-06-13 |
Family
ID=69040497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910960223.5A Active CN110659352B (zh) | 2019-10-10 | 2019-10-10 | 试题考点识别方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110659352B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111209734A (zh) * | 2020-01-13 | 2020-05-29 | 浙江蓝鸽科技有限公司 | 试题去重方法及其系统 |
CN111460101B (zh) * | 2020-03-30 | 2023-09-15 | 广州视源电子科技股份有限公司 | 知识点类型的识别方法、装置及处理器 |
CN111914068B (zh) * | 2020-08-21 | 2024-05-10 | 广州云蝶科技有限公司 | 试题知识点的提取方法 |
CN114201613B (zh) * | 2021-11-30 | 2022-10-21 | 北京百度网讯科技有限公司 | 试题生成方法、试题生成装置、电子设备以及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0897923A (ja) * | 1994-09-26 | 1996-04-12 | Dainippon Printing Co Ltd | 電話による受験結果発表システム |
CN106407237A (zh) * | 2015-08-03 | 2017-02-15 | 科大讯飞股份有限公司 | 在线学习试题推荐方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146867A (ja) * | 1994-11-17 | 1996-06-07 | Gutsudo Geimu:Kk | 自己評価導入式評価方法及び自己評価導入式評価システム及びそれに使用するワークシート |
CN102201177A (zh) * | 2011-06-23 | 2011-09-28 | 北京新东方教育科技(集团)有限公司 | 自适应测评方法和系统 |
-
2019
- 2019-10-10 CN CN201910960223.5A patent/CN110659352B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0897923A (ja) * | 1994-09-26 | 1996-04-12 | Dainippon Printing Co Ltd | 電話による受験結果発表システム |
CN106407237A (zh) * | 2015-08-03 | 2017-02-15 | 科大讯飞股份有限公司 | 在线学习试题推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110659352A (zh) | 2020-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110659352B (zh) | 试题考点识别方法及其系统 | |
CN106570109B (zh) | 一种通过文本分析自动生成题库知识点的方法 | |
CN110443427B (zh) | 基于认知知识谱的成绩预测方法及其系统 | |
JP5664978B2 (ja) | 学習支援システム及び学習支援方法 | |
CN110472203B (zh) | 一种文章的查重检测方法、装置、设备及存储介质 | |
CN109960790B (zh) | 摘要生成方法及装置 | |
CN108090099B (zh) | 一种文本处理方法及装置 | |
CN111274239A (zh) | 试卷结构化处理方法、装置和设备 | |
CN111209734A (zh) | 试题去重方法及其系统 | |
CN112434211A (zh) | 一种数据处理方法、装置、存储介质及设备 | |
KR102484007B1 (ko) | 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템 | |
CN105786898B (zh) | 一种领域本体的构建方法和装置 | |
CN107357765A (zh) | Word文档碎片化方法及装置 | |
CN110674722B (zh) | 一种试卷拆分方法及其系统 | |
CN113836894B (zh) | 多维度英语作文评分方法、装置及可读存储介质 | |
KR102185733B1 (ko) | 프로필 자동생성서버 및 방법 | |
JP6942759B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
CN112700203B (zh) | 智能阅卷方法及装置 | |
CN112015883A (zh) | 英文题目自动生成方法和系统 | |
CN110096708B (zh) | 一种定标集确定方法及装置 | |
CN110765107A (zh) | 基于数字化编码的题型识别方法及其系统 | |
CN110223206B (zh) | 课文专业方向确定方法及系统和解析课件匹配方法及系统 | |
CN111523310B (zh) | 数据处理方法、数据处理装置、存储介质和电子设备 | |
CN110442862B (zh) | 基于招聘信息的数据处理方法及装置 | |
CN112559798B (zh) | 音频内容质量的检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |