CN116595129B - 一种基于知识点标注的主观题评分方法和装置 - Google Patents
一种基于知识点标注的主观题评分方法和装置 Download PDFInfo
- Publication number
- CN116595129B CN116595129B CN202310689136.7A CN202310689136A CN116595129B CN 116595129 B CN116595129 B CN 116595129B CN 202310689136 A CN202310689136 A CN 202310689136A CN 116595129 B CN116595129 B CN 116595129B
- Authority
- CN
- China
- Prior art keywords
- knowledge point
- determinant
- knowledge
- importance
- mapping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 51
- 238000013077 scoring method Methods 0.000 title claims abstract description 14
- 238000013507 mapping Methods 0.000 claims description 174
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000000354 decomposition reaction Methods 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 abstract description 4
- 238000005065 mining Methods 0.000 abstract description 2
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
本发明请求保护一种基于知识点标注的主观题评分方法及装置,包括知识术语集预处理和主观题作答内容得分比对两个阶段。知识术语集预处理阶段建立知识术语表,计算各表项的关系权值以及离散权值,并将知识术语关联到知识术语表的相应表项;得分比对阶段将主观题作答内容输入到知识点挖掘网络中,网络通过语义知识点特征的特征计算输出作答内容涵盖的知识点,并检索知识术语表中对应加权值,并将该表项中关联的知识术语依次与主观题作答内容中相应知识点进行比较,分析得分情况。本发明可以有效对主观题的作答内容进行准确评分,全面地考虑了知识点重要性等因素的评分要素,有效节约了人力资源。
Description
技术领域
本发明属于大数据处理领域,具体的,涉及一种基于知识点标注的主观题评分方法。
背景技术
目前,对主观题进行评分的方式大多还是停留在关键词的匹配上,也就是用大量人工设置想出的所有可能作为答案的关键词,然后查找作答人员的答案中是否出现这些可能的关键词,如果出现就得分,不出现就不得分。
但这种纯粹依靠关键词的主观题评分方式过度依赖于提前设置的答案关键词的集合,一旦集合不全,考生的分数出现明显误差的可能性就急剧增加,因此,对于主观题的评分标准还存在更加客观的技术方案改进需求。
此外,对于主观题的评分过程中对于层次的分析与理解,对于具体的采分点不能一概而论,而需要基于具体的知识点情况进行评价,而这在现有技术中还未曾发现。
发明内容
根据本发明第一方面,本发明请求保护一种基于知识点标注的主观题评分方法,包括:
依次获取D个知识点中的标注数据,其中,每一条标注数据用于表示一个主观题作答内容对一个知识点的评分权重;其中,D≥2;
根据每个知识点中的标注数据,依次为每个知识点生成一个映射行列式;其中,每个映射行列式的行对应于标注数据所对应的主观题作答内容,每个映射行列式的列对应于标注数据所针对的知识点;
将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式;
其中,每个知识点的映射行列式分解后得到的主观题作答内容组行列式和主观题作答内容组映射行列式依次为A行×B列的行列式和B行×D列的行列式,其中,A为从该知识点中获取到的标注数据所对应的主观题作答内容个数,K为从该知识点中获取到的标注数据中,针对相同知识点的标注数据的个数,B为预设正整数且B不大于所述D个知识点中各个知识点的标注数据所对应的主观题作答内容个数的最小值;
依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算,并将所述加权计算的结果作为该知识点的术语章节映射关系,以使主观题作答内容根据各个知识点的术语章节映射关系对主观题作答内容进行评分。
进一步地,所述将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式,包括:
将所述D个知识点中每个知识点的映射行列式进行行列式分解,得到至少一个行列式组;其中,每个行列式组包括一个第一行列式,以及与其对应的一个第二行列式;
依次获取每个知识点的映射行列式分解后所获得的每个第二行列式与其他知识点的映射行列式分解所获得的各个第二行列式的距离之和;
将所述距离之和最小的第二行列式,决策为所述每个映射行列式所对应的一个主观题作答内容组映射行列式;将所述距离之和最小的第二行列式所对应的第一行列式,决策为所述一个主观题作答内容组映射行列式所对应的主观题作答内容组行列式,从而得到所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式。
进一步地,在所述依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算之前,还包括:
依次获取所述D个知识点对每个知识点的权重;
所述依次获取所述D个知识点对每个知识点的权重,包括:
依次获取所述每个知识点所对应的主观题作答内容组映射行列式中第一列知识点特征与第二列知识点特征的相似度;其中,所述第一列知识点特征为每个映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;所述第二列知识点特征为其他映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;
决策所述第一列知识点特征与所述第二列知识点特征的最大相似度,并将所述最大相似度决策为所述D个知识点对所述每个知识点的权重。
进一步地,依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离;所述每个知识点所对应的重要性知识点特征为所述D个知识点对所述每个知识点的重要性;
依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联;
所述依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联,包括:
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离小于所述关联阈值,则所述知识点的术语章节映射关系关联;
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离大于或等于所述关联阈值,则所述知识点的术语章节映射关系不关联。
进一步地,所述依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离之前,还包括:
根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征;所述重要性行列式包括所述D个知识点对所有知识点的重要性;
所述根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征,包括:
将所述重要性行列式的列,决策为所述每个知识点所对应的重要性知识点特征;
将所述重要性行列式各行的非重要性,决策为所述非重要性知识点特征;
所述根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征之前,还包括:
依次获取所述每个知识点的第一列知识点特征与第二列知识点特征的距离之和,并将所述距离之和决策为所述D个知识点对所述每个知识点的重要性,生成所述D个知识点对所有知识点的重要性;
根据所述D个知识点对所有知识点的重要性,生成所述重要性行列式。
根据本发明第二方面,本发明请求保护一种基于知识点标注的主观题评分装置,包括:
获取模块,用于依次获取D个知识点中的标注数据,其中,每一条标注数据用于表示一个主观题作答内容对一个知识点的评分权重;其中,D≥2;
生成模块,用于根据每个知识点中的标注数据,依次为每个知识点生成一个映射行列式;其中,每个映射行列式的行对应于标注数据所对应的主观题作答内容,每个映射行列式的列对应于标注数据所针对的知识点;
分解模块,用于将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式;其中,每个知识点的映射行列式分解后得到的主观题作答内容组行列式和主观题作答内容组映射行列式依次为A行×B列的行列式和B行×D列的行列式,其中,A为从该知识点中获取到的标注数据所对应的主观题作答内容个数;K为从该知识点中获取到的标注数据中,针对相同知识点的标注数据的个数,B为预设正整数且B不大于所述D个知识点中各个知识点的标注数据所对应的主观题作答内容个数的最小值;
计算模块,用于依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算,并将所述加权计算的结果作为该知识点的术语章节映射关系,以使主观题作答内容根据各个知识点的术语章节映射关系对主观题作答内容进行评分。
进一步地,所述分解模块,具体用于将所述D个知识点中每个知识点的映射行列式进行行列式分解,得到至少一个行列式组;其中,每个行列式组包括一个第一行列式,以及与其对应的一个第二行列式;依次获取每个知识点的映射行列式分解后所获得的每个第二行列式与其他知识点的映射行列式分解所获得的各个第二行列式的距离之和;将所述距离之和最小的第二行列式,决策为所述每个映射行列式所对应的一个主观题作答内容组映射行列式;将所述距离之和最小的第二所对应的第一行列式,决策为所述一个主观题作答内容组映射行列式所对应的主观题作答内容组行列式,从而得到所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式。
进一步地,所述基于知识点标注的主观题评分装置,还包括:
获取模块,用于在所述计算模块根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算之前,依次获取所述D个知识点对每个知识点的权重;
所述获取模块,具体包括:相似度获取单元,用于依次获取所述每个知识点所对应的主观题作答内容组映射行列式中第一列知识点特征与第二列知识点特征的相似度;其中,所述第一列知识点特征为每个映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;所述第二列知识点特征为其他映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;
权重决策单元,用于决策所述第一列知识点特征与所述第二列知识点特征的最大相似度,并将所述最大相似度决策为所述D个知识点对所述每个知识点的权重。
进一步地,所述获取模块,还用于依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离;所述每个知识点所对应的重要性知识点特征为所述D个知识点对所述每个知识点的重要性;
所述基于知识点标注的主观题评分装置,还包括:
判断模块,用于依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联;
所述判断模块,具体用于:若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离小于所述关联阈值,则所述知识点的术语章节映射关系关联;
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离大于或等于所述关联阈值,则所述知识点的术语章节映射关系不关联。
进一步地,所述装置还包括:
决策模块,用于在所述获取模块依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离之前,根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征;所述重要性行列式包括所述D个知识点对所有知识点的重要性;
具体用于将所述重要性行列式的列,决策为所述每个知识点所对应的重要性知识点特征;将所述重要性行列式各行的非重要性,决策为所述非重要性知识点特征;
所述获取模块,还用于所述决策模块根据所述重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征之前,依次获取所述每个知识点的第一列知识点特征与第二列知识点特征的距离之和;
所述决策模块,还用于将所述距离之和决策为所述D个知识点对所述每个知识点的重要性,生成所述D个知识点对所有知识点的重要性;
所述生成模块,还用于根据所述D个知识点对所述所有知识点的重要性,生成所述重要性行列式。
本发明请求保护一种基于知识点标注的主观题评分方法及装置,包括知识术语集预处理和主观题作答内容得分比对两个阶段。知识术语集预处理阶段建立知识术语表,计算各表项的关系权值以及离散权值,并将知识术语关联到知识术语表的相应表项;得分比对阶段将主观题作答内容输入到知识点挖掘网络中,网络通过语义知识点特征的特征计算输出作答内容涵盖的知识点,并检索知识术语表中对应加权值,并将该表项中关联的知识术语依次与主观题作答内容中相应知识点进行比较,分析得分情况。本发明可以有效对主观题的作答内容进行准确评分,全面地考虑了知识点重要性等因素的评分要素,有效节约了人力资源。
附图说明
图1为本发明所请求保护的一种基于知识点标注的主观题评分方法的工作流程图;
图2为本发明所请求保护的一种基于知识点标注的主观题评分方法的第二工作流程图;
图3为本发明所请求保护的一种基于知识点标注的主观题评分方法的第三工作流程图;
图4为本发明所请求保护的一种基于知识点标注的主观题评分方法的第四工作流程图;
图5为本发明所请求保护的一种基于知识点标注的主观题评分方法的第五工作流程图;
图6为本发明所请求保护的一种基于知识点标注的主观题评分方法的结构模块图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。可以理解,本申请所使用的的术语“第一”、“第二”等可在本文本中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另外一个元件区分。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
根据本发明第一实施例,参照附图1,本发明请求保护一种基于知识点标注的主观题评分方法,包括:
依次获取D个知识点中的标注数据,其中,每一条标注数据用于表示一个主观题作答内容对一个知识点的评分权重;其中,D≥2;
根据每个知识点中的标注数据,依次为每个知识点生成一个映射行列式;其中,每个映射行列式的行对应于标注数据所对应的主观题作答内容,每个映射行列式的列对应于标注数据所针对的知识点;
将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式;
其中,每个知识点的映射行列式分解后得到的主观题作答内容组行列式和主观题作答内容组映射行列式依次为A行×B列的行列式和B行×D列的行列式,其中,A为从该知识点中获取到的标注数据所对应的主观题作答内容个数,K为从该知识点中获取到的标注数据中,针对相同知识点的标注数据的个数,B为预设正整数且B不大于所述D个知识点中各个知识点的标注数据所对应的主观题作答内容个数的最小值;
依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算,并将所述加权计算的结果作为该知识点的术语章节映射关系,以使主观题作答内容根据各个知识点的术语章节映射关系对主观题作答内容进行评分。
进一步地,参照附图2,所述将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式,包括:
将所述D个知识点中每个知识点的映射行列式进行行列式分解,得到至少一个行列式组;其中,每个行列式组包括一个第一行列式,以及与其对应的一个第二行列式;
依次获取每个知识点的映射行列式分解后所获得的每个第二行列式与其他知识点的映射行列式分解所获得的各个第二行列式的距离之和;
将所述距离之和最小的第二行列式,决策为所述每个映射行列式所对应的一个主观题作答内容组映射行列式;将所述距离之和最小的第二行列式所对应的第一行列式,决策为所述一个主观题作答内容组映射行列式所对应的主观题作答内容组行列式,从而得到所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式。
进一步地,在所述依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算之前,还包括:
依次获取所述D个知识点对每个知识点的权重;
参照附图3,所述依次获取所述D个知识点对每个知识点的权重,包括:
依次获取所述每个知识点所对应的主观题作答内容组映射行列式中第一列知识点特征与第二列知识点特征的相似度;其中,所述第一列知识点特征为每个映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;所述第二列知识点特征为其他映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;
决策所述第一列知识点特征与所述第二列知识点特征的最大相似度,并将所述最大相似度决策为所述D个知识点对所述每个知识点的权重。
进一步地,依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离;所述每个知识点所对应的重要性知识点特征为所述D个知识点对所述每个知识点的重要性;
依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联;
所述依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联,包括:
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离小于所述关联阈值,则所述知识点的术语章节映射关系关联;
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离大于或等于所述关联阈值,则所述知识点的术语章节映射关系不关联。
其中,在该实施例中,接收知识点所属章节发来的针对目标章节的评分重要性配置通知;所述评分重要性配置通知由所述知识点所属章节在生成所述目标章节的章节知识点后发出,所述章节知识点由所述知识点所属章节基于评分重要性配置请求生成;所述评分重要性配置请求中至少包括所述目标章节的章节标识和所述目标章节对应的点击量控制参数;根据所述评分重要性配置通知,构建所述目标章节的评分重要性数据结构,并将所述评分重要性数据结构与所述章节知识点进行关联;所述评分重要性数据结构中包括用于对所述目标章节进行点击量控制的策略。
所述目标章节的扩展属性中记录所述章节标识和所述点击量控制参数。
对所述目标章节进行点击量控制的策略为token结构,所述token结构的深度与令牌放入周期由所述评分重要性配置通知确定,并且在构建所述评分重要性数据结构之后,激活所述评分重要性数据结构中的token结构。
在将所述评分重要性数据结构与所述章节知识点进行关联之后,所述方法还包括:
接收所述知识点所属章节发来的重要性修改通知,对所述目标章节的评分重要性数据结构中的成员进行修改,并对应调整用于对所述目标章节进行点击量控制的策略。
在将所述评分重要性数据结构与所述章节知识点进行关联之后,所述方法还包括:
响应于所述知识点所属章节发来的重要性删除通知,为所述目标章节的评分重要性数据结构添加失效标记,并冻结用于对所述目标章节进行点击量控制的策略。
在为所述目标章节的评分重要性数据结构添加失效标记之后,所述方法还包括:
识别所述评分重要性数据结构的数据关联计数,若所述数据关联计数为零,销毁所述评分重要性数据结构,并释放所述评分重要性数据结构所占用的内存空间。
所述目标章节下包括一个或者多个子章节和/或子文件,其中,针对任意一个子章节或者子文件,识别所述子章节或者子文件的父章节,在所述父章节的章节知识点具备关联的评分重要性数据结构的情况下,将所述父章节的评分重要性数据结构与所述子章节的章节知识点或者子文件的文件知识点进行关联;其中,所述父章节的评分重要性数据结构根据关联的章节的数量,设置对应的数据关联计数。
若所述子章节的章节知识点或者子文件的文件知识点被删除或释放,取消所述子章节的章节知识点或者子文件的文件知识点与所述父章节的评分重要性数据结构之间的关联关系,并更新所述父章节的评分重要性数据结构对应的数据关联计数;其中,若所述父章节的评分重要性数据结构对应的数据关联计数为零,销毁所述父章节的评分重要性数据结构。
进一步地,所述依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离之前,还包括:
根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征;所述重要性行列式包括所述D个知识点对所有知识点的重要性;
参照附图4,所述根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征,包括:
将所述重要性行列式的列,决策为所述每个知识点所对应的重要性知识点特征;
将所述重要性行列式各行的非重要性,决策为所述非重要性知识点特征;
参照附图5,所述根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征之前,还包括:
依次获取所述每个知识点的第一列知识点特征与第二列知识点特征的距离之和,并将所述距离之和决策为所述D个知识点对所述每个知识点的重要性,生成所述D个知识点对所有知识点的重要性;
根据所述D个知识点对所有知识点的重要性,生成所述重要性行列式。
根据本发明第二实施例,参照附图6,本发明请求保护一种基于知识点标注的主观题评分装置,包括:
获取模块,用于依次获取D个知识点中的标注数据,其中,每一条标注数据用于表示一个主观题作答内容对一个知识点的评分权重;其中,D≥2;
生成模块,用于根据每个知识点中的标注数据,依次为每个知识点生成一个映射行列式;其中,每个映射行列式的行对应于标注数据所对应的主观题作答内容,每个映射行列式的列对应于标注数据所针对的知识点;
分解模块,用于将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式;其中,每个知识点的映射行列式分解后得到的主观题作答内容组行列式和主观题作答内容组映射行列式依次为A行×B列的行列式和B行×D列的行列式,其中,A为从该知识点中获取到的标注数据所对应的主观题作答内容个数;K为从该知识点中获取到的标注数据中,针对相同知识点的标注数据的个数,B为预设正整数且B不大于所述D个知识点中各个知识点的标注数据所对应的主观题作答内容个数的最小值;
计算模块,用于依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算,并将所述加权计算的结果作为该知识点的术语章节映射关系,以使主观题作答内容根据各个知识点的术语章节映射关系对主观题作答内容进行评分。
进一步地,所述分解模块,具体用于将所述D个知识点中每个知识点的映射行列式进行行列式分解,得到至少一个行列式组;其中,每个行列式组包括一个第一行列式,以及与其对应的一个第二行列式;依次获取每个知识点的映射行列式分解后所获得的每个第二行列式与其他知识点的映射行列式分解所获得的各个第二行列式的距离之和;将所述距离之和最小的第二行列式,决策为所述每个映射行列式所对应的一个主观题作答内容组映射行列式;将所述距离之和最小的第二所对应的第一行列式,决策为所述一个主观题作答内容组映射行列式所对应的主观题作答内容组行列式,从而得到所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式。
进一步地,所述基于知识点标注的主观题评分装置,还包括:
获取模块,用于在所述计算模块根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算之前,依次获取所述D个知识点对每个知识点的权重;
所述获取模块,具体包括:相似度获取单元,用于依次获取所述每个知识点所对应的主观题作答内容组映射行列式中第一列知识点特征与第二列知识点特征的相似度;其中,所述第一列知识点特征为每个映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;所述第二列知识点特征为其他映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;
权重决策单元,用于决策所述第一列知识点特征与所述第二列知识点特征的最大相似度,并将所述最大相似度决策为所述D个知识点对所述每个知识点的权重。
进一步地,所述获取模块,还用于依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离;所述每个知识点所对应的重要性知识点特征为所述D个知识点对所述每个知识点的重要性;
所述基于知识点标注的主观题评分装置,还包括:
判断模块,用于依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联;
所述判断模块,具体用于:若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离小于所述关联阈值,则所述知识点的术语章节映射关系关联;
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离大于或等于所述关联阈值,则所述知识点的术语章节映射关系不关联。
进一步地,所述装置还包括:
决策模块,用于在所述获取模块依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离之前,根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征;所述重要性行列式包括所述D个知识点对所有知识点的重要性;
具体用于将所述重要性行列式的列,决策为所述每个知识点所对应的重要性知识点特征;将所述重要性行列式各行的非重要性,决策为所述非重要性知识点特征;
所述获取模块,还用于所述决策模块根据所述重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征之前,依次获取所述每个知识点的第一列知识点特征与第二列知识点特征的距离之和;
所述决策模块,还用于将所述距离之和决策为所述D个知识点对所述每个知识点的重要性,生成所述D个知识点对所有知识点的重要性;
所述生成模块,还用于根据所述D个知识点对所述所有知识点的重要性,生成所述重要性行列式。本领域技术人员能够理解,本公开所披露的内容可以出现多种变型和改进。例如,以上所描述的各种设备或组件可以通过硬件实现,也可以通过软件、固件、或者三者中的一些或全部的组合实现。
本公开中使用了流程图用来说明根据本公开的实施例的方法的步骤。应当理解的是,前面或后面的步骤不一定按照顺序来精确的进行。相反,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中。
本领域普通技术人员可以理解上述方法中的全部或部分的步骤可通过计算机程序来指令相关硬件完成,程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本公开并不限制于任何特定形式的硬件和软件的结合。
除非另有定义,这里使用的所有术语具有与本公开所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
以上是对本公开的说明,而不应被认为是对其的限制。尽管描述了本公开的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本公开的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本公开范围内。应当理解,上面是对本公开的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本公开由权利要求书及其等效物限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (8)
1.一种基于知识点标注的主观题评分方法,其特征在于,包括:
依次获取D个知识点中的标注数据,其中,每一条标注数据用于表示一个主观题作答内容对一个知识点的评分权重;其中,D≥2;
根据每个知识点中的标注数据,依次为每个知识点生成一个映射行列式;其中,每个映射行列式的行对应于标注数据所对应的主观题作答内容,每个映射行列式的列对应于标注数据所针对的知识点;
将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式;
其中,每个知识点的映射行列式分解后得到的主观题作答内容组行列式和主观题作答内容组映射行列式依次为A行×B列的行列式和B行×D列的行列式,其中,A为从该知识点中获取到的标注数据所对应的主观题作答内容个数,B为从该知识点中获取到的标注数据中,针对相同知识点的标注数据的个数,B为预设正整数且B不大于所述D个知识点中各个知识点的标注数据所对应的主观题作答内容个数的最小值;
依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算,并将所述加权计算的结果作为该知识点的术语章节映射关系,以使主观题作答内容根据各个知识点的术语章节映射关系对主观题作答内容进行评分;
所述将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式,包括:
将所述D个知识点中每个知识点的映射行列式进行行列式分解,得到至少一个行列式组;其中,每个行列式组包括一个第一行列式,以及与其对应的一个第二行列式;
依次获取每个知识点的映射行列式分解后所获得的每个第二行列式与其他知识点的映射行列式分解所获得的各个第二行列式的距离之和;
将所述距离之和最小的第二行列式,决策为所述每个映射行列式所对应的一个主观题作答内容组映射行列式;将所述距离之和最小的第二行列式所对应的第一行列式,决策为所述一个主观题作答内容组映射行列式所对应的主观题作答内容组行列式,从而得到所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式。
2.根据权利要求1所述的方法,其特征在于,在所述依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算之前,还包括:
依次获取所述D个知识点对每个知识点的权重;
所述依次获取所述D个知识点对每个知识点的权重,包括:
依次获取所述每个知识点所对应的主观题作答内容组映射行列式中第一列知识点特征与第二列知识点特征的相似度;其中,所述第一列知识点特征为每个映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;所述第二列知识点特征为其他映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;
决策所述第一列知识点特征与所述第二列知识点特征的最大相似度,并将所述最大相似度决策为所述D个知识点对所述每个知识点的权重。
3.根据权利要求2所述的方法,其特征在于,还包括:
依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离;所述每个知识点所对应的重要性知识点特征为所述D个知识点对所述每个知识点的重要性;
依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联;
所述依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联,包括:
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离小于所述关联阈值,则所述知识点的术语章节映射关系关联;
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离大于或等于所述关联阈值,则所述知识点的术语章节映射关系不关联。
4.根据权利要求3所述的方法,其特征在于,所述依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离之前,还包括:
根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征;所述重要性行列式包括所述D个知识点对所有知识点的重要性;
所述根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征,包括:
将所述重要性行列式的列,决策为所述每个知识点所对应的重要性知识点特征;
将所述重要性行列式各行的非重要性,决策为所述非重要性知识点特征;
所述根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征之前,还包括:
依次获取所述每个知识点的第一列知识点特征与第二列知识点特征的距离之和,并将所述距离之和决策为所述D个知识点对所述每个知识点的重要性,生成所述D个知识点对所有知识点的重要性;
根据所述D个知识点对所有知识点的重要性,生成所述重要性行列式。
5.一种基于知识点标注的主观题评分装置,其特征在于,包括:
获取模块,用于依次获取D个知识点中的标注数据,其中,每一条标注数据用于表示一个主观题作答内容对一个知识点的评分权重;其中,D≥2;
生成模块,用于根据每个知识点中的标注数据,依次为每个知识点生成一个映射行列式;其中,每个映射行列式的行对应于标注数据所对应的主观题作答内容,每个映射行列式的列对应于标注数据所针对的知识点;
分解模块,用于将所述D个知识点中每个知识点的映射行列式分解为一个主观题作答内容组行列式和一个主观题作答内容组映射行列式,以得到D个主观题作答内容组行列式和D个主观题作答内容组映射行列式;其中,每个知识点的映射行列式分解后得到的主观题作答内容组行列式和主观题作答内容组映射行列式依次为A行×B列的行列式和B行×D列的行列式,其中,A为从该知识点中获取到的标注数据所对应的主观题作答内容个数;B为从该知识点中获取到的标注数据中,针对相同知识点的标注数据的个数,B为预设正整数且B不大于所述D个知识点中各个知识点的标注数据所对应的主观题作答内容个数的最小值;
计算模块,用于依次根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算,并将所述加权计算的结果作为该知识点的术语章节映射关系,以使主观题作答内容根据各个知识点的术语章节映射关系对主观题作答内容进行评分;
所述分解模块,具体用于将所述D个知识点中每个知识点的映射行列式进行行列式分解,得到至少一个行列式组;其中,每个行列式组包括一个第一行列式,以及与其对应的一个第二行列式;依次获取每个知识点的映射行列式分解后所获得的每个第二行列式与其他知识点的映射行列式分解所获得的各个第二行列式的距离之和;将所述距离之和最小的第二行列式,决策为所述每个映射行列式所对应的一个主观题作答内容组映射行列式;将所述距离之和最小的第二所对应的第一行列式,决策为所述一个主观题作答内容组映射行列式所对应的主观题作答内容组行列式,从而得到所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式。
6.根据权利要求5所述的装置,其特征在于,所述基于知识点标注的主观题评分装置,还包括:
获取模块,用于在所述计算模块根据所述D个知识点对每个知识点的权重,对所述D个主观题作答内容组行列式和所述D个主观题作答内容组映射行列式中与该知识点所对应的元素进行加权计算之前,依次获取所述D个知识点对每个知识点的权重;
所述获取模块,具体包括:相似度获取单元,用于依次获取所述每个知识点所对应的主观题作答内容组映射行列式中第一列知识点特征与第二列知识点特征的相似度;其中,所述第一列知识点特征为每个映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;所述第二列知识点特征为其他映射行列式所对应的主观题作答内容组映射行列式的列知识点特征;
权重决策单元,用于决策所述第一列知识点特征与所述第二列知识点特征的最大相似度,并将所述最大相似度决策为所述D个知识点对所述每个知识点的权重。
7.根据权利要求6所述的装置,其特征在于,
所述获取模块,还用于依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离;所述每个知识点所对应的重要性知识点特征为所述D个知识点对所述每个知识点的重要性;
所述基于知识点标注的主观题评分装置,还包括:
判断模块,用于依次根据所述每个知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离、及关联阈值判断所述每个知识点的术语章节映射关系是否关联;
所述判断模块,具体用于:若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离小于所述关联阈值,则所述知识点的术语章节映射关系关联;
若所述知识点所对应的重要性知识点特征与所述非重要性知识点特征之间的距离大于或等于所述关联阈值,则所述知识点的术语章节映射关系不关联。
8.根据权利要求7所述的装置,其特征在于,还包括:
决策模块,用于在所述获取模块依次获取所述每个知识点所对应的重要性知识点特征与非重要性知识点特征之间的距离之前,根据重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征;所述重要性行列式包括所述D个知识点对所有知识点的重要性;
具体用于将所述重要性行列式的列,决策为所述每个知识点所对应的重要性知识点特征;将所述重要性行列式各行的非重要性,决策为所述非重要性知识点特征;
所述获取模块,还用于所述决策模块根据所述重要性行列式,决策所述每个知识点所对应的重要性知识点特征及所述非重要性知识点特征之前,依次获取所述每个知识点的第一列知识点特征与第二列知识点特征的距离之和;
所述决策模块,还用于将所述距离之和决策为所述D个知识点对所述每个知识点的重要性,生成所述D个知识点对所有知识点的重要性;
所述生成模块,还用于根据所述D个知识点对所述所有知识点的重要性,生成所述重要性行列式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310689136.7A CN116595129B (zh) | 2023-06-12 | 2023-06-12 | 一种基于知识点标注的主观题评分方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310689136.7A CN116595129B (zh) | 2023-06-12 | 2023-06-12 | 一种基于知识点标注的主观题评分方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116595129A CN116595129A (zh) | 2023-08-15 |
CN116595129B true CN116595129B (zh) | 2023-10-27 |
Family
ID=87600858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310689136.7A Active CN116595129B (zh) | 2023-06-12 | 2023-06-12 | 一种基于知识点标注的主观题评分方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116595129B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112131889A (zh) * | 2020-09-29 | 2020-12-25 | 上海松鼠课堂人工智能科技有限公司 | 基于大数据的智能语文主观题评分方法和系统 |
CN113392187A (zh) * | 2021-06-17 | 2021-09-14 | 上海出版印刷高等专科学校 | 一种针对主观题的自动评分及纠错推荐方法 |
WO2023273583A1 (zh) * | 2021-06-29 | 2023-01-05 | 上海商汤智能科技有限公司 | 阅卷方法、装置、电子设备及存储介质 |
-
2023
- 2023-06-12 CN CN202310689136.7A patent/CN116595129B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112131889A (zh) * | 2020-09-29 | 2020-12-25 | 上海松鼠课堂人工智能科技有限公司 | 基于大数据的智能语文主观题评分方法和系统 |
CN113392187A (zh) * | 2021-06-17 | 2021-09-14 | 上海出版印刷高等专科学校 | 一种针对主观题的自动评分及纠错推荐方法 |
WO2023273583A1 (zh) * | 2021-06-29 | 2023-01-05 | 上海商汤智能科技有限公司 | 阅卷方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
潜在语义分析技术在自动评卷系统中的应用;赵亚慧;;延边大学学报(自然科学版)(第04期);67-70 * |
Also Published As
Publication number | Publication date |
---|---|
CN116595129A (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5940647B2 (ja) | 文書の電子的調査 | |
JP6398510B2 (ja) | 実体のリンク付け方法及び実体のリンク付け装置 | |
WO2017216980A1 (ja) | 機械学習装置 | |
US6778941B1 (en) | Message and user attributes in a message filtering method and system | |
US9146987B2 (en) | Clustering based question set generation for training and testing of a question and answer system | |
US20090319449A1 (en) | Providing context for web articles | |
US20130262086A1 (en) | Generation of a semantic model from textual listings | |
US20110289033A1 (en) | Supervised Learning with Multi-Scale Time Intervals Using a Statistical Classification Model to Classify Unlabeled Events | |
US11120268B2 (en) | Automatically evaluating caption quality of rich media using context learning | |
US7089238B1 (en) | Method and apparatus for incremental computation of the accuracy of a categorization-by-example system | |
US20150086947A1 (en) | Computer-based system and method for creating customized medical video information using crowd sourcing | |
CN107844531B (zh) | 答案输出方法、装置和计算机设备 | |
CN108717459B (zh) | 一种面向用户评论信息的移动应用缺陷定位方法 | |
JP2019032704A (ja) | 表データ構造化システムおよび表データ構造化方法 | |
US11507746B2 (en) | Method and apparatus for generating context information | |
US10796005B1 (en) | Method of application security vulnerability evaluation based on tree boosting, and readable medium and apparatus for performing the method | |
WO2021239078A1 (zh) | 领域识别的方法、交互的方法、电子设备及存储介质 | |
CN112699671B (zh) | 一种语言标注方法、装置、计算机设备和存储介质 | |
CN116595129B (zh) | 一种基于知识点标注的主观题评分方法和装置 | |
WO2021245924A1 (ja) | 処理装置、処理方法および処理プログラム | |
CN110866393B (zh) | 基于领域知识库的简历信息抽取方法及系统 | |
JP2008282111A (ja) | 類似文書検索方法、プログラムおよび装置 | |
CN112860983B (zh) | 一种学习内容推送的方法、系统、设备及可读存储介质 | |
Shan et al. | Automatic Generation of Piano Score Following Videos. | |
JP2003108576A (ja) | データベース管理装置およびデータベース管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |