CN110705278A - 主观题阅卷方法和主观题阅卷装置 - Google Patents
主观题阅卷方法和主观题阅卷装置 Download PDFInfo
- Publication number
- CN110705278A CN110705278A CN201810745153.7A CN201810745153A CN110705278A CN 110705278 A CN110705278 A CN 110705278A CN 201810745153 A CN201810745153 A CN 201810745153A CN 110705278 A CN110705278 A CN 110705278A
- Authority
- CN
- China
- Prior art keywords
- answer
- similarity
- keyword
- preset
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提出了一种主观题阅卷方法和一种主观题阅卷装置,其中,主观题阅卷方法包括:从阅卷答案中获取主观题答案的答案关键词;根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度;根据所述相似度和所述预设标准答案的分值,计算所述阅卷答案的得分。通过本发明的技术方案,可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分,避免使用人工进行主观题阅卷,减少了阅卷的人工成本和时间成本,提升了主观题阅卷的效率。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种主观题阅卷方法和一种主观题阅卷装置。
背景技术
目前,现有的上机考试系统通常只能解决选择题、判断题等客观题型的评分,而不能自动识别和批阅主观题。
由于主观题的答案内容多遍,具有不唯一性,通常只能进行人工阅卷,然而,手工评阅试卷的工作量极大,统计起来也十分繁琐,给阅卷工作带来很大的不便。
因此需要一种新的技术方案,可以自动有效地进行主观题阅卷。
发明内容
本发明正是基于上述问题,提出了一种新的技术方案,可以自动有效地进行主观题阅卷。
有鉴于此,本发明的第一方面提出了一种主观题阅卷方法,包括:从阅卷答案中获取主观题答案的答案关键词;根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度;根据所述相似度和所述预设标准答案的分值,计算所述阅卷答案的得分。
在该技术方案中,可以通过分词以及无意义词过滤等方式将主观题答案中的答案关键词筛选出来,并求得答案关键词与预设标准答案中的预设关键词的相似度,将其相似度与对应占据的分值相乘,即可得到最终得分。比如,预设标准答案中具有一个关键词,对应分值为5分,答题的主观题答案中的答案关键词与其相似度为80%,则主观题答案的得分为5分乘以80%,也就是4分。
通过该技术方案,可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分,避免使用人工进行主观题阅卷,减少了阅卷的人工成本和时间成本,提升了主观题阅卷的效率。
在上述技术方案中,优选地,所述根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度,包括:根据预设匹配规则,对任一答案关键词进行同义词扩展和近义词扩展,得到所述任一答案关键词的多个关联词;计算所述任一答案关键词与任一预设关键词的单一相似度,并计算所述多个关联词与所述任一预设关键词的关联相似度;根据所述单一相似度和多个所述关联相似度,计算所述单一相似度和多个所述关联相似度的平均值,作为所述任一答案关键词与所述任一预设关键词的相似度。
在该技术方案中,考生填写的答案关键词不一定为预设标准答案中的预设关键词本身,但也有可能是对的,因此,为了提升主观题自动阅卷的准确性,可以通过对答案关键词进行同义词扩展和近义词扩展,得到多个关联词,并将该答案关键词、多个关联词分别与预设关键词的相似度的均值作为该答案关键词与该预设关键词的最终相似度比较结果。通过该技术方案,提升了主观题自动阅卷的准确性,避免误判。
在上述任一技术方案中,优选地,所述根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度,还包括:计算任一答案关键词与所述预设标准答案中的每个预设关键词的相似度,并选择其中最高的相似度作为所述任一答案关键词对应于所述预设标准答案的相似度。
在该技术方案中,考生填写的答案中往往具有多个答案关键词,而预设标准答案中也往往具有多个预设关键词,系统无法预知多个答案关键词各自对应哪个预设关键词,因此,对于任一个答案关键词,都需要求得其相对于所有预设关键词的相似度,从而在其中选择相似度最高的一个作为对应的预设关键词。通过该技术方案,可以最大限度地避免因答案关键词的对应预设关键词选择错误而造成的考生得分的损失,使自动进行主观题阅卷的得分更加准确可靠。
在上述任一技术方案中,优选地,所述计算所述阅卷答案的得分,包括:计算每个答案关键词的所述相似度与所述每个答案关键词的权重值的乘积,并将计算得到的所有乘积相加,得到所述阅卷答案的得分。
在该技术方案中,每个答案关键词的相似度相当于其对于答案关键词的有效性的百分比,因此,可以将每个答案关键词的相似度与答案关键词的权重值(即分值)相乘,得到该答案关键词的得分,如果考生答案中具有多个答案关键词,则可以把多个答案关键词的得分相加,即可得到该题的最终得分。
在上述任一技术方案中,优选地,所述相似度包括以下之一或其组合:表面信息相似度、结构信息相似度、语义相似度。
在该技术方案中,对关键词进行同义词的扩展、近义词的扩展,对扩展后的词语集合进行深层次的模糊匹配,可以得到基于语句表面信息的语句相似度;词语的排列顺序也影响着语句之间是否相似,通过对词序的计算以及对关键词出现情况的计算,可以得到基于语句结构信息的相似度;而为了更好地表达句子的信息,语义理解也是不可缺少的部分,其中,知网中对语句概念的解释是目前为止最权威的,故可通过知网中对义原关系的树状结构,结合一些特征信息,计算出语义相似度。以上三种方法体现了一个句子的三个主要特征:词形、词态、词义,但这三种方法都存在着缺点,因此,可以将三个主要特征分别使用或按照预定比例配合使用,以便更加全面、准确地衡量考生答案与预设标准答案之间的相似度。
本发明的第二方面提出了一种主观题阅卷装置,包括:答案关键词获取单元,从阅卷答案中获取主观题答案的答案关键词;相似度计算单元,根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度;得分计算单元,根据所述相似度和所述预设标准答案的分值,计算所述阅卷答案的得分。
在该技术方案中,可以通过分词以及无意义词过滤等方式将主观题答案中的答案关键词筛选出来,并求得答案关键词与预设标准答案中的预设关键词的相似度,将其相似度与对应占据的分值相乘,即可得到最终得分。比如,预设标准答案中具有一个关键词,对应分值为5分,答题的主观题答案中的答案关键词与其相似度为80%,则主观题答案的得分为5分乘以80%,也就是4分。
通过该技术方案,可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分,避免使用人工进行主观题阅卷,减少了阅卷的人工成本和时间成本,提升了主观题阅卷的效率。
在上述技术方案中,优选地,所述相似度计算单元包括:关联词扩展单元,根据预设匹配规则,对任一答案关键词进行同义词扩展和近义词扩展,得到所述任一答案关键词的多个关联词;关联相似度计算单元,计算所述任一答案关键词与任一预设关键词的单一相似度,并计算所述多个关联词与所述任一预设关键词的关联相似度;相似度均值计算单元,根据所述单一相似度和多个所述关联相似度,计算所述单一相似度和多个所述关联相似度的平均值,作为所述任一答案关键词与所述任一预设关键词的相似度。
在该技术方案中,考生填写的答案关键词不一定为预设标准答案中的预设关键词本身,但也有可能是对的,因此,为了提升主观题自动阅卷的准确性,可以通过对答案关键词进行同义词扩展和近义词扩展,得到多个关联词,并将该答案关键词、多个关联词分别与预设关键词的相似度的均值作为该答案关键词与该预设关键词的最终相似度比较结果。通过该技术方案,提升了主观题自动阅卷的准确性,避免误判。
在上述任一技术方案中,优选地,所述相似度计算单元还用于:计算任一答案关键词与所述预设标准答案中的每个预设关键词的相似度,并选择其中最高的相似度作为所述任一答案关键词对应于所述预设标准答案的相似度。
在该技术方案中,考生填写的答案中往往具有多个答案关键词,而预设标准答案中也往往具有多个预设关键词,系统无法预知多个答案关键词各自对应哪个预设关键词,因此,对于任一个答案关键词,都需要求得其相对于所有预设关键词的相似度,从而在其中选择相似度最高的一个作为对应的预设关键词。通过该技术方案,可以最大限度地避免因答案关键词的对应预设关键词选择错误而造成的考生得分的损失,使自动进行主观题阅卷的得分更加准确可靠。
在上述任一技术方案中,优选地,所述得分计算单元具体用于:计算每个答案关键词的所述相似度与所述每个答案关键词的权重值的乘积,并将计算得到的所有乘积相加,得到所述阅卷答案的得分。
在该技术方案中,每个答案关键词的相似度相当于其对于答案关键词的有效性的百分比,因此,可以将每个答案关键词的相似度与答案关键词的权重值(即分值)相乘,得到该答案关键词的得分,如果考生答案中具有多个答案关键词,则可以把多个答案关键词的得分相加,即可得到该题的最终得分。
在上述任一技术方案中,优选地,所述相似度包括以下之一或其组合:表面信息相似度、结构信息相似度、语义相似度。
在该技术方案中,对关键词进行同义词的扩展、近义词的扩展,对扩展后的词语集合进行深层次的模糊匹配,可以得到基于语句表面信息的语句相似度;词语的排列顺序也影响着语句之间是否相似,通过对词序的计算以及对关键词出现情况的计算,可以得到基于语句结构信息的相似度;而为了更好地表达句子的信息,语义理解也是不可缺少的部分,其中,知网中对语句概念的解释是目前为止最权威的,故可通过知网中对义原关系的树状结构,结合一些特征信息,计算出语义相似度。以上三种方法体现了一个句子的三个主要特征:词形、词态、词义,但这三种方法都存在着缺点,因此,可以将三个主要特征分别使用或按照预定比例配合使用,以便更加全面、准确地衡量考生答案与预设标准答案之间的相似度。
本发明的第三方面提出了一种计算机设备,包括:处理器;用于储存处理器可执行指令的存储器,其中,处理器用于执行存储器中储存的可执行指令时实现如上述第一方面的技术方案中任一项所述的主观题阅卷方法的步骤。
本发明的第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面的技术方案中任一项所述的主观题阅卷方法的步骤。
通过以上技术方案,可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分,避免使用人工进行主观题阅卷,减少了阅卷的人工成本和时间成本,提升了主观题阅卷的效率。
附图说明
图1示出了根据本发明的一个实施例的主观题阅卷方法的流程图;
图2示出了根据本发明的一个实施例的主观题阅卷装置的框图;
图3示出了根据本发明的一个实施例的主观题答案的截屏示意图;
图4示出了根据本发明的一个实施例的主观题答案审阅结果的示意图;
图5示出了根据本发明的一个实施例的计算机设备的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的一个实施例的主观题阅卷方法的流程图。
如图1所示,根据本发明的一个实施例的主观题阅卷方法,包括:
步骤102,从阅卷答案中获取主观题答案的答案关键词;
步骤104,根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度;
步骤106,根据所述相似度和所述预设标准答案的分值,计算所述阅卷答案的得分。
在该技术方案中,可以通过分词以及无意义词过滤等方式将主观题答案中的答案关键词筛选出来,并求得答案关键词与预设标准答案中的预设关键词的相似度,将其相似度与对应占据的分值相乘,即可得到最终得分。比如,预设标准答案中具有一个关键词,对应分值为5分,答题的主观题答案中的答案关键词与其相似度为80%,则主观题答案的得分为5分乘以80%,也就是4分。
通过该技术方案,可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分,避免使用人工进行主观题阅卷,减少了阅卷的人工成本和时间成本,提升了主观题阅卷的效率。
在上述技术方案中,优选地,步骤104包括:根据预设匹配规则,对任一答案关键词进行同义词扩展和近义词扩展,得到所述任一答案关键词的多个关联词;计算所述任一答案关键词与任一预设关键词的单一相似度,并计算所述多个关联词与所述任一预设关键词的关联相似度;根据所述单一相似度和多个所述关联相似度,计算所述单一相似度和多个所述关联相似度的平均值,作为所述任一答案关键词与所述任一预设关键词的相似度。
在该技术方案中,考生填写的答案关键词不一定为预设标准答案中的预设关键词本身,但也有可能是对的,因此,为了提升主观题自动阅卷的准确性,可以通过对答案关键词进行同义词扩展和近义词扩展,得到多个关联词,并将该答案关键词、多个关联词分别与预设关键词的相似度的均值作为该答案关键词与该预设关键词的最终相似度比较结果。通过该技术方案,提升了主观题自动阅卷的准确性,避免误判。
在上述任一技术方案中,优选地,步骤104还包括:计算任一答案关键词与所述预设标准答案中的每个预设关键词的相似度,并选择其中最高的相似度作为所述任一答案关键词对应于所述预设标准答案的相似度。
在该技术方案中,考生填写的答案中往往具有多个答案关键词,而预设标准答案中也往往具有多个预设关键词,系统无法预知多个答案关键词各自对应哪个预设关键词,因此,对于任一个答案关键词,都需要求得其相对于所有预设关键词的相似度,从而在其中选择相似度最高的一个作为对应的预设关键词。通过该技术方案,可以最大限度地避免因答案关键词的对应预设关键词选择错误而造成的考生得分的损失,使自动进行主观题阅卷的得分更加准确可靠。
在上述任一技术方案中,优选地,步骤106包括:计算每个答案关键词的所述相似度与所述每个答案关键词的权重值的乘积,并将计算得到的所有乘积相加,得到所述阅卷答案的得分。
在该技术方案中,每个答案关键词的相似度相当于其对于答案关键词的有效性的百分比,因此,可以将每个答案关键词的相似度与答案关键词的权重值(即分值)相乘,得到该答案关键词的得分,如果考生答案中具有多个答案关键词,则可以把多个答案关键词的得分相加,即可得到该题的最终得分。
在上述任一技术方案中,优选地,所述相似度包括以下之一或其组合:表面信息相似度、结构信息相似度、语义相似度。
在该技术方案中,对关键词进行同义词的扩展、近义词的扩展,对扩展后的词语集合进行深层次的模糊匹配,可以得到基于语句表面信息的语句相似度;词语的排列顺序也影响着语句之间是否相似,通过对词序的计算以及对关键词出现情况的计算,可以得到基于语句结构信息的相似度;而为了更好地表达句子的信息,语义理解也是不可缺少的部分,其中,知网中对语句概念的解释是目前为止最权威的,故可通过知网中对义原关系的树状结构,结合一些特征信息,计算出语义相似度。以上三种方法体现了一个句子的三个主要特征:词形、词态、词义,但这三种方法都存在着缺点,因此,可以将三个主要特征分别使用或按照预定比例配合使用,以便更加全面、准确地衡量考生答案与预设标准答案之间的相似度。
图2示出了根据本发明的一个实施例的主观题阅卷装置的框图。
如图2所示,根据本发明的一个实施例的主观题阅卷装置200,包括:答案关键词获取单元202、相似度计算单元204和得分计算单元206。
其中,答案关键词获取单元202用于从阅卷答案中获取主观题答案的答案关键词;相似度计算单元204用于根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度;得分计算单元206用于根据所述相似度和所述预设标准答案的分值,计算所述阅卷答案的得分。
在该技术方案中,可以通过分词以及无意义词过滤等方式将主观题答案中的答案关键词筛选出来,并求得答案关键词与预设标准答案中的预设关键词的相似度,将其相似度与对应占据的分值相乘,即可得到最终得分。比如,预设标准答案中具有一个关键词,对应分值为5分,答题的主观题答案中的答案关键词与其相似度为80%,则主观题答案的得分为5分乘以80%,也就是4分。
通过该技术方案,可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分,避免使用人工进行主观题阅卷,减少了阅卷的人工成本和时间成本,提升了主观题阅卷的效率。
在上述技术方案中,优选地,相似度计算单元204包括:关联词扩展单元2042,根据预设匹配规则,对任一答案关键词进行同义词扩展和近义词扩展,得到所述任一答案关键词的多个关联词;关联相似度计算单元2044,计算所述任一答案关键词与任一预设关键词的单一相似度,并计算所述多个关联词与所述任一预设关键词的关联相似度;相似度均值计算单元2046,根据所述单一相似度和多个所述关联相似度,计算所述单一相似度和多个所述关联相似度的平均值,作为所述任一答案关键词与所述任一预设关键词的相似度。
在该技术方案中,考生填写的答案关键词不一定为预设标准答案中的预设关键词本身,但也有可能是对的,因此,为了提升主观题自动阅卷的准确性,可以通过对答案关键词进行同义词扩展和近义词扩展,得到多个关联词,并将该答案关键词、多个关联词分别与预设关键词的相似度的均值作为该答案关键词与该预设关键词的最终相似度比较结果。通过该技术方案,提升了主观题自动阅卷的准确性,避免误判。
在上述任一技术方案中,优选地,相似度计算单元204还用于:计算任一答案关键词与所述预设标准答案中的每个预设关键词的相似度,并选择其中最高的相似度作为所述任一答案关键词对应于所述预设标准答案的相似度。
在该技术方案中,考生填写的答案中往往具有多个答案关键词,而预设标准答案中也往往具有多个预设关键词,系统无法预知多个答案关键词各自对应哪个预设关键词,因此,对于任一个答案关键词,都需要求得其相对于所有预设关键词的相似度,从而在其中选择相似度最高的一个作为对应的预设关键词。通过该技术方案,可以最大限度地避免因答案关键词的对应预设关键词选择错误而造成的考生得分的损失,使自动进行主观题阅卷的得分更加准确可靠。
在上述任一技术方案中,优选地,得分计算单元206具体用于:计算每个答案关键词的所述相似度与所述每个答案关键词的权重值的乘积,并将计算得到的所有乘积相加,得到所述阅卷答案的得分。
在该技术方案中,每个答案关键词的相似度相当于其对于答案关键词的有效性的百分比,因此,可以将每个答案关键词的相似度与答案关键词的权重值(即分值)相乘,得到该答案关键词的得分,如果考生答案中具有多个答案关键词,则可以把多个答案关键词的得分相加,即可得到该题的最终得分。
在上述任一技术方案中,优选地,所述相似度包括以下之一或其组合:表面信息相似度、结构信息相似度、语义相似度。
在该技术方案中,对关键词进行同义词的扩展、近义词的扩展,对扩展后的词语集合进行深层次的模糊匹配,可以得到基于语句表面信息的语句相似度;词语的排列顺序也影响着语句之间是否相似,通过对词序的计算以及对关键词出现情况的计算,可以得到基于语句结构信息的相似度;而为了更好地表达句子的信息,语义理解也是不可缺少的部分,其中,知网中对语句概念的解释是目前为止最权威的,故可通过知网中对义原关系的树状结构,结合一些特征信息,计算出语义相似度。以上三种方法体现了一个句子的三个主要特征:词形、词态、词义,但这三种方法都存在着缺点,因此,可以将三个主要特征分别使用或按照预定比例配合使用,以便更加全面、准确地衡量考生答案与预设标准答案之间的相似度。
图3示出了根据本发明的一个实施例的主观题答案的截屏示意图。
如图3所示,对于问题“什么是实体”,考生填写的学生答案为“客观存在相互”,具有“客观”、“存在”、“相互”三个答案关键词。
如图4所示,对于主观题答案审阅时可以将学生答案拆分为“客观”、“存在”、“相互”三个答案关键词,同时将标准答案也拆分为多个关键词,其中,每个标准答案的分词后的字母对应有不同的权重,也就是分值,最终计算得到学生答案与标准答案的相似度为73%。
其中,代码中关键部分是对标准答案对照中文停用词表把没用实际意义的词语过滤掉,并且把分出来的词语进行词性的分解,然后获取学生答案,同样对照中文停用词表过滤没用实际意义的词语,然后利用余弦定理根据已经设置好的每个分词的权值进行计算,最终得到学生答案与标准答案的相似度,最后根据该题目的总分值计算出改学生的得分情况。
在上述技术方案中,优选地,对答案进行分词可以通过ICTCLAS(汉语词法分析系统)。
另外,对关键词进行同义词的扩展、近义词的扩展,对扩展后的词语集合进行深层次的模糊匹配,可以得到基于语句表面信息的语句相似度。
词语的排列顺序也影响着语句之间是否相似,通过对词序的计算以及对关键词出现情况的计算,可以得到基于语句结构信息的相似度。
为了更好地表达句子的信息,语义理解也是不可缺少的部分,其中,知网中对语句概念的解释是目前为止最权威的,故可通过知网中对义原关系的树状结构,结合一些特征信息,计算出语义相似度。
以上三种方法体现了一个句子的三个主要特征:词形、词态、词义,但这三种方法都存在着缺点,因此,可以将三个主要特征分别使用或按照预定比例配合使用,以便更加全面、准确地衡量考生答案与预设标准答案之间的相似度。
图5示出了本发明实施例的计算机设备的示意框图。
如图5所示,根据本发明实施例的计算机设备500,包括处理器502和存储器504,其中,存储器504上存储有可在处理器502上运行的计算机程序,其中存储器504和处理器502之间可以通过总线连接,该处理器502用于执行存储器504中存储的计算机程序时实现如上实施例中所述的主观题阅卷方法的步骤。
本发明实施例的主观题阅卷方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例的主观题阅卷装置200和计算机设备500中的单元可以根据实际需要进行合并、划分和删减。
根据本发明的实施例,提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上实施例中所述的主观题阅卷方法的步骤。
进一步地,可以理解的是,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等;以及上述提到的计算机设备可以为电脑等。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分,避免使用人工进行主观题阅卷,减少了阅卷的人工成本和时间成本,提升了主观题阅卷的效率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种主观题阅卷方法,其特征在于,包括:
从阅卷答案中获取主观题答案的答案关键词;
根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度;
根据所述相似度和所述预设标准答案的分值,计算所述阅卷答案的得分。
2.根据权利要求1所述的主观题阅卷方法,其特征在于,所述根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度,包括:
根据预设匹配规则,对任一答案关键词进行同义词扩展和近义词扩展,得到所述任一答案关键词的多个关联词;
计算所述任一答案关键词与任一预设关键词的单一相似度,并计算所述多个关联词与所述任一预设关键词的关联相似度;
根据所述单一相似度和多个所述关联相似度,计算所述单一相似度和多个所述关联相似度的平均值,作为所述任一答案关键词与所述任一预设关键词的相似度。
3.根据权利要求2所述的主观题阅卷方法,其特征在于,所述根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度,还包括:
计算任一答案关键词与所述预设标准答案中的每个预设关键词的相似度,并选择其中最高的相似度作为所述任一答案关键词对应于所述预设标准答案的相似度。
4.根据权利要求1至3中任一项所述的主观题阅卷方法,其特征在于,所述计算所述阅卷答案的得分,包括:
计算每个答案关键词的所述相似度与所述每个答案关键词的权重值的乘积,并将计算得到的所有乘积相加,得到所述阅卷答案的得分。
5.根据权利要求1所述的主观题阅卷方法,其特征在于,所述相似度包括以下之一或其组合:表面信息相似度、结构信息相似度、语义相似度。
6.一种主观题阅卷装置,其特征在于,包括:
答案关键词获取单元,从阅卷答案中获取主观题答案的答案关键词;
相似度计算单元,根据预设标准答案,计算所述答案关键词与所述预设标准答案中的预设关键词的相似度;
得分计算单元,根据所述相似度和所述预设标准答案的分值,计算所述阅卷答案的得分。
7.根据权利要求6所述的主观题阅卷装置,其特征在于,所述相似度计算单元包括:
关联词扩展单元,根据预设匹配规则,对任一答案关键词进行同义词扩展和近义词扩展,得到所述任一答案关键词的多个关联词;
关联相似度计算单元,计算所述任一答案关键词与任一预设关键词的单一相似度,并计算所述多个关联词与所述任一预设关键词的关联相似度;
相似度均值计算单元,根据所述单一相似度和多个所述关联相似度,计算所述单一相似度和多个所述关联相似度的平均值,作为所述任一答案关键词与所述任一预设关键词的相似度。
8.根据权利要求7所述的主观题阅卷装置,其特征在于,所述相似度计算单元还用于:
计算任一答案关键词与所述预设标准答案中的每个预设关键词的相似度,并选择其中最高的相似度作为所述任一答案关键词对应于所述预设标准答案的相似度。
9.根据权利要求6至8中任一项所述的主观题阅卷装置,其特征在于,所述得分计算单元具体用于:
计算每个答案关键词的所述相似度与所述每个答案关键词的权重值的乘积,并将计算得到的所有乘积相加,得到所述阅卷答案的得分。
10.根据权利要求9所述的主观题阅卷装置,其特征在于,所述相似度包括以下之一或其组合:表面信息相似度、结构信息相似度、语义相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810745153.7A CN110705278A (zh) | 2018-07-09 | 2018-07-09 | 主观题阅卷方法和主观题阅卷装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810745153.7A CN110705278A (zh) | 2018-07-09 | 2018-07-09 | 主观题阅卷方法和主观题阅卷装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110705278A true CN110705278A (zh) | 2020-01-17 |
Family
ID=69192173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810745153.7A Pending CN110705278A (zh) | 2018-07-09 | 2018-07-09 | 主观题阅卷方法和主观题阅卷装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705278A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112164263A (zh) * | 2020-11-10 | 2021-01-01 | 龙岩烟草工业有限责任公司 | 用于烟草行业安全知识的答题方法和答题系统 |
CN112214579A (zh) * | 2020-10-10 | 2021-01-12 | 浙江蓝鸽科技有限公司 | 简答题的机器智能评阅方法及系统 |
CN114333461A (zh) * | 2020-09-30 | 2022-04-12 | 董黎明 | 主观题自动评分方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058560A (ja) * | 2001-08-21 | 2003-02-28 | Seiko Epson Corp | 情報分類・集計方法および情報分類・集計装置ならびに情報分類・集計処理プログラム |
CN103942994A (zh) * | 2014-04-22 | 2014-07-23 | 济南大学 | 一种主观性试题的计算机考核方法 |
CN103955874A (zh) * | 2014-03-31 | 2014-07-30 | 西南林业大学 | 一种基于语义相似度区间的主观题自动评分系统及方法 |
CN105468572A (zh) * | 2015-12-07 | 2016-04-06 | 无锡曙光云计算有限公司 | 一种试卷自动拆题组卷系统及其组卷方法 |
CN107705231A (zh) * | 2017-11-07 | 2018-02-16 | 语联网(武汉)信息技术有限公司 | 一种计算机辅助的阅卷方法、装置及计算机可读存储介质 |
-
2018
- 2018-07-09 CN CN201810745153.7A patent/CN110705278A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058560A (ja) * | 2001-08-21 | 2003-02-28 | Seiko Epson Corp | 情報分類・集計方法および情報分類・集計装置ならびに情報分類・集計処理プログラム |
CN103955874A (zh) * | 2014-03-31 | 2014-07-30 | 西南林业大学 | 一种基于语义相似度区间的主观题自动评分系统及方法 |
CN103942994A (zh) * | 2014-04-22 | 2014-07-23 | 济南大学 | 一种主观性试题的计算机考核方法 |
CN105468572A (zh) * | 2015-12-07 | 2016-04-06 | 无锡曙光云计算有限公司 | 一种试卷自动拆题组卷系统及其组卷方法 |
CN107705231A (zh) * | 2017-11-07 | 2018-02-16 | 语联网(武汉)信息技术有限公司 | 一种计算机辅助的阅卷方法、装置及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
丁康健: "考试系统中智能化辅助阅卷技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
张均胜: "一种基于短文本相似度计算的主观题自动阅卷方法", 《图书情报工作》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114333461A (zh) * | 2020-09-30 | 2022-04-12 | 董黎明 | 主观题自动评分方法及系统 |
CN114333461B (zh) * | 2020-09-30 | 2024-03-12 | 董黎明 | 主观题自动评分方法及系统 |
CN112214579A (zh) * | 2020-10-10 | 2021-01-12 | 浙江蓝鸽科技有限公司 | 简答题的机器智能评阅方法及系统 |
CN112214579B (zh) * | 2020-10-10 | 2022-08-23 | 浙江蓝鸽科技有限公司 | 简答题的机器智能评阅方法及系统 |
CN112164263A (zh) * | 2020-11-10 | 2021-01-01 | 龙岩烟草工业有限责任公司 | 用于烟草行业安全知识的答题方法和答题系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109815487B (zh) | 文本质检方法、电子装置、计算机设备及存储介质 | |
US10831769B2 (en) | Search method and device for asking type query based on deep question and answer | |
CN112667794A (zh) | 一种基于孪生网络bert模型的智能问答匹配方法及系统 | |
CN110895561A (zh) | 基于多模态知识感知的医疗问答检索方法、系统、装置 | |
JP7153004B2 (ja) | コミュニティ質問応答データの検証方法、装置、コンピュータ機器、及び記憶媒体 | |
US9152620B2 (en) | System, method, and computer-readable medium for plagiarism detection | |
KR101060973B1 (ko) | 에세이에서 과도하게 반복되는 단어 사용의 자동 평가 | |
CN110705278A (zh) | 主观题阅卷方法和主观题阅卷装置 | |
CN110909035A (zh) | 个性化复习题集生成方法、装置、电子设备及存储介质 | |
CN109858626A (zh) | 一种知识库构建方法及装置 | |
CN111444718A (zh) | 一种保险产品需求文档处理方法、装置及电子设备 | |
KR101812763B1 (ko) | 한글 철자 검사지 생성 및 검사 결과 해석 시스템 | |
Barz et al. | Implicit estimation of paragraph relevance from eye movements | |
CN112256576B (zh) | 人机对话语料测试方法、装置、设备及存储介质 | |
CN113806500A (zh) | 信息处理方法、装置和计算机设备 | |
CN113807096A (zh) | 文本数据的处理方法、装置、计算机设备和存储介质 | |
CN112101030A (zh) | 建立术语映射模型、实现标准词映射的方法、装置及设备 | |
CN108021595A (zh) | 检验知识库三元组的方法及装置 | |
CN115438624B (zh) | 数学题目出题意图识别方法、系统、存储介质及设备 | |
Littell et al. | Measuring sentence parallelism using Mahalanobis distances: The NRC unsupervised submissions to the WMT18 Parallel Corpus Filtering shared task | |
CN112559798B (zh) | 音频内容质量的检测方法及装置 | |
CN112860983B (zh) | 一种学习内容推送的方法、系统、设备及可读存储介质 | |
CN113962216A (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN111383769B (zh) | 主诉与诊断一致性检测方法、装置、设备及存储介质 | |
CN110163498B (zh) | 课件原创度评分方法、装置、存储介质及处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200117 |