CN109815491A - 答题评分方法、装置、计算机设备及存储介质 - Google Patents

答题评分方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109815491A
CN109815491A CN201910014250.3A CN201910014250A CN109815491A CN 109815491 A CN109815491 A CN 109815491A CN 201910014250 A CN201910014250 A CN 201910014250A CN 109815491 A CN109815491 A CN 109815491A
Authority
CN
China
Prior art keywords
answer
model
word
trained
marking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910014250.3A
Other languages
English (en)
Other versions
CN109815491B (zh
Inventor
金戈
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910014250.3A priority Critical patent/CN109815491B/zh
Publication of CN109815491A publication Critical patent/CN109815491A/zh
Application granted granted Critical
Publication of CN109815491B publication Critical patent/CN109815491B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种答题评分方法、装置、计算机设备及存储介质,包括下述步骤:获取目标命题的答题答案;将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;根据评分模型的输出结果确定所述答题答案的评分。在建立多项式回归模型时,对获取到的训练答案进行同义词拓展,保证同样的语义用不同词语表达的时候获取到相同的分值。通过这种方式对答题答案进行评分,不依赖于特定的关键词或句,提高阅卷评分时的灵活度和准确度,有效保证评分的客观性。

Description

答题评分方法、装置、计算机设备及存储介质
技术领域
本发明涉及阅卷评分技术领域,特别是涉及一种答题评分方法、装置、计算机设备及存储介质。
背景技术
随着计算机科学与技术的发展,自动化信息处理能力和水平也得到了显著的提高。自动阅卷系统的出现将人从繁重的机械劳动中解放出来。机器阅卷不仅有利于对学生的成绩做出客观公正的评价,而且利于对阅卷的结果进行保存、统计和查询。但主观部分,例如作文的阅卷还只能依靠人工阅卷,并且为了尽量减少不同阅卷老师的主观差异带来的评分影响,还需要对阅卷老师进行各类培训以统一标准,还可能需要多轮次多人综合评价等,费时费力,且客观性难以得到保证。
现有的主观题评分系统通常是基于一定的规则,对于答案进行评分,例如用大量的人工罗列出所有可能的关键词,然后查找考生的答案中是否出现这些可能的关键词,如果出现这些可能的关键词,则得分,否则不得分。但主观题的评分方式受较多因素干扰,仅通过关键词等规则进行评分时缺少灵活性,另一方面,句子虽然由词语组成,但词与词之间的关系也隐藏了大量的语义信息,基于关键词的匹配会导致这一部分信息丢失,导致评分结果不准确。
发明内容
本发明实施例能够提供一种提高评分效率、灵活度和准确性的答题评分方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种答题评分方法,包括以下步骤:
获取目标命题的答题答案;
将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;
根据评分模型的输出结果确定所述答题答案的评分。
可选地,建立所述评分模型的步骤,包括以下步骤:
获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值;
将所述训练答案集中的多个答案与预设的标准答案分别进行相似度对比,得到多个特征向量;
根据所述特征向量建立评分模型。
可选地,所述根据所述特征向量建立评分模型的步骤,包括以下步骤:
获取所述训练答案集中每个答案的分值;
对每个答案的分值和所述特征向量进行多项式回归,得到多项式回归模型;
根据所述多项式回归模型建立所述评分模型。
可选地,所述获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值的步骤之前,包括以下步骤:
获取训练答案;
根据预设的同义词替换规则对训练答案中的同义词进行替换,生成一个或多个替换答案;
定义所述训练答案和所述替换答案的集合为所述训练答案集。
可选地,所述根据预设的同义词替换规则对训练答案中的同义词进行替换,生成一个或多个替换答案的步骤,包括下述步骤:
获取训练答案中的目标词语;
在预设的同义词库中查找与所述目标词语具有映射关系的同义词;
将所述训练答案中的所述目标词语替换为所述同义词语,生成替换答案。
可选地,所述获取训练答案中的目标词语的步骤之前,包括下述步骤:
根据预设的提取规则对所述训练答案中的词语进行提取;
根据词语在所述训练答案中的出现次数对所述训练答案中的词语进行排序;
定义出现次数最高的一个或多个词语为所述目标词语。
可选地,建立所述同义词库的步骤,包括下述步骤:
获取待处理的词语信息;
根据预设的抽取规则在待处理的词语信息中抽取同义词组;
根据提取出的同义词组生成同义词库。
为解决上述技术问题,本发明实施例还提供一种答题评分装置,包括:
获取模块,用于获取目标命题的答题答案;
处理模块,用于将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;
执行模块,用于根据评分模型的输出结果确定所述答题答案的评分。
可选地,所述答题评分装置,还包括:
第一获取子模块,用于获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值;
第一对比子模块,用于将所述训练答案集中的多个答案与预设的标准答案分别进行相似度对比,得到多个特征向量;
第一处理子模块,用于根据所述特征向量建立评分模型。
可选地,所述答题评分装置,还包括:
第二获取子模块,用于获取所述训练答案集中每个答案的分值;
第二处理子模块,用于对每个答案的分值和所述特征向量进行多项式回归,得到多项式回归模型;
第一执行子模块,用于根据所述多项式回归模型建立所述评分模型。
可选地,所述答题评分装置,还包括:
第三获取子模块,用于获取训练答案;
第三处理子模块,用于根据预设的同义词替换规则对训练答案中的同义词进行替换,生成一个或多个替换答案;
第二执行子模块,用于定义所述训练答案和所述替换答案的集合为所述训练答案集。
可选地,所述答题评分装置,还包括:
第四获取子模块,用于获取训练答案中的目标词语;
第一查找子模块,用于在预设的同义词库中查找与所述目标词语具有映射关系的同义词;
第四处理子模块,用于将所述训练答案中的所述目标词语替换为所述同义词语,生成替换答案。
可选地,所述答题评分装置,还包括:
第五处理子模块,用于根据预设的提取规则对所述训练答案中的词语进行提取;
第六处理子模块,用于根据词语在所述训练答案中的出现次数对所述训练答案中的词语进行排序;
第三执行子模块,用于定义出现次数最高的一个或多个词语为所述目标词语。
可选地,所述答题评分装置,还包括:
第五获取子模块,用于获取待处理的词语信息;
第七处理子模块,用于根据预设的抽取规则在待处理的词语信息中抽取同义词组;
第四执行子模块,用于根据提取出的同义词组生成同义词库。
为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述答题评分方法的步骤。
为解决上述技术问题,本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述答题评分方法的步骤。
本发明实施例的有益效果是:通过利用答题答案和标准答案进行文本的相似度对比,得出特征向量,并将特征向量进行多项式回归的方式,完成多答题答案进行评分,相对于传统的人工阅卷,有效提高了评分效率,节省了人工评分需要消耗的大量时间和人力成本;相对于现有的利用关键词匹配进行评分的方法,降低了对于特定关键词或句的依赖程度,避免在相同语义的不同表达时造成评分错误,保证阅卷评分的客观性,同时提高了评分模型对于不同答案进行评分时的灵活度和准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例答题评分方法的基本流程示意图;
图2为本发明实施例建立评分模型的流程示意图;
图3为本发明实施例建立多项式回归模型的流程示意图;
图4为本发明实施例建立训练答案集的流程示意图;
图5为本发明实施例生成替换答案的流程示意图;
图6为本发明实施例确定目标词语的流程示意图;
图7为本发明实施例建立同义词库的流程示意图;
图8为本发明实施例答题评分装置的基本结构框图;
图9为本发明实施例计算机设备基本结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunicationsService,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(PersonalDigitalAssistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(GlobalPositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(MobileInternetDevice,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
具体地请参阅图1,图1为本实施例答题评分方法的基本流程示意图。
如图1所示,一种答题评分方法,包括以下步骤:
S1100、获取目标命题的答题答案;
应试人员通过智能终端的应用程序录入答案,应用程序在获取到答题答案之后,在应试人员确认交卷时将答题答案上传至服务器中,等待评分。另一方面,可以通过笔试的方式,应试人员在答题卡上作答,上交答题卡后管理人员统计所有答题卡,将答题卡扫描或拍照得到图像文件,并将图像文件录入到服务器中,并通过文字识别模型对答题卡上的内容部分进行识别提取,得到应试人员的答题答案信息,文字识别模型可以是现有的用于对提取图像文件中的文字内容的任意模型。
S1200、将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;
将获取到的答题答案输入到评分模型中,与预设的标准答案进行文本相似度对比,得到一个特征向量,将特征向量通过多项式回归输出计算结果。具体地,将答题答案进行分句,将分句与标准答案中的不同句子进行相似度对比,将所有分句的相似度对比结果集合形成一个特征向量,用于表示答题答案与标准答案之间的文本相似度。得到特征向量之后,根据预设的多项式回归模型进行计算,得到特征向量进行多项式回归的结果。
本实施方式所用到的多项式回归模型,是通过利用多组训练答案作为训练答案集,与标准模型进行文本相似度对比,得出各自的特征向量,并且每个训练答案在训练之前都进行分值的标记,在得到特征向量后,通过将不同的特征向量和对应的分值进行反复计算得到较为逼近实测点的多项式回归模型。根据实际应用场景的不同,可以通过增加自变量的高次项使多项式回归模型的输出结果更加逼近实测点,提高评分的精度,同理,在评分精度要求较低的场景中,也可以通过降低自变量的次项使以提高多项式回归模型的计算速度和建立时的训练效率。
S1300、根据评分模型的输出结果确定所述答题答案的评分;
获取到评分模型的输出结果之后,根据输出结果计算出答题答案的评分。在一些实施方式中,可以将评分模型的输出分值直接作为答题答案的评分,也可以作为参考分数,结合其他的评价得出最终得分,例如文本篇幅、卷面分数或者岗位系数等等,但不限于此。
如图2所示,建立所述评分模型的步骤,包括以下步骤:
S2100、获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值;
训练答案集包括有多人训练答案,训练答案是不同人员对于目标题目撰写的答案,并且根据评分标准对于每个训练答案进行评分,即训练答案集中每个训练答案对应一个分值,用于训练多项式回归模型。训练答案的获取可以通过收集在先答题记录,将在先答题记录中其他人员的答案和得分进行统计,整合作为训练答案集。
在一些实施方式中,得到一部分训练答案之后,对训练答案中的部分词语进行同义词的替换,得到多个替换答案,同一个训练答案的多个替换答案与训练答案本身具有相同的分值,以提高同一语义在不同表达方式下的评分准确率。在得到替换答案后,以训练答案与替换答案的合集作为训练答案集。
S2200、将所述训练答案集中的多个答案与预设的标准答案分别进行相似度对比,得到多个特征向量;
将训练答案集中的一个训练答案进行分句,将分句与标准答案中的不同句子进行相似度对比,将所有分句的相似度对比结果集合形成一个特征向量,用于表示训练答案与标准答案之间的文本相似度。重复上述过程,获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值中所有答案与标准答案对比后得到的特征向量。
S2300、根据所述特征向量建立评分模型;
所述评分模型为根据答题答案和标准答案进行相似度对比得出的特征向量进行评分计算的多项式回归模型。
每个训练答案预设设置有对应的分值,在得到特征向量后,通过将不同的特征向量和对应的分值进行反复计算得到较为逼近实测点的多项式回归模型。根据实际应用场景的不同,可以通过增加自变量的次项使多项式回归模型的输出结果更加逼近实测点,提高评分的精度,同理,在评分精度要求较低的场景中,也可以通过降低自变量的次项使以提高多项式回归模型的计算速度和建立时的训练效率。在得到多项式回归模型后,整合得到将输入答案与标准答案进行文本相似度对比得出特征向量,并利用上述多项式回归模型对获得的特征向量进行代入计算得到得分的模型,作为评分模型。
通过上述方法建立的评分模型,训练时替换同义词的训练答案分配相同的分值,多次反复训练之后,得到的多项式回归模型对于语义相同的答案会给出较为接近的得分,有效提高了评分模型对答案进行评分时的准确性,降低相同语义因为表达方式的不同造成的得分偏差。
如图3所示,步骤S2300具体包括以下步骤:
S2310、获取所述训练答案集中每个答案的分值;
训练答案集中的每个答案具有一个对应的分值,所述对应的分值为根据评分标准对答案进行评分得到的答案分值,获取评分的方式可是以通过人工进行评分,也可以是获取该答案在先录入时的评分作为对应的分值。在一些实施方式中,对训练答案进行同义词的替换,替换后的答案与原答案具有相同的分值。
S2320、对每个答案的分值和所述特征向量进行多项式回归,得到多项式回归模型;
在得到每个答案的特征向量和各自对应的分值后,通过将特征向量和对应的分值进行反复计算得到较为逼近实测点的多项式回归模型。根据实际应用场景的不同,可以通过增加自变量的次项使多项式回归模型的输出结果更加逼近实测点,提高评分的精度,同理,在评分精度要求较低的场景中,也可以通过降低自变量的次项使以提高多项式回归模型的计算速度和建立时的训练效率。
S2330、根据所述多项式回归模型建立所述评分模型;
通过多组特征向量和对应的分值作为训练样本对多项式回归模型进行训练,得到一个较为接近实测点的多项式回归模型,定义训练完成的多项式回归模型为评分模型,用于根据输入答案的特征向量输出答案的得分。在得到多项式回归模型后,整合得到将输入答案与标准答案进行文本相似度对比得出特征向量,并利用上述多项式回归模型对获得的特征向量进行代入计算得到得分的模型,作为评分模型。
通过上述方法,使用大量的答案与对应分值作为训练样本,建立更加逼近实测点的多项式回归模型,有效提高了在利用多项式回归模型进行评分时的客观性。
如图4所示,步骤S2100之前还包括以下步骤:
S2010、获取训练答案;
训练答案是不同人员对于目标题目撰写的答案,训练答案的获取可以通过收集在先答题记录,将在先答题记录中其他人员的答案进行统计。
S2020、根据预设的同义词替换规则对训练答案中的同义词进行替换,生成一个或多个替换答案;
在获取到训练答案之后,通过自然语言解析的方法提取训练答案中的词语,统计各个词语的出现次数,并根据出现次数对词语进行排序,定义出现次数最高的一个或多个词语为目标词语,在同义词库中查找目标词语的同义词组,同义词组具有一个或多个同义词,将训练答案中所有的目标词语替换为同义词,得到替换后的答案,若同义词具有多个,即进行多次替换,得到多个替换后的答案。
S2030、定义所述训练答案和所述替换答案的集合为所述训练答案集;
在获取到替换答案之后,赋予替换答案与原训练答案相同的分值,并将所有训练答案和替换答案的集合作为训练答案集。
通过上述方法得到训练答案集,在原有训练答案的基础上进行了同义词的拓展,有利于在建立多项式回归模型时降低相同语义下不同表达方式的得分偏差,提高对于不同答案进行评分时的准确率和灵活性。
如图5所示,步骤S2020具体包括下述步骤:
S2021、获取训练答案中的目标词语;
通过自然语言解析的方法提取训练答案中的词语,统计各个词语的出现次数,并根据出现次数对词语进行排序,定义出现次数最高的一个或多个词语为目标词语。在一些实施方式中,可以对训练答案中的词语的词性进行判断,若同一个词语在训练答案中具有不同的词性,在统计出现频率时,按照词性的不同将同一个词语分为两个或以上的统计目标,例如同一个词语作为动词使用和作为名词使用,统计各自的出现频率。
S2022、在预设的同义词库中查找与所述目标词语具有映射关系的同义词;
同义词库中设有同义词组,每个同义词组对应多个词语,在获取到目标词语后,在同义词库中查找与目标词语具有映射关系的同义词组,并提取同义词组中除目标词语以外的词语作为同义语。在一些实施方式中,目标词语带有词性标签,同义词库中的同义词组也具有词性标签,用于区分同一个词语在不同应用场景下的不同表达意义,例如同一个词语作为动词使用和作为名词使用,对应有不同的同义词组,在进行替换时,根据各自不同的词性获取到对应的同义词组。
S2023、将所述训练答案中的所述目标词语替换为所述同义词语,生成替换答案;
在获取到目标词语的同义词语后,将训练样答案中的目标词语替换为同义词语,得到替换答案,若同义词语具有多个,则进行多次替换,生成多个替换答案。在一些实施方式中,目标词语具有词性,获取到的同义词组也具有词性,若训练样本中目标词语具有两个或以上的词性,在替换同义词时,只替换与同义词相同词性的目标词语。
如图6所示,步骤S2021之前,包括下述步骤:
S2011、根据预设的提取规则对所述训练答案中的词语进行提取;
根据自然语言解析模型对训练答案中的词语进行提取,并识别词语的词性,本实施方式使用的自然语言解析模型可以是现有的用于在文本中识别并提取词语的任意模型。
S2012、根据词语在所述训练答案中的出现次数对所述训练答案中的词语进行排序;
在训练答案中提取出词语之后,统计各个词语的出现次数,并根据出现次数对词语进行排序。在一些实施方式中,一个训练答案中同一个词语根据词语的应用场景不同,具有不同的词性,对于同一个词语的不同词性进行区分,得到的是带有词性的统计信息,进行出现次数统计时,不同词性的同一个词语进行分别的统计。
S2013、定义出现次数最高的一个或多个词语为所述目标词语。
根据统计得出的词语出现次数,定义出现次数最高的词语为目标词语。当同时有多个词语具有最高的出现次数时,定义上述多个词语作为多个目标词语。在一些实施方式中,可以设定出现次数的阈值,当某个词语的出现次数超过预设的阈值时,定义该词语作为目标词语。在另一些实施方式中,可以设计提取的目标词语数量,定义出现次数最高的预设数量的词语作为目标词语。上述阈值或预设的数量可以根据实际应用场景的不同进行设定,在需要获取较大量的替换答案时,可以选用较小的阈值或较多的提取数量,在需要的替换答案较少时,则选用较大的阈值或较少的提取数量。
如图7所示,建立所述同义词库的步骤,具体包括下述步骤:
S3100、获取待处理的词语信息;
通过网络爬虫等方式获取到网络上的词语信息,例如百科或者辞海等,但不限于此。以百科为例,在获取词语内容时,通过百科中词与词之间的链接关系,链接到其他词语中,并保留词语之间的链接信息,转化为文本信息。通过上述方法获取到大量的文本信息,作为待处理的词语信息。
S3200、根据预设的抽取规则在待处理的词语信息中抽取同义词组;
获取到待处理的词语信息后,抽取其中的同义词组。在一些实施方式中,抽取同义词组的方式可以通过获取到的百科中同义词之间的链接关系确定同义词组,将同一个链接对应的多个同义词统计生成同义词组,或者通过识别各个词语的文本信息中特定的字段,如“又称”、“俗称”、“其他名称”、“同义词”和“近义词”等关键字,但不限于此,在识别到特定的字段之后,提取其所对应的文本,作为词语的同义词,统计得到的词语与其同义词作为同义词组。
S3300、根据提取出的同义词组生成同义词库。
通过上一个步骤的方法提取出大量的同义词组,并融合其中相同的词语的同义词组,将所有同义词组整合作为同义词库。每个同义词组对应有两个或以上的词语,一个同义词组中的所有词语具有相同的词性,表达的语义相同或相近。
为解决上述技术问题,本发明实施例还提供一种答题评分装置。具体请参阅图8,图8为本实施答题评分装置的基本结构框图。
如图8所示,答题评分装置,包括:获取模块2100、处理模块2200和执行模块2300。其中,获取模块用于获取目标命题的答题答案;处理模块用于将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;执行模块用于根据评分模型的输出结果确定所述答题答案的评分。
通过利用答题答案和标准答案进行文本的相似度对比,得出特征向量,并将特征向量进行多项式回归的方式,完成多答题答案进行评分,相对于传统的人工阅卷,有效提高了评分效率,节省了人工评分需要消耗的大量时间和人力成本;相对于现有的利用关键词匹配进行评分的方法,降低了对于特定关键词或句的依赖程度,避免在相同语义的不同表达时造成评分错误,保证阅卷评分的客观性,同时提高了评分模型对于不同答案进行评分时的灵活度和准确性。
在一些实施方式中,答题评分装置还包括:第一获取子模块、第一对比子模块、第一处理子模块。其中第一获取子模块用于获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值;第一对比子模块用于将所述训练答案集中的多个答案与预设的标准答案分别进行相似度对比,得到多个特征向量;第一处理子模块用于根据所述特征向量建立评分模型。
在一些实施方式中,答题评分装置还包括:第二获取子模块、第二处理子模块、第一执行子模块。其中,第二获取子模块用于获取所述训练答案集中每个答案的分值;第二处理子模块用于对每个答案的分值和所述特征向量进行多项式回归,得到多项式回归模型;第一执行子模块用于根据所述多项式回归模型建立所述评分模型。
在一些实施方式中,答题评分装置还包括:第三获取子模块、第三处理子模块、第二执行子模块。其中,第三获取子模块用于获取训练答案;第三处理子模块用于根据预设的同义词替换规则对训练答案中的同义词进行替换,生成一个或多个替换答案;第二执行子模块用于定义所述训练答案和所述替换答案的集合为所述训练答案集。
在一些实施方式中,答题评分装置还包括:第四获取子模块、第一查找子模块、第四处理子模块。其中,第四获取子模块用于获取训练答案中的目标词语;第一查找子模块用于在预设的同义词库中查找与所述目标词语具有映射关系的同义词;第四处理子模块用于将所述训练答案中的所述目标词语替换为所述同义词语,生成替换答案。
在一些实施方式中,答题评分装置还包括:第五处理子模块、第六处理子模块、第三执行子模块。其中,第五处理子模块用于根据预设的提取规则对所述训练答案中的词语进行提取;第六处理子模块用于根据词语在所述训练答案中的出现次数对所述训练答案中的词语进行排序;第三执行子模块用于定义出现次数最高的一个或多个词语为所述目标词语。
在一些实施方式中,答题评分装置还包括:第五获取子模块、第七处理子模块、第四执行子模块。其中,第五获取子模块用于获取待处理的词语信息;第七处理子模块用于根据预设的抽取规则在待处理的词语信息中抽取同义词组;第四执行子模块用于根据提取出的同义词组生成同义词库。
为解决上述技术问题,本发明实施例还提供一种计算机设备。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
如图9所示,计算机设备的内部结构示意图。如图9所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种答题评分方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种答题评分方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图8中获取模块2100、处理模块2200和执行模块2300的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有答题评分装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述答题评分方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)等非易失性存储介质,或随机存储记忆体(RandomAccessMemory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种答题评分方法,其特征在于,包括以下步骤:
获取目标命题的答题答案;
将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;
根据评分模型的输出结果确定所述答题答案的评分。
2.如权利要求1所述的答题评分方法,其特征在于,建立所述评分模型的步骤,包括以下步骤:
获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值;
将所述训练答案集中的多个答案与预设的标准答案分别进行相似度对比,得到多个特征向量;
根据所述特征向量建立评分模型。
3.如权利要求2所述的答题评分方法,其特征在于,所述根据所述特征向量建立评分模型的步骤,包括以下步骤:
获取所述训练答案集中每个答案的分值;
对每个答案的分值和所述特征向量进行多项式回归,得到多项式回归模型;
根据所述多项式回归模型建立所述评分模型。
4.如权利要求2所述的答题评分方法,其特征在于,所述获取训练答案集,其中,所述训练答案集包括同一目标命题的多个答案,且各答案分别对应一个分值的步骤之前,包括以下步骤:
获取训练答案;
根据预设的同义词替换规则对训练答案中的同义词进行替换,生成一个或多个替换答案;
定义所述训练答案和所述替换答案的集合为所述训练答案集。
5.如权利要求4所述的答题评分方法,其特征在于,所述根据预设的同义词替换规则对训练答案中的同义词进行替换,生成一个或多个替换答案的步骤,包括下述步骤:
获取训练答案中的目标词语;
在预设的同义词库中查找与所述目标词语具有映射关系的同义词;
将所述训练答案中的所述目标词语替换为所述同义词语,生成替换答案。
6.如权利要求5所述的答题评分方法,其特征在于,所述获取训练答案中的目标词语的步骤之前,包括下述步骤:
根据预设的提取规则对所述训练答案中的词语进行提取;
根据词语在所述训练答案中的出现次数对所述训练答案中的词语进行排序;
定义出现次数最高的一个或多个词语为所述目标词语。
7.如权利要求1所述的答题评分方法,其特征在于,建立所述同义词库的步骤,包括下述步骤:
获取待处理的词语信息;
根据预设的抽取规则在待处理的词语信息中抽取同义词组;
根据提取出的同义词组生成同义词库。
8.一种答题评分装置,其特征在于,包括:
获取模块,用于获取目标命题的答题答案;
处理模块,用于将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;
执行模块,用于根据评分模型的输出结果确定所述答题答案的评分。
9.一种计算机设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述权利要求1-7任意一项所述的答题评分方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种答题评分方法,所述方法包括上述权利要求1-7任意一项所述的答题评分方法。
CN201910014250.3A 2019-01-08 2019-01-08 答题评分方法、装置、计算机设备及存储介质 Active CN109815491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910014250.3A CN109815491B (zh) 2019-01-08 2019-01-08 答题评分方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910014250.3A CN109815491B (zh) 2019-01-08 2019-01-08 答题评分方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN109815491A true CN109815491A (zh) 2019-05-28
CN109815491B CN109815491B (zh) 2023-08-08

Family

ID=66604116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910014250.3A Active CN109815491B (zh) 2019-01-08 2019-01-08 答题评分方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109815491B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362601A (zh) * 2019-06-19 2019-10-22 平安国际智慧城市科技股份有限公司 元数据标准的映射方法、装置、设备及存储介质
CN110427972A (zh) * 2019-07-09 2019-11-08 众安信息技术服务有限公司 证件视频特征提取方法、装置、计算机设备和存储介质
CN110674276A (zh) * 2019-09-23 2020-01-10 深圳前海微众银行股份有限公司 机器人自学习方法、机器人终端、装置及可读存储介质
CN111324692A (zh) * 2020-01-16 2020-06-23 深圳市芥菜种科技有限公司 基于人工智能的主观题自动评分方法和装置
CN112085629A (zh) * 2020-08-30 2020-12-15 高岩峰 一种诊断及补偿训练的智能系统
CN112164262A (zh) * 2020-11-09 2021-01-01 河南环球优路教育科技有限公司 一种智能阅卷辅导系统
CN112686020A (zh) * 2020-12-29 2021-04-20 科大讯飞股份有限公司 作文评分方法、装置、电子设备及存储介质
CN113535913A (zh) * 2021-06-02 2021-10-22 科大讯飞股份有限公司 回答评分方法及装置和电子设备、存储介质
CN113850235A (zh) * 2021-11-26 2021-12-28 北京世纪好未来教育科技有限公司 一种文本处理方法、装置、设备及介质
CN114971425A (zh) * 2022-07-27 2022-08-30 深圳市必提教育科技有限公司 数据库信息监控方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273861A (zh) * 2017-06-20 2017-10-20 广东小天才科技有限公司 一种主观题阅卷评分方法、装置及终端设备
CN107967318A (zh) * 2017-11-23 2018-04-27 北京师范大学 一种采用lstm神经网络的中文短文本主观题自动评分方法和系统
CN109101518A (zh) * 2018-05-21 2018-12-28 全球能源互联网研究院有限公司 语音转录文本质量评估方法、装置、终端及可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273861A (zh) * 2017-06-20 2017-10-20 广东小天才科技有限公司 一种主观题阅卷评分方法、装置及终端设备
CN107967318A (zh) * 2017-11-23 2018-04-27 北京师范大学 一种采用lstm神经网络的中文短文本主观题自动评分方法和系统
CN109101518A (zh) * 2018-05-21 2018-12-28 全球能源互联网研究院有限公司 语音转录文本质量评估方法、装置、终端及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李艳玲等: "多特征融合的英语口语考试自动评分系统的研究", 《电子与信息学报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362601A (zh) * 2019-06-19 2019-10-22 平安国际智慧城市科技股份有限公司 元数据标准的映射方法、装置、设备及存储介质
CN110427972B (zh) * 2019-07-09 2022-02-22 众安信息技术服务有限公司 证件视频特征提取方法、装置、计算机设备和存储介质
CN110427972A (zh) * 2019-07-09 2019-11-08 众安信息技术服务有限公司 证件视频特征提取方法、装置、计算机设备和存储介质
CN110674276A (zh) * 2019-09-23 2020-01-10 深圳前海微众银行股份有限公司 机器人自学习方法、机器人终端、装置及可读存储介质
CN111324692A (zh) * 2020-01-16 2020-06-23 深圳市芥菜种科技有限公司 基于人工智能的主观题自动评分方法和装置
CN112085629A (zh) * 2020-08-30 2020-12-15 高岩峰 一种诊断及补偿训练的智能系统
CN112164262A (zh) * 2020-11-09 2021-01-01 河南环球优路教育科技有限公司 一种智能阅卷辅导系统
CN112686020A (zh) * 2020-12-29 2021-04-20 科大讯飞股份有限公司 作文评分方法、装置、电子设备及存储介质
CN112686020B (zh) * 2020-12-29 2024-06-04 科大讯飞股份有限公司 作文评分方法、装置、电子设备及存储介质
CN113535913A (zh) * 2021-06-02 2021-10-22 科大讯飞股份有限公司 回答评分方法及装置和电子设备、存储介质
CN113535913B (zh) * 2021-06-02 2023-12-01 科大讯飞股份有限公司 回答评分方法及装置和电子设备、存储介质
CN113850235A (zh) * 2021-11-26 2021-12-28 北京世纪好未来教育科技有限公司 一种文本处理方法、装置、设备及介质
CN113850235B (zh) * 2021-11-26 2022-03-04 北京世纪好未来教育科技有限公司 一种文本处理方法、装置、设备及介质
CN114971425A (zh) * 2022-07-27 2022-08-30 深圳市必提教育科技有限公司 数据库信息监控方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109815491B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN109815491A (zh) 答题评分方法、装置、计算机设备及存储介质
CN109359215B (zh) 视频智能推送方法和系统
CN106503255B (zh) 基于描述文本自动生成文章的方法及系统
CN110427463B (zh) 搜索语句响应方法、装置及服务器和存储介质
Guest et al. Applied thematic analysis
CN110188168A (zh) 语义关系识别方法和装置
CN112650840A (zh) 一种基于知识图谱推理的医疗智能问答处理方法及系统
CN107818164A (zh) 一种智能问答方法及其系统
CN107291694B (zh) 一种自动评阅作文的方法和装置、存储介质及终端
KR20050036541A (ko) 백과사전 질의응답 시스템의 지식베이스 반자동 구축 방법
CN109101493A (zh) 一种基于对话机器人的智能购房助手
CN113157885B (zh) 一种面向人工智能领域知识的高效智能问答系统
CN105528437A (zh) 一种基于结构化文本知识提取的问答系统构建方法
CN111309891B (zh) 一种阅读机器人进行自动问答的系统及其应用方法
CN107092605A (zh) 一种实体链接方法及装置
Majumder et al. Automatic selection of informative sentences: The sentences that can generate multiple choice questions
Ortiz-Zambranoa et al. Overview of alexs 2020: First workshop on lexical analysis at sepln
KR102148867B1 (ko) 노래와 그리기를 연계한 교육 서비스 제공 시스템
CN112949293B (zh) 一种相似文本生成方法、相似文本生成装置及智能设备
Chang et al. Automated Chinese essay scoring based on multilevel linguistic features
Feng et al. Design and implementation of automatic question answering system in information retrieval
CN111813919B (zh) 一种基于句法分析与关键词检测的mooc课程评价方法
Huang et al. A robust estimation scheme of reading difficulty for second language learners
CN110059318A (zh) 基于维基百科与WordNet的论述题自动评卷方法
Mitchell Class-based ordering of prenominal modifiers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant