CN109993387A - 一种基于nlp的自动评分方法及装置、考试系统 - Google Patents
一种基于nlp的自动评分方法及装置、考试系统 Download PDFInfo
- Publication number
- CN109993387A CN109993387A CN201711488675.5A CN201711488675A CN109993387A CN 109993387 A CN109993387 A CN 109993387A CN 201711488675 A CN201711488675 A CN 201711488675A CN 109993387 A CN109993387 A CN 109993387A
- Authority
- CN
- China
- Prior art keywords
- answer
- space vector
- word segmentation
- examinee
- automatic scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013077 scoring method Methods 0.000 title claims abstract description 22
- 239000013598 vector Substances 0.000 claims abstract description 144
- 230000011218 segmentation Effects 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000004590 computer program Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 abstract description 24
- 238000003058 natural language processing Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- SBNFWQZLDJGRLK-UHFFFAOYSA-N phenothrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 SBNFWQZLDJGRLK-UHFFFAOYSA-N 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Educational Technology (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明适用于教学考试技术领域,提供了一种基于NLP的自动评分方法及装置、考试系统,所述自动评分方法包括:对考生的答案进行分词处理,得到分词结果;基于所述分词结果获取对应的空间向量;将所获取的空间向量及标准答案对应的空间向量进行比对,获得比对结果;自动基于所述比对结果对所述考生的答案进行评分。通过上述方法能够实现自动评分目的,无需人工打分,提高效率。
Description
技术领域
本发明属于教学考试技术领域,尤其涉及一种基于NLP的自动评分方法及装置、考试系统。
背景技术
目前,在现有考试形式中,考卷中主观题(如论述题等)占一定比例。对主观题答案的评定判分将直接影响到考卷最终得分,因此,要求对主观题的评分过程具有较为合理的规范约束。人工阅卷评分方式易受到多因素干扰,使评分结果带有一定主观性,因此人工评分的效率较低,时间成本较高。
发明内容
有鉴于此,本发明实施例提供了一种基于NLP的自动评分方法及装置、考试系统,以解决现有技术需要人工阅卷评分导致效率较低的问题。
本发明实施例的第一方面提供了一种基于NLP的自动评分方法,包括:
对考生的答案进行分词处理,得到分词结果;
基于所述分词结果获取对应的空间向量;
将所获取的空间向量与标准答案对应的空间向量进行比对,获得比对结果;
自动基于所述比对结果对所述考生的答案进行评分。
本发明实施例的第二方面提供了一种自动生成快捷回复的装置,包括:
分词模块,用于对考生的答案进行分词处理,得到分词结果;
获取模块,用于基于所述分词结果获取对应的空间向量;
比对模块,用于将所获取的空间向量与标准答案对应的空间向量进行比对,获得比对结果;
评分模块,用于基于所述比对结果对所述考生的答案进行评分。
本发明实施例的第三方面提供了一种考试系统,所述考试系统包括基于NLP的自动评分装置,所述自动评分装置包括:
分词模块,用于对考生的答案进行分词处理,得到分词结果;
获取模块,用于基于所述分词结果获取对应的空间向量;
比对模块,用于将所获取的空间向量与标准答案对应的空间向量进行比对,获得比对结果;
评分模块,用于基于所述比对结果对所述考生的答案进行评分。
本发明实施例的第四方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如一种基于NLP的自动评分方法任一项所述方法的步骤。
本发明实施例的第五方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如一种基于NLP的自动评分方法任一项所述方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:
对考生的答案进行分词,转为空间向量后计算其与标准答案的距离来进行评分,实现自动评分目的,无需人工打分,提高效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于NLP的自动评分方法的流程图;
图2是本发明实施例提供的一种基于NLP的自动评分方法的步骤S2的具体流程图;
图3是本发明实施例提供的一种基于NLP的自动评分方法的步骤S3的具体流程图;
图4是本发明实施例提供的一种基于NLP的自动评分装置的结构示意图;
图5是本发明实施例提供的一种考试系统的结构示意图;
图6是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的一种基于NLP的自动评分方法的流程图,详述如下:
步骤S1,对考生的答案进行分词处理,得到分词结果;
具体地,分析考试作答的答案,对作答的答案进行分词处理,例如该答案为一个句子,基于NLP(自然语言处理)及语言模型对该答案进行分词处理,得到分词结果,进一步地,对分词结果进行筛选,去除无意义词汇,如“的”。该语言模型预先通过大量的语言进行机器学习得到,需要说明的是,该语言模型还可以是综合LSTM及CNN模型的结构,可提高评分过程中的语言识别精确度及提高评分结果的准确性。
步骤S2,基于分词结果获取对应的空间向量;
具体地,将分词结果转为对应的空间向量。
步骤S3,将所获取的空间向量与标准答案对应的空间向量进行比对,获得比对结果;
具体地,将所获取的空间向量与标准答案对应的空间向量进行比对,即计算所获取的空间向量与标准答案对应的空间向量之间的差值(距离),根据计算结果来进行评分。
步骤S4,自动基于比对结果对考生的答案进行评分;
具体地,自动根据比对结果来进行评分,进一步地,根据预设评分标准来进行评分,该预设评分标准设置了比对结果与分数之间的对应关系,基于该预设评分标准及比对结果来进行评分,例如,平均距离<0.1,给出满分,或者距离<0.05,给出满分;平均距离<0.12,给出90分等,该预设评分标准可根据实际情况而设,例如可根据题目的难易程度来设置,此处对此不作限制,可体现不同评分人的评分风格和“宽松”程度,提高人性化。
在本实施例的一个优选方案中,该步骤S1之前,还包括:
形成语言模型及词向量库;具体地,收集语料,形成语料库;对语料库进行预处理,对预处理后的语料库进行NLP自然语言处理模型训练,得到对应的语言模型及词向量库。
在本实施例的一个优选方案中,该步骤S1之前,还可包括:
获取标准答案;
将标准答案输入上述语料库对标准答案进行分词处理,得到标准答案的分词结果;
将分词结果输入上述词向量库中,获得对应的词向量;
将标准答案的词向量转为空间向量,得到标准答案的空间向量。
需要说明的是,标准答案的空间向量的获取过程与考生的作答答案的空间向量的获取过程基本一致。
本实施例中,对考生的答案进行分词,转为空间向量后计算其与标准答案的距离来进行评分,实现自动评分目的,无需人工打分,提高效率。
在本实施例的一个优选方案中,如图2所示,为本发明实施例提供的一种基于NLP的自动评分方法的步骤S2的具体流程图,该步骤S2具体包括:
步骤S21,将分词结果转为对应的词向量;
具体地,词向量即是使用一个向量来标示一个词,预先设置一词向量库,该词向量库存储有海量的词及对应的向量。基于前述分词处理后得到两个以上分词,将两个以上分词到词向量库中进行匹配,优选地,通过查字典的方式得到对应的词向量。
步骤S22,将词向量转为空间向量序列;
具体地,将考试作答的答案对应的词向量转为空间向量序列。
在本实施例的一个优选方案中,按照每个分词出现的顺序来将词向量拼接成空间向量序列,例如:如包括10个词的句子可由10个64维的词向量拼接成640维空间向量序列,若该答案包含10句话,则再按照句子顺序逐句拼接各个句子的空间向量序列,最后生成答案向量序列;如包含10句话,平均每句话包含10个词的答案,最终形成一个6400维的空间向量。
在本实施例的一个优选方案中,如图3所示,为本发明实施例提供的一种基于NLP的自动评分方法的步骤S3的具体流程图,该步骤S3具体包括:
步骤S31,计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值;
具体地,计算考生作答的答案对应的空间向量与标准答案对应的空间向量在每一维度的差值,进一步地,在每一维度上分别计算计算考生作答的答案对应的空间向量与标准答案对应的空间向量之间的差值。
在本实施例的一个优选方案中,可采用整体计算规则来计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值;
具体地,由于考生作答的答案与标准答案的长度在通常情况下是不一致的,该整体计算规则是以前述两答案的空间向量序列中最长的答案为标准,短的另一个做居中处理,然后向两边补零得到相同长度的序列,例如:最长空间向量序列对应的答案是五维向量[0.787,-0.102,0.202,,0.543,-0.897],而另一个答案是三维向量[-0.201,0.302,0.643],则将该三维向量补充成与最长空间向量序列对应的答案的向量维数相同,得到[0.00,-0.201,0.302,0.643,0.00],然后分别计算五维向量[0.787,-0.102,0.202,,0.543,-0.897]与五维向量[0.00,-0.201,0.302,0.643,0.00]在各个维度上的距离差,得到对应维度的差值。需要说明的是,计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值采用的手段是一样的。
在本实施例的另一个优选方案中,可采用分句计算规则来计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值;
具体地,分句计算规则是以标准答案为标准,计算标准答案的每一句话分别与作答答案中的每一句话之间的在不同维度的差值,计算所述差值可采用前述的整体计算规则来进行。然后通过均值法获得标准答案的每一句话分别与作答答案中的每一句话之间的距离,因此标准答案的一句话与作答答案的每一句话有不同的距离,选取距离最小的作答答案中的该句话作为标准答案中的一句话的作答答案,于是得到标准答案的每一句话与作答答案的对应的一句话之间的距离值,例如,标准答案有三句话(A,B,C),作答答案有三句话(1,2,3),对于标准答案A,通过上述方案获得A1、A2、A3之间的距离,而前述三个距离大小不一致,此时选距离最小的(例如A1之间距离最小),则选择1作为标准答案中的A作为作答答案。同理,根据上述步骤得到标准答案的BC与作答答案之间的距离:B2、C3(假设ABC正好对应123时的距离值最小)。然后基于标准答案的每一句话与作答答案的对应的一句话之间的距离值获得标准答案与作答答案之间的距离。
进一步地,可采用均值法获取标准答案与作答答案之间的距离(即将每一距离值求和然后求平均值),获得采用加权均值法,例如:如标准答案是“x1,x2,x3”(x对应标准答案的句子),答出x1,得4分,答出x2,得2分,答出x3,得2分是一个得分点不一致的标准答案,答出x1,得两分,答出x2,得两分,答出x3,得2分是得分点一致的标准答案(无规定只有总分值也是得分点一致的标准答案),对于得分点一致的直接做均值处理得到“分句计算”最终距离,对于得分点不一致的做加权均值处理,例如基于上述例子,采用均值加权值处理时,答出x1,得四分,则x1对应的该句作答答案的加权值为4/(4+2+2)=为0.5,则先为x1的距离乘以其权值,同理得到x2、x3、x4对应的加权值,x2的距离乘以其权值,x3的距离乘以其权值,再做均值处理得到最终“分句计算”距离结果。
步骤S32,基于每一空间维度的差值获取考生答案与标准答案之间的空间距离;
具体地,基于每一空间维度的差值获取考生答案与标准答案之间的空间距离,优选地,可基于每一空间维度的差值获取差值平均值,得到平均距离,即为前述空间距离。
本实施例中,对考生的答案进行分词,转为空间向量后计算其与标准答案的距离来进行评分,实现自动评分目的,无需人工打分,提高效率。
图4示出了本发明实施例提供的一种基于NLP的自动评分装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。该自动评分装置包括:分词模块1、与分词模块1连接的获取模块2、与获取模块2连接的比对模块3、与比对模块3连接的评分模块4,其中:
分词模块1,用于对考生的答案进行分词处理,得到分词结果;
具体地,分析考试作答的答案,对作答的答案进行分词处理,例如该答案为一个句子,则NLP及语言模型对该答案进行分词处理,得到分词结果,进一步地,对分词结果进行筛选,去除无意义词汇,如“的”。该语言模型预先通过大量的语言进行机器学习得到,需要说明的是,该语言模型还可以是综合LSTM及CNN模型的结构,可提高评分过程中的语言识别精确度及提高评分结果的准确性。
获取模块2,用于基于分词结果获取对应的空间向量;
具体地,将分词结果转为对应的空间向量。
比对模块3,用于将所获取的空间向量及标准答案对应的空间向量进行比对,获得比对结果;
具体地,将所获取的空间向量及标准答案对应的空间向量进行比对,即计算所获取的空间向量及标准答案对应的空间向量之间的差值(距离),根据计算结果来进行评分。
评分模块4,用于自动基于比对结果对考生的答案进行评分;
具体地,自动根据比对结果来进行评分,进一步地,根据预设评分标准来进行评分,该预设评分标准设置了比对结果与分数之间的对应关系,基于该预设评分标准及比对结果来进行评分,例如,平均距离<0.1,给出满分,或者距离<0.05,给出满分;平均距离<0.12,给出90分等,该预设评分标准可根据实际情况而设,例如可根据题目的难易程度来设置,此处对此不作限制,可体现不同评分人的评分风格和“宽松”程度,提高人性化。
在本实施例的一个优选方案中,该装置还包括:
训练模块,用于形成语言模型及词向量库;具体地,收集语料,形成语料库;对语料库进行预处理,对预处理后的语料库进行NLP自然语言处理模型训练,得到对应的语言模型及词向量库。
本实施例中,对考生的答案进行分词,转为空间向量后计算其与标准答案的距离来进行评分,实现自动评分目的,无需人工打分,提高效率。
在本实施例的一个优选方案中,该获取模块2具体包括:第一转化单元、与第一转化单元连接的第二转化单元,其中:
第一转化单元,用于将分词结果转为对应的词向量;
具体地,词向量即是使用一个向量来标示一个词,预先设置一词向量库,该词向量库存储有海量的词及对应的向量。基于前述分词处理后得到两个以上分词,将两个以上分词到词向量库中进行匹配,优选地,通过查字典的方式得到对应的词向量。
第二转化单元,用于将词向量转为空间向量序列;
具体地,将考试作答的答案对应的词向量转为空间向量序列。
在本实施例的一个优选方案中,按照每个分词出现的顺序来将词向量拼接成空间向量序列,例如:如包括10个词的句子可由10个64维的词向量拼接成640维空间向量序列,若该答案包含10句话,则再按照句子顺序逐句拼接各个句子的空间向量序列,最后生成答案向量序列;如包含10句话,平均每句话包含10个词的答案,最终形成一个6400维的空间向量。
在本实施例的一个优选方案中,该比对模块3具体包括:计算单元及与其连接的获取单元,其中:
计算单元,用于计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值;
具体地,计算考生作答的答案对应的空间向量与标准答案对应的空间向量在每一维度的差值,进一步地,在每一维度上分别计算计算考生作答的答案对应的空间向量与标准答案对应的空间向量之间的差值。
在本实施例的一个优选方案中,可采用整体计算规则来计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值;
具体地,由于考生作答的答案与标准答案的长度在通常情况下是不一致的,该整体计算规则是以前述两答案的空间向量序列中最长的答案为标准,短的另一个做居中处理,然后向两边补零得到相同长度的序列,例如:最长空间向量序列对应的答案是五维向量[0.787,-0.102,0.202,0.543,-0.897],而另一个答案是三维向量[-0.201,0.302,0.643],则将该三维向量补充成与最长空间向量序列对应的答案的向量维数相同,得到[0.00,-0.201,0.302,0.643,0.00],然后分别计算五维向量[0.787,-0.102,0.202,0.543,-0.897]与五维向量[0.00,-0.201,0.302,0.643,0.00]在各个维度上的距离差,得到对应维度的差值。需要说明的是,计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值采用的手段是一样的。
在本实施例的另一个优选方案中,可采用分句计算规则来计算所获取空间向量与标准答案对应的空间向量之间在每一个空间维度的差值;
具体地,分句计算规则是以标准答案为标准,计算标准答案的每一句话分别与作答答案中的每一句话之间的在不同维度的差值,计算所述差值可采用前述的整体计算规则来进行。然后通过均值法获得标准答案的每一句话分别与作答答案中的每一句话之间的距离,因此标准答案的一句话与作答答案的每一句话有不同的距离,选取距离最小的作答答案中的该句话作为标准答案中的一句话的作答答案,于是得到标准答案的每一句话与作答答案的对应的一句话之间的距离值,例如,标准答案有三句话(A,B,C),作答答案有三句话(1,2,3),对于标准答案A,通过上述方案获得A1、A2、A3之间的距离,而前述三个距离大小不一致,此时选距离最小的(例如A1之间距离最小),则选择1作为标准答案中的A作为作答答案。同理,根据上述步骤得到标准答案的BC与作答答案之间的距离:B2、C3(假设ABC正好对应123时的距离值最小)。
然后基于标准答案的每一句话与作答答案的对应的一句话之间的距离值获得标准答案与作答答案之间的距离。进一步地,可采用均值法获取标准答案与作答答案之间的距离(即将每一距离值求和然后求平均值),获得采用加权均值法,例如:如标准答案是“x1,x2,x3”(x对应标准答案的句子),答出x1,得4分,答出x2,得2分,答出x3,得2分是一个得分点不一致的标准答案,答出x1,得两分,答出x2,得两分,答出x3,得2分是得分点一致的标准答案(无规定只有总分值也是得分点一致的标准答案),对于得分点一致的直接做均值处理得到“分句计算”最终距离,对于得分点不一致的做加权均值处理,例如基于上述例子,采用均值加权值处理时,答出x1,得四分,则x1对应的该句作答答案的加权值为4/(4+2+2)=为0.5,则先为x1的距离乘以其权值,同理得到x2、x3、x4对应的加权值,x2的距离乘以其权值,x3的距离乘以其权值,再做均值处理得到最终“分句计算”距离结果。
获取单元,用于基于每一空间维度的差值获取考生答案与标准答案之间的空间距离;
具体地,基于每一空间维度的差值获取考生答案与标准答案之间的空间距离,优选地,可基于每一空间维度的差值获取差值平均值,得到平均距离,即为前述空间距离。
本实施例中,对考生的答案进行分词,转为空间向量后计算其与标准答案的距离来进行评分,实现自动评分目的,无需人工打分,提高效率。
本发明还提出一种考试系统(见图5),该考试系统包括:作答模块、语言处理模块(包括一种以上训练模型、词向量库)、语料库、还包括如上述实施例所述的基于NLP的自动评分装置,该基于NLP的自动评分装置的具体结构及工作原理可参考上述实施例的描述,此处不再赘述。
图6是本发明实施例提供的终端设备的示意图。如图6所示,该实施例的终端设备6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62。所述处理器60执行所述计算机程序62时实现上述各个自动生成快捷回复的方法实施例中的步骤,例如图1所示的步骤S1至步骤S4。或者,所述处理器60执行所述计算机程序2时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块1至4的功能。
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端设备6中的执行过程。例如,所述计算机程序62可以被分割成分词模块、获取模块、比对模块及评分模块等;
分词模块,用于对考生的答案进行分词处理,得到分词结果;
获取模块,用于基于分词结果获取对应的空间向量;
比对模块,用于将所获取的空间向量及标准答案对应的空间向量进行比对,获得比对结果;
评分模块,用于自动基于比对结果对考生的答案进行评分;
所述终端设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端设备6的示例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备5的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于NLP的自动评分方法,其特征在于,包括:
对考生的答案进行分词处理,得到分词结果;
基于所述分词结果获取对应的空间向量;
将所获取的空间向量与标准答案对应的空间向量进行比对,获得比对结果;
自动基于所述比对结果对所述考生的答案进行评分。
2.如权利要求1所述的自动评分方法,其特征在于,所述基于所述分词结果获取对应的空间向量具体包括:
将所述分词结果转为对应的词向量;
将所述词向量转为空间向量序列。
3.如权利要求2所述的自动评分方法,其特征在于,所述分词结果包括两个以上分词,将所述分词结果转为对应的词向量具体为:
在预设的词向量库中,通过查字典方式获取所述分词结果对应的词向量,每一所述分词对应一词向量。
4.如权利要求1所述的自动评分方法,其特征在于,所述将所获取的空间向量与标准答案对应的空间向量进行比对,获得比对结果具体包括:
计算所获取空间向量与所述标准答案对应的空间向量之间在每一个空间维度的差值;
基于每一空间维度的差值获取所述考生答案与标准答案之间的空间距离。
5.如权利要求4所述的自动评分方法,其特征在于,所述基于每一空间维度的差值获取所述考生答案与标准答案之间的空间距离具体为:
基于每一空间维度的差值获取差值平均值,得到平均距离。
6.如权利要求5所述的自动评分方法,其特征在于,所述基于所述比对结果对所述考生的答案进行评分具体为:
基于所述平均距离及预设评分标准对所述考生的答案进行评分。
7.一种基于NLP的自动评分装置,其特征在于,包括:
分词模块,用于对考生的答案进行分词处理,得到分词结果;
获取模块,用于基于所述分词结果获取对应的空间向量;
比对模块,用于将所获取的空间向量与标准答案对应的空间向量进行比对,获得比对结果;
评分模块,用于基于所述比对结果对所述考生的答案进行评分。
8.一种考试系统,其特征在于,包括如权利要求7所述的一种基于NLP的自动评分装置。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述自动评分方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述自动评分方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711488675.5A CN109993387A (zh) | 2017-12-29 | 2017-12-29 | 一种基于nlp的自动评分方法及装置、考试系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711488675.5A CN109993387A (zh) | 2017-12-29 | 2017-12-29 | 一种基于nlp的自动评分方法及装置、考试系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109993387A true CN109993387A (zh) | 2019-07-09 |
Family
ID=67109987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711488675.5A Pending CN109993387A (zh) | 2017-12-29 | 2017-12-29 | 一种基于nlp的自动评分方法及装置、考试系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993387A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413741A (zh) * | 2019-08-07 | 2019-11-05 | 山东山大鸥玛软件股份有限公司 | 一种面向主观题的智能阅卷方法 |
CN110413961A (zh) * | 2019-06-21 | 2019-11-05 | 平安国际智慧城市科技股份有限公司 | 基于分类模型进行文本评分的方法、装置和计算机设备 |
CN110852653A (zh) * | 2019-11-22 | 2020-02-28 | 成都国腾实业集团有限公司 | 一种应用于计算机编程题的自动评分系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850537A (zh) * | 2014-02-17 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 对文本内容进行筛选的方法及装置 |
CN106940788A (zh) * | 2017-03-07 | 2017-07-11 | 百度在线网络技术(北京)有限公司 | 智能评分方法及装置、计算机设备及计算机可读介质 |
CN107273861A (zh) * | 2017-06-20 | 2017-10-20 | 广东小天才科技有限公司 | 一种主观题阅卷评分方法、装置及终端设备 |
-
2017
- 2017-12-29 CN CN201711488675.5A patent/CN109993387A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850537A (zh) * | 2014-02-17 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 对文本内容进行筛选的方法及装置 |
CN106940788A (zh) * | 2017-03-07 | 2017-07-11 | 百度在线网络技术(北京)有限公司 | 智能评分方法及装置、计算机设备及计算机可读介质 |
CN107273861A (zh) * | 2017-06-20 | 2017-10-20 | 广东小天才科技有限公司 | 一种主观题阅卷评分方法、装置及终端设备 |
Non-Patent Citations (2)
Title |
---|
张均胜等: ""一种基于短文本相似度计算的主观题自动阅卷方法"", 《图书情报工作》 * |
赵志弘等: ""基于NLP-TF技术的主观题自动评测系统研究"", 《软件导刊》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413961A (zh) * | 2019-06-21 | 2019-11-05 | 平安国际智慧城市科技股份有限公司 | 基于分类模型进行文本评分的方法、装置和计算机设备 |
CN110413741A (zh) * | 2019-08-07 | 2019-11-05 | 山东山大鸥玛软件股份有限公司 | 一种面向主观题的智能阅卷方法 |
CN110413741B (zh) * | 2019-08-07 | 2022-04-05 | 山东山大鸥玛软件股份有限公司 | 一种面向主观题的智能阅卷方法 |
CN110852653A (zh) * | 2019-11-22 | 2020-02-28 | 成都国腾实业集团有限公司 | 一种应用于计算机编程题的自动评分系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107103113B (zh) | 面向神经网络处理器的自动化设计方法、装置及优化方法 | |
CN109300107A (zh) | 磁共振血管壁成像的斑块处理方法、装置和计算设备 | |
CN110046698A (zh) | 异质图神经网络生成方法、装置、电子设备及存储介质 | |
CN111275007B (zh) | 基于多尺度信息融合的轴承故障诊断方法及系统 | |
CN110610052B (zh) | Pcb自动布线系统及方法 | |
CN107239443A (zh) | 一种词向量学习模型的训练方法及服务器 | |
CN107273861A (zh) | 一种主观题阅卷评分方法、装置及终端设备 | |
CN107835496A (zh) | 一种垃圾短信的识别方法、装置和服务器 | |
CN107220505A (zh) | 儿童发育能力评估方法及装置 | |
CN109993387A (zh) | 一种基于nlp的自动评分方法及装置、考试系统 | |
CN113590776B (zh) | 基于知识图谱的文本处理方法、装置、电子设备及介质 | |
CN107958285A (zh) | 面向嵌入式系统的神经网络的映射方法及装置 | |
CN110147926A (zh) | 一种业务类型的风险等级计算方法、存储介质及终端设备 | |
CN110222330A (zh) | 语义识别方法及装置、存储介质、计算机设备 | |
CN108509923A (zh) | 课堂注意力检测方法、装置、设备及计算机可读介质 | |
CN106778910A (zh) | 基于本地训练的深度学习系统和方法 | |
CN106997373A (zh) | 一种基于深度置信网络的链路预测方法 | |
CN110532314A (zh) | 高压电器质量检测的方法及终端设备 | |
CN110517077A (zh) | 基于属性距离的商品相似度分析方法、装置及存储介质 | |
CN109992781A (zh) | 文本特征的处理、装置、存储介质和处理器 | |
CN115859128A (zh) | 一种基于档案数据交互相似度的分析方法和系统 | |
CN110046344A (zh) | 添加分隔符的方法及终端设备 | |
CN110162769A (zh) | 文本主题输出方法和装置、存储介质及电子装置 | |
CN112131587A (zh) | 一种智能合约伪随机数安全检验方法、系统、介质和装置 | |
CN109934350A (zh) | 数学题目一题多解实现方法、装置及平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190709 |
|
RJ01 | Rejection of invention patent application after publication |