CN113407675A - 教育题目自动批改方法、装置和电子设备 - Google Patents
教育题目自动批改方法、装置和电子设备 Download PDFInfo
- Publication number
- CN113407675A CN113407675A CN202110707923.0A CN202110707923A CN113407675A CN 113407675 A CN113407675 A CN 113407675A CN 202110707923 A CN202110707923 A CN 202110707923A CN 113407675 A CN113407675 A CN 113407675A
- Authority
- CN
- China
- Prior art keywords
- corrected
- answer
- question
- calculation formula
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000004364 calculation method Methods 0.000 claims abstract description 120
- 238000010801 machine learning Methods 0.000 claims abstract description 42
- 239000013598 vector Substances 0.000 claims abstract description 26
- 238000012937 correction Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 9
- 238000002715 modification method Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 6
- 239000000463 material Substances 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 241000220225 Malus Species 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 11
- 235000021016 apples Nutrition 0.000 description 9
- 125000003118 aryl group Chemical group 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 244000020518 Carthamus tinctorius Species 0.000 description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明属于在线教育技术领域,提供一种教育题目自动批改方法、装置和电子设备,其中方法包括:获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案;将待批改题目的信息进行处理得到该题目的计算公式;根据计算公式和参数计算得到标准答案,判断待批改答案是否准确。本发明通过自动识别并提取题目文本中的关键词,将关键词转换为特征向量输入训练好的机器学习模型,模型输出该题目的计算公式,结合题目中的参数可以计算出标准答案,以此来批改待批改的答案是否正确。应用本方法可以应用系统线上自动批改计算类题目,相较于现有技术批改流程简单,批改效率高,准确率稳定,节约了人力物力和教育资源。
Description
技术领域
本发明属于教育技术领域,特别适用于在线教育,更具体的是涉及一种教育题目自动批改方法、装置、电子设备和计算机可读介质。
背景技术
随着现代信息技术的发展以及教育市场的需求,在线教育作为一种新兴的教育理念,正在被不断推广和普及。在线教学给教师和学生带来了极大的便利,通过在线教育,教师可以在家里进行教学,学生也可以在家里同步进行听课和考试等。目前的在线教学主要基于APP等进行,教师可以在网上布置作业或考试题,学生通过安装有相应教学APP的智能手机等智能终端进行答题。
现有批改题目多数是人工批改,需要消耗大量的人力物力,且随着批改时间的增加,工作人员批改题目的效率和准确率都会下降;即使使用软件自动批改时,也仅仅能批改与题库中参数和文本均相同的题目,若同等语义的题目更换成其他描述方式或更换其中的某个参数,由于题库中没有相同的题目,软件将无法进行批改,需要先将这道题目添加到题库中,因此,如何实现系统自动识别题目和上传的答案,并进行准确地批改成为要解决的技术问题。
发明内容
(一)要解决的技术问题
本发明旨在解决如何控制系统自动准确地批改教育题目,提高效率的技术问题。
(二)技术方案
为解决上述技术问题,本发明的一方面提出一种教育题目自动批改方法,包括:
获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案;
将所述待批改题目的信息进行处理,得到该题目的计算公式;
根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确。
根据本发明的优选实施方式,所述获取待批改题目的信息,进一步包括:
根据预设的关键词库提取所述题干及问题中的关键词;
将所述题干及关键词转化为特征向量。
根据本发明的优选实施方式,所述待批改题目为可通过将参数代入计算公式得到答案的题目,所述题目类型包括:填空题、选择题、计算类应用题。
根据本发明的优选实施方式,所述将所述待批改题目的信息进行处理,得到该题目的计算公式,进一步包括:
根据所述待批改题目的类型调用对应类型的机器学习模型;
将所述特征向量输入所述机器学习模型,输出该题目的计算公式。
根据本发明的优选实施方式,所述根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确,进一步包括:
根据所述待批改题目的类型确定该题目的标准答案类型;
将所述待批改题目中的参数代入所述计算公式计算得到标准答案;
根据所述标准答案类型和所述标准答案,判断所述待批改答案是否准确。
根据本发明的优选实施方式,所述根据所述待批改题目的类型确定该题目的标准答案类型,进一步包括:
当所述待批改题目的类型为填空题或选择题时,判断所述待批改答案的字符长度是否在预定阈值范围内,若不在,则判断该待批改答案错误;
若所述待批改答案的字符长度在预定阈值范围内,判断所述待批改答案中是否包含标准答案,若包含则判断该待批改答案正确,若不包含则判断待批改答案错误。
根据本发明的优选实施方式,所述根据所述标准答案类型和所述标准答案,判断所述待批改答案是否准确,进一步包括:
当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若不包括,则判断该待批改答案错误。
根据本发明的优选实施方式,所述根据所述标准答案类型和所述标准答案,判断所述待批改答案是否准确,进一步包括:
当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若包括,则根据所述标准答案检测所述待批改答案中是否包含正确的计算公式的计算结果:若包含,则判断所述待批改答案正确;若不包含,则判断所述待批改答案错误或部分错误。
根据本发明的优选实施方式,所述方法还包括:
当判断所述待批改答案错误后,自动将标准答案及解析填写在题目的相应位置。
本发明第二方面提出一种教育题目自动批改装置,包括:
题目获取模块,用于获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案;
计算公式生成模块,用于将所述待批改题目的信息进行处理,得到该题目的计算公式;
批改模块,用于根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确。
本发明第三方面提出一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的方法。
本发明第四方面还提出一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的方法。
(三)有益效果
本发明通过自动识别并提取题目文本中的关键词,将题目文本和关键词转换为特征向量输入训练好的机器学习模型,模型输出该题目的计算公式,结合题目中的参数可以计算出标准答案,以此来批改待批改的答案是否正确。应用本方法可以应用系统线上自动批改计算类题目,相较于现有技术批改流程简单,效率大大提高,且准确率稳定,节约了人力物力和教育资源。
附图说明
图1是本发明一个实施例的一种教育题目自动批改方法应用场景示意图;
图2是本发明一个实施例的一种教育题目自动批改方法流程示意图;
图3是本发明一个实施例的一种教育题目输入机器学习模型后自动生成计算公式的界面示意图;
图4是本发明一个实施例的一种教育题目自动批改装置示意图;
图5是本发明的一个实施例的电子设备的结构示意图;
图6是本发明的一个实施例的计算机可读记录介质的示意图。
具体实施方式
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
为解决上述技术问题,本发明提出一种教育题目自动批改方法,本发明实施例中的教育题目主要以小学的数学计算类题目为主来说明,包括数字类的加减乘除运算,通过将大量的计算类题目和计算对应的公式作为样本输入机器学习模型进行训练,训练得到的机器学习模型可以用于自动生成题目对应的计算公式,最后根据得到的公式和题目中的参数计算出正确答案,并与待批改的答案进行对比,便可实现对题目的自动批改,批改效率大大提高。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
图1是本发明一个实施例的一种教育题目自动批改方法应用场景示意图。如图1所示,用户通过手机或电脑等电子设备上传包含待批改教育题目的图片,客户端接收图片后将该图片发送到后台服务器,服务器通过对图片进行处理,识别图片中题目的文本信息,并将文本信息输入训练好的机器学习模型,得到该题目的计算公式及答案,并与用户待批改的答案进行比较,判断待批改答案是否准确,将反馈结果通过客户端发送给用户。
图2是本发明一个是实施例的一种教育题目自动批改方法流程示意图。
如图2所示,本方法包括:
S101、获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案。
具体来说,当用户做完题目后,将题目通过客户端上传到服务器,可以将纸质版题目拍照进行上传,也可以上传包含电子版题目的图片,服务器接收后,利用OCR技术识别上传的题目和待批改的答案的文本信息,文本信息包括题目类型、题干、参数及待批改答案,本发明实施例中的待批改题目主要为简单的数字计算类题目,例如1000以内的加减乘除法,题目类型包括填空题、选择题及计算类应用题,也可以包括判断题,其中,填空题和选择题也可以作为不需要解题步骤的应用题,所有题目均可以通过计算公式计算后得到答案。
利用OCR技术识别出图片中的文本信息后,以行为单位,将整个图片中的文本信息分成多个行结构,然后将这些行结构进行拼接,根据拼接后的文本的语义判断其中哪些行结构属于同一道题目,并将每道题目在图中的位置以坐标的形式标记出来,其中题干和问题的文本信息为打印字体,待批改答案的文本信息为手写字体,OCR技术可以根据不同的字体来识别出哪部分是题干,哪部分是待批改答案,最后从每道题目中识别手写体的待批改答案,将题目中手写体前后的文本信息输入训练好的模型,由于每道题目中的每个字均有坐标位置,所以可以确定每道题中手写体的坐标位置,并识别出手写体的待批改答案的文本信息。
识别出题目和带批改答案的文本信息后,提取题目文本中的关键词,可以根据历史题目确定关键词,将所有的关键词保存在关键词库中,将待批改题目中命中关键词库中的词作为关键词,例如题目:一个长为3米,宽为2米的矩形,面积是多少平方米?本题中的关键词有长、宽、米、矩形、面积、平方米,同时还会识别出题目中的参数3和2。
将题目文本及提取的关键词转化为特征向量,对于对题目文本的向量化,可以使用神经网络模型进行训练,对样本题目进行标注处理,标注每个样本题目的文本内容,利用神经网络模型对标注的文本内容进行二维特征向量提取,从而训练得到向量化的模型,其中,具体的训练过程处于现有技术,在此不再赘述。
将题目文本的关键词转化的特征向量包括一个由0和1组成的mask序列,该mask序列长度与题目文本转化的特征向量长度相同,该序列用于标记题目文本转化的特征向量中的关键词位置,例如一个题目文本转化的mask序列为0011001100,其中0表示题目文本中不重要的字,1表示题目文本中的关键字,将特征向量及mask序列作为后续机器学习模型的输入。
S102、将所述待批改题目的信息进行处理,得到该题目的计算公式。
具体来说,将上述实施例中得到的特征向量输入训练好的机器学习模型,输出对应的计算公式。在将特征向量输入机器学习模型之前,首先对机器学习模型进行训练。
本发明中的实施例通过将题库中符合计算类条件的题目作为训练样本,从每道题目中提取对应的计算公式作为训练标签,该计算公式表示参数间的计算关系,将上述实施例中样本题目文本转化的特征向量、关键词转化的特征向量中的mask序列及对应的计算公式输入机器学习模型,直到输出的计算公式与题目作为标签的计算公式相同,便可得到训练好的机器学习模型。
例如题目:现有27个苹果,平均分给9个小朋友,每个小朋友会分到几个苹果?提取该题目中的公式27/9作为标签,并将题目文本转化为特征向量,并将题目文本中的关键词苹果、个、平均、分、小朋友、每个、几个,关键词转化为特征向量中的mask序列,将特征向量、mask序列和参数27、9一同输入机器学习模型,模型会自动识别出这些特征向量及其中的关键词的属性,例如“苹果”、“小朋友”为名词,“个”为单位,“每”为量词,“分”为动词,“27”和“9”为参数等,此时机器学习模型中会输出加、减、乘、除四种运算,根据预设的规则得到27+9、27-9、27*9、27/9四个计算公式,模型根据题目文本的语义计算每个计算公式输出的概率,并不断地调整模型的参数,直到输出概率最高的为27/9,通过大量的题目训练得到最终的机器学习模型。
训练好机器学习模型后,确定待批改题目的题目类型,本发明实施例中的题目类型主要包括计算类的选择题、计算类的填空题和计算类应用题,分别对应不同的机器学习模型,调用对应类型的机器学习模型,将待批改题目的特征向量输入机器学习模型,由于训练模型时样本中出现过与题目相似的文本描述,模型便可得到对应的计算公式,利用公式得出计算结果,然后根据题目的类型给出相应的答案。
本发明实施例所述的方法,适用于任何简单的计算类题目,可根据题目文本和语义生成对应的计算公式,然后根据计算公式计算得到结果。尤其适用于题目文本或语义不同但计算公式相同的题目,例如题目一:小红有28个苹果,小明有15个苹果,问小红比小明多几个苹果,题库中给出的计算公式为28-15;但如果有题目二:为小芳有15个小红花,小刚有28个小红花,问小芳比小刚少几个小红花,此时在题库中无法匹配到与之题目文本或语义相同的题目,传统方法无法给出相应的公式。使用本发明实施例中的方法,由于在训练模型时将题目一作为训练样本训练过该模型,所以将题目二输入该模型时,即使题目文本或语义不同,模型仍然可以输出计算公式28-15,相较于现有技术更灵活,批改效率更高。
优选的,可以对一定时间段内所有生成的计算公式进行统计,统计相同的计算公式的数量,将其中数量较多的计算公式作为热门计算公式,根据热门计算公式生成对应的公式模板,当后续识别到相同文本的题目时,直接调用对应的公式模板输出计算公式。
本发明实施例中的机器学习模型包括但不限于神经网络模型。
通过机器学习模型可以批量快速的得到每个题目的计算公式,提高了批改效率和准确率。
S103、根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确。
具体来说,服务器会根据模型输出的计算公式自动对待批改答案进行批改。首先根据待批改题目的类型确定对应标准答案的类型,例如选择题的标准答案为ABCD等选项,填空题的标准答案为数字或简单的文本,计算类应用题的标准答案包括答案格式、计算步骤、计算公式及计算结果。
在对待批改答案进行批改时,首先判断待批改答案的类型是否与标准答案类型一致,若不一致则无需进一步判断待批改答案是否正确,直接批改该待批改答案错误。
具体的,当所述待批改题目的类型为填空题或选择题时,判断所述待批改答案的字符长度是否在预定阈值范围内,若不在,则判断该待批改答案错误,例如一道填空题目的标准答案为30,当待批改答案为300时,超出了预设的字符长度,直接批改该答案错误。
优选的,还可以检测待批改答案的种类是否与标准答案的种类一致,例如上述实施例中填空题目的标准答案为30,该答案类型为数字,若待批改答案的类型不是数字而是字母,可以直接批改该答案错误。
当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若不包括,则判断该待批改答案错误。
若待批改答案的类型与标准答案类型一致,则进一步判断待批改答案中是否包含标准答案,若包含则判断该待批改答案正确,若不包含则判断待批改答案错误。
具体的,当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若包括,则根据所述标准答案检测所述待批改答案中是否包含正确的计算公式的计算结果:若包含,则判断所述待批改答案正确;若不包含,则判断所述待批改答案错误或部分错误。当所述待批改题目的类型为选择题或填空题时,获取待批改题目需要输入答案的位置坐标,并识别该位置的手写体,将手写体转化为文本信息,并与计算出的答案进行匹配,若匹配成功则判定所述待批改答案正确。
例如上述实施例中的题目:现有27个苹果,平均分给9个小朋友,每个小朋友会分到几个苹果?首先判断该题目的待批改答案中是否包含计算公式“27/9”,其次判断待批改答案中是否包含计算公式对应的结果“3”,并将计算公式与结果用“=”连接得到完整的计算公式,最后判断待批改答案的格式是否准确,例如预设的格式为“答:根据题意得知计算公式为27/9=3,所以每个小朋友会分到3个苹果。”若待批改答案中不包含“答”、完整的计算公式“27/9=3”及“3个苹果”等关键词,则判断待批改答案错误或部分错误,若包含上述全部关键词则判断待批改答案正确。
当上述题目中的参数或题目语义发生变化时,例如将题目中的27和9分别改为24和6,或者将题目改变为:老师有27只铅笔,平均分给9个学生,每个学生会分到几只铅笔?此时通过本发明实施例中的方法同样能得到完整的计算公式和结果24/6=4或27/9=3,不会因为题库中没有相同的题目导致无法批改对应的题目。
图3是本发明一个实施例的一种教育题目输入机器学习模型后自动生成计算公式的界面示意图。如图3所示,将题目输入搜索框后点击搜索,服务器会提取题目文本中的关键词并将关键词输入训练好的机器学习模型,模型根据关键词和之间的语义关系输出的结果显示在下方,其中,entity表示模型从题目中提取出的参数,expression表示模型输出的完整公式,value表示根据模型输出的公式计算出的结果值,expr表示根据参数和完整公示推导出的公式模板,例如将计算公式中的参数以X1、X2等表示,运算符号与计算公式中的相同,将该公式模板存储在服务器中,该公式模板既可以方便后续在遇到相同题目时直接调用模板输出计算公式,也可以对输出的计算公式进行复核。
优选的,在批改完成后系统会将批改完成的题目存入题库中,并对题库中的题目进行分类,将计算公式相同的题目分为一类,便于后续工作人员查找相近的题目,当用户搜索一个题目时,服务器将相同计算公式的其他题目也推荐给用户,用户可以通过练习不同语义相同计算公式的题目来加深对公式的理解,提高学习效率。
通过本发明实施例中的方法进行题目批改,无需题库中匹配相同的题目,只需将题目的文本信息输入训练好的机器学习模型得到题目的计算公式,模型会进一步计算得到答案,同类型的题目即使改变了语义或改变题目中的参数,也能快速得出题目的计算公式和答案,批改流程简单,效率高且准确率稳定。
当判断出某个待批改答案错误后,服务器会自动将标准答案及解析填写在题目的相应位置。例如上述实施例中的27/9=3,若待批改答案中的公式写成了37/9=3,在批改该答案错误后,会在该应用题预设的空白处以红色字体显示出标准答案,并把其中与待批改答案不同的关键词高亮显示,并通过客户端将题目和对照版的答案一同展示给用户。在给用户展示题目和答案的同时,会将题库中具有相同计算公式的一部分近似题目也展示给用户,并引导用户对近似题目进行解答,提高了用户的学习兴趣,便于用户理解和记忆题目原理,提高学习效率。
由于不断将新批改的题目存入了题库中,定期使用题库中相同类型的题目训练对应类型的机器学习模型,对机器学习模型进行更新,以保证模型输出计算公式的准确性。
服务器定期对关键词库中的关键词按照应用的频率进行排序,分别对每种属性的关键词按照应用的频率进行排序,提取每种属性中的应用频率较高的关键词,将这些关键词组合并设置语义生成题目,以此方法可以生成关注度较高的题目。
本发明通过自动识别并提取题目文本中的关键词,将题目文本和关键词转换为特征向量输入训练好的机器学习模型,模型输出该题目的计算公式,结合题目中的参数可以计算出标准答案,以此来批改待批改的答案是否正确。应用本方法可以应用系统线上自动批改计算类题目,相较于现有技术批改流程简单,效率大大提高,且准确率稳定,节约了人力物力和教育资源。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
图4是本发明一个是实施例的一种,如图3所示,该装置200包括:
题目获取模块201,用于获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案;
计算公式生成模块202,用于将所述待批改题目的信息进行处理,得到该题目的计算公式;
批改模块203,用于根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确。
其中,题目获取模块201进一步用于根据预设的关键词库提取所述题干及问题中的关键词;将所述关键词转化为特征向量。所述待批改题目为可通过将参数代入计算公式得到答案的题目,题目类型包括:填空题、选择题、计算类应用题。
计算公式生成模块202进一步用于根据所述待批改题目的类型调用对应类型的机器学习模型;将所述特征向量输入所述机器学习模型,输出该题目的计算公式。
批改模块203进一步用于根据所述待批改题目的类型确定该题目的标准答案类型;将所述待批改题目中的参数代入所述计算公式计算得到标准答案;根据所述标准答案类型和所述标准答案,判断所述待批改答案是否准确。批改模块203还用于当所述待批改题目的类型为填空题或选择题时,判断所述待批改答案的字符长度是否在预定阈值范围内,若不在,则判断该待批改答案错误;若所述待批改答案的字符长度在预定阈值范围内,判断所述待批改答案中是否包含标准答案,若包含则判断该待批改答案正确,若不包含则判断待批改答案错误。批改模块203还用于当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若不包括,则判断该待批改答案错误。批改模块203还用于当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若包括,则根据所述标准答案检测所述待批改答案中是否包含正确的计算公式的计算结果:若包含,则判断所述待批改答案正确;若不包含,则判断所述待批改答案错误或部分错误。
装置200还包括答案展示模块,用于当判断所述待批改答案错误后,自动将标准答案及解析填写在题目的相应位置。
图5是本发明的一个实施例的电子设备的结构示意图,该电子设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行教育题目自动批改方法。
如图5所示,电子设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体,也可以是多个实体设备的总和。
所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得电子设备能够执行本发明的方法,或者方法中的至少部分步骤。
所述存储器包括易失性存储器,例如随机存取存储单元(RAM)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(ROM)。
可选的,该实施例中,电子设备还包括有I/O接口,其用于电子设备与外部的设备进行数据交换。I/O接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
应当理解,图5显示的电子设备仅仅是本发明的一个示例,本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如,有些电子设备中还包括有显示屏等显示单元,有些电子设备还包括人机交互元件,例如按扭、键盘等。只要该电子设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的电子设备。
图6是本发明的一个实施例的计算机可读记录介质的示意图。如图6所示,计算机可读记录介质中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明上述的教育题目自动批改方法。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案,所述待批改题目为可通过将参数代入计算公式得到答案的题目,该计算公式表示参数间的计算关系;将所述待批改题目的信息输入训练好的机器学习模型得到该题目的计算公式;根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等。本发明也可以由执行本发明的方法的计算机软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现,例如计算机程序执行的某些方法步骤可以在移动客户端执行,另一部分可以在智能表、智能识别笔等中执行。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得电子设备执行根据本发明的方法。
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种题目自动批改方法,其特征在于,包括:
获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案;
将所述待批改题目的信息进行处理,得到该题目的计算公式;
根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确。
2.根据权利要求1所述的题目自动批改方法,其特征在于,所述获取待批改题目的信息,进一步包括:
根据预设的关键词库提取所述题干中的关键词;
将所述题干及关键词转化为特征向量。
3.根据权利要求1-2任一项所述的题目自动批改方法,其特征在于,所述待批改题目为可通过将参数代入计算公式得到答案的题目,所述题目类型包括:填空题、选择题、计算类应用题。
4.根据权利要求1-3任一项所述的题目自动批改方法,其特征在于,所述将所述待批改题目的信息进行处理,得到该题目的计算公式,进一步包括:
根据所述待批改题目的类型调用对应类型的机器学习模型;
将所述特征向量输入所述机器学习模型,输出该题目的计算公式。
5.根据权利要求1-4任一项所述的题目自动批改方法,其特征在于,所述根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确,进一步包括:
根据所述待批改题目的类型确定该题目的标准答案类型;
将所述待批改题目中的参数代入所述计算公式计算得到标准答案;
根据所述标准答案类型和所述标准答案,判断所述待批改答案是否准确。
6.根据权利要求1-5任一项所述的题目自动批改方法,其特征在于,所述根据所述标准答案类型和所述标准答案,判断所述待批改答案是否准确,进一步包括:
当所述待批改题目的类型为填空题或选择题时,判断所述待批改答案的字符长度是否在预定阈值范围内,若不在,则判断该待批改答案错误;
若所述待批改答案的字符长度在预定阈值范围内,判断所述待批改答案中是否包含标准答案,若包含则判断该待批改答案正确,若不包含则判断待批改答案错误;
优选的,当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若不包括,则判断该待批改答案错误;
优选的,当判断所述待批改答案错误后,自动将标准答案及解析填写在题目的相应位置。
7.根据权利要求1-6任一项所述的教育题目自动批改方法,其特征在于,所述根据所述标准答案类型和所述标准答案,判断所述待批改答案是否准确,进一步包括:
当所述待批改题目的类型为计算类应用题时,检测待批改答案中是否包括所述机器学习模型得到的计算公式,若包括,则根据所述标准答案检测所述待批改答案中是否包含正确的计算公式的计算结果:若包含,则判断所述待批改答案正确;若不包含,则判断所述待批改答案错误或部分错误。
8.一种教育题目自动批改装置,其特征在于,包括:
题目获取模块,用于获取待批改题目的信息,所述信息包括题目类型、题干、参数及待批改答案;
计算公式生成模块,用于将所述待批改题目的信息进行处理,得到该题目的计算公式;
批改模块,用于根据所述计算公式和参数计算得到标准答案,判断所述待批改答案是否准确。
9.一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,其特征在于:
当所述计算机程序被所述处理器执行时,所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读介质,存储有计算机可执行程序,其特征在于,所述计算机可执行程序被执行时,实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110707923.0A CN113407675A (zh) | 2021-06-24 | 2021-06-24 | 教育题目自动批改方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110707923.0A CN113407675A (zh) | 2021-06-24 | 2021-06-24 | 教育题目自动批改方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113407675A true CN113407675A (zh) | 2021-09-17 |
Family
ID=77683055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110707923.0A Pending CN113407675A (zh) | 2021-06-24 | 2021-06-24 | 教育题目自动批改方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113407675A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792133A (zh) * | 2021-11-11 | 2021-12-14 | 北京世纪好未来教育科技有限公司 | 判题方法、装置、电子设备和介质 |
CN113850235A (zh) * | 2021-11-26 | 2021-12-28 | 北京世纪好未来教育科技有限公司 | 一种文本处理方法、装置、设备及介质 |
CN115547132A (zh) * | 2022-11-29 | 2022-12-30 | 深圳市采集科技有限公司 | 作业批改方法、装置、存储介质及电子设备 |
CN116308934A (zh) * | 2023-05-15 | 2023-06-23 | 深圳市采集科技有限公司 | 作业批改辅助设备及使用该设备进行作业批改的方法 |
CN116798046A (zh) * | 2023-04-19 | 2023-09-22 | 江西风向标智能科技有限公司 | 初中数学公式自动批改方法、设备、介质和程序产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583429A (zh) * | 2018-12-26 | 2019-04-05 | 杭州大拿科技股份有限公司 | 一种批改试卷中应用题的方法及装置 |
CN111428021A (zh) * | 2020-06-05 | 2020-07-17 | 平安国际智慧城市科技股份有限公司 | 基于机器学习的文本处理方法、装置、计算机设备及介质 |
CN111753767A (zh) * | 2020-06-29 | 2020-10-09 | 广东小天才科技有限公司 | 一种作业自动批改的方法、装置、电子设备和存储介质 |
CN111767307A (zh) * | 2020-07-06 | 2020-10-13 | 北京猿力未来科技有限公司 | 对象处理方法及系统、数学题目批改方法及系统 |
US20210082301A1 (en) * | 2019-09-16 | 2021-03-18 | Hangzhou Dana Technology Inc. | Calculation practicing method, system, electronic device and computer readable storage medium |
-
2021
- 2021-06-24 CN CN202110707923.0A patent/CN113407675A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583429A (zh) * | 2018-12-26 | 2019-04-05 | 杭州大拿科技股份有限公司 | 一种批改试卷中应用题的方法及装置 |
US20210082301A1 (en) * | 2019-09-16 | 2021-03-18 | Hangzhou Dana Technology Inc. | Calculation practicing method, system, electronic device and computer readable storage medium |
CN111428021A (zh) * | 2020-06-05 | 2020-07-17 | 平安国际智慧城市科技股份有限公司 | 基于机器学习的文本处理方法、装置、计算机设备及介质 |
CN111753767A (zh) * | 2020-06-29 | 2020-10-09 | 广东小天才科技有限公司 | 一种作业自动批改的方法、装置、电子设备和存储介质 |
CN111767307A (zh) * | 2020-07-06 | 2020-10-13 | 北京猿力未来科技有限公司 | 对象处理方法及系统、数学题目批改方法及系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792133A (zh) * | 2021-11-11 | 2021-12-14 | 北京世纪好未来教育科技有限公司 | 判题方法、装置、电子设备和介质 |
CN113850235A (zh) * | 2021-11-26 | 2021-12-28 | 北京世纪好未来教育科技有限公司 | 一种文本处理方法、装置、设备及介质 |
CN113850235B (zh) * | 2021-11-26 | 2022-03-04 | 北京世纪好未来教育科技有限公司 | 一种文本处理方法、装置、设备及介质 |
CN115547132A (zh) * | 2022-11-29 | 2022-12-30 | 深圳市采集科技有限公司 | 作业批改方法、装置、存储介质及电子设备 |
CN116798046A (zh) * | 2023-04-19 | 2023-09-22 | 江西风向标智能科技有限公司 | 初中数学公式自动批改方法、设备、介质和程序产品 |
CN116798046B (zh) * | 2023-04-19 | 2024-05-17 | 江西风向标智能科技有限公司 | 初中数学公式自动批改方法、设备、介质和程序产品 |
CN116308934A (zh) * | 2023-05-15 | 2023-06-23 | 深圳市采集科技有限公司 | 作业批改辅助设备及使用该设备进行作业批改的方法 |
CN116308934B (zh) * | 2023-05-15 | 2024-01-16 | 深圳市采集科技有限公司 | 作业批改辅助设备及使用该设备进行作业批改的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113407675A (zh) | 教育题目自动批改方法、装置和电子设备 | |
CN110825875B (zh) | 文本实体类型识别方法、装置、电子设备和存储介质 | |
CN110781681B (zh) | 一种基于翻译模型的初等数学应用题自动求解方法及系统 | |
CN108304387B (zh) | 文本中噪音词的识别方法、装置、服务器组及存储介质 | |
CN114510570A (zh) | 基于小样本语料的意图分类方法、装置及计算机设备 | |
CN116303537A (zh) | 数据查询方法及装置、电子设备、存储介质 | |
CN117252739B (zh) | 一种评卷方法、系统、电子设备及存储介质 | |
CN114357195A (zh) | 基于知识图谱的问答对生成方法、装置、设备及介质 | |
Baulé et al. | Automatic code generation from sketches of mobile applications in end-user development using Deep Learning | |
CN113836894A (zh) | 多维度英语作文评分方法、装置及可读存储介质 | |
CN110765241B (zh) | 推荐题的超纲检测方法、装置、电子设备和存储介质 | |
CN112559711A (zh) | 一种同义文本提示方法、装置及电子设备 | |
CN111158648B (zh) | 一种基于实景语义理解的互动帮助系统开发方法及其平台 | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN113259763A (zh) | 教学视频处理方法、装置和电子设备 | |
WO2023143127A1 (zh) | 一种试题批改方法以及相关装置 | |
CN112100355A (zh) | 一种智能交互方法、装置及设备 | |
CN113392190B (zh) | 一种文本识别方法、相关设备及装置 | |
CN115757720A (zh) | 基于知识图谱的项目信息搜索方法、装置、设备和介质 | |
CN116306506A (zh) | 一种基于内容识别的智能邮件模板方法 | |
CN114840657A (zh) | 一种基于混合模式的api知识图谱自适应构建及智能问答方法 | |
CN114840680A (zh) | 一种实体关系联合抽取方法、装置、存储介质及终端 | |
CN113407676A (zh) | 题目批改方法和系统、电子设备和计算机可读介质 | |
CN113569112A (zh) | 基于题目的辅导策略提供方法、系统、装置及介质 | |
CN113535916A (zh) | 一种基于表格的问答方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230719 Address after: 6001, 6th Floor, No.1 Kaifeng Road, Shangdi Information Industry Base, Haidian District, Beijing, 100085 Applicant after: Beijing Baige Feichi Technology Co.,Ltd. Address before: 100085 4002, 4th floor, No.1 Kaifa Road, Shangdi Information Industry base, Haidian District, Beijing Applicant before: ZUOYEBANG EDUCATION TECHNOLOGY (BEIJING) CO.,LTD. |