WO2021051502A1 - 基于长短期记忆的教学方法、装置和计算机设备 - Google Patents

基于长短期记忆的教学方法、装置和计算机设备 Download PDF

Info

Publication number
WO2021051502A1
WO2021051502A1 PCT/CN2019/116338 CN2019116338W WO2021051502A1 WO 2021051502 A1 WO2021051502 A1 WO 2021051502A1 CN 2019116338 W CN2019116338 W CN 2019116338W WO 2021051502 A1 WO2021051502 A1 WO 2021051502A1
Authority
WO
WIPO (PCT)
Prior art keywords
value
text
preset
answer sheet
designated
Prior art date
Application number
PCT/CN2019/116338
Other languages
English (en)
French (fr)
Inventor
张奇
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2021051502A1 publication Critical patent/WO2021051502A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于长短期记忆的教学方法、装置、计算机设备和存储介质,方法包括:获取指定答卷图片,并对指定答卷图片进行文字识别处理,得到答卷文本(S1);接收教师端对答卷文本的评分结果(S2);获取答卷文本对应学生的学习特征数据,得到评分预估模型输出的预估结果(S3);计算预估结果与评分结果的差别程度值(S4);若差别程度值大于预设的误差阈值,则生成扣分知识点(S5);获取每一个扣分知识点对应的教授时间段(S6);计算教授时间段之间的关联指数(S7);获取排名大于预设的名次阈值的指定关联指数和指定时间段,并向教师端发送教学质量改进的提醒信息,其中提醒信息附带有指定时间段(S8)。从而有效提高教学质量。

Description

基于长短期记忆的教学方法、装置和计算机设备
本申请要求于2019年9月19日提交中国专利局、申请号为201910886610.9,发明名称为“基于长短期记忆的教学方法、装置和计算机设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及到计算机领域,特别是涉及到一种基于长短期记忆的教学方法、装置、计算机设备和存储介质。
背景技术
网上智能审批试卷是将传统阅卷模式下,试卷保管、分发、转运、回收、核分等诸多环节简化成只有评卷一个流程,其他均由计算机统一完成,大大节省了人力物力,缩短了整体阅卷时间。但是,智能审批试卷太过侧重结果,只能得知学生哪部分知识掌握不足,却不能得知为什么该部分知识掌握不足(即教学质量待提高)。因此,传统技术无法获知哪些部分的教学质量待提高,因此亟需能够精准获取哪些部分的教学质量需要提高的技术方案。
技术问题
本申请的主要目的为提供一种基于长短期记忆的教学方法、装置、计算机设备和存储介质,旨在提高教学质量。
技术解决方案
为了实现上述目的,本申请提出一种基于长短期记忆的教学方法,包括以下步骤:
获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片;
将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;
获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成;
根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0;
若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点;
调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段;
根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表;
获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。
有益效果
本申请的基于长短期记忆的教学方法、装置、计算机设备和存储介质,获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本;将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;获取所述答卷文本对应学生的学习特征数据,得到所述评分预估模型输出的预 估结果;计算所述预估结果与所述评分结果的差别程度值;若所述差别程度值大于预设的误差阈值,则生成扣分知识点;获取每一个扣分知识点对应的教授时间段;计算得到所述教授时间段之间的关联指数;获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。从而有效提高教学质量。
附图说明
图1为本申请一实施例的基于长短期记忆的教学方法的流程示意图;
图2为本申请一实施例的基于长短期记忆的教学装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请的最佳实施方式
参照图1,本申请实施例提供一种基于长短期记忆的教学方法,包括以下步骤:
S1、获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片;
S2、将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;
S3、获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成;
S4、根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0;
S5、若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点;
S6、调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段;
S7、根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表;
S8、获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。
如上述步骤S1所述,获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片。其中文字识别处理是指将图片中的文字识别为文字文本。进行文字识别处理可采用任意方法,例如OCR(Optical Character Recognition,光学字符识别)识别。进一步地,所述对所述指定答卷图片进行文字识别处理包括:从所述指定答卷图片中识别出手写文字文本,并将所述手写文字文本作为答卷文本。从而减少网络开销,提高信息发送效率。
如上述步骤S2所述,将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果。其中所述评分结果可以为任意形式的评分结果,例如为包括对每道题(或者知识点)的子评分、对整个 答卷文本的总评分、与子评分对应的批注和与总评分对应的总批注中的一者以上。
如上述步骤S3所述,获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成。其中所述长短期记忆模型是使用长短期记忆网络的模型,其中长短期记忆网络是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,相对于普通的循环神经网络,其加入了一个判断信息有用与否的“处理器”,只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘,从而解决了长序依赖问题。其中所述预估结果可为任意形式的预估结果,例如为总成绩得分,或者为掌握的知识点等。进一步地,所述评分预估模型包括顺序连接的编码用长短期记忆网络和解码用长短期记忆网络,所述评分预估模型的处理过程例如为:将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述解码用长短期记忆网络中进行处理,得到所述解码用长短期记忆网络输出的预测的知识点和对应的掌握程度值;将所述掌握程度值大于预设的掌握程度阈值的知识点作为预估结果,并输出所述预估结果。
如上述步骤S4所述,根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0。其中差别程度值计算方法可以为任意方法(与预估结果与评分结果相关),例如采用差值法计算预估结果与所述评分结果的差值(此时取预估结果的预估成绩得分,相应的评分结果为成绩总分);或者将相同知识点的数量(所述相同知识点指评分中得分的知识点与预估的已掌握的知识点相同的知识点)作为差别程度值。本申请优选将相同知识点的数量作为差别程度值。
如上述步骤S5所述,若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点。若所述差别程度值大于预设的误差阈值,表明教学质量不在预料之中,因此需要分析哪些部分的教学的质量需要提高。因此,根据所述答卷文本中被扣分的位置,生成扣分知识点,以备后续分析。
如上述步骤S6所述,调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段。据此,得到的教授时间段均是可疑的教学质量待提高的时间段。但是,由于知识点失分难以避免,而这些时间段中究竟有哪些是教学质量存在大的问题的还需要进一步分析。
如上述步骤S7所述,根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表。其中预设的时间段关联指数计算方法例如为:根据所述标签数值,将所述教授时间段映射为高维虚拟空间的高维向量,所述高维向量的维度为m;根据公式:
Figure PCTCN2019116338-appb-000001
计算得到两个所述教授时间段之间的关联指数DIS,其中C为所述一个教授时间段对应的高维向量,Ci为高维向量C的第i个分向量,所述高维向量C共有m个分向量,D 为另一个教授时间段对应的高维向量,Ci为高维向量D的第i个分向量,所述高维向量D共有m个分向量。其中,所述标签指对教学质量有影响的因素,例如为:该知识点是否在体育课之后进行教授;该知识点在整个知识点网络中的关联程度;该知识点的易学程度;该知识点的重要程度等等。从而得到所述教授时间段之间的关联指数。
如上述步骤S8所述,获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。其中所述指定关联指数对应的指定时间段,即表明这些指定时间段是对教学质量有较大影响的时间段,若针对这些时间段进行教学质量整治,能够更有效地提高教学质量。
进一步地,所述向所述教师端发送教学质量改进的提醒信息的步骤之后,还包括:获取所述教师端利用所述语音输入装置采集的语音数据;根据预设的语音识别技术,将所述语音数据识别为语音文本;判断所述语音文本中是否存在指定关键词;若所述语音文本中存在指定关键词,则根据预设的关键词与知识点的对应关系,获取与所述指定关键词对应的指定知识点;在所述评分结果中的指定位置附上所述语音数据,其中所述指定位置为与所述指定知识点对应的位置。
在一个实施方式中,所述答完题的纸质试卷中包括手写文字与印刷体文字,所述对所述指定答卷图片进行文字识别处理,得到答卷文本的步骤S1,包括:
S101、采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值,从而获得由三种颜色构成的暂时图片;
S102、计算三种颜色在所述暂时图片中所占面积,并对面积较小的两种颜色的所占区域分别进行文字分割处理,从而获得分割开的第一种字体文字和分割开的第二种字体文字;
S103、提取所述第一种字体文字的特征和所述第二种字体文字的特征,并输入预设的基于支持向量机的文字分类模型中进行分类,从而将所述第一种字体分类为手写文字,或者将所述第二种字体分类为手写文字;
S104、将所有分割开的手写文字组合为手写文字文本,并将所述手写文字文本记为答卷文本。
如上所述,实现了采用颜色设置方法获得识别而得的手写文字文本和印刷体文字文本。本申请使手写文字与印刷体文字的区分更加明显,具体地,是将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值,从而获得由三种颜色构成的暂时图片,并计算三种颜色所占面积,并对面积较小的两种颜色的所占区域分别进行文字分割处理(面积最大的颜色区域为背景),从而获得分割开的分割开的第一种字体文字和分割开的第二种字体文字(暂时未知哪种字体为手写文字)。其中所述支持向量机是一类按监督学习方式对数据进行二元分类的广义线性分类器,适用于对待识别文字与预存的文字进行对比,以输出最相似的文字。因此再提取所述第一种字体文字的特征和所述第二种字体文字的特征,并输入预设的基于支持向量机的文字分类模型中进行分类,从而获知哪处字体为手写文字。最后再将所有分割开的手写文字组合为手写文字文本,并将所述手写文字文本记为答卷文本。其中,由于教师端进行评卷时,只需要学生的答卷内容,因此本 申请只将学生的答卷内容作为答卷文本,以减少网络开销。另外,由于使用了将像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),使得背景颜色的识别更加准确(由于拍摄图片时的光线影响,背景颜色的RGB数值不是纯粹的白色,传统方案的识别方法会造成背景区域识别的不准确,从而影响手写文字的提取)。其中所述第一种字体文字的特征和所述第二种字体文字的特征例如为文字对应的像素点中的特殊的点:例如极值点或者孤立点等。
在一个实施方式中,所述采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值的步骤S101,包括:
S1011、采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/L,0],A},获取颜色影响数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于L的正数,L为大于0的整数,A为预设的取值在范围(0,255)之内第一阈值参数,R、G、B分别为所述指定图片中的指定像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值;
S1012、判断所述颜色影响数值F1的值是否等于A;
S1013、若所述颜色影响数值F1的值等于A,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/L,0],B},获取颜色影响数值F2,其中MAX为最大值函数,B为预设的取值在范围(0,255)之内第二阈值参数,并且B大于A;
S1014、判断所述颜色影响数值F2的值是否等于B;
S1015、若所述颜色影响数值F2的值不等于B,则将所述指定像素点的RGB颜色设置为(255,255,255)。
如上所述,实现了采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q)。具体地,采用两个公式:F1=MIN{ROUND[(a1R+a2G+a3B)/L,0],A},F2=MAX{ROUND[(a1R+a2G+a3B)/L,0],B},以将所述指定像素点的设置为(0,0,0)、(255,255,255)或者(Q,Q,Q)。进一步地,若所述颜色影响数值F1的值不等于A,则将所述指定像素点的RGB颜色设置为(0,0,0)。进一步地,若所述颜色影响数值F2的值等于B,则将所述指定像素点的RGB颜色设置为(Q,Q,Q)。从而实现了三值化处理,以使背景、印刷体文字、手写体文字完全区分出来,使文字识别更加准确。ROUND函数是四舍五入函数,ROUND(M,s)指对实数M按小数位为s进行四舍五入运算,其中s为大于等于0的整数,例如ROUND(8.3,0)=8。
在一个实施方式中,所述评分预估模型包括顺序连接的编码用长短期记忆网络和解码用长短期记忆网络,所述将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成的步骤S3,包括:
S301、将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列;
S302、将所述隐藏状态向量序列输入所述解码用长短期记忆网络中进行处理,得到所述解码用长短期记忆网络输出的预测的知识点和对应的掌握程度值;
S303、将所述掌握程度值大于预设的掌握程度阈值的知识点作为预估结果,并输出所述预估结果。
如上所述,实现了得到所述评分预估模型输出的预估结果。其中,本申请的编码用长短期记忆网络中的编码指将输入的信息转换为指定长度的向量序列,解码用长短期记忆网络中的解码指将输入的向量序列转换为预测的向量序列。其中解码用长短期记忆网络可采用任意的方法进行运算,例如采用公式:
Figure PCTCN2019116338-appb-000002
其中c i为所述编码用长短期记忆网络中最终隐藏状态向量c i,a ij为权重参数,其中共有n个时间段(由于对知识点的掌握程度会随时间的变化而变化,例如某一知识点在长期不使用不复习的情况下,会被遗忘,因此利用长短期记忆网络的时间特征,设置n个时间段),si为所述解码用长短期记忆网络中的第i个隐藏状态向量,score(s i,h j)指采用预设的score函数根据si和hj计算出的分数,W C为权值,p为输出概率,yt为解码用长短期记忆网络的对应第t个时间段的输出,x为输入(与学习特征数据直接相关)。再将所述掌握程度值大于预设的掌握程度阈值的知识点作为预估结果,并输出所述预估结果,从而将掌握程度值高的知识点作为预估结果。
在一个实施方式中,所述将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列的步骤S301,包括:
S3011、根据公式:h t=LSTM enc(x t,h t-1),获得所述编码用长短期记忆网络中的隐藏状态向量h t,其中t为第t个时间段,h t为对应于第t个时间段的隐藏状态向量,h t-1为对应于第t-1个时间段的隐藏状态向量,X t为第t个时间段的学习特征数据,LSTM enc指利用编码用长短期记忆网络进行编码运算;
S3012、根据公式:
Figure PCTCN2019116338-appb-000003
获取所述编码用长短期记忆网络中最终隐藏状态向量c i,a ij为权重参数,其中共有n个时间段,s i为所述编码用长短期记忆网络中的第i个隐藏状态向量,score(s i,h j)指采用预设的score函数根据s i和h j计算出的分数;
S3013、将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c 1、c 2…、c n
如上所述,实现了将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列。本申请采用公式:h t=LSTM enc(x t,h t-1),获得所述编码用长短期记忆网络中的隐藏状态向量h t,再根据公式:
Figure PCTCN2019116338-appb-000004
获取所述编码用长短期记忆网络中最终隐藏状态向量c i,也即是引入了注意力机制自动捕捉对结局重要的信息,从而将最终隐藏状态向量序列作为解码用长短期记忆网络的解码基础。由于采用了注意力机制,使得权重分配更为准确,有利于改善预测的准确性。据此,将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c 1、c 2…、c n,从而作为解码用长短期记忆网络的解码基础。
在一个实施方式中,每个所述教授时间段均具有m个标签,所述标签记载有标签数值,所述根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数的步骤S7,包括:
S701、根据所述标签数值,将所述教授时间段映射为高维虚拟空间的高维向量,所述高维向量的维度为m;
S702、根据公式:
Figure PCTCN2019116338-appb-000005
计算得到两个所述教授时间段之间的关联指数DIS,其中C为所述一个教授时间段对应的高维向量,Ci为高维向量C的第i个分向量,所述高维向量C共有m个分向量,D为另一个教授时间段对应的高维向量,Di为高维向量D的第i个分向量,所述高维向量D共有m个分向量。
如上所述,实现了根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数。其中,所述标签指对教学质量有影响的因素,例如为:该知识点是否在体育课之后进行教授;该知识点在整个知识点网络中的关联程度;该知识点的易学程度;该知识点的重要程度等等。先根据所述标签数值,将所述教授时间段映射为高维虚拟空间的高维向量,所述高维向量的维度为m,使影响时间段的因素以数值的方式准确映射为高维向量(即以标签数值作为高维向量的分向量的数值),从而使时间段之间的关联程度的计算成为可能。再根据公式:
Figure PCTCN2019116338-appb-000006
计算得到两个所述教授时间段之间的关联指数DIS,从而得知两个所述教授时间段的影响因素之间的关联程度,从而作为是否需要改进教学质量的依据。
在一个实施方式中,所述教师端设置有语音输入装置,所述向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段的步骤S8之后,包括:
S81、获取所述教师端利用所述语音输入装置采集的语音数据;
S82、根据预设的语音识别技术,将所述语音数据识别为语音文本;
S83、判断所述语音文本中是否存在指定关键词;
S84、若所述语音文本中存在指定关键词,则根据预设的关键词与知识点的对应关系,获取与所述指定关键词对应的指定知识点;
S85、在所述评分结果中的指定位置附上所述语音数据,其中所述指定位置为与所述指定知识点对应的位置。
如上所述,实现了在所述评分结果中的指定位置附上所述语音数据,其中所述指定位置为与所述指定知识点对应的位置。其中语音输入装置例如为麦克风阵列。语音识别技术用于将语音识别为文字文本,使数据处理更方便。关键词可以设置为知识点本身,或者与知识点本身相关的词汇。据此,在所述评分结果中的指定位置附上所述语音数据。由于语音评述更简洁且更容易让学生理解,因此语音评述更容易让学生意识到犯的错误,从而重新掌握扣分知识点。并且,由于采用的关键词判断的方式,因此教师端无需逐个寻找知识点对应的题目即可实现针对性语音输入,更高效更快捷。
参照图2,本申请实施例提供一种基于长短期记忆的教学装置,包括:
答卷文本获取单元10,用于获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答 卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片;
答卷文本发送单元20,用于将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;
预估结果获取单元30,用于获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成;
误差阈值判断单元40,用于根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0;
扣分知识点生成单元50,用于若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点;
教授时间段获取单元60,用于调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段;
关联指数计算单元70,用于根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表;
提醒信息发送单元80,用于获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。
其中上述单元分别用于执行的操作与前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述答完题的纸质试卷中包括手写文字与印刷体文字,所述答卷文本获取单元10,包括:
暂时图片获取子单元,用于采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值,从而获得由三种颜色构成的暂时图片;
面积计算子单元,用于计算三种颜色在所述暂时图片中所占面积,并对面积较小的两种颜色的所占区域分别进行文字分割处理,从而获得分割开的第一种字体文字和分割开的第二种字体文字;
手写文字分类子单元,用于提取所述第一种字体文字的特征和所述第二种字体文字的特征,并输入预设的基于支持向量机的文字分类模型中进行分类,从而将所述第一种字体分类为手写文字,或者将所述第二种字体分类为手写文字;
答卷文本获取子单元,用于将所有分割开的手写文字组合为手写文字文本,并将所述手写文字文本记为答卷文本。
其中上述子单元分别用于执行的操作与前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述暂时图片获取子单元,包括:
颜色影响数值F1获取模块,用于采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/L,0],A},获取颜色影响数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于L的正数,L为大于0的整数,A为预设的取值在范围(0,255)之内第一阈值参数,R、G、B分别为所述指定图片中的指定像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值;
颜色影响数值F1判断模块,用于判断所述颜色影响数值F1的值是否等于A;
颜色影响数值F2获取模块,用于若所述颜色影响数值F1的值等于A,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/L,0],B},获取颜色影响数值F2,其中MAX为最大值函数,B为预设的取值在范围(0,255)之内第二阈值参数,并且B大于A;
颜色影响数值F2判断模块,用于判断所述颜色影响数值F2的值是否等于B;
颜色设置模块,用于若所述颜色影响数值F2的值不等于B,则将所述指定像素点的RGB颜色设置为(255,255,255)。
其中上述模块分别用于执行的操作与前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述评分预估模型包括顺序连接的编码用长短期记忆网络和解码用长短期记忆网络,所述预估结果获取单元30,包括:
编码子单元,用于将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列;
预测的知识点获取子单元,用于将所述隐藏状态向量序列输入所述解码用长短期记忆网络中进行处理,得到所述解码用长短期记忆网络输出的预测的知识点和对应的掌握程度值;
预估结果输出子单元,用于将所述掌握程度值大于预设的掌握程度阈值的知识点作为预估结果,并输出所述预估结果。
其中上述子单元分别用于执行的操作与前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述编码子单元,包括:
隐藏状态向量获取模块,用于根据公式:h t=LSTM enc(x t,h t-1),获得所述编码用长短期记忆网络中的隐藏状态向量h t,其中t为第t个时间段,h t为对应于第t个时间段的隐藏状态向量,h t-1为对应于第t-1个时间段的隐藏状态向量,X t为第t个时间段的学习特征数据,LSTM enc指利用编码用长短期记忆网络进行编码运算;
最终隐藏状态向量获取模块,用于根据公式:
Figure PCTCN2019116338-appb-000007
获取所述编码用长短期记忆网络中最终隐藏状态向量c i,a ij为权重参数,其中共有n个时间段,s i为所述编码用长短期记忆网络中的第i个隐藏状态向量,score(s i,h j)指采用预设的score函数根据s i和h j计算出的分数;
隐藏状态向量序列获取模块,用于将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量 序列c 1、c 2…、c n
其中上述模块分别用于执行的操作与前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
在一个实施方式中,每个所述教授时间段均具有m个标签,所述标签记载有标签数值,所述关联指数计算单元70,包括:
高维向量映射子单元,用于根据所述标签数值,将所述教授时间段映射为高维虚拟空间的高维向量,所述高维向量的维度为m;
关联指数计算子单元,用于根据公式:
Figure PCTCN2019116338-appb-000008
计算得到两个所述教授时间段之间的关联指数DIS,其中C为所述一个教授时间段对应的高维向量,Ci为高维向量C的第i个分向量,所述高维向量C共有m个分向量,D为另一个教授时间段对应的高维向量,Di为高维向量D的第i个分向量,所述高维向量D共有m个分向量。
其中上述子单元分别用于执行的操作与前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述教师端设置有语音输入装置,所述装置,包括:
语音数据获取单元,用于获取所述教师端利用所述语音输入装置采集的语音数据;
语音文本获取单元,用于根据预设的语音识别技术,将所述语音数据识别为语音文本;
指定关键词判断单元,用于判断所述语音文本中是否存在指定关键词;
指定知识点获取单元,用于若所述语音文本中存在指定关键词,则根据预设的关键词与知识点的对应关系,获取与所述指定关键词对应的指定知识点;
语音数据附加单元,用于在所述评分结果中的指定位置附上所述语音数据,其中所述指定位置为与所述指定知识点对应的位置。
其中上述单元分别用于执行的操作与前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于长短期记忆的教学方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于长短期记忆的教学方法。
上述处理器执行上述基于长短期记忆的教学方法,其中所述方法包括的步骤分别与执行前述实施方 式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于长短期记忆的教学方法,其中所述方法包括的步骤分别与执行前述实施方式的基于长短期记忆的教学方法的步骤一一对应,在此不再赘述。其中所述计算机可读存储介质例如为非易失性的计算机可读存储介质,或者为易失性的计算机可读存储介质。

Claims (20)

  1. 一种基于长短期记忆的教学方法,其特征在于,包括:
    获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片;
    将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;
    获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成;
    根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0;
    若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点;
    调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段;
    根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表;
    获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。
  2. 根据权利要求1所述的基于长短期记忆的教学方法,其特征在于,所述答完题的纸质试卷中包括手写文字与印刷体文字,所述对所述指定答卷图片进行文字识别处理,得到答卷文本的步骤,包括:
    采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值,从而获得由三种颜色构成的暂时图片;
    计算三种颜色在所述暂时图片中所占面积,并对面积较小的两种颜色的所占区域分别进行文字分割处理,从而获得分割开的第一种字体文字和分割开的第二种字体文字;
    提取所述第一种字体文字的特征和所述第二种字体文字的特征,并输入预设的基于支持向量机的文字分类模型中进行分类,从而将所述第一种字体分类为手写文字,或者将所述第二种字体分类为手写文字;
    将所有分割开的手写文字组合为手写文字文本,并将所述手写文字文本记为答卷文本。
  3. 根据权利要求2所述的基于长短期记忆的教学方法,其特征在于,所述采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值的步骤,包括:
    采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/L,0],A},获取颜色影响数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于L的正数,L为大 于0的整数,A为预设的取值在范围(0,255)之内第一阈值参数,R、G、B分别为所述指定图片中的指定像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值;
    判断所述颜色影响数值F1的值是否等于A;
    若所述颜色影响数值F1的值等于A,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/L,0],B},获取颜色影响数值F2,其中MAX为最大值函数,B为预设的取值在范围(0,255)之内第二阈值参数,并且B大于A;
    判断所述颜色影响数值F2的值是否等于B;
    若所述颜色影响数值F2的值不等于B,则将所述指定像素点的RGB颜色设置为(255,255,255)。
  4. 根据权利要求1所述的基于长短期记忆的教学方法,其特征在于,所述评分预估模型包括顺序连接的编码用长短期记忆网络和解码用长短期记忆网络,所述将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成的步骤,包括:
    将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列;
    将所述隐藏状态向量序列输入所述解码用长短期记忆网络中进行处理,得到所述解码用长短期记忆网络输出的预测的知识点和对应的掌握程度值;
    将所述掌握程度值大于预设的掌握程度阈值的知识点作为预估结果,并输出所述预估结果。
  5. 根据权利要求4所述的基于长短期记忆的教学方法,其特征在于,所述将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列的步骤,包括:
    根据公式:h t=LSTM enc(x t,h t-1),获得所述编码用长短期记忆网络中的隐藏状态向量h t,其中t为第t个时间段,h t为对应于第t个时间段的隐藏状态向量,h t-1为对应于第t-1个时间段的隐藏状态向量,X t为第t个时间段的学习特征数据,LSTM enc指利用编码用长短期记忆网络进行编码运算;
    根据公式:
    Figure PCTCN2019116338-appb-100001
    e ij=score(s i,h j),获取所述编码用长短期记忆网络中最终隐藏状态向量c i,a ij为权重参数,其中共有n个时间段,s i为所述编码用长短期记忆网络中的第i个隐藏状态向量,score(s i,h j)指采用预设的score函数根据s i和h j计算出的分数;
    将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c 1、c 2…、c n
  6. 根据权利要求1所述的基于长短期记忆的教学方法,其特征在于,每个所述教授时间段均具有m个标签,所述标签记载有标签数值,所述根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数的步骤,包括:
    根据所述标签数值,将所述教授时间段映射为高维虚拟空间的高维向量,所述高维向量的维度为m;
    根据公式:
    Figure PCTCN2019116338-appb-100002
    计算得到两个所述教授时间段之间的关联指数DIS,其中C为所述一个教授时间段对应的高维向量,Ci为高维向量C的第i个分向量,所述高维向量C共有m个分向量,D为另一个教授时间段对应的高维向量,Di为高维向量D的第i个分向量,所述高维向量D共有m个分向量。
  7. 根据权利要求1所述的基于长短期记忆的教学方法,其特征在于,所述教师端设置有语音输入装置,所述向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段的步骤之后,包括:
    获取所述教师端利用所述语音输入装置采集的语音数据;
    根据预设的语音识别技术,将所述语音数据识别为语音文本;
    判断所述语音文本中是否存在指定关键词;
    若所述语音文本中存在指定关键词,则根据预设的关键词与知识点的对应关系,获取与所述指定关键词对应的指定知识点;
    在所述评分结果中的指定位置附上所述语音数据,其中所述指定位置为与所述指定知识点对应的位置。
  8. 一种基于长短期记忆的教学装置,其特征在于,包括:
    答卷文本获取单元,用于获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片;
    答卷文本发送单元,用于将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;
    预估结果获取单元,用于获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成;
    误差阈值判断单元,用于根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0;
    扣分知识点生成单元,用于若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点;
    教授时间段获取单元,用于调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段;
    关联指数计算单元,用于根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表;
    提醒信息发送单元,用于获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。
  9. 根据权利要求8所述的基于长短期记忆的教学装置,其特征在于,所述答完题的纸质试卷中包括手写文字与印刷体文字,所述答卷文本获取单元10,包括:
    暂时图片获取子单元,用于采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值,从而获得由三种颜色构成的暂时图片;
    面积计算子单元,用于计算三种颜色在所述暂时图片中所占面积,并对面积较小的两种颜色的所占区域分别进行文字分割处理,从而获得分割开的第一种字体文字和分割开的第二种字体文字;
    手写文字分类子单元,用于提取所述第一种字体文字的特征和所述第二种字体文字的特征,并输入预设的基于支持向量机的文字分类模型中进行分类,从而将所述第一种字体分类为手写文字,或者将所述第二种字体分类为手写文字;
    答卷文本获取子单元,用于将所有分割开的手写文字组合为手写文字文本,并将所述手写文字文本记为答卷文本。
  10. 根据权利要求9所述的基于长短期记忆的教学装置,其特征在于,所述暂时图片获取子单元,包括:
    颜色影响数值F1获取模块,用于采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/L,0],A},获取颜色影响数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于L的正数,L为大于0的整数,A为预设的取值在范围(0,255)之内第一阈值参数,R、G、B分别为所述指定图片中的指定像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值;
    颜色影响数值F1判断模块,用于判断所述颜色影响数值F1的值是否等于A;
    颜色影响数值F2获取模块,用于若所述颜色影响数值F1的值等于A,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/L,0],B},获取颜色影响数值F2,其中MAX为最大值函数,B为预设的取值在范围(0,255)之内第二阈值参数,并且B大于A;
    颜色影响数值F2判断模块,用于判断所述颜色影响数值F2的值是否等于B;
    颜色设置模块,用于若所述颜色影响数值F2的值不等于B,则将所述指定像素点的RGB颜色设置为(255,255,255)。
  11. 根据权利要求8所述的基于长短期记忆的教学装置,其特征在于,所述评分预估模型包括顺序连接的编码用长短期记忆网络和解码用长短期记忆网络,所述预估结果获取单元30,包括:
    编码子单元,用于将所述学习特征数据输入所述编码用长短期记忆网络中进行处理,得到所述编码用长短期记忆网络中的隐藏状态向量序列;
    预测的知识点获取子单元,用于将所述隐藏状态向量序列输入所述解码用长短期记忆网络中进行处理,得到所述解码用长短期记忆网络输出的预测的知识点和对应的掌握程度值;
    预估结果输出子单元,用于将所述掌握程度值大于预设的掌握程度阈值的知识点作为预估结果,并 输出所述预估结果。
  12. 根据权利要求11所述的基于长短期记忆的教学装置,其特征在于,所述编码子单元,包括:
    隐藏状态向量获取模块,用于根据公式:h t=LSTM enc(x t,h t-1),获得所述编码用长短期记忆网络中的隐藏状态向量h t,其中t为第t个时间段,h t为对应于第t个时间段的隐藏状态向量,h t-1为对应于第t-1个时间段的隐藏状态向量,X t为第t个时间段的学习特征数据,LSTM enc指利用编码用长短期记忆网络进行编码运算;
    最终隐藏状态向量获取模块,用于根据公式:
    Figure PCTCN2019116338-appb-100003
    e ij=score(s i,h j),获取所述编码用长短期记忆网络中最终隐藏状态向量c i,a ij为权重参数,其中共有n个时间段,s i为所述编码用长短期记忆网络中的第i个隐藏状态向量,score(s i,h j)指采用预设的score函数根据s i和h j计算出的分数;
    隐藏状态向量序列获取模块,用于将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c 1、c 2…、c n
  13. 根据权利要求8所述的基于长短期记忆的教学装置,其特征在于,每个所述教授时间段均具有m个标签,所述标签记载有标签数值,所述关联指数计算单元70,包括:
    高维向量映射子单元,用于根据所述标签数值,将所述教授时间段映射为高维虚拟空间的高维向量,所述高维向量的维度为m;
    关联指数计算子单元,用于根据公式:
    Figure PCTCN2019116338-appb-100004
    计算得到两个所述教授时间段之间的关联指数DIS,其中C为所述一个教授时间段对应的高维向量,Ci为高维向量C的第i个分向量,所述高维向量C共有m个分向量,D为另一个教授时间段对应的高维向量,Di为高维向量D的第i个分向量,所述高维向量D共有m个分向量。
  14. 根据权利要求8所述的基于长短期记忆的教学装置,其特征在于,所述教师端设置有语音输入装置,所述装置,包括:
    语音数据获取单元,用于获取所述教师端利用所述语音输入装置采集的语音数据;
    语音文本获取单元,用于根据预设的语音识别技术,将所述语音数据识别为语音文本;
    指定关键词判断单元,用于判断所述语音文本中是否存在指定关键词;
    指定知识点获取单元,用于若所述语音文本中存在指定关键词,则根据预设的关键词与知识点的对应关系,获取与所述指定关键词对应的指定知识点;
    语音数据附加单元,用于在所述评分结果中的指定位置附上所述语音数据,其中所述指定位置为与所述指定知识点对应的位置。
  15. 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现基于长短期记忆的教学方法,所述基于长短期记忆的教学方法,包括:
    获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片;
    将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;
    获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成;
    根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0;
    若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点;
    调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段;
    根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表;
    获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。
  16. 根据权利要求15所述的计算机设备,其特征在于,所述答完题的纸质试卷中包括手写文字与印刷体文字,所述对所述指定答卷图片进行文字识别处理,得到答卷文本的步骤,包括:
    采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值,从而获得由三种颜色构成的暂时图片;
    计算三种颜色在所述暂时图片中所占面积,并对面积较小的两种颜色的所占区域分别进行文字分割处理,从而获得分割开的第一种字体文字和分割开的第二种字体文字;
    提取所述第一种字体文字的特征和所述第二种字体文字的特征,并输入预设的基于支持向量机的文字分类模型中进行分类,从而将所述第一种字体分类为手写文字,或者将所述第二种字体分类为手写文字;
    将所有分割开的手写文字组合为手写文字文本,并将所述手写文字文本记为答卷文本。
  17. 根据权利要求15所述的计算机设备,其特征在于,所述采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值的步骤,包括:
    采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/L,0],A},获取颜色影响数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于L的正数,L为大于0的整数,A为预设的取值在范围(0,255)之内第一阈值参数,R、G、B分别为所述指定图片中的指定像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值;
    判断所述颜色影响数值F1的值是否等于A;
    若所述颜色影响数值F1的值等于A,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/L,0],B},获取颜色影响数值F2,其中MAX为最大值函数,B为预设的取值在范围(0,255)之内第二阈值参数,并且B大于A;
    判断所述颜色影响数值F2的值是否等于B;
    若所述颜色影响数值F2的值不等于B,则将所述指定像素点的RGB颜色设置为(255,255,255)。
  18. 一种非易失性的计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现基于长短期记忆的教学方法,所述基于长短期记忆的教学方法,包括:
    获取指定答卷图片,并对所述指定答卷图片进行文字识别处理,得到答卷文本,所述指定答卷图片指对答完题的纸质试卷进行图像采集得到的图片;
    将所述答卷文本发送给教师端,并接收教师端对所述答卷文本的评分结果;
    获取所述答卷文本对应学生的学习特征数据,并将所述学习特征数据输入预设的训练完成的评分预估模型中,从而得到所述评分预估模型输出的预估结果,其中所述评分预估模型是基于长短期记忆模型训练而成;
    根据预设的差别程度值计算方法,计算所述预估结果与所述评分结果的差别程度值,并判断所述差别程度值是否大于预设的误差阈值,其中所述误差阈值大于等于0;
    若所述差别程度值大于预设的误差阈值,则根据所述答卷文本中被扣分的位置,生成扣分知识点;
    调取预设的知识点教授时间表,并根据所述时间表,获取每一个扣分知识点对应的教授时间段;
    根据预设的时间段关联指数计算方法,计算得到所述教授时间段之间的关联指数,并对所述关联指数按数值大小进行降序排列,得到关联指数表;
    获取所述关联指数表中排名大于预设的名次阈值的指定关联指数,获取所述指定关联指数对应的指定时间段,并向所述教师端发送教学质量改进的提醒信息,其中所述提醒信息附带有所述指定时间段。
  19. 根据权利要求18所述的非易失性的计算机可读存储介质,其特征在于,所述答完题的纸质试卷中包括手写文字与印刷体文字,所述对所述指定答卷图片进行文字识别处理,得到答卷文本的步骤,包括:
    采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值,从而获得由三种颜色构成的暂时图片;
    计算三种颜色在所述暂时图片中所占面积,并对面积较小的两种颜色的所占区域分别进行文字分割处理,从而获得分割开的第一种字体文字和分割开的第二种字体文字;
    提取所述第一种字体文字的特征和所述第二种字体文字的特征,并输入预设的基于支持向量机的文字分类模型中进行分类,从而将所述第一种字体分类为手写文字,或者将所述第二种字体分类为手写文字;
    将所有分割开的手写文字组合为手写文字文本,并将所述手写文字文本记为答卷文本。
  20. 根据权利要求18所述的非易失性的计算机可读存储介质,其特征在于,所述采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据预设的颜色设置方法将所述指定答卷图片中的像素点的RGB颜色设置为(0,0,0)、(255,255,255)或者(Q,Q,Q),其中Q为大于0且小于255的预设数值的步骤,包括:
    采集所述指定答卷图片中的像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值,并根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/L,0],A},获取颜色影响数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于L的正数,L为大于0的整数,A为预设的取值在范围(0,255)之内第一阈值参数,R、G、B分别为所述指定图片中的指定像素点的RGB颜色模型中的R颜色通道的数值、G颜色通道的数值和B颜色通道的数值;
    判断所述颜色影响数值F1的值是否等于A;
    若所述颜色影响数值F1的值等于A,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/L,0],B},获取颜色影响数值F2,其中MAX为最大值函数,B为预设的取值在范围(0,255)之内第二阈值参数,并且B大于A;
    判断所述颜色影响数值F2的值是否等于B;
    若所述颜色影响数值F2的值不等于B,则将所述指定像素点的RGB颜色设置为(255,255,255)。
PCT/CN2019/116338 2019-09-19 2019-11-07 基于长短期记忆的教学方法、装置和计算机设备 WO2021051502A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910886610.9A CN110795997B (zh) 2019-09-19 2019-09-19 基于长短期记忆的教学方法、装置和计算机设备
CN201910886610.9 2019-09-19

Publications (1)

Publication Number Publication Date
WO2021051502A1 true WO2021051502A1 (zh) 2021-03-25

Family

ID=69427350

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/116338 WO2021051502A1 (zh) 2019-09-19 2019-11-07 基于长短期记忆的教学方法、装置和计算机设备

Country Status (2)

Country Link
CN (1) CN110795997B (zh)
WO (1) WO2021051502A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091733B (zh) * 2020-03-19 2020-06-30 浙江正元智慧科技股份有限公司 一种教师实时教学成果辅助检验系统
CN114419636A (zh) * 2022-01-10 2022-04-29 北京百度网讯科技有限公司 文本识别方法、装置、设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011119484A1 (en) * 2010-03-23 2011-09-29 Iogenetics, Llc Bioinformatic processes for determination of peptide binding
CN103164994A (zh) * 2013-03-15 2013-06-19 南京信息工程大学 一种运算类习题的批改及反馈方法
CN106981227A (zh) * 2017-05-24 2017-07-25 亳州学院 一种数学教学系统
CN109117738A (zh) * 2018-07-19 2019-01-01 江苏黄金屋教育发展股份有限公司 基于人工智能的阅卷方法
CN109284355A (zh) * 2018-09-26 2019-01-29 杭州大拿科技股份有限公司 一种批改试卷中口算题的方法及装置
CN109902683A (zh) * 2019-03-07 2019-06-18 大连大学 试卷核分和成绩录入方法及系统
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180071029A (ko) * 2016-12-19 2018-06-27 삼성전자주식회사 음성 인식 방법 및 장치
CN109697905A (zh) * 2017-10-20 2019-04-30 深圳市鹰硕技术有限公司 一种试卷批阅系统
CN109389091B (zh) * 2018-10-22 2022-05-03 重庆邮电大学 基于神经网络和注意力机制结合的文字识别系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011119484A1 (en) * 2010-03-23 2011-09-29 Iogenetics, Llc Bioinformatic processes for determination of peptide binding
CN103164994A (zh) * 2013-03-15 2013-06-19 南京信息工程大学 一种运算类习题的批改及反馈方法
CN106981227A (zh) * 2017-05-24 2017-07-25 亳州学院 一种数学教学系统
CN109117738A (zh) * 2018-07-19 2019-01-01 江苏黄金屋教育发展股份有限公司 基于人工智能的阅卷方法
CN109284355A (zh) * 2018-09-26 2019-01-29 杭州大拿科技股份有限公司 一种批改试卷中口算题的方法及装置
CN109902683A (zh) * 2019-03-07 2019-06-18 大连大学 试卷核分和成绩录入方法及系统
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序

Also Published As

Publication number Publication date
CN110795997B (zh) 2023-07-28
CN110795997A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN110110585B (zh) 基于深度学习的智能阅卷实现方法及系统、计算机程序
WO2020207431A1 (zh) 文献分类方法、装置、设备及存储介质
CN109598995B (zh) 基于贝叶斯知识跟踪模型的智能教学系统
CN111259625B (zh) 意图识别方法、装置、设备及计算机可读存储介质
CN110647619A (zh) 一种基于问题生成和卷积神经网络的常识问答方法
CN110569356B (zh) 基于智能面试交互系统的面试方法、装置和计算机设备
CN111985239A (zh) 实体识别方法、装置、电子设备及存储介质
CN112115301B (zh) 一种基于课堂笔记的视频标注方法及系统
WO2021218028A1 (zh) 基于人工智能的面试内容精炼方法、装置、设备及介质
CN109949637B (zh) 一种客观题目的自动解答方法和装置
CN114297987B (zh) 基于文本分类和阅读理解的文档信息抽取方法及系统
WO2021051502A1 (zh) 基于长短期记忆的教学方法、装置和计算机设备
CN116049367A (zh) 一种基于无监督知识增强的视觉-语言预训练方法及装置
CN111180025A (zh) 表示病历文本向量的方法、装置及问诊系统
CN113742733A (zh) 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置
CN113032601A (zh) 一种基于判别性提升的零样本草图检索方法
CN114417851A (zh) 一种基于关键词加权信息的情感分析方法
CN115546553A (zh) 一种基于动态特征抽取和属性修正的零样本分类方法
CN110852071A (zh) 知识点检测方法、装置、设备及可读存储介质
Gross et al. A handwriting recognition system for the classroom
CN113505786A (zh) 试题拍照评判方法、装置及电子设备
CN116821297A (zh) 一种风格化法律咨询问答方法、系统、存储介质和设备
CN114579706B (zh) 一种基于bert神经网络和多任务学习的主观题自动评阅方法
CN113626537B (zh) 一种面向知识图谱构建的实体关系抽取方法及系统
CN114330943A (zh) 一种面试辅助方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19946120

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19946120

Country of ref document: EP

Kind code of ref document: A1