CN108182177A - 一种数学试题知识点自动化标注方法和装置 - Google Patents

一种数学试题知识点自动化标注方法和装置 Download PDF

Info

Publication number
CN108182177A
CN108182177A CN201810067572.XA CN201810067572A CN108182177A CN 108182177 A CN108182177 A CN 108182177A CN 201810067572 A CN201810067572 A CN 201810067572A CN 108182177 A CN108182177 A CN 108182177A
Authority
CN
China
Prior art keywords
mathematics
training
text
knowledge
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810067572.XA
Other languages
English (en)
Inventor
谢德刚
姚志峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810067572.XA priority Critical patent/CN108182177A/zh
Publication of CN108182177A publication Critical patent/CN108182177A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

一种数学试题知识点自动化标注方法,该标注方法基于深度学习模型,所述标注方法包括步骤:S1:数学试题文本进行预处理,包括分别进行标准化、分词和去停用词处理;S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量;S3:搭建两层TextCNN神经网络模型,输入有标注的数学试题训练样本集,训练该神经网络模型,利用该模型实现对新入题库的数学题目进行知识点自动化标注。

Description

一种数学试题知识点自动化标注方法和装置
技术领域
本发明属于教学技术领域,特别涉及一种数学试题知识点自动化标注方法和装置。
背景技术
随着人工智能技术的不断发展,深度学习越来越多得被运用于语音识别,图像识别,自然语言处理等方面。深度学习的概念源于人工神经网络的研究,含多隐藏层的多层感知器就是一种深度学习结构。深度学习框架能够学习潜在的数据特征表示,从而找到特征数据与目标数据内在关系。在互联网教育领域,线上题库的建立与维护是“基石”。将新题目录入到题库的过程中,依赖于人工录入,且标注题目相关信息(如题目知识点、考点、难度、题目类型等)。该工作既费时又费力。
发明内容
本发明的实施例提供一种基于深度学习技术的数学试题知识点自动化标注方法和装置,目的在于解决现有的数学题库对于试题无法自动标注知识点的问题。
本发明的实施例之一是,一种数学试题知识点自动化标注方法,该标注方法基于深度学习模型,所述标注方法包括步骤:
S1:数学试题文本进行预处理,包括分别进行标准化、分词和去停用词处理;
S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量;
S3:搭建两层TextCNN神经网络模型,输入有标注的数学试题训练样本集,训练该神经网络模型,利用该模型实现对新入题库的数学题目进行知识点自动化标注。
本发明的实施例之一,一种数学试题知识点自动化标注装置,所述自动化标注装置基于深度学习模型,该装置包括存储器;以及耦合到所述存储器的处理器,该处理器被配置为执行存储在所述存储器中的指令,所述处理器执行以下操作:
S1:数学试题文本进行预处理,包括分别进行标准化、分词和去停用词处理;
S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量;
S3:搭建两层TextCNN神经网络模型,输入有标注的数学试题训练样本集,训练该神经网络模型,利用该模型实现对新入题库的数学题目进行知识点自动化标注。
本发明实施例还包括,一种基于深度学习的数学知识点自动化标注方法,包括如下步骤:
S1:准备标注好知识点的训练样本集,并对数学文本进行预处理。预处理工作具体包括文本标准化,规范化,分词,去停用词,tf-idf进行关键词提取。其中tf-idf算法,基于词频和逆文档率,计算词语得分,反映出该词语在该类文档中的重要性程度;
S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量,将结果保存为{词语/字符:词向量}的字典形式,为之后训练神经网络模型备用;
S3:搭建两层TextCNN神经网络模型,输入有标注的训练样本集,训练模型。具体工作包括模型框架设计,本方法搭建两层TextCNN网络,结构为词嵌入-卷积-池化-卷积-池化-dropout。其中,根据数学语言特点,设计多个不同视野的卷积核采集数学文本信息。词嵌入为预先训练的字符级\词语级的word2vec向量。
在本发明说明书中提到的分词、关键词提取、词嵌入,分别具有如下解释:
分词,针对中文文本无间隔特点,将其以词语单位分开,便于程序输入和后续分析处理。本方法采用jieba分词法,并总结出数学领域专有词表,对数学文本,连同数学表达式,进行分词。
关键词提取,对每一类知识点而言,都有比较重要的特征词,这些词语是重点关注的,还有一类词语,在数学文本中普遍出现或偶尔出现,利用tf-idf将低分词过滤掉,对数学文本进一步清理。
词嵌入,将词语向量化,不同于one-hot编码形式,而是用分布式表示,方便文本词语在计算机内的运算。
本发明基于深度学习技术,提供了一种数学题目知识点自动化标注系统,将对数学题目进行知识点标注转化为文本的多标签分类问题。本发明针对数学语言的特点,进行文本处理和神经网络设计,能够对新入库的数学题目进行知识点自动化标注。主要运用在,当新题入库时,不再需要人工通过阅读题目,理解题意,甚至在做完题目之后,为新题目标注题目考点,从而实现知识点标注的自动化。由于本发明实现了新题入库时的知识点自动化标注,大大提高了知识点标注效率,实现智能化。
本发明结合自然语言处理技术,先对数学题文和标准答案进行解析,再利用深度学习方法,对有标注的语料进行训练,利用训练好的模型对新题目进行知识点标注。通过上述方式,本发明能够省去大量人工标注工作,不仅高效,且准确率高。
本发明的有益效果包括:通过实现知识点标注的自动化,大大提高了对数学题目知识点标注的工作效率和准确率。进一步的,由于知识点是题目重要特征之一,准确高效的知识点标注,为下一步的智能组卷和试题推荐的精准性提供了基础性保障,对智能组卷和试题推荐等运用具有重要意义。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1是本发明实施例中一种基于深度学习的数学知识点自动化标注方法流程图。
图2是本发明实施例中基于深度学习的数学知识点自动化标注实例处理流程图。
具体实施方式
实施例一如图1所示,一种基于深度学习的数学知识点自动化标注方法,包括如下步骤:
S1:准备标注好知识点的训练样本集,并对数学文本进行预处理;
S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量,将结果保存为{词语/字符:词向量}的字典形式,为之后训练神经网络模型备用;S3:搭建两层TextCNN神经网络模型,输入有标注的训练样本集,训练模型。
具体工作中包括模型框架设计,本发明采用搭建两层TextCNN网络,结构为词嵌入-卷积-池化-卷积-池化-dropout。其中设计多个不同视野的卷积核采集数学文本信息。词嵌入为预先训练的字符级\词语级的word2vec向量,本发明训练的词向量模型为CBOW模型。
在另一个实施例中,所述步骤S1具体包括一下步骤:
S11:将数学题目和解析合并为数学文本,对数学文本进行预处理。首先进行标准化,同一化。例如:“推想|推测|推断|类推|猜想“都同一化为“推理”等。
S12:本方法分别按字符级,词级别对文本拆分。对于词语级别,本方法采用jieba工具包加数学领域专有词表对文本进行分词,包括文本中的数学公式,符号等。
S13:对文本进行关键词提取,具体方法采用tf-idf算法,计算每个关键词或字符在每类知识点中的tf-idf得分,过滤掉低分词。
在另一实施例中,所属步骤S3具体包括以下步骤:
S31:搭建两层TextCNN神经网络,其中embedding层输入为预训练的词向量(字符级或词语级)。并结合数学语言特点,设计多个不同大小的卷积核。采用dropout和l2范式防止模型过拟合。
S32:将文本和知识点类别标签编码为0,1离散型向量输入到神经网络中,将模型转化为多个独立二分类来进行训练,并对正样本进行加权以解决正负样本不平衡问题。最终确定概率值大于阈值的类别索引为该题的知识点。
本发明的实施例二
一种基于深度学习的数学知识点自动化标注方法,包括:
S1:数学文本预处理,分别进行标准化,分词和去停用词处理;
S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量;
S3:搭建两层TextCNN神经网络模型,输入有标注的训练样本集,训练模型;
所述步骤S1具体包括以下步骤:
S11:对数学文本进行标准化,主要做文本规范化和同义词替换。例如:“图象”替换为“图像”,“°|circ|degree”替换为“度”,“//|parallel”替换为“平行”等。去停用词即去掉高频且无重要意义的词语,如“的”,“,”,“!”,“\”等。
S12:用tf-idf对每类知识点题目进行关键词筛选,去掉tf-idf得分低的词语。具体做法为按知识点对数学文本进行分类,包含该知识点的所有题文作为该知识点的语料库进行关键词提取,并去掉低分词。
所述步骤S2具体包括以下步骤:
S21:准备十万级以上数学文本作为数学领域语料库进行词向量训练,分别按字符级别,词级别训练词向量备用。对于词语级别的词向量训练,首先要针对数学文本进行分词。本方法采用jieba分词工具,但在jieba分词的基础上,添加了数学领域专有名词表,使得分词更有针对性,且准确率更高。本方法创新性得将数学文本中的表达式也一起分词,这样可以分出表达式中的组合信息,例如:y=sin(x)-ln(x),分词结果为“y/=/sin/(/x/)/-/ln/(/x/)”,这样可以得到更多关于表达式的信息,结果证明该方法简单且高效。
S22:采用gensim工具包进行词向量训练,本方法选择CBOW模型。
所述步骤S3具体包括以下步骤:
搭建TextCNN网络结构为:Embedding--conv--max_pooling--conv--max_pooling--dropout。其中embedding层为预训练的词向量。采用多个不同大小的卷积核大小,使得神经网络有更丰富的视野,获取更多题文信息。
如图2所示,一种基于深度学习的数学知识点自动化标注方法,基于实例处理过程,具体说明本方法的实施过程(以字符级分词为例)。包括如下步骤:
S1:对一道新入库的题目(题文+解析):一个四面体的三视图如图所示,则该四面体的表面积是()四面体的直观图如图所示,设O是AC的中点,则OP=OB=1,因此PB=\sqrt2,于是,S_{PAB}=S_{PBC}=\frac{1}{2}\times\frac{{\sqrt 6}}{2}\times\sqrt 2=\frac{{\sqrt 3}}{2},S_{PAC}=S_{ABC}=\frac{1}{2}\times{2}\times{1=1},故四面体的表面积S={2}\times{1+2}\times\frac{{\sqrt 3}}{2}{=2+}\sqrt 3,经过去停用词和tf-idf筛选后的文本为:“一/个/四/面/体/三/视/图/如/图/所/示/则/该/四/面/体/表/面/积/是/#/四/面/体/直/观/图/如/图/所/示/设/O/是/A/C/中/点/则/O/P/=/O/B/=/1/因/此/P/B/=/s/q/r/t/2/于/是/S/P/A/B/=/S/P/B/C/=/f/r/a/c/1/2/t/i/m/e/s/f/r/a/c/s/q/r/t/6/2/t/i/m/e/s/s/q/r/t/2/=/f/r/a/c/s/q/r/t/3/2/S/P/A/C/=/S/A/B/C/=/f/r/a/c/1/2/t/i/m/e/s/2/t/i/m/e/s/1/=/1/故/四/面/体/表/面/积/S/=/2/t/i/m/e/s/1/+/2/t/i/m/e/s/f/r/a/c/s/q/r/t/3/2/=/2/+/s/q/r/t/3”。
S2:文本向量化:具体为有基于数学语料得到的字符索引词典,将字符映射为相应的词典索引序列。如下表所示:
S3:利用训练好的模型,预测新题目对应的标签索引。通过计算该题目可能取到各个考点的概率值大小(0.32,0.75,0.03,0.81,…,0.045),输出大于阈值的索引号为最终预测类别(1,3)。其中,阈值即为区分是否取到该类别的判断标准值,为临界值,大于该值,则认为取到该类别,否则认为取不到该类别。
S4:利用考点索引与考点对应的词典,将预测输出的类别序列映射为考点。索引号与考点映射表为:{0:函数的值域,1:空间几何体的特征、三视图和直观图,2:三角函数的综合应用,3:空间几何体的表面积与体积……},在确定本题考点为:空间几何体的特征、三视图和直观图,空间几何体的表面积与体积。
值得说明的是,虽然前述内容已经参考若干具体实施方式描述了本发明创造的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (6)

1.一种数学试题知识点自动化标注方法,该标注方法基于深度学习模型,其特征在于,所述标注方法包括步骤:
S1:数学试题文本进行预处理,包括分别进行标准化、分词和去停用词处理;
S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量;
S3:搭建两层TextCNN神经网络模型,输入有标注的数学试题训练样本集,训练该神经网络模型,利用该模型实现对新入题库的数学题目进行知识点自动化标注。
2.如权利要求1所述数学试题知识点自动化标注方法,其特征在于,所述步骤S1具体包括以下步骤:
S11:通过文本规范化和同义词替换对数学文本进行标准化;
S12:用tf-idf对每类知识点题目进行关键词筛选,去掉tf-idf得分低的词语。
3.如权利要求1所述数学试题知识点自动化标注方法,其特征在于,所述步骤S2具体包括以下步骤:
S21:准备多个数学文本作为数学领域语料库进行词向量训练,分别按字符级别、词语级别训练词向量备用,对于词语级别的词向量训练,首先针对数学文本进行分词;
S22:采用工具包进行词向量训练。
4.如权利要求3所述数学试题知识点自动化标注方法,其特征在于,步骤S21中,分词时,将数学文本中的表达式也一起分词,分出表达式中的组合信息。
5.如权利要求1所述数学试题知识点自动化标注方法,其特征在于,所述步骤S3具体包括以下步骤:
S31:搭建两层TextCNN神经网络,其中embedding层输入为预训练的词向量,并结合数学语言特点,设计多个不同大小的卷积核;
S32:将文本和知识点类别标签编码为0、1离散型向量输入到神经网络中,将模型转化为多个独立二分类来进行训练,并对正样本进行加权以解决正负样本不平衡问题,最终确定概率值大于阈值的类别索引为试题的知识点。
6.一种数学试题知识点自动化标注装置,其特征在于,所述自动化标注装置基于深度学习模型,该装置包括存储器;以及
耦合到所述存储器的处理器,该处理器被配置为执行存储在所述存储器中的指令,所述处理器执行以下操作:
S1:数学试题文本进行预处理,包括分别进行标准化、分词和去停用词处理;
S2:准备数学领域语料库,分别按字符级别,词级别训练数学领域词向量;
S3:搭建两层TextCNN神经网络模型,输入有标注的数学试题训练样本集,训练该神经网络模型,利用该模型实现对新入题库的数学题目进行知识点自动化标注。
CN201810067572.XA 2018-01-24 2018-01-24 一种数学试题知识点自动化标注方法和装置 Pending CN108182177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810067572.XA CN108182177A (zh) 2018-01-24 2018-01-24 一种数学试题知识点自动化标注方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810067572.XA CN108182177A (zh) 2018-01-24 2018-01-24 一种数学试题知识点自动化标注方法和装置

Publications (1)

Publication Number Publication Date
CN108182177A true CN108182177A (zh) 2018-06-19

Family

ID=62551342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810067572.XA Pending CN108182177A (zh) 2018-01-24 2018-01-24 一种数学试题知识点自动化标注方法和装置

Country Status (1)

Country Link
CN (1) CN108182177A (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985293A (zh) * 2018-06-22 2018-12-11 深源恒际科技有限公司 一种基于深度学习的图像自动化标注方法及系统
CN109326279A (zh) * 2018-11-23 2019-02-12 北京羽扇智信息科技有限公司 一种文本转语音的方法、装置、电子设备和存储介质
CN109359201A (zh) * 2018-10-15 2019-02-19 浙江蓝鸽科技有限公司 多媒体教学资源的编码、存储方法及其设备
CN109359290A (zh) * 2018-08-20 2019-02-19 国政通科技有限公司 试题文本的知识点确定方法、电子设备及存储介质
CN109408631A (zh) * 2018-09-03 2019-03-01 平安医疗健康管理股份有限公司 药品数据处理方法、装置、计算机设备和存储介质
CN109635100A (zh) * 2018-12-24 2019-04-16 上海仁静信息技术有限公司 一种相似题目的推荐方法、装置、电子设备及存储介质
CN109766548A (zh) * 2018-12-29 2019-05-17 北京京师乐学教育科技有限公司 考点识别方法、装置、设备和计算机存储介质
CN109815339A (zh) * 2019-01-02 2019-05-28 平安科技(深圳)有限公司 基于TextCNN知识抽取方法、装置、计算机设备及存储介质
CN109947923A (zh) * 2019-03-21 2019-06-28 江西风向标教育科技有限公司 一种基于词向量的初等数学题型自动提取方法及系统
CN109948473A (zh) * 2019-03-04 2019-06-28 中国计量大学 一种基于神经网络的提升学生应用题解题能力的方法
CN110134767A (zh) * 2019-05-10 2019-08-16 云知声(上海)智能科技有限公司 一种词汇表的筛选方法
CN110362723A (zh) * 2019-05-31 2019-10-22 平安国际智慧城市科技股份有限公司 一种题目特征表示方法、装置及存储介质
CN110377802A (zh) * 2019-07-26 2019-10-25 江苏曲速教育科技有限公司 一种新增试题的知识点标注方法及系统
CN110413789A (zh) * 2019-07-31 2019-11-05 广西师范大学 一种基于svm的习题自动分类方法
CN110472044A (zh) * 2019-07-11 2019-11-19 平安国际智慧城市科技股份有限公司 数学题的知识点分类方法、装置、可读存储介质及服务器
CN110704510A (zh) * 2019-10-12 2020-01-17 中森云链(成都)科技有限责任公司 一种结合用户画像的题目推荐方法及系统
CN110852071A (zh) * 2019-11-08 2020-02-28 科大讯飞股份有限公司 知识点检测方法、装置、设备及可读存储介质
CN110851723A (zh) * 2019-11-14 2020-02-28 上海钦文信息科技有限公司 一种基于大规模知识点标注结果的英语习题推荐方法
CN111563166A (zh) * 2020-05-28 2020-08-21 浙江学海教育科技有限公司 一种针对数学问题分类的预训练模型方法
CN111737402A (zh) * 2020-06-23 2020-10-02 上海松鼠课堂人工智能科技有限公司 题库智能知识点标注系统
CN111767307A (zh) * 2020-07-06 2020-10-13 北京猿力未来科技有限公司 对象处理方法及系统、数学题目批改方法及系统
CN111931020A (zh) * 2020-10-12 2020-11-13 北京世纪好未来教育科技有限公司 公式的标注方法、装置、设备及存储介质
CN112580361A (zh) * 2020-12-18 2021-03-30 蓝舰信息科技南京有限公司 基于统一注意力机制的公式及文字识别模型方法
CN113420543A (zh) * 2021-05-11 2021-09-21 江苏大学 基于改进Seq2Seq模型的数学试题自动标注方法
CN113626588A (zh) * 2020-05-09 2021-11-09 北京金山数字娱乐科技有限公司 卷积神经网络训练的方法和装置、文章分类的方法和装置
CN114757154A (zh) * 2022-06-13 2022-07-15 深圳市承儒科技有限公司 基于深度学习的作业生成方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170132526A1 (en) * 2015-11-11 2017-05-11 Adobe Systems Incorporated Structured Knowledge Modeling and Extraction from Images
CN106776724A (zh) * 2016-11-16 2017-05-31 福建天泉教育科技有限公司 一种题目分类方法及系统
CN107169043A (zh) * 2017-04-24 2017-09-15 成都准星云学科技有限公司 一种基于标准答案的知识点自动提取方法及系统
CN107590127A (zh) * 2017-09-21 2018-01-16 北京师范大学 一种题库知识点自动标注方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170132526A1 (en) * 2015-11-11 2017-05-11 Adobe Systems Incorporated Structured Knowledge Modeling and Extraction from Images
CN106776724A (zh) * 2016-11-16 2017-05-31 福建天泉教育科技有限公司 一种题目分类方法及系统
CN107169043A (zh) * 2017-04-24 2017-09-15 成都准星云学科技有限公司 一种基于标准答案的知识点自动提取方法及系统
CN107590127A (zh) * 2017-09-21 2018-01-16 北京师范大学 一种题库知识点自动标注方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
YOON KIM: "Convolutional Neural Networks for Sentence Classification", 《ARXIV.ORG/ABS/1408.5882》 *
吕征达: "基于机器学习的试题多知识点和认知动词自动标注研究", 《中国优秀硕士学位论文全文数据库》 *
数据派THU: "300万知乎多标签文本分类任务经验分享", 《HTTPS://BLOG.CSDN.NET/TMB8Z9VDM66WH68VX1/ARTICLE/DETAILS/78679672》 *
数据派THU: "300万知乎多标签文本分类任务经验分享", 《HTTPS://MP.WEIXIN.QQ.COM/S/YCOWKHXJ1TLTARRWV0OBDA》 *

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985293A (zh) * 2018-06-22 2018-12-11 深源恒际科技有限公司 一种基于深度学习的图像自动化标注方法及系统
CN109359290A (zh) * 2018-08-20 2019-02-19 国政通科技有限公司 试题文本的知识点确定方法、电子设备及存储介质
CN109359290B (zh) * 2018-08-20 2023-05-05 国政通科技有限公司 试题文本的知识点确定方法、电子设备及存储介质
CN109408631A (zh) * 2018-09-03 2019-03-01 平安医疗健康管理股份有限公司 药品数据处理方法、装置、计算机设备和存储介质
WO2020048264A1 (zh) * 2018-09-03 2020-03-12 平安医疗健康管理股份有限公司 药品数据处理方法、装置、计算机设备和存储介质
CN109408631B (zh) * 2018-09-03 2023-06-20 深圳平安医疗健康科技服务有限公司 药品数据处理方法、装置、计算机设备和存储介质
CN109359201A (zh) * 2018-10-15 2019-02-19 浙江蓝鸽科技有限公司 多媒体教学资源的编码、存储方法及其设备
CN109359201B (zh) * 2018-10-15 2021-07-30 浙江蓝鸽科技有限公司 多媒体教学资源的编码、存储方法及其设备
CN109326279A (zh) * 2018-11-23 2019-02-12 北京羽扇智信息科技有限公司 一种文本转语音的方法、装置、电子设备和存储介质
CN109635100A (zh) * 2018-12-24 2019-04-16 上海仁静信息技术有限公司 一种相似题目的推荐方法、装置、电子设备及存储介质
CN109766548A (zh) * 2018-12-29 2019-05-17 北京京师乐学教育科技有限公司 考点识别方法、装置、设备和计算机存储介质
CN109766548B (zh) * 2018-12-29 2023-01-31 北京京师乐学教育科技有限公司 考点识别方法、装置、设备和计算机存储介质
CN109815339A (zh) * 2019-01-02 2019-05-28 平安科技(深圳)有限公司 基于TextCNN知识抽取方法、装置、计算机设备及存储介质
CN109815339B (zh) * 2019-01-02 2022-02-08 平安科技(深圳)有限公司 基于TextCNN知识抽取方法、装置、计算机设备及存储介质
CN109948473A (zh) * 2019-03-04 2019-06-28 中国计量大学 一种基于神经网络的提升学生应用题解题能力的方法
CN109947923A (zh) * 2019-03-21 2019-06-28 江西风向标教育科技有限公司 一种基于词向量的初等数学题型自动提取方法及系统
CN110134767A (zh) * 2019-05-10 2019-08-16 云知声(上海)智能科技有限公司 一种词汇表的筛选方法
CN110134767B (zh) * 2019-05-10 2021-07-23 云知声(上海)智能科技有限公司 一种词汇表的筛选方法
CN110362723B (zh) * 2019-05-31 2022-06-21 平安国际智慧城市科技股份有限公司 一种题目特征表示方法、装置及存储介质
CN110362723A (zh) * 2019-05-31 2019-10-22 平安国际智慧城市科技股份有限公司 一种题目特征表示方法、装置及存储介质
CN110472044A (zh) * 2019-07-11 2019-11-19 平安国际智慧城市科技股份有限公司 数学题的知识点分类方法、装置、可读存储介质及服务器
CN110377802B (zh) * 2019-07-26 2021-07-02 江苏曲速教育科技有限公司 一种新增试题的知识点标注方法及系统
CN110377802A (zh) * 2019-07-26 2019-10-25 江苏曲速教育科技有限公司 一种新增试题的知识点标注方法及系统
CN110413789A (zh) * 2019-07-31 2019-11-05 广西师范大学 一种基于svm的习题自动分类方法
CN110704510A (zh) * 2019-10-12 2020-01-17 中森云链(成都)科技有限责任公司 一种结合用户画像的题目推荐方法及系统
CN110852071A (zh) * 2019-11-08 2020-02-28 科大讯飞股份有限公司 知识点检测方法、装置、设备及可读存储介质
CN110852071B (zh) * 2019-11-08 2023-10-24 科大讯飞股份有限公司 知识点检测方法、装置、设备及可读存储介质
CN110851723A (zh) * 2019-11-14 2020-02-28 上海钦文信息科技有限公司 一种基于大规模知识点标注结果的英语习题推荐方法
CN110851723B (zh) * 2019-11-14 2022-09-23 学利网络科技(上海)有限公司 一种基于大规模知识点标注结果的英语习题推荐方法
CN113626588A (zh) * 2020-05-09 2021-11-09 北京金山数字娱乐科技有限公司 卷积神经网络训练的方法和装置、文章分类的方法和装置
CN111563166A (zh) * 2020-05-28 2020-08-21 浙江学海教育科技有限公司 一种针对数学问题分类的预训练模型方法
CN111563166B (zh) * 2020-05-28 2024-02-13 浙江学海教育科技有限公司 一种针对数学问题分类的预训练模型方法
CN111737402A (zh) * 2020-06-23 2020-10-02 上海松鼠课堂人工智能科技有限公司 题库智能知识点标注系统
CN111767307A (zh) * 2020-07-06 2020-10-13 北京猿力未来科技有限公司 对象处理方法及系统、数学题目批改方法及系统
CN111931020A (zh) * 2020-10-12 2020-11-13 北京世纪好未来教育科技有限公司 公式的标注方法、装置、设备及存储介质
CN112580361A (zh) * 2020-12-18 2021-03-30 蓝舰信息科技南京有限公司 基于统一注意力机制的公式及文字识别模型方法
CN113420543A (zh) * 2021-05-11 2021-09-21 江苏大学 基于改进Seq2Seq模型的数学试题自动标注方法
CN113420543B (zh) * 2021-05-11 2024-03-22 江苏大学 基于改进Seq2Seq模型的数学试题自动标注方法
CN114757154A (zh) * 2022-06-13 2022-07-15 深圳市承儒科技有限公司 基于深度学习的作业生成方法、装置、设备及存储介质
CN114757154B (zh) * 2022-06-13 2022-09-30 深圳市承儒科技有限公司 基于深度学习的作业生成方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108182177A (zh) 一种数学试题知识点自动化标注方法和装置
CN110750959B (zh) 文本信息处理的方法、模型训练的方法以及相关装置
CN110427463B (zh) 搜索语句响应方法、装置及服务器和存储介质
US9779085B2 (en) Multilingual embeddings for natural language processing
CN110825875B (zh) 文本实体类型识别方法、装置、电子设备和存储介质
WO2018028077A1 (zh) 一种基于深度学习的中文语义分析的方法及装置
Azpiazu et al. Multiattentive recurrent neural network architecture for multilingual readability assessment
CN112270196B (zh) 实体关系的识别方法、装置及电子设备
CN107330011A (zh) 多策略融合的命名实体的识别方法及装置
CN110825867B (zh) 相似文本推荐方法、装置、电子设备和存储介质
CN111159356B (zh) 基于教学内容的知识图谱构建方法
CN107301165A (zh) 一种试题难度分析方法及系统
CN112035675A (zh) 医疗文本标注方法、装置、设备及存储介质
CN110781681B (zh) 一种基于翻译模型的初等数学应用题自动求解方法及系统
CN108090099B (zh) 一种文本处理方法及装置
CN108182275A (zh) 一种数学变式训练题推送系统以及关联方法
CN114595327A (zh) 数据增强方法和装置、电子设备、存储介质
CN115357719A (zh) 基于改进bert模型的电力审计文本分类方法及装置
CN111126610A (zh) 题目分析方法、装置、电子设备和存储介质
CN107797981B (zh) 一种目标文本识别方法及装置
Tüselmann et al. Recognition-free question answering on handwritten document collections
CN113901224A (zh) 基于知识蒸馏的涉密文本识别模型训练方法、系统及装置
CN107783958B (zh) 一种目标语句识别方法及装置
Tashu et al. Deep Learning Architecture for Automatic Essay Scoring
CN110765241A (zh) 推荐题的超纲检测方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180619