CN116955589A - 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 - Google Patents
一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 Download PDFInfo
- Publication number
- CN116955589A CN116955589A CN202311205733.4A CN202311205733A CN116955589A CN 116955589 A CN116955589 A CN 116955589A CN 202311205733 A CN202311205733 A CN 202311205733A CN 116955589 A CN116955589 A CN 116955589A
- Authority
- CN
- China
- Prior art keywords
- teaching material
- knowledge graph
- knowledge
- proposition
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000463 material Substances 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000003860 storage Methods 0.000 title claims abstract description 8
- 238000012360 testing method Methods 0.000 claims abstract description 63
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000013135 deep learning Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 7
- 230000033001 locomotion Effects 0.000 description 7
- 238000011835 investigation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 239000003638 chemical reducing agent Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003466 welding Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质,属于教育与评测领域,S1:依据电子教材结构特点抽取章、节、段落标题结构化实体信息;S2:根据电子教材的各科目内容特点选取对应的专业词汇识别方式;S3:以结构化的标题信息和专业词汇信息构建知识图谱,节点类型包括章、节、段落、知识点、专业词汇;S4:以嵌入表示知识图谱节点,嵌入表示方法包括基于图结构和文本语义;S5:根据科目特点由专家制定试题生成规则,规则自学习后再结合实体的嵌入表示及图谱的结构自动生成试题。本发明能够根据电子教材及参考专家经验自动化的生成与教材内容相关的、更具解释性的多类型试题。
Description
技术领域
本发明属于教育与评测领域,尤其涉及一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质。
背景技术
目前的命题的方法四种形式是原命题、逆命题、否命题和逆否命题,命题(判断)是指一个判断句的语义(实际表达的概念),命题不是指判断句本身,而是指所表达的语义。比如,原命题和逆命题可以表示为一个命题的题设和结论分别是另一个命题的结论和题设,则这样的两个命题互称为原命题和逆命题。而否命题:对于两个命题,若其中一个命题的条件和结论分别是另一个命题的条件的否定和结论的否定,则这两个命题互为否命题。
以上的命题方式主要依赖于人工设计和审核,存在主观性、重复性、效率低下等问题,而智能命题则可以通过机器学习、自然语言处理等技术,实现自动化命题、智能化评分等功能,提高命题效率和准确性,同时也可以满足不同学生的需求,提供个性化的学习体验。
而随着人工智能技术的发展和应用,以及教育领域对高效、精准、个性化教学的需求不断增加,智能命题作为一种新型的命题方式应运而生。
现有技术中,深度学习、知识图谱和自然语言处理技术的突破与广泛应用驱动了人工智能的实质进步,实现了基于深度学习的试题自动化生成,但是生成的试题质量好坏不可控且不具备可解释性,影响了深度学习在命题过程中的应用。
发明内容
本发明提供一种基于教材知识图谱的智能命题方法,方法是为了实现能够根据电子教材及参考专家经验自动化的生成与教材内容相关的、更具解释性的多类型试题。
方法包括:
S1:依据电子教材结构特点抽取章、节、段落标题结构化实体信息;
S2:根据电子教材的各科目内容特点选取对应的专业词汇识别方式;
S3:以结构化的标题信息和专业词汇信息构建知识图谱,知识图谱的节点类型包括章、节、段落、知识点、专业词汇;
S4:以嵌入表示知识图谱的节点类型,嵌入表示包括基于图结构和文本语义;
S5:根据科目特点由专家制定试题生成规则,规则自学习后再结合实体的嵌入表示及图谱的结构自动生成试题。
进一步需要说明的是,步骤S1中还涉及对电子教材的自动化解析,具体步骤包括:
S11:对章、节、段落标题做预处理,删除其中的特殊字符,将文档内图像建立知识索引并存储;
S12、利用正则匹配得到标题内容,对标题标号进行特殊字符替换;
S13、利用特殊字符对教材内容进行切分,层层分析得到标题及对应内容。
进一步需要说明的是,专业词汇识别方式包括:有监督深度学习方法和无监督深度学习方法。
进一步需要说明的是,步骤S2中,以有监督的深度学习方法包括如下步骤;
根据词汇字典、网络爬虫及教材章、节、知识点信息自动化生成训练、测试数据;
通过反向传播算法进行误差传递,利用优化器更新模型参数,完成专业词汇识别模型的训练。
进一步需要说明的是,步骤S5中所述试题生成规则的制作与自学习包括如下步骤:
S51、根据考试大纲要求和考试等级要求,制作试题生成规则;
S52、对规则进行自学习并生成模型;
S53、利用模型对教材段落内容进行处理,自动化抽取中知识点信息和题干信息;
S54、利用图谱节点嵌入表示生成带干扰项的多类型试题。
本发明还提供一种基于教材知识图谱的智能命题系统,系统包括:教材解析模块、专业词汇识别模块、知识图谱构建模块、知识表示学习模块以及试题生成模块;
教材解析模块,用于依据电子教材结构特点抽取章、节、段落标题结构化实体信息;
专业词汇识别模块,用于根据电子教材的各科目内容特点选取对应的专业词汇识别方式;
知识图谱构建模块,用于以结构化的标题信息和专业词汇信息构建知识图谱,知识图谱的节点类型包括章、节、段落、知识点、专业词汇;
知识表示学习模块,用于以嵌入表示知识图谱的节点类型,嵌入表示包括基于图结构和文本语义;
试题生成模块,用于根据科目特点由专家制定试题生成规则,规则自学习后再结合实体的嵌入表示及图谱的结构自动生成试题。
本发明还提供一种命题终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,处理器执行所述程序时实现基于教材知识图谱的智能命题方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于教材知识图谱的智能命题方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明提供的基于教材知识图谱的智能命题方法,可以对电子教材的自动化解析;对电子教材的专业词汇识别,根据各科目内容特点选取对应专业词汇识别,再以结构化的标题信息和专业词汇信息构建知识图谱,知识图谱节点的嵌入表示;试题生成规则的制作与自学习,根据科目特点由专家制定试题生成规则,规则自学习后自动化的生成试题。这样,本发明能够根据电子教材及参考专家经验自动化的生成与教材内容相关的、更具解释性的多类型试题。有效解决了生成的试题质量好坏不可控且不具备可解释性的问题。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为基于教材知识图谱的智能命题方法流程图;
图2为本发明的专业词汇识别模型结构图;
图3为本发明的专家知识自学习模型及试题生成结构图;
图4为本发明实例选项图;
图5为基于教材知识图谱的智能命题系统示意图。
具体实施方式
本发明提供的基于教材知识图谱的智能命题方法是为了解决基于深度学习的试题自动化生成的试题质量好坏不可控且不具备可解释性的问题。为了解决这一个问题,本发明的智能命题方法可以基于人工智能技术对关联的数据进行获取和处理。本发明的智能命题方法可以采用自然语言处理、深度学习、知识图谱、知识表示学习等技术。
本发明提供的智能命题方法中可以采用专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统等硬件,配合自然语言处理技术、机器学习/深度学习技术、知识图谱技术以及程序设计语言。程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。智能命题方法的程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行。这样,本发明涉及的基于教材知识图谱的智能命题方法依据教材结构特点抽取章、节、段落等标题结构化实体信息;通过识别电子教材的专业词汇,结合各科目内容特点选取对应专业词汇识别方法,根据科目特点由专家制定试题生成规则,规则自学习后自动化的生成试题。本发明能够根据电子教材及参考专家经验自动化的生成与教材内容相关的、更具解释性的多类型试题。进一步有效解决了生成的试题质量好坏不可控且不具备可解释性的问题。
本发明提供的基于教材知识图谱的智能命题方法应用于一个或者多个命题终端中,所述命题终端是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、可编程门阵列(Field-ProgrammableGate Array,FPGA)、数字处理器(DigitalSignalProcessor,DSP)、嵌入式设备等。
命题终端旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。命题终端还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
命题终端所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(VirtualPrivateNetwork,VPN)等。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1至图3所示是一具体实施例中基于专业教材知识图谱的智能命题方法整体流程图及相关模型结构图,方法包括:
S1:依据电子教材结构特点抽取章、节、段落标题结构化实体信息;
根据本发明的实施例来讲,步骤S1中所述电子教材的自动化解析,具体步骤为:
S11、对章、节、段落等标题做预处理,删除其中的特殊字符,文档图像建立知识索引并存储等;
S12、利用正则匹配得到标题内容,对标题标号进行特殊字符替换;
S13、利用特殊字符对教材内容进行切分,层层分析得到标题及对应内容。
示例性的讲:
S2:根据电子教材的各科目内容特点选取对应的专业词汇识别方式;
本实施例中,电子教材的专业词汇识别,具体步骤为:
S21、根据教材内容特点选取合适的专业词汇识别方法,以有监督的深度学习方法为例;
S22、根据词汇字典、网络爬虫及教材章、节、知识点等节点信息自动化生成训练、测试数据;
S23、通过反向传播算法进行误差传递,利用优化器更新模型参数,完成专业词汇识别模型的训练。
通过以上步骤完成专业词汇识别模型的训练。
示例性的讲:
S3:以结构化的标题信息和专业词汇信息构建知识图谱,知识图谱的节点类型包括章、节、段落、知识点、专业词汇;
其中,结构化的标题信息可以理解为用户预设标题信息的格式,可以以词组的形式设置标题信息,结合不同的科目设置相应的标题信息。专业词汇信息是基于相应的命题科目,从教材中,或者从题库中调取相应的专业词汇信息。系统可以基于历史储存的标题信息与相应专业词汇信息已有的关联联系,对结构化的标题信息和专业词汇信息进行匹配建立关系,形成知识图谱。
知识图谱中具有多个节点类型,本实施例中,节点类型包括了章、节、段落、知识点、专业词汇。章理解为知识图谱中最上层的一个分级,每个章可以具有多个节,每个节可以由多个段落,段落中具有至少一个知识点,知识点由多个专业词汇构成。
而上述的章、节、段落、知识点、专业词汇的构建,可以在标题信息和专业词汇信息得到,系统可以基于已有的,或者以往形成相应关联的章、节、段落、知识点、专业词汇,并根据当前需要命题的标题信息和专业词汇信息构建知识图谱,这其中构建的知识图谱包括了当前所需要的章、节、段落、知识点、专业词汇。
S4:以嵌入表示知识图谱的节点类型,嵌入表示包括基于图结构和文本语义;
本实施例为了突出生成的试题具备可解释性,也便于可追溯,可以将嵌入表示包括基于图结构和文本语义。也就是说在构建的知识图谱中,具有知识图谱的节点类型中涉及了图结构和文本语义。
示例性的讲,如果节点类型为专业词汇,可以对专业词汇进行嵌入表示,嵌入表示的方式可以使用图结构和文本语义进行进一步说明,以完善知识图谱的节点类型,使得生成的试题具备可解释性。同样的,也可以对段落或者知识点进行嵌入表示,嵌入表示的方式可以使用图结构和文本语义进行进一步说明,以完善知识图谱中段落或者知识点解释说明。
S5:根据科目特点由专家制定试题生成规则,规则自学习后再结合实体的嵌入表示及图谱的结构自动生成试题。
本实施例中,步骤S5中所述试题生成规则的制作与自学习,其具体步骤如下:S51、专家可根据考试大纲要求和考试等级要求,制作试题生成规则;
S52、对规则进行自学习,生成自学习模型;
S53、利用模型对教材进行处理,可自动化抽取中知识点信息和题干信息;
S54、利用图谱节点嵌入表示及图谱结构特点生成带干扰项的多类型试题。
S55、根据知识点及命制题目需求,可以将原文档中相关的图像进行嵌入,完善试题表述。
这样,本发明涉及的方法可实现不同科目的多类型试题快速生成,试题的生成质量整体可控,试题更具有可解释性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,提供了基于教材知识图谱的智能命题方法的实例,
以下是利用上述方法生成的部分试题结果:
(单选题)1.手部与腕部有机械接口,也可能有电接头、()、液接头。
A.喷嘴B.分流器C.气接头D.弹簧。
答案:气接头。
考察知识点:工业机器人基础与典型应用->工业机器人系统构成->工业机器人末端执行器->末端执行器的特点。
(单选题)2.以下哪项工业机器人系统的标识表示螺旋危险,检修前必须断电()。
具体选项如图4所示。答案:D螺旋危险标识。
考察知识点:工业机器人操作安全->安全标识。
(多选题)3.在示教过程中,控制系统可储存作业顺序、()、()运动速度和与生产工艺有关的信息。
A.运动路径B.运动过程C.运动特征D.运动方式。
答案:运动方式;运动路径。
考察知识点:工业机器人基础与典型应用->工业机器人系统构成->工业机器人控制系统->控制系统的基本功能。
(判断题)4.禁止强制扳动工业机器人、工业机器人的位姿、攀爬在工业机器人上,以免造成人身伤害或者设备损坏。
答案:×。
考察知识点:工业机器人操作安全->安全操作规程与防范措施->安全操作规程->操作注意事项。
(填空题)5.当焊枪接正极端子时表示为直流电极正(DCEP),称为()。
答案:反接。
考察知识点:工业机器人基础与典型应用->焊接工作站认知->常见焊接参数->极性。
(简答题)6.谐波减速器的结构谐波减速器主要由哪些内容组成。
答案:具有内齿的刚轮、具有外齿的柔轮;使柔轮发生径向变形的波发生器。
考察知识点:工业机器人基础与典型应用->工业机器人系统构成->工业机器人驱动系统->工业机器人减速器->谐波减速器。
从以上生成的试题可以看出本发明提出的方法具有生成质量可控及有可解释性的多类型试题。还可实现不同科目的多类型试题快速生成,试题的生成质量整体可控,试题更具有可解释性,如试题的产生原理(与考试大纲相对应)、试题的难度(考试等级、知识点类型、考纲要求程度等)、干扰项的产生(语义相近性、同属某一节点等)。
以下是本公开实施例提供的基于教材知识图谱的智能命题系统的实施例,该系统与上述各实施例的基于教材知识图谱的智能命题方法属于同一个发明构思,在基于教材知识图谱的智能命题系统的实施例中未详尽描述的细节内容,可以参考上述基于教材知识图谱的智能命题方法的实施例。
如图5所示,系统包括:教材解析模块、专业词汇识别模块、知识图谱构建模块、知识表示学习模块以及试题生成模块;
教材解析模块,用于依据电子教材结构特点抽取章、节、段落标题结构化实体信息;
专业词汇识别模块,用于根据电子教材的各科目内容特点选取对应的专业词汇识别方式;
知识图谱构建模块,用于以结构化的标题信息和专业词汇信息构建知识图谱,知识图谱的节点类型包括章、节、段落、知识点、专业词汇;
知识表示学习模块,用于以嵌入表示知识图谱的节点类型,嵌入表示包括基于图结构和文本语义;
试题生成模块,用于根据科目特点由专家制定试题生成规则,规则自学习后再结合实体的嵌入表示及图谱的结构自动生成试题。
上述模块可以在系统中以具体的操作界面为展现方式,比如教材解析模块可以具有解析操作界面以及解析过程的显示界面,解析操作界面可以提供供用户选择或者参数信息增删改查的窗口,满足用户对教材解析相关信息的设置,以满足系统的使用需要。当前其他几个模块也可以设置相应的界面满足使用要求。
本发明提供的基于教材知识图谱的智能命题系统中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明提供的基于教材知识图谱的智能命题方法及系统中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的本发明提供的基于教材知识图谱的智能命题方法可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明提供的基于教材知识图谱的智能命题方法公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的索引方法。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种基于教材知识图谱的智能命题方法,其特征在于,方法包括:
S1:依据电子教材结构特点抽取章、节、段落标题结构化实体信息;
S2:根据电子教材的各科目内容特点选取对应的专业词汇识别方式;
S3:以结构化的标题信息和专业词汇信息构建知识图谱,知识图谱的节点类型包括章、节、段落、知识点、专业词汇;
S4:以嵌入表示知识图谱的节点类型,嵌入表示包括基于图结构和文本语义;
S5:根据科目特点由专家制定试题生成规则,规则自学习后再结合实体的嵌入表示及图谱的结构自动生成试题。
2.根据权利要求1所述的基于教材知识图谱的智能命题方法,其特征在于,步骤S1中还涉及对电子教材的自动化解析,具体步骤包括:
S11:对章、节、段落标题做预处理,删除其中的特殊字符,将文档内图像建立知识索引并存储;
S12、利用正则匹配得到标题内容,对标题标号进行特殊字符替换;
S13、利用特殊字符对教材内容进行切分,层层分析得到标题及对应内容。
3.根据权利要求1所述的基于教材知识图谱的智能命题方法,其特征在于,专业词汇识别方式包括:有监督深度学习方法和无监督深度学习方法。
4.根据权利要求3所述的基于教材知识图谱的智能命题方法,其特征在于,步骤S2中,以有监督的深度学习方法包括如下步骤;
根据词汇字典、网络爬虫及教材章、节、知识点信息自动化生成训练、测试数据;
通过反向传播算法进行误差传递,利用优化器更新模型参数,完成专业词汇识别模型的训练。
5.根据权利要求1所述的基于教材知识图谱的智能命题方法,其特征在于,步骤S5中所述试题生成规则的制作与自学习包括如下步骤:
S51、根据考试大纲要求和考试等级要求,制作试题生成规则;
S52、对规则进行自学习并生成模型;
S53、利用模型对教材段落内容进行处理,自动化抽取中知识点信息和题干信息;
S54、利用图谱节点嵌入表示生成带干扰项的多类型试题。
6.一种基于教材知识图谱的智能命题系统,其特征在于,系统采用如权利要求1至5任意一项所述的基于教材知识图谱的智能命题方法;
系统包括:教材解析模块、专业词汇识别模块、知识图谱构建模块、知识表示学习模块以及试题生成模块;
教材解析模块,用于依据电子教材结构特点抽取章、节、段落标题结构化实体信息;
专业词汇识别模块,用于根据电子教材的各科目内容特点选取对应的专业词汇识别方式;
知识图谱构建模块,用于以结构化的标题信息和专业词汇信息构建知识图谱,知识图谱的节点类型包括章、节、段落、知识点、专业词汇;
知识表示学习模块,用于以嵌入表示知识图谱的节点类型,嵌入表示包括基于图结构和文本语义;
试题生成模块,用于根据科目特点由专家制定试题生成规则,规则自学习后再结合实体的嵌入表示及图谱的结构自动生成试题。
7.一种命题终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述基于教材知识图谱的智能命题方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于教材知识图谱的智能命题方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311205733.4A CN116955589B (zh) | 2023-09-19 | 2023-09-19 | 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311205733.4A CN116955589B (zh) | 2023-09-19 | 2023-09-19 | 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116955589A true CN116955589A (zh) | 2023-10-27 |
CN116955589B CN116955589B (zh) | 2024-01-30 |
Family
ID=88454894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311205733.4A Active CN116955589B (zh) | 2023-09-19 | 2023-09-19 | 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116955589B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117891908A (zh) * | 2023-12-15 | 2024-04-16 | 广州网才信息技术有限公司 | 一种基于人工智能识别的辅助命题审题检索办法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255031A (zh) * | 2018-09-20 | 2019-01-22 | 苏州友教习亦教育科技有限公司 | 基于知识图谱的数据处理方法 |
CN109359215A (zh) * | 2018-12-03 | 2019-02-19 | 江苏曲速教育科技有限公司 | 视频智能推送方法和系统 |
CN112507140A (zh) * | 2021-02-08 | 2021-03-16 | 深圳市阿卡索资讯股份有限公司 | 一种个性化智能学习推荐方法、装置、设备及存储介质 |
CN113127731A (zh) * | 2021-03-16 | 2021-07-16 | 西安理工大学 | 一种基于知识图谱的个性化试题推荐方法 |
WO2021196520A1 (zh) * | 2020-03-30 | 2021-10-07 | 西安交通大学 | 一种面向税务领域知识图谱的构建方法及系统 |
WO2021208716A1 (zh) * | 2020-11-24 | 2021-10-21 | 平安科技(深圳)有限公司 | 基于知识图谱的辅助教学方法、装置、设备及存储介质 |
CN113569540A (zh) * | 2021-05-14 | 2021-10-29 | 南京奥派信息产业股份公司 | 基于社会科学类教材的试卷生成方法和装置 |
CN114610892A (zh) * | 2020-12-09 | 2022-06-10 | 深圳市企鹅网络科技有限公司 | 知识点标注方法、装置、电子设备和计算机存储介质 |
CN115048506A (zh) * | 2022-06-29 | 2022-09-13 | 广州市南方人力资源评价中心有限公司 | 基于知识图谱的试题生成系统、方法、装置及存储介质 |
WO2022218186A1 (zh) * | 2021-04-15 | 2022-10-20 | 京东科技控股股份有限公司 | 个性化知识图谱的生成方法、装置及计算机设备 |
CN115422457A (zh) * | 2022-09-05 | 2022-12-02 | 东莞市亚太未来软件有限公司 | 一种基于教育云平台的试题随机生成方法及系统 |
WO2023108991A1 (zh) * | 2021-12-15 | 2023-06-22 | 平安科技(深圳)有限公司 | 模型的训练方法、知识分类方法、装置、设备、介质 |
CN116756340A (zh) * | 2023-06-25 | 2023-09-15 | 森纵艾数(北京)科技有限公司 | 一种试题自动生成方法、系统及设备 |
-
2023
- 2023-09-19 CN CN202311205733.4A patent/CN116955589B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255031A (zh) * | 2018-09-20 | 2019-01-22 | 苏州友教习亦教育科技有限公司 | 基于知识图谱的数据处理方法 |
CN109359215A (zh) * | 2018-12-03 | 2019-02-19 | 江苏曲速教育科技有限公司 | 视频智能推送方法和系统 |
WO2021196520A1 (zh) * | 2020-03-30 | 2021-10-07 | 西安交通大学 | 一种面向税务领域知识图谱的构建方法及系统 |
WO2021208716A1 (zh) * | 2020-11-24 | 2021-10-21 | 平安科技(深圳)有限公司 | 基于知识图谱的辅助教学方法、装置、设备及存储介质 |
CN114610892A (zh) * | 2020-12-09 | 2022-06-10 | 深圳市企鹅网络科技有限公司 | 知识点标注方法、装置、电子设备和计算机存储介质 |
CN112507140A (zh) * | 2021-02-08 | 2021-03-16 | 深圳市阿卡索资讯股份有限公司 | 一种个性化智能学习推荐方法、装置、设备及存储介质 |
CN113127731A (zh) * | 2021-03-16 | 2021-07-16 | 西安理工大学 | 一种基于知识图谱的个性化试题推荐方法 |
WO2022218186A1 (zh) * | 2021-04-15 | 2022-10-20 | 京东科技控股股份有限公司 | 个性化知识图谱的生成方法、装置及计算机设备 |
CN113569540A (zh) * | 2021-05-14 | 2021-10-29 | 南京奥派信息产业股份公司 | 基于社会科学类教材的试卷生成方法和装置 |
WO2023108991A1 (zh) * | 2021-12-15 | 2023-06-22 | 平安科技(深圳)有限公司 | 模型的训练方法、知识分类方法、装置、设备、介质 |
CN115048506A (zh) * | 2022-06-29 | 2022-09-13 | 广州市南方人力资源评价中心有限公司 | 基于知识图谱的试题生成系统、方法、装置及存储介质 |
CN115422457A (zh) * | 2022-09-05 | 2022-12-02 | 东莞市亚太未来软件有限公司 | 一种基于教育云平台的试题随机生成方法及系统 |
CN116756340A (zh) * | 2023-06-25 | 2023-09-15 | 森纵艾数(北京)科技有限公司 | 一种试题自动生成方法、系统及设备 |
Non-Patent Citations (1)
Title |
---|
刘一然;骆力明;: "基于知识图谱的学科单选题考点提取研究", 计算机应用研究, no. 06, pages 99 - 101 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117891908A (zh) * | 2023-12-15 | 2024-04-16 | 广州网才信息技术有限公司 | 一种基于人工智能识别的辅助命题审题检索办法及系统 |
CN117891908B (zh) * | 2023-12-15 | 2024-06-04 | 广州网才信息技术有限公司 | 一种基于人工智能识别的辅助命题审题检索办法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116955589B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113505244B (zh) | 基于深度学习的知识图谱构建方法、系统、设备及介质 | |
CN112347268A (zh) | 一种文本增强的知识图谱联合表示学习方法及装置 | |
WO2021121198A1 (zh) | 基于语义相似度的实体关系抽取方法、装置、设备及介质 | |
CN116955589B (zh) | 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 | |
CN111524593B (zh) | 基于上下文语言模型和知识嵌入的医疗问答方法及系统 | |
CN110162766B (zh) | 词向量更新方法和装置 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN113901191A (zh) | 问答模型的训练方法及装置 | |
CN111858878B (zh) | 从自然语言文本中自动提取答案的方法、系统及存储介质 | |
CN109670168A (zh) | 基于特征学习的短答案自动评分方法、系统及存储介质 | |
CN108846138A (zh) | 一种融合答案信息的问题分类模型构建方法、装置和介质 | |
US20220392242A1 (en) | Method for training text positioning model and method for text positioning | |
CN115618045A (zh) | 一种视觉问答方法、装置及存储介质 | |
CN115048944A (zh) | 一种基于主题增强的开放域对话回复方法及系统 | |
CN117235215A (zh) | 基于大模型和知识图谱的生成对话方法、系统及介质 | |
WO2023169301A1 (zh) | 一种文本处理方法、装置及电子设备 | |
CN116680407A (zh) | 一种知识图谱的构建方法及装置 | |
CN113505207B (zh) | 一种金融舆情研报的机器阅读理解方法及系统 | |
CN112328812B (zh) | 基于自调参数的领域知识抽取方法与系统、电子设备 | |
CN114358579A (zh) | 评阅方法、评阅装置、电子设备以及计算机可读存储介质 | |
CN114357111A (zh) | 政策关联影响分析方法、装置、电子设备及存储介质 | |
CN111680163A (zh) | 一种面向电力科技成果的知识图谱可视化方法 | |
CN105808522A (zh) | 一种语义联想的方法及装置 | |
CN111708896A (zh) | 一种应用于生物医学文献的实体关系抽取方法 | |
US20230146519A1 (en) | Method for selecting annotated sample, apparatus, electronic device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |