CN114817552B - 一种习题关联关系处理方法、装置、设备及存储介质 - Google Patents

一种习题关联关系处理方法、装置、设备及存储介质

Info

Publication number
CN114817552B
CN114817552B CN202110129249.2A CN202110129249A CN114817552B CN 114817552 B CN114817552 B CN 114817552B CN 202110129249 A CN202110129249 A CN 202110129249A CN 114817552 B CN114817552 B CN 114817552B
Authority
CN
China
Prior art keywords
data
knowledge
chapter
knowledge point
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110129249.2A
Other languages
English (en)
Other versions
CN114817552A (zh
Inventor
林鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Original Assignee
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shiyuan Electronics Thecnology Co Ltd filed Critical Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority to CN202110129249.2A priority Critical patent/CN114817552B/zh
Publication of CN114817552A publication Critical patent/CN114817552A/zh
Application granted granted Critical
Publication of CN114817552B publication Critical patent/CN114817552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Creation or modification of classes or clusters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种习题关联关系处理方法、装置、设备及存储介质。该方法包括:获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。通过上述技术手段,解决了习题标签不够全面,关联关系不够全面的问题,以构建更全面的习题知识图谱。

Description

一种习题关联关系处理方法、装置、设备及存储介质
技术领域
本发明实施例涉及自适应学习技术领域,尤其涉及一种习题关联关系处理方法、装置、设备及存储介质。
背景技术
近年来,在线教育行业快速发展,涌现出一大批主打自适应学习的相关产品,其主旨是希望通过大数据+人工智能的手段,通过诊断学生的学习水平,给学生推荐合适的习题等,实现自适应学习。常见的自适应学习的技术方案是构建一个针对习题、知识点和章节的知识图谱,通过知识图谱的丰富信息,对于学生的行为和做题记录等进行建模,从而根据知识图谱的推理能力确定给学生推荐的习题。针对上述的技术方案,需要解决两个问题,一是习题标签的挖掘,二是知识图谱的构建。
发明人发现无论是现有技术中的习题标签挖掘方案还是知识图谱构建方案均存在一些问题。对于现有的习题标签挖掘方案,其挖掘的习题标签类型单一,不够全面,其只利用了题目的文本信息,而实际上的习题可能有章节等其他的标签信息,这些标签其实对于最终知识点的预测具有相当重要的作用,丢失了这部分的数据可能会影响最后的效果。此外,一道习题往往会与多个标签相关,如一道习题可能会考试考察多个知识点,与多个章节相关联,而一般的文本分类并没有办法解决这样的问题,仅仅只能预测出一种类型的一个标签。对于现有的知识图谱构建方案,其包含的关联关系不够全面,其只是寻找知识点和知识点之间的关联的,而实际上知识点和章节、章节和章节也存在一定的关联关系,这些关联关系不但有助于给题目标注标签,并且这些关系也有助于构建一个更全面的知识图谱。
发明内容
本发明实施例提供一种习题关联关系处理方法、装置、设备及存储介质,以解决习题挖掘和知识图谱构建时,习题标签不够全面,关联关系不够全面的问题,达到更好的自适应学习效果。
在第一方面,本发明实施例提供了一种习题关联关系处理方法,包括:
获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;
根据所述习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为所述综合图谱的三元组;
根据所述综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据所述向量三元组训练所述知识图谱嵌入模型,所述知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;
基于预设的链接预测规则,根据所述知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与所述习题数据相关联的章节数据和知识点数据。
在第二方面,本发明实施例提供了一种习题关联关系处理装置,包括:
数据获取模块,被配置为获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;
综合图谱构建模块,被配置为根据所述习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为所述综合图谱的三元组;
知识图谱构建模块,被配置为根据所述综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据所述向量三元组训练所述知识图谱嵌入模型,所述知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;
习题标签挖掘模块,被配置为基于预设的链接预测规则,根据所述知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与所述习题数据相关联的章节数据和知识点数据。
在第三方面,本发明实施例提供了一种电子设备,包括:
存储器以及一个或多个处理器;
存储器,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面的习题关联关系处理方法。
在第四方面,本发明实施例提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如第一方面的习题关联关系处理方法。
本发明实施例通过获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。通过上述技术手段,综合图谱中的数据和各数据之间的关系由知识图谱嵌入模型的向量表征,从而可以基于知识图谱嵌入模型中的向量,根据链接预测规则来确定与习题关联的章节和知识点,以实现对没有标签的习题进行章节标签和知识点标签的标注。除了可以确定习题关联的章节和知识点外,还可以确定知识点之间,章节之间,以及章节和知识点之间的关联关系,构建更详细更全面的知识图谱,以达到更好的自适应学习效果。对于新添加的习题数据,根据其新习题节点向量和新关系向量,可以快速调整知识图谱嵌入模型的结构,以知识图谱嵌入模型中的向量表征新添加的习题数据,实现了知识图谱嵌入模型的知识扩展功能。
附图说明
图1是本发明实施例一提供的一种习题关联关系处理方法的流程图;
图2是数据和数据关系一种可选的具体获取流程图;
图3是综合图谱一种可选的具体构建流程图。
图4是综合图谱示意图;
图5是向量三元组一种可选的构建流程图;
图6是知识图谱嵌入模型一种可选的具体训练流程图;
图7是习题的章节和知识点标签一种可选的具体标注流程图;
图8是本发明实施例二提供的一种习题关联关系处理方法的流程图;
图9是本发明实施例三提供的一种习题关联关系处理方法的流程图
图10是本发明实施例四提供的一种习题关联关系处理装置的结构示意图;
图11是本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
本发明实施例提供的习题关联关系处理方法、装置、设备及存储介质,旨在通过获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。相对于传统的习题标签挖掘方案,只利用了题目的文本信息,可能会丢失部分有效数据,从而影响最后的效果,且其仅仅只能预测出一种类型的一个标签。相对于传统的知识图谱构建方案其只是寻找知识点和知识点之间的关联的,而实际上知识点和章节、章节和章节也存在一定的关联关系,这些关联关系不但有助于给题目标注标签,并且这些关系也有助于构建一个更全面的知识图谱。基于此,本发明实施例提出一种习题关联关系处理方法、装置、设备及存储介质,以解决习题挖掘和知识图谱构建时,习题标签不够全面,关联关系不够全面的问题,达到更好的自适应学习效果。
实施例一
图1是本发明实施例一提供的一种习题关联关系处理方法的流程图。实施例中提供的习题关联关系处理方法可以基于习题关联关系处理设备执行,该习题关联关系处理设备可以通过软件或硬件的方式实现,该习题关联关系处理设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。
为了便于理解,实施例中以习题关联关系处理设备作为习题关联关系处理方法的执行主体进行示例性描述。
具体的,参考图1,本发明实施例提供的习题关联关系处理方法包括:
S110、获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系。
具体的,事先采集大量的习题数据,章节数据和知识点,并人工标注习题数据的章节标签和知识点标签,章节数据的章节标签和知识点标签,知识点数据的知识点标签和知识标签,其中部分习题数据的标签可能只包含章节标签或知识点标签,甚至部分习题数据没有标签,而章节数据和知识点标签也可能不是完整的。基于此,可根据现有的数据和数据关系构建知识图谱嵌入模型,以知识图谱嵌入模型的向量表征数据和数据关系,基于链接预测规则可获取更多知识图谱嵌入模型中向量之间的关系,从而完善习题数据,章节数据和知识点数据的标签。其中,知识图谱嵌入模型(Knowl edge Graph Embedd i ng)是一种解决知识图谱补全问题的方法,其通过将知识图谱中的实体和关系嵌入到连续向量空间,从而在方便计算实体关系的同时保留知识图谱中的结构信息。
为构建知识图谱嵌入模型,首先需获取现有的数据和数据关系,示例性的,参考图2,图2是数据和数据关系一种可选的具体获取流程图。如图2所示,数据和数据关系获取流程包括:
S1101、获取数据库中初始习题数据,确定初始习题数据的相似习题数据;
S1102、获取数据库中章节数据和知识点数据;
S1103、根据初始习题数据和相似习题数据的章节标签或知识点标签,确定初始习题数据和相似习题数据与章节数据或知识点数据之间的关联关系;
S1104、根据章节数据的章节标签或知识点标签,和知识点数据的章节标签或知识点标签,确定章节数据之间、知识点数据之间以及章节数据和知识点数据之间的关联关系。
示例性的,从数据库中获取第一个习题数据,计算第一个习题数据和其他习题数据的相似度,将达到预设相似度阈值的习题数据作为第一个习题数据。将相似习题数据作为下一个处理的习题数据,去计算该习题数据与除第一个习题数据之外的习题数据的相似度,确定该习题数据的相似习题数据,从而逐步确定数据库中所有习题数据之间的相似关系。进一步的,从数据库中获取章节数据和知识点数据,根据章节数据和知识点数据的标签,确定数据库中所有章节数据之间,所有知识点数据,以及章节数据和知识点数据之间的关联关系。根据习题数据的章节标签和知识点标签,确定数据库中的习题数据和数据库中的章节数据,知识点数据的关联关系。可理解的,上述所有章节数据之间的关联关系,所有知识点数据之间的关联关系,以及章节数据和知识点数据之间的关联关系是指根据当前数据的标签可确定的数据关系,而无法由标签确定的数据关系暂时还无法获取,而需要通过后续的知识图谱嵌入模型的向量来获取。
S120、根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组。
具体的,参考图3,图3是综合图谱一种可选的具体构建流程图。如图3所示,该综合图谱构建流程包括:
S1201、根据习题数据、相似习题数据和两者之间的相似关系,构建实体层图谱;
S1202、根据章节数据和知识点数据,章节数据之间、知识点数据之间以及章节数据和知识点数据之间的关联关系,构建本体层图谱;
S1203、根据习题数据与章节数据之间的关联关系,和习题数据与知识点数据之间的关联关系,将实体层中的习题数据与本体层中对应的章节数据和知识点数据相关联,得到综合图谱。
示例性的,参考图4,图4是综合图谱示意图。如图4所示,章节数据和知识点数据设置在本体层图谱中,通过本体层图谱的节点表征章节数据和知识数据,通过本体层图谱中两节点之间的边表征章节数据之间的相似或上下级关系,知识点数据之间的下级关系,以及知识点数据和章节数据之间的相关关系。习题数据设置在实体层图谱中,通过实体层图谱的节点表征习题数据,通过实体层图谱中两节点之间的边表征习题数据之间的相似关系。进一步的,根据数据库中习题数据和数据库中章节数据,知识点数据之间的关联关系,将实体层图谱中习题节点与本体层中章节节点和知识点节点相连接,构成实体层节点和本体层节点之间的边,从而将实体层和本体层构建成一个整体,得到综合图谱。综合图谱详细描述了数据库的习题数据,章节数据,知识点数据,以及各数据之间的关系,而综合图谱的三元组可以理解为构成整个综合图谱的单元数据组,三元组由综合图谱中关联的两个数据及其之间的关联关系组成,即两关联节点及其之间的边组成。
具体的,三元组中关联的两个数据可以包括:实体层中习题和相似习题、本体层中章节和关联章节,本体层中的知识点和关联知识点,本体层中的章节和关联知识点,实体层中的习题和本体层中的章节,实体层中的习题和本体层中的知识点,关联关系为上下级关系、相似关系或相关关系。示例性的,如图4所示,第一一级章节和第二一级章节以及两者之间的相似关系为一个三元组,第一一级章节和二级章节以及两者之间的下级关系为一个三元组,一级知识点和第一二级知识点以及两者之间的下级关系为一个三元组,第一习题和第二一级章节以及两者之间的关联关系为一个三元组,第二习题和第四习题以及两者之间的相似关系为一个三元组,第三习题和第一三级知识点以及两者之间的关联关系为一个三元组。图4中连线的两个端点和连线关系都能组成一个三元组,在此不再赘述图4中没有描述到的三元组。
S130、根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系。
由于综合图谱中三元组只能描述数据库中数据和对应的标签数据及两者之间的关系,和习题数据和相似习题数据及两者之间的关系,需将综合图谱中的知识补全。对此,需要引入链接预测规则,根据三元组中的任意两个数据,可确定两个数据之间的关系,而为确定两个数据之间是否存在关联,引入知识图谱嵌入模型,通过知识图谱嵌入模型中的向量表征综合图谱中的数据,根据两个向量之间的相似度确定两者是否存在关联。对此,需构建知识图谱嵌入模型,并确定每个数据在知识图谱嵌入模型中正确的节点向量。
首先需根据综合图谱中数据和各数据之间的关系构建知识图谱嵌入模型的向量三元组。示例性的,参考图5,图5是向量三元组一种可选的构建流程图。如图5所示,向量三元组构建流程包括:
S1301、根据综合图谱中的数据,以及综合图谱中数据之间的关联关系,在知识图谱嵌入模型中随机生成数据对应的节点向量,和关联关系对应的关系向量;
S1302、将两个关联的节点向量和对应的关系向量,作为向量三元组。
示例性的,将图4中本体层的章节节点和知识节点,实体层中的习题节点对应生成知识图谱嵌入模型中的章节节点向量,知识点节点向量和习题节点向量,将图4中实体层内两关联节点之间的边,本体层内两关联节点之间的边,和跨实体层和本体层两关联节点之间的边,对应生成知识图谱嵌入模型中的关系向量。
进一步的,将知识图谱嵌入模型中两个关联的节点向量,以及两者之间的关系向量作为向量三元组。由于知识图谱嵌入模型中的向量在生成时是随机生成的,此时知识图谱嵌入模型中的向量还不能表征综合图谱中的数据和数据关系。对此,将知识图谱嵌入模型中的向量三元组作为训练样本,基于向量三元组训练知识图谱嵌入模型,以使知识图谱嵌入模型中的向量能够表征综合图谱中的数据和数据关系。
具体的,参考图6,图6是知识图谱嵌入模型一种可选的具体训练流程图。如图6所示,知识图谱嵌入模型训练流程包括:
S1303、将向量三元组作为知识图谱嵌入模型的正样本三元组,并根据每一正样本三元组随机生成多个负样本三元组;其中,本体层和实体层内部的正样本三元组与对应的负样本三元组的关系向量相同;
S1304、根据正样本三元组、负样本三元组和预设的得分函数,计算正样本三元组和负样本三元组的分数;
S1305、根据正样本三元组和负样本三元组的分数,以及预设的损失函数,计算损失函数的结果,并根据损失函数的结果调整知识图谱嵌入模型中向量的向量值。
具体的,得分函数为fr(h,t)=hTMrt;
损失函数为
其中,JIntra为本体层和实体层内部的正样本三元组的损失函数,为跨实体层和本体层的正样本三元组的损失函数,w为权重系数,S1为本体层和实体层内部的正样本三元组的集合,S1′为本体层和实体层内部的正样本三元组对应的负样本三元组的集合,h和t分别为本体层和实体层内部的正样本三元组的头节点向量和尾节点向量,r为本体层和实体层内部的正样本三元组的关系向量,Mr为在r关系向量下的对角矩阵,h′和t′分别为本体层和实体层内部的正样本三元组对应的负样本三元组的头节点向量和尾节点向量,γ为第一分数阈值,c和e分别为跨本体层和实体层的正样本三元组的头节点向量和尾节点向量,c′为跨本体层和实体层的正样本三元组的负样本三元组的头节点向量,fCT为线性映射函数,用于将跨本体层和实体层的正样本三元组的尾节点向量映射到对应头节点向量的向量空间,γCT为第二分数阈值,S2为跨实体层和本体层的正样本三元组集合,|S2|为跨实体层和本体层的正样本三元组的总数量,[]+用于限定样本三元组代入对应的损失函数进行计算。
其中,损失函数公式中的中括号右下角的加号限定了只有对应的样本三元组才能代入对应的损失函数进行计算。例如损失函数JIntra限定了只有本体层内部或实体层内部的样本三元组才能代入损失函数JIntra进行计算,损失函数限定了只有跨本体层和实体层的样本三元组才能代入损失函数进行计算,样本三元组包括负样本三元组和正样本三元组。
示例性的,假设第二习题和第四习题以及两者之间的相似关系组成的三元组对应的正样本三元组为(h,r,t),h为第二习题的节点向量,t为第四习题的节点向量,r为第二习题和第四习题之间的边的关系向量。根据正样本三元组(h,r,t)随机生成对应的负样本(h′,r,t′)。可理解的,如果希望正样本三元组数据为真,则正样本三元组的分数越高,当正样本三元组的分数比负样本三元组的分数高出第一分数阈值γ时,则表明当前正样本三元组的向量贴近综合图谱中对应的三元组。若正样本三元组的分数没有比负样本三元组的分数高出第一分数阈值γ时,则表明当前正样本三元组的向量还不是正确的嵌入向量。此时需要引入本体层和实体层内部的正样本三元组的损失函数JIntra,通过本体层和实体层内部的正样本三元组的损失函数JIntra优化知识图谱嵌入模型的结构,以使的知识图谱嵌入模型中的向量更贴近综合图谱中的数据和数据关系。
而对于跨实体层和本体层的正样本三元组,由于实体层中的节点数量相对于本体层中的节点数量较多,跨实体层和本体层的正样本三元组中的头节点向量和尾节点向量表征的空间大小不一致,需要通过线性映射函数fCT将两者映射到同一个空间后才可以计算两者之间的得分。当跨实体层和本体层的正样本三元组的分数比负样本三元组的分数高出第二分数阈值γCT时,则表明当前正样本三元组的向量贴近综合图谱中对应的三元组。若正样本三元组的分数没有比负样本三元组的分数高出第二分数阈值γCT时,则表明当前正样本三元组的向量还不是正确的嵌入向量。此时需要引入跨实体层和本体层的正样本三元组的损失函数通过跨实体层和本体层的正样本三元组的损失函数优化知识图谱嵌入模型的结构,以使的知识图谱嵌入模型中的向量更贴近综合图谱中的数据和数据关系。
可理解的,由于在一次知识图谱嵌入模型的训练过程中,是基于所有的正样本三元组对其进行训练,每个正样本三元组都存在损失,因此在通过损失函数优化知识图谱嵌入模型的参数时,是计算所有正样本三元组的损失总和。相应的,在调整知识图谱嵌入模型的参数后,正样本三元组中向量的向量值也会相应改变,并通过改变后的正样本三元组训练知识图谱嵌入模型,直至所有正样本三元组的分数比负样本三元组的分数高出对应的分数阈值。
S140、基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。
具体的,完成训练后的知识图谱嵌入模型的向量可以表征综合图谱中的数据和数据关系,可根据知识图谱嵌入模型中的节点向量,基于链接预测规则,确定综合图谱中没有章节标签或知识点标签的习题数据是否和综合图谱中的章节数据,知识点数据相关联。示例性的,参考图7,图7是习题的章节和知识点标签一种可选的具体标注流程图。如图7所示,习题的章节和知识点标签标注流程包括:
S1401、获取待标注习题数据的节点向量,待标注习题数据为没有关联章节数据或知识点数据的习题数据;
S1402、获取所有章节数据和知识点数据的节点向量,计算待标注习题数据的节点向量与章节数据或知识点数据的节点向量之间的相似度;
S1403、若相似度小于预设的相似阈值,则将知识点数据或章节数据作为待标注习题数据的章节标签和知识点标签。
示例性的,获取没有关联章节节点或知识点节点的习题节点向量,获取知识图谱嵌入模型中所有章节节点向量和知识点节点向量,计算习题节点向量和章节节点向量,以及习题节点向量和知识点节点向量之间的余弦夹角,通过两个向量的夹角余弦值来评估两者之间的相似度,以确定两者之间是否存在关联。若余弦夹角小于预设的余弦阈值,则表明两者之间存在关联,则将章节节点向量和知识节点向量对应的章节数据和知识点数据作为习题节点向量对应的节点数据的标签。
示例性的,假设习题数据库中存在一个高中生物习题:“当细胞处于饥饿状态时,可降解自身的生物大分子,以产生营养成分供细胞急需,那么在此过程中起到积极作用的细胞器可能是?”该习题答案为“溶酶体”,该习题的知识点标签为“细胞器功能”,该习题的章节标签为“人教版第三章第2节”,“人教版第三章第2节”的上级章节为“人教版第三章”,“细胞器功能”的上级知识点为“细胞基本结构”。根据该习题的文本内容和答案内容,确定习题数据库中与该习题相似的习题,并进一步确定相似习题的章节标签和知识点标签,依次获取到习题数据库中的所有习题与对应的相似习题以及章节或知识点标签,以及确定章节与关联章节,知识点与关联知识点,章节与关联知识点。进一步的,在对知识图谱嵌入模型训练完成后,假设习题数据库中存在一个没有标签的习题,该无标签习题的节点向量为A,而“人教版第三章第2节”的节点向量为B。两个向量的余弦相似性cosθ由点积和向量长度给出,余弦相似性计算公式为:其中,Ai和Bi分别代表向量A和B的各分量。余弦相似性cosθ给出的相似性范围为[-1,1],-1意味着两个向量指向的方向截然相反,1表示两个向量指向完全相同,0表示两个向量之间是独立的,而在(0,1)之间则表示两个向量存在一定的相似性。假设cosθ=0.8,预先设定的余弦阈值为0.7,则表明该无标签习题与“人教版第三章第2节”存在一定关联,可将“人教版第三章第2节”作为该无标签习题的章节标签。
综上,本发明实施例通过获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。通过上述技术手段,综合图谱中的数据和各数据之间的关系由知识图谱嵌入模型的向量表征,从而可以基于知识图谱嵌入模型中的向量,根据链接预测规则来确定与习题关联的章节和知识点,以实现对没有标签的习题进行章节标签和知识点标签的标注。
实施例二
图8是本发明实施例二提供的一种习题关联关系处理方法的流程图。如图8所示,习题关联关系处理方法包括:
S210、获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系。
S220、根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组。
S230、根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系。
S240、基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。
步骤S210到S240具体实现过程可以参考步骤S110到S140。
S250、计算两个没有关联的章节数据的节点向量之间的相似度,若该相似度小于相似阈值,则将该两个章节数据相关联。
S260、计算两个没有关联的知识点数据的节点向量之间的相似度,若该相似度小于相似阈值,则将该两个知识点数据相关联。
S270、计算没有关联的知识点数据和章节数据的节点向量之间的相似度,若该相似度小于相似阈值,则将该知识点数据和该章节数据相关联。
具体的,获取知识图谱嵌入模型中所有章节节点向量和知识点节点向量,计算章节节点向量之间,知识点节点向量之间,以及章节节点向量和知识节点向量之间的余弦夹角,通过两个向量的夹角余弦值来评估两者之间的相似度,以确定两者之间是否存在关联。若余弦夹角小于预设的余弦阈值,则表明两者之间存在关联,并在知识图谱嵌入模型添加关联关系对应的关系向量。本发明实施例通过链接预测规则,补全知识图谱嵌入模型中两关联节点向量之间的关系向量。
综上,本发明实施例通过获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。通过上述技术手段,综合图谱中的数据和各数据之间的关系由知识图谱嵌入模型的向量表征,从而可以基于知识图谱嵌入模型中的向量,根据链接预测规则来确定与习题关联的章节和知识点,以实现对没有标签的习题进行章节标签和知识点标签的标注。除了可以确定习题关联的章节和知识点外,还可以确定知识点之间,章节之间,以及章节和知识点之间的关联关系,构建更详细更全面的知识图谱,以达到更好的自适应学习效果。
实施例三
图9是本发明实施例三提供的一种习题关联关系处理方法的流程图。如图9所示,习题关联关系处理方法包括:
S310、获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系。
S320、根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组。
S330、根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系。
S340、基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。
步骤S310到S340具体实现过程可以参考步骤S110到S140。
S350、获取新添加到综合图谱中的习题数据,确定综合图谱中与新添加习题数据相似的习题数据。
S360、根据新添加习题数据,以及新添加习题数据与对应的相似习题数据之间的相似关系,在知识图谱嵌入模型中随机生成对应的新节点向量和新关系向量。
S370、根据新节点向量、新关系向量以及相似习题的节点向量量训练知识图谱嵌入模型。
具体的,当需要往数据库中添加新的习题数据时,需对应更新综合图谱的结构和知识图谱嵌入模型的结构。示例性的,确定原始数据库中与新习题数据相似的习题数据,根据新习题数据和对应的相似习题数据,在综合图谱中添加新习题数据的新习题节点,以及新习题节点与相似习题节点之间的相似边。进一步的,根据新习题节点,以及新习题节点与相似习题节点之间的相似边,对应生成知识图谱嵌入模型中的新习题节点向量和新关系向量。根据新习题节点向量和新关系向量训练知识图谱嵌入模型,以使新习题节点向量和新关系向量找到正确的嵌入向量。由于当前知识图谱嵌入模型的结构稳定,只需微调就能找到正确的新习题节点向量和新关系向量。
对于新习题节点向量,还可以根据链接预测规则,确定与新习题节点向量关联的章节节点向量和知识点节点向量,从而实现对新习题数据的章节标签和知识点标签标注。
综上,本发明实施例通过获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。通过上述技术手段,综合图谱中的数据和各数据之间的关系由知识图谱嵌入模型的向量表征,从而可以基于知识图谱嵌入模型中的向量,根据链接预测规则来确定与习题关联的章节和知识点,以实现对没有标签的习题进行章节标签和知识点标签的标注。对于新添加的习题数据,根据其新习题节点向量和新关系向量,可以快速调整知识图谱嵌入模型的结构,以知识图谱嵌入模型中的向量表征新添加的习题数据,实现了知识图谱嵌入模型的知识扩展功能。
实施例四
图10是本发明实施例四提供的一种习题关联关系处理装置的结构示意图。参考图10,该习题关联关系处理装置包括:数据获取模块21、综合图谱构建模块22、知识图谱构建模块23和习题标签挖掘模块24。
其中,数据获取模块21,被配置为获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;
综合图谱构建模块22,被配置为根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;
知识图谱构建模块23,被配置为根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;
习题标签挖掘模块24,被配置为基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。
在上述实施例的基础上,数据获取模块包括:习题数据获取单元,被配置为获取数据库中初始习题数据,确定初始习题数据的相似习题数据;章节和知识点数据获取单元,被配置为获取数据库中章节数据和知识点数据;第一关联关系确定单元,被配置为根据初始习题数据和相似习题数据的章节标签或知识点标签,确定初始习题数据和相似习题数据与章节数据或知识点数据之间的关联关系;第二关联关系确定单元,被配置为根据章节数据的章节标签或知识点标签,和知识点数据的章节标签或知识点标签,确定章节数据之间、知识点数据之间以及章节数据和知识点数据之间的关联关系。
在上述实施例的基础上,综合图谱构建模块包括:实体层图谱构建单元,被配置为根据习题数据、相似习题数据和两者之间的相似关系,构建实体层图谱;本体层图谱构建单元,被配置为根据章节数据和知识点数据,章节数据之间、知识点数据之间以及章节数据和知识点数据之间的关联关系,构建本体层图谱;综合图谱构建单元,被配置为根据习题数据与章节数据之间的关联关系,和习题数据与知识点数据之间的关联关系,将实体层中的习题数据与本体层中对应的章节数据和知识点数据相关联,得到综合图谱。
在上述实施例的基础上,三元组中关联的两个数据包括:实体层中习题和相似习题、本体层中章节和关联章节,本体层中的知识点和关联知识点,本体层中的章节和关联知识点,实体层中的习题和本体层中的章节,实体层中的习题和本体层中的知识点,关联关系为上下级关系、相似关系或相关关系。
在上述实施例的基础上,知识图谱构建模块包括:知识图谱构建单元,被配置为根据综合图谱中的数据,以及综合图谱中各数据之间的关联关系,在知识图谱嵌入模型中随机生成数据对应的节点向量,和关联关系对应的关系向量;向量三元组确定单元,被配置为将两个关联的节点向量和对应的关系向量,作为向量三元组。
在上述实施例的基础上,知识图谱构建模块还包括:样本获取单元,被配置为将向量三元组作为知识图谱嵌入模型的正样本三元组,并根据每一正样本三元组随机生成多个负样本三元组;其中,本体层和实体层内部的正样本三元组与对应的负样本三元组的关系向量相同;样本分数计算单元,被配置为根据正样本三元组、负样本三元组和预设的得分函数,计算正样本三元组和负样本三元组的分数;第一训练单元,被配置为根据正样本三元组和负样本三元组的分数,以及预设的损失函数,计算损失函数的结果,并根据损失函数的结果调整知识图谱嵌入模型中向量的向量值;
其中,得分函数为fr(h,t)=hTMrt;
损失函数为
其中,JIntra为本体层和实体层内部的正样本三元组的损失函数,为跨实体层和本体层的正样本三元组的损失函数,w为权重系数,S1为本体层和实体层内部的正样本三元组的集合,S1′为本体层和实体层内部的正样本三元组对应的负样本三元组的集合,h和t分别为本体层和实体层内部的正样本三元组的头节点向量和尾节点向量,r为本体层和实体层内部的正样本三元组的关系向量,Mr为在r关系向量下的对角矩阵,h′和t′分别为本体层和实体层内部的正样本三元组对应的负样本三元组的头节点向量和尾节点向量,γ为第一分数阈值,c和e分别为跨本体层和实体层的正样本三元组的头节点向量和尾节点向量,c′为跨本体层和实体层的正样本三元组的负样本三元组的头节点向量,fCT为线性映射函数,用于将跨本体层和实体层的正样本三元组的尾节点向量映射到对应头节点向量的向量空间,γCT为第二分数阈值,S2为跨实体层和本体层的正样本三元组集合,|S2|为跨实体层和本体层的正样本三元组的总数量,[]+用于限定样本三元组代入对应的损失函数进行计算。
在上述实施例的基础上,习题标签挖掘模块包括:节点向量获取单元,被配置为获取待标注习题数据的节点向量,待标注习题数据为没有关联章节数据或知识点数据的习题数据;向量相似度计算单元,被配置为获取所有章节数据和知识点数据的节点向量,计算待标注习题数据的节点向量与章节数据或知识点数据的节点向量之间的相似度;标签标注单元,被配置为若相似度小于预设的相似阈值,则将知识点数据或章节数据作为待标注习题数据的章节标签和知识点标签。
在上述实施例的基础上,习题关联关系处理装置还包括:第一关联关系确定单元,被配置为计算两个没有关联的章节数据的节点向量之间的相似度,若该相似度小于相似阈值,则将该两个章节数据相关联;第二关联关系确定单元,被配置为计算两个没有关联的知识点数据的节点向量之间的相似度,若该相似度小于相似阈值,则将该两个知识点数据相关联;第三关联关系确定单元,被配置为计算没有关联的知识点数据和章节数据的节点向量之间的相似度,若该相似度小于相似阈值,则将该知识点数据和该章节数据相关联。
在上述实施例的基础上,习题关联关系处理装置还包括:新习题数据添加单元,被配置为获取新添加到综合图谱中的习题数据,确定综合图谱中与新添加习题数据相似的习题数据;新习题向量生成单元,被配置为根据新添加习题数据,以及新添加习题数据与对应的相似习题数据之间的相似关系,在知识图谱嵌入模型中随机生成对应的新节点向量和新关系向量;第二训练模型,被配置为根据新节点向量、新关系向量以及相似习题的节点向量训练知识图谱嵌入模型。
上述,通过获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。通过上述技术手段,综合图谱中的数据和各数据之间的关系由知识图谱嵌入模型的向量表征,从而可以基于知识图谱嵌入模型中的向量,根据链接预测规则来确定与习题关联的章节和知识点,以实现对没有标签的习题进行章节标签和知识点标签的标注。除了可以确定习题关联的章节和知识点外,还可以确定知识点之间,章节之间,以及章节和知识点之间的关联关系,构建更详细更全面的知识图谱,以达到更好的自适应学习效果。对于新添加的习题数据,根据其新习题节点向量和新关系向量,可以快速调整知识图谱嵌入模型的结构,以知识图谱嵌入模型中的向量表征新添加的习题数据,实现了知识图谱嵌入模型的知识扩展功能。
本发明实施例提供的习题关联关系处理装置包含在习题关联关系处理设备中,且可用于执行上述任意实施例提供的习题关联关系处理方法,具备相应的功能和有益效果。
实施例五
图11为本发明实施例五提供的一种习题关联关系处理设备的结构示意图。如图11所示,该习题关联关系处理设备包括处理器30、存储器31、输入装置32、输出装置33以及显示屏34;习题关联关系处理设备中处理器30的数量可以是一个或多个,图11中以一个处理器30为例;习题关联关系处理设备中显示屏34的数量可以是一个或多个,图11中以一个显示屏34为例;习题关联关系处理设备中的处理器30、存储器31、输入装置32、输出装置33以及显示屏34可以通过总线或其他方式连接,图11中以通过总线连接为例。
存储器31作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的习题关联关系处理方法对应的程序指令或模块(例如,习题关联关系处理装置中的数据获取模块21、综合图谱构建模块22、知识图谱构建模块23和习题标签挖掘模块24)。处理器30通过运行存储在存储器31中的软件程序、指令以及模块,从而执行习题关联关系处理设备的各种功能应用以及数据处理,即实现上述习题关联关系处理方法。
存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据习题关联关系处理设备的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器31可进一步包括相对于处理器30远程设置的存储器,这些远程存储器可以通过网络连接至习题关联关系处理设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置32可用于接收输入的数字或字符信息,以及产生与习题关联关系处理设备的用户设置以及功能控制有关的键信号输入。输出装置33可包括扬声器等音频输出设备。显示屏34为具有触摸功能的显示屏,其可以是电容屏、电磁屏或者红外屏。可选的,当显示屏34为红外屏时,其还包括红外触摸框,该红外触摸框设置在显示屏34的四周,其还可以用于接收红外信号,并将该红外信号发送至处理器30或者其他设备。显示屏可以根据处理器的指令显示其他的内容。
上述习题关联关系处理设备包含习题关联关系处理装置,可以用于执行任意习题关联关系处理方法,具备相应的功能和有益效果。
实施例六
本发明实施例还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种习题关联关系处理方法,该方法包括:获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;根据习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为综合图谱的三元组;根据综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据向量三元组训练知识图谱嵌入模型,知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;基于预设的链接预测规则,根据知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与习题数据相关联的章节数据和知识点数据。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的习题关联关系处理方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
值得注意的是,上述基于习题关联关系处理装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种习题关联关系处理方法,其特征在于,包括:
获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;
根据所述习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为所述综合图谱的三元组;所述根据所述习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱包括:根据所述习题数据、相似习题数据和两者之间的相似关系,构建实体层图谱;根据所述章节数据和所述知识点数据,所述章节数据之间、知识点数据之间以及章节数据和知识点数据之间的关联关系,构建本体层图谱;根据所述习题数据与所述章节数据之间的关联关系,和所述习题数据与所述知识点数据之间的关联关系,将所述实体层中的习题数据与所述本体层中对应的章节数据和知识点数据相关联,得到所述综合图谱;
根据所述综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据所述向量三元组训练所述知识图谱嵌入模型,所述知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;
基于预设的链接预测规则,根据所述知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与所述习题数据相关联的章节数据和知识点数据。
2.根据权利要求1所述的方法,其特征在于,所述获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系,包括:
获取数据库中初始习题数据,确定所述初始习题数据的相似习题数据;
获取数据库中章节数据和知识点数据;
根据所述初始习题数据和相似习题数据的章节标签或知识点标签,确定所述初始习题数据和相似习题数据与所述章节数据或所述知识点数据之间的关联关系;
根据所述章节数据的章节标签或知识点标签,和所述知识点数据的章节标签或知识点标签,确定所述章节数据之间、知识点数据之间以及章节数据和知识点数据之间的关联关系。
3.根据权利要求1所述的方法,其特征在于,所述三元组中关联的两个数据包括:实体层中习题和相似习题、本体层中章节和关联章节,本体层中的知识点和关联知识点,本体层中的章节和关联知识点,实体层中的习题和本体层中的章节,实体层中的习题和本体层中的知识点,所述关联关系为上下级关系、相似关系或相关关系。
4.根据权利要求3所述的方法,其特征在于,所述根据所述综合图谱的三元组,构建知识图谱嵌入模型的向量三元组包括:
根据所述综合图谱中的数据,以及所述综合图谱中各数据之间的关联关系,在所述知识图谱嵌入模型中随机生成数据对应的节点向量,和关联关系对应的关系向量;
将两个关联的节点向量和对应的关系向量,作为向量三元组。
5.根据权利要求4所述的方法,其特征在于,根据所述向量三元组训练所述知识图谱嵌入模型包括:
将所述向量三元组作为所述知识图谱嵌入模型的正样本三元组,并根据每一所述正样本三元组随机生成多个负样本三元组;其中,本体层和实体层内部的正样本三元组与对应的负样本三元组的关系向量相同;
根据所述正样本三元组、所述负样本三元组和预设的得分函数,计算所述正样本三元组和所述负样本三元组的分数;
根据所述正样本三元组和所述负样本三元组的分数,以及预设的损失函数,计算所述损失函数的结果,并根据所述损失函数的结果调整所述知识图谱嵌入模型中向量的向量值;
其中,所述得分函数为
所述损失函数为
其中,为本体层和实体层内部的正样本三元组的损失函数,为跨实体层和本体层的正样本三元组的损失函数,为权重系数,为本体层和实体层内部的正样本三元组的集合,为本体层和实体层内部的正样本三元组对应的负样本三元组的集合,分别为本体层和实体层内部的正样本三元组的头节点向量和尾节点向量,为本体层和实体层内部的正样本三元组的关系向量,为在关系向量下的对角矩阵,分别为本体层和实体层内部的正样本三元组对应的负样本三元组的头节点向量和尾节点向量,为第一分数阈值,分别为跨本体层和实体层的正样本三元组的头节点向量和尾节点向量,为跨本体层和实体层的正样本三元组的负样本三元组的头节点向量,为线性映射函数,用于将跨本体层和实体层的正样本三元组的尾节点向量映射到对应头节点向量的向量空间,为第二分数阈值,为跨实体层和本体层的正样本三元组集合,为跨实体层和本体层的正样本三元组的总数量,用于限定样本三元组代入对应的损失函数进行计算。
6.根据权利要求1所述的方法,其特征在于,所述基于预设的链接预测规则,根据所述知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与所述习题数据相关联的章节数据和知识点数据包括:
获取待标注习题数据的节点向量,所述待标注习题数据为没有关联章节数据或知识点数据的习题数据;
获取所有章节数据和知识点数据的节点向量,计算所述待标注习题数据的节点向量与所述章节数据或所述知识点数据的节点向量之间的相似度;
若所述相似度小于预设的相似阈值,则将所述知识点数据或所述章节数据作为所述待标注习题数据的章节标签和知识点标签。
7.根据权利要求1所述的方法,其特征在于,在所述确定与所述习题数据相关联的章节数据和知识点数据之后,还包括:
计算两个没有关联的章节数据的节点向量之间的相似度,若该相似度小于预设的相似阈值,则将该两个章节数据相关联;
计算两个没有关联的知识点数据的节点向量之间的相似度,若该相似度小于预设的相似阈值,则将该两个知识点数据相关联;
计算没有关联的知识点数据和章节数据的节点向量之间的相似度,若该相似度小于预设的相似阈值,则将该知识点数据和该章节数据相关联。
8.根据权利要求1所述的方法,其特征在于,在所述确定与所述习题数据相关联的章节数据和知识点数据之后,还包括:
获取新添加到所述综合图谱中的习题数据,确定所述综合图谱中与新添加习题数据相似的习题数据;
根据所述新添加习题数据,以及所述新添加习题数据与对应的相似习题数据之间的相似关系,在所述知识图谱嵌入模型中随机生成对应的新节点向量和新关系向量;
根据所述新节点向量、所述新关系向量以及相似习题的节点向量训练所述知识图谱嵌入模型。
9.一种习题关联关系处理装置,其特征在于,包括:
数据获取模块,被配置为获取习题数据、章节数据和知识点数据,确定各数据之间的关联关系;
综合图谱构建模块,被配置为根据所述习题数据、章节数据、知识点数据和数据之间的关联关系,构建综合图谱,其中关联的两个数据及其之间的关联关系组成的数组作为所述综合图谱的三元组;所述综合图谱构建模块具体被配置为:根据所述习题数据、相似习题数据和两者之间的相似关系,构建实体层图谱;根据所述章节数据和所述知识点数据,所述章节数据之间、知识点数据之间以及章节数据和知识点数据之间的关联关系,构建本体层图谱;根据所述习题数据与所述章节数据之间的关联关系,和所述习题数据与所述知识点数据之间的关联关系,将所述实体层中的习题数据与所述本体层中对应的章节数据和知识点数据相关联,得到所述综合图谱;
知识图谱构建模块,被配置为根据所述综合图谱的三元组,构建知识图谱嵌入模型的向量三元组,根据所述向量三元组训练所述知识图谱嵌入模型,所述知识图谱嵌入模型用于通过向量表征综合图谱中的数据和数据之间的关联关系;
习题标签挖掘模块,被配置为基于预设的链接预测规则,根据所述知识图谱嵌入模型中习题数据、章节数据和知识点数据的向量,确定与所述习题数据相关联的章节数据和知识点数据。
10.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8任一所述的习题关联关系处理方法。
11.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8任一所述的习题关联关系处理方法。
CN202110129249.2A 2021-01-29 2021-01-29 一种习题关联关系处理方法、装置、设备及存储介质 Active CN114817552B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110129249.2A CN114817552B (zh) 2021-01-29 2021-01-29 一种习题关联关系处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110129249.2A CN114817552B (zh) 2021-01-29 2021-01-29 一种习题关联关系处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114817552A CN114817552A (zh) 2022-07-29
CN114817552B true CN114817552B (zh) 2025-09-09

Family

ID=82525625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110129249.2A Active CN114817552B (zh) 2021-01-29 2021-01-29 一种习题关联关系处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114817552B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116186295B (zh) * 2023-04-28 2023-07-18 湖南工商大学 基于注意力的知识图谱链接预测方法、装置、设备及介质
CN117079222B (zh) * 2023-10-17 2024-01-26 广州乐庚信息科技有限公司 一种基于课堂音视频智能分析的教案生成方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709830A (zh) * 2015-08-13 2017-05-24 马正方 一种基于知识点结构的题库系统
CN109376249A (zh) * 2018-09-07 2019-02-22 桂林电子科技大学 一种基于自适应负采样的知识图谱嵌入方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469169A (zh) * 2015-08-19 2017-03-01 阿里巴巴集团控股有限公司 信息处理方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709830A (zh) * 2015-08-13 2017-05-24 马正方 一种基于知识点结构的题库系统
CN109376249A (zh) * 2018-09-07 2019-02-22 桂林电子科技大学 一种基于自适应负采样的知识图谱嵌入方法

Also Published As

Publication number Publication date
CN114817552A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
Isvoranu et al. Network psychometrics with R: A guide for behavioral and social scientists
Waheed et al. A bibliometric perspective of learning analytics research landscape
Huckle et al. The UN Decade of Education for Sustainable Development: business as usual in the end
Palmer Modelling engineering student academic performance using academic analytics
CN109543031A (zh) 一种基于多任务对抗学习的文本分类方法
CN120339011B (zh) 基于多模态知识图谱的在线教学交互方法、介质和设备
CN111210111B (zh) 一种基于在线学习与众包数据分析的城市环境评估方法和系统
CN113868515B (zh) 一种基于蚁群算法的自适应学习路径推荐方法
CN114817552B (zh) 一种习题关联关系处理方法、装置、设备及存储介质
CN119919259B (zh) 基于知识点集群的学习路径生成方法、装置及电子设备
CN108172047A (zh) 一种网络在线学习资源个性化实时推荐方法
Yu RETRACTED: Application of artificial intelligence in physical education
CN115114421A (zh) 一种问答模型训练方法
CN119691263B (zh) 基于学科知识图谱和图神经网络的个性化学习资源推荐方法
Ye Interval-valued hesitant fuzzy prioritized weighted aggregation operators for multiple attribute decision making
CN111062484A (zh) 基于多任务学习的数据集选取方法及装置
CN112380429A (zh) 一种习题推荐方法及装置
CN103530405A (zh) 一种基于分层结构的图像检索方法
Zhang et al. APGKT: Exploiting associative path on skills graph for knowledge tracing
Rashid et al. Assessing socioeconomic differentiation of rural household groups in malaysia
CN117079291A (zh) 图像轨迹确定方法、装置、计算机设备和存储介质
CN112907155A (zh) 评价学生作业产品的方法
Tong et al. Exploiting knowledge hierarchy for finding similar exercises in online education systems
CN118822696A (zh) 基于求解策略的个性化习题资源推荐方法及系统
CN116702784A (zh) 实体链接方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant