CN115329200A - 一种基于知识图谱和用户相似度的教学资源推荐方法 - Google Patents

一种基于知识图谱和用户相似度的教学资源推荐方法 Download PDF

Info

Publication number
CN115329200A
CN115329200A CN202211030711.4A CN202211030711A CN115329200A CN 115329200 A CN115329200 A CN 115329200A CN 202211030711 A CN202211030711 A CN 202211030711A CN 115329200 A CN115329200 A CN 115329200A
Authority
CN
China
Prior art keywords
knowledge
teaching
user
similarity
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211030711.4A
Other languages
English (en)
Other versions
CN115329200B (zh
Inventor
袁亚兴
贺媛婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OPEN UNIVERSITY OF CHINA
Original Assignee
OPEN UNIVERSITY OF CHINA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OPEN UNIVERSITY OF CHINA filed Critical OPEN UNIVERSITY OF CHINA
Priority to CN202211030711.4A priority Critical patent/CN115329200B/zh
Publication of CN115329200A publication Critical patent/CN115329200A/zh
Application granted granted Critical
Publication of CN115329200B publication Critical patent/CN115329200B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Animal Behavior & Ethology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及信息检索技术领域,具体涉及一种基于知识图谱和用户相似度的教学资源推荐方法;本发明对教学资源文本进行预处理,再提取获取词向量,根据用户的历史行为,得到历史知识向量,根据词向量和历史知识向量计算用户对于教学资源的相似度,然后对知识图谱和用户相似度赋权重,融合获得联合相似度矩阵,并对联合相似度矩阵进行学习校正,再计算获得教学推荐资源,推荐给用户,本发明通过对联合相似度矩阵的校正,得到具有结构信息和特征选择信息联合矩阵,进而较大程度地联合数据的结构信息和特征选择信息来筛选出最具代表性的特征,并且本发明提升了教学推荐资源推荐的准确性,使得教学资源的推荐能够更符合学习者的知识认识水平。

Description

一种基于知识图谱和用户相似度的教学资源推荐方法
技术领域
本发明涉及信息检索技术领域,具体涉及一种基于知识图谱和用户相似度的教学资源推荐方法。
背景技术
教学资源是为教学的有效开展提供的素材等各种可被利用的条件,通常包括教材、案例、影视、图片、课件等,也包括教师资源、教具、基础设施等,广义也应该涉及到教育政策等内容。从广义上来讲,教学资源可以指在教学过程中被教学者利用的一切要素,包括支撑教学的、为教学服务的人、财、物、信息等。从狭义上来讲,教学资源(学习资源)主要包括教学材料、教学环境及教学后援系统。
随着教育信息化的深入发展,互联网上的教学资源数量呈现出指数级的飞速增长,教学资源的类型也更加多元。同时在电子商务、社交网站等广泛应用的推荐系统,也逐渐应用到教育领域,能够在一定程度上实现教学资源的个性化推荐。
如专利申请号为CN201810749591.0的专利,其在说明书中记载有“首先根据知识图谱获取关键字扩充用户检索关键字集合,得到第一检索资源列表;根据用户之间的背景相似度和兴趣相似度计算出当前检索用户和其他用户之间的相似度;选择出与当前检索用户相似度最高的F个用户;在第一检索资源列表中将当前检索用户已经下载的资源删除,得第二检索资源列表。根据当前检索用户与上述选择出的F个用户之间的相似度、当前检索用户和F个用户针对各资源已经评过的分数计算预测出当前检索用户针对第二检索资源列表中各资源的评分,从中选择评分排名前F′的资源推荐给当前检索用户。本发明方法将知识图谱和用户相似度考虑进去,明显提高了教学资源推荐的精准”,又如专利申请号为CN201710204355.6的专利,其在说明书中记载有“包括:知识图谱资源模块,用于构建资源库的知识图谱和资源图谱;学生学习能力测评模块,用于在知识图谱资源模块的基础上对学生学习能力进行测评获得学生学习能力等级;学生画像模块,用于结合学生学习能力等级和学生信息库绘制学生画像并对学生信息进行聚类;教师画像模块,基于教师信息库绘制教师画像;个性化推荐模块,用于对学生或教师进行资源推荐。本发明基于异构教学资源,对学习能力各不相同的学习者,以及面向差异学习者进行教学的教师能够以比较高的精准度推荐教学资源”,上述所提供的专利,虽然融合有知识图谱和用户相似度或借助知识图谱进行教学资料的推荐,但是其过程复杂,相似度矩阵和知识图谱的矩阵之间的相关性连接不强,同时,在进行教学资源推荐中,未能充分的考虑学习者的知识认知差异,即缺少符合学习者的知识认识水平的推荐方式,影响了推荐效果,无法满足使用者的使用需求。
综上所述,研发一种基于知识图谱和用户相似度的教学资源推荐方法,是信息检索技术领域中急需解决的关键问题。
发明内容
针对现有技术所存在的上述缺点,本发明在于提供一种基于知识图谱和用户相似度的教学资源推荐方法,本发明首先对教学资源文本进行预处理,再提取获取词向量,根据词向量和历史知识向量计算用户对于教学资源的相似度,然后对知识图谱和用户相似度赋权重,融合获得联合相似度矩阵,并对联合相似度矩阵进行学习校正,再计算获得教学推荐资源,推荐给用户,实现基于知识图谱和用户相似度来实现教学资源的推荐效果,本发明提升了教学推荐资源推荐的准确性,使得教学资源的推荐能够更符合学习者的知识认识水平。
为实现上述目的,本发明提供了如下技术方案:
本发明提供了一种基于知识图谱和用户相似度的教学资源推荐方法,包括以下步骤:
(1)对教学资源文本进行预处理,再提取关键词作为资源的语义特征,将关键词用词向量表示,其中,对教学资源文本进行预处理是指对教学资源文本进行分词,然后再去掉停用词,最后根据不同教学资源文本的重视程度,设置相应的权重比;
(2)将资源文本中的向量排列成列表,再将该列表作为资源库;
(3)根据用户的历史行为,将学习过的教学资源作为用户自己的知识库,并将用户自己的知识库用历史知识向量表示;
(4)根据词向量和历史知识向量计算用户对于教学资源的相似度;
(5)构建知识图谱,对知识图谱和用户相似度赋权重,融合获得联合相似度矩阵,其中,构建知识图谱是将教学资源内知识点按照关联关系进行逻辑运算并用矩阵表示,对联合相似度矩阵进行学习校正;
(6)根据学习校正后的联合相似度矩阵,计算获得联合相似度矩阵的最大值作为教学推荐资源,并将其推荐给用户。
本发明进一步的设置为:在步骤(1)中,提取关键词作为资源的语义特征是指用训练的神经网络从预处理后的教学资源文本中提取资源的语义特征,将其作为关键词。
本发明进一步的设置为:在步骤(3)中,将用户自己的知识库用历史知识向量表示是指将用户自己所学习过的知识点集合用历史知识向量来表示。
本发明进一步的设置为:在步骤(4)中,相似度的计算公式为:
Figure DEST_PATH_IMAGE001
,式中,
Figure DEST_PATH_IMAGE002
为目标用户,
Figure DEST_PATH_IMAGE003
为历史资源集合,
Figure DEST_PATH_IMAGE004
为历史资源集合的数量,
Figure DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE006
分别为资源
Figure DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE008
的词向量。
本发明进一步的设置为:在步骤(5)中,构建知识图谱需要将教学资源内知识点按照关联关系进行逻辑运算,
所述的关联关系包括前提与和前提或,若掌握知识点的前提是同时掌握知识点
Figure DEST_PATH_IMAGE009
,则
Figure 31826DEST_PATH_IMAGE009
中每个知识点和知识点k之间的关系均为前提与关系,若掌握知识点
Figure DEST_PATH_IMAGE010
的前提是至少掌握知识点
Figure 152229DEST_PATH_IMAGE009
中的一个,则知识点
Figure 791021DEST_PATH_IMAGE009
中每个知识点与知识点
Figure 655071DEST_PATH_IMAGE010
间均为前提或关系。
本发明进一步的设置为:在步骤(5)中,假设知识图谱和用户相似度的权重分别为
Figure DEST_PATH_IMAGE011
Figure DEST_PATH_IMAGE012
,则
Figure DEST_PATH_IMAGE013
本发明进一步的设置为:在步骤(5)中,对联合相似度矩阵进行学习校正的方法如下:
假设有
Figure DEST_PATH_IMAGE014
个不同知识点图谱的矩阵数据:
Figure DEST_PATH_IMAGE015
,式中,
Figure DEST_PATH_IMAGE016
表示第
Figure DEST_PATH_IMAGE017
个知识点图谱的矩阵;
将不同知识点图谱的矩阵看作一致,利用学习校正公式对联合相似度矩阵进行校正。
本发明进一步的设置为:学习校正公式为:
Figure DEST_PATH_IMAGE018
,式中,
Figure DEST_PATH_IMAGE019
是第
Figure 750938DEST_PATH_IMAGE017
个知识点图谱矩阵,
Figure DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
是一致相似度矩阵,为构造知识点图谱时的知识点个数,
Figure DEST_PATH_IMAGE022
表示范数,指非0元素的个数,
Figure DEST_PATH_IMAGE023
为第
Figure 261816DEST_PATH_IMAGE017
个知识点图谱矩阵的权重参数,
Figure 263270DEST_PATH_IMAGE020
是权重向量,
Figure DEST_PATH_IMAGE024
Figure 790066DEST_PATH_IMAGE019
的转置矩阵,
Figure DEST_PATH_IMAGE025
为单位矩阵,
Figure DEST_PATH_IMAGE026
为第
Figure 537574DEST_PATH_IMAGE017
个知识点图谱矩阵的相似度矩阵,
Figure DEST_PATH_IMAGE027
为在
Figure DEST_PATH_IMAGE028
平衡参数下,第
Figure 327675DEST_PATH_IMAGE017
个知识点图谱矩阵的权重参数,
Figure DEST_PATH_IMAGE029
为第
Figure 426212DEST_PATH_IMAGE017
个知识点图谱矩阵中第
Figure 897645DEST_PATH_IMAGE007
个元素,
Figure DEST_PATH_IMAGE030
为第
Figure 748926DEST_PATH_IMAGE017
个知识点图谱矩阵中第
Figure 913191DEST_PATH_IMAGE008
个元素,
Figure DEST_PATH_IMAGE031
Figure DEST_PATH_IMAGE032
是平衡参数,且
Figure DEST_PATH_IMAGE033
有益效果
采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
本发明对教学资源文本进行预处理,再提取关键词作为资源的语义特征,将关键词用词向量表示,再将资源文本中的向量排列成列表,再将该列表作为资源库,并根据用户的历史行为,将学习过的教学资源作为用户自己的知识库,并将用户自己的知识库用历史知识向量表示,再利用词向量和历史知识向量,计算用户对于教学资源的相似度,通过前提与和前提或关系的设置,基于所设置的关联关系,建立起知识点间的关联性,形成以关联关系为纽带的关图谱,然后对知识图谱和用户相似度赋权重,融合获得联合相似度矩阵,并对联合相似度矩阵进行学习校正,再计算获得教学推荐资源,推荐给用户,实现基于知识图谱和用户相似度来实现教学资源的推荐效果,此外,通过对联合相似度矩阵的校正,将相似度矩阵和知识图谱的矩阵之间的相关性最大化,得到具有结构信息和特征选择信息联合矩阵,进而较大程度地联合数据的结构信息和特征选择信息来筛选出最具代表性的特征,本发明提升了教学推荐资源推荐的准确性,使得教学资源的推荐能够更符合学习者的知识认识水平。
附图说明
图1为本发明基于知识图谱和用户相似度的教学资源推荐方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合实施例对本发明作进一步的描述。
实施例:
如图1所示,图1为本发明基于知识图谱和用户相似度的教学资源推荐方法的流程图,本发明提升了教学推荐资源推荐的准确性,使得教学资源的推荐能够更符合学习者的知识认识水平,为此,本发明提供了本发明提供了一种基于知识图谱和用户相似度的教学资源推荐方法,包括以下步骤:
(1)对教学资源文本进行预处理,再提取关键词作为资源的语义特征,将关键词用词向量表示,其中,对教学资源文本进行预处理是指对教学资源文本进行分词,然后再去掉停用词,最后根据不同教学资源文本的重视程度,比如通过星形标记重视程度的等级,三颗星代表非常重视,两个星代表一般重视,一颗星代表不重视,设置相应的权重比。
进一步的,提取关键词作为资源的语义特征是指用训练的神经网络从预处理后的教学资源文本中提取资源的语义特征,将其作为关键词。
在本实施例中,通过对教学资源文本进行预处理,能够有效的提升所使用的关键词的准确性,需要说明的是,在提取关键词时,根据权重比,确定对于教学资源文本中关键词提取的权重,进而能够有效的保障所提取的关键词,能够更贴合使用重视程度,即提升后续推荐的精确度。
此外,作为一种实施提取关键词的方式,如对给定的文本进行句子分割,将文本表示为:
Figure DEST_PATH_IMAGE034
,对句子进行分词、去停用词,获得子
Figure DEST_PATH_IMAGE035
的词语表示:
Figure DEST_PATH_IMAGE036
,根据对于每个教学资源文本的重视程度,设置相应的权重比,然后提取关键词,作为资源的语义特征。
作为一种神经网络的应用形式,可以采用神经网络模型进行关键词的提取,在使用该神经网络模型前,采用已知的资料库,作为训练样本,将训练样本拆分为训练集和测试集,其中训练集占整个训练样本的20%,测试集占整个训练样本的80%,采用训练集对神经网络模型训练,再由测试集对所训练的神经网络模型进行测试,至所训练的神经网络模型满足对于关键词的提取需求,若所训练的神经网络模型不能够满足需求,则重新更换已知的资料库,并重复训练集和测试集的训练,为了提升神经网络模型的提取精确度,在本实施例中,所用的资料库数量越大越好。采用神经网络提取关键词,能够有效的提升对于关键词的提取速度。
(2)将资源文本中的向量排列成列表,再将该列表作为资源库。
在本实施例中,能够从资源文本中获得多个向量,按照获得顺序,将其排列成列表,将该列表作为教学知识的资源库。
作为列表的一种表达形式,如:
Figure DEST_PATH_IMAGE037
,通过对资源文本中的向量排列成列表,可以在后续的相似度计算中,方便的从资源库内按照顺序进行向量的提取,避免了向量提取的遗漏。
(3)根据用户的历史行为,将学习过的教学资源作为用户自己的知识库,并将用户自己的知识库用历史知识向量表示。
进一步的,将用户自己的知识库用历史知识向量表示是指将用户自己所学习过的知识点集合用历史知识向量来表示。
在本实施例中,作为获取用户历史行为的一种方式,可以采用爬虫方式,对用户所学习的网站等进行数据爬取,获取历史信息,如所有数据爬取自101教育PPT,使用编程实现网页模拟点击,定位网页的各类标签来获取目标数据。在101教育PPT中搜索关键字“二年级英语”,获取85页总计1211 本图书信息,但在第12页之后的图书并没有用户交互行为,阅读覆盖率非常低,由于101教育PPT中有用户打标签机制,用户读完书后可以为图书打上标签,这表示有标签的书一定是有用户阅读过的,为了筛选无交互行为的无意义数据,最终选取所有标签为“二年级英语”的图书作为目标图书。从目标图书中主要爬取的数据信息包括图书ID、图书名称、图书的评分、阅读人数、图书主页链接、图书目录文本以及用户和图书的交互行为数据等信息,然后将所爬取的数据进行除噪,剔除无关数据信息,再将其作为用户的历史行为数据信息。本发明能够根据用户的历史行为,爬取用户所学习过的教学资源,将所获取的全部教学资源作为历史知识向量,用于后续的相似度计算。
(4)根据词向量和历史知识向量计算用户对于教学资源的相似度。
进一步的,相似度的计算公式为:
Figure 97093DEST_PATH_IMAGE001
,式中,
Figure DEST_PATH_IMAGE038
为目标用户,
Figure DEST_PATH_IMAGE039
为历史资源集合,
Figure 434533DEST_PATH_IMAGE004
为历史资源集合的数量,
Figure 812425DEST_PATH_IMAGE005
Figure 616433DEST_PATH_IMAGE006
分别为资源
Figure 955141DEST_PATH_IMAGE007
Figure 768377DEST_PATH_IMAGE008
的词向量。
在本实施例中,相似度由词向量和历史知识向量计算获取,便可以得到用户的相似度。在相似度的计算中,资源与用户历史资源的文本相似度越高,表明该资源与用户偏好越相近,则该资源就越值得推荐。
(5)构建知识图谱,对知识图谱和用户相似度赋权重,融合获得联合相似度矩阵,其中,构建知识图谱需要将教学资源内知识点按照关联关系进行逻辑运算,并用矩阵表示,对联合相似度矩阵进行学习校正;
其中所述教学资源可包括教材,教材辅导资料,教育网页相关资料以及学科知识等,也可包括教研期刊,考试试卷以及其他第三方来源数据。
其中,以构建思维导图式的知识图谱为例,首先将知识点信息录入;将知识点信息转化为代码化数据;将代码化数据进行分词,与预设的思维导图中元素进行匹配,过滤删除多余的字段,从而得到标准的格式化元素,将格式化元素代入到思维导图中,对其对应的元素进行更新,从而得到新的知识图谱。
进一步的,
关联关系包括前提与和前提或,若掌握知识点
Figure 775DEST_PATH_IMAGE010
的前提是同时掌握知识点
Figure 365897DEST_PATH_IMAGE009
,则
Figure 50956DEST_PATH_IMAGE009
中每个知识点和知识点k之间的关系均为前提与关系,若掌握知识点
Figure 402303DEST_PATH_IMAGE010
的前提是至少掌握知识点
Figure 364574DEST_PATH_IMAGE009
中的一个,则知识点
Figure 41543DEST_PATH_IMAGE009
中每个知识点与知识点
Figure 213898DEST_PATH_IMAGE010
间均为前提或关系。
在本实施例中,通过前提与和前提或关系的设置,能够基于所设置的关联关系,建立起知识点间的关联性,形成以关联关系为纽带的关系图谱,如掌握L6的前提是同时掌握L10、 L11,则L10、 L11是L6的前提知识点,L10、 L11和L6均为前提与关系,掌握L2的前提是至少掌握L1、L18中的一个,则L1、L18是L2的前提知识点,L1、L18和L2均为前提或关系。
需要说明的是,在构建知识图谱后,知识图谱的矩阵可以用
Figure DEST_PATH_IMAGE040
表示,式中,
Figure DEST_PATH_IMAGE041
表示试题与知识点
Figure DEST_PATH_IMAGE042
的关联关系。
进一步的,假设知识图谱和用户相似度的权重分别为
Figure DEST_PATH_IMAGE043
Figure DEST_PATH_IMAGE044
,则
Figure DEST_PATH_IMAGE045
。需要说明的是,本发明能够基于知识图谱和用户相似度,来融合获得联合相似度矩阵,在对知识图谱和用户相似度赋权重时,其所赋值总和为1,通过联合相似度矩阵,能够将知识图谱和用户相似度相结合,用于教学资源的推荐。
进一步的,对联合相似度矩阵进行学习校正的方法如下:
假设有
Figure DEST_PATH_IMAGE046
个不同知识点图谱的矩阵数据:
Figure DEST_PATH_IMAGE047
,式中,
Figure DEST_PATH_IMAGE048
表示第
Figure 306619DEST_PATH_IMAGE017
个知识点图谱的矩阵;
将不同知识点图谱的矩阵看做一致,利用学习校正公式对联合相似度矩阵进行校正。
需要说明的是,为了将不同知识点图谱看做一致相似度矩阵,假
设不同知识点图谱的相似度矩阵
Figure 123397DEST_PATH_IMAGE020
是一致的,初始化相似度矩阵采用
Figure DEST_PATH_IMAGE049
最近邻方法构造,相似度矩阵元素定义如下:
Figure DEST_PATH_IMAGE050
,其中若
Figure DEST_PATH_IMAGE051
Figure DEST_PATH_IMAGE052
的最邻近或
Figure 377792DEST_PATH_IMAGE052
Figure 37443DEST_PATH_IMAGE051
的最邻近,则
Figure DEST_PATH_IMAGE053
,否则
Figure DEST_PATH_IMAGE054
。为了结合每个不同知识点图谱的重要信息,组合各个不同知识点图谱信息时,使用权重值
Figure 589647DEST_PATH_IMAGE023
,对该值加上幂
Figure 119986DEST_PATH_IMAGE028
,是为了避免出现平凡解
Figure 138757DEST_PATH_IMAGE054
,对一致矩阵
Figure 161071DEST_PATH_IMAGE020
加上幂
Figure 657912DEST_PATH_IMAGE032
同样是为了避免平凡解,但是由于该矩阵最终是在所有数据中训练得到的,一致相似度矩阵
Figure 573915DEST_PATH_IMAGE020
的每一行对应于一个数据点,需要加上以下约束:
Figure DEST_PATH_IMAGE055
,其中,
Figure 357063DEST_PATH_IMAGE020
表示第
Figure DEST_PATH_IMAGE056
行任意列的元素,约束是非负。该约束保证了训练得到的一致相似度矩阵
Figure 335515DEST_PATH_IMAGE020
和初始相似度矩阵的一致性。
进一步的,学习校正公式为:
Figure DEST_PATH_IMAGE057
,式中,
Figure DEST_PATH_IMAGE058
是第
Figure 963942DEST_PATH_IMAGE017
个知识点图谱矩阵,
Figure DEST_PATH_IMAGE060
Figure 734452DEST_PATH_IMAGE021
是一致相似度矩阵,
Figure 829447DEST_PATH_IMAGE049
为构造知识点图谱时的知识点个数,
Figure 560774DEST_PATH_IMAGE022
表示范数,指非0元素的个数,
Figure 664996DEST_PATH_IMAGE023
为第
Figure 290012DEST_PATH_IMAGE017
个知识点图谱矩阵的权重参数
Figure DEST_PATH_IMAGE061
是权重向量,
Figure 414963DEST_PATH_IMAGE024
Figure 758220DEST_PATH_IMAGE019
的转置矩阵,
Figure 541499DEST_PATH_IMAGE025
为单位矩阵,
Figure 21022DEST_PATH_IMAGE026
为第
Figure 723399DEST_PATH_IMAGE017
个知识点图谱矩阵的相似度矩阵,
Figure 678585DEST_PATH_IMAGE027
为在
Figure 859031DEST_PATH_IMAGE028
平衡参数下,第
Figure 458640DEST_PATH_IMAGE017
个知识点图谱矩阵的权重参数,
Figure 207284DEST_PATH_IMAGE029
为第
Figure 525133DEST_PATH_IMAGE017
个知识点图谱矩阵中第
Figure 243690DEST_PATH_IMAGE007
个元素,
Figure 88018DEST_PATH_IMAGE030
为第个知识点图谱矩阵中第
Figure 132197DEST_PATH_IMAGE008
个元素,
Figure 937342DEST_PATH_IMAGE028
Figure 725170DEST_PATH_IMAGE032
是平衡参数,且
Figure 909158DEST_PATH_IMAGE033
在本实施例中,通过对联合相似度矩阵的校正,将相似度矩阵和知识图谱的矩阵之间的相关性最大化,得到具有结构信息和特征选择信息联合矩阵,进而较大程度地联合数据的结构信息和特征选择信息来筛选出最具代表性的特征。
(6)根据学习校正后的联合相似度矩阵,计算获得联合相似度矩阵的最大值作为教学推荐资源,并将其推荐给用户。
在本实施例中,能够实现准确的教学推荐资源效果,提升教学推荐资源推荐的准确性,使得教学资源的推荐能够更符合学习者的知识认识水平。
本发明对教学资源文本进行预处理,再提取获取词向量,根据用户的历史行为,得到历史知识向量,根据词向量和历史知识向量计算用户对于教学资源的相似度,然后对知识图谱和用户相似度赋权重,融合获得联合相似度矩阵,并对联合相似度矩阵进行学习校正,再计算获得教学推荐资源,推荐给用户,本发明通过对联合相似度矩阵的校正,将相似度矩阵和知识图谱的矩阵之间的相关性最大化,得到具有结构信息和特征选择信息联合矩阵,进而较大程度地联合数据的结构信息和特征选择信息来筛选出最具代表性的特征,并且本发明实现了基于知识图谱和用户相似度来实现教学资源的推荐效果,提升教学推荐资源推荐的准确性,使得教学资源的推荐能够更符合学习者的知识认识水平。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,包括以下步骤:
(1)对教学资源文本进行预处理,再提取关键词作为资源的语义特征,将关键词用词向量表示,其中,对教学资源文本进行预处理是指对教学资源文本进行分词,然后再去掉停用词,最后根据不同教学资源文本的重视程度,设置相应的权重比;
(2)将资源文本中的向量排列成列表,再将该列表作为资源库;
(3)根据用户的历史行为,将学习过的教学资源作为用户自己的知识库,并将用户自己的知识库用历史知识向量表示;
(4)根据词向量和历史知识向量计算用户对于教学资源的相似度;
(5)构建知识图谱,对知识图谱和用户相似度赋权重,融合获得联合相似度矩阵,其中,构建知识图谱需要按照关联关系进行逻辑运算,并用矩阵表示,对联合相似度矩阵进行学习校正;其中,所述关联关系包括前提与和前提或,若掌握知识点
Figure 767834DEST_PATH_IMAGE001
的前提是同时掌握知识点
Figure 311073DEST_PATH_IMAGE002
,则
Figure 215444DEST_PATH_IMAGE002
中每个知识点和知识点
Figure 141812DEST_PATH_IMAGE003
之间的关系均为前提与关系,若掌握知识点
Figure 110511DEST_PATH_IMAGE001
的前提是至少掌握知识点
Figure 323187DEST_PATH_IMAGE002
中的一个,则知识点
Figure 357264DEST_PATH_IMAGE002
中每个知识点与知识点
Figure 211957DEST_PATH_IMAGE001
间均为前提或关系;且对联合相似度矩阵进行学习校正的方法如下:假设有
Figure 775443DEST_PATH_IMAGE004
个不同知识点图谱的矩阵数据:
Figure 299965DEST_PATH_IMAGE005
,式中,
Figure 116611DEST_PATH_IMAGE006
表示第
Figure 650361DEST_PATH_IMAGE007
个知识点图谱的矩阵;将不同知识点图谱的矩阵看作一致,利用学习校正公式对联合相似度矩阵进行校正;其中,所述学习校正公式为:
Figure 596582DEST_PATH_IMAGE009
,式中,
Figure 88744DEST_PATH_IMAGE010
是第
Figure 533631DEST_PATH_IMAGE007
个知识点图谱的矩阵,
Figure 136651DEST_PATH_IMAGE011
Figure 340974DEST_PATH_IMAGE012
是一致相似度矩阵,
Figure 4037DEST_PATH_IMAGE003
为构造知识点图谱时的知识点个数,
Figure 795275DEST_PATH_IMAGE013
表示范数,指非0元素的个数,
Figure 936406DEST_PATH_IMAGE014
为第
Figure 998166DEST_PATH_IMAGE007
个知识点图谱的矩阵的权重参数,
Figure 566550DEST_PATH_IMAGE015
是权重向量,
Figure 313926DEST_PATH_IMAGE016
Figure 610479DEST_PATH_IMAGE017
的转置矩阵,
Figure 759700DEST_PATH_IMAGE019
为单位矩阵,
Figure 498986DEST_PATH_IMAGE020
为第
Figure 999238DEST_PATH_IMAGE007
个知识点图谱的矩阵的相似度矩阵,
Figure 983637DEST_PATH_IMAGE021
为在
Figure 784102DEST_PATH_IMAGE022
平衡参数下,第
Figure 959869DEST_PATH_IMAGE007
个知识点图谱的矩阵的权重参数,
Figure 947416DEST_PATH_IMAGE023
为第
Figure 732576DEST_PATH_IMAGE007
个知识点图谱的矩阵中第
Figure 856390DEST_PATH_IMAGE024
个元素,
Figure 468637DEST_PATH_IMAGE025
Figure 943481DEST_PATH_IMAGE007
个知识点图谱的矩阵中第
Figure 174742DEST_PATH_IMAGE026
个元素,
Figure 185686DEST_PATH_IMAGE027
Figure 437675DEST_PATH_IMAGE028
是平衡参数,且
Figure 399815DEST_PATH_IMAGE029
(6)根据学习校正后的联合相似度矩阵,计算获得联合相似度矩阵的最大值作为教学推荐资源,并将其推荐给用户。
2.根据权利要求1所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,在步骤(1)中,提取关键词作为资源的语义特征是指用训练的神经网络从预处理后的教学资源文本中提取资源的语义特征,将其作为关键词。
3.根据权利要求1所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,在步骤(3)中,将用户自己的知识库用历史知识向量表示是指将用户自己所学习过的知识点集合用历史知识向量来表示。
4.根据权利要求4所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,在步骤(4)中,相似度矩阵的计算公式为:
Figure 126112DEST_PATH_IMAGE030
,式中,
Figure 631043DEST_PATH_IMAGE031
为目标用户,
Figure 53934DEST_PATH_IMAGE032
为历史资源集合,
Figure 768949DEST_PATH_IMAGE033
为历史资源集合的数量,
Figure 201068DEST_PATH_IMAGE034
Figure 921024DEST_PATH_IMAGE035
分别为资源
Figure 780396DEST_PATH_IMAGE024
Figure 248286DEST_PATH_IMAGE026
的词向量。
5.根据权利要求1所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,步骤(5)中所述教学资源可包括教材,教材辅导资料,教育网页相关资料以及学科知识。
6.根据权利要求1所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,步骤(5)中所述教学资源包括教研期刊,考试试卷以及其他第三方来源数据。
7.根据权利要求1所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,知识图谱为思维导图式的知识图谱。
8.根据权利要求7所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,所述思维导图式的知识图谱构建包括如下步骤:首先将知识点信息录入;将知识点信息转化为代码化数据;将代码化数据进行分词,与预设的思维导图中元素进行匹配,过滤删除多余的字段,从而得到标准的格式化元素,将格式化元素代入到思维导图中,对其对应的元素进行更新,从而得到新的知识图谱。
9.根据权利要求1所述的一种基于知识图谱和用户相似度的教学资源推荐方法,其特征在于,在步骤(5)中,假设知识图谱和用户相似度的权重分别为
Figure 638423DEST_PATH_IMAGE036
Figure 275203DEST_PATH_IMAGE037
,则
Figure 102214DEST_PATH_IMAGE038
CN202211030711.4A 2022-08-26 2022-08-26 一种基于知识图谱和用户相似度的教学资源推荐方法 Active CN115329200B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211030711.4A CN115329200B (zh) 2022-08-26 2022-08-26 一种基于知识图谱和用户相似度的教学资源推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211030711.4A CN115329200B (zh) 2022-08-26 2022-08-26 一种基于知识图谱和用户相似度的教学资源推荐方法

Publications (2)

Publication Number Publication Date
CN115329200A true CN115329200A (zh) 2022-11-11
CN115329200B CN115329200B (zh) 2024-04-26

Family

ID=83927149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211030711.4A Active CN115329200B (zh) 2022-08-26 2022-08-26 一种基于知识图谱和用户相似度的教学资源推荐方法

Country Status (1)

Country Link
CN (1) CN115329200B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115809371A (zh) * 2023-02-01 2023-03-17 中信联合云科技有限责任公司 基于数据分析的学习需求确定方法及系统
CN116342340A (zh) * 2023-03-31 2023-06-27 上海毅学堂智能科技有限公司 基于多版本教材知识图谱实现的个性化教育系统及方法
CN116628339A (zh) * 2023-06-09 2023-08-22 国信蓝桥教育科技股份有限公司 一种基于人工智能的教育资源推荐方法及系统
CN116957869A (zh) * 2023-08-16 2023-10-27 珠海庚商教育科技有限公司 一种基于资源模式匹配及协同的教育平台
CN116993549A (zh) * 2023-09-18 2023-11-03 西北师范大学 一种用于在线学习系统的复习资源推荐方法
CN117573894A (zh) * 2024-01-15 2024-02-20 北京文华在线教育科技股份有限公司 一种基于知识图谱的资源推荐系统及方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020143186A1 (zh) * 2019-01-10 2020-07-16 平安科技(深圳)有限公司 推荐系统训练方法、装置、计算机设备及存储介质
CN111753098A (zh) * 2020-06-23 2020-10-09 陕西师范大学 一种基于跨媒体动态知识图谱的教学方法及系统
CN112214685A (zh) * 2020-09-27 2021-01-12 电子科技大学 一种基于知识图谱的个性化推荐方法
CN112733035A (zh) * 2021-01-21 2021-04-30 唐亮 基于知识图谱的知识点推荐方法、装置、存储介质及电子装置
CN113094587A (zh) * 2021-04-23 2021-07-09 东南大学 一种基于知识图谱路径的隐式推荐方法
CN113190593A (zh) * 2021-05-12 2021-07-30 《中国学术期刊(光盘版)》电子杂志社有限公司 一种基于数字人文知识图谱的搜索推荐方法
CN113239209A (zh) * 2021-05-19 2021-08-10 上海应用技术大学 基于RankNet-transformer的知识图谱个性化学习路径推荐方法
CN114065040A (zh) * 2021-11-18 2022-02-18 扬州大学 基于学科知识图谱的个性化学习路径和学习资源推荐方法
CN114218378A (zh) * 2021-12-29 2022-03-22 神州医疗科技股份有限公司 一种基于知识图谱的内容推送方法、装置、设备及介质
CN114297399A (zh) * 2021-11-24 2022-04-08 科大讯飞股份有限公司 知识图谱生成方法、系统、存储介质及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020143186A1 (zh) * 2019-01-10 2020-07-16 平安科技(深圳)有限公司 推荐系统训练方法、装置、计算机设备及存储介质
CN111753098A (zh) * 2020-06-23 2020-10-09 陕西师范大学 一种基于跨媒体动态知识图谱的教学方法及系统
CN112214685A (zh) * 2020-09-27 2021-01-12 电子科技大学 一种基于知识图谱的个性化推荐方法
CN112733035A (zh) * 2021-01-21 2021-04-30 唐亮 基于知识图谱的知识点推荐方法、装置、存储介质及电子装置
CN113094587A (zh) * 2021-04-23 2021-07-09 东南大学 一种基于知识图谱路径的隐式推荐方法
CN113190593A (zh) * 2021-05-12 2021-07-30 《中国学术期刊(光盘版)》电子杂志社有限公司 一种基于数字人文知识图谱的搜索推荐方法
CN113239209A (zh) * 2021-05-19 2021-08-10 上海应用技术大学 基于RankNet-transformer的知识图谱个性化学习路径推荐方法
CN114065040A (zh) * 2021-11-18 2022-02-18 扬州大学 基于学科知识图谱的个性化学习路径和学习资源推荐方法
CN114297399A (zh) * 2021-11-24 2022-04-08 科大讯飞股份有限公司 知识图谱生成方法、系统、存储介质及电子设备
CN114218378A (zh) * 2021-12-29 2022-03-22 神州医疗科技股份有限公司 一种基于知识图谱的内容推送方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAO WEN ET AL.: "Research on personalized recommendation algorithm combined with time factor", 《2017 IEEE 17TH INTERNATIONAL CONFERENCE ON COMMUNICATION TECHNOLOGY》, 2 August 2021 (2021-08-02), pages 1911 - 1915 *
刘桐: "以学习分析技术理解学习失败——基于在线课程退课行为的视角", 《开放教育研究》, vol. 28, no. 3, 5 June 2022 (2022-06-05), pages 93 - 101 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115809371A (zh) * 2023-02-01 2023-03-17 中信联合云科技有限责任公司 基于数据分析的学习需求确定方法及系统
CN115809371B (zh) * 2023-02-01 2023-09-01 中信联合云科技有限责任公司 基于数据分析的学习需求确定方法及系统
CN116342340A (zh) * 2023-03-31 2023-06-27 上海毅学堂智能科技有限公司 基于多版本教材知识图谱实现的个性化教育系统及方法
CN116342340B (zh) * 2023-03-31 2023-10-17 上海毅学堂智能科技有限公司 基于多版本教材知识图谱实现的个性化教育系统及方法
CN116628339A (zh) * 2023-06-09 2023-08-22 国信蓝桥教育科技股份有限公司 一种基于人工智能的教育资源推荐方法及系统
CN116628339B (zh) * 2023-06-09 2023-11-17 国信蓝桥教育科技股份有限公司 一种基于人工智能的教育资源推荐方法及系统
CN116957869A (zh) * 2023-08-16 2023-10-27 珠海庚商教育科技有限公司 一种基于资源模式匹配及协同的教育平台
CN116957869B (zh) * 2023-08-16 2024-07-23 珠海庚商教育科技有限公司 一种基于资源模式匹配及协同的教育平台
CN116993549A (zh) * 2023-09-18 2023-11-03 西北师范大学 一种用于在线学习系统的复习资源推荐方法
CN117573894A (zh) * 2024-01-15 2024-02-20 北京文华在线教育科技股份有限公司 一种基于知识图谱的资源推荐系统及方法

Also Published As

Publication number Publication date
CN115329200B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN107230174B (zh) 一种基于网络的在线互动学习系统和方法
Neculoiu et al. Learning text similarity with siamese recurrent networks
CN115329200B (zh) 一种基于知识图谱和用户相似度的教学资源推荐方法
CN108021616B (zh) 一种基于循环神经网络的社区问答专家推荐方法
CN111538894B (zh) 查询反馈方法、装置、计算机设备及存储介质
Tahsin Mayeesha et al. Deep learning based question answering system in Bengali
CN110633730A (zh) 一种基于课程学习的深度学习机器阅读理解训练方法
CN111831924A (zh) 内容推荐方法、装置、设备及可读存储介质
CN116860978B (zh) 基于知识图谱和大模型的小学语文个性化学习系统
Nguyen et al. Design intelligent educational chatbot for information retrieval based on integrated knowledge bases
CN112487290A (zh) 基于大数据和人工智能的互联网精准化教学方法及系统
Tashu et al. Semantic-based feedback recommendation for automatic essay evaluation
Singh et al. Question answering chatbot using deep learning with NLP
Ullah et al. An E-Assessment Methodology Based on Artificial Intelligence Techniques to Determine Students' Language Quality and Programming Assignments' Plagiarism.
Boateng et al. Real-world deployment and evaluation of kwame for science, an ai teaching assistant for science education in west africa
EP3254269A2 (en) Semi-automated system and method for assessment of responses
Alwaneen et al. Stacked dynamic memory-coattention network for answering why-questions in Arabic
Okhdar et al. English vocabulary learning through recommender system based on sentence complexity and vocabulary difficulty
CN109165289B (zh) 一种通过深度卷积神经网络进行社区问答网站问题质量预测的方法
CN112464665A (zh) 一种学科术语抽取与应用方法
Singh et al. Computer application for assessing subjective answers using AI
Meena et al. Semantic similarity based assessment of descriptive type answers
Almuayqil et al. Towards an ontology-based fully integrated system for student e-assessment
Singh et al. Analysis of Student Sentiment Level Using Perceptual Neural Boltzmann Machine Learning Approach for E-learning Applications
Shabana et al. Unsupervised Concept Tagging of Mathematical Questions from Student Explanations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant