CN113435685A - 一种分层Attention深度学习模型的课程推荐方法 - Google Patents
一种分层Attention深度学习模型的课程推荐方法 Download PDFInfo
- Publication number
- CN113435685A CN113435685A CN202110467407.5A CN202110467407A CN113435685A CN 113435685 A CN113435685 A CN 113435685A CN 202110467407 A CN202110467407 A CN 202110467407A CN 113435685 A CN113435685 A CN 113435685A
- Authority
- CN
- China
- Prior art keywords
- user
- course
- interest
- representation
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000013136 deep learning model Methods 0.000 title claims abstract description 10
- 239000013598 vector Substances 0.000 claims abstract description 38
- 230000006399 behavior Effects 0.000 claims abstract description 34
- 230000007774 longterm Effects 0.000 claims abstract description 27
- 230000003993 interaction Effects 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000012216 screening Methods 0.000 claims abstract description 6
- 230000008859 change Effects 0.000 claims abstract description 4
- 238000007418 data mining Methods 0.000 claims abstract description 3
- 238000013135 deep learning Methods 0.000 claims abstract description 3
- 238000010801 machine learning Methods 0.000 claims abstract description 3
- 238000012163 sequencing technique Methods 0.000 claims abstract description 3
- 230000008569 process Effects 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000003068 static effect Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 4
- 239000011159 matrix material Substances 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 101150033293 mocos gene Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Biophysics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Technology (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及机器学习、深度学习及数据挖掘等技术领域,具体是涉及一种分层Attention深度学习模型课程推荐方法。通过利用用户顺序行为数据,使用LSTM建模用户兴趣的动态变化,通过构建分层的Attention结构,得到用户的长期和短期偏好,从而生成用户的高级混合表示,以此提高推荐结果的用户个性化和准确度。具体为:利用原始在线学习相关行为数据进行筛选和预处理,将用户的顺序行为划分为会话,然后使用embedding层和全连接层对细粒度(信息用户ID和课程ID)与粗粒度信息(课程类型)三种数据进行处理,得到用户向量表示;应用LSTM来捕捉用户不同历史会话兴趣的交互和演化,得到序列化的兴趣向量,将兴趣向量输入到Attention网络中,得到用户的长期兴趣表示;然后将用户最近行为数据和长期兴趣表示输入到第二层Attention网络中,得到用户的混合兴趣表示;最后将用户的混合兴趣表示和课程向量表示做内积,将得到的值作为该候选项目的得分,将候选项目得分排序得到推荐列表以为学生进行个性化推荐。
Description
(一)技术领域
本发明涉及机器学习、深度学习及数据挖掘等技术领域,具体是涉及一种分层Attention深度学习模型课程推荐方法。
(二)背景技术
近年来,随着云计算,大数据,人工智能等技术的迅速发展,教育领域发生了巨大的变革。众所周知的大规模公开在线课程(Massive Open Online Course,简称MOOCs)它是一种开放课程,旨在通过在线平台向大量参与者提供教育内容,并提供免费的访问权限。MOOC这个词是在2008年发明的,自2012年以来越来越流行,创造了一种新的教育模式。美国顶尖大学及其教授建立了几个 MOOC平台,例如Udacity,Course和edX,并成为该领域的领导者。近年来,中国涌现出大量的MOOC平台,例如网易云教室、xuetangX、IMOOC等。MOOC 收录了全球优秀开放式的在线课程,目前MOOC的注册用户数量已经超过了1 亿,它包括了1.14万的课程数量。与传统的学习方式相比,E-learning提供了一种不受空间差异限制的在线教育平台,大量的线下课程被高质量且方便的线上课程取而代之,为世界范围内的学生提供了更好的教育条件。但是,人们在享受互联网带来便利的同时,一些问题也随之产生。网络信息爆炸式的增长,使用户难以进行高效的选择,课程推荐系统成为解决信息超载问题的有效解决方案。
目前已公布的发明专利“基于图卷积神经网络的动态权重的课程推荐方法和系统”,公开号为CN110580314A,通过获取用户对每一课程的评分值进行预处理,得到用户-课程矩阵,在此基础上构建图卷积神经网络,预测用户-课程评分矩阵,对其进行序列模式挖掘得到每个用户的推荐课程序列。该发明没有考虑用户兴趣会随着时间的推移而不断演变,同时也忽略了在线平台的文本信息中蕴含的课程特征。本发明描述的“一种基于混合Attention深度学习模型课程推荐方法”利用用户顺序行为数据,使用LSTM建模用户兴趣的动态变化,通过构建分层的Attention结构,得到用户的长期和短期偏好,从而生成用户的高级混合表示,以此提高推荐结果的用户个性化和准确度。
(三)发明内容
本发明要解决的是目前基于课程推荐方法中仅仅用一个静态且低秩的向量来模拟用户的兴趣,从而忽略了用户兴趣是动态变化的问题;同时在课程特征的构建过程中,没有考虑到课程文本信息中蕴含的课程特征和知识点等信息,从而导致生成的推荐模型无法为用户推荐给个性化的课程等问题,提供了一种基于分层Attention深度学习模型课程推荐方法。
本发明的目的是这样实现的:
步骤一、对已下载的好的MOOCCube数据集的原始在线学习相关行为数据进行筛选和预处理;
步骤二、将用户的顺序行为划分为会话,然后将用户ID,课程ID和课程类型这3类数据的稀疏特征嵌入到全连接层,得到用户向量表示;对于课程特征表示,将每一在线平台的课程简介作为输入,利用卷积神经网络提取课程中蕴含的知识点作为课程特征向量;
步骤三、应用LSTM来捕捉用户不同历史会话兴趣的交互和演化,得到序列化的兴趣向量;
步骤四、为了刻画不同的用户,相同的项目对下一个项目预测的影响可能不同,将步骤三学习到的序列化兴趣向量输入到Attention网络中,得到用户的长期兴趣表示;
步骤五、将用户最近行为数据和步骤四得到的长期兴趣表示输入到第二层Attention网络中,得到用户的混合兴趣表示;
步骤六、将用户的混合兴趣表示和课程向量表示做内积,将得到的值作为该候选项目的得分,将候选项目得分排序得到推荐列表以为学生进行个性化推荐。
与现有的技术相比,本发明具有如下优势:
(1)在用户和课程向量表示方面,本发明考虑到学生的学习是一个连续的行为,将用户顺序行为数据进行了细粒度的划分为会话,并使用embedding层和全连接层对细粒度(信息用户ID和课程ID)与粗粒度信息(课程类型)三种数据进行处理,得到用户向量表示,提高了模型的表示能力,有助于提高推荐的准确性。
(2)课程知识点提取方面,本发明通过使用CNN模型对课程简介文本进行处理,提取课程中包含的知识点,从而提高学生个性化体验。
(3)由于学生的学习是一个连续的行为,前面的学习行为能够对后面的学习行为产生影响,且用户的长期兴趣通常随着时间而变化,仅仅学习每个用户静态的长期偏好是远远不够的,本发明使用LSTM捕捉用户历史会话之间的顺序关系,来建模用户长期兴趣的交互和演化。
(4)考虑到相同的项目对下一个项目预测的影响可能不同,且不同的用户,相同的项目对下一个项目预测的影响可能不同,本发明引入Attention层,通过分配不同权重来决定那些课程对于课程推荐有决定性作用。通过两层Attention层的构建,结合用户的长期偏好和短期偏好,得到用户的混合偏好,从而提高模型的性能。
(四)附图说明
图1为本发明的模型的框架图。
图2为基于分层Attention深度学习模型的学生课程推荐的整体的流程图。
图3为模型输入数据生成的流程图。
图4为用户特征向量生成的示意图。
图5为课程特征向量生成的流程图。
图6为历史会话兴趣交互的流程图。
图7为用户混合偏好生成的流程图。
图8为课程推荐产生的过程的示意图。
(五)具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下结合具体实例,并参照附图,对本发明进一步详细阐述。
本发明以基于分层Attention深度学习模型的课程推荐为实例描述本发明方法的具体实施过程。
本发明的模型框架如图1所示,基于分层Attention深度学习模型的课程推荐的整体流程如图2所示。结合示意图说明具体步骤:
步骤1、在MOOCData官网下载MOOCCube数据集,对数据进行筛选,以及预处理。
步骤2、因为步骤1只是对数据进行初步选择,为了符合本模型的输入要求,需要继续对数据进行再次处理,因此对步骤1清理后的学习行为日志,将学生的行为记录按时间顺序排列,以一天为单位划分会话。
步骤3、将步骤2得到的学生课程记录,嵌入到embedding层和全连接层,得到用户特征向量矩阵,如图4所示,将课程简介文本输入到卷积神经网络中提取课程特征,如图5所示。
步骤4、然后使用LSTM捕捉历史会话之间的顺序关系,模拟用户不同历史会话兴趣的交互和演化,从而得到序列化的兴趣向量。
步骤5、考虑到相同的项目对下一个项目预测的影响可能不同,且不同的用户,相同的项目对下一个项目预测的影响可能不同,利用Attention层为用户不同的行为赋予不同的权重,通过结合长期和短期偏好的两层结构来学习每个用户的混合偏好表示。
步骤6、将步骤5得到的混合偏好表示与候选课程向量做内积,得到课程的得分,使用候选课程得分前10的项目推荐给用户,以实现课程推荐。
图3显示的是本实例输入数据生成的流程图,具体的步骤包括:
步骤1、发表于ACL2020的论文公开了一个面向大规模在线教育有关的开放数据仓库,此数据集包含706门真实在线课程、38181个教学视频、114563个概念、 199999名MOOC用户的数十万选课、视频观看记录等课程概念有关的资源库。课程数据和学生行为数据来自学堂在线的真实使用环境。对此数据集进行初步处理,清洗掉无用的数据,在已选的数据集中user.csv文件,包含了学生学习行为的记录。course.csv包含了课程信息,包括课程名称、课程类型、课程简介等相关信息。学生的学习行为记录由不同的属性组成,这些属性有不同的意义。例如,在user.csv数据集中,id表示学生编号,name表示学生姓名,course_order表示学生观看过的课程,enroll_time表示学生观看相应课程发生的时间。在course.csv 中,id表示课程的course_id,name表示课程的信息,course_type表示相应课程所属于的类型,course_info表示课程简介,video_order表示此课程中包含的视频的顺序。
步骤2、对上述两个数据集进行进一步处理,首先将user.csv数据集中的学生行为记录按照时间顺序排列,并筛选出观看课程数量大于10的用户,然后以一天为单位,为学生行为划分会话,再次筛选出会话个数大于4的用户,并删除 enroll_time这一列数据。对于course.csv数据集,只保留 course_id,course_type,course_info这三类数据,丢弃其他类型的数据。最终,经过数据预处理,符合要求的学生行为数据14580条,其中包括994位学生,707 门课程,共23类课程。
步骤3、经过步骤2处理后的原始数据记录是文本格式,不能直接用作模型的输入,为了符合模型输入要求,需要将上述经过筛选的数据进行编码,转换为能由深度网络处理的格式。在学生行为记录中,由于每个学生观看课程的数量不同,需要统一用户观看课程的数量为50,不足的用<pad>填充,多余的则剪切。对于每一个学生的历史课程记录生成一个50维的行为向量,作为模型的输入。
经过上述的处理,得到了用户在相应时间戳的会话,用户的会话兴趣与上下文的兴趣之间存在顺序关系,而LSTM擅长捕捉顺序关系,所以我们利用 LSTM捕获用户不同历史会话兴趣的交互和演化,图6显示的是历史会话兴趣交互的流程图,具体的步骤包括:
步骤1、对于每一个用户,他的顺序行为表示为其中T表示时间步长的总数,表示相应的用户u在时间戳为t时会话(项目集)。对于一个固定的时间t,项目集能够反映用户u在时间t时的短期偏好,另外,表示在时间步t之前,用户交互过的项目集,能够反映用户的长期偏好。为了方便下面的描述,表示在时间t时的长期项目集,表示用户的短期项目集。本发明使用一个卷积神经网络来将课程简介嵌入到神经网络中,得到课程特征向量其中K是向量的维数,|V|是项目的总数量。
步骤2、将步骤1生成的课程特征向量矩阵输入LSTM神经网络中,得到各个时刻隐层状态表示向量矩阵,其中对于每一个时刻t,LSTM神经网络中输入门it、遗忘门ft、输出门Ot和单元状态Ct,计算公式如下:
it=σ(Wxivt+Whiht-1+Wcict-1+bi)
ft=σ(Wxfvt+Whfht-1+Wcfct-1+bf)
ct=ftct-1+ittanh(Wxcvt+Whcht-1+bc)
ot=σ(Wxovt+Whoht-1+Wcoct+bo)
ht=ottanh(ct)
vt为输入LSTM神经网络的课程特征向量矩阵,σ是激活函数,ht是LSTM在t 时刻的隐藏状态,Wxi,Whi,Wci,Wxf,Whf,Wcf,Wxc,Whc,Wxo,Who,Wco, bi,bf,bc,bo是LSTM神经网络的参数,ht是LSTM的隐藏状态。
步骤3、LSTM层通过多个逻辑单元完成历史会话兴趣演化过程,并获得序列化的兴趣向量矩阵。通过上述步骤,一般都会直接使用最终状态的兴趣向量矩阵经过全连接层后,直接用于课程推荐,但是由于相同的项目对下一个项目的预测可能不同,且不同的用户,相同的项目对下一个项目预测的影响也不同,本发明使用Attention网络来建模不同会话对用户偏好构建的影响程度。
通过注意力网络计算学生不同会话的权重,得到学生偏好特征的长期和短期共同组成的混合表示以进行课程推荐。
图7显示的是用户混合偏好生成的流程图,具体的步骤包括:
步骤1、将LSTM模型中,得到的多个会话中的兴趣向量序列Hi,且i={1,2,…,n}作为Attention层的输入。
步骤2、首先计算给定的长期项目集中每个会话的重要性,然后聚合这些项目的嵌入得到长期用户偏好表示,具体地说,首先将兴趣向量hj输入到多层感知机中得到隐层表示l1j,函数是激活函数RELU,利用激活增强模型的非线性能力,第j个会话的隐层状态l1j对于长期偏好表示的影响权重αj,计算公式如下:
W1、b1是模型的参数,其中W1是一个K×K维的矩阵,b1是K×1维的向量,hj代表第j个会话的兴趣表示。得到每个会话的影响权重后,将LSTM层提取到的各个会话的兴趣向量加权求和,得到基于注意力分布的学生长期偏好表示向量计算公式如下:
W2、b2是模型的参数,其中W2是一个K×K维的矩阵,b2是K×1维的向量;当 j>0时,xj代表项目的向量表示,但当j=0时,类似于步骤二,得到每个短期项目集中每个项目的影响权重后,将用户长期项目表示和项目嵌入加权求和,得到基于注意力分布的学生混合偏好表示向量计算公式如下:
其中,β0是长期用户偏好的权重。
训练模型的损失函数遵循BPR优化准则,模型利用成对排序目标函数。假设用户更喜欢下一个购买的物品,而不是其他未被观察到的物品。由此,假设 j是学生在时间步t将要学习的下一个课程,k是未被观察到的课程。对于每一个候选项目模型会产生一组成对的偏好顺序最后,通过最大化后验来训练模型,计算公式如下:
其中,Θ={U,V,W1,W2,b1,b2}是模型的参数,σ是逻辑函数,Θuv={U,V} 是用户和项目的嵌入向量,Θa={W1,W2}是注意力网络权重的集合,λ= {λuv,λa}是模型的正则化参数。
根据得到的损失值,采用梯度下降的方法优化模型,进行参数调整,得到经过优化的深度网络,经过多次操作,得到多个损失值,当损失值趋于收敛时结束操作,将此模型作为最终的预测模型。卷积层,LSTM层中的所有参数都是通过反向传播的算法进行训练并更新,损失函数的优化运用随机梯度下降法。
需要说明的是,以上所述实例仅是本发明的较优实施例,本发明并非局限于上述实施例和实施例方法。相关技术领域的从业者可在本发明的技术思路许可的范围内进行不同的细节调整和实施,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请。
Claims (5)
1.本发明涉及机器学习、深度学习及数据挖掘等技术领域,具体是涉及一种分层Attention深度学习模型课程推荐方法。其特征是:利用用户顺序行为数据,使用LSTM建模用户兴趣的动态变化,通过构建分层的Attention结构,得到用户的长期和短期偏好,从而生成用户的高级混合表示,以此提高推荐结果的用户个性化和准确度。具体为:将用户原始在线学习相关行为数据进行筛选和预处理,将用户的顺序行为划分为会话,然后将用户数据的稀疏特征嵌入到全连接层,得到用户向量表示;应用LSTM来捕捉用户不同历史会话兴趣的交互和演化,得到序列化的兴趣向量,将兴趣向量输入到Attention网络中,得到用户的长期兴趣表示;然后将用户最近行为数据和长期兴趣表示输入到第二层Attention网络中,得到用户的混合兴趣表示;最后将用户的混合兴趣表示和课程向量表示做内积,将得到的值作为该候选项目的得分,将候选项目得分排序得到推荐列表以为学生进行个性化推荐。
2.根据权利要求1所述的一种分层Attention深度学习模型课程推荐方法,其特征是:在用户和课程向量表示方面,本发明考虑到学生的学习是一个连续的行为,将用户顺序行为数据进行了细粒度的划分为会话,并使用embedding层和全连接层对细粒度(信息用户ID和课程ID)与粗粒度信息(课程类型)三种数据进行处理,得到用户向量表示,提高了模型的表示能力,有助于提高推荐的准确性。
3.根据权利要求1所述的一种分层Attention深度学习模型课程推荐方法,其特征是:课程知识点提取方面,本发明通过使用CNN模型对课程简介文本进行处理,提取课程中包含的知识点,从而提高学生个性化体验。
4.根据权利要求1所述的一种分层Attention深度学习模型课程推荐方法,其特征是:由于学生的学习是一个连续的行为,前面的学习行为能够对后面的学习行为产生影响,且用户的长期兴趣通常随着时间而变化,仅仅学习每个用户静态的长期偏好是远远不够的,本发明使用LSTM捕捉用户历史会话之间的顺序关系,来建模用户长期兴趣的交互和演化。
5.根据权利要求1所述的一种分层Attention深度学习模型课程推荐方法,其特征是:考虑到相同的项目对下一个项目预测的影响可能不同,且不同的用户,相同的项目对下一个项目预测的影响可能不同,本发明引入Attention层,通过分配不同权重来决定那些课程对于课程推荐有决定性作用。通过两层Attention层的构建,结合用户的长期偏好和短期偏好,得到用户的混合偏好,从而提高模型的性能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110467407.5A CN113435685A (zh) | 2021-04-28 | 2021-04-28 | 一种分层Attention深度学习模型的课程推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110467407.5A CN113435685A (zh) | 2021-04-28 | 2021-04-28 | 一种分层Attention深度学习模型的课程推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113435685A true CN113435685A (zh) | 2021-09-24 |
Family
ID=77753015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110467407.5A Pending CN113435685A (zh) | 2021-04-28 | 2021-04-28 | 一种分层Attention深度学习模型的课程推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435685A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114722238A (zh) * | 2022-05-13 | 2022-07-08 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、电子设备、存储介质及程序产品 |
US20230237416A1 (en) * | 2022-01-26 | 2023-07-27 | Ryan Francis Morrissey | System and method for assessing work habits and providing relevant support |
CN117436550A (zh) * | 2023-12-15 | 2024-01-23 | 深圳须弥云图空间科技有限公司 | 推荐模型训练方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555112A (zh) * | 2019-08-22 | 2019-12-10 | 桂林电子科技大学 | 一种基于用户正负偏好学习的兴趣点推荐方法 |
CN110659411A (zh) * | 2019-08-21 | 2020-01-07 | 桂林电子科技大学 | 一种基于神经注意力自编码器的个性化推荐方法 |
CN111488137A (zh) * | 2020-04-07 | 2020-08-04 | 重庆大学 | 一种基于共同注意力表征学习的代码搜索方法 |
CN111737570A (zh) * | 2020-06-10 | 2020-10-02 | 之江实验室 | 多模态在线学习资源网络推荐系统及其推荐方法 |
CN114564639A (zh) * | 2022-01-31 | 2022-05-31 | 桂林电子科技大学 | 一种基于深度会话兴趣交互模型的课程推荐方法 |
CN114637911A (zh) * | 2022-02-21 | 2022-06-17 | 桂林电子科技大学 | 一种注意力融合感知网络的下一个兴趣点推荐方法 |
CN114780866A (zh) * | 2022-04-11 | 2022-07-22 | 山东省人工智能研究院 | 一种基于时空上下文兴趣学习模型的个性化智能推荐方法 |
KR102513758B1 (ko) * | 2022-07-07 | 2023-03-27 | 주식회사 에이치투케이 | 커리큘럼 내 학습 세션 추천 시스템 및 방법 |
-
2021
- 2021-04-28 CN CN202110467407.5A patent/CN113435685A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659411A (zh) * | 2019-08-21 | 2020-01-07 | 桂林电子科技大学 | 一种基于神经注意力自编码器的个性化推荐方法 |
CN110555112A (zh) * | 2019-08-22 | 2019-12-10 | 桂林电子科技大学 | 一种基于用户正负偏好学习的兴趣点推荐方法 |
CN111488137A (zh) * | 2020-04-07 | 2020-08-04 | 重庆大学 | 一种基于共同注意力表征学习的代码搜索方法 |
CN111737570A (zh) * | 2020-06-10 | 2020-10-02 | 之江实验室 | 多模态在线学习资源网络推荐系统及其推荐方法 |
CN114564639A (zh) * | 2022-01-31 | 2022-05-31 | 桂林电子科技大学 | 一种基于深度会话兴趣交互模型的课程推荐方法 |
CN114637911A (zh) * | 2022-02-21 | 2022-06-17 | 桂林电子科技大学 | 一种注意力融合感知网络的下一个兴趣点推荐方法 |
CN114780866A (zh) * | 2022-04-11 | 2022-07-22 | 山东省人工智能研究院 | 一种基于时空上下文兴趣学习模型的个性化智能推荐方法 |
KR102513758B1 (ko) * | 2022-07-07 | 2023-03-27 | 주식회사 에이치투케이 | 커리큘럼 내 학습 세션 추천 시스템 및 방법 |
Non-Patent Citations (2)
Title |
---|
刘源: "面向个性化课程推荐的分层分期注意力网络模型", 计算机应用 * |
吴琼: "基于深度学习的个性化课程推荐算法研究", 中国优秀硕士学位论文全文数据库 社会科学II辑 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230237416A1 (en) * | 2022-01-26 | 2023-07-27 | Ryan Francis Morrissey | System and method for assessing work habits and providing relevant support |
CN114722238A (zh) * | 2022-05-13 | 2022-07-08 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、电子设备、存储介质及程序产品 |
CN114722238B (zh) * | 2022-05-13 | 2022-09-30 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、电子设备、存储介质及程序产品 |
CN117436550A (zh) * | 2023-12-15 | 2024-01-23 | 深圳须弥云图空间科技有限公司 | 推荐模型训练方法及装置 |
CN117436550B (zh) * | 2023-12-15 | 2024-04-16 | 深圳须弥云图空间科技有限公司 | 推荐模型训练方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wan et al. | A learner oriented learning recommendation approach based on mixed concept mapping and immune algorithm | |
CN113435685A (zh) | 一种分层Attention深度学习模型的课程推荐方法 | |
CN107766447A (zh) | 一种使用多层注意力网络机制解决视频问答的方法 | |
CN109657156A (zh) | 一种基于循环生成对抗网络的个性化推荐方法 | |
CN113344053B (zh) | 一种基于试题异构图表征与学习者嵌入的知识追踪方法 | |
Johnson et al. | Understanding aesthetics and fitness measures in evolutionary art systems | |
Wang et al. | Attention-based CNN for personalized course recommendations for MOOC learners | |
Fazlollahtabar et al. | User/tutor optimal learning path in e-learning using comprehensive neuro-fuzzy approach | |
CN108228674A (zh) | 一种基于dkt的信息处理方法及装置 | |
CN110889450A (zh) | 超参数调优、模型构建方法和装置 | |
Kang | Combining grey relationship analysis and neural network to develop attractive automobile booth design | |
CN109559576A (zh) | 一种儿童伴学机器人及其早教系统自学习方法 | |
Ahajjam et al. | Predicting students' final performance using artificial neural networks | |
Ma | Research on basketball teaching network course resource recommendation method based on deep learning algorithm | |
de Araújo et al. | Applying computational intelligence techniques to improve the decision making of business game players | |
CN111311997B (zh) | 一种基于网络教育资源的互动方法 | |
CN114154839A (zh) | 一种基于在线教育平台数据的课程推荐方法 | |
Li et al. | Practical Perception and Quality Evaluation for Teaching of Dynamic Visual Communication Design in the Context of Digital Media | |
CN114564639A (zh) | 一种基于深度会话兴趣交互模型的课程推荐方法 | |
Wang et al. | [Retracted] The Application of Motion Trajectory Acquisition and Intelligent Analysis Technology in Physical Education Teaching in Colleges and Universities | |
Xia | Construction and implementation of music recommendation model utilising deep learning artificial neural network and mobile edge computing | |
Shminan et al. | Dynamic student assessment to advocate personalized learning plan | |
Oubalahcen et al. | The Use of AI in E-Learning Recommender Systems: A Comprehensive Survey | |
CN115423546A (zh) | 一种基于多图神经网络的课程推荐方法 | |
Farrenkopf et al. | Ontology based business simulations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |