CN109325552A - 个性化资源推荐模型建立方法及装置 - Google Patents
个性化资源推荐模型建立方法及装置 Download PDFInfo
- Publication number
- CN109325552A CN109325552A CN201811467521.2A CN201811467521A CN109325552A CN 109325552 A CN109325552 A CN 109325552A CN 201811467521 A CN201811467521 A CN 201811467521A CN 109325552 A CN109325552 A CN 109325552A
- Authority
- CN
- China
- Prior art keywords
- data
- layer
- limited
- sample data
- boltzmann machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 241001269238 Data Species 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000012360 testing method Methods 0.000 claims description 79
- 238000012549 training Methods 0.000 claims description 59
- 239000011159 matrix material Substances 0.000 claims description 48
- 238000011156 evaluation Methods 0.000 claims description 11
- 230000003542 behavioural effect Effects 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 239000011521 glass Substances 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 25
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 206010034719 Personality change Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种个性化资源推荐模型建立方法及装置,涉及数据处理技术领域,方法包括获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据,将对多个样本数据进行处理得到多个目标样本数据输入至深度信念网络算法中,并将网络课程的评分作为该深度信念网络算法的决策项进行处理得到一目标模型。通过上述设置,以在采用目标模型查找网络课程时,仅需输入用户的人口统计学特征信息即可获得相对应的网络课程,以实现可靠的课程推荐,避免了用户在进行网络课程学习时存在的课程查找不便的情况。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种个性化资源推荐模型建立方法及装置。
背景技术
随着互联网技术教育的蓬勃发展,众多的在线学习平台应运而生,以实现课程资源的数字化和网络共享。学习者在面对学习平台上不计其数、质量良莠不齐的课程资源时,由于网络课程资源丰富,因此容易导致学习者选择资源困难,使学习者产生信息迷航。
因此,提供一种便于用户从爆炸式增长的网络课程资源中快速、精准地找到适合自身的网络课程的分类模型是亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种个性化资源推荐模型建立方法及装置,以有效缓解上述技术问题。
为实现上述目的,本发明实施例采用如下技术方案:
一种个性化资源推荐模型建立方法,包括:
获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据;
对多个所述样本数据分别进行处理得到多个目标样本数据,其中,每个目标样本数据中包括人口统计学特征信息数据对应的人口统计学特征向量、行为特征信息数据对应的行为特征向量以及课程资源内容信息数据对应的课程资源特征向量;
将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型。
可选的,在上述个性化资源推荐模型建立方法中,将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型的步骤包括:
将多个所述目标样本数据划分为训练数据集和测试数据集,其中,所述训练数据集和所述测试数据集中分别包括多个目标样本数据;
将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型;
将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型。
可选的,在上述个性化资源推荐模型建立方法中,所述深度信念网络算法包括多层受限玻尔兹曼机,将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型的步骤包括:
将所述训练数据集输入至所述深度信念网络算法的第一层受限玻尔兹曼机中,采用CD-k算法进行学习以得到该第一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
将该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵输入至该第一层受限玻尔兹曼机相邻的下一层受限玻尔兹曼机中,并采用CD-k算法进行学习以得到该下一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该下一层受限玻尔兹曼机的可见层的权值和偏置矩阵,并将该下一层受限玻尔兹曼机作为新的第一层受限玻尔兹曼机,直至得到最后一层受限玻尔兹曼机的隐藏层的权重和偏置,以及该最后一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
根据所述训练数据集中的网络课程的评分,将该最后一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵采用反向传播算法依次对各层受限玻尔兹曼机的隐藏层对应的权重和偏置矩阵进行调整以得到一初始模型。
可选的,在上述个性化资源推荐模型建立方法中,将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型的步骤包括:
将所述测试数据集中的各目标样本数据输入至所述初始模型以进行测试得到各目标样本数据对应的网络课程的测试评分;
根据测试得到的各目标样本数据对应的网络课程的测试评分,所述测试数据集中存在网络课程的评分及其对应的目标样本数据对所述初始模型进行处理以得到目标模型。
可选的,在上述个性化资源推荐模型建立方法中,对多个所述样本数据分别进行处理得到多个目标样本数据的步骤包括:
当多个所述样本数据中存在包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据为异常时,将对应的样本数据进行剔除以得到多个第一样本数据;
对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到目标样本数据。
可选的,在上述个性化资源推荐模型建立方法中,所述对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到目标样本数据的步骤包括:
对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
本发明还提供一种个性化资源推荐模型建立装置,包括:
数据获取模块,用于获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据;
数据处理模块,用于对多个所述样本数据分别进行处理得到多个目标样本数据,其中,每个目标样本数据中包括人口统计学特征信息数据对应的人口统计学特征向量、行为特征信息数据对应的行为特征向量以及课程资源内容信息数据对应的课程资源特征向量;
模型建立模块,用于将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型。
可选的,在上述个性化资源推荐模型建立装置中,所述模型建立模块包括:
数据划分子模块,用于将多个所述目标样本数据划分为训练数据集和测试数据集,其中,所述训练数据集和所述测试数据集中分别包括多个目标样本数据;
训练子模块,用于将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型;
测试子模块,用于将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型。
可选的,在上述个性化资源推荐模型建立装置中,所述深度信念网络算法包括多层受限玻尔兹曼机,所述训练子模块包括:
训练单元,用于将所述训练数据集输入至所述深度信念网络算法的第一层受限玻尔兹曼机中,采用CD-k算法进行学习以得到该第一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
所述训练单元,还用于将该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵输入至该第一层受限玻尔兹曼机相邻的下一层受限玻尔兹曼机中,并采用CD-k算法进行学习以得到该下一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该下一层受限玻尔兹曼机的可见层的权值和偏置矩阵,并将该下一层受限玻尔兹曼机作为新的第一层受限玻尔兹曼机,直至得到最后一层受限玻尔兹曼机的隐藏层的权重和偏置,以及该最后一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
模型建立单元,用于根据所述训练数据集中的网络课程的评分,将该最后一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵采用反向传播算法依次对各层受限玻尔兹曼机的隐藏层对应的权重和偏置矩阵进行调整以得到一初始模型。
可选的,在上述个性化资源推荐模型建立装置中,所述测试子模块包括:
测试单元,用于将所述测试数据集中的各目标样本数据输入至所述初始模型以进行测试得到各目标样本数据对应的网络课程的测试评分;
处理单元,用于根据测试得到的各目标样本数据对应的网络课程的测试评分,所述测试数据集中存在网络课程的评分及其对应的目标样本数据对所述初始模型进行处理以得到目标模型。
本发明提供的一种个性化资源推荐模型建立方法及装置,方法通过对获取的多个样本数据进行处理后得到多个目标样本数据,以基于该多个目标样本数据采用深度信念网络算法进行训练以得到一目标模型,以使用户在查找网络课程时,仅需输入该用户的人口统计学特征信息即可实现采用上述的目标模型获得与该用户的人口统计学特征信息相对应的网络课程,进而实现了可靠的课程推荐,避免了用户在进行网络课程学习时存在的课程查找不便的情况。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的电子设备的连接框图。
图2为本发明实施例提供的个性化资源推荐模型建立方法的流程示意图。
图3为图2中步骤S120的流程示意图。
图4为图2中步骤S130的流程示意图。
图5为图4中步骤S136的流程示意图。
图6为本发明实施例提供的个性化资源推荐模型建立装置的连接框图。
图7为本发明实施例提供的模型建立模块的连接框图。
图8为本发明实施例提供的训练子模块的连接框图。
图9为本发明实施例提供的测试子模块的连接框图。
图标:10-电子设备;12-存储器;14-处理器;100-个性化资源推荐模型建立装置;110-数据获取模块;120-数据处理模块;130-模型建立模块;132-数据划分子模块;134-训练子模块;134a-训练单元;134c-模型建立单元;136-测试子模块;136a-测试单元;136b-处理单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
如图1所示,本发明实施例提供了一种电子设备10,包括存储器12和处理器14,所述存储器12与所述处理器14之间直接或间接地电性连接,以实现数据的传输或交互。
具体的,所述存储器12中存储有以软件或固件(Firmware)的形式存储于所述存储器12中的软件功能模块,所述处理器14通过运行存储在存储器12内的软件程序以及模块,如本发明实施例中的个性化资源推荐模型建立装置100,从而执行各种功能应用以及数据处理,即实现本发明实施例中的个性化资源推荐模型建立方法。
所述存储器12可以是,但不限于,随机存取存储器12(Random Access Memory,RAM),只读存储器12(Read Only Memory,ROM),可编程只读存储器12(Programmable Read-Only Memory,PROM),可擦除只读存储器12(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器12(Electrically Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器12用于存储程序,所述处理器14在接收到执行指令后,执行所述程序。
所述处理器14可以是通用处理器14,包括中央处理器14(Central ProcessingUnit,CPU)、网络处理器14(Network Processor,NP)等,还可以是数字信号处理器14(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器14可以是微处理器14或者该处理器14也可以是任何常规的处理器14等。
可以理解,图1所示的结构仅为示意,所述电子设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请结合图2,本发明提供一种可应用于上述电子设备10的课程建立方法,所述个性化资源推荐模型建立方法应用于上述电子设备10时实现步骤S110-S130三个步骤。
步骤S110:获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据。
其中,所述人口统计学特征信息至少包括学习者的姓名、教育程度以及年级,所述人口统计学特征信息还可以包括年龄、性别、学校以及专业等;所述行为特征信息数据至少包括针对一个网络课程的课程网页请求总次数、注册课程时长、视频课程播放时长、视频课程播放数量、完成习题总数目以及视频正常观看结束次数,所述行为特征信息数据还可以包括教材查看次数、活跃天数、在线时长、提交作业次数、检查作业次数、课程大纲请求次数、换视频播放速度次数、显示作业答案次数、论坛发帖数、回帖数、读帖数、论坛访问次数、帖子被回复的数量、帖子被阅读的数量、搜索讨论帖次数、是否收藏课程和/或是否分享课程;所述课程资源信息数据至少包括课程名称、课程所属学科以及课程所属年级,所述课程资源信息数据还可以包括课程知识点标注、课程创建者和/或课程所属学校。
可以理解,同一学习者可能在网络学习平台同时进行多个网络课程的学习,则同一学习者针对每个课程分别对应有一个样本数据、即各所述样本数据对应的网络课程可以是相同的,也可以是不同的。
获取多个样本数据的方式可以是获取用户以表格方式输入的多个样本数据,也可以是获取网络学习平台中存储的样本数据,还可以是针对每个学习者获取所述网络学习平台中的对应的样本数据中的行为特征信息数据,并从所述学籍网络对应的数据库中获取该样本数据中对应的课程资源信息数据以及人口统计特征数据,并进行映射得到样本数据,在此不作具体限定,根据实际需求进行设置即可。
步骤S120:对多个所述样本数据分别进行处理得到多个目标样本数据,其中,每个目标样本数据中包括人口统计学特征信息数据对应的人口统计学特征向量、行为特征信息数据对应的行为特征向量以及课程资源内容信息数据对应的课程资源特征向量。
可以理解,由于所述行为特征数据中的各项数据中的差异性角度,为便于后续基于所述样本数据训练分类模型,在本实施例中,对多个所述样本数据进行处理的方式还可以是对所述样本数据进行归一化处理。
具体的,请结合图3,在本实施例中,步骤S120中,对多个所述样本数据进行处理得到多个目标样本数据的步骤包括:
步骤S122:判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个目标样本数据。
需要说明的是,存在异常的数据通常为行为特征信息数据,通过将存在异常的数据对应的样本数据进行剔除,以避免因存在异常数据造成获得的分类模型不准确的情况。
例如,当样本数据中的在线时长或视频课程播放时长大于注册课程时长时,则对应的样本数据为异常,并剔除该样本数据;当样本数据中的检查作业次数大于提交作业次数时,则对应的样本数据为异常,并剔除该样本数据。
步骤S124:对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理。
具体的,所述学习者的行为特征信息数据至少包括的课程网页请求总次数、注册课程时长、视频课程播放时长、视频课程播放数量、完成习题总数目和视频正常观看结束次数,以及还可以包括的教材查看次数、活跃天数、在线时长、提交作业次数、检查作业次数、课程大纲请求次数、换视频播放速度次数、显示作业答案次数、论坛发帖数、回帖数、读帖数、论坛访问次数、帖子被回复的数量、帖子被阅读的数量、搜索讨论帖次数、是否收藏课程和/或是否分享课程。
具体的,在本实施例中,所述步骤S124包括:对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
通过上述方法,以使获得的行为特征信息数据对应的行为特征向量的取值范围为[0,1],进而避免因样本数据中的特征信息数据值过大,进而造成算法复杂的问题。
步骤S130:将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型。
通过上述设置,以根据人口统计学特征信息、行为特征信息数据、课程资源信息数据以及课程资源数据对应的网络课程的评分来构建学习者兴趣模型即本申请中的目标模型,以在用户在进行网络课程学习时,仅需输入该用户的人口统计学特征信息,以实现快速精准地向用户推荐网络课程,且在进行课程推荐时,向用户推荐与该用户的人口统计学特征相似或相近的学习者人口统计学特征信息对应的网络课程,且推荐的网络课程均为评分较高的课程,进而达到更好的网络课程推荐效果,并避免用户进行查找造成不便的情况。
为使上述获得的分类模型更加准确,请结合图4,在本实施例中,步骤S130包括:
步骤S132:将多个所述目标样本数据划分为训练数据集和测试数据集,其中,所述训练数据集和所述测试数据集中分别包括多个目标样本数据。
其中,训练样本数据集中包括的目标样本数据的数量与所述测试样本数据集中包括的目标样本数据的数量的比例可以是但不限于7:3或8:2等,在此不作具体限定。
步骤S134:将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型。
步骤S136:将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型。
具体的,将多个所述目标样本数据划分为训练数据集和测试数据集的方式可以是随机划分。
为使进行训练获得的初始模型更准确,请结合图5,在本实施例中,所述深度信念网络算法包括多层受限玻尔兹曼机,步骤S134具体包括:
将所述训练数据集输入至所述深度信念网络算法的第一层受限玻尔兹曼机中,采用CD-k算法进行学习以得到该第一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵。将该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵输入至该第一层受限玻尔兹曼机相邻的下一层受限玻尔兹曼机中,并采用CD-k算法进行学习以得到该下一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该下一层受限玻尔兹曼机的可见层的权值和偏置矩阵,并将该下一层受限玻尔兹曼机作为新的第一层受限玻尔兹曼机,直至得到最后一层受限玻尔兹曼机的隐藏层的权重和偏置,以及该最后一层受限玻尔兹曼机的可见层的权值和偏置矩阵。根据所述训练数据集中的网络课程的评分,将该最后一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵采用反向传播算法依次对各层受限玻尔兹曼机的隐藏层对应的权重和偏置矩阵进行调整以得到一初始模型。
具体的,利用BP反向误差传递算法以实现对整个网络的权值、偏置矩阵进行微调以降低误差,直至当训练误差满足某一设定值的时候,保存最终的权值和偏置矩阵,以得到初始模型。
为使进行测试处理获得目标模型更准确,请结合图5,在本实施例中,步骤S136具体可以包括:
步骤S136a:将所述测试数据集中的各目标样本数据输入至所述初始模型以进行测试得到各目标样本数据对应的网络课程的测试评分。
步骤S136b:根据测试得到的各目标样本数据对应的网络课程的测试评分,所述测试数据集中存在网络课程的评分及其对应的目标样本数据对所述初始模型进行处理以得到目标模型。
通过上述设置,以进一步实现在用户输入该用户的人口统计学特征时,实现向用户推荐与该用户的人口统计学特征相似或相近的学习者人口统计学特征信息对应的网络课程,且推荐的网络课程均为评分较高的课程,进而达到更好的网络课程推荐效果,并避免用户进行查找造成不便的情况。
请参阅图6,在上述基础上,本发明还提供一种个性化资源推荐模型建立装置100,包括数据获取模块110、数据处理模块120以及模型建立模块130。
所述数据获取模块110,用于获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据。在本实施例中,所述数据获取模块110可用于执行图2所示的步骤S110,关于所述数据获取模块110的具体描述可以参照前文对步骤S110的描述。
所述数据处理模块120,用于对多个所述样本数据分别进行处理得到多个目标样本数据,其中,每个目标样本数据中包括人口统计学特征信息数据对应的人口统计学特征向量、行为特征信息数据对应的行为特征向量以及课程资源内容信息数据对应的课程资源特征向量。在本实施例中,所述数据处理模块120可用于执行图2所示的步骤S120,关于所述数据处理模块120的具体描述可以参照前文对步骤S120的描述。
所述模型建立模块130,用于将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型。在本实施例中,所述模型建立模块130可用于执行图2所示的步骤S130,关于所述模型建立模块130的具体描述可以参照前文对步骤S130的描述。
请结合图7,在本实施例中,所述模型建立模块130包括数据划分子模块132、训练子模块134以及测试子模块136。
所述数据划分子模块132,用于将多个所述目标样本数据划分为训练数据集和测试数据集,其中,所述训练数据集和所述测试数据集中分别包括多个目标样本数据。在本实施例中,所述数据划分子模块132可用于执行图4所示的步骤S132,关于所述数据划分子模块132的具体描述可以参照前文对步骤S132的描述。
所述训练子模块134,用于将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型。在本实施例中,所述训练子模块134可用于执行图4所示的步骤S134,关于所述训练子模块134的具体描述可以参照前文对步骤S134的描述。
所述测试子模块136,用于将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型。在本实施例中,所述测试子模块136可用于执行图4所示的步骤S136,关于所述测试子模块136的具体描述可以参照前文对步骤S136的描述。
请结合图8,在本实施例中,所述深度信念网络算法包括多层受限玻尔兹曼机,所述训练子模块134包括训练单元134a和模型建立单元134c。
所述训练单元134a,用于将所述训练数据集输入至所述深度信念网络算法的第一层受限玻尔兹曼机中,采用CD-k算法进行学习以得到该第一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵。在本实施例中,关于所述训练单元134a的具体描述可以参照前文对步骤S134的描述。
所述训练单元134a,还用于将该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵输入至该第一层受限玻尔兹曼机相邻的下一层受限玻尔兹曼机中,并采用CD-k算法进行学习以得到该下一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该下一层受限玻尔兹曼机的可见层的权值和偏置矩阵,并将该下一层受限玻尔兹曼机作为新的第一层受限玻尔兹曼机,直至得到最后一层受限玻尔兹曼机的隐藏层的权重和偏置,以及该最后一层受限玻尔兹曼机的可见层的权值和偏置矩阵。在本实施例中,关于所述训练单元134a的具体描述还可以参照前文对步骤S134的描述。
所述模型建立单元134c,用于根据所述训练数据集中的网络课程的评分,将该最后一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵采用反向传播算法依次对各层受限玻尔兹曼机的隐藏层对应的权重和偏置矩阵进行调整以得到一初始模型。在本实施例中,关于所述模型建立单元134c的具体描述可以参照前文对步骤S134的描述。
所述测试子模块136,用于将所述测试样本集中的各目标样本数据输入至所述初始模型中进行测试以得到分类模型。在本实施例中,所述测试子模块136可用于执行图4所示的步骤S136,关于所述测试子模块136的具体描述可以参照前文对步骤S136的描述。
请结合图9,在本实施例中,所述测试子模块136包括:测试单元136a和处理单元136b。
所述测试单元136a,用于将所述测试数据集中的各目标样本数据输入至所述初始模型以进行测试得到各目标样本数据对应的网络课程的测试评分。在本实施例中,所述测试单元136a可用于执行图5所示的步骤S136a,关于所述测试单元136a的具体描述可以参照前文对步骤S136a的描述。
所述处理单元136b,用于根据测试得到的各目标样本数据对应的网络课程的测试评分,所述测试数据集中存在网络课程的评分及其对应的目标样本数据对所述初始模型进行处理以得到目标模型。在本实施例中,所述处理单元136b可用于执行图5所示的步骤S136b,关于所述处理单元136b的具体描述可以参照前文对步骤S136b的描述。
综上,本发明提供的一种个性化资源推荐模型建立方法及装置,方法包括获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据,将对多个样本数据进行处理得到多个目标样本数据输入至深度信念网络算法中,并将网络课程的评分作为该深度信念网络算法的决策项进行处理得到一目标模型。通过上述设置,以在采用目标模型查找网络课程时,仅需输入用户的人口统计学特征信息即可获得相对应的网络课程,即可实现向用户推荐与该用户的人口统计学特征相似或相近的学习者人口统计学特征信息对应的网络课程,且推荐的网络课程均为评分较高的课程,进而达到更好的网络课程推荐效果,并避免用户进行查找造成不便的情况。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种个性化资源推荐模型建立方法,其特征在于,包括:
获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据;
对多个所述样本数据分别进行处理得到多个目标样本数据,其中,每个目标样本数据中包括人口统计学特征信息数据对应的人口统计学特征向量、行为特征信息数据对应的行为特征向量以及课程资源内容信息数据对应的课程资源特征向量;
将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型。
2.根据权利要求1所述的个性化资源推荐模型建立方法,其特征在于,将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型的步骤包括:
将多个所述目标样本数据划分为训练数据集和测试数据集,其中,所述训练数据集和所述测试数据集中分别包括多个目标样本数据;
将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型;
将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型。
3.根据权利要求2所述的个性化资源推荐模型建立方法,其特征在于,所述深度信念网络算法包括多层受限玻尔兹曼机,将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型的步骤包括:
将所述训练数据集输入至所述深度信念网络算法的第一层受限玻尔兹曼机中,采用CD-k算法进行学习以得到该第一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
将该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵输入至该第一层受限玻尔兹曼机相邻的下一层受限玻尔兹曼机中,并采用CD-k算法进行学习以得到该下一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该下一层受限玻尔兹曼机的可见层的权值和偏置矩阵,并将该下一层受限玻尔兹曼机作为新的第一层受限玻尔兹曼机,直至得到最后一层受限玻尔兹曼机的隐藏层的权重和偏置,以及该最后一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
根据所述训练数据集中的网络课程的评分,将该最后一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵采用反向传播算法依次对各层受限玻尔兹曼机的隐藏层对应的权重和偏置矩阵进行调整以得到一初始模型。
4.根据权利要求2所述的个性化资源推荐模型建立方法,其特征在于,将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型的步骤包括:
将所述测试数据集中的各目标样本数据输入至所述初始模型以进行测试得到各目标样本数据对应的网络课程的测试评分;
根据测试得到的各目标样本数据对应的网络课程的测试评分,所述测试数据集中存在网络课程的评分及其对应的目标样本数据对所述初始模型进行处理以得到目标模型。
5.根据权利要求1所述的个性化资源推荐模型建立方法,其特征在于,对多个所述样本数据分别进行处理得到多个目标样本数据的步骤包括:
判断各所述样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据是否存在异常,并将多个样本数据中存在异常的样本数据进行剔除以得到多个目标样本数据;
对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到目标样本数据。
6.根据权利要求5所述的个性化资源推荐模型建立方法,其特征在于,所述对各第一样本数据中包括的学习者的行为特征信息数据进行归一化处理得到目标样本数据的步骤包括:
对各所述第一样本数据中包括的学习者的人口统计学特征信息、行为特征信息数据以及课程资源信息数据分别采用公式进行归一化处理得到多个目标样本数据,其中,xmin代表一项行为特征信息数据中单一属性特征值的最小值,xmax代表一项行为特征信息数据中单一属性特征值的最大值,x*代表归一化之后得到的数值,x代表原始数据。
7.一种个性化资源推荐模型建立装置,其特征在于,包括:
数据获取模块,用于获取多个样本数据,其中,每个样本数据包括学习者的人口统计学特征信息数据、行为特征信息数据和课程资源内容信息数据,且多个样本数据中存在包括与所述课程资源内容信息数据对应的网络课程的评分的样本数据;
数据处理模块,用于对多个所述样本数据分别进行处理得到多个目标样本数据,其中,每个目标样本数据中包括人口统计学特征信息数据对应的人口统计学特征向量、行为特征信息数据对应的行为特征向量以及课程资源内容信息数据对应的课程资源特征向量;
模型建立模块,用于将多个所述目标样本数据输入至深度信念网络算法中,并将所述网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行处理得到一目标模型。
8.根据权利要求7所述的个性化资源推荐模型建立装置,其特征在于,所述模型建立模块包括:
数据划分子模块,用于将多个所述目标样本数据划分为训练数据集和测试数据集,其中,所述训练数据集和所述测试数据集中分别包括多个目标样本数据;
训练子模块,用于将所述训练数据集输入至深度信念网络算法中,并将所述训练数据集中的网络课程的评分作为该深度信念网络算法的决策项,以采用该深度信念网络算法进行训练得到一初始模型;
测试子模块,用于将所述测试数据集输入至所述初始模型中以进行测试处理得到一目标模型。
9.根据权利要求8所述的个性化资源推荐模型建立装置,其特征在于,所述深度信念网络算法包括多层受限玻尔兹曼机,所述训练子模块包括:
训练单元,用于将所述训练数据集输入至所述深度信念网络算法的第一层受限玻尔兹曼机中,采用CD-k算法进行学习以得到该第一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
所述训练单元,还用于将该第一层受限玻尔兹曼机的可见层的权值和偏置矩阵输入至该第一层受限玻尔兹曼机相邻的下一层受限玻尔兹曼机中,并采用CD-k算法进行学习以得到该下一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵,以及该下一层受限玻尔兹曼机的可见层的权值和偏置矩阵,并将该下一层受限玻尔兹曼机作为新的第一层受限玻尔兹曼机,直至得到最后一层受限玻尔兹曼机的隐藏层的权重和偏置,以及该最后一层受限玻尔兹曼机的可见层的权值和偏置矩阵;
模型建立单元,用于根据所述训练数据集中的网络课程的评分,将该最后一层受限玻尔兹曼机的隐藏层的权重和偏置矩阵采用反向传播算法依次对各层受限玻尔兹曼机的隐藏层对应的权重和偏置矩阵进行调整以得到一初始模型。
10.根据权利要求8所述的个性化资源推荐模型建立装置,其特征在于,所述测试子模块包括:
测试单元,用于将所述测试数据集中的各目标样本数据输入至所述初始模型以进行测试得到各目标样本数据对应的网络课程的测试评分;
处理单元,用于根据测试得到的各目标样本数据对应的网络课程的测试评分,所述测试数据集中存在网络课程的评分及其对应的目标样本数据对所述初始模型进行处理以得到目标模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811467521.2A CN109325552A (zh) | 2018-12-03 | 2018-12-03 | 个性化资源推荐模型建立方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811467521.2A CN109325552A (zh) | 2018-12-03 | 2018-12-03 | 个性化资源推荐模型建立方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109325552A true CN109325552A (zh) | 2019-02-12 |
Family
ID=65256560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811467521.2A Pending CN109325552A (zh) | 2018-12-03 | 2018-12-03 | 个性化资源推荐模型建立方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325552A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221964A (zh) * | 2019-05-06 | 2019-09-10 | 福建天晴数码有限公司 | 基于深度信念网络的ui自动化测试方法、存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101694652A (zh) * | 2009-09-30 | 2010-04-14 | 西安交通大学 | 一种基于极速神经网络的网络资源个性化推荐方法 |
US20180315330A1 (en) * | 2017-04-28 | 2018-11-01 | edX Inc. | Learning event management system |
-
2018
- 2018-12-03 CN CN201811467521.2A patent/CN109325552A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101694652A (zh) * | 2009-09-30 | 2010-04-14 | 西安交通大学 | 一种基于极速神经网络的网络资源个性化推荐方法 |
US20180315330A1 (en) * | 2017-04-28 | 2018-11-01 | edX Inc. | Learning event management system |
Non-Patent Citations (3)
Title |
---|
何世建: ""基于梯度提升决策树与深度信念网络融合的推荐算法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
李镇东: ""基于二部图网络结构的个性化推荐系统研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
王洁: ""基于学习风格的学习内容自适应系统的研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221964A (zh) * | 2019-05-06 | 2019-09-10 | 福建天晴数码有限公司 | 基于深度信念网络的ui自动化测试方法、存储介质 |
CN110221964B (zh) * | 2019-05-06 | 2023-03-28 | 福建天晴数码有限公司 | 基于深度信念网络的ui自动化测试方法、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Martinková et al. | Checking equity: Why differential item functioning analysis should be a routine part of developing conceptual assessments | |
CN109597937A (zh) | 网络课程推荐方法及装置 | |
Gnanadesikan et al. | An activity-based statistics course | |
CN112395403B (zh) | 一种基于知识图谱的问答方法、系统、电子设备及介质 | |
US10643488B2 (en) | System and method of assessing depth-of-understanding | |
Gavurova et al. | Management of education concepts in the field of entrepreneurship of university students in the Czech Republic | |
Enfield et al. | Innovation diffusion: assessment of strategies within the diffusion simulation game | |
Kai et al. | Predicting Student Retention from Behavior in an Online Orientation Course. | |
CN102034373A (zh) | 辅助学习的方法及其系统 | |
Kaptein et al. | Statistics for Data Scientists | |
Lee et al. | A systematic review of AI education in K-12 classrooms from 2018 to 2023: Topics, strategies, and learning outcomes | |
Ilić et al. | Intelligent techniques in e-learning: a literature review | |
Hardegree | Standards-based assessment and high stakes testing: Accuracy of standards-based grading | |
Rama et al. | A study on causal rule discovery with PC algorithm | |
Qiu et al. | [Retracted] Effectiveness of Artificial Intelligence (AI) in Improving Pupils’ Deep Learning in Primary School Mathematics Teaching in Fujian Province | |
Duong | A serial mediation model of the linkage between entrepreneurial education, self-efficacy, attitudes and intentions: does gender matter? A multi-group analysis | |
Singh et al. | Competency-based medical education and the McNamara fallacy: Assessing the important or making the assessed important? | |
Alaofi et al. | A validated computer terminology test for predicting non-native english-speaking CS1 students’ academic performance | |
Ellikkal et al. | Factors Influencing Entrepreneurial Intentions and the Role of Entrepreneurship Education in Indian Universities: A Stakeholder Perspective | |
US20190228679A1 (en) | System and method for providing mathematics education instructions | |
CN109325552A (zh) | 个性化资源推荐模型建立方法及装置 | |
Litzler et al. | Degree aspirations of undergraduate engineering students at the intersection of race/ethnicity and gender | |
Carnero | Developing a fuzzy TOPSIS model combining MACBETH and fuzzy shannon entropy to select a gamification App | |
Pong-inwong et al. | Teaching evaluation using data mining on moodle LMS forum | |
CN107358829A (zh) | 学习测验系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190212 |