CN112598549B - 一种学习者潜在重叠社区检测方法、装置、设备及介质 - Google Patents

一种学习者潜在重叠社区检测方法、装置、设备及介质 Download PDF

Info

Publication number
CN112598549B
CN112598549B CN202011541203.3A CN202011541203A CN112598549B CN 112598549 B CN112598549 B CN 112598549B CN 202011541203 A CN202011541203 A CN 202011541203A CN 112598549 B CN112598549 B CN 112598549B
Authority
CN
China
Prior art keywords
learner
target object
node
nodes
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011541203.3A
Other languages
English (en)
Other versions
CN112598549A (zh
Inventor
李春英
汤志康
林伟杰
肖政宏
罗梓元
吴伟杰
彭家宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Polytechnic Normal University
Original Assignee
Guangdong Polytechnic Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Polytechnic Normal University filed Critical Guangdong Polytechnic Normal University
Priority to CN202011541203.3A priority Critical patent/CN112598549B/zh
Publication of CN112598549A publication Critical patent/CN112598549A/zh
Application granted granted Critical
Publication of CN112598549B publication Critical patent/CN112598549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Technology (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种学习者潜在重叠社区检测方法、装置、设备及介质,方法包括:将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络;获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全;在所述补全后的学习者关系网络中查找学习者关系网络高阶结构三角形模体,构建所述三角形模体的邻接矩阵;根据所述邻接矩阵,确定所述学习者关系网络中的节点标签;根据所述节点标签,确定目标对象潜在重叠社区的检测结果。本发明提高了目标对象潜在重叠社区检测的质量和准确度,可广泛应用于数据挖掘技术领域。

Description

一种学习者潜在重叠社区检测方法、装置、设备及介质
技术领域
本发明涉及数据挖掘技术领域,尤其是一种学习者潜在重叠社区检测方法、装置、设备及介质。
背景技术
对目标对象而言,在线课程平台是一个极为自由的学习环境,大多数不存在课堂或班级等严格的教学组织形式,一门课程的目标对象多达几千甚至上万人,并且目标对象分布广泛,年龄结构、知识层次、学科背景甚至学习目的等均有显著差异。因此将具有相似专业背景、学习兴趣、知识层次甚至地理位置相近的目标对象“聚集在一起”(发现社区),有助于规范和引导学习行为,为目标对象、尤其是需要精确个性化学习导向才能调动其使用在线课程进行有效学习的目标对象(惰性目标对象和冷启动目标对象)提供个性化的推荐服务,促进学习目标的有效达成并提升在线课程平台的粘度;同时,也有助于评估和预测目标对象活动,发现潜在问题,为在线课程平台教育管理者和平台功能演化及预测等提供决策性支持。
在线课程中社区的概念早已被提及,在已有的研究中,多数指的是网络学习社区或虚拟学习社区,它是指由具有共同兴趣和学习目的的目标对象组成的学习团体在Internet上构建的虚拟学习环境,通过相互的交流、互动、讨论和协作等学习方式,共享彼此的观点、资源、知识、学习经验和集体智慧,从而促进知识建构,达到学习的目的。这种社区是从心理学、教育学和社会学等角度出发,是目标对象主观意愿下促成的一种带有明显主题倾向的在线学习社区,无法为惰性目标对象和冷启动目标对象提供学习导向并进而达到学习知识的目的。
目前,在线课程平台目标对象交互关系稀疏及在线主题学习社区对目标对象,尤其惰性目标对象和冷启动目标对象无法提供精确学习导向。
发明内容
有鉴于此,本发明实施例提供一种准确性高的学习者潜在重叠社区检测方法、装置、设备及介质。
本发明的一方面提供了一种学习者潜在重叠社区检测方法,包括:
将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络;所述目标对象包括学者或学习者;
获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全;
在所述补全后的学习者关系网络中查找学习者关系网络高阶结构三角形模体,构建所述三角形模体的邻接矩阵;
根据所述邻接矩阵,确定所述学习者关系网络中的节点标签;
根据所述节点标签,确定目标对象潜在重叠社区的检测结果。
优选地,所述将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络,包括:
将所述目标对象的学术好友关系作为社交关系数据,将所述目标对象的师生关系和同学关系作为学习关系数据;
根据所述社交关系数据和所述学习关系数据,构建学习者关系网络;
其中,所述学习者关系网络为无向无权重复杂网络;
所述无向无权重学习者关系网络的图结构表达式为:G(V,E);
V是目标对象节点集合,E是目标对象之间关联关系的集合,即V={v1,v2,…,vn},E={e1,e2,…,em},n和m分别表示目标对象人数和目标对象之间的关联关系数,所述目标对象之间的关联关系使用V中的两个目标对象节点(vi,vj)来表示。
优选地,所述获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全,包括:
获取目标对象在课程平台上的同学关系和/或师生关系;
将所述同学关系和/或师生关系补全所述学习者关系网络。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,包括:
从所述邻接矩阵中依次确定最大元素;
对所述最大元素对应的节点进行标签和权重的赋值;
判断每个所述三角形模体中节点标签的并集是否为空集,若是,则返回执行从所述邻接矩阵中依次确定最大元素的步骤;反之,则完成所述节点标签的初始化过程。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,还包括:
当节点拥有多个标签时,删除权重小于阈值的标签及该标签对应的权重;
当所述节点的所有标签的权重均小于所述阈值,则保留所有标签中最大的一个标签;当所有标签中最大的标签有多个时,则从所述多个最大的标签中随机选择一个。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,还包括:
对所有节点的标签权重进行归一化处理。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,还包括:
确定标准互信息和模块度;
根据所述标准互信息和所述模块度,确定所述学习者潜在重叠社区的检测质量;
其中,所述标准互信息的表达式为:
Figure BDA0002854639790000031
NMI代表标准互信息;A和B表示学习者关系网络社区结构的两种划分结果;C表示混合矩阵;其元素Cij表示社区划分A中的i社团里面的节点在社区划分B中的j社团里面出现的个数;CA和CB表示社区划分A和社区划分B中的社区个数;Ci,表示矩阵C中第i行的元素之和;C,j表示矩阵C中第j列的元素之和,n表示学习者关系网络节点数;
所述模块度Qov的表达式为:
Figure BDA0002854639790000032
m表示学习者关系网络的边数;ki,kj是节点学习者i,j的度数;A是学习者关系网络的邻接矩阵,Aij代表学习者关系网络邻接矩阵中的元素;如果学习者节点i和j相邻,则Aij=1,否则Aij=0;δ(Ci,Cj)代表学习者节点i和j是否在同一个社区;如果节点i和j在同一个社区,δ(Ci,Cj)=1,否则δ(Ci,Cj)=0。
本发明实施例还提供了一种学习者潜在重叠社区检测装置,包括:
抽象模块,用于将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络;
补全模块,用于获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全;
构建模块,用于在所述补全后的学习者关系网络中查找学习者关系网络高阶结构三角形模体,构建所述三角形模体的邻接矩阵;
第一确定模块,用于根据所述邻接矩阵,确定所述学习者关系网络中的节点标签;第二确定模块,用于根据所述节点标签,确定目标对象潜在重叠社区的检测结果。
本发明实施例还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
本发明的实施例将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络;获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全;在所述补全后的学习者关系网络中查找学习者关系网络高阶结构三角形模体,构建所述三角形模体的邻接矩阵;根据所述邻接矩阵,确定所述学习者关系网络中的节点标签;根据所述节点标签,确定目标对象潜在重叠社区的检测结果。本发明解决在线课程平台学习者交互数据稀疏问题,同时在构建的学习者稠密关系数据集上检测学习者潜在的学习社区,提高了在线课程平台学习者尤其惰性学习者和冷启动学习者的社区检测质量。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的学习者潜在重叠社区检测方法的步骤流程图;
图2为本发明实施例提供的目标对象稠密学习关系网络构建过程示意图;
图3为本发明实施例提供的在目标对象学习关系网络中寻找模体及生成模体邻接矩阵的过程示意图;
图4为本发明实施例中的步骤流程图;
图5为本发明实施例提供的学习者关系网络迭代结果图;
图6为本发明实施例提供的目标对象学习关系网络初始化结果示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
针对现有技术存在的问题,本发明针对目前在线课程平台目标对象交互关系稀疏及在线主题学习社区对目标对象,尤其惰性目标对象和冷启动目标对象无法提供精确学习导向等问题,使用学者在学术社交网络中的学术好友关系数据对目标对象在在线课程平台中的学习关系数据(同学关系、师生关系)进行补全,并在补全后的数据集上检测目标对象的潜在学习社区,为在线课程平台学习者尤其惰性学习者和冷启动学习者的精确的个性化推荐系统、平台功能演化及预测以及教育管理者等提供决策支持。
目标对象的目的是获取知识,使其在课程平台参与交互的动力不足。对MOOC内置讨论区的测量发现,不少于60%的目标对象从不参与讨论区各项活动,而这部分目标对象也是高危流失人群。实际上,交互数据的缺乏使得难以对在线课程平台目标对象(尤其是惰性目标对象和冷启动目标对象)的关联关系进行准确的分析与量化,进而使平台的相关服务受到限制。社交网络(social network)是目标对象日常生活必不可少的一部分,其记录目标对象与应用以及目标对象与目标对象之间交互的行为轨迹数据,通过对历史积累的海量数据的离线分析补全目标对象在在线学习平台中的数据,挖掘目标对象的潜在关联关系及偏好并为之提供精准的个性化服务,提高目标对象的学习兴趣、学习参与度和学习效果。
为了解决在线课程平台目标对象交互数据稀疏问题,提出在社交化在线课程平台中利用目标对象的社交数据补全目标对象在课程平台中的学习数据,并利用补全后的数据检测目标对象的潜在学习社区,进而为目标对象学习资源推荐、教学管理与决策、平台功能演化及预测等提供决策支持。其中,数据补全包含提取目标对象在社交网络中的学术社交数据(学术好友关系)和目标对象在课程平台中的关联关系数据(同学关系、师生关系)两个部分,利用提取后的目标对象学术社交关系数据补全目标对象学习关系数据,并在补全后的数据集上检测目标对象的潜在学习社区。
具体地,本发明实施例提供了一种学习者潜在重叠社区检测方法,如图1所示,方法包括以下步骤:
将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络;所述目标对象包括学者或学习者;
获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全;
在所述补全后的学习者关系网络中查找学习者关系网络高阶结构三角形模体,构建所述三角形模体的邻接矩阵;
根据所述邻接矩阵,确定所述学习者关系网络中的节点标签;
根据所述节点标签,确定目标对象潜在重叠社区的检测结果。
优选地,所述将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络,包括:
将所述目标对象的学术好友关系作为社交关系数据,将所述目标对象的师生关系和同学关系作为学习关系数据;
根据所述社交关系数据和所述学习关系数据,构建学习者关系网络;
其中,所述学习者关系网络为无向无权重复杂网络;
所述无向无权重学习者关系网络的图结构表达式为:G(V,E);
V是目标对象节点集合,E是目标对象之间关联关系的集合,即V={v1,v2,…,vn},E={e1,e2,…,em},n和m分别表示目标对象人数和目标对象之间的关联关系数,所述目标对象之间的关联关系使用V中的两个目标对象节点(vi,vj)来表示。
本发明实施例将目标对象社交关系数据(学术好友关系)和学习关系数据(师生关系、同学关系)抽象成无向无权重学习者关系网络结构G(V,E)的形式,其中V是目标对象节点集合,E是目标对象之间关联关系(边)的集合。即V={v1,v2,…,vn},E={e1,e2,…,em},n和m分别表示学者/目标对象人数和目标对象之间的关联关系(边)数,关系(边)使用V中的两个目标对象节点(vi,vj)来表示。
本发明实施例在无向无权重的目标对象学习关系网络中查找高阶结构三角形模体(Motifs)并构建模体邻接矩阵M,如图3所示。
优选地,所述获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全,包括:
获取目标对象在课程平台上的同学关系和/或师生关系;
将所述同学关系和/或师生关系补全所述学习者关系网络。
如图2所示,本发明实施例提取学者在学术社交网络中的学术好友关系,补全目标对象在课程平台上的学习关系(同学关系、师生关系),构建目标对象在社交化课程平台上稠密的目标对象学习关系网络。
可以理解的是,有一些在好友中出现的用户并不一定在同学关系和师生关系中出现。关于学习者关联关系挖掘也是本发明的一个突出改进点:使用学者(学者可能是学习者也可能不是学习者,这里的学习者实际上是指学生,而学者不一定是学生;学生可能会出现在学者的好友关系里,利用这一点进行学习者关联关系的衔接)好友关系补充学习者关联关系稀疏问题。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,包括:
从所述邻接矩阵中依次确定最大元素;
对所述最大元素对应的节点进行标签和权重的赋值;
判断每个所述三角形模体中节点标签的并集是否为空集,若是,则返回执行从所述邻接矩阵中依次确定最大元素的步骤;反之,则完成所述节点标签的初始化过程。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,还包括:
当节点拥有多个标签时,删除权重小于阈值的标签及该标签对应的权重;
当所述节点的所有标签的权重均小于所述阈值,则保留所有标签中最大的一个标签;当所有标签中最大的标签有多个时,则从所述多个最大的标签中随机选择一个。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,还包括:
对所有节点的标签权重进行归一化处理。
优选地,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,还包括:
确定标准互信息和模块度;
根据所述标准互信息和所述模块度,确定所述学习者潜在重叠社区的检测质量;
其中,所述标准互信息的表达式为:
Figure BDA0002854639790000071
NMI代表标准互信息;A和B表示学习者关系网络社区结构的两种划分结果;C表示混合矩阵;其元素Cij表示社区划分A中的i社团里面的节点在社区划分B中的j社团里面出现的个数;CA和CB表示社区划分A和社区划分B中的社区个数;Ci,表示矩阵C中第i行的元素之和;C,j表示矩阵C中第j列的元素之和,n表示学习者关系网络节点数;
所述模块度Qov的表达式为:
Figure BDA0002854639790000072
m表示学习者关系网络的边数;ki,kj是节点学习者i,j的度数;A是学习者关系网络的邻接矩阵,Aij代表学习者关系网络邻接矩阵中的元素;如果学习者节点i和j相邻,则Aij=1,否则Aij=0;δ(Ci,Cj)代表学习者节点i和j是否在同一个社区;如果节点i和j在同一个社区,δ(Ci,Cj)=1,否则δ(Ci,Cj)=0。
下面结合说明书附图,对本发明的方法的具体实现过程进行详细描述:
本实施例以社交化在线课程平台学者网作为实施例,提取学者网中全部课程的师生关系、同学关系以及全部学者用户的学术好友关系,对这三种类型数据进行脱敏处理,然后构建无向无权重目标对象稠密关系网络,并在目标对象关系网络中提取三角形模体(Motifs),然后对模体中的节点按照初始化过程赋予标签和权重,初始化结束后使用标签传播规则使网络中全部节点获得标签,当网络中全部节点标签稳定时算法停止迭代,最终实现目标对象潜在重叠社区检测,并利用已有方法NMI和Qov评价本发明所提方法的性能。
在该实施例中执行的步骤如图4所示,以图2中展示的目标对象稠密学习关系网络为例,执行完本发明实施例的方法后,该网络被划分为2个社区,分别为(1,2,3,4,5)和(5,6,7,8),其中节点5为重叠节点,其目标对象潜在重叠社区检测结果如图5所示。具体地,步骤包括:
(1)、将目标对象社交关系数据(学术好友关系)和学习关系数据(师生关系、同学关系)抽象成无向无权重学习者关系网络结构G(V,E)的形式,其中V是目标对象节点集合,E是目标对象之间关联关系(边)的集合。即V={v1,v2,…,vn},E={e1,e2,…,em},n和m分别表示学者/目标对象人数和目标对象之间的关联关系(边)数,关系(边)使用V中的两个目标对象节点(vi,vj)来表示;
(2)、提取学者在学术社交网络中的学术好友关系,补全目标对象在课程平台上的学习关系(同学关系、师生关系),构建目标对象在社交化课程平台上稠密的目标对象学习关系网络,如图2所示。
(3)、在无向无权重的目标对象学习关系网络中查找学习者关系网络高阶结构三角形模体(Motifs)并构建模体邻接矩阵M,如图3所示。
(4)、找出模体邻接矩阵中的最大元素Muv,并对Muv对应的节点u,v赋予相同的标签和权重(如图2中,目标对象关系网络则对节点3和节点4分别赋予标签1和权重1);u,v被赋予了标签,则初始化时和u,v关联的模体中的其他节点不再被赋予标签和权重;
(5)、继续寻找模体邻接矩阵余下元素中的最大值;重复步骤(4);如果每个模体节点标签的并集都不为空集,则初始化过程终止;图2中目标对象关系网络初始化结果如图6所示。
(6)、节点u继承其邻居节点v的标签i,权重为
Figure BDA0002854639790000081
其中,
Figure BDA0002854639790000082
表示节点u在第t轮在标签i下的权重,
Figure BDA0002854639790000083
为节点v在第t-1轮在标签i下的权重,d(u)为节点u的度数,N(u)为节点u的邻接节点集合;
(7)、当节点u拥有多个标签时,删除权重小于
Figure BDA0002854639790000084
的节点标签和其对应的权重;如果标签权重均小于
Figure BDA0002854639790000085
则保留最大的一个;如果最大的有多个,则随机保留1个;
(8)、每一轮迭代后对节点所保留的标签权重进行归一化处理;
(9)、当网络中所有节点的标签稳定时(或者达到一定的迭代次数时),迭代过程停止,否则重复步骤(6)-(8);
(10)、利用标准互信息NMI和模块度Qov两种方式评价本发明提出的方法的质量,标准互信息NMI和模块度Qov如公式1和公式2所示。
Figure BDA0002854639790000091
在公式1中,A和B表示学习者关系网络社区结构的两种划分结果,C表示混合矩阵,其元素Cij表示社区划分A中的i社团里面的节点在社区划分B中的j社团里面出现的个数。CA和CB表示社区划分A和社区划分B中的社区个数,Ci,表示矩阵C中第i行的元素之和,C,j表示矩阵C中第j列的元素之和,n表示学习者关系网络节点数。
Figure BDA0002854639790000092
在公式2中,m表示学习者关系网络的边数。ki,kj是节点i,j的度数。A是网络的邻接矩阵,如果节点i和j相邻,则Aij=1,否则Aij=0。如果节点i和j在同一个社区,δ(Ci,Cj)=1,否则δ(Ci,Cj)=0。
综上所述,相较于现有技术,本发明具有以下突出的特点:
(1)、在关联关系挖掘中,该方法通过目标对象在课程平台上的关联关系信息(同学关系、师生关系)提取目标对象在课程平台上的学习关系网络,因为目标对象直接的关联关系网络一般都比较稀疏,而且通常只对应一门或少数几门课程,所以该方法通过提取学者在社交网络上的学术社交关系(学术好友关系)补全目标对象的学习关系网络数据,最终构建相对稠密的无向无权重的目标对象学习关系网络,并在构建的多类型关联关系目标对象学习网络上检测目标对象潜在的学习社区。
(2)、在目标对象学习关系网络中寻找高阶组织三角形模体(Motifs),并构建模体邻接矩阵,在模体邻接矩阵中依次寻找较大的元素,将较大元素对应的节点u,v赋予相同的标签和权重;如果u,v被赋予了标签,则初始化时和u,v关联的模体中的其他节点不再被赋予标签和权重;如果网络中每个模体节点标签的并集都不为空集,则初始化过程终止。
(3)、在标签传播过程中,节点u继承其邻居节点v的标签i,权重计算方法为
Figure BDA0002854639790000093
其中,
Figure BDA0002854639790000094
表示节点u在第t轮在标签i下的权重,
Figure BDA0002854639790000095
为节点v在第t-1轮在标签i下的权重,d(u)为节点u的度数,N(u)为节点u的邻接节点集合;每一轮迭代后,如果节点u拥有多个标签,则删除权重小于
Figure BDA0002854639790000096
的节点标签和其对应的权重;如果标签权重均小于
Figure BDA0002854639790000101
则保留最大的一个;如果最大的有多个,则随机保留1个。
相较于现有技术,本发明具有以下优点:
目标对象尤其是惰性目标对象和冷启动目标对象的关联关系数据比较稀疏,本发明使用学者在学术社交网络中的学术好友关系数据对目标对象在在线课程平台中的关系数据(同学关系、师生关系)进行补全,并在补全后的数据集上检测目标对象的潜在学习社区。这种目标对象潜在关联关系挖掘方法可以更好的描述目标对象潜在的关联关系,尤其对于惰性目标对象和冷启动目标对象,通过社交网络数据补充其在课程平台中数据的不足,从而改善目标对象关联关系数据稀疏问题,进一步提高目标对象潜在重叠社区检测的质量以及更加准确、高效和细粒度的为在线课程平台中的目标对象(尤其惰性目标对象和冷启动目标对象)提供服务和管理。
本发明实施例还提供了一种学习者潜在重叠社区检测装置,包括:
抽象模块,用于将目标对象的社交关系数据和学习关系数据抽象成学习者关系网络;
补全模块,用于获取目标对象在学术社交网络中的学术好友关系,对所述学习者关系网络进行补全;
构建模块,用于在所述补全后的学习者关系网络中查找学习者关系网络高阶结构三角形模体,构建所述三角形模体的邻接矩阵;
第一确定模块,用于根据所述邻接矩阵,确定所述学习者关系网络中的节点标签;
第二确定模块,用于根据所述节点标签,确定目标对象潜在重叠社区的检测结果。
本发明实施例还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (5)

1.一种学习者潜在重叠社区检测方法,其特征在于,包括:
将目标对象的学术好友关系作为社交关系数据,将所述目标对象的师生关系和同学关系作为学习关系数据;
根据所述社交关系数据和所述学习关系数据,构建学习者关系网络;所述目标对象包括学者或学习者;
获取目标对象在学术社交网络中的学术好友关系,根据所述学术好友关系补全所述学习者关系网络;
在所述补全后的学习者关系网络中查找学习者关系网络高阶结构三角形模体,构建所述三角形模体的邻接矩阵;
找出所述三角形模体的邻接矩阵中的最大元素Muv,并对Muv对应的节点u,v赋予相同的标签和权重;节点u,v被赋予了标签后,则初始化时和u,v关联的模体中的其他节点不再被赋予标签和权重;
继续寻找所述三角形模体的邻接矩阵中除最大元素之外的其他元素的最大值,并对该最大值对应的节点赋予相同的标签和权重,直至每个模体节点标签的并集都不为空集,完成初始化过程,并进入迭代过程;
在迭代过程中,由目标节点u继承该目标节点u的邻居节点v的标签i和权重
Figure FDA0003546848510000011
当节点u拥有多个标签时,删除权重小于
Figure FDA0003546848510000012
的节点标签和其对应的权重;如果节点u的标签权重均小于
Figure FDA0003546848510000013
则保留最大的1个;如果节点u的标签权重均小于
Figure FDA0003546848510000014
且最大的有多个,则随机保留1个;
其中,权重
Figure FDA0003546848510000015
的表达式为
Figure FDA0003546848510000016
其中,
Figure FDA0003546848510000017
表示节点u在第t轮在标签i下的权重;
Figure FDA0003546848510000018
为节点v在第t-1轮在标签i下的权重;d(u)为节点u的度数;N(u)为节点u的邻接节点集合;
每一轮迭代过后,对各个节点所保留的标签权重进行归一化处理;
当网络中所有节点的标签稳定时,完成迭代过程,并确定目标对象潜在重叠社区的检测结果。
2.根据权利要求1所述的一种学习者潜在重叠社区检测方法,其特征在于,
所述学习者关系网络为无向无权重复杂网络;
所述学习者关系网络的图结构表达式为:G(V,E);
V是目标对象节点集合,E是目标对象之间关联关系的集合,即V={v1,v2,…,vn},E={e1,e2,…,em},n和m分别表示目标对象人数和目标对象之间的关联关系数,所述目标对象之间的关联关系使用V中的两个目标对象节点(vi,vj)来表示。
3.根据权利要求1所述的一种学习者潜在重叠社区检测方法,其特征在于,所述根据所述邻接矩阵,确定所述学习者关系网络中的节点标签,还包括:
确定标准互信息和模块度;
根据所述标准互信息和所述模块度,确定所述学习者潜在重叠社区的检测质量;
其中,所述标准互信息的表达式为:
Figure FDA0003546848510000021
NMI代表标准互信息;A和B表示学习者关系网络社区结构的两种划分结果;C表示混合矩阵;其元素Cij表示社区划分A中的i社团里面的节点在社区划分B中的j社团里面出现的个数;CA和CB表示社区划分A和社区划分B中的社区个数;Ci,表示矩阵C中第i行的元素之和;C,j表示矩阵C中第j列的元素之和,n表示学习者关系网络节点数;
所述模块度Qov的表达式为:
Figure FDA0003546848510000022
m表示学习者关系网络的边数;ki,kj是节点学习者i,j的度数;A是学习者关系网络的邻接矩阵,Aij代表学习者关系网络邻接矩阵中的元素;如果学习者节点i和j相邻,则Aij=1,否则Aij=0;δ(Ci,Cj)代表学习者节点i和j是否在同一个社区;如果节点i和j在同一个社区,δ(Ci,Cj)=1,否则δ(Ci,Cj)=0。
4.一种电子设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1-3任一项所述的方法。
5.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1-3中任一项所述的方法。
CN202011541203.3A 2020-12-23 2020-12-23 一种学习者潜在重叠社区检测方法、装置、设备及介质 Active CN112598549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011541203.3A CN112598549B (zh) 2020-12-23 2020-12-23 一种学习者潜在重叠社区检测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011541203.3A CN112598549B (zh) 2020-12-23 2020-12-23 一种学习者潜在重叠社区检测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112598549A CN112598549A (zh) 2021-04-02
CN112598549B true CN112598549B (zh) 2022-05-03

Family

ID=75200457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011541203.3A Active CN112598549B (zh) 2020-12-23 2020-12-23 一种学习者潜在重叠社区检测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112598549B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363350B (zh) * 2019-07-15 2023-10-10 西华大学 一种基于复杂网络的区域空气污染物分析方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020267B (zh) * 2012-12-26 2016-01-20 上海交通大学 基于三角簇多标签传播的复杂网络社区结构挖掘方法
US20170019495A1 (en) * 2014-03-10 2017-01-19 Nokia Solutions And Networks Oy Distribution of popular content between user nodes of a social network community via direct proximity-based communication
SK8068Y1 (sk) * 2015-05-05 2018-04-04 Polak Matus Stavebný modulový rám
CN109712010B (zh) * 2017-10-24 2023-07-18 华为云计算技术有限公司 发现社团的方法和装置、计算设备、可读存储介质
CN108712278A (zh) * 2018-04-24 2018-10-26 山西大学 一种基于集成学习的网络社区发现方法
CN108809709A (zh) * 2018-06-06 2018-11-13 山东大学 一种基于节点亲密性与标签传播的社区发现方法
CN110096623A (zh) * 2019-04-12 2019-08-06 大连理工大学 一种高效计算模体数量的方法
CN110263260A (zh) * 2019-05-23 2019-09-20 山西大学 一种面向社交网络的社区检测方法
CN110929044A (zh) * 2019-12-03 2020-03-27 山西大学 一种面向学术合作网络的社区检测方法和装置
CN112052940B (zh) * 2020-08-26 2023-11-24 西安电子科技大学 基于向量压缩与重构的社交网络特征动态提取方法

Also Published As

Publication number Publication date
CN112598549A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
Davis Clustering and structural balance in graphs
CN111177473B (zh) 人员关系分析方法、装置和可读存储介质
CN110971659A (zh) 推荐消息的推送方法、装置及存储介质
CN112116090A (zh) 神经网络结构搜索方法、装置、计算机设备及存储介质
CN112221159A (zh) 一种虚拟道具推荐方法、装置及计算机可读存储介质
CN111563156A (zh) 一种知识点智能诊断的方法、装置、电子设备及存储介质
CN112733035A (zh) 基于知识图谱的知识点推荐方法、装置、存储介质及电子装置
CN112598549B (zh) 一种学习者潜在重叠社区检测方法、装置、设备及介质
CN115358809A (zh) 一种基于图对比学习的多意图推荐方法及装置
Nafea et al. A novel algorithm for dynamic student profile adaptation based on learning styles
Buyrukoğlu A novel color labeled student modeling approach using e-learning activities for data mining
Moon et al. Rich representations for analyzing learning trajectories: Systematic review on sequential data analytics in game-based learning research
Vidu et al. Old meets new: integrating Artificial Intelligence in museums’ management practices
Sivill Ethical and statistical considerations in models of moral judgments
Cheng et al. Usability prioritization using performance metrics and hierarchical agglomerative clustering in MAR-learning application
CN111126812A (zh) 综合学习能力监测方法、装置、电子设备和存储介质
CN116228361A (zh) 基于特征匹配的课程推荐方法、装置、设备和存储介质
Jiang et al. Learning analytics in a blended computer education course
Amin Clustering Analysis of Admission of New Students Using K-Means Clustering and K-Medoids Algorithms to Increase Campus Marketing Potential
Soares et al. Citizen science-based labeling of imprecisely segmented images: Case study and preliminary results
Lee et al. Prescribing deep attentive score prediction attracts improved student engagement
CN112749335B (zh) 生命周期状态预测方法、装置、计算机设备和存储介质
Alif et al. Performance Analysis of Oversampling and Undersampling on Telco Churn Data Using Naive Bayes, SVM And Random Forest Methods
Reddy et al. Personality prediction using stack meta model
Alshmrany LFD-CNN: Levy flight distribution based convolutional neural network for an adaptive learning style prediction in E-learning environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant