CN111221915A - 基于CWK-means的在线学习资源质量分析方法 - Google Patents

基于CWK-means的在线学习资源质量分析方法 Download PDF

Info

Publication number
CN111221915A
CN111221915A CN201910313479.7A CN201910313479A CN111221915A CN 111221915 A CN111221915 A CN 111221915A CN 201910313479 A CN201910313479 A CN 201910313479A CN 111221915 A CN111221915 A CN 111221915A
Authority
CN
China
Prior art keywords
data
learning
index
value
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910313479.7A
Other languages
English (en)
Other versions
CN111221915B (zh
Inventor
马汉达
钱玉婷
刘相涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Ruide Peixin Education Technology Co ltd
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201910313479.7A priority Critical patent/CN111221915B/zh
Publication of CN111221915A publication Critical patent/CN111221915A/zh
Application granted granted Critical
Publication of CN111221915B publication Critical patent/CN111221915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于数据分析领域,具体涉及一种基于CWK‑means的在线学习资源质量分析方法;利用学习者在网络学习平台的学习数据,采用一种基于权重的初始中心优化K‑means算法,通过学习者的学习行为对学习资源进行聚类分析,结合学习者的学习行为与成绩之间的关系,通过学习者学习行为反馈出学习资源的质量、存在的问题,便于改进,提供更优质的学习资源。

Description

基于CWK-means的在线学习资源质量分析方法
技术领域
本发明涉及数据分析领域,具体涉及一种基于CWK-means的在线学习资源质量分析方法。
背景技术
互联网+教育技术的飞速发展给传统的教学模式带来了一个新的改革创新,我国在线教育发展迅速,用户规模呈直线上升趋势,在线学习的出现给学习者提供了很多便利,如今网络上的学习资源数不胜数,但质量良莠不齐。学习资源质量不高直接影响学习者的学习体验和学习效果,导致完成网络课程学习的人很少、课程的利用率低。在线学习资源质量不高的问题亟待解决,但很少有人使用在线学习平台中的学习行为数据去分析、改进在线学习资源的质量。因此使用数据挖掘技术通过学习者的学习行为分析学习资源质量,并挖掘学习者学习行为与学习资源质量的关系,从源头上解决学习资源质量问题,给学习者提供更优质的学习资源,这是非常有意义的。
发明内容
针对上述存在的问题,本发明提出一种基于CWK-means算法的在线学习资源质量分析方法,以提高学习资源质量。
为实现上述目的,本发明具体技术方案如下:一种基于CWK-means的在线学习资源质量分析方法,包括以下步骤:
1)从在线学习平台采集日志数据和数据库数据,构建特征向量;所述日志数据包括视频学习行为数据、文本学习行为数据和论坛学习行为数据,所述数据库数据包括测试学习行为数据和反馈数据;所述特征向量包括视频学习行为数据特征向量、文本学习行为数据特征向量和论坛学习行为数据特征向量、测试学习行为数据特征向量和反馈数据特征向量;所述视频学习行为数据的特征向量表示为:
Video={SLV,PN,PT,AN,AT,RN,RT}
其中,SLV、PN、PT、AN、AT、RN、RT分别代表学习时长、暂停次数、暂停时长、前进次数、前进时长、后退次数、后退时长;所述文本学习行为数据的特征向量表示为:
Text={SLT,FS,BS,MA,DL,CP,CRT}
其中,SLT、FS、BS、MA、DL、CP、CRT分别代表学习时长、前进滚动、后退滚动、标记、下载、复制、收藏;所述论坛学习行为数据的特征向量表示为:
Forum={SLF,WR,PR,RR,CRF}
其中,SLF、WR、PR、RR、CRF分别代表学习时长、看帖记录、发帖记录、回帖记录、收藏记录;所述测试学习行为数据的特征向量表示为:
Examinate={SLE,ES,WQ}
其中,SLE、ES、WQ分别代表测试时长、测试成绩、错题;所述反馈数据的特征向量表示为:
Feedback={UR,FS,FT,FR}
其中,UR、FS、FT、FR分别代表用户、反馈分数、反馈时间和反馈资源;
2)数据预处理,构建数据集X,记为:X={x1,x2,…,xn},xi表示数据集X中第i个数据对象,每个数据对象包含m个特征,表示为xi={xi1,xi2,…,xim},xij为第i个数据对象的第j个特征属性;
3)采用主客观相结合的方法计算各个特征属性的权重,第m个特征xim的权重记为
Figure BDA0002032307910000021
4)利用权重计算初始聚类中心;
5)利用步骤3)和步骤4)中计算出的权重和初始聚类中心,通过K-means算法对学习资源聚类即CWK-means算法对学习资源聚类,每个聚类对应一个质量等级。
进一步的,上述步骤2)中,数据预处理包括数据清洗、数据集成、数据归约、数据变换;所述数据清洗包括分析数据、缺失值处理、异常值处理、去重处理、噪音数据处理;所述数据集成采用模式集成方法;所述数据变换包括平方根转换、对数转换、倒数变换。
进一步的,上述步骤3)中第m个特征xim的权重
Figure BDA0002032307910000022
的计算方法包括如下步骤:
3.1)建立系统的递阶层次结构模型,层次结构模型包括目标层、准则层、方案层;
3.2)根据系统的递阶层次结构模型构造判断矩阵A=(aij)n*n,记为:
Figure BDA0002032307910000023
其中,aij为同一层次中关于某一准则重要性的两两比较的结果,取值方法如下:特征i与特征j相比较,具有相同重要性取值为1,前者比后者稍重要取值为3,前者比后者明显重要取值为5,前者比后者强烈重要取值为7,前者比后者极端重要取值为9;取值2、4、6、8表示上面相邻判断的中间值;i与j之比为aij则j与i之比为aji=1/aij
3.3)检验各判断矩阵是否满足一致性要求,如果满足一致性要求转步骤3.4),否则转步骤3.2)修改判断矩阵;
3.4)计算主观权重w,计算公式如下:
Aw=λmaxw
3.5)利用资源质量分析结构模型构建原始数列矩阵R,记为:
Figure BDA0002032307910000031
其中,rij表示评价对象i在评价指标j下的评价值;
3.6)对原始数列矩阵R中的数据进行无钢化处理,使各个指标具有可比性,其中,选取的指标包括越大越优型指标和越小越优型指标,所述越大越优型指标计算公式如下:
Figure BDA0002032307910000032
所述越小越优型指标计算公式如下:
Figure BDA0002032307910000033
其中,Vij表示rij经过无钢化处理之后的数值,max(rj)和min(rj)分别表示第j个指标的最大值和最小值;
3.7)计算第j个指标下第i个对象指标值所占比重Pij,计算公式如下:
Figure BDA0002032307910000034
3.8)计算第j个指标的熵值,计算公式如下:
Figure BDA0002032307910000035
3.9)计算客观权重W,计算公式如下:
Figure BDA0002032307910000041
其中,dj为差异系数,dj=1-ej,dj越大表示该指标包含的信息量越大,应该赋予越大的权重;
3.10)使用拉格朗日乘子法组合计算出来的两种权重,计算最终的权重
Figure BDA0002032307910000048
计算公式如下:
Figure BDA0002032307910000042
其中,wi为层次分析法计算出来的权重,Wi为熵权法计算出来的权重。
进一步的,上述步骤4)中初始聚类中心的计算方法包括如下步骤:
4.1)计算两两数据对象之间基于权重的欧式距离,任意对象xi,xj(1≤i≠j≤n)之间基于权重的欧式距离公式如下:
Figure BDA0002032307910000043
其中,
Figure BDA0002032307910000044
为属性m的权重,xim为对象i的第m个特征;
4.2)计算数据集中的数据对象xi(i∈[1,n])对应的距离密度,计算公式如下;
Figure BDA0002032307910000045
4.3)计算数据集中数据对象xi(i∈[1,n])的邻域半径Ri
Figure BDA0002032307910000046
其中,cR(cR∈(0,1))为邻域半径调节系数,当cR=0.13时有较好的聚类效果;
4.4)依次计算数据对象xi的点密度D(xi),即以xi为圆心,邻域半径Ri为半径的球形域内包含的数据对象个数;
D(xi)=|{p|d(xi,p)≤Ri,p∈X}|
4.5)把数据集中的数据对象按照点密度D(xi)降序排放;
4.6)使用分离系数函数确定k的值,分离系数函数表示为:
Figure BDA0002032307910000047
其中,uij是xi在第j个类中的隶属度,k的最优选择公式为:
Figure BDA0002032307910000051
其中,Ω为所有聚类结果;
4.7)取点密度最大的数据对象作为第一个初始聚类中心C1
4.8)选择一个和C1距离超过R1的且密度仅次于C1的数据对象作为第二个初始聚类中心;
4.9)判断是否找到K个聚类中心,如果找到转步骤5),否则转步骤4.8)。
进一步的,上述步骤3.3)中检验各判断矩阵一致性的方法为:计算出判断矩阵的最大的特征根λmax,计算一致性指标CI,计算一致性比例CR,当CR<0.10时,满足一致性要求,其中一致性指标计算公式如下:
Figure BDA0002032307910000052
一致性比例计算公式如下:
Figure BDA0002032307910000053
RI是同阶随机判断矩阵的一致性指标的平均值。
本发明的有益效果在于克服K-means算法对初始聚类中心比较敏感的问题,减小了无关属性对学习资源聚类的影响,使得学习资源的划分更科学、提高了资源聚类的精确度,使得学习资源的优劣对比更加明显;更有效的分析学习资源存在的问题,从而提高学习资源质量。
附图说明
图1是资源质量分析方法流程图。
图2是资源质量分析的递阶层次结构模型图。
图3是CWK-means算法的流程图。
图4是学习资源质量分析模型图。
具体实施方式
下面结合附图以及具体实施例对本发明作进一步的说明,需要指出的是,下面仅以一种最优化的技术方案对本发明的技术方案以及设计原理进行详细阐述,但本发明的保护范围并不限于此。
所述实施例为本发明的优选的实施方式,但本发明并不限于上述实施方式,在不背离本发明的实质内容的情况下,本领域技术人员能够做出的任何显而易见的改进、替换或变型均属于本发明的保护范围。
下面详细介绍基于CWK-means的在线学习资源质量分析方法的技术方案。学习资源质量分析模型图如图2所示,本方法从在线学习平台采集学习者在线学习行为数据。
本发明一种基于CWK-means的在线学习资源质量分析方法,主要包括以下几个步骤:采集数据,特征提取,数据预处理,CWK-means聚类,数据分析,数据可视化。
1)采集数据,构建数据的特征向量;从在线学习平台采集数据,采集的数据包括日志数据和数据库数据,日志数据包括视频学习行为数据、文本学习行为数据和论坛学习行为数据,数据库数据包括测试学习行为数据和反馈数据;其中,视频学习行为数据表示为:
Video={SLV,PN,PT,AN,AT,RN,RT},
其中,SLV、PN、PT、AN、AT、RN、RT分别代表学习时长、暂停次数、暂停时长、前进次数、前进时长、后退次数、后退时长;文本学习行为数据表示为:
Text={SLT,FS,BS,MA,DL,CP,CRT},
其中,SLT、FS、BS、MA、DL、CP、CRT分别代表学习时长、前进滚动、后退滚动、标记、下载、复制、收藏;论坛学习行为数据表示为:
Forum={SLF,WR,PR,RR,CRF}
其中,SLF、WR、PR、RR、CRF分别代表学习时长、看帖记录、发帖记录、回帖记录、收藏记录;测试学习行为数据表示为:
Examinate={SLE,ES,WQ},
其中,SLE、ES、WQ分别代表测试时长、测试成绩、错题;反馈数据表示为:
Feedback={UR,FS,FT,FR}
其中,UR、FS、FT、FR分别代表用户、反馈分数、反馈时间和反馈资源;
2)通过数据清洗、数据集成、数据归约和数据变换对数据进行预处理,构建数据集X,表示为X={x1,x2,…,xn},xi表示数据集X中第i个数据对象,每个数据对象包含m个特征,表示为xi={xi1,xi2,…,xim},第i个数据对象的第j个特征属性定义为xij
3)采用主客观相结合的方法计算各个特征属性的权重,第m个特征xim的权重为
Figure BDA0002032307910000061
计算方法包括如下步骤:
3.1)建立系统的递阶层次结构模型,其中,层次结构模型包括目标层、准则层、方案层,如图3所示;
3.2)根据系统的递阶层次结构模型构造判断矩阵,对同一层次的各元素关于上一层次中某一准则的重要性进行两两比较,引用数字1-9及其倒数作为标度定义判断矩阵A=(aij)m*n;具体方法如下:
特征i与特征j相比较,具有相同重要性取值为1,前者比后者稍重要取值为3,前者比后者明显重要取值为5,前者比后者强烈重要取值为7,前者比后者极端重要取值为9;取值2、4、6、8表示上面相邻判断的中间值;i与j之比为aij则j与i之比为aji=1/aij
3.3)检验各判断矩阵是否满足一致性要求,如果满足转步骤3.4),否则转步骤3.2),修改判断矩阵,其中,检验各判断矩阵一致性的方法如下:
计算出判断矩阵的最大的特征根λmax,计算一致性指标CI,计算一致性比例CR,当CR<0.10时,满足一致性要求,计算公式如下:
一致性指标:
Figure BDA0002032307910000071
一致性比例:
Figure BDA0002032307910000072
其中,RI是同阶随机判断矩阵的一致性指标的平均值,RI的取值如下:
(n,RI)={(1,0),(2,0),(3,0.52),(4,0.89),(5,1.12),(6,1.24),(7,1.36),(8,1.41),(9,1.46)}
3.4)计算主观权重w,公式如下:
Aw=λmaxw
3.5)利用资源质量分析结构模型构建原始数列矩阵R,其中,rij表示评价对象i在评价指标j下的评价值,评价对象Mi(i=1,2,…,m),评价指标Nj(j=1,2,…,n),资源质量分析结构模型如图3所示;
Figure BDA0002032307910000073
3.6)采用阙值法对原始数列矩阵R无钢化处理,使Vij处于0~1之间,使各个指标具有可比性,其中分为两种指标类型:越大越优型指标和越小越优型指标,计算公式如下:
越大越优型指标:
Figure BDA0002032307910000081
越小越优型指标:
Figure BDA0002032307910000082
其中,Vij表示rij经过无钢化处理之后的数值,max(rj)和min(rj)分别表示第j个指标的最大值和最小值;
3.7)计算第j个指标下第i个对象指标值所占比重Pij
Figure BDA0002032307910000083
3.8)计算第j个指标的熵值;
Figure BDA0002032307910000084
3.9)计算出客观权重W;
Figure BDA0002032307910000085
其中dj为差异系数,dj=1-ej,dj越大表示该指标包含的信息量越大,应该赋予越大的权重;
3.10)使用拉格朗日乘子法组合计算出来的两种权重,得到最终的权重
Figure BDA0002032307910000086
Figure BDA0002032307910000087
其中,wi为层次分析法计算出来的权重,Wi为熵权法计算出来的权重;
4)利用权重计算初始聚类中心,如图4所示计算方法包括如下步骤:
4.1)计算两两数据对象之间基于权重的欧式距离,任意对象xi,xj(1≤i≠j≤n)之间基于权重的欧式距离公式如下:
Figure BDA0002032307910000088
其中,
Figure BDA0002032307910000089
为属性m的权重,xim为对象i的第m个特征;
4.2)计算数据集中的数据对象xi(i∈[1,n])对应的距离密度,计算公式如下;
Figure BDA0002032307910000091
4.3)计算数据集中数据对象xi(i∈[1,n])的邻域半径Ri
Figure BDA0002032307910000092
其中,cR(cR∈(0,1))为邻域半径调节系数,当cR=0.13时有较好的聚类效果;
4.4)依次计算数据对象xi的点密度D(xi),即以xi为圆心,邻域半径Ri为半径的球形域内包含的数据对象个数;
D(xi)=|{p|d(xi,p)≤Ri,p∈X}|
4.5)把数据集中的数据对象按照点密度D(xi)降序排放;
4.6)使用分离系数函数确定k的值,分离系数函数表示为:
Figure BDA0002032307910000093
其中,uij是xi在第j个类中的隶属度,k的最优选择公式为:
Figure BDA0002032307910000094
其中,Ω为所有聚类结果;
4.7)取点密度最大的数据对象作为第一个初始聚类中心C1
4.8)选择一个和C1距离超过R1的且密度仅次于C1的数据对象作为第二个初始聚类中心;
4.9)判断是否找到K个聚类中心,如果是转步骤5),否则转步骤4.8);
5)利用步骤3)和步骤4)中计算出的权重和初始聚类中心,通过K-means算法对学习资源聚类即CWK-means算法对学习资源聚类,每一个类中在线学习资源质量相似,根据学习者学习过程中的行为,判断学习资源存在的不足,最终每个聚类对应一个质量等级。

Claims (5)

1.一种基于CWK-means的在线学习资源质量分析方法,包括以下步骤:
1)从在线学习平台采集日志数据和数据库数据,构建特征向量;所述日志数据包括视频学习行为数据、文本学习行为数据和论坛学习行为数据,所述数据库数据包括测试学习行为数据和反馈数据;所述特征向量包括视频学习行为数据特征向量、文本学习行为数据特征向量和论坛学习行为数据特征向量、测试学习行为数据特征向量和反馈数据特征向量;所述视频学习行为数据的特征向量表示为:
Video={SLV,PN,PT,AN,AT,RN,RT}
其中,SLV、PN、PT、AN、AT、RN、RT分别代表学习时长、暂停次数、暂停时长、前进次数、前进时长、后退次数、后退时长;所述文本学习行为数据的特征向量表示为:
Text={SLT,FS,BS,MA,DL,CP,CRT}
其中,SLT、FS、BS、MA、DL、CP、CRT分别代表学习时长、前进滚动、后退滚动、标记、下载、复制、收藏;所述论坛学习行为数据的特征向量表示为:
Forum={SLF,WR,PR,RR,CRF}
其中,SLF、WR、PR、RR、CRF分别代表学习时长、看帖记录、发帖记录、回帖记录、收藏记录;所述测试学习行为数据的特征向量表示为:
Examinate={SLE,ES,WQ}
其中,SLE、ES、WQ分别代表测试时长、测试成绩、错题;所述反馈数据的特征向量表示为:
Feedback={UR,FS,FT,FR}
其中,UR、FS、FT、FR分别代表用户、反馈分数、反馈时间和反馈资源;
2)数据预处理,构建数据集X,记为:X={x1,x2,…,xn},xi表示数据集X中第i个数据对象,每个数据对象包含m个特征,表示为xi={xi1,xi2,…,xim},xij为第i个数据对象的第j个特征属性;
3)采用主客观相结合的方法计算各个特征属性的权重,第m个特征xim的权重记为
Figure FDA0002032307900000011
4)利用权重计算初始聚类中心;
5)利用步骤3)和步骤4)中计算出的权重和初始聚类中心,通过K-means算法对学习资源聚类即CWK-means算法对学习资源聚类,每个聚类对应一个质量等级。
2.如权利要求1所述的基于CWK-means的在线学习资源质量分析方法,其特征在于所述步骤2)中,数据预处理包括数据清洗、数据集成、数据归约、数据变换;所述数据清洗包括分析数据、缺失值处理、异常值处理、去重处理、噪音数据处理;所述数据集成采用模式集成方法;所述数据变换包括平方根转换、对数转换、倒数变换。
3.如权利要求1所述的基于CWK-means的在线学习资源质量分析方法,其特征在于所述步骤3)中第m个特征xim的权重
Figure FDA0002032307900000021
的计算方法包括如下步骤:
3.1)建立系统的递阶层次结构模型,层次结构模型包括目标层、准则层、方案层;
3.2)根据系统的递阶层次结构模型构造判断矩阵A=(aij)n*n,记为:
Figure FDA0002032307900000022
其中,aij为同一层次中关于某一准则重要性的两两比较的结果,取值方法如下:特征i与特征j相比较,具有相同重要性取值为1,前者比后者稍重要取值为3,前者比后者明显重要取值为5,前者比后者强烈重要取值为7,前者比后者极端重要取值为9;取值2、4、6、8表示上面相邻判断的中间值;i与j之比为aij则j与i之比为aji=1/aij
3.3)检验各判断矩阵是否满足一致性要求,如果满足一致性要求转步骤3.4),否则转步骤3.2)修改判断矩阵;
3.4)计算主观权重w,计算公式如下:
Aw=λmaxw
3.5)利用资源质量分析结构模型构建原始数列矩阵R,记为:
Figure FDA0002032307900000023
其中,rij表示评价对象i在评价指标j下的评价值;
3.6)对原始数列矩阵R中的数据进行无钢化处理,使各个指标具有可比性,其中,选取的指标包括越大越优型指标和越小越优型指标,所述越大越优型指标计算公式如下:
Figure FDA0002032307900000024
所述越小越优型指标计算公式如下:
Figure FDA0002032307900000031
其中,Vij表示rij经过无钢化处理之后的数值,max(rj)和min(rj)分别表示第j个指标的最大值和最小值;
3.7)计算第j个指标下第i个对象指标值所占比重Pij,计算公式如下:
Figure FDA0002032307900000032
3.8)计算第j个指标的熵值,计算公式如下:
Figure FDA0002032307900000033
3.9)计算客观权重W,计算公式如下:
Figure FDA0002032307900000034
其中,dj为差异系数,dj=1-ej,dj越大表示该指标包含的信息量越大,应该赋予越大的权重;
3.10)使用拉格朗日乘子法组合计算出来的两种权重,计算最终的权重
Figure FDA0002032307900000035
计算公式如下:
Figure FDA0002032307900000036
其中,wi为层次分析法计算出来的权重,Wi为熵权法计算出来的权重。
4.如权利要求1所述的基于CWK-means的在线学习资源质量分析方法,其特征在于所述步骤4)中初始聚类中心的计算方法包括如下步骤:
4.1)计算两两数据对象之间基于权重的欧式距离,任意对象xi,xj(1≤i≠j≤n)之间基于权重的欧式距离公式如下:
Figure FDA0002032307900000037
其中,
Figure FDA0002032307900000038
为属性m的权重,xim为对象i的第m个特征;
4.2)计算数据集中的数据对象xi(i∈[1,n])对应的距离密度,计算公式如下;
Figure FDA0002032307900000041
4.3)计算数据集中数据对象xi(i∈[1,n])的邻域半径Ri
Figure FDA0002032307900000042
其中,cR(cR∈(0,1))为邻域半径调节系数,当cR=0.13时有较好的聚类效果;
4.4)依次计算数据对象xi的点密度D(xi),即以xi为圆心,邻域半径Ri为半径的球形域内包含的数据对象个数;
D(xi)=|{p|d(xi,p)≤Ri,p∈X}|
4.5)把数据集中的数据对象按照点密度D(xi)降序排放;
4.6)使用分离系数函数确定k的值,分离系数函数表示为:
Figure FDA0002032307900000043
其中,uij是xi在第j个类中的隶属度,k的最优选择公式为:
Figure FDA0002032307900000044
其中,Ω为所有聚类结果;
4.7)取点密度最大的数据对象作为第一个初始聚类中心C1
4.8)选择一个和C1距离超过R1的且密度仅次于C1的数据对象作为第二个初始聚类中心;
4.9)判断是否找到K个聚类中心,如果找到转步骤5),否则转步骤4.8)。
5.如权利要求3所述的基于CWK-means的在线学习资源质量分析方法,其特征在于所述步骤3.3)中检验各判断矩阵一致性的方法为:计算出判断矩阵的最大的特征根λmax,计算一致性指标CI,计算一致性比例CR,当CR<0.10时,满足一致性要求,其中一致性指标计算公式如下:
Figure FDA0002032307900000045
一致性比例计算公式如下:
Figure FDA0002032307900000046
RI是同阶随机判断矩阵的一致性指标的平均值。
CN201910313479.7A 2019-04-18 2019-04-18 基于CWK-means的在线学习资源质量分析方法 Active CN111221915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910313479.7A CN111221915B (zh) 2019-04-18 2019-04-18 基于CWK-means的在线学习资源质量分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910313479.7A CN111221915B (zh) 2019-04-18 2019-04-18 基于CWK-means的在线学习资源质量分析方法

Publications (2)

Publication Number Publication Date
CN111221915A true CN111221915A (zh) 2020-06-02
CN111221915B CN111221915B (zh) 2024-01-09

Family

ID=70810003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910313479.7A Active CN111221915B (zh) 2019-04-18 2019-04-18 基于CWK-means的在线学习资源质量分析方法

Country Status (1)

Country Link
CN (1) CN111221915B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219346A (zh) * 2021-12-24 2022-03-22 江苏童能文化科技有限公司 一种提高网络学习环境服务质量的方法及系统
CN116523402A (zh) * 2023-05-04 2023-08-01 江苏师范大学 一种基于多模态数据的网络学习资源质量评估方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484454A (zh) * 2014-12-27 2015-04-01 西安交通大学 一种面向知识地图的网络学习行为与效能分析方法
CN104731916A (zh) * 2015-03-24 2015-06-24 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度优化初始中心的k均值聚类方法
CN107609651A (zh) * 2017-08-15 2018-01-19 华中师范大学 一种基于学习者模型的设计项评估方法
US20180101570A1 (en) * 2016-10-11 2018-04-12 Google Inc. Hierarchical quantization for fast inner product search
CN108182489A (zh) * 2017-12-25 2018-06-19 浙江工业大学 一种基于在线学习行为分析的个性化学习推荐方法
CN109508429A (zh) * 2019-01-30 2019-03-22 四川省电子信息产业技术研究院有限公司 基于教育平台大数据分析的个性化自适应学习推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484454A (zh) * 2014-12-27 2015-04-01 西安交通大学 一种面向知识地图的网络学习行为与效能分析方法
CN104731916A (zh) * 2015-03-24 2015-06-24 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度优化初始中心的k均值聚类方法
US20180101570A1 (en) * 2016-10-11 2018-04-12 Google Inc. Hierarchical quantization for fast inner product search
CN107609651A (zh) * 2017-08-15 2018-01-19 华中师范大学 一种基于学习者模型的设计项评估方法
CN108182489A (zh) * 2017-12-25 2018-06-19 浙江工业大学 一种基于在线学习行为分析的个性化学习推荐方法
CN109508429A (zh) * 2019-01-30 2019-03-22 四川省电子信息产业技术研究院有限公司 基于教育平台大数据分析的个性化自适应学习推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
向俊;: "数据挖掘在网络教学资源整合中的应用" *
王琳琳;: "基于协同过滤的在线学习个性化推荐技术研究" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219346A (zh) * 2021-12-24 2022-03-22 江苏童能文化科技有限公司 一种提高网络学习环境服务质量的方法及系统
CN116523402A (zh) * 2023-05-04 2023-08-01 江苏师范大学 一种基于多模态数据的网络学习资源质量评估方法及系统
CN116523402B (zh) * 2023-05-04 2024-04-19 江苏师范大学 一种基于多模态数据的网络学习资源质量评估方法及系统

Also Published As

Publication number Publication date
CN111221915B (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
Whitehill et al. Whose vote should count more: Optimal integration of labels from labelers of unknown expertise
CN111414461B (zh) 一种融合知识库与用户建模的智能问答方法及系统
CN107609147B (zh) 一种从日志流中自动提取特征的方法和系统
CN110659665B (zh) 一种异维特征的模型构建方法及图像识别方法、装置
CN109033408B (zh) 信息推送方法及装置、计算机可读存储介质、电子设备
CN109726747B (zh) 基于社交网络推荐平台的数据融合排序方法
CN112613552B (zh) 一种结合情感类别注意力损失的卷积神经网络情感图像分类方法
CN110348486A (zh) 基于采样与特征简约的非平衡数据集转换方法及系统
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
CN110580510A (zh) 一种聚类结果评价方法和系统
CN109086794A (zh) 一种基于t-lda主题模型的驾驶行为模式识方法
CN114588633B (zh) 一种内容推荐方法
CN111221915A (zh) 基于CWK-means的在线学习资源质量分析方法
Fagni et al. Fine-grained prediction of political leaning on social media with unsupervised deep learning
CN113705310A (zh) 特征学习的方法、目标物体的识别方法和对应装置
CN116452241B (zh) 一种基于多模态融合神经网络的用户流失概率计算方法
CN117195027A (zh) 基于成员选择的簇加权聚类集成方法
CN110008975B (zh) 基于免疫危险理论的社交网络水军检测方法
Yang et al. An academic social network friend recommendation algorithm based on decision tree
CN112529637B (zh) 基于情景感知的服务需求动态预测方法及系统
CN113435713B (zh) 基于gis技术和两模型融合的风险地图编制方法及系统
CN112463964B (zh) 文本分类及模型训练方法、装置、设备及存储介质
Li Construction of Sports Training Performance Prediction Model Based on a Generative Adversarial Deep Neural Network Algorithm
CN114357307A (zh) 一种基于多维度特征的新闻推荐方法
CN107818319A (zh) 一种自动判别人脸美丽程度的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231008

Address after: 518000 1002, Building A, Zhiyun Industrial Park, No. 13, Huaxing Road, Henglang Community, Longhua District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Wanzhida Technology Co.,Ltd.

Address before: 212013 No. 301, Xuefu Road, Zhenjiang, Jiangsu

Applicant before: JIANGSU University

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231212

Address after: 710000, 1st and 2nd floors of Building 8, Huizeju Community, Shangzhuang, Bapu Fifth Road, Chanba Ecological Zone, Xi'an City, Shaanxi Province

Applicant after: Xi'an Ruide Peixin Education Technology Co.,Ltd.

Address before: 518000 1002, Building A, Zhiyun Industrial Park, No. 13, Huaxing Road, Henglang Community, Longhua District, Shenzhen, Guangdong Province

Applicant before: Shenzhen Wanzhida Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 710000, Building 203-A, Building 14, Qinchuangyuan Vertical Linkage Incubator Base, Fengdong New City, Xi'an City, Shaanxi Province

Patentee after: Xi'an Ruide Peixin Education Technology Co.,Ltd.

Address before: 710000, 1st and 2nd floors of Building 8, Huizeju Community, Shangzhuang, Bapu Fifth Road, Chanba Ecological Zone, Xi'an City, Shaanxi Province

Patentee before: Xi'an Ruide Peixin Education Technology Co.,Ltd.

CP03 Change of name, title or address