CN110889431A - 基于K-Means算法改进的高频职业技能生命曲线聚类方法 - Google Patents

基于K-Means算法改进的高频职业技能生命曲线聚类方法 Download PDF

Info

Publication number
CN110889431A
CN110889431A CN201911030748.5A CN201911030748A CN110889431A CN 110889431 A CN110889431 A CN 110889431A CN 201911030748 A CN201911030748 A CN 201911030748A CN 110889431 A CN110889431 A CN 110889431A
Authority
CN
China
Prior art keywords
clustering
skill
life curve
frequency
occupational
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911030748.5A
Other languages
English (en)
Inventor
陈冲
司华友
万健
吴浩鹏
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Hangzhou Electronic Science and Technology University
Original Assignee
Hangzhou Electronic Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Electronic Science and Technology University filed Critical Hangzhou Electronic Science and Technology University
Priority to CN201911030748.5A priority Critical patent/CN110889431A/zh
Publication of CN110889431A publication Critical patent/CN110889431A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明公开了一种基于K‑Means算法改进的高频职业技能生命曲线聚类方法,其特征在于,包括以下步骤:1)爬取用户信息形成用户文档库;2)挖掘高频职业技能;3)构建高频职业技能生命曲线;4)使用密度峰算法选取K个职业技能生命曲线聚类中心;5)使用K‑Means算法对职业技能生命曲线进行聚类;6)采用戴维森堡丁指数评估聚类结果,评估不合格,增加职业技能生命曲线聚类中心的数量K,返回步骤4,评估合格则进入下一步;7)得到最终高频职业技能生命曲线聚类结果。本发明通过对高频职业技能生命曲线进行定义,使用密度峰算法选取合适聚类中心点,然后使用K‑Means算法进行聚类,进而比较稳定有效的找出生命曲线相似的职业技能。

Description

基于K-Means算法改进的高频职业技能生命曲线聚类方法
技术领域
本发明涉及数据挖掘领域,尤其是涉及一种基于K-Means算法改进的高频职业技能生命曲线聚类方法。
背景技术
一项职业技能的生命曲线,受到很多因素影响例如职业技能掌握的难易程度、社会对该项职业技能的需求量、该项职业技能对人的身体素质需求以及该项职业技能在社会的认可度等各个方面的影响。所以绘画出职业技能的生命曲线十分困难。但是随着互联网的发展社交网络平台已经成为互联网发展中不可获缺的重要组成部分,职业社交网站上包含了大量用户的职业信息。例如用户掌握的技能、以及其他用户对该用户掌握技能的点赞数、用户的年龄等。职业社交网络的出现为刻画职业技能生命曲线提供了一种新的途径。
对高频职业技能生命曲线进行高效且准确的聚类,使得同一个类中的职业技能有着相似的发展轨迹。未来可以根据增长曲线模型等对职业技术的发展趋势做一定的预测,并衡量职业技能的发展潜力,同样可以应用于职业推荐系统中,使得推荐算法能够推荐更具发展潜力的职业给用户。这些都需要依赖对职业技能生命曲线高效且准确的聚类方法。现有最常用的聚类方法是K-Means方法,但是聚类中心点选择的好坏对聚类效果影响非常大。常用的聚类中心点的选择方法有两种:随机选取和选取彼此距离比较远的数据点。前者在数据集上随机选取K个点作为聚类中心点;后者先从数据集中随机选择一个数据点作为初始聚类中心,然后计算其他数据点到该点的距离,选择距离最远的数据点作为第二个初始聚类中心点,接着计算其他点到前两个的点的平均距离,选择距离最远的点作为第三个聚类中心点。以此类推,直到选出K个初始聚类中心点。第一种方法随机性大,如果随机选取的聚类中心点比较接近聚类效果差,在大部分情况下聚类效果较差。第二种方法相比随机选择法有较大的改善,能够选择出彼此距离相对较远的K个点,使得最后的聚类结果较好,但此方法依然存在一定的不稳定性,由于第一个点是随机选取,因此在某些情况下依然会形成较差的聚类效果。
针对职业技能生命曲线难以刻画,职业技能生命曲线聚类中心点难以选择的问题因此需要找到合适的职业技能生命曲线聚类方法。
发明内容
本发明的目的在于针对针对职业技能生命曲线难以刻画,职业技能生命曲线聚类中心点难以选择的问题,提供一种刻画高频职业技能生命曲线模型并为高频职业技能生命曲线聚类提供高效且稳定的聚类方法。
本发明解决上述技术问题所采用的技术方案为:
本发明涉及的一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于,其包括以下步骤:
1)采用WebMagic爬虫系统爬取用户信息形成用户文档库;
2)采用MongoDB数据管理工具,挖掘高频职业技能;
3)采用MongoDB数据管理工具,基于用户之间的点赞关系,使用用户年龄信息进行分段统计,构建高频职业技能生命曲线;
4)使用密度峰算法选取K个职业技能生命曲线聚类中心;
5)使用K-Means算法对职业技能生命曲线进行聚类;
6)采用戴维森堡丁指数度量同一个类簇中数据点的紧密程度以及不同类的聚类中心的离散程度来评估聚类结果,评估不合格,增加职业技能生命曲线聚类中心的数量K,返回步骤4,评估合格则进入下一步;
7)基于评估结果,选取戴维森堡丁指数指标趋向稳定的K个初始聚类中心点进行聚类得到最终高频职业技能生命曲线聚类结果。
优选地,在步骤4)和步骤5)的过程中,通过皮尔森相关系数度量的方式,计算其中任意两个职业技能生命曲线的相似度。
优选地,所述的步骤1爬取的用户信息包含用户ID、用户年龄、用户掌握的职业技能、用户每个职业技能拥有的点赞数。
优选地,所述的步骤2高频职业技能为拥有这项技能的人数占总人数的比例超过0.1%的技能。
优选地,所述的步骤3高频职业技能的生命曲线为该技能在不同年龄段中拥有的平均点赞数。
优选地,所述的步骤4中初步设置职业技能生命曲线聚类中心的个数为2个;所述步骤6中,若评估不合格,每次增加的职业技能生命曲线聚类中心的数量1个。
优选地,所述的步骤4中,采用皮尔森相关系数计算两个职业技能生命曲线的相似度,具体步骤为:
4.1)从两个职业技能生命曲线中提取两个变量X和Y,变量X和Y分别表示两个职业技能生命曲线在各个年龄段的取值;
4.2)计算两个变量X与Y的期望值μx与μy,期望值是指变量X和Y中,不同年龄段的平均点赞数之和与年龄段数量的商即平均点赞数的均值;
4.5)计算两个变量X和Y的标准差σx和σy
Figure BDA0002250080140000031
Figure BDA0002250080140000032
4.4)计算两个变量线性相关程度的皮尔森相关系数ρ,
Figure BDA0002250080140000033
4.4)计算两条职业技能生命曲线之间的距离,
Figure BDA0002250080140000034
本发明与现有技术相比,存在的以下有益效果:
本发明使用职业社交网站LinkedIn中高频职业技能在不同年龄段中被点赞的平均数量对高频职业技能生命曲线进行建模,并定义了曲线相似度的计算公式,结合密度峰算法选取聚类中心点解决了K-Means算法在职业技能生命曲线聚类时由于聚类初始点选取不当造成的聚类结果波动大、聚类效果不佳的问题。能够高效、稳定的找出具有相似生命曲线的高频职业技能。
附图说明
附图1是本发明方法的总体实现框图;
附图2是爬虫采集用户信息原理图;
附图3是随机选取聚类中心的K-Means算法和本发明方法聚类效果对比图。
具体实施方式
为进一步了解本发明的内容,结合实施例对本发明作详细描述,以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例一:
结合附图1所示,本发明提出的一种基于K-Means算法改进的高频职业技能生命曲线聚类方法包括以下步骤:
1)采用WebMagic爬虫系统爬取用户信息形成用户文档库:
从LinkedIn网站上随机采集了64442份用户档案,其中有13536个用户填写了职业技能,使用这13536个拥有职业技能的用户档案构成用户档案库,爬虫采集用户档案原理如附图2所示,主要包括四个大模块。分别为URL管理模块、网页下载模块、数据解析模块、数据持久化模块。用户信息采集主要步骤为,一、在URL管理模块里的URL队列里添加初始用户信息URL地址。二、下载器从URL队列获取一个URL,通过模拟Http请求从LinkedIn网站上下载包含用户信息的html页面。三、把下载得到的html页面传递给数据解析模块,通过正则表达式进行匹配解析得到用户信息,同时把用户好友信息URL地址传递给URL管理模块,用户管理模块对URL进行去重处理。四、把解析得到的用户信息交由数据持久化模块存储到数据库。
2)采用MongoDB数据管理工具,挖掘高频职业技能:
统计用户档案库里面所有职业技能掌握的人数T=(t1,t2,t3…tn),其中ti表示第i种职业技能掌握的人数,然后计算每种技能在人群中的掌握程度,其中第i种职业技能在人群中的掌握程度计算公式为:
Figure BDA0002250080140000041
其中num是用户档案库中的用户数。把技能在人群中掌握程度大于0.1%的称为高频职业技能,一共找到4764项高频技能。
3)采用MongoDB数据管理工具,基于用户之间的点赞关系,使用用户年龄信息进行分段统计,构建高频职业技能生命曲线:
统计每个高频职业技能被点赞数L=(l1,l2,l3,…,ln),计算每个高频职业技能的在不同年龄段的平均点赞数,其中第i种职业技能的平均点赞数为lai=(li/gi1,li/gi2,li/gi3,…,li/gi10),其中gij为掌握第i种职业技能在第j个年龄段分组中的人数总数,li/gij为第i种高频职业技能在Gj年龄段的平均点赞数,分组标准如表1所示:
表1
Figure BDA0002250080140000051
4)使用利用密度峰算法来选取K个初始聚类中心:
在使用利用密度峰算法来选取K个初始聚类中心前,首先通过皮尔森相关系数度量的方式,逐一计算其中任意两个职业技能生命曲线的相似度,方法为:
4.1)从两个职业技能生命曲线中提取两个变量X和Y,变量X和Y分别表示两个职业技能生命曲线在各个年龄段的取值;
4.2)计算两个变量X与Y的期望值μx与μy,期望值是指变量X和Y中,不同年龄段的平均点赞数之和与年龄段数量的商即平均点赞数的均值;
4.3)计算两个变量X和Y的标准差σx和σy
Figure BDA0002250080140000052
Figure BDA0002250080140000053
4.4)计算两个变量线性相关程度的皮尔森相关系数ρ,用于表示数据点的局部密度,
Figure BDA0002250080140000054
当ρ>0时,说明X与Y成正相关,两者有着相似的变化趋势;
当ρ<0时,说明X与Y成负相关,两者的变化趋势相反;
|ρ|的值越接近1,则X与Y的相关程度越高;
|ρ|的值越接近0,则X与Y的相关程度越低;
4.5)依据两个变量线性相关程度的皮尔森相关系数ρ,计算两条职业技能生命曲线之间的距离,
Figure BDA0002250080140000061
当ρ的取值越接近1时,表示变量X与Y的相关程度越高,代表了两类职业技能的生命曲线越相似,Dis(X,Y)越小;
当ρ的取值越接近-1时,代表变量X与Y的相关程度越低,则两类职业技能的生命曲线变化趋势相差较大,Dis(X,Y)也会较大;
4.6)然后使用密度峰算法选取K个职业技能生命曲线聚类中心,具体为:
依据每个数据点的局部密度大小θi和聚类中心距离δi的数值,组合(θii),根据决策因子γi=θi×δi对数据点进行从大到小排序,选取前K个点作为聚类中心,K个初始值可定为2;其中数据点i的局部密度大小θi为数据点i在以i为圆心,给定领域半径范围内的数据点的数量。数据点i的聚类中心距离δi为数据点i与其他局部密度大于该点的数据点的最近距离。
5)使用K-Means算法对其余职业技能生命曲线进行聚类,进行聚类时,采用4.1~4.5相同的方法计算每个职业技能生命曲线与个聚类中心的类距;
6)采用戴维森堡丁指数度量同一个类簇中数据点的紧密程度以及不同类的聚类中心的离散程度来评估聚类结果,
戴维森堡丁指数度量主要计算的是聚类结果中每个类的相似度,具体公式如下。
Figure BDA0002250080140000062
Figure BDA0002250080140000063
Figure BDA0002250080140000064
Figure BDA0002250080140000065
Mjk=||xj-xk||2=dist(xj,xk)
其中:Rk为第k类与所有其他各类的相似度的最大值,Rjk表示第k类与第j类的相似度;式中Sj和Sk分别表示两个类中数据点的离散程度;Mjk为第j类与第k类中心之间的距离;IDBI表示两个类簇之间的比值;
其中IDBI越小表示聚类结果越好,通过戴维森堡丁指数度量同一个类中数据点的紧密程度以及不同类的聚类中心的离散程度来评估聚类结果,若聚类结果不好,则增加选取的聚类中心个数K,优选地每次增加1,然后返回步骤4;若聚类结果好,则进入下一步;
7)选取DBI值趋向稳定的K作为聚类中心点的个数,使用K-Means算法进行聚类得到最终结果,聚类结束。
效果实施例:
为了进一步验证本发明方法的可行性和有效性,使用随机选取聚类中心的K-Means算法和本发明方法进行对比,聚类评价对比结果如图3所示:
通过图3可以清晰的看见随机选取聚类中心的K-Means方法聚类效果波动较大,而本发明方法的聚类效果波动不明显,能够更加准确有效的得到合适的聚类中心数并完成聚类。
以上结合实施例对本发明进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍属于本发明的专利涵盖范围之内。

Claims (7)

1.一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于,其包括以下步骤:
1)采用WebMagic爬虫系统爬取用户信息形成用户文档库;
2)采用MongoDB数据管理工具,挖掘高频职业技能;
3)采用MongoDB数据管理工具,基于用户之间的点赞关系,使用用户年龄信息进行分段统计,构建高频职业技能生命曲线;
4)使用密度峰算法选取K个职业技能生命曲线聚类中心;
5)使用K-Means算法对职业技能生命曲线进行聚类;
6)采用戴维森堡丁指数度量同一个类簇中数据点的紧密程度以及不同类的聚类中心的离散程度来评估聚类结果,评估不合格,增加职业技能生命曲线聚类中心的数量K,返回步骤4,评估合格则进入下一步;
7)基于评估结果,选取戴维森堡丁指数指标趋向稳定的K个初始聚类中心点进行聚类得到最终高频职业技能生命曲线聚类结果。
2.根据权利要求1所述的基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于:在步骤4)和步骤5)的过程中,通过皮尔森相关系数度量的方式,计算其中任意两个职业技能生命曲线的相似度。
3.根据权利要求1所述的一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于:所述的步骤1爬取的用户信息包含用户ID、用户年龄、用户掌握的职业技能、用户每个职业技能拥有的点赞数。
4.根据权利要求1所述的一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于:所述的步骤2高频职业技能为拥有这项技能的人数占总人数的比例超过0.1%的技能。
5.根据权利要求1所述的一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于:所述的步骤3高频职业技能的生命曲线为该技能在不同年龄段中拥有的平均点赞数。
6.根据权利要求1所述的一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于:所述的步骤4中初步设置职业技能生命曲线聚类中心的个数为2个;所述步骤6中,若评估不合格,每次增加的职业技能生命曲线聚类中心的数量1个。
7.根据权利要求2所述的一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于:采用皮尔森相关系数计算两个职业技能生命曲线的相似度的具体步骤为:
4.1)从两个职业技能生命曲线中提取两个变量X和Y,变量X和Y分别表示两个职业技能生命曲线在各个年龄段的取值;
4.2)计算两个变量X与Y的期望值μx与μy,期望值是指变量X和Y中,不同年龄段的平均点赞数之和与年龄段数量的商;
4.3)计算两个变量X和Y的标准差σx和σy
Figure FDA0002250080130000021
Figure FDA0002250080130000022
4.4)计算两个变量线性相关程度的皮尔森相关系数ρ,
Figure FDA0002250080130000023
4.5)计算两条职业技能生命曲线之间的距离,
Figure FDA0002250080130000024
CN201911030748.5A 2019-10-28 2019-10-28 基于K-Means算法改进的高频职业技能生命曲线聚类方法 Pending CN110889431A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911030748.5A CN110889431A (zh) 2019-10-28 2019-10-28 基于K-Means算法改进的高频职业技能生命曲线聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911030748.5A CN110889431A (zh) 2019-10-28 2019-10-28 基于K-Means算法改进的高频职业技能生命曲线聚类方法

Publications (1)

Publication Number Publication Date
CN110889431A true CN110889431A (zh) 2020-03-17

Family

ID=69746566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911030748.5A Pending CN110889431A (zh) 2019-10-28 2019-10-28 基于K-Means算法改进的高频职业技能生命曲线聚类方法

Country Status (1)

Country Link
CN (1) CN110889431A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860997A (zh) * 2023-02-21 2023-03-28 山东心法科技有限公司 一种基于职业技能的人才培训管理方法、系统及介质

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003131604A (ja) * 2001-10-23 2003-05-09 Toyota Motor Corp 広告表示方法、及び広告データ配信サーバ
US20070203786A1 (en) * 2002-06-27 2007-08-30 Nation Mark S Learning-based performance reporting
US20140143251A1 (en) * 2012-11-19 2014-05-22 The Penn State Research Foundation Massive clustering of discrete distributions
CN104008150A (zh) * 2014-05-20 2014-08-27 中国科学院信息工程研究所 一种对社交网络信息传播趋势预测的方法及系统
JP2016042213A (ja) * 2014-08-13 2016-03-31 ヤフー株式会社 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
CN106022849A (zh) * 2016-07-11 2016-10-12 互动派科技股份有限公司 一种新媒体价值与效果评估方法和系统
US20170083608A1 (en) * 2012-11-19 2017-03-23 The Penn State Research Foundation Accelerated discrete distribution clustering under wasserstein distance
CN106933211A (zh) * 2017-04-18 2017-07-07 中南大学 一种识别工业过程动态调整区间的方法和装置
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法
CN107657266A (zh) * 2017-08-03 2018-02-02 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法
US20180137137A1 (en) * 2016-11-16 2018-05-17 International Business Machines Corporation Specialist keywords recommendations in semantic space
CN108280472A (zh) * 2018-01-18 2018-07-13 安徽师范大学 一种基于局部密度和聚类中心优化的密度峰聚类方法
CN109171812A (zh) * 2018-09-26 2019-01-11 南京邮电大学 一种基于弹性模量的颈动脉衰老预测方法
CN109409757A (zh) * 2018-11-02 2019-03-01 中电科新型智慧城市研究院有限公司 一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法
US20190102374A1 (en) * 2017-10-02 2019-04-04 Facebook, Inc. Predicting future trending topics
CN109685122A (zh) * 2018-12-12 2019-04-26 浙江工业大学 一种基于密度峰和引力影响的半监督游客画像数据聚类方法
CN109872327A (zh) * 2019-03-13 2019-06-11 南京航空航天大学 基于改进后密度峰和k均值聚类的簇绒地毯图像分割方法
CN110069467A (zh) * 2019-04-16 2019-07-30 沈阳工业大学 基于皮尔逊系数与MapReduce并行计算的电网尖峰负荷聚类提取法
CN110111083A (zh) * 2019-05-15 2019-08-09 深圳市前海欢雀科技有限公司 一种基于深度学习构建职业规划的系统

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003131604A (ja) * 2001-10-23 2003-05-09 Toyota Motor Corp 広告表示方法、及び広告データ配信サーバ
US20070203786A1 (en) * 2002-06-27 2007-08-30 Nation Mark S Learning-based performance reporting
US20140143251A1 (en) * 2012-11-19 2014-05-22 The Penn State Research Foundation Massive clustering of discrete distributions
US20170083608A1 (en) * 2012-11-19 2017-03-23 The Penn State Research Foundation Accelerated discrete distribution clustering under wasserstein distance
CN104008150A (zh) * 2014-05-20 2014-08-27 中国科学院信息工程研究所 一种对社交网络信息传播趋势预测的方法及系统
JP2016042213A (ja) * 2014-08-13 2016-03-31 ヤフー株式会社 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
CN106022849A (zh) * 2016-07-11 2016-10-12 互动派科技股份有限公司 一种新媒体价值与效果评估方法和系统
US20180137137A1 (en) * 2016-11-16 2018-05-17 International Business Machines Corporation Specialist keywords recommendations in semantic space
CN106933211A (zh) * 2017-04-18 2017-07-07 中南大学 一种识别工业过程动态调整区间的方法和装置
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法
CN107657266A (zh) * 2017-08-03 2018-02-02 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法
US20190102374A1 (en) * 2017-10-02 2019-04-04 Facebook, Inc. Predicting future trending topics
CN108280472A (zh) * 2018-01-18 2018-07-13 安徽师范大学 一种基于局部密度和聚类中心优化的密度峰聚类方法
CN109171812A (zh) * 2018-09-26 2019-01-11 南京邮电大学 一种基于弹性模量的颈动脉衰老预测方法
CN109409757A (zh) * 2018-11-02 2019-03-01 中电科新型智慧城市研究院有限公司 一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法
CN109685122A (zh) * 2018-12-12 2019-04-26 浙江工业大学 一种基于密度峰和引力影响的半监督游客画像数据聚类方法
CN109872327A (zh) * 2019-03-13 2019-06-11 南京航空航天大学 基于改进后密度峰和k均值聚类的簇绒地毯图像分割方法
CN110069467A (zh) * 2019-04-16 2019-07-30 沈阳工业大学 基于皮尔逊系数与MapReduce并行计算的电网尖峰负荷聚类提取法
CN110111083A (zh) * 2019-05-15 2019-08-09 深圳市前海欢雀科技有限公司 一种基于深度学习构建职业规划的系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DANIEL E: "Gartner’s hype cycle and information system research issues", 《INTERNATIONAL JOURNAL OF ACCOUNTING INFORMATION SYSTEMS》 *
HUAYOU SI: "An Industrial Analysis Technology About Occupational Adaptability and Association Rules in Social Networks", 《IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS》 *
张书: "基于函数型数据分析的短期电力负荷预测研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 *
邱莉榕: "《算法设计与优化》", 30 June 2017 *
陈彬彬: "面向LinkedIn社交网络的职业技能分布特征研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860997A (zh) * 2023-02-21 2023-03-28 山东心法科技有限公司 一种基于职业技能的人才培训管理方法、系统及介质

Similar Documents

Publication Publication Date Title
CN105701216B (zh) 一种信息推送方法及装置
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN107896153B (zh) 一种基于移动用户上网行为的流量套餐推荐方法及装置
CN104599084A (zh) 一种群体计算的质量控制方法及装置
CN109544196A (zh) 预约订单的价格倍数确定方法和装置
CN114332984B (zh) 训练数据处理方法、装置和存储介质
CN115577152B (zh) 基于数据分析的在线图书借阅管理系统
CN111460323B (zh) 基于人工智能的焦点用户挖掘方法和装置
CN109543940B (zh) 活动评估方法、装置、电子设备及存储介质
CN111695084A (zh) 模型生成方法、信用评分生成方法、装置、设备及存储介质
CN111582450A (zh) 一种基于参数评价的神经网络模型训练方法及相关装置
CN111079009A (zh) 一种用于政务地图服务的用户兴趣检测方法及系统
CN111510368A (zh) 家庭群组识别方法、装置、设备及计算机可读存储介质
CN116450982A (zh) 一种基于云服务推送的大数据分析方法及系统
CN111061948A (zh) 一种用户标签推荐方法、装置、计算机设备及存储介质
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
CN110889431A (zh) 基于K-Means算法改进的高频职业技能生命曲线聚类方法
CN110457387B (zh) 一种应用于网络中用户标签确定的方法及相关装置
CN109977131A (zh) 一种房型匹配系统
CN111325255B (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN111552882B (zh) 一种新闻影响力计算方法、装置、计算机设备及存储介质
CN111078859B (zh) 一种基于引用次数的作者推荐方法
CN110543601B (zh) 一种基于中智集的上下文感知兴趣点推荐方法及系统
CN112836750A (zh) 一种系统资源分配方法、装置及设备
CN109992592B (zh) 基于校园消费卡流水数据的高校贫困生识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200317