CN112396102B - 基于时空移动特征分布的移动群智感知用户联盟聚类方法 - Google Patents
基于时空移动特征分布的移动群智感知用户联盟聚类方法 Download PDFInfo
- Publication number
- CN112396102B CN112396102B CN202011282797.0A CN202011282797A CN112396102B CN 112396102 B CN112396102 B CN 112396102B CN 202011282797 A CN202011282797 A CN 202011282797A CN 112396102 B CN112396102 B CN 112396102B
- Authority
- CN
- China
- Prior art keywords
- user
- alliance
- clustering
- users
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于移动群智感知中用户聚类及任务分配技术领域,具体涉及一种基于时空移动特征分布的移动群智感知用户联盟聚类方法,包括以下步骤:1)描述用户移动行为特征与用户活跃度,确定初始联盟聚类中心;2)基于用户上传数据,计算用户数据与联盟相似度,设置每个联盟中的用户上限,保障聚类数据的平衡性;3)结合得到的用户联盟相似度与当前联盟中用户数量,基于用户联盟判定准则,实现用户联盟聚类。本发明在用户数据质量已知的条件下,可有效地挖掘出重要用户数据,算法稳定,聚类速率快,保证聚类结果的平衡性并提升聚类效果。本发明与现有技术中两种常见的聚类方法进行性能相比,具有分类准确率高、平衡性效果优和计算复杂度低的优点。
Description
技术领域
本发明属于移动群智感知中用户聚类及任务分配技术领域,具体涉及一种基于时空移动特征分布的移动群智感知用户联盟聚类方法。
背景技术
近年来,随着用户手持移动智能设备的日益普及与通信网络技术的不断发展,移动群智感知(Mobile Crowdsensing,MCS)已成为跨空间和大规模数据传感的一个前沿研究问题,通过以参与用户作为中心,实现大量感知任务的执行。虽然移动群智感知的研究已得到了长足的发展,但考虑到用户感知能力的差异性,任务地理位置的多样性,如何确保任务的合理分配已成为一个亟待解决的问题。
任务分配是MCS感知任务中的关键问题,它是在用户与任务之间找到最佳匹配方法。通常,用户的时空分布将影响着任务分配的优劣。聚类使处于相同任务区域中的用户具有更高的相似性,提升了备选用户数据的可用性,增强任务分配的合理性。用户聚类是移动群智感知必不可少的技术之一
在现实中,现有的用户聚类方法普遍存才算法复杂度高于数据平衡性差的不足,因此,需要一种低复杂度且具有平衡性的用户聚类方法,以增强用户可用性,为任务分配高效性提供保障。
发明内容
本发明的目的在于提供在用户数据质量已知的条件下,可以有效地挖掘出重要用户数据,算法稳定,聚类速率快,保证聚类结果的平衡性并提升聚类效果的一种基于时空移动特征分布的移动群智感知用户联盟聚类方法。
本发明的目的通过如下技术方案来实现:包括以下步骤:
步骤1:计算用户移动行为特征与用户活跃度,确定K个联盟的初始聚类中心点cj,j=1,2,...,K;
所述的用户移动行为特征反映用户在给定时间间隔内,在不同空间位置上的移动时空行为分布特征,用户移动行为特征表示为:
其中,mbc(ui,ls)表示用户ui在空间位置ls上的用户移动行为特征;fqua(ui,ls)表示用户ui在空间位置ls上的数据质量;fqua(ui,l)表示用户ui在所有空间位置l上的数据质量;fco(ui,ls)表示用户ui在空间位置ls上的感知成本;fco(ui,l)表示用户ui在所有空间位置l上的感知成本;
所述的用户活跃度ma(ui,l)为用户ui在所有空间位置l上的数据质量与感知成本,用户活跃度ma(uj,l)表示为:;
其中,n为用户的数量;
步骤2:基于用户上传数据,计算用户数据与联盟相似度,设置每个联盟中的用户上限τ,保障聚类数据的平衡性;
用户ui与第j个联盟中心点cj的相似度为:
其中,fqua(cj,l)表示第j个联盟中心点cj在所有空间位置l上的数据质量;fco(cj,l)表示第j个联盟中心点cj在所有空间位置l上的感知成本;
步骤3:根据用户联盟相似度与联盟中用户数量,基于用户联盟判定准则,实现用户联盟聚类;
步骤3.1.1:若联盟k中用户数量未达到上限τ,则将用户ui加入到联盟k中,完成用户ui的联盟聚类,执行步骤3.3;若联盟k中用户数量达到上限,则执行步骤3.1.2;
步骤3.1.2:提取联盟k中的边界用户ue,判断是否小于若则将用户ui加入到联盟k中,剔除联盟k中的边界用户ue,重新分配边界用户ue的所属联盟,完成用户ui的联盟聚类,执行步骤3.3;若则执行步骤3.2;
步骤3.3:判断是否完成所有用户的联盟聚类,若未完成则返回步骤3.1。
本发明的有益效果在于:
本发明在用户数据质量已知的条件下,可有效地挖掘出重要用户数据,算法稳定,聚类速率快,保证聚类结果的平衡性并提升聚类效果。本发明与两种常见的聚类方法进行性能相比(即K-Means方法和Fuzzy C-means方法),具有分类准确率高、平衡性效果优和计算复杂度低的优点。
附图说明
图1为本发明的总体流程图。
图2为本发明实施例在用户聚类中,不同用户规模下,三种方法的聚类准确率对比图。
图3为本发明实施例在用户聚类中,不同用户规模下,三种方法的标准信息熵对比图。
图4为本发明实施例在用户聚类中,不同用户规模下,三种方法的运行时间对比图。。
具体实施方式
下面结合附图对本发明做进一步描述。
本发明的目的是为了高效挖掘重要用户数据与保障聚类结果平衡。本发明在用户数据质量已知的条件下,可有效地挖掘出重要用户数据,算法稳定,聚类速率快,保证聚类结果的平衡性并提升聚类效果。
一种基于时空移动特征分布的移动群智感知用户联盟聚类方法,包括以下步骤:
步骤1:计算用户移动行为特征与用户活跃度,确定K个联盟的初始聚类中心点cj,j=1,2,...,K;
所述的用户移动行为特征反映用户在给定时间间隔内,在不同空间位置上的移动时空行为分布特征,用户移动行为特征表示为:
其中,mbc(ui,ls)表示用户ui在空间位置ls上的用户移动行为特征;fqua(ui,ls)表示用户ui在空间位置ls上的数据质量;fqua(ui,l)表示用户ui在所有空间位置l上的数据质量;fco(ui,ls)表示用户ui在空间位置ls上的感知成本;fco(ui,l)表示用户ui在所有空间位置l上的感知成本;
所述的用户活跃度ma(ui,l)为用户ui在所有空间位置l上的数据质量与感知成本,用户活跃度ma(uj,l)表示为:;
其中,n为用户的数量;
步骤2:基于用户上传数据,计算用户数据与联盟相似度,设置每个联盟中的用户上限τ,保障聚类数据的平衡性;
用户ui与第j个联盟中心点cj的相似度为:
其中,fqua(cj,l)表示第j个联盟中心点cj在所有空间位置l上的数据质量;fco(cj,l)表示第j个联盟中心点cj在所有空间位置l上的感知成本;
步骤3:根据用户联盟相似度与联盟中用户数量,基于用户联盟判定准则,实现用户联盟聚类;
步骤3.1.1:若联盟k中用户数量未达到上限τ,则将用户ui加入到联盟k中,完成用户ui的联盟聚类,执行步骤3.3;若联盟k中用户数量达到上限,则执行步骤3.1.2;
步骤3.1.2:提取联盟k中的边界用户ue,判断是否小于若则将用户ui加入到联盟k中,剔除联盟k中的边界用户ue,重新分配边界用户ue的所属联盟,完成用户ui的联盟聚类,执行步骤3.3;若则执行步骤3.2;
步骤3.3:判断是否完成所有用户的联盟聚类,若未完成则返回步骤3.1。
本发明与两种常见的聚类方法进行性能相比(即K-Means方法和Fuzzy C-means方法),具有分类准确率高、平衡性效果优和计算复杂度低的优点。
实施例1:
本实施例提供了一种基于时空移动特征分布的移动群智感知用户联盟聚类方法,所述方法的流程图如图1所述,包括以下步骤:
第一步、描述用户移动行为特征与用户活跃度,确定初始联盟聚类中心;
1)用户行为特征反映用户在给定时间间隔内,在不同空间位置上的移动时空行为分布特征,用户的行为特征表示为:
式中:mbc(uj,li)表示用户uj在空间位置li上的用户行为特征,fqua(uj,li)和fqua(uj,l)分别表示用户uj在li上的数据质量以及在所有空间位置l上的数据质量,fco(uj,li)和fco(uj,l)分别表示用户uj在li上的感知成本以及在所有空间位置l上的感知成本;
2)从本质上来看,用户行为特征属于相对值,用户活跃度属于绝对值。定义用户活跃度为用户uj在不同空间位置上的数据质量与感知成本,用户活跃度表示为:
3)根据任务发布特点,计算参与用户活跃度,确定初始用户联盟中心;
第二步、基于用户上传数据,计算用户数据与联盟相似度,设置每个联盟中的用户上限,保障聚类数据的平衡性;
1)计算用户ui与K个联盟中心点的相似度,相似度计算公式如下:
接着,将用户ui与K个联盟中心点的相似度由大到小进行排序,表示为:
STC={simui,j|j=1,2,...,K} (4)
2)为了保障生成的用户聚类联盟的平衡性,应对每个用户联盟中的用户数量设定上限τ,定义如下:
||simui,cj||≤τ (5)
其中,||simui,cj||表示每个用户联盟中的用户数量;
第三步、结合第一步与第二步中得到的用户联盟相似度与当前联盟中用户数量,基于用户联盟判定准则,实现用户联盟聚类;
将用户ui及与第j个联盟中心的相似度simui,j存入CSj={{ui,simui,j}...},并根据以下用户联盟判定准则进行用户联盟聚类:
1)针对用户ui,先尝试加入相似度最高的联盟中心cj,若当前联盟中用户数量未达到上限,即||simui,cj||<τ,将ui加入到联盟cj中;
通过用户移动行为特征、联盟相似度计算与分析,实现了用户聚类并保证了聚类结果平衡性,为群智感知任务分配提供用户保障。
图2、图3和图4分别展示了不同用户规模下,三种方法的聚类准确率对比、标准信息熵对比和运行时间对比。从图2可以看出,随着用户数量的增加,三种方法的聚类准确率均会出现一定程度的下降,这是因为大量用户数据中存在越来越多的低相似度数据,从而降低了聚类准确率。但本发明方法由于考虑各联盟用户数量上限,取得的准确率优于K-Means方法和Fuzzy C-means方法,这说明本发明方法具有聚类准确性高的优点。标准信息熵是用于衡量不同联盟间的平衡度,值越接近于1表示聚类结果平衡性越好,从图3可以看出,本发明方法的标准信息熵值基本保持在0.93以上,这说明了本发明方法具有平衡性强的优点。从图4可以看出,随着用户数量的增加,三种方法的运行时间都会相应的增加,但本发明方法的运行时间增长幅度低且均优于K-Means方法和Fuzzy C-means方法,这是因为所提发明方法是针对平衡约束的特点对K-Means方法进行改进,当联盟中用户数量达到上限时,新用户数据通过试探性地尝试与联盟边界用户交换位置,不仅保障了聚类结果与K-Means一样具有较好内聚性,还约束了不同联盟的平衡性,说明了本发明方法具有运行速度快的优点。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于时空移动特征分布的移动群智感知用户联盟聚类方法,其特征在于,包括以下步骤:
步骤1:计算用户移动行为特征与用户活跃度,确定K个联盟的初始聚类中心点cj,j=1,2,...,K;
所述的用户移动行为特征反映用户在给定时间间隔内,在不同空间位置上的移动时空行为分布特征,用户移动行为特征表示为:
其中,mbc(ui,ls)表示用户ui在空间位置ls上的用户移动行为特征;fqua(ui,ls)表示用户ui在空间位置ls上的数据质量;fqua(ui,l)表示用户ui在所有空间位置l上的数据质量;fco(ui,ls)表示用户ui在空间位置ls上的感知成本;fco(ui,l)表示用户ui在所有空间位置l上的感知成本;
所述的用户活跃度ma(ui,l)为用户ui在所有空间位置l上的数据质量与感知成本,用户活跃度ma(uj,l)表示为:
其中,n为用户的数量;
步骤2:基于用户上传数据,计算用户数据与联盟相似度,设置每个联盟中的用户上限τ,保障聚类数据的平衡性;
用户ui与第j个联盟中心点cj的相似度为:
其中,fqua(cj,l)表示第j个联盟中心点cj在所有空间位置l上的数据质量;fco(cj,l)表示第j个联盟中心点cj在所有空间位置l上的感知成本;
步骤3:根据用户联盟相似度与联盟中用户数量,基于用户联盟判定准则,实现用户联盟聚类;
步骤3.1.1:若联盟k中用户数量未达到上限τ,则将用户ui加入到联盟k中,完成用户ui的联盟聚类,执行步骤3.3;若联盟k中用户数量达到上限,则执行步骤3.1.2;
步骤3.1.2:提取联盟k中的边界用户ue,判断是否小于若则将用户ui加入到联盟k中,剔除联盟k中的边界用户ue,重新分配边界用户ue的所属联盟,完成用户ui的联盟聚类,执行步骤3.3;若则执行步骤3.2;
步骤3.3:判断是否完成所有用户的联盟聚类,若未完成则返回步骤3.1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011282797.0A CN112396102B (zh) | 2020-11-17 | 2020-11-17 | 基于时空移动特征分布的移动群智感知用户联盟聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011282797.0A CN112396102B (zh) | 2020-11-17 | 2020-11-17 | 基于时空移动特征分布的移动群智感知用户联盟聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112396102A CN112396102A (zh) | 2021-02-23 |
CN112396102B true CN112396102B (zh) | 2022-08-02 |
Family
ID=74599934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011282797.0A Active CN112396102B (zh) | 2020-11-17 | 2020-11-17 | 基于时空移动特征分布的移动群智感知用户联盟聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112396102B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106851711A (zh) * | 2017-01-09 | 2017-06-13 | 重庆邮电大学 | 一种用于无线电环境地图数据收集的任务分配方法 |
CN108959194A (zh) * | 2018-06-28 | 2018-12-07 | 苏州大学 | 感知任务分发方法、装置、系统及可读存储介质 |
CN110009233A (zh) * | 2019-04-08 | 2019-07-12 | 清华大学深圳研究生院 | 群智感知中基于博弈论的任务分配方法 |
CN110059770A (zh) * | 2019-04-30 | 2019-07-26 | 苏州大学 | 基于位置预测的自适应任务分发方法、装置及相关组件 |
CN110232517A (zh) * | 2019-06-06 | 2019-09-13 | 哈尔滨工程大学 | 一种移动群智感知用户收益选取方法 |
CN111695046A (zh) * | 2020-04-23 | 2020-09-22 | 清华大学 | 基于时空移动数据表征学习的用户画像推断方法及装置 |
CN111814079A (zh) * | 2020-07-03 | 2020-10-23 | 福州大学 | 结合聚类与cmab的群智感知车联网用户筛选方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11178219B2 (en) * | 2019-03-08 | 2021-11-16 | Toyota Jidosha Kabushiki Kaisha | Resource assurance for vehicle cloudification |
-
2020
- 2020-11-17 CN CN202011282797.0A patent/CN112396102B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106851711A (zh) * | 2017-01-09 | 2017-06-13 | 重庆邮电大学 | 一种用于无线电环境地图数据收集的任务分配方法 |
CN108959194A (zh) * | 2018-06-28 | 2018-12-07 | 苏州大学 | 感知任务分发方法、装置、系统及可读存储介质 |
CN110009233A (zh) * | 2019-04-08 | 2019-07-12 | 清华大学深圳研究生院 | 群智感知中基于博弈论的任务分配方法 |
CN110059770A (zh) * | 2019-04-30 | 2019-07-26 | 苏州大学 | 基于位置预测的自适应任务分发方法、装置及相关组件 |
CN110232517A (zh) * | 2019-06-06 | 2019-09-13 | 哈尔滨工程大学 | 一种移动群智感知用户收益选取方法 |
CN111695046A (zh) * | 2020-04-23 | 2020-09-22 | 清华大学 | 基于时空移动数据表征学习的用户画像推断方法及装置 |
CN111814079A (zh) * | 2020-07-03 | 2020-10-23 | 福州大学 | 结合聚类与cmab的群智感知车联网用户筛选方法 |
Non-Patent Citations (7)
Title |
---|
Mobile crowd sensing task optimal allocation: a mobility pattern matching perspective;Liang WANG 等;《Front. Comput. Sci》;20181231;第12卷(第2期);231-244 * |
PUEGM: A Method of User Revenue Selection Based on a Publisher-User Evolutionary Game Model for Mobile Crowdsensing;Zihao Shao 等;《sensors》;20190702;1-19 * |
Social-Aware Task Allocation in Mobile Crowd Sensing;Weiping Zhu 等;《Wireless Communications and Mobile Computing》;20201014;1-15 * |
Task Allocation in Mobile Crowd Sensing: State-of-the-Art and Future Opportunities;Jiangtao Wang 等;《EEE INTERNET OF THINGS JOURNAL》;20180808;第5卷(第5期);3747-3757 * |
基于时空数据的城市人流移动模式挖掘;孙天旭 等;《计算机科学》;20201015;第47卷(第10期);91-96 * |
基于生存簇识别和预测的生存态势感知模型;赵国生 等;《电子科技大学学报》;20180724;第47卷(第4期);558-565 * |
基于移动社交网络的群智感知社群化任务分发;王亮 等;《浙江大学学报(工学版)》;20180806;第52卷(第9期);1709-1716 * |
Also Published As
Publication number | Publication date |
---|---|
CN112396102A (zh) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103678618A (zh) | 一种基于社交网络平台的Web服务推荐方法 | |
WO2016155493A1 (zh) | 数据处理方法及装置 | |
US11244332B2 (en) | Segments of contacts | |
CN113727420B (zh) | 一种多模接入网络选择装置及方法 | |
CN112307886A (zh) | 行人重识别方法和装置 | |
CN104391879A (zh) | 层次聚类的方法及装置 | |
CN112749343B (zh) | 资源推荐方法、装置及计算机存储介质 | |
WO2018113370A1 (zh) | 扩展用户的方法、装置及系统 | |
CN107809740A (zh) | Wi‑Fi热点部署优化方法、服务器及存储介质 | |
CN108776863A (zh) | 一种基于用户基数最大化的群智感知激励方法 | |
Qin et al. | Enhanced neural gas network for prototype-based clustering | |
CN105045867B (zh) | 一种基于图书评分的图书作家推荐方法 | |
CN112528149A (zh) | 一种融合知识图谱及贝叶斯网络的智能推荐方法 | |
CN113222073A (zh) | 训练迁移学习模型和推荐模型的方法及装置 | |
CN109360191A (zh) | 一种基于变分自编码器的图像显著性检测方法 | |
CN118052301A (zh) | 一种迭代凝聚式簇估计联邦学习方法 | |
CN106470435A (zh) | 识别WiFi群的方法及系统 | |
CN112396102B (zh) | 基于时空移动特征分布的移动群智感知用户联盟聚类方法 | |
CN107133268A (zh) | 一种用于Web服务推荐的协同过滤算法 | |
CN110390058A (zh) | 考虑时效性的Web服务可信混合推荐方法 | |
Peters et al. | Dynamic clustering with soft computing | |
CN112686690A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
Yu et al. | A novel possibilistic fuzzy leader clustering algorithm | |
CN107784363B (zh) | 数据处理方法、装置及系统 | |
CN116128581A (zh) | 物品推荐方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |