CN111814079A - 结合聚类与cmab的群智感知车联网用户筛选方法 - Google Patents

结合聚类与cmab的群智感知车联网用户筛选方法 Download PDF

Info

Publication number
CN111814079A
CN111814079A CN202010637805.2A CN202010637805A CN111814079A CN 111814079 A CN111814079 A CN 111814079A CN 202010637805 A CN202010637805 A CN 202010637805A CN 111814079 A CN111814079 A CN 111814079A
Authority
CN
China
Prior art keywords
user
task
clustering
worker
skill level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010637805.2A
Other languages
English (en)
Other versions
CN111814079B (zh
Inventor
冯心欣
郭丹颖
柳泽烽
郑海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202010637805.2A priority Critical patent/CN111814079B/zh
Publication of CN111814079A publication Critical patent/CN111814079A/zh
Application granted granted Critical
Publication of CN111814079B publication Critical patent/CN111814079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种结合聚类与CMAB的群智感知车联网用户筛选方法。该方法包括:对车联网用户行车轨迹进行用户轨迹聚类特征的构建;利用CMAB模型,将轨迹聚类信息作为用户任务分配的依据,求解最佳工作者组合;根据真实出租车轨迹数据集对该方法进行验证分析。本发明将用户轨迹信息与CMAB模型相结合的用户筛选方法,克服了参与感知任务的用户技能水平不高而导致的感知数据质量差的现象,能使所选出的工作者集合具有相近的行车轨迹;同时该方法可以使得基于用户筛选结果的任务分配算法更快更早地趋于稳定。故适用于实际应用场景中。

Description

结合聚类与CMAB的群智感知车联网用户筛选方法
技术领域
本发明涉及一种群智感知车联网领域,具体是一种结合聚类与组合多臂赌博机(CMAB)的群智感知车联网用户筛选方法。
背景技术
随着嵌入式设备的不断更新和互联网覆盖范围的逐渐扩大,智能城市的社会感知活动已成为信息和通信领域的研究热点。群智感知技术代替了传统传感网络,使传感更为实时、便捷和低成本,并且更真实地反映了实时状态,规避了传统模式的缺陷。在群智感知相关研究中,任务分配是目前国内外学者研究的核心问题之一,该方面的研究主要分为任务自主选择和任务协调分配两类。在任务分配的过程中,易存在参与感知任务的用户技能水平不高,感知数据质量差的问题。因此,在任务分配环节引入合适的算法进行工作者技能水平筛选,并根据筛选结果进行感知任务分配,可以大大提高感知数据的质量。
群智感知车联网(Internet of Vehicles,IoV),是物联网在车辆领域的一个典型应用。它是由车辆位置、速度和路线等信息构成的巨大交互网络。在IoV系统中,由于车联网用户存在数量多、车辆轨迹信息多样化等特点,因此,基于车联网系统的群智感知用户筛选,需要考虑用户的车辆轨迹信息以及任务要求的完成时间等多方面的因素。作为一种新型的动态随机控制模型,具有强大的学习能力的多臂赌博机(Multi Arm Bandit,MAB)是解决上述问题的方案之一。但是,经典的MAB框架中存在从某些臂观察到的信息被丢弃,导致效率降低的问题。因此,为解决上述问题,研究者进一步提出了CMAB框架,以解决在随机环境中的组合在线学习问题。
发明内容
本发明的目的在于提供一种结合聚类与CMAB的群智感知车联网用户筛选方法,将车辆用户轨迹特征与组合多臂赌博机相结合,克服了参与感知任务的用户技能水平不高而导致的感知数据质量差的现象,同时该方法可以使得基于用户筛选结果的任务分配任务更快更早地趋于稳定。
为实现上述目的,本发明的技术方案是:一种结合聚类与CMAB的群智感知车联网用户筛选方法,包括如下步骤:
步骤S1、对车联网用户行车轨迹进行用户轨迹聚类特征的构建,将轨迹相近的用户聚类为同一群集用户;
步骤S2、根据CMAB模型,从衡量其多臂收益的标准之一后悔值的策略中选择出一组超级臂;
步骤S3、将选出的超级臂与用户轨迹聚类特征相结合,初步估计群集用户技能水平,并更新到当前为止的用户总期望收益;
步骤S4、重新选出一组超级臂与用户轨迹聚类特征相结合,利用初步估计的群集用户技能水平及总期望收益来观察工作者的真实反馈,更新工作者自己的技能水平以及总期望收益;
步骤S5、迭代执行步骤S4,根据更新后的群集用户技能水平进行如数据收集或分布式计算的任务分配,求解出最佳工作者组合即求解任务分配最大化问题;
步骤S6、最后根据真实出租车轨迹数据集对该方法进行验证分析。
在本发明一实施例中,在所述步骤S1中,所述用户轨迹聚类特征通过如下方式构建:
步骤S11、给定道路网络,将覆盖整个道路网络的最小边界矩形划分为一系列网格单元;
步骤S12、将包含车辆开始位置、行程位置和目标位置的轨迹投射到网格化后的道路网络中,并将其表示为覆盖其位置的时间有序网格单元序列;
步骤S13、根据基于网格单元序列的距离函数计算不同轨迹间的距离;
步骤S14、通过轨迹映射算法TrajMap将每个轨迹转换为欧氏度量空间中的d维点;
步骤S15、在d维欧几里德空间中对轨迹映射的坐标点进行k-means聚类;
步骤S16、使用聚类平方和来判别聚类质量。
在本发明一实施例中,在所述步骤S2中,后悔值的策略包括:
(1)Random策略:采用随机选择的方式,每个手臂获得相同的被选中概率;
(2)ε-Greedy策略:在选择手臂的过程中,以ε的概率从所有手臂中随机选择一个进行尝试,执行“探索”操作,以1-ε的概率选择目前收益最高的手臂执行“开发”操作;
(3)上置信界策略:在CMAB框架下,定义每个手臂的UCB值如下所示:
Figure BDA0002568232140000021
其中t为摇臂轮数,ni,t为手臂i到t轮时被摇的次数,
Figure BDA0002568232140000022
为手臂i到t轮为止的期望收益,
Figure BDA0002568232140000023
体现
Figure BDA0002568232140000024
的不确定度。
在本发明一实施例中,在所述步骤S3中,初步估计用户技能水平的步骤如下:
S41、将步骤S2选择的一组超级臂记为St
S42、根据超级臂的执行结果来初步更新所有集群中用户的技能水平,更新所有用户
Figure BDA0002568232140000025
其同一集群中用户的技能水平的初步估计如下式:
Figure BDA0002568232140000031
其中Cp表示工作者i所属簇类,
Figure BDA0002568232140000032
表示第t次实验工作者h给出任务k的感知结果达到任务质量要求,
Figure BDA0002568232140000033
表示第t次实验工作者h给出任务k的感知结果未达到任务质量要求,
Figure BDA0002568232140000034
为用户i到t轮时任务k的总次数;
S43、更新所有用户的总期望收益
Figure BDA0002568232140000035
用户i到t轮时在任务k上的总期望收益
Figure BDA0002568232140000036
为:
Figure BDA0002568232140000037
Figure BDA0002568232140000038
在本发明一实施例中,在所述步骤S4中,观察工作者的真实反馈,更新工作者自己的技能水平的步骤如下:
S51、通过步骤S2重新选择一组超级臂St
S52、根据超级臂的执行结果来更新所有集群中用户的技能水平,更新所有用户
Figure BDA0002568232140000039
对于第k项任务,工作者i在该类任务上的技能水平
Figure BDA00025682321400000310
通过其以往对该任务的历史完成率来定义,如下式:
Figure BDA00025682321400000311
其中,
Figure BDA00025682321400000312
表示用户i在第t次实验中给出任务k的感知结果达到任务要求,
Figure BDA00025682321400000313
表示用户i在第t次实验中给出任务k的感知结果未达到任务要求;调和因子ε的作用是避免在实验次数较少时工作者的技能水平估计误差过大;
S53、基于更新后的用户技能水平再来更新所有用户的总期望收益
Figure BDA00025682321400000314
在本发明一实施例中,在所述步骤S5中,任务分配最大化问题为:
Figure BDA00025682321400000315
Figure BDA00025682321400000316
其中rμ(St)是超级手臂St里所有工作者在t轮时完成任务的收益。
在所述步骤S6中,采用准确率和后悔值对实测数据进行验证分析,其定义如下:
准确率指的是每种策略最终所选择的用户实际完成任务的概率的均值;令T轮之后的后悔值为ρ,其表示如下:
Figure BDA0002568232140000041
其中μ*是最大收益的平均数,μ*=max{μK},
Figure BDA0002568232140000042
是在t轮时获得的收益。
相较于现有技术,本发明具有以下有益效果:本发明方法将车辆用户轨迹特征与组合多臂赌博机相结合,克服了参与感知任务的用户技能水平不高而导致的感知数据质量差的现象,同时该方法可以使得任务分配算法更快更早地趋于稳定。
附图说明
图1是本发明实施例中考虑轨迹特征的任务分配CUCB策略在1000次迭代下的工作者选择结果。
图2是本发明实施例中考虑轨迹特征的任务分配CUCB策略和不考虑轨迹特征的任务分配UCB策略下的的实验后悔值对比图。
图3是为本发明实施例中考虑轨迹特征的任务分配CUCB策略和不考虑轨迹特征的任务分配UCB策略下的的实验后悔率对比图。
图4是为本发明实施例中考虑轨迹特征的任务分配CUCB策略所选工作者的轨迹图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明提出一种结合车辆轨迹聚类与组合多臂赌博机(CMAB)的群智感知车联网用户筛选方法,具体按照如下步骤实现:
步骤S1:对车联网用户行车轨迹进行用户轨迹聚类特征的构建,将轨迹相近的用户聚类为同一群集用户。
先给定道路网络,将覆盖整个道路网络的最小边界矩形划分为一系列网格单元。将包含车辆开始位置、行程位置和目标位置的轨迹投射到网格化后的道路网络中,并将其表示为覆盖其位置的时间有序网格单元序列。根据基于网格单元序列的距离函数计算不同轨迹间的距离。
再通过轨迹映射算法TrajMap将每个轨迹转换为欧氏度量空间中的d维点,也就是将每对轨迹之间的网格序列距离转换成欧氏度量空间的中的每对点之间的距离。
最后在d维欧几里德空间中对轨迹映射的坐标点进行k-means聚类。使用WCSS来判别聚类质量,WCSS值越小则聚类质量越好。通过该聚类方法,使相似程度高的历史行车轨迹的用户聚集在同一个类别中。
步骤S2:根据CMAB模型,从衡量其多臂收益的标准之一后悔值的常用策略中选择出一组超级臂。
后悔值代表的是最优策略对应的总收益和所执行策略的长期累积收益之间的差值。某个策略的后悔值越小,则越趋近于最优策略。常用的策略有如下三种。
Random策略:采用随机选择的方式,每个手臂获得相同的被选中概率。
ε-Greedy策略:在选择手臂的过程中,以ε的概率从所有手臂中随机选择一个进行尝试,执行“探索”操作,以1-ε的概率选择目前收益最高的手臂执行“开发”操作。
UCB策略:在CMAB框架下,定义每个手臂的UCB值如下所示:
Figure BDA0002568232140000051
其中t为摇臂轮数,ni,t为手臂i到t轮时被摇的次数,
Figure BDA0002568232140000052
为手臂i到t轮为止的期望收益,
Figure BDA0002568232140000053
体现
Figure BDA0002568232140000054
的不确定度。
步骤S3:将选出的超级臂与用户轨迹聚类特征相结合,先初步估计群集用户技能水平,并更新到当前为止的用户总期望收益。
先根据步骤S2从所述策略中选择一组超级臂St。接着为了达到用较少的实验次数来估计所有工作者的技能水平的目的,则根据超级臂的执行结果来初步更新所有集群中用户的技能水平,更新所有用户
Figure BDA0002568232140000055
其同一集群中用户的技能水平的初步估计如下式:
Figure BDA0002568232140000056
其中Cp表示工作者i所属簇类,
Figure BDA0002568232140000057
表示第t次实验工作者h给出任务k的感知结果达到任务质量要求,
Figure BDA0002568232140000058
表示第t次实验工作者h给出任务k的感知结果未达到任务质量要求,
Figure BDA0002568232140000059
为用户i到t轮时任务k的总次数。
最后再基于更新后的用户技能水平来更新所有用户的总期望收益即真实反馈
Figure BDA00025682321400000510
用户i到t轮时在任务k上的总期望收益
Figure BDA00025682321400000511
为:
Figure BDA0002568232140000061
其中,用户i到t轮时在任务k上的期望收益
Figure BDA0002568232140000062
为:
Figure BDA0002568232140000063
步骤S4:重新选出一组超级臂与用户轨迹聚类特征相结合,利用初步估计的群集用户技能水平及总期望收益来观察工作者的真实反馈,更新工作者自己的技能水平及总期望收益。
先根据步骤S2从所述策略中重新选择一组超级臂St。再根据超级臂的执行结果来更新所有集群中用户的技能水平,更新所有用户
Figure BDA0002568232140000064
该处对于第k项任务,工作者i在该类任务上的技能水平
Figure BDA0002568232140000065
可通过其以往对该任务的历史完成率来定义,如下式:
Figure BDA0002568232140000066
其中,
Figure BDA0002568232140000067
表示用户i在第t次实验中给出任务k的感知结果达到任务要求,
Figure BDA0002568232140000068
表示用户i在第t次实验中给出任务k的感知结果未达到任务要求。调和因子ε的作用是避免在实验次数较少时工作者的技能水平估计误差过大。
最后基于更新后的用户技能水平再来更新所有用户的总期望收益
Figure BDA0002568232140000069
步骤S5:迭代执行步骤S4,最终根据更新后的群集用户技能水平进行如数据收集或分布式计算的任务分配,求解出最佳工作者组合即求解任务分配最大化问题。
最终根据步骤S4迭代可得到所有群集用户的技能水平,从这些群集用户中求解出用户技能水平最高的群集用户即为本方法所求解出的最佳工作者组合,求解任务分配最大化问题为:
Figure BDA00025682321400000610
在上式中,目标函数为任务发布者获得的总收益。其中,
Figure BDA00025682321400000611
步骤S6:最后根据真实出租车轨迹数据集对该方法进行验证分析。
采用准确率和后悔值对实测数据进行验证分析,其中准确率指的是每种策略最终所选择的用户实际完成任务的概率的均值。令T轮之后的后悔值为ρ,其表示如下:
Figure BDA0002568232140000071
其中μ*是最大收益的平均数,μ*=max{μK},
Figure BDA0002568232140000072
是在t时获得的收益。当准确率越高则该策略越优化,后悔值越低增长较慢则该策略越早趋于稳定。
为了让本领域技术人员进一步了解本发明所提出的一种结合车辆轨迹聚类与组合多臂赌博机的群智感知车联网用户筛选方法,下面结合具体实施例作详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程。
如图1所示,为考虑轨迹特征的任务分配CUCB策略在1000次迭代下的工作者选择结果。
本实施例包括如下具体步骤:
步骤一:本发明中将结合轨迹特征的任务分配使用UCB策略简称为CUCB策略。采用的原始数据集为滴滴出行公司提供的真实出租车轨迹数据,主要为包含了整个成都市在2016年11月的所有出租车轨迹数据,最终对该原始数据集进行预处理,得到如表1为本发明实验中所需数据集。
表1工作者数据示例
Figure BDA0002568232140000073
步骤二:本发明实验假设用户技能水平服从伯努利分布,设定单个任务即K=1,假设该任务要求选取的工作者总数量为10人以达到所需的感知质量,最大迭代次数为2000,k-means算法群集数取12。根据步骤S1对表1的数据集进行轨迹聚类特征的构建,即根据这些出租车工作者的历史行车轨迹将所有工作者聚集在不同群集里。
步骤三:根据构建的轨迹聚类特征,可观察CUCB策略在迭代次数T为1000次下的工作者选择结果。在T1轮前根据步骤S3先初步估计工作者的技能水平。即在T1轮前不断迭代地执行如下步骤:先根据步骤S2选出一组CUCB策略下的超级臂;接着按照工作者所聚类成不同的群集根据这一群集里的所有工作者的任务完成收益情况统一计算这一群集里的工作者水平,以快速探索所有工作者的技能水平。
步骤四:在T1轮后根据步骤S4观察工作者的真实反馈,然后更新工作者自己的技能水平(更新个人的,对应类簇里其他的不更新)。
步骤五:根据步骤S5由得到的群集用户技能水平来求解出能够带给任务发布者最大效益的最佳工作者集合。则由此绘制的实验图1中横坐标表示实验的迭代次数,纵坐标表示工作者标号ID,当第t轮工作者j被选择时用黄点标识。则由图1可以看出,在迭代初期,CUCB策略对于工作者的选择较为分散,但随着迭代次数的增加,所选择的工作者趋于稳定。在实验迭代到1000次后,由图1可以看出,感知任务最终所选择的工作者集合为S1000={25,58,208,213,272,277,307,331,384,440}。
如图2所示,为本发明中考虑轨迹特征的任务分配CUCB策略和不考虑轨迹特征的任务分配UCB策略下的的实验后悔值对比图。
本实施例包括如下具体步骤:
步骤一:按照表1实验数据以及相应实验参数的设置,可求解出CUCB策略在不同迭代次数下的最佳工作者集合,其步骤类比图1。
步骤二:将求解出的CUCB策略在不同迭代次数下的最佳工作者集合带入公式(5),计算不同迭代次数下选出的最佳工作者集合的后悔值,并绘制出来,由纵坐标表示。利用公式(5)将计算出的UCB策略在不同迭代次数下的的后悔值进行绘制。则由图2可得,在迭代次数为100时,CUCB策略的后悔值比UCB策略小了19.8%;在迭代次数为200时,CUCB策略的后悔值比UCB策略小了23.6%;而后其他迭代次数,两个值的差距在10%上下波动,体现了轨迹聚类辅助的优势,速度更快更早稳定,后悔值更小。
如图3所示,为本发明中考虑轨迹特征的任务分配CUCB策略和不考虑轨迹特征的任务分配UCB策略下的的实验准确率对比图。
本实施例包括如下具体步骤:
步骤一:按照表1实验数据以及相应实验参数的设置,可求解出CUCB策略在不同迭代次数下的最佳工作者集合,其步骤类比图1。
步骤二:对求解出的CUCB策略在不同迭代次数下的最佳工作者集合计算其实际完成任务的概率的均值即准确率,并进行绘制,由纵坐标表示。同理对由UCB策略选出的工作者计算其准确率并进行绘制。则由图3可得,在迭代次数为100时,CUCB策略的准确率比UCB策略高了14.9%;在迭代次数为200时,CUCB策略的准确率比UCB策略高了15.9%,并且更早趋向于稳定,体现了轨迹聚类辅助的优势,速度更快更早稳定,准确率更高。
如图4所示,为本发明中考虑轨迹特征的任务分配CUCB策略所选工作者的轨迹图。
本实施例包括如下具体步骤:
步骤一:由于数据集过于庞大,因此需缩小数据涉及范围,故截取成都市某块区域内的所有出租车历史行车记录点,并从此区域选取用以设置感知任务的地点。该选定区域包含文殊院景点区域及附近城市道路,经纬度范围为104.07458°-104.08460°E、30.67564°-30.68565°N。实验区域的地图如图4所示,感知地点为在地图里设置50×50m2的方块区域。
步骤二:根据图1所选出的最佳工作者集合S1000的行车轨迹绘制于该实验区域中,用红色字体标注,则由图可以看出,所选工作者的轨迹都会经过任务地点。结合图2和图3可知借助于轨迹聚类所选出的工作者集合S1000相对于没有进行轨迹聚类所选出的集合其感知任务完成质量高,故该实验结果与倾向于选择技能水平高的工作者相符合。即本发明提出的结合轨迹特征和CMAB模型的用户筛选算法所选出的工作者集合具有相同或相似程度高的历史轨迹,对于同一地点的任务具有较高的完成质量,这也说明了本发明所提出的策略适用于实际应用场景。
上述分析说明,本发明所提出的一种结合车辆轨迹聚类与组合多臂赌博机的群智感知车联网用户筛选方法,能够选出具有感知质量高的工作者集合并最大化任务发布者的效益,具有一定的参考价值和实际经济效益。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (7)

1.一种结合聚类与CMAB的群智感知车联网用户筛选方法,其特征在于,包括如下步骤:
步骤S1、对车联网用户行车轨迹进行用户轨迹聚类特征的构建,将轨迹相近的用户聚类为同一群集用户;
步骤S2、根据组合多臂赌博机即CMAB模型,从衡量其多臂收益的标准之一后悔值的策略中选择出一组超级臂;
步骤S3、将选出的超级臂与用户轨迹聚类特征相结合,初步估计群集用户技能水平,并更新到当前为止的用户总期望收益;
步骤S4、重新选出一组超级臂与用户轨迹聚类特征相结合,利用初步估计的群集用户技能水平及总期望收益来观察工作者的真实反馈,更新工作者自己的技能水平以及总期望收益;
步骤S5、迭代执行步骤S4,根据更新后的群集用户技能水平进行如数据收集或分布式计算的任务分配,求解出最佳工作者组合即求解任务分配最大化问题;
步骤S6、最后根据真实出租车轨迹数据集对该方法进行验证分析。
2.根据权利要求1所述的一种结合聚类与CMAB的群智感知车联网用户筛选方法,其特征在于,在所述步骤S1中,所述用户轨迹聚类特征通过如下方式构建:
步骤S11、给定道路网络,将覆盖整个道路网络的最小边界矩形划分为一系列网格单元;
步骤S12、将包含车辆开始位置、行程位置和目标位置的轨迹投射到网格化后的道路网络中,并将其表示为覆盖其位置的时间有序网格单元序列;
步骤S13、根据基于网格单元序列的距离函数计算不同轨迹间的距离;
步骤S14、通过轨迹映射算法TrajMap将每个轨迹转换为欧氏度量空间中的d维点;
步骤S15、在d维欧几里德空间中对轨迹映射的坐标点进行k-means聚类;
步骤S16、使用聚类平方和来判别聚类质量。
3.根据权利要求1所述的一种结合聚类与CMAB的群智感知车联网用户筛选方法,其特征在于,在所述步骤S2中,后悔值的策略包括:
(1)Random策略:采用随机选择的方式,每个手臂获得相同的被选中概率;
(2)ε-Greedy策略:在选择手臂的过程中,以ε的概率从所有手臂中随机选择一个进行尝试,执行“探索”操作,以1-ε的概率选择目前收益最高的手臂执行“开发”操作;
(3)上置信界策略:在CMAB框架下,定义每个手臂的UCB值如下所示:
Figure FDA0002568232130000011
其中t为摇臂轮数,ni,t为手臂i到t轮时被摇的次数,
Figure FDA0002568232130000021
为手臂i到t轮为止的期望收益,
Figure FDA0002568232130000022
体现
Figure FDA0002568232130000023
的不确定度。
4.根据权利要求1所述的一种结合聚类与CMAB的群智感知车联网用户筛选方法,其特征在于,在所述步骤S3中,初步估计用户技能水平的步骤如下:
S41、将步骤S2选择的一组超级臂记为St
S42、根据超级臂的执行结果来初步更新所有集群中用户的技能水平,更新所有用户
Figure FDA0002568232130000024
其同一集群中用户的技能水平的初步估计如下式:
Figure FDA0002568232130000025
其中Cp表示工作者i所属簇类,
Figure FDA0002568232130000026
表示第t次实验工作者h给出任务k的感知结果达到任务质量要求,
Figure FDA0002568232130000027
表示第t次实验工作者h给出任务k的感知结果未达到任务质量要求,
Figure FDA0002568232130000028
为用户i到t轮时任务k的总次数;
S43、更新所有用户的总期望收益
Figure FDA0002568232130000029
用户i到t轮时在任务k上的总期望收益
Figure FDA00025682321300000210
为:
Figure FDA00025682321300000211
Figure FDA00025682321300000212
5.根据权利要求1所述的一种结合聚类与CMAB的群智感知车联网用户筛选方法,其特征在于,在所述步骤S4中,观察工作者的真实反馈,更新工作者自己的技能水平的步骤如下:
S51、通过步骤S2重新选择一组超级臂St
S52、根据超级臂的执行结果来更新所有集群中用户的技能水平,更新所有用户
Figure FDA00025682321300000213
对于第k项任务,工作者i在该类任务上的技能水平
Figure FDA00025682321300000214
通过其以往对该任务的历史完成率来定义,如下式:
Figure FDA00025682321300000215
其中,
Figure FDA00025682321300000216
表示用户i在第t次实验中给出任务k的感知结果达到任务要求,
Figure FDA00025682321300000217
表示用户i在第t次实验中给出任务k的感知结果未达到任务要求;调和因子ε的作用是避免在实验次数较少时工作者的技能水平估计误差过大;
S53、基于更新后的用户技能水平再来更新所有用户的总期望收益
Figure FDA0002568232130000031
6.根据权利要求4所述的一种结合聚类与CMAB的群智感知车联网用户筛选方法,其特征在于,在所述步骤S5中,任务分配最大化问题为:
Figure FDA0002568232130000032
Figure FDA0002568232130000033
其中rμ(St)是超级手臂St里所有工作者在t轮时完成任务的收益。
7.根据权利要求1所述的一种结合聚类与组合多臂赌博机的群智感知车联网用户筛选方法,其特征在于,在所述步骤S6中,采用准确率和后悔值对实测数据进行验证分析,其定义如下:
准确率指的是每种策略最终所选择的用户实际完成任务的概率的均值;令T轮之后的后悔值为ρ,其表示如下:
Figure FDA0002568232130000034
其中μ*是最大收益的平均数,μ*=max{μK},
Figure FDA0002568232130000035
是在t轮时获得的收益。
CN202010637805.2A 2020-07-03 2020-07-03 结合聚类与cmab的群智感知车联网用户筛选方法 Active CN111814079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010637805.2A CN111814079B (zh) 2020-07-03 2020-07-03 结合聚类与cmab的群智感知车联网用户筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010637805.2A CN111814079B (zh) 2020-07-03 2020-07-03 结合聚类与cmab的群智感知车联网用户筛选方法

Publications (2)

Publication Number Publication Date
CN111814079A true CN111814079A (zh) 2020-10-23
CN111814079B CN111814079B (zh) 2022-05-13

Family

ID=72856125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010637805.2A Active CN111814079B (zh) 2020-07-03 2020-07-03 结合聚类与cmab的群智感知车联网用户筛选方法

Country Status (1)

Country Link
CN (1) CN111814079B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110968426A (zh) * 2019-11-29 2020-04-07 西安交通大学 一种基于在线学习的边云协同k均值聚类的模型优化方法
CN112256739A (zh) * 2020-11-12 2021-01-22 同济大学 一种基于多臂赌博机的动态流大数据中数据项筛选方法
CN112396224A (zh) * 2020-11-13 2021-02-23 智邮开源通信研究院(北京)有限公司 基于轨迹的车辆招募方法、系统、设备及可读存储介质
CN112396102A (zh) * 2020-11-17 2021-02-23 哈尔滨工程大学 基于时空移动特征分布的移动群智感知用户联盟聚类方法
CN112990728A (zh) * 2021-03-26 2021-06-18 山东大学 一种基于特征信息的大规模群智感知任务分配方法
CN113077149A (zh) * 2021-04-02 2021-07-06 华南理工大学 一种基于ucb算法的群智感知任务分配方法及系统
CN114339655A (zh) * 2022-03-14 2022-04-12 中国人民解放军国防科技大学 人车协同参与的稀疏移动群智感知方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731963A (zh) * 2015-04-03 2015-06-24 重庆邮电大学 一种基于车联网的网格化路径推荐方法及系统
CN106127662A (zh) * 2016-06-23 2016-11-16 福州大学 一种针对出租车轨迹数据的K‑means初始聚类中心的选择方法
CN108197889A (zh) * 2017-12-28 2018-06-22 吉林大学 一种基于移动性预测的群智感知用户招募方法和系统
CN108256714A (zh) * 2016-12-29 2018-07-06 得道车联网络科技(上海)有限公司 一种基于车联网大数据的行车轨迹实时风险评估模型
CN109151042A (zh) * 2018-09-06 2019-01-04 广州知弘科技有限公司 物联感知数据智能规划方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731963A (zh) * 2015-04-03 2015-06-24 重庆邮电大学 一种基于车联网的网格化路径推荐方法及系统
CN106127662A (zh) * 2016-06-23 2016-11-16 福州大学 一种针对出租车轨迹数据的K‑means初始聚类中心的选择方法
CN108256714A (zh) * 2016-12-29 2018-07-06 得道车联网络科技(上海)有限公司 一种基于车联网大数据的行车轨迹实时风险评估模型
CN108197889A (zh) * 2017-12-28 2018-06-22 吉林大学 一种基于移动性预测的群智感知用户招募方法和系统
CN109151042A (zh) * 2018-09-06 2019-01-04 广州知弘科技有限公司 物联感知数据智能规划方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
万辛等: "基于群智感知技术的车联网路径优化问题研究", 《计算机与数字工程》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110968426A (zh) * 2019-11-29 2020-04-07 西安交通大学 一种基于在线学习的边云协同k均值聚类的模型优化方法
CN110968426B (zh) * 2019-11-29 2022-02-22 西安交通大学 一种基于在线学习的边云协同k均值聚类的模型优化方法
CN112256739A (zh) * 2020-11-12 2021-01-22 同济大学 一种基于多臂赌博机的动态流大数据中数据项筛选方法
CN112256739B (zh) * 2020-11-12 2022-11-18 同济大学 一种基于多臂赌博机的动态流大数据中数据项筛选方法
CN112396224A (zh) * 2020-11-13 2021-02-23 智邮开源通信研究院(北京)有限公司 基于轨迹的车辆招募方法、系统、设备及可读存储介质
CN112396102A (zh) * 2020-11-17 2021-02-23 哈尔滨工程大学 基于时空移动特征分布的移动群智感知用户联盟聚类方法
CN112396102B (zh) * 2020-11-17 2022-08-02 哈尔滨工程大学 基于时空移动特征分布的移动群智感知用户联盟聚类方法
CN112990728A (zh) * 2021-03-26 2021-06-18 山东大学 一种基于特征信息的大规模群智感知任务分配方法
CN113077149A (zh) * 2021-04-02 2021-07-06 华南理工大学 一种基于ucb算法的群智感知任务分配方法及系统
CN114339655A (zh) * 2022-03-14 2022-04-12 中国人民解放军国防科技大学 人车协同参与的稀疏移动群智感知方法

Also Published As

Publication number Publication date
CN111814079B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN111814079B (zh) 结合聚类与cmab的群智感知车联网用户筛选方法
CN102542818B (zh) 一种基于有机计算的区域边界交通信号协调控制方法
CN101719315B (zh) 一种基于中间件的动态交通信息采集方法
CN107247938A (zh) 一种高分辨率遥感影像城市建筑物功能分类的方法
CN109948547A (zh) 城市绿地景观评价方法、装置、存储介质及终端设备
US8768866B2 (en) Computer-implemented systems and methods for forecasting and estimation using grid regression
CN106651213A (zh) 服务订单的处理方法及装置
CN111402616A (zh) 智能停车控制方法、系统、存储介质、计算机程序、终端
CN112101684A (zh) 一种插电式混合动力车辆实时能量管理方法和系统
CN103294928A (zh) 一种碳排放组合预测方法
CN112861972A (zh) 一种展业区域的选址方法、装置、计算机设备和介质
CN112053097A (zh) 一种贷款催收方法、装置、电子设备及存储介质
CN114553661A (zh) 一种面向无线联邦学习的移动用户设备分簇训练方法
CN105868906A (zh) 一种优化的区域发展成熟度分析方法
CN112487281A (zh) 一种立体车库推荐方法
CN111259950B (zh) 一种基于3d模型训练yolo神经网络的方法
CN110826244A (zh) 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法
CN110427690A (zh) 一种基于全局粒子群算法生成ato速度曲线的方法及装置
CN116796904A (zh) 一种轨道交通新线客流预测方法、系统、电子设备及介质
CN107329887A (zh) 一种基于推荐系统的数据处理方法以及装置
CN109147322B (zh) 一种城市交通大数据处理中多源数据自适应融合方法
CN102521202B (zh) 面向复杂系统中的maxq任务图结构的自动发现方法
CN102567523A (zh) 一种集聚分布型地理要素的自适应空间抽样方案设计方法
CN108764518A (zh) 一种基于物联网大数据的交通资源动态优化方法
CN106469346A (zh) 一种基于区域的风险控制方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant