CN112257955A - 一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质 - Google Patents

一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质 Download PDF

Info

Publication number
CN112257955A
CN112257955A CN202011228011.7A CN202011228011A CN112257955A CN 112257955 A CN112257955 A CN 112257955A CN 202011228011 A CN202011228011 A CN 202011228011A CN 112257955 A CN112257955 A CN 112257955A
Authority
CN
China
Prior art keywords
data
riding
shared bicycle
clustering algorithm
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011228011.7A
Other languages
English (en)
Inventor
汪敏
严妍
肖国泉
裴非
肖克
彭祖剑
邵罗树
张博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kaipuyun Information Technology Co ltd
Cape Cloud Information Technology Co ltd
Original Assignee
Beijing Kaipuyun Information Technology Co ltd
Cape Cloud Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kaipuyun Information Technology Co ltd, Cape Cloud Information Technology Co ltd filed Critical Beijing Kaipuyun Information Technology Co ltd
Priority to CN202011228011.7A priority Critical patent/CN112257955A/zh
Publication of CN112257955A publication Critical patent/CN112257955A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质,属于公共交通规划和数据挖掘技术领域。所述方法应用于服务器,方法包括:通过采集共享单车特定时间段的骑行数据,用聚类的方法对整个城市任意时段的骑行起点数据、骑行终点数据做预测和判断,计算出骑行目标的期望值。同时,针对每个区域内骑行次数、骑行时间、骑行距离等骑行特征的数据做定量分析,为共享单车的高效利用提供数据支持。本发明将聚类算法与大数据清洗、大数据挖掘和大数据可视化技术相结合,通过大规模的数据采集和聚类分析,实现共享单车快捷、高效且准确的调配使用,还将数据分析结果进行可视化呈现,使管理更加直观高效,大大缓解了城市交通压力、愈加优化出行需要。

Description

一种基于聚类算法的共享单车优化调配方法、控制装置、电子 设备及其存储介质
技术领域
本发明属于公共交通规划和数据挖掘技术领域,尤其涉及一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质。
背景技术
随着共享理念的快速崛起,共享单车为响应市场需要也应运而生。共享单车产生初期,对城市的交通出行产生了很好的促进作用,也有效贯彻了低碳出行的环保倡议。但随着市场需求的不断扩大,共享单车数量急剧增多,单车随意停放、缺乏管理的现象日趋严重,逐渐给城市的市容市貌带来了负面影响。如何优化共享单车的调配使用、使管理方法行之有效,也成为共享理念可持续发展的研究性课题之一。
目前,共享单车的调配使用方案仅依靠简单的数据统计和经验决断,没有借助大数据清洗、大数据挖掘和大数据可视化技术,导致数据存在主观性判断过强、分析过程略显粗糙、分析结论不准确的问题,同时,也无法形成直观的可视化效果。
发明内容
本发明为了弥补现有技术的不足,提供一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质,将聚类算法与大数据清洗、大数据挖掘和大数据可视化技术相结合,通过大规模的数据采集和聚类分析,实现共享单车快捷、高效且准确的调配使用,还将数据分析结果进行可视化呈现,使管理更加直观高效,大大缓解了城市交通压力、愈加优化出行需要。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供了一种基于聚类算法的共享单车优化调配方法,应用于服务器,具体实现步骤是:
通过采集共享单车特定时间段的骑行数据,用聚类的方法对整个城市任意时段的骑行起点数据、骑行终点数据做预测和判断,计算出骑行目标的期望值。同时,针对每个区域内骑行次数、骑行时间、骑行距离等骑行特征的数据做定量分析,为共享单车的高效利用提供数据支持。
进一步地,对骑行特征进行筛选,利用K-means聚类算法对筛选后数据的骑行特征进行分类,对分类后数据进行可视化分析,根据分析结果预测聚类的坐标。
进一步地,定量分析是指通过大量数据的聚类分析和可视化呈现后,由效果图的经纬度(聚类的坐标)从地图上判断出聚类的位置,通常聚类较多的位置出现在人员密集、流动性大的区域,为共享单车的高效利用提供数据支持。
第二方面,本发明实施例还提供了通过执行程序实现基于聚类算法的共享单车优化调配方法,应用于服务器,具体实现步骤是:
把一个城市的单车数据输入程序中,利用聚类算法进行计算,对计算结果进行数据可视化。
第三方面,本发明实施例还提供了一种基于聚类算法的共享单车优化调配控制装置,应用于服务器,该控制装置包括以下模块:
数据采集和清洗模块:从共享单车数据源采集骑行数据,对不完整、重复、无关数据进行清洗,得到标准、干净、合规的数据,选择所需时间段,设置数据清洗标准,即筛选标准参数值,对骑行特征进行有效性筛选;
数据挖掘模块:利用聚类算法从筛选后数据集合中挖掘数据特征,得到特征分类并存储在特征分类库;
可视化呈现模块:将分类后数据特征进行连线,得到各个区域的骑行辐射图,可根据骑行辐射图中的聚类效果做相应的放缩,使呈现效果最优化;
调配优化模块:通过可视化效果分析,预测所需时间段共享单车大量聚集的位置,并根据可视化效果需要进行调参,得到单车调配最优方案。
进一步地,数据采集和清洗模块还包括数据采集子模块和特征筛选子模块。
进一步地,数据挖掘模块还包括聚类计算子模块和特征分类库。
进一步地,放缩方式可通过随机洗牌算法筛选出有代表性的数据,将放缩后数据进行连线,根据连线效果调整放缩范围。
进一步地,调参方式可通过调整骑行特征的筛选标准参数值,或者调整聚类算法的质心和数量来优化调配方案。
第四方面,本发明实施例还提供了一种电子设备,包括:存储器和处理器,存储器与处理器连接,存储器用于存储程序代码指令,处理器用于调用存储器中存储的程序代码指令,按照获得的程序执行如第一、二方面实施例所提供的方法。
第五方面,本发明实施例还提供了一种存储介质,该存储介质存储有处理器可执行的程序代码指令,存储介质包括多条程序代码指令,多条指令被配置成使处理器执行如第一、二方面实施例所提供的方法。
本发明提供的一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质,相比于现有技术具有以下优点:
本发明将聚类算法与大数据清洗、大数据挖掘和大数据可视化技术相结合,通过大规模的数据采集和聚类分析,实现共享单车快捷、高效且准确的调配使用,还将数据分析结果进行可视化呈现,使管理更加直观高效,大大缓解了城市交通压力、愈加优化出行需要。
附图说明
图1为实施例一提供的一种基于聚类算法的共享单车优化调配方法的流程图。
图2、3为实施例二提供的采用基于聚类算法的共享单车优化调配方法通过执行程序来实现的可视化效果图。
图4为实施例三提供的一种基于聚类算法的共享单车优化调配控制装置的示意图。
图5为实施例四提供的一种电子设备的结构示意图。
图6为实施例五提供的一种网络系统的交互示意图。
具体实施方式
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可以找说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和有点能够更明显易懂,以下为本发明的具体实施方式。
实施例一
参见图1,为本实施例提供的一种基于聚类算法的共享单车优化调配方法,所举实例只用于解释本发明,并非用于限定本发明的范围。该方法具体包括以下步骤:
S1、大规模采集数据;
S2、对数据进行清洗和特征选择,利用聚类算法进行计算;
S3、数据可视化效果判断;
S4、效果好,得到共享单车优化调配结论;
S5、否则,修改聚类的分类个数重新运行算法,或者修改清洗数据的参数值。
其中,S1中所述“采集数据”是指:从共享单车运营系统中读取骑行数据,多为表格文件。
其中,S2还包括以下步骤:
S2.1、对骑行特征进行筛选;
S2.2、利用K-means聚类算法对筛选后数据的骑行特征进行分类,得到分类图;
S2.3、对分类后数据进行可视化分析;
S2.4、根据分析结果预测聚类的坐标。
其中,S2.1中所述“对骑行特征进行筛选”是指:筛选出需要的时间段,利用二维欧氏距离计算骑行距离。对骑行距离、骑行时间等骑行特征进行有效性的筛选。二维欧氏距离计算公式是:
Figure BSA0000223953810000041
公式中,dist为点(x2,y2)与点(x1,y1)之间的欧式距离,|X|为点(x2,y2)到原点的欧氏距离。骑行距离过短和骑行时间过短都不符合正常骑行的标准,本实施例中,采用骑行距离的筛选标准是1公里以上,骑行时间的筛选标准是1分钟以上,还可以视实际情况具体分析和制定其他筛选标准的参数值,骑行特征根据参数值不同而不同。
其中,S2.2还包括以下步骤:
S2.2.1、输入K值;
S2.2.2、从数据集合中随机选择K个数据点作为初始质心;
S2.2.3、计算集合中各个数据与初始质心的二维欧氏距离,距离近的归为一类;
S2.2.4、利用算法在一类中选择新的质心;
S2.2.5、判断新的质心与初始质心的距离;
S2.2.6、当距离小于固定阈值,得到聚类分类数据,否则继续S2.2.3。
其中,S2.2.4中所述“利用算法在一类中选择新的质心”是指:使用误差平方和(Sum of the Squared Error,SSE)作为聚类的目标函数,两次运行K 均值产生的两个不同的簇集,选择SSE为最小值的簇集作为新的质心。误差平方和计算公式是:
Figure BSA0000223953810000051
公式中,K表示K个初始质心,Ci表示第i个质心,dist表示二维欧氏距离。
其中,S2.2.6中所述“固定阈值”是指:根据聚类计算和可视化效果的需要,可人为设置固定参数值,当参数值为7时,聚类后可视化效果最好。
其中,S2.3还包括以下步骤:
S2.3.1、取骑行终点数据的平均数;
S2.3.2、利用随机洗牌算法计算骑行起点数据;
S2.3.3、将骑行终点数据的平均数与骑行起点数据进行连线;
S2.3.4、得到各个区域骑行数据的辐射图。
其中,S2.3.1中所述“取骑行终点数据的平均数”原因是现实情况中,数据分布图呈现二维正态分布,如果单纯取骑行起点数据的平均数与骑行终点数据的平均数,得到的骑行区域的可视化效果图并不准确。
其中,S2.3.2中所述“随机洗牌算法”是指:假设骑行起点数据的数组从0开始,共有Y个数据,从数组中随机抽取一个P点[0,Y),并重复从剩下的数组中抽取P点,直到数组中的数据全部取完,抽取出的数据形成一个随机打乱的骑行起点数据数组;随机洗牌的目的是从一个大的数据集合中筛选出有代表性的数组进行相应的放缩,利于可视化呈现。
其中,S2.3.3中所述“连线”的数量,可以根据聚类后该类数量做相应的放缩,利于各个骑行区域的可视化呈现。
其中,S2.3.4中所述“辐射图”是指数据进行聚类后,模拟出各个区域的骑行数据分布图。
其中,S2.4中所述“预测聚类的坐标”是指在当前统计时段,预测能出现大量共享单车的位置,即通过对骑行起点数据的聚类分析和对骑行终点数据的平均值计算,得出用户大量集中使用共享单车的坐标,从而达到共享单车优化调配的目的。
其中,S3中所述“效果判断”是指:通过大量数据的聚类分析和可视化呈现后,由效果图的经纬度从地图上判断出聚类的位置,通常聚类较多的位置出现在地铁、小区、商业区等人员密集、流动性大的区域,因此,如果位置出现偏差,可判定为可视化效果不好。
其中,S5中所述“修改聚类的分类个数重新运行算法,或者修改清洗数据的参数值”是指:当可视化效果不好时,一是可以通过修改聚类的质心和数量重新进行K-means聚类算法计算;二是可以修改骑行特征的筛选参数值,进而优化可视化效果。
其中,本实施例所述方法是应用于实施例四中所述电子设备200的解调方法。
实施例二
参见图2、3,为本实施例提供的采用基于聚类算法的共享单车优化调配方法通过程序进行实现的可视化效果图,所举实例只用于解释本发明,并非用于限定本发明的范围。该方法具体包括以下步骤:
S101、把一个城市的单车数据输入程序中,程序实现如下:
Figure BSA0000223953810000061
Figure BSA0000223953810000071
S102、利用聚类算法进行计算,程序实现如下:
Figure BSA0000223953810000072
Figure BSA0000223953810000081
程序执行完成后,数据计算结果如下:
Figure BSA0000223953810000082
Figure BSA0000223953810000091
由上表数据可知:通过聚类计算得到聚类具体坐标,可以在地图中直接定位相应的聚点坐标(起止坐标)和分类数量,以便做进一步的统计分析。
S103、数据可视化,程序实现如下:
Figure BSA0000223953810000092
Figure BSA0000223953810000101
Figure BSA0000223953810000111
程序执行完成后,得到可视化效果图2和图3,效果图是根据共享单车某一天11 点到12点骑行起点和骑行终点的数据做的聚类分析,聚集的焦点就是骑行终点的坐标,线条数量就是这个分类相对骑行的人数。
其中,图2是部分数据聚类后的效果图,图3是全量数据聚类后的效果图,从聚点的经纬度上对比地图可以看出:共享单车的骑行终点基本都在地铁站和商业区附近。其意义在于:根据上一个小时的数据,可聚类分析出共享单车聚集停放最多的位置,以便为下一小时的出行定量分配共享单车,达到更高的骑行利用率。
其中,本实施例所述方法是按照实施例一中所述方法通过执行程序代码完成共享单车的优化调配。
实施例三
参见图4,为本实施例提供的一种基于聚类算法的共享单车优化调配控制装置210,所举实例只用于解释本发明,并非用于限定本发明的范围。该控制装置具体包括以下模块:
数据采集和清洗模块212:从共享单车数据源211采集骑行数据,对不完整、重复、无关数据进行清洗,得到标准、干净、合规的数据,选择所需时间段,设置数据清洗标准,即筛选标准参数值,对骑行特征进行有效性筛选;
数据挖掘模块213:利用聚类算法从筛选后数据集合中挖掘数据特征,得到特征分类并存储在特征分类库;
可视化呈现模块214:将分类后数据特征进行连线,得到各个区域的骑行辐射图,可根据骑行辐射图中的聚类效果做相应的放缩,使呈现效果最优化;
调配优化模块215:通过可视化效果分析,预测所需时间段共享单车大量聚集的位置,并根据可视化效果需要进行调参,得到单车调配最优方案。
其中,数据采集和清洗模块212进一步包括以下内容:
数据采集子模块2121:从共享单车数据源采集骑行数据;
特征筛选子模块2122:对不完整、重复、无关数据进行清洗,得到标准、干净、合规的数据,选择所需时间段,利用二维欧氏距离计算骑行距离,设置筛选标准参数值,对骑行距离、骑行时间、骑行次数等骑行特征进行有效性筛选。
其中,数据挖掘模块213进一步包括以下内容:
聚类计算子模块2131:利用K-means聚类算法从筛选后数据集合中随机选择初始质心,计算集合中各个数据到初始质心的距离,将相近数据归为一类并计算新的质心,当距离小于固定阈值,得到特征分类;
特征分类库2132:用于存储聚类计算子模块输出的分类数据。
其中,放缩方式可通过随机洗牌算法筛选出有代表性的数据,将放缩后数据进行连线,根据连线效果调整放缩范围。
其中,调参方式可通过调整数据的清洗标准,即骑行特征的筛选参数值,比如骑行距离、骑行时间等,或者调整数据的挖掘标准,即聚类算法的质心和数量,以优化调配方案。
其中,本实施例所述共享单车优化调配控制装置210,其实现原理及产生的技术效果与实施例一和实施例二中各所述方法相同,为简要描述,本实施例中未提及之处,可参考前述方法实施例中相应内容。
实施例四
参见图5,为本实施例提供的一种电子设备200,所举实例只用于解释本发明,并非用于限定本发明的范围。所述电子设备200包括:共享单车优化调配控制装置210、存储器220和处理器230。
其中,所述共享单车优化调配控制装置210、存储器220、处理器230 各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。
其中,上述各元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述共享单车优化调配控制装置210包括至少一个可以软件或固件 (firmware)的形式存储于所述存储器220中或固化在所述电子设备200的操作系统(0S)中的软件功能模块。所述处理器230用于执行所述存储器220中存储的可执行模块,比如,所述共享单车优化调配控制装置210包括的软件功能模块或计算机程序。
其中,所述存储器220不限于随机存取存储器(RAM),只读存储器(ROM),可编程只读存储器(PROM),可擦除只读存储器(EPROM),电可擦除只读存储器(EEPROM)等。
其中,所述存储器220用于存储程序,所述处理器230在接收到执行指令后,执行所述程序。本发明实施例一实施例二中所执行的方法均可以应用于本实施例所述电子设备200的处理器230中,或者由处理器230实现。
其中,所述处理器230可能是一种集成电路芯片,具有信号的处理能力。所述处理器230可以是通用处理器,包括中央处理器(CPU)、网络处理器(NP) 等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器,或者也可以是任何常规的处理器等。
其中,本实施例所述电子设备200可以是实施例五中所述服务器110。
实施例五
参见图6,为本实施例提供的一种网络系统100,所举实例只用于解释本发明,并非用于限定本发明的范围。所述网络系统100包括:服务器110和客户终端120,客户终端120通过网络与服务器110进行数据交互。
其中,所述服务器110在数据载入加速时,将预设提示信息发送至与所述服务器110通信的客户终端120。
其中,所述服务器110不限于网络服务器、数据库服务器、云端服务器等。所述客户终端120不限于个人电脑(PC)、智能手机、平板电脑、移动上网设备(MID)、个人数字助理(PDA)等电子设备。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。并且,各个实施例公开并不局限于上面已经描述并在附图中示出的精确结构,还可以在不脱离其范围进行各种修改和改变。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围不局限于此,任何熟悉本技术领域的技术人员在本发明的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (14)

1.一种基于聚类算法的共享单车优化调配方法,其特征在于:
S1、大规模采集数据;
S2、对数据进行清洗和特征选择,利用聚类算法进行计算:
S3、数据可视化效果判断;
S4、效果好,得到共享单车优化调配结论;
S5、否则,修改聚类的分类个数重新运行算法,或者修改清洗数据的参数值。
2.如权利要求1所述的一种基于聚类算法的共享单车优化调配方法,其特征在于:所述S2进一步包括以下步骤:
S2.1、对骑行特征进行筛选;
S2.2、利用K-means聚类算法对筛选后数据的骑行特征进行分类,得到分类图;
S2.3、对分类后数据进行可视化分析;
S2.4、根据分析结果预测聚类的坐标。
3.如权利要求1所述的一种基于聚类算法的共享单车优化调配方法,其特征在于:所述S2.2进一步包括以下步骤:
S2.2.1、输入K值;
S2.2.2、从数据集合中随机选择K个数据点作为初始质心;
S2.2.3、计算集合中各个数据与初始质心的二维欧氏距离,距离近的归为一类;
S2.2.4、利用算法在一类中选择新的质心;
S2.2.5、判断新的质心与初始质心的距离;
S2.2.6、当距离小于固定阈值,得到聚类分类数据,否则继续S2.2.3。
4.如权利要求1所述的一种基于聚类算法的共享单车优化调配方法,其特征在于:所述S2.3进一步包括以下步骤:
S2.3.1、取骑行终点数据的平均数;
S2.3.2、利用随机洗牌算法计算骑行起点数据;
S2.3.3、将骑行终点数据的平均数与骑行起点数据进行连线;
S2.3.4、得到各个区域骑行数据的辐射图。
5.如权利要求2所述的一种基于聚类算法的共享单车优化调配方法,其特征在于:所述S2.1中“对骑行特征进行筛选”是指:筛选出需要的时间段,利用二维欧氏距离计算骑行距离,并对骑行距离、骑行时间这类骑行特征进行有效性的筛选。
6.如权利要求3所述的一种基于聚类算法的共享单车优化调配方法,其特征在于:所述S2.2.4中“利用算法在一类中选择新的质心”是指:使用误差平方和(Sum of the SquaredError,SSE)作为聚类的目标函数,两次运行K均值产生的两个不同的簇集,选择SSE为最小值的簇集作为新的质心;所述S2.2.6中“固定阈值”是指:根据聚类效果的需要,人为设置固定参数值,当参数值为7时,聚类效果最好。
7.如权利要求4所述的一种基于聚类算法的共享单车优化调配方法,其特征在于:所述S2.3.2中“利用随机洗牌算法计算骑行起点数据”是指:利用随机洗牌算法从骑行起点数据集合中抽取数据,形成一个随机打乱的骑行起点数据数组,即从一个大的数据集合中筛选出有代表性的数组做相应的放缩,利于可视化呈现。
8.如权利要求1所述的一种基于聚类算法的共享单车优化调配方法,其特征在于:所述S5中“修改聚类的分类个数重新运行算法,或者修改清洗数据的参数值”是指:当可视化效果不好时,一是可以通过修改聚类的质心和数量重新进行K-means聚类算法计算;二是可以修改骑行特征的筛选参数值,进而优化可视化效果。
9.一种基于聚类算法的共享单车优化调配控制装置,其特征在于:该控制装置包括以下模块:
数据采集和清洗模块:从共享单车数据源采集骑行数据,对不完整、重复、无关数据进行清洗,得到标准、干净、合规的数据,选择所需时间段,设置数据清洗标准,即筛选标准参数值,对骑行特征进行有效性筛选;
数据挖掘模块:利用聚类算法从筛选后数据集合中挖掘数据特征,得到特征分类并存储在特征分类库;
可视化呈现模块:将分类后数据特征进行连线,得到各个区域的骑行辐射图,可根据骑行辐射图中的聚类效果做相应的放缩,使呈现效果最优化;
调配优化模块:通过可视化效果分析,预测所需时间段共享单车大量聚集的位置,并根据可视化效果需要进行调参,得到单车调配最优方案。
10.如权利要求9所述的一种基于聚类算法的共享单车优化调配控制装置,其特征在于:所述数据采集和清洗模块还包括以下模块:
数据采集子模块:从共享单车数据源采集骑行数据;
特征筛选子模块:对不完整、重复、无关数据进行清洗,得到标准、干净、合规的数据,选择所需时间段,利用二维欧氏距离计算骑行距离,设置筛选标准参数值,对骑行距离、骑行时间、骑行次数这类骑行特征进行有效性筛选。
11.如权利要求9所述的一种基于聚类算法的共享单车优化调配控制装置,其特征在于:所述数据挖掘模块还包括以下模块:
聚类计算子模块:从筛选后数据集合中随机选择初始质心,计算集合中各个数据到初始质心的距离,将相近数据归为一类并计算新的质心,当距离小于固定阈值,得到特征分类;
特征分类库:用于存储聚类计算子模块输出的分类数据。
12.如权利要求9所述的一种基于聚类算法的共享单车优化调配控制装置,其特征在于:所述“放缩”方式可通过随机洗牌算法筛选出有代表性的数据,将放缩后数据进行连线,根据连线效果调整放缩范围;所述“调参”方式可通过调整数据的清洗标准,即骑行特征的筛选参数值,比如骑行距离、骑行时间,或者调整数据的挖掘标准,即聚类算法的质心和数量,以优化调配方案。
13.一种电子设备,其特征在于:所述电子设备包括:存储器和处理器,所述存储器与所述处理器连接;所述存储器用于存储程序;所述处理器用于调用存储于所述存储器中的程序,以执行如权利要求1-8任一项所述的方法。
14.一种存储介质,其特征在于:所述存储介质存储有处理器可执行的程序代码于计算机内,所述存储介质包括多条指令,所述多条指令被配置成使所述处理器执行如权利要求1-8任一项所述的方法。
CN202011228011.7A 2020-11-06 2020-11-06 一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质 Pending CN112257955A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011228011.7A CN112257955A (zh) 2020-11-06 2020-11-06 一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011228011.7A CN112257955A (zh) 2020-11-06 2020-11-06 一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质

Publications (1)

Publication Number Publication Date
CN112257955A true CN112257955A (zh) 2021-01-22

Family

ID=74265044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011228011.7A Pending CN112257955A (zh) 2020-11-06 2020-11-06 一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质

Country Status (1)

Country Link
CN (1) CN112257955A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114579884A (zh) * 2022-02-16 2022-06-03 中冶南方城市建设工程技术有限公司 城市建成区内共享单车出行展示方法及系统
CN114579884B (zh) * 2022-02-16 2024-05-31 中冶南方城市建设工程技术有限公司 城市建成区内共享单车出行展示方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015180340A1 (zh) * 2014-05-30 2015-12-03 华为技术有限公司 一种数据挖掘方法及装置
CN107491895A (zh) * 2017-08-30 2017-12-19 国信优易数据有限公司 一种共享单车停放点的确定方法及装置
CN109508865A (zh) * 2018-10-19 2019-03-22 东南大学 基于时空使用模式的地铁站辐射范围内共享单车的部署方法
CN109583491A (zh) * 2018-11-23 2019-04-05 温州职业技术学院 一种共享单车智能调度方法
CN110458187A (zh) * 2019-06-27 2019-11-15 广州大学 一种恶意代码家族聚类方法和系统
CN110750528A (zh) * 2019-10-25 2020-02-04 广东机场白云信息科技有限公司 一种多源数据可视分析与展现方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015180340A1 (zh) * 2014-05-30 2015-12-03 华为技术有限公司 一种数据挖掘方法及装置
CN107491895A (zh) * 2017-08-30 2017-12-19 国信优易数据有限公司 一种共享单车停放点的确定方法及装置
CN109508865A (zh) * 2018-10-19 2019-03-22 东南大学 基于时空使用模式的地铁站辐射范围内共享单车的部署方法
CN109583491A (zh) * 2018-11-23 2019-04-05 温州职业技术学院 一种共享单车智能调度方法
CN110458187A (zh) * 2019-06-27 2019-11-15 广州大学 一种恶意代码家族聚类方法和系统
CN110750528A (zh) * 2019-10-25 2020-02-04 广东机场白云信息科技有限公司 一种多源数据可视分析与展现方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
苏影: "基于数据分析的共享单车动态调配优化研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
郑宗成等: "《市场研究中的统计分析方法基础篇》", 31 December 2012 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114579884A (zh) * 2022-02-16 2022-06-03 中冶南方城市建设工程技术有限公司 城市建成区内共享单车出行展示方法及系统
CN114579884B (zh) * 2022-02-16 2024-05-31 中冶南方城市建设工程技术有限公司 城市建成区内共享单车出行展示方法及系统

Similar Documents

Publication Publication Date Title
CN107547633B (zh) 一种用户常驻点的处理方法、装置和存储介质
CN106708989B (zh) 基于空间时序数据流应用的Skyline查询方法
CN106777093B (zh) 基于空间时序数据流应用的Skyline查询系统
CN109241846B (zh) 遥感影像的时空变化估测方法、装置与存储介质
CN109033170B (zh) 停车场的数据修补方法、装置、设备及存储介质
CN110569321B (zh) 基于城市地图的网格划分处理方法、装置和计算机设备
CN113570867B (zh) 一种城市交通状态预测方法、装置、设备及可读存储介质
CN109840640B (zh) 一种电动汽车充电桩的选址方法和系统
CN111479321B (zh) 一种网格构建方法、装置、电子设备和存储介质
CN115988421A (zh) 一种基于时间权重聚类的职住地估计方法及装置
CN114614989A (zh) 基于数字孪生技术的网络业务的可行性验证方法及装置
CN115829124A (zh) 充电桩选址方法、装置、设备及存储介质
CN114418360A (zh) 一种智慧城市运行体征大数据分析方法及装置
CN117079148B (zh) 城市功能区的识别方法、装置、设备和介质
CN116611678B (zh) 数据处理方法、装置、计算机设备和存储介质
CN117171288A (zh) 一种栅格地图解析方法、装置、设备和介质
CN112257955A (zh) 一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质
CN111352964B (zh) 获取兴趣点信息的方法、装置、设备及存储介质
CN107464571B (zh) 一种数据质量评估的方法、设备及系统
CN115511343A (zh) 一种城市核心区域的确定方法、装置、设备以及存储介质
CN115456238A (zh) 一种基于动态多视图耦合图卷积的城市出行需求预测方法
CN111429742B (zh) 一种路侧设备分配方法及装置
CN114331206A (zh) 点位选址方法、装置、电子设备及可读存储介质
CN112612934A (zh) 用户充电行为画像处理方法和装置
CN112529311A (zh) 一种基于图卷积分析的道路流量预测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Wang Min

Inventor after: Du Yinchen

Inventor after: Zhang Bo

Inventor after: Yan Yan

Inventor after: Xiao Guoquan

Inventor after: Pei Fei

Inventor after: Shack

Inventor after: Peng Zujian

Inventor after: Shao Luoshu

Inventor after: Liu Tong

Inventor after: Guo Yufeng

Inventor before: Wang Min

Inventor before: Yan Yan

Inventor before: Xiao Guoquan

Inventor before: Pei Fei

Inventor before: Shack

Inventor before: Peng Zujian

Inventor before: Shao Luoshu

Inventor before: Zhang Bo

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210122