CN111832791A - 一种基于机器学习逻辑回归的加油站预测方法 - Google Patents
一种基于机器学习逻辑回归的加油站预测方法 Download PDFInfo
- Publication number
- CN111832791A CN111832791A CN201911185713.9A CN201911185713A CN111832791A CN 111832791 A CN111832791 A CN 111832791A CN 201911185713 A CN201911185713 A CN 201911185713A CN 111832791 A CN111832791 A CN 111832791A
- Authority
- CN
- China
- Prior art keywords
- points
- machine learning
- sample
- logistic regression
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000007477 logistic regression Methods 0.000 title claims abstract description 33
- 238000010801 machine learning Methods 0.000 title claims abstract description 30
- 230000002776 aggregation Effects 0.000 claims abstract description 16
- 238000004220 aggregation Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000013145 classification model Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000003032 molecular docking Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000006116 polymerization reaction Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于机器学习逻辑回归的加油站预测方法,包括如下步骤:S1、收集样本数据;S2、根据所述样本数据,进行停靠点聚合;S3、确定模型特征,并计算每一个停靠点的模型特征;S4、根据所述模型特征对正负样本进行标注;S5、根据所述样本数据,采用机器学习的分类模型逻辑回归进行训练建模。本发明基于海量的停靠点和聚合点,通过对模型的应用,达到通过对加油站旁边的停靠点的发现去准确确定加油站的位置。
Description
技术领域
本发明属于智能交通技术领域,具体涉及一种基于机器学习逻辑回归的加油站预测方法。
背景技术
现有技术中,加油站信息点(Point of Interest,POI)的采集方法主要是利用步采,车采和航拍的方法人工进行采集。
上述方案中,无论是步采还是车采,事先都不知道加油站的具体位置,需要人或者采集车到达相应位置后才能发现,采集成本较高,并且会出现漏掉加油站的情况;另外,当某个地方新建一个加油站或者拆除一个加油站,现有的采集方法不能快速的发现,而是需要下一个采集周期才能够发现,导致加油站POI更新时间周期长。
另外,目前关于兴趣点(Point Of Interest,POI)的挖掘算法不能实现对加油站的发现。
发明内容
本发明的目的是通过以下技术方案实现的。
本发明通过日常的停靠兴趣点(Point Of Interest,POI)数据,发现周围的加油站。
具体的,本发明提供了一种基于机器学习逻辑回归的加油站预测方法,包括如下步骤:
S1、收集样本数据;
S2、根据所述样本数据,进行停靠点聚合;
S3、确定模型特征,并计算每一个停靠点的模型特征;
S4、根据所述模型特征对正负样本进行标注;
S5、根据所述样本数据,采用机器学习的分类模型逻辑回归进行训练建模。
进一步地,所述样本数据为全国海量的货运车辆动态轨迹点数据。
进一步地,所述根据样本数据,进行停靠点聚合,包括:
对所述样本数据中的货运车辆停靠点数据进行数据分析,采用dbscan+kmeans算法,设置多种参数组合,选取对于已有加油站命中最多的一组参数和聚合点。
进一步地,所述停靠点聚合,具体包括如下步骤:
(1)修改经典DBScan、Kmeans、轮廓系数机器学习方法,增加一个样本重复数的参数,将所述机器学习方法修改成可重复计算的规则;
(2)设计一个网格划分规则,将位置点根据经纬度划分到不同的网格中;
(3)将距离小于5米的点合成一个点,将这些点的个数设为合成后的点的重复数,以合成后点的经度、纬度、重复数生成新样本S1;
(4)设计一个DBScan上限参数,对样本S1分类,把不能分类的样本去掉,把能分类的样本再合成一个新样本S2;
(5)设计一个DBScan下限参数,对样本S2分类,把不能分类的样本去掉,把能分类的样本再合成一个新样本S3,同时记录分类后的类别个数M;
(6)对样本S3进行KMeans聚类,聚类参数分别为1至M,聚出M个类别;
(7)在聚类的同时,计算这M个类别计算轮廓系数,将轮廓系数最大的类别的各类中心点输出,作为聚合的点的位置;
(8)在新的网格规则下,再执行一次通过DBScan、Kmeans、轮廓系数生成一次聚合点。
进一步地,所述步骤(1)包括:
对经典DBScan聚合方法进行修改,除了原有的坐标参数外,再增加一个数量参数n,将原方法累加距离条件内样本数量的操作,由原来的每次加1,改成加上n;
对经典KMeans方法进行修改,除了原有的坐标参数外,再增加一个数量参数n,将原方法中计算质心时,每个样本参与一次计算的流程,改成每个样本重复参与n次质心计算;
对经典聚类轮廓系数计算的方法进行修改,除了原有的坐标参数外,再增加一个数量参数n,将原方法中计算样本距离的方法,修改成将原有的距离乘以n倍。
进一步地,所述每一个停靠点的模型特征包括:停靠点平均停车时长,停靠点平均同时停车数量,停靠点固定时间停车数,停靠点到最近等级道路距离。
进一步地,所述根据模型特征对正负样本进行标注,包括:
选取已知的加油站为正样本,通过固定的特征对正样本进行描述和计算;选取经过筛选和合并的非油站样本做为负样本,每一个负样本独立且单一分布,同时删除正样本油站周围非加油站的点,同样以相同的特征对负样本进行描述,对正负样本进行标注。
进一步地,所述根据样本数据,采用机器学习的分类模型逻辑回归进行训练建模,包括:
计算每个车辆的特征值:停靠点平均停车时长,停靠点平均同时停车数量,停靠点固定时间停车数,停靠点到最近等级道路距离;
判断停靠点的类别二分类问题的类别变量分别是0,1;
将特征值进行细分化,按照2小时为时间间隔,细分化计算共49个特征;
在样本中随机选择70%特征值和类别值,设特征值组成的矩阵为X,类别值组成的向量为Y;
使用LR.fit方法,对矩阵X和向量Y进行建模。
进一步地,所述根据样本数据,采用机器学习的分类模型逻辑回归进行训练建模,包括:
对所述分类模型进行验证与修正,将效果最好的模型进行保存。
进一步地,所述验证与修正的方法如下:
将建模时剩下的30%的样本中的每组特征值,使用建立的模型,调用预测方法,将会得到1或0的预测值,然后与实际的类别值进行比较;
计算所有剩余30%的预测值的正确率;
选择LR建模时的fit方法的L1或L2正则化进行微调,然后建模并重复上述两个步骤,计算不同参数值时的正确率,以正确率最高的模型作为最终使用的预测模型进行保存;
使用逻辑回归对特征进行建模,训练模型,并对测试集进行预测,用百度地图的api进行预测效果查看。
本发明的优点在于:本发明基于海量的停靠点和聚合点,通过对模型的应用,达到通过对加油站旁边的停靠点的发现去准确确定加油站的位置。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
附图1示出了根据本发明实施方式的一种基于机器学习逻辑回归的加油站预测方法的简要流程图;
附图2示出了根据本发明实施方式的一种基于机器学习逻辑回归的加油站预测方法的详细流程图;
附图3示出了根据本发明实施方式将海量停靠点进行聚合的方法流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明结合机器学习逻辑回归技术,回归是一种极易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。本发明基于海量的停靠点和聚合点,通过对模型的应用达到通过对加油站旁边的停靠点的发现去确定加油站的位置。
逻辑(Logistic)回归的主要思想是,根据现有的数据对分类边界建立回归公式,从而实现分类(一般两类)。“回归”的意思就是要找到最佳拟合参数,其中涉及的数学原理和步骤如下:
(1)需要一个合适的分类函数来实现分类,例如单位阶跃函数、Sigmoid函数。
(2)损失函数(Cost函数)来表示预测值(h(x)h(x))与实际值(yy)的偏差(h-yh-y),要使得回归最佳拟合,那么偏差要尽可能小(偏差求和或取均值)。
(3)记J(ω)J(ω)表示回归系数为ωω时的偏差,那么求最佳回归参数ωω就转换成了求J(ω)J(ω)的最小值,即梯度下降法。
如图1、2所示,本发明的一种基于机器学习逻辑回归的加油站预测方法,包括如下步骤:
S1、收集样本数据:
全国海量的动态轨迹点数据。依托目前公知的货运平台每天生成的全国海量的动态轨迹点数据。
S2、停靠点聚合
针对货运车辆停靠点数据进行数据分析,采用dbscan+kmeans算法,设置多种参数组合,选取对于已有加油站命中最多的一组参数和聚合点;
如图3所示,将海量停靠点进行聚合的方法,具体包括如下步骤:
1.对经典DBScan聚合方法进行修改,除了原有的坐标参数外,再增加一个数量参数n。将原方法累加距离条件内样本数量的操作,由原来的每次加1,改成加上n。
2.对经典KMeans方法进行修改,除了原有的坐标参数外,再增加一个数量参数n。将原方法中计算质心时,每个样本参与一次计算的流程,改成每个样本重复参与n次质心计算。
3.对经典聚类轮廓系数计算的方法进行修改,除了原有的坐标参数外,再增加一个数量参数n。将原方法中,计算样本距离的方法,修改成将原有的距离乘以n倍。
4.上述三个方法的修改,可以使原本计算时的样本量减少很多,运算量会呈几何级数趋势的下降。
5.对于所有gps位置点,把距离小于5米(该阈值可修改)的点(假设有m个),合并成一条经纬度在这些点中心位置,数量是m的一个样本。
6.对于上一步生成的位置点+数量的样本,执行如下运算:
a)设计一个运行DBScan的上限的参数(具体参数值可以通过数据统计确认),运行修改过的DBScan算法,将包含不可分类的点的样本去掉,将包含可分类点的样本合并成一个新的样本集。
b)设计一个运行DBScan的下限的参数(具体参数值可以通过数据统计确认),运行修改过的DBScan算法,对合并后的样本集中的各条记录进行分类,得到类别个数M。
c)运行修改过的KMeans算法,对于合并后的样本集中的数据,将K值,由1到M,分别运行聚类运算,得到M组聚类结果。
d)对每组聚类结果,运行修改后的轮廓系数算法计算每组的轮廓系数,取轮廓系数值最大的那组聚类结果的位置点。
由于gps位置点数量庞大,传统的机器学习方法一方面从性能上不是很理想,而通过采用本发明的技术方案,从海量gps位置点中,可以高效而准确的生成候选POI或事件的位置点,经测试验证,效果非常理想。
S3、确定模型特征,并计算每一个停靠点的模型特征。
S11)停靠点平均停车时长,停靠点平均同时停车数量,停靠点固定时间停车数,停靠点到最近等级道路距离。
S12)指标解释:
停靠点平均同时停车数量:数据的start_time和end_time全部小于观测窗口的上边界或者数据的start_time和end_time全部大于观测窗口的下边界,按照start_time进行排序后,对第i辆车,选取符合上线边界的车辆进行求和计算。
停靠点固定时间停车数:统计在固定观测时间内停留在该点的车辆数。
停靠点到最近等级道路距离:计算停靠点到各个不同等级的道路的距离,并取最短距离。
停靠点平均停车时长:计算该点的车辆的时间总长并求平均。
S4、正负样本标注;
选取已知的加油站为正样本,通过固定的特征对正样本进行描述和计算;选取经过筛选和合并的非油站样本做为负样本。每一个负样本独立且单一分布,同时删除正样本油站周围非加油站的点,避免出现过拟合问题,同样以相同的特征对负样本进行描述,对正负样本进行标注。
S5、训练模型
S51)根据样本中的数据,采用任意一种常用机器学习的分类模型逻辑回归进行训练建模,建立二分类模型。
以逻辑回归建立模型为例进行说明:LogisticRegression有多种实现框架,这里选用sklearn框架中的lr模型
sklearn.linear_model.LogisticRegression)。
a.计算每个车辆的特征值:停靠点平均停车时长,停靠点平均同时停车数量,停靠点固定时间停车数,停靠点到最近等级道路距离,设这些值分别为V1、V2、V3、V4….V49。
b.判断这点的类别二分类问题的类别变量分别是0,1。
c.将特征值进行细分化,按照2小时为时间间隔,细分化计算共49个特征,设细分化后的特征值为X1、X2、X3、X4….X49。
d.在样本中随机选择70%特征值和类别值,设特征值组成的矩阵为X,类别值组成的向量为Y。
e.使用LR.fit方法,对矩阵X和向量Y进行建模。
S52)对模型进行验证与修正,将效果最好的模型进行保存。
验证与修正的方法如下:
a.将建模时剩下的30%的样本中的每组特征值,使用建立的模型,调用predict方法,将会得到1或0的预测值,然后与实际的类别值进行比较;
b.计算所有剩余30%的预测值的正确率。
c.LR建模时的fit方法有多个参数,可以选择L1或L2正则化进行微调,然后建模并重复上述a、b两个步骤,计算不同参数值时的正确率,以正确率最高的模型作为最终使用的预测模型进行保存。
d.验证
使用逻辑回归对上述特征进行建模,训练模型,并对测试集进行预测,用百度地图的api进行预测效果查看。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于机器学习逻辑回归的加油站预测方法,包括如下步骤:
S1、收集样本数据;
S2、根据所述样本数据,进行停靠点聚合;
S3、确定模型特征,并计算每一个停靠点的模型特征;
S4、根据所述模型特征对正负样本进行标注;
S5、根据所述样本数据,采用机器学习的分类模型逻辑回归进行训练建模。
2.根据权利要求1所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述样本数据为全国海量的货运车辆动态轨迹点数据。
3.根据权利要求2所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述根据样本数据,进行停靠点聚合,包括:
对所述样本数据中的货运车辆停靠点数据进行数据分析,采用dbscan+kmeans算法,设置多种参数组合,选取对于已有加油站命中最多的一组参数和聚合点。
4.根据权利要求1-3任意一项所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述停靠点聚合,具体包括如下步骤:
(1)修改经典DBScan、Kmeans、轮廓系数机器学习方法,增加一个样本重复数的参数,将所述机器学习方法修改成可重复计算的规则;
(2)设计一个网格划分规则,将位置点根据经纬度划分到不同的网格中;
(3)将距离小于5米的点合成一个点,将这些点的个数设为合成后的点的重复数,以合成后点的经度、纬度、重复数生成新样本S1;
(4)设计一个DBScan上限参数,对样本S1分类,把不能分类的样本去掉,把能分类的样本再合成一个新样本S2;
(5)设计一个DBScan下限参数,对样本S2分类,把不能分类的样本去掉,把能分类的样本再合成一个新样本S3,同时记录分类后的类别个数M;
(6)对样本S3进行KMeans聚类,聚类参数分别为1至M,聚出M个类别;
(7)在聚类的同时,计算这M个类别计算轮廓系数,将轮廓系数最大的类别的各类中心点输出,作为聚合的点的位置;
(8)在新的网格规则下,再执行一次通过DBScan、Kmeans、轮廓系数生成一次聚合点。
5.根据权利要求4所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述步骤(1)包括:
对经典DBScan聚合方法进行修改,除了原有的坐标参数外,再增加一个数量参数n,将原方法累加距离条件内样本数量的操作,由原来的每次加1,改成加上n;
对经典KMeans方法进行修改,除了原有的坐标参数外,再增加一个数量参数n,将原方法中计算质心时,每个样本参与一次计算的流程,改成每个样本重复参与n次质心计算;
对经典聚类轮廓系数计算的方法进行修改,除了原有的坐标参数外,再增加一个数量参数n,将原方法中计算样本距离的方法,修改成将原有的距离乘以n倍。
6.根据权利要求1-3任意一项所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述每一个停靠点的模型特征包括:停靠点平均停车时长,停靠点平均同时停车数量,停靠点固定时间停车数,停靠点到最近等级道路距离。
7.根据权利要求1-3任意一项所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述根据模型特征对正负样本进行标注,包括:
选取已知的加油站为正样本,通过固定的特征对正样本进行描述和计算;选取经过筛选和合并的非油站样本做为负样本,每一个负样本独立且单一分布,同时删除正样本油站周围非加油站的点,同样以相同的特征对负样本进行描述,对正负样本进行标注。
8.根据权利要求1-3任意一项所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述根据样本数据,采用机器学习的分类模型逻辑回归进行训练建模,包括:
计算每个车辆的特征值:停靠点平均停车时长,停靠点平均同时停车数量,停靠点固定时间停车数,停靠点到最近等级道路距离;
判断停靠点的类别二分类问题的类别变量分别是0,1;
将特征值进行细分化,按照2小时为时间间隔,细分化计算共49个特征;
在样本中随机选择70%特征值和类别值,设特征值组成的矩阵为X,类别值组成的向量为Y;
使用LR.fit方法,对矩阵X和向量Y进行建模。
9.根据权利要求8所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述根据样本数据,采用机器学习的分类模型逻辑回归进行训练建模,包括:
对所述分类模型进行验证与修正,将效果最好的模型进行保存。
10.根据权利要求9所述的一种基于机器学习逻辑回归的加油站预测方法,其特征在于,
所述验证与修正的方法如下:
将建模时剩下的30%的样本中的每组特征值,使用建立的模型,调用预测方法,将会得到1或0的预测值,然后与实际的类别值进行比较;
计算所有剩余30%的预测值的正确率;
选择LR建模时的fit方法的L1或L2正则化进行微调,然后建模并重复上述两个步骤,计算不同参数值时的正确率,以正确率最高的模型作为最终使用的预测模型进行保存;
使用逻辑回归对特征进行建模,训练模型,并对测试集进行预测,用百度地图的api进行预测效果查看。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911185713.9A CN111832791B (zh) | 2019-11-27 | 2019-11-27 | 一种基于机器学习逻辑回归的加油站预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911185713.9A CN111832791B (zh) | 2019-11-27 | 2019-11-27 | 一种基于机器学习逻辑回归的加油站预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111832791A true CN111832791A (zh) | 2020-10-27 |
CN111832791B CN111832791B (zh) | 2024-06-25 |
Family
ID=72912680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911185713.9A Active CN111832791B (zh) | 2019-11-27 | 2019-11-27 | 一种基于机器学习逻辑回归的加油站预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832791B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577602A (zh) * | 2013-11-18 | 2014-02-12 | 浪潮(北京)电子信息产业有限公司 | 一种二次聚类方法及系统 |
CN105718939A (zh) * | 2016-01-13 | 2016-06-29 | 北京中交兴路信息科技有限公司 | 基于增量聚类的车辆停靠轨迹漂移去除方法及装置 |
CN106776988A (zh) * | 2016-12-06 | 2017-05-31 | 北京中交兴路信息科技有限公司 | 一种基于时间聚合的停靠点确定方法及装置 |
CN108154261A (zh) * | 2017-12-18 | 2018-06-12 | 北京中交兴路信息科技有限公司 | 一种最优加油站的推荐方法及装置 |
CN108182558A (zh) * | 2017-12-04 | 2018-06-19 | 北京中交兴路信息科技有限公司 | 一种基于统计特征的运距计算方法及装置 |
CN110222782A (zh) * | 2019-06-13 | 2019-09-10 | 齐鲁工业大学 | 基于密度聚类的有监督二分类数据分析方法及系统 |
CN110417810A (zh) * | 2019-08-20 | 2019-11-05 | 西安电子科技大学 | 基于逻辑回归的增强模型的恶意加密流量检测方法 |
-
2019
- 2019-11-27 CN CN201911185713.9A patent/CN111832791B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577602A (zh) * | 2013-11-18 | 2014-02-12 | 浪潮(北京)电子信息产业有限公司 | 一种二次聚类方法及系统 |
CN105718939A (zh) * | 2016-01-13 | 2016-06-29 | 北京中交兴路信息科技有限公司 | 基于增量聚类的车辆停靠轨迹漂移去除方法及装置 |
CN106776988A (zh) * | 2016-12-06 | 2017-05-31 | 北京中交兴路信息科技有限公司 | 一种基于时间聚合的停靠点确定方法及装置 |
CN108182558A (zh) * | 2017-12-04 | 2018-06-19 | 北京中交兴路信息科技有限公司 | 一种基于统计特征的运距计算方法及装置 |
CN108154261A (zh) * | 2017-12-18 | 2018-06-12 | 北京中交兴路信息科技有限公司 | 一种最优加油站的推荐方法及装置 |
CN110222782A (zh) * | 2019-06-13 | 2019-09-10 | 齐鲁工业大学 | 基于密度聚类的有监督二分类数据分析方法及系统 |
CN110417810A (zh) * | 2019-08-20 | 2019-11-05 | 西安电子科技大学 | 基于逻辑回归的增强模型的恶意加密流量检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111832791B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mayakuntla et al. | A novel methodology for construction of driving cycles for Indian cities | |
CN110413905B (zh) | 获取道路线形的方法、装置、设备及存储介质 | |
CN107103754A (zh) | 一种道路交通状况预测方法及系统 | |
CN107067025A (zh) | 一种基于主动学习的数据自动标注方法 | |
CN106919957B (zh) | 处理数据的方法及装置 | |
CN105069470A (zh) | 分类模型训练方法及装置 | |
CN106649709B (zh) | 一种基于数据挖掘的车辆停留行为模式预测与评估方法 | |
CN109492709A (zh) | 基于混合模型的数据预测方法及装置 | |
CN109886724B (zh) | 一种鲁棒性的居民出行轨迹识别方法 | |
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
CN109376331A (zh) | 一种基于梯度提升回归树的城市公交车排放率估计方法 | |
CN113792782A (zh) | 运营车辆的轨迹监测方法、装置、存储介质及计算机设备 | |
CN117074951A (zh) | 锂电池荷电状态的估计方法、装置、设备及可读存储介质 | |
CN111832599B (zh) | 一种基于机器学习随机森林的加油站预测方法 | |
CN115860214A (zh) | 一种pm2.5排放浓度的预警方法和装置 | |
CN115422747A (zh) | 一种机动车尾气污染物排放量的计算方法和计算装置 | |
CN111723835A (zh) | 车辆移动轨迹区分方法、装置和电子设备 | |
CN109543922B (zh) | 用于有桩共享单车站点群的分时段借还量预测方法 | |
CN111210158A (zh) | 目标地址确定方法、装置、计算机设备和存储介质 | |
CN111160594B (zh) | 一种到达时间的预估方法、装置及存储介质 | |
CN115691140B (zh) | 一种汽车充电需求时空分布的分析与预测方法 | |
CN111832791A (zh) | 一种基于机器学习逻辑回归的加油站预测方法 | |
CN114492169B (zh) | 考虑用户市场响应潜力的电动汽车用户画像方法及系统 | |
CN114390582B (zh) | 基站站址预测方法及装置 | |
CN113744070A (zh) | 新能源汽车保险成本的预测方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |