CN116432871A - 一种基于AdaBoost算法的公交调度优化方法 - Google Patents

一种基于AdaBoost算法的公交调度优化方法 Download PDF

Info

Publication number
CN116432871A
CN116432871A CN202310693805.8A CN202310693805A CN116432871A CN 116432871 A CN116432871 A CN 116432871A CN 202310693805 A CN202310693805 A CN 202310693805A CN 116432871 A CN116432871 A CN 116432871A
Authority
CN
China
Prior art keywords
data
bus
weather
adaboost algorithm
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310693805.8A
Other languages
English (en)
Inventor
赵龙霄
马红光
李想
邵杰
王新鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Cuiwen Technology Co ltd
Beijing University of Chemical Technology
Original Assignee
Anhui Cuiwen Technology Co ltd
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Cuiwen Technology Co ltd, Beijing University of Chemical Technology filed Critical Anhui Cuiwen Technology Co ltd
Priority to CN202310693805.8A priority Critical patent/CN116432871A/zh
Publication of CN116432871A publication Critical patent/CN116432871A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于AdaBoost算法的公交调度优化方法,属于公交调度技术领域,包括如下步骤:获取公交运行、学校开学状态、天气的历史数据,并建立原始数据集;S2、对获取的原始数据进行预处理;构建基于AdaBoost算法的模型;输入待预测日期的信息,通过AdaBoost模型预测结果,输出公交车线路运行时间内不同站间、不同发车时间的运行时间;根据预测结果,对公交车发车时刻表进行调整。本发明采用上述步骤的一种基于AdaBoost算法的公交调度优化方法,能够根据公交历史运行数据和环境数据预测将来日期下公交在站点之间的运行时间,并以此为依据进行调度,从而解决公交集簇问题。

Description

一种基于AdaBoost算法的公交调度优化方法
技术领域
本发明涉及公交调度技术领域,尤其是涉及一种基于AdaBoost算法的公交调度优化方法。
背景技术
城市公交是城市基础设施之一。随着我国经济的快速发展及城市化进程的不断加快,城市交通正变得越来越拥堵。而道路拥堵会造成同一线路不同班次的公交车造成集簇,这指的是不同班次公交车的距离会靠近,甚至是并行运行。这会使公交车实际到站时间与原计划公交时刻表的偏差较大,不仅影响乘客的乘坐体验,还浪费公交资源。所以合理的安排公交车发车时刻表一直是一项技术难题。
目前,解决公交车集簇的主流方法有等待方法、跳站方法、上车限制方法。等待方法是指在一辆公交车遇到交通堵塞时延缓下一班次公交车的发车时间。跳站方法是指在公交车遇到交通拥堵时某些站点只下不上。上车限制方法是指在公交车遇到交通堵塞时限制站点上车人数。以上方法理论上都可以解决公交车集簇的问题,但是由于早晚高峰交通状况及其复杂,这些方法无法很好的实现其目标,依旧会影响乘客的乘坐体验。
发明内容
本发明的目的是提供一种基于AdaBoost算法的公交调度优化方法,以公交运行和周围环境的历史数据为基础,构建预测模型,通过预测模型输出预测日期下公交在站点之间的运行时间,并以此为依据进行调度,从而解决公交集簇问题。
为实现上述目的,本发明提供了一种基于AdaBoost算法的公交调度优化方法,如图1所示,包括如下步骤:
S1、获取公交运行历史数据、学校开学状态历史数据、天气历史数据,并建立原始数据集;
S2、对获取的原始数据进行预处理;
S3、构建基于AdaBoost算法的模型;
S4、输入待预测日期的信息,通过AdaBoost模型预测结果,输出公交车线路运行时间内不同站间、不同发车时间的运行时间;
S5、根据预测结果,对公交车发车时刻表进行调整。
优选的,S1中的公交运行历史数据包括站点名称、离站时间、到站时间,通过公交集团的数据库获取公交历史运行数据;通过学校日历获取公交线路周边学校开学状态历史数据,包括幼儿园是否开学、小学是否开学、初中是否开学、高中是否开学;天气历史数据包括天气状况、能见度、风力、温度、空气质量,通过网络爬虫获取天气数据。通过日历信息搜集节假日及星期信息。
优选的,爬虫技术是互联网高速发展和数据量快速膨胀的催化结果,通过网络爬虫获取天气历史数据的具体步骤如下:
S11、在互联网中选取主流天气数据网站URL(统一资源定位符),如百度天气、墨迹天气等网站的URL;
S12、将S11选取的URL放入待抓取的URL队列;
S13、取出待抓取的URL队列中每一个URL,访问每一个URL页面,并下载其中的天气状况信息;
S14、利用XPath(XML路径语言)抽取出步骤S13下载得到的天气信息中格式化的数据,并对格式化的数据进行过滤、去重、拼接等操作得到固定格式的结构化数据;
S15、分析已抓取的URL得到网站下网页的结构,根据网页的结构找到要得到的数据的路径,根据路径设置网页信息爬取循环,根据网页信息爬取循环返回S13,直到把所有URL的天气信息爬取完成。
优选的,公交运行数据,由于采集装置的故障或数据传输不正确,获取的数据中会有残缺数据、错误数据、重复数据。同样爬虫数据也会有许多脏数据。数据中的误差会影响到分析的准确性,所以在整理原始数据的时候需要对数据进行清洗操作,去除掉原始数据中的脏数据、重复数据和错填数据等,以保证数据的准确性,避免对预测产生不利的影响。数据集成将来自不同数据源的数据合成一个数据集。数据变换对数据进行相应的转换,转换后数据便于计算和数据挖掘。
S2中对获取的原始数据进行预处理的具体步骤如下:
S21、数据清理:对残缺数据、错误数据采用多重插补法,对残缺数据、错误数据采用多重插补法,多值插补的思想来源于贝叶斯估计,认为待插补的值是随机的,它的值来自于已观测到的值。具体实践上通常是估计出待插补的值,然后再加上不同的噪声,形成多组可选插补值。根据某种选择依据,选取最合适的插补值。具体包括:
S211、为每个空值产生一套可能的插补值,这些值反映了无响应模型的不确定性。每个值都可以被用来插补数据集中的缺失值,产生若干个完整数据集合;
S212、每个插补数据集合都用针对完整数据集的统计方法进行统计分析;
S213、对来自各个插补数据集的结果,根据评分函数进行选择,产生最终的插补值。
S22、数据集成:将来自不同数据源的数据合成一个数据集;
S23、数据变换:对数据进行转换计算,在建立预测模型前需要对数据进行相应的转换,转换后数据便于计算和数据挖掘,具体包括:
(1)区间化
当处理的数据值变化范围小,可以将范围数据进行离散处理,在实际应用中比如天气状况的阴天、阴转晴、多云等对公交运行时间影响相差不多,所以可以将这类天气归为一类方便后续的简化计算,离散化后用一个定义来代替一部分数据可以提高模型的准确性;
(2)独热编码
独热编码(One-Hot Encoding),又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。即,只有一位是1,其余都是零值。独热编码是利用0和1表示一些参数,使用N位状态寄存器来对N个状态进行编码。
如天气特征:["大雨","中雨","晴"] =>0,1,2=>三维。在对其按照N位状态寄存器来对N个状态进行编码的原理编码之后:天气特征:["大雨","中雨","晴"](这里N=3,三维数据):大雨 =>100、中雨 =>010、晴 =>001。
(3)归一化
max-min归一化:
数据归一化是属性的数据映射到(0,1)之间,这种变化不会让数据“失效”,反而在模型求解的时候可以提高数据的表现,一方面能够在求解最优化问题的时候,可以提高求解速度和收敛数据。
数据归一化公式为:
Figure SMS_1
归一化数据还原公式为:
Figure SMS_2
优选的,AdaBoost算法的最大优点就是可以将不同的算法作为弱分类器,充分考虑每个分类器的权重,具有很高的精度。因此,AdaBoost算法能够在公交车行驶时间预测中有更良好的表现。
搭建AdaBoost算法模型时,将站点名称、公交车到站时间、公交车离站时间、幼儿园是否开学、小学是否开学、中学是否开学、高中是否开学、是否为节假日、星期、天气状况、能见度、风力、温度、空气质量作为输入变量,将预测的每个时刻的站间运行时间作为输出变量。将AdaBoost算法模型学习率设为0.001,采用误差的平方作为损失函数。通过回归决策树的深度、基学习器的最大迭代次数调整模型。在训练模型时,使用train-test-split方式将预处理之后的数据集分为训练集和测试集,训练集用来拟合模型的参数及配置,测试集用来对拟合好的模型进行预测,也就是对未来预测的结果的验证,然后评估这些预测的性能。使用交叉验证方法来评估模型,并生成每次训练之后得到的报告。在每个epoch之后,评估测试集表现,判断何时停止和是否提前停止。
S3中构建基于AdaBoost算法的模型,具体步骤如下:
S31、输入训练数据集:
Figure SMS_3
其中,
Figure SMS_4
,表示每一个样本数据有/>
Figure SMS_5
个特征,/>
Figure SMS_6
为样本/>
Figure SMS_7
的目标数值;
S32、初始化权重,记初始状态下的数据集样本分布为
Figure SMS_10
,对每一个样本/>
Figure SMS_12
的权重均初始化为/>
Figure SMS_14
,则/>
Figure SMS_8
,/>
Figure SMS_11
分布用于第一个弱分类器/>
Figure SMS_13
的训练,
Figure SMS_15
分布用于第一个弱分类器/>
Figure SMS_9
的训练;
S33、循环进行
Figure SMS_16
轮迭代,记每一轮迭代中弱分类器的编号为/>
Figure SMS_17
,且
Figure SMS_18
,以该步骤作为循环体,循环体中的步骤进一步细分为:
S331、在样本分布为
Figure SMS_19
的基础上,在数据集/>
Figure SMS_20
上训练弱分类器/>
Figure SMS_21
S332、计算分类器
Figure SMS_22
在训练集/>
Figure SMS_23
上的最大误差/>
Figure SMS_24
,计算公式为:
Figure SMS_25
,/>
Figure SMS_26
其中,
Figure SMS_27
表示弱分类器/>
Figure SMS_28
对样本/>
Figure SMS_29
的预测结果,/>
Figure SMS_30
表示样本/>
Figure SMS_31
的目标值;
S333、根据上面求得的
Figure SMS_32
的最大误差/>
Figure SMS_33
,采用平方误差计算/>
Figure SMS_34
对每个样本的相对误差:
,/>
Figure SMS_36
S334、根据上一步求得的样本相对误差
Figure SMS_37
,计算出当前分类器/>
Figure SMS_38
的误差率:
Figure SMS_39
即数据集中所有样本的权重与误差之和;
S335、更新当前弱分类器
Figure SMS_40
的权重,计算公式为:
Figure SMS_41
S336、更新数据样本的权重分布,对于样本
Figure SMS_42
,更新权重的计算公式为:
Figure SMS_43
S337、令
Figure SMS_44
,回到循环体中的S331;
S338、结束
Figure SMS_45
轮迭代,最终得到强回归器如下:
Figure SMS_46
其中,
Figure SMS_47
是所有/>
Figure SMS_48
的中位数,即所有弱学习器的加权输出结果的中位数。
优选的,S4、接收通过终端发出的预测请求,根据预测请求调取信息设置界面,在界面中用户输入想要预测日期,预测日期幼儿园是否开学、小学是否开学、中学是否开学、高中是否开学,是否为节假日、星期、天气状况基于用户输入的预测日期通过网络爬虫获取。通过AdaBoost模型预测输出公交车线路运行时间内不同站间、不同发车时间的运行时间。
因此,本发明采用上述步骤的一种基于AdaBoost算法的公交调度优化方法,不同于传统的依靠历史数据和人工经验来进行公交调度规划,采用AdaBoost算法基于数据处理、数据分析、机器学习构建预测模型,可以对公交车不同时间,站间运行时间做出科学预测,为公交车排班提供有效参考,同时也可用于公交车到站时间预测,其计算速度快,不易出现过拟合现象,精度相对较高。对公交车时刻表优化后,公交车班次运行时段分布均匀,运行效率高,乘客体验更佳。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明一种基于AdaBoost算法的公交调度优化方法的流程图。
具体实施方式
以下通过附图和实施例对本发明的技术方案作进一步说明。
实施例
城市公交在行驶过程中由于受到道路状况、天气、客流、车流等因素影响,公交运营系统就会逐渐从高效有序状态进入到为无序低效的状态。如某条线路公交车原调度方案是发车间隔为均匀的8分钟。该线路经过某些站间,高峰时段与平峰时段运行时间相差明显。按原有的调度方案,势必会造成公交运营效率和服务水平的下降。所以在这些时段根据预测结果给予不均衡的发车间隔,避免公交车集簇。
采集某城市某条公交线路的运行时间表并以本发明提出的如图1所示的优化方法进行调度调整,得到表1的某城市某条公交线路原始计划时间表、表2的以原始计划时间表进行公交调度的实际时间表、表3的采用本发明的优化方法后的实际时间表。
Figure SMS_49
Figure SMS_50
Figure SMS_51
由原始计划时间表、以原始计划时间表进行公交调度的实际时间表可以得出公交车主要在第4站到第15站间出现进度偏差,总体进度偏差为344分钟,并且出现了公交车集簇。在使用本优化方法进行调度调整后,第4站到第15站间的总体进度偏差为23分钟,总体进度偏差减少了93.31%,并且没有出现公交车集簇。公交公司可基于本方法优化后的时间表,调整原始时间表,减少公交车集簇,提高乘客出行体验,提升公交运营效率。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims (5)

1.一种基于AdaBoost算法的公交调度优化方法,其特征在于:包括如下步骤:
S1、获取公交运行历史数据、学校开学状态历史数据、天气历史数据,并建立原始数据集;
S2、对获取的原始数据进行预处理;
S3、构建基于AdaBoost算法的模型;
S4、输入待预测日期的信息,通过AdaBoost模型预测结果,输出公交车线路运行时间内不同站间、不同发车时间的运行时间;
S5、根据预测结果,对公交车发车时刻表进行调整。
2.根据权利要求1所述的一种基于AdaBoost算法的公交调度优化方法,其特征在于:S1中的公交运行历史数据包括站点名称、离站时间、到站时间,通过公交集团的数据库获取公交历史运行数据;通过学校日历获取公交线路周边学校开学状态历史数据;天气历史数据包括天气状况、能见度、风力、温度、空气质量,通过网络爬虫获取天气数据。
3.根据权利要求2所述的一种基于AdaBoost算法的公交调度优化方法,其特征在于:通过网络爬虫获取天气历史数据的具体步骤如下:
S11、在互联网中选取主流天气数据网站URL;
S12、将S11选取的URL放入待抓取的URL队列;
S13、取出待抓取的URL队列中每一个URL,访问每一个URL页面,并下载其中的天气状况信息;
S14、利用XPath抽取出步骤S13下载得到的天气信息中格式化的数据,并对格式化的数据进行过滤、去重、拼接操作得到固定格式的结构化数据;
S15、分析已抓取的URL得到网站下网页的结构,根据网页的结构找到要得到的数据的路径,根据路径设置网页信息爬取循环,根据网页信息爬取循环返回S13,直到把所有URL的天气信息爬取完成。
4.根据权利要求1所述的一种基于AdaBoost算法的公交调度优化方法,其特征在于:S2中对获取数据的原始数据进行预处理的具体步骤如下:
S21、数据清理:对残缺数据、错误数据采用多重插补法,具体包括:
S211、为每个空值产生一套插补值,用于插补数据集中的缺失值,产生若干个完整数据集合;
S212、每个插补数据集合都用针对完整数据集的统计方法进行统计分析;
S213、对来自各个插补数据集的结果,根据评分函数进行选择,产生最终的插补值;
S22、数据集成:将来自不同数据源的数据合成一个数据集;
S23、数据变换:对数据进行转换计算,转换过程包括区间化、独热编码和归一化。
5.根据权利要求1所述的一种基于AdaBoost算法的公交调度优化方法,其特征在于:S3中构建基于AdaBoost算法的模型,具体步骤如下:
S31、输入训练数据集:
Figure QLYQS_1
其中,
Figure QLYQS_2
,表示每一个样本数据有/>
Figure QLYQS_3
个特征,/>
Figure QLYQS_4
为样本/>
Figure QLYQS_5
的目标数值;
S32、初始化权重,记初始状态下的数据集样本分布为
Figure QLYQS_8
,对每一个样本/>
Figure QLYQS_9
的权重均初始化为/>
Figure QLYQS_12
,则/>
Figure QLYQS_7
,/>
Figure QLYQS_10
分布用于第一个弱分类器/>
Figure QLYQS_11
的训练,/>
Figure QLYQS_13
分布用于第一个弱分类器/>
Figure QLYQS_6
的训练;
S33、循环进行
Figure QLYQS_14
轮迭代,记每一轮迭代中弱分类器的编号为/>
Figure QLYQS_15
,且
Figure QLYQS_16
,以该步骤作为循环体,循环体中的步骤进一步细分为:
S331、在样本分布为
Figure QLYQS_17
的基础上,在数据集/>
Figure QLYQS_18
上训练弱分类器/>
Figure QLYQS_19
S332、计算分类器
Figure QLYQS_20
在训练集/>
Figure QLYQS_21
上的最大误差/>
Figure QLYQS_22
,计算公式为:
Figure QLYQS_23
,/>
Figure QLYQS_24
其中,
Figure QLYQS_25
表示弱分类器/>
Figure QLYQS_26
对样本/>
Figure QLYQS_27
的预测结果,/>
Figure QLYQS_28
表示样本/>
Figure QLYQS_29
的目标值;
S333、根据上面求得的
Figure QLYQS_30
的最大误差/>
Figure QLYQS_31
,采用平方误差计算/>
Figure QLYQS_32
对每个样本的相对误差:
Figure QLYQS_33
,/>
Figure QLYQS_34
S334、根据上一步求得的样本相对误差
Figure QLYQS_35
,计算出当前分类器/>
Figure QLYQS_36
的误差率:
Figure QLYQS_37
即数据集中所有样本的权重与误差之和;
S335、更新当前弱分类器
Figure QLYQS_38
的权重,计算公式为:
Figure QLYQS_39
S336、更新数据样本的权重分布,对于样本
Figure QLYQS_40
,更新权重的计算公式为:
Figure QLYQS_41
S337、令
Figure QLYQS_42
,回到循环体中的S331;
S338、结束
Figure QLYQS_43
轮迭代,最终得到强回归器如下:
Figure QLYQS_44
其中,
Figure QLYQS_45
是所有/>
Figure QLYQS_46
的中位数,即所有弱学习器的加权输出结果的中位数。
CN202310693805.8A 2023-06-13 2023-06-13 一种基于AdaBoost算法的公交调度优化方法 Pending CN116432871A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310693805.8A CN116432871A (zh) 2023-06-13 2023-06-13 一种基于AdaBoost算法的公交调度优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310693805.8A CN116432871A (zh) 2023-06-13 2023-06-13 一种基于AdaBoost算法的公交调度优化方法

Publications (1)

Publication Number Publication Date
CN116432871A true CN116432871A (zh) 2023-07-14

Family

ID=87081915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310693805.8A Pending CN116432871A (zh) 2023-06-13 2023-06-13 一种基于AdaBoost算法的公交调度优化方法

Country Status (1)

Country Link
CN (1) CN116432871A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272484A (ja) * 1989-04-13 1990-11-07 Toshiba Corp バスの運行ダイヤ作成装置
CN102004777A (zh) * 2010-11-19 2011-04-06 中国科学院软件研究所 一种可定制的Web信息集成方法及系统
CN104156983A (zh) * 2014-08-05 2014-11-19 天津大学 一种基于视频图像处理的公交客流统计方法
CN107992895A (zh) * 2017-10-19 2018-05-04 电子科技大学 一种Boosting支持向量机学习方法
CN108563739A (zh) * 2018-04-11 2018-09-21 平安科技(深圳)有限公司 天气数据获取方法及装置、计算机装置及可读存储介质
CN110390349A (zh) * 2019-06-20 2019-10-29 浙江大学 基于XGBoost模型的公交车客流量预测建模方法
CN110570678A (zh) * 2019-10-23 2019-12-13 厦门大学 一种公交车辆从起点到终点总行驶时间预测方法及装置
CN110598082A (zh) * 2019-09-17 2019-12-20 安徽信息工程学院 一种基于pm2.5数据采集预测方法
CN111340289A (zh) * 2020-02-25 2020-06-26 杭州电子科技大学 一种基于遗传算法的公交发车与车速调整优化方法及系统
CN112286924A (zh) * 2020-11-20 2021-01-29 中国水利水电科学研究院 一种数据异常动态识别与多模式自匹配的数据清洗技术
CN113159364A (zh) * 2020-12-30 2021-07-23 中国移动通信集团广东有限公司珠海分公司 一种大型交通场站的客流预测方法及系统
CN113420198A (zh) * 2021-05-27 2021-09-21 江苏大学 一种针对网络商品的专利侵权线索网络爬虫方法
KR20220051991A (ko) * 2020-10-20 2022-04-27 한국건설기술연구원 듀얼밴드 적외선 카메라를 이용한 승차인원 검지 시스템 및 그 방법
WO2022116522A1 (zh) * 2020-12-01 2022-06-09 广州橙行智动汽车科技有限公司 行程融合方法、装置以及车辆
CN115757390A (zh) * 2022-09-29 2023-03-07 南京沅宇科技有限公司 一种智慧工地对不完整数据的修补方法、装置及存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272484A (ja) * 1989-04-13 1990-11-07 Toshiba Corp バスの運行ダイヤ作成装置
CN102004777A (zh) * 2010-11-19 2011-04-06 中国科学院软件研究所 一种可定制的Web信息集成方法及系统
CN104156983A (zh) * 2014-08-05 2014-11-19 天津大学 一种基于视频图像处理的公交客流统计方法
CN107992895A (zh) * 2017-10-19 2018-05-04 电子科技大学 一种Boosting支持向量机学习方法
CN108563739A (zh) * 2018-04-11 2018-09-21 平安科技(深圳)有限公司 天气数据获取方法及装置、计算机装置及可读存储介质
CN110390349A (zh) * 2019-06-20 2019-10-29 浙江大学 基于XGBoost模型的公交车客流量预测建模方法
CN110598082A (zh) * 2019-09-17 2019-12-20 安徽信息工程学院 一种基于pm2.5数据采集预测方法
CN110570678A (zh) * 2019-10-23 2019-12-13 厦门大学 一种公交车辆从起点到终点总行驶时间预测方法及装置
CN111340289A (zh) * 2020-02-25 2020-06-26 杭州电子科技大学 一种基于遗传算法的公交发车与车速调整优化方法及系统
KR20220051991A (ko) * 2020-10-20 2022-04-27 한국건설기술연구원 듀얼밴드 적외선 카메라를 이용한 승차인원 검지 시스템 및 그 방법
CN112286924A (zh) * 2020-11-20 2021-01-29 中国水利水电科学研究院 一种数据异常动态识别与多模式自匹配的数据清洗技术
WO2022116522A1 (zh) * 2020-12-01 2022-06-09 广州橙行智动汽车科技有限公司 行程融合方法、装置以及车辆
CN113159364A (zh) * 2020-12-30 2021-07-23 中国移动通信集团广东有限公司珠海分公司 一种大型交通场站的客流预测方法及系统
CN113420198A (zh) * 2021-05-27 2021-09-21 江苏大学 一种针对网络商品的专利侵权线索网络爬虫方法
CN115757390A (zh) * 2022-09-29 2023-03-07 南京沅宇科技有限公司 一种智慧工地对不完整数据的修补方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赖永炫;张璐;杨帆;卢卫;王田;: "基于时空相关属性模型的公交到站时间预测算法", 软件学报, vol. 31, no. 03, pages 648 - 662 *

Similar Documents

Publication Publication Date Title
CN110570651B (zh) 一种基于深度学习的路网交通态势预测方法及系统
CN109670277B (zh) 一种基于多模态数据融合与多模型集成的旅行时间预测方法
CN110517482B (zh) 一种基于3d卷积神经网络的短时交通流预测方法
Yu et al. A special event-based K-nearest neighbor model for short-term traffic state prediction
CN111653088A (zh) 一种车辆出行量预测模型构建方法及预测方法和系统
Kušić et al. An overview of reinforcement learning methods for variable speed limit control
JP2008123474A (ja) 旅行時間予測装置、旅行時間予測方法、交通情報提供システム及びプログラム
Hunter et al. Large-scale estimation in cyberphysical systems using streaming data: A case study with arterial traffic estimation
CN112071062B (zh) 一种基于图卷积网络和图注意力网络的行车时间估计方法
CN112863182B (zh) 基于迁移学习的跨模态数据预测方法
Kou et al. Multiobjective optimization model of intersection signal timing considering emissions based on field data: A case study of Beijing
CN110163449B (zh) 一种基于主动时空图卷积的机动车排污监测节点部署方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN113469425A (zh) 深度交通拥堵预测方法
CN116307152A (zh) 时空交互式动态图注意力网络的交通预测方法
Zhang et al. Traffic light optimization based on modified Webster function
KR102359902B1 (ko) 빅데이터 및 인공지능 기반 교차로 서비스수준 예측방법, 그리고 이를 포함하는 저장매체
CN117610734A (zh) 基于深度学习的用户行为预测方法、系统和电子设备
Lu et al. Learning Car-Following Behaviors for a Connected Automated Vehicle System: An Improved Sequence-to-Sequence Deep Learning Model
CN116432871A (zh) 一种基于AdaBoost算法的公交调度优化方法
Ye et al. Demand forecasting of online car‐hailing by exhaustively capturing the temporal dependency with TCN and Attention approaches
CN113408786B (zh) 一种交通特征预测方法及系统
Fei et al. Traffic signal control under stochastic traffic demand and vehicle turning via decentralized decomposition approaches
CN114139984A (zh) 基于流量与事故协同感知的城市交通事故风险预测方法
Liu et al. MCT‐TTE: Travel Time Estimation Based on Transformer and Convolution Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination