CN114723275A - 一种面向综合交通系统的客运生成总量分析方法 - Google Patents

一种面向综合交通系统的客运生成总量分析方法 Download PDF

Info

Publication number
CN114723275A
CN114723275A CN202210347620.7A CN202210347620A CN114723275A CN 114723275 A CN114723275 A CN 114723275A CN 202210347620 A CN202210347620 A CN 202210347620A CN 114723275 A CN114723275 A CN 114723275A
Authority
CN
China
Prior art keywords
variable
passenger
passenger transport
urban
attraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210347620.7A
Other languages
English (en)
Inventor
华雪东
付少伟
于维杰
王炜
周凡
赵德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202210347620.7A priority Critical patent/CN114723275A/zh
Publication of CN114723275A publication Critical patent/CN114723275A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种面向综合交通系统的客运生成总量分析方法,包括以下步骤:收集城市统计数据并选取衡量城市经济发展水平、人口规模与结构、资源分布与环境、城市交通便利程度的变量数据以及城市对外客运生成总量;对变量进行相关性分析筛选掉部分变量后建立变量体系;对变量体系中的变量进行多重共线性诊断,若存在多重共线性则需要主成分分析后才能进行多元线性回归,否则直接进行多元线性回归,从而建立相应的多元线性回归模型;将未来城市的变量数据代入建立的模型,获取未来城市对外客运发生量和吸引量。本发明面向综合交通系统,对未来城市的对外客运生成量进行预测,可为未来区域交通系统交通需求预测提供参考。

Description

一种面向综合交通系统的客运生成总量分析方法
技术领域
本发明属于综合交通系统领域,具体涉及一种面向综合交通系统的客运生成总量分析方法。
背景技术
交通运输是国民经济的重要组成部分,对于国民经济的发展有着至关重要的作用,是国民经济发展的基础和命脉。随着我国社会经济的持续发展以及城市化进程的不断加快,我国区域交通运输系统达到了前所未有的水平,已经由单纯依靠某一运输方式转变为依靠各运输方式协调发展的综合交通运输系统。客运生成总量预测是综合交通系统需求分析的首要步骤,其预测结果直接制约后续步骤的分析精度。因此,合理预测客运生成总量是实现综合交通系统优化的基本前提。
目前,客运生成总量预测方面的研究主要集中于探究客运生成的机理及过程。根据历年的统计数据,结合区域的社会经济状况、人口数量、产业结构和资源分布等方面的信息,应用不同的方法构建各类预测模型,大体分为定性预测和定量预测两类。常用的定性预测方法包括运输市场调查法和类推法等,常见的定量预测方法有指数平滑法、回归分析法、组合法等。
现有方法在进行客运生成总量预测时,存在以下两点不足:①仅考虑影响客运量的单一或少量因素,缺乏全面性,致使客运量预测有失偏颇;②部分方法忽略了因素间的多重共线性,出现回归系数不能通过显著性检验的情况。此外,现有研究主要集中于城市交通系统的客运生成总量预测方面,而面向综合交通系统的研究体系不健全且研究成果存在局限性,无法对现阶段的综合交通系统客运生成总量进行准确预测。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出一种面向综合交通系统的客运生成总量分析方法,精准预测综合交通系统的客运生成总量。
为了实现上述技术目的,本发明的技术方案为:
一种面向综合交通系统的客运生成总量分析方法,包括以下步骤:
(1)数据收集:收集若干年的城市统计数据,包括城市人口、资源环境、经济发展、科技创新、人民生活、公共服务、基础设施及城市对外客运生成总量八个数据集,其中所述城市对外客运生成总量包括客运发生量和客运吸引量;
(2)变量选取:从步骤(1)的数据集中选取客运发生量、客运吸引量作为因变量;分别选取衡量城市经济发展水平、城市人口规模及结构、城市资源分布与环境、城市交通便利程度的自变量;
(3)变量相关性分析:计算每一个自变量与客运发生量、客运吸引量的相关系数,根据相关系数判断各自变量对客运发生量、客运吸引量的相关程度;
(4)建立变量体系:根据步骤(3)得到的相关系数,保留与客运发生量的相关系数大于0.6的自变量,建立客运发生量的变量体系;保留与客运吸引量的相关系数大于0.6的自变量,建立客运吸引量的变量体系;
(5)多重共线性诊断:计算客运发生量的变量体系中各自变量的方差膨胀系数
Figure BDA00035774885000000210
若存在
Figure BDA00035774885000000211
表示客运发生量的自变量之间存在多重共线性,移至步骤(6)进行主成分分析并进入步骤(7)建立多元线性回归模型;否则,移至步骤(7)建立多元线性回归模型;同理计算客运吸引量的变量体系中各自变量的方差膨胀系数
Figure BDA00035774885000000212
并判断客运吸引量的自变量之间是否存在多重共线性;
(6)主成分分析:分别对步骤(4)得到的客运发生量、客运吸引量的变量体系进行主成分分析;
(7)建立多元线性回归模型:若步骤(4)计算的方差膨胀系数满足
Figure BDA0003577488500000021
Figure BDA0003577488500000022
使用最小二乘法将主成分
Figure BDA0003577488500000023
分别与客运发生量、客运吸引量的标准化值Y1,Y2进行多元线性回归分析,得到多元线性回归模型
Figure BDA0003577488500000024
其中
Figure BDA0003577488500000025
为第r个主成分
Figure BDA0003577488500000026
的标准化偏回归系数,m1为客运发生量主成分个数,m2为客运吸引量的主成分个数,把各主成分的回归系数还原成关于原自变量的回归系数,并将标准化后的数据进行还原,得到关于原始数据的多元线性回归模型;若步骤(4)计算的方差膨胀系数满足
Figure BDA0003577488500000027
使用最小二乘法将标准化的自变量矩阵X1,X2分别与客运发生量、客运吸引量的标准化值Y1,Y2进行多元线性回归,得到多元线性回归模型
Figure BDA0003577488500000028
其中
Figure BDA0003577488500000029
为第j个自变量
Figure BDA0003577488500000031
的偏回归系数,p1为客运发生量变量体系中的变量数,p2为客运吸引量变量体系中的变量数,并将标准化后的数据进行还原,得到关于原始数据的多元线性回归模型;
(8)预测未来客运生成量:将未来年的自变量数据代入步骤(7)构建的多元线性回归模型,即能够对未来年的城市对外客运发生量、客运吸引量进行预测。
优选地,所述步骤(7)还包括模型检验步骤,具体为:对线性关系采用F检验,当计算的F值大于临界值时,说明回归效果显著,该回归模型较为合理;对回归系数采用t检验,当计算的t值大于临界值时,说明各个主成分或自变量的偏回归系数是显著的。
优选地,所述衡量城市经济发展水平具体包括:城市生产总值、人均城市生产总值、在岗职工平均工资、机动车保有量;所述衡量城市人口规模及结构具体包括:城市总人口、人口密度;所述衡量城市资源分布与环境具体包括:土地面积、公园绿地面积、城市道路面积;所述衡量城市交通便利程度具体包括:高速公路总里程、铁路营业线路里程、客运枢纽场站数。
优选地,所述步骤(5)中,方差膨胀系数VIFj的计算公式如式(1)所示:
Figure BDA0003577488500000032
其中,
Figure BDA0003577488500000033
为第j个自变量在所有其他自变量上回归时的判定系数。
优选地,所述步骤(6)主成分分析具体包括:
(61)对客运发生量变量体系中的自变量进行数据标准化处理;计算公式如式(2)所示:
Figure BDA0003577488500000034
式中,
Figure BDA0003577488500000035
为客运发生量中第i个样本中的第j个变量的标准化值,
Figure BDA0003577488500000036
为客运发生量中第i个样本中的第j个变量的观测值,
Figure BDA0003577488500000037
Figure BDA0003577488500000038
分别表示客运发生量变量体系中第j个变量的样本均值和方差,i=1,2,3,...,N1,j=1,2,3,...,p1,N1为客运发生量的样本数,p1为客运发生量变量体系中的变量数;
(62)对客运吸引量变量体系中的自变量进行数据标准化处理;计算公式如式(3)所示:
Figure BDA0003577488500000041
式中,
Figure BDA0003577488500000042
为客运吸引量中第i个样本中的第j个变量的标准化值,
Figure BDA0003577488500000043
为客运吸引量中第i个样本中的第j个变量的观测值,
Figure BDA0003577488500000044
Figure BDA0003577488500000045
分别表示客运吸引量变量体系中第j个变量的样本均值和方差,i=1,2,3,...,N2,j=1,2,3,...,p2,N2为客运吸引量的样本数,p2为客运吸引量变量体系中的变量数;
(63)将标准化后的
Figure BDA0003577488500000046
构建成标准化矩阵X1,X2
Figure BDA0003577488500000047
Figure BDA0003577488500000048
根据标准化矩阵X1、X2计算出相关系数矩阵R1、R2,对相关系数矩阵R1、R2分别进行特征分解,计算出特征值
Figure BDA0003577488500000049
与特征向量
Figure BDA00035774885000000410
(64)将特征值
Figure BDA00035774885000000411
由大到小排列,依次计算贡献率
Figure BDA00035774885000000412
Figure BDA00035774885000000413
选取贡献率排在前m1,m2,的变量使得累计贡献率达到90%,m1≤p1,m2≤p2,并计算累计贡献率
Figure BDA00035774885000000414
用主成分
Figure BDA00035774885000000415
代替
Figure BDA00035774885000000416
Figure BDA00035774885000000417
用主成分
Figure BDA00035774885000000418
代替
Figure BDA00035774885000000419
Figure BDA00035774885000000420
优选地,所述步骤(7)中F值和t值的计算公式如式(4)和式(5)所示:
Figure BDA0003577488500000051
Figure BDA0003577488500000052
其中tj代表第j个变量的偏回归系数的t值;k为自变量个数,n为样本数,SSR为回归平方和,SSE为残差平方和,
Figure BDA0003577488500000053
为偏回归系数βj的抽样分布的标准差;检验时选取显著性水平α=0.05,在F分布表中查出第一自由度为k,第二自由度为n-k-1的临界值Fα(k,n-k-1),在t分布表中查出自由度为n-k-1的临界值tα(n-k-1)。
采用上述技术方案带来的有益效果:
与现有的综合交通系统的客运需求预测方法相比,本发明具有以下明显优势:首先,综合考虑了综合交通系统客运生成总量的多重影响变量,并通过相关性分析构建综合交通系统客运生成总量的变量体系;其次,采用主成分分析方法降低影响变量间的多重共线性,提高区域综合交通系统客运生成总量的预测精度。
附图说明
图1是本发明面向综合交通系统的客运生成总量分析方法流程图;
图2是本发明中综合交通系统客运发生量的变量体系图;
图3是本发明中综合交通系统客运吸引量的变量体系图;
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
发明介绍了一种面向综合交通系统的客运生成总量分析方法,实现了对未来城市的对外客运生成总量预测。下面结合实例和附图对本发明的技术方案作进一步详细说明。
本发明以北京市为例,对其面向综合交通系统的客运生成总量进行分析。首先,通过查阅中国国家统计年鉴以及北京市交通发展年度报告获取因变量数据与自变量测量指标数据。基于实例数据,建立相关变量体系,并对变量进行多重共线性诊断,进而建立面向综合交通系统的客运生成量多元线性回归预测模型,并对模型进行检验。通过将未来城市的具体变量数据代入预测模型,得到未来该城市对应的客运生成总量,方法流程见附图1,主要包括以下八个阶段:
(1)数据收集及变量选取:
(11)数据收集
查阅中国国家统计年鉴以及北京市交通发展年度报告,获取2009年至2019年北京市的客运交通生成总量,包括客运生成量和客运吸引量数据。同时,对自变量数据进行采集,包括城市人口、资源环境、经济发展、科技创新、人民生活、公共服务、基础设施及城市对外客运生成总量(客运发生量、客运吸引量)八个数据集。
(12)变量选取
选取客运发生量(万人)、客运吸引量(万人)作为因变量,如表1所示;选取衡量城市经济发展水平、城市人口规模及结构、城市资源分布与环境、城市交通便利程度的变量作为自变量,如表2所示:
表1 北京市历年客运生成总量数据表
年份 客运发生量(万人) 客运吸引量(万人)
2009 24318 24747
2010 23240 23315
2011 24891 24954
2012 25917 26232
2013 27439 27638
2014 29267 29517
2015 29368 29322
2016 30281 30340
2017 29525 29441
2018 30599 30408
2019 31320 31516
表2 模型自变量
Figure BDA0003577488500000071
(2)变量相关性分析:计算每一个自变量与客运发生量、客运吸引量的相关系数,根据相关系数判断各自变量与客运发生量、客运吸引量的相关程度,由于本案例中土地面积为常量故其与客运生成量和客运吸引量间的相关系数为0,计算的相关系数如表3所示:
表3 相关系数表
Figure BDA0003577488500000072
Figure BDA0003577488500000081
(3)建立变量体系:根据求出的相关系数矩阵,保留与客运发生量的相关系数大于0.6的自变量,建立客运发生量的变量体系,如图2所示。包括城市生产总值
Figure BDA0003577488500000082
人均城市生产总值
Figure BDA0003577488500000083
在岗职工平均工资
Figure BDA0003577488500000084
机动车保有量
Figure BDA0003577488500000085
城市总人口
Figure BDA0003577488500000086
人口密度
Figure BDA0003577488500000087
公园绿地面积
Figure BDA0003577488500000088
城市道路面积
Figure BDA0003577488500000089
高速公路总里程
Figure BDA00035774885000000810
铁路营业线路里程
Figure BDA00035774885000000811
保留与客运吸引量的相关系数大于0.6的自变量,建立客运吸引量的变量体系,如图3所示。包括城市生产总值
Figure BDA00035774885000000812
人均城市生产总值
Figure BDA00035774885000000813
在岗职工平均工资
Figure BDA00035774885000000814
机动车保有量
Figure BDA00035774885000000815
城市总人口
Figure BDA00035774885000000816
人口密度
Figure BDA00035774885000000817
公园绿地面积
Figure BDA00035774885000000818
城市道路面积
Figure BDA00035774885000000819
高速公路总里程
Figure BDA00035774885000000820
铁路营业线路里程
Figure BDA00035774885000000821
(4)多重共线性诊断:计算客运发生量的变量体系各自变量的方差膨胀系数
Figure BDA00035774885000000822
各自变量的
Figure BDA00035774885000000823
值都大于10,客运发生量的自变量之间存在多重共线性,需要进行主成分分析;计算客运吸引量的变量体系各自变量的方差膨胀系数
Figure BDA00035774885000000824
各自变量的
Figure BDA00035774885000000825
值都大于10,客运吸引量的自变量之间存在多重共线性,同样也需要进行主成分分析;
(5)主成分分析:对客运发生量变量体系进行主成分分析,对客运发生量变量体系中的自变量进行数据标准化处理,并构建成标准化矩阵
Figure BDA0003577488500000091
根据标准化矩阵进而计算出相关系数矩阵,并对其特征分解得到相应的特征值和特征向量。将特征值由大到小排列,依次计算其贡献率和累计贡献率。其中前2个特征值的累计方差贡献率已经达到95.162%。因此,选取前2个主成分,其表达式为:
Figure BDA0003577488500000092
Figure BDA0003577488500000093
同理对客运吸引量变量体系进行主成分分析,本案例中客运吸引量的变量体系和客运发生量的变量体系一致,其主成分表达式与客运发生量的主成分表达式相同:
Figure BDA0003577488500000094
Figure BDA0003577488500000095
(6)建立多元线性回归模型:将主成分
Figure BDA0003577488500000096
与客运发生量的标准化值Y1进行多元回归分析,得到的主成分回归方程如下:
Figure BDA0003577488500000097
把各主成分的回归系数还原成关于原自变量的回归系数,将其转化为关于标准化变量的标准化回归方程:
Figure BDA0003577488500000098
并将标准化后的数据进行还原,得到关于原始数据的多元线性回归模型:
Figure BDA0003577488500000099
将主成分
Figure BDA00035774885000000910
与客运吸引量的标准化值Y2进行多元回归分析,得到的主成分回归方程如下:
Figure BDA00035774885000000911
把各主成分的回归系数还原成关于原自变量的回归系数,将其转化为关于标准化变量的标准化回归方程:
Figure BDA0003577488500000101
并将标准化后的数据进行还原,得到关于原始数据的多元线性回归模型:
Figure BDA0003577488500000102
(7)模型检验:包括线性关系检验和回归系数检验两个步骤:
(71)线性关系检验:对步骤(6)中建立的主成分回归模型进行F检验,分别计算F值。取显著性水平α=0.05,临界值F0.05(2,8)=5.32,对于客运发生量的主成分回归模型,F1=33.244,大于临界值,说明回归效果显著,该回归模型较为合理;对于客运吸引量的主成分回归模型,F2=27.697,大于临界值,说明回归效果显著,该回归模型较为合理。
(72)回归系数检验:对步骤(6)中建立的主成分回归模型进行t检验,分别计算各自变量t值。取显著性水平α=0.05,临界值t0.05(8)=1.943。对于客运发生量的主成分回归模型,
Figure BDA0003577488500000103
均大于临界值,说明回归系数在统计结果上是显著的;对于客运吸引量的主成分回归模型,
Figure BDA0003577488500000104
Figure BDA0003577488500000105
均大于临界值,说明回归系数在统计结果上是显著的。
(8)预测未来客运生成量:将未来年的自变量数据代入步骤(6)构建的多元线性回归模型,即可对未来年的城市对外客运发生量、客运吸引量进行预测。
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (6)

1.一种面向综合交通系统的客运生成总量分析方法,其特征在于,包括以下步骤:
(1)数据收集:收集若干年的城市统计数据,包括城市人口、资源环境、经济发展、科技创新、人民生活、公共服务、基础设施及城市对外客运生成总量八个数据集,其中所述城市对外客运生成总量包括客运发生量和客运吸引量;
(2)变量选取:从步骤(1)的数据集中选取客运发生量、客运吸引量作为因变量;分别选取衡量城市经济发展水平、城市人口规模及结构、城市资源分布与环境、城市交通便利程度的自变量;
(3)变量相关性分析:计算每一个自变量与客运发生量、客运吸引量的相关系数,根据相关系数判断各自变量对客运发生量、客运吸引量的相关程度;
(4)建立变量体系:根据步骤(3)得到的相关系数,保留与客运发生量的相关系数大于0.6的自变量,建立客运发生量的变量体系;保留与客运吸引量的相关系数大于0.6的自变量,建立客运吸引量的变量体系;
(5)多重共线性诊断:计算客运发生量的变量体系中各自变量的方差膨胀系数
Figure FDA0003577488490000011
若存在
Figure FDA0003577488490000012
表示客运发生量的自变量之间存在多重共线性,移至步骤(6)进行主成分分析并进入步骤(7)建立多元线性回归模型;否则,移至步骤(7)建立多元线性回归模型;同理计算客运吸引量的变量体系中各自变量的方差膨胀系数
Figure FDA0003577488490000013
并判断客运吸引量的自变量之间是否存在多重共线性;
(6)主成分分析:分别对步骤(4)得到的客运发生量、客运吸引量的变量体系进行主成分分析;
(7)建立多元线性回归模型:若步骤(4)计算的方差膨胀系数满足
Figure FDA0003577488490000014
使用最小二乘法将主成分
Figure FDA0003577488490000015
分别与客运发生量、客运吸引量的标准化值Y1,Y2进行多元线性回归分析,得到多元线性回归模型
Figure FDA0003577488490000021
其中
Figure FDA0003577488490000022
为第r个主成分
Figure FDA0003577488490000023
的标准化偏回归系数,m1为客运发生量主成分个数,m2为客运吸引量的主成分个数,把各主成分的回归系数还原成关于原自变量的回归系数,并将标准化后的数据进行还原,得到关于原始数据的多元线性回归模型;若步骤(4)计算的方差膨胀系数满足
Figure FDA0003577488490000024
使用最小二乘法将标准化的自变量矩阵X1,X2分别与客运发生量、客运吸引量的标准化值Y1,Y2进行多元线性回归,得到多元线性回归模型
Figure FDA0003577488490000025
Figure FDA0003577488490000026
其中
Figure FDA0003577488490000027
为第j个自变量
Figure FDA0003577488490000028
的偏回归系数,p1为客运发生量变量体系中的变量数,p2为客运吸引量变量体系中的变量数,并将标准化后的数据进行还原,得到关于原始数据的多元线性回归模型;
(8)预测未来客运生成量:将未来年的自变量数据代入步骤(7)构建的多元线性回归模型,即能够对未来年的城市对外客运发生量、客运吸引量进行预测。
2.根据权利要求1所述一种面向综合交通系统的客运生成总量分析方法,其特征在于,所述步骤(7)还包括模型检验步骤,具体为:对线性关系采用F检验,当计算的F值大于临界值时,说明回归效果显著,该回归模型较为合理;对回归系数采用t检验,当计算的t值大于临界值时,说明各个主成分或自变量的偏回归系数是显著的。
3.根据权利要求1所述一种面向综合交通系统的客运生成总量分析方法,其特征在于,所述衡量城市经济发展水平具体包括:城市生产总值、人均城市生产总值、在岗职工平均工资、机动车保有量;所述衡量城市人口规模及结构具体包括:城市总人口、人口密度;所述衡量城市资源分布与环境具体包括:土地面积、公园绿地面积、城市道路面积;所述衡量城市交通便利程度具体包括:高速公路总里程、铁路营业线路里程、客运枢纽场站数。
4.根据权利要求1所述一种面向综合交通系统的客运生成总量分析方法,其特征在于,所述步骤(5)中,方差膨胀系数VIFj的计算公式如式(1)所示:
Figure FDA0003577488490000031
其中,
Figure FDA0003577488490000032
为第j个自变量在所有其他自变量上回归时的判定系数。
5.根据权利要求1所述一种面向综合交通系统的客运生成总量分析方法,其特征在于,所述步骤(6)主成分分析具体包括:
(61)对客运发生量变量体系中的自变量进行数据标准化处理;计算公式如式(2)所示:
Figure FDA0003577488490000033
式中,
Figure FDA0003577488490000034
为客运发生量中第i个样本中的第j个变量的标准化值,
Figure FDA0003577488490000035
为客运发生量中第i个样本中的第j个变量的观测值,
Figure FDA0003577488490000036
Figure FDA0003577488490000037
分别表示客运发生量变量体系中第j个变量的样本均值和方差,i=1,2,3,...,N1,j=1,2,3,...,p1,N1为客运发生量的样本数,p1为客运发生量变量体系中的变量数;
(62)对客运吸引量变量体系中的自变量进行数据标准化处理;计算公式如式(3)所示:
Figure FDA0003577488490000038
式中,
Figure FDA0003577488490000039
为客运吸引量中第i个样本中的第j个变量的标准化值,
Figure FDA00035774884900000310
为客运吸引量中第i个样本中的第j个变量的观测值,
Figure FDA00035774884900000311
Figure FDA00035774884900000312
分别表示客运吸引量变量体系中第j个变量的样本均值和方差,i=1,2,3,...,N2,j=1,2,3,...,p2,N2为客运吸引量的样本数,p2为客运吸引量变量体系中的变量数;
(63)将标准化后的
Figure FDA0003577488490000041
构建成标准化矩阵X1,X2
Figure FDA0003577488490000042
Figure FDA0003577488490000043
Figure FDA00035774884900000420
根据标准化矩阵X1、X2计算出相关系数矩阵R1、R2,对相关系数矩阵R1、R2分别进行特征分解,计算出特征值
Figure FDA0003577488490000044
与特征向量
Figure FDA0003577488490000045
(64)将特征值
Figure FDA0003577488490000046
由大到小排列,依次计算贡献率
Figure FDA0003577488490000047
Figure FDA0003577488490000048
选取贡献率排在前m1,m2,的变量使得累计贡献率达到90%,m1≤p1,m2≤p2,并计算累计贡献率
Figure FDA0003577488490000049
Figure FDA00035774884900000410
用主成分
Figure FDA00035774884900000411
代替
Figure FDA00035774884900000412
Figure FDA00035774884900000413
用主成分
Figure FDA00035774884900000414
代替
Figure FDA00035774884900000415
Figure FDA00035774884900000416
6.根据权利要求2所述一种面向综合交通系统的客运生成总量分析方法,其特征在于,所述步骤(7)中F值和t值的计算公式如式(4)和式(5)所示:
Figure FDA00035774884900000417
Figure FDA00035774884900000418
式中,tj代表第j个变量的偏回归系数的t值;k为自变量个数,n为样本数,SSR为回归平方和,SSE为残差平方和,
Figure FDA00035774884900000419
为偏回归系数βj的抽样分布的标准差;检验时选取显著性水平α=0.05,在F分布表中查出第一自由度为k,第二自由度为n-k-1的临界值Fα(k,n-k-1),在t分布表中查出自由度为n-k-1的临界值tα(n-k-1)。
CN202210347620.7A 2022-04-01 2022-04-01 一种面向综合交通系统的客运生成总量分析方法 Pending CN114723275A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210347620.7A CN114723275A (zh) 2022-04-01 2022-04-01 一种面向综合交通系统的客运生成总量分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210347620.7A CN114723275A (zh) 2022-04-01 2022-04-01 一种面向综合交通系统的客运生成总量分析方法

Publications (1)

Publication Number Publication Date
CN114723275A true CN114723275A (zh) 2022-07-08

Family

ID=82241157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210347620.7A Pending CN114723275A (zh) 2022-04-01 2022-04-01 一种面向综合交通系统的客运生成总量分析方法

Country Status (1)

Country Link
CN (1) CN114723275A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227737A (zh) * 2023-05-04 2023-06-06 中铁第四勘察设计院集团有限公司 基于迭代优化模型的区域客运量预测方法、系统及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227737A (zh) * 2023-05-04 2023-06-06 中铁第四勘察设计院集团有限公司 基于迭代优化模型的区域客运量预测方法、系统及设备
CN116227737B (zh) * 2023-05-04 2023-08-18 中铁第四勘察设计院集团有限公司 基于迭代优化模型的区域客运量预测方法、系统及设备

Similar Documents

Publication Publication Date Title
CN109299438B (zh) 一种基于网约车数据的公共交通设施供给水平评价方法
CN101853290A (zh) 基于地理信息系统的气象服务效益评估方法
CN107766981A (zh) 基于站点WiFi的公交客流OD估计及短时预测方法
CN113112090B (zh) 基于综合互信息度的主成分分析的空间负荷预测方法
CN110866775A (zh) 一种基于机器学习的用户空铁联程城际出行信息处理方法
CN113887908A (zh) 考虑主客观交叉融合权重的桥梁风险评估方法
CN110889092A (zh) 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法
CN111582738B (zh) 一种区域机场群的航空客流需求预测方法
CN114723275A (zh) 一种面向综合交通系统的客运生成总量分析方法
CN111222703B (zh) 一种预测旅客出行方式的方法及装置
Zhu et al. Calibrating travel time thresholds with cluster analysis and AFC data for passenger reasonable route generation on an urban rail transit network
CN111626582A (zh) 一种城市交通出行问题热点分级方法及装置
Jung et al. Assessment of the transit ridership prediction errors using AVL/APC data
CN107316096A (zh) 一种轨道交通一票通乘客进站量预测方法
CN112580951B (zh) 基于乘客出行的城市地面公交运行监测关键指标筛选方法
CN116452154B (zh) 一种适用于通信运营商的项目管理系统
CN112102613A (zh) 一种高速公路客货运输量预测方法及系统
CN111640294A (zh) 一种新建地铁线路影响下城市公交线路客流变化预测方法
Wen et al. Visualizing train delays using tableau and the framework of a delay impact visualization system
CN115115233A (zh) 一种公交与地铁之间换乘服务水平确定方法
CN113570250B (zh) 变压器测温装置全生命周期多目标综合评价方法
CN114626692A (zh) 镇村规模结构优化方法、系统、计算机设备和存储介质
CN112365041A (zh) 基于系统动力学的城市电动汽车保有量的分类预测方法
CN111967111A (zh) 一种基于复合变量指标的多维度轨道线网规模预测方法
CN116258389B (zh) 一种钢筋混凝土管片生产阶段碳排放评价方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination