CN110941651A - 一种基于不完备人口信息的交通模式选择分析方法 - Google Patents
一种基于不完备人口信息的交通模式选择分析方法 Download PDFInfo
- Publication number
- CN110941651A CN110941651A CN201911165903.4A CN201911165903A CN110941651A CN 110941651 A CN110941651 A CN 110941651A CN 201911165903 A CN201911165903 A CN 201911165903A CN 110941651 A CN110941651 A CN 110941651A
- Authority
- CN
- China
- Prior art keywords
- data
- population
- model
- bayesian network
- missing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 10
- 238000009826 distribution Methods 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims description 5
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Fuzzy Systems (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于不完备人口信息的交通模式选择分析方法。通过贝叶斯网络模型建立人口属性特征的联合分布,针对人口调查资料部分不完全、存在缺失问题,在交通模式选择建模中,通过部分人口属性数据推理出其他缺失属性的后验分布,使在不完备人口数据的情况下建立的交通选择模型可获得良好的解释结果。本发明在人口属性数据不足或缺失时,通过贝叶斯网络对多个人口属性特征进行联合建模,得到缺失数据的概率分布,进而使交通模式选择模型获得更好的估计和解释结果。
Description
技术领域
本发明涉及交通模式选择分析领域,特别是涉及一种基于不完备人口信息的交通模式选择分析方法。
背景技术
使用代理人基模型(Agent-Based Model,ABM)城市交通和土地利用微观模拟模型的发展极大地促进了城市建设与发展。但这些微观模拟模型需要一个完整的代理人列表,其中包含个人和家庭层面的详细人口和社会经济信息。然而,使用这样一个详细和分类的数据集是高度敏感的,大多数政府机构并没有公布完整的数据,而是以1%到10%的比率从全体人口中抽取一个子集,用于城市模型建立。因此需要捕捉人口属性数据间的关联关系,为选择模型建模提供更完备的数据。
发明内容
为了解决上述存在的问题,本发明提供一种基于不完备人口信息的交通模式选择分析方法,通过贝叶斯网络模型建立人口属性特征的联合分布,针对人口调查资料部分不完全、存在缺失问题,在交通模式选择建模中,通过部分人口属性数据推理出其他缺失属性的后验分布,使在不完备人口数据的情况下建立的交通选择模型可获得良好的解释结果。本发明在人口属性数据不足或缺失时,通过贝叶斯网络对多个人口属性特征进行联合建模,得到缺失数据的概率分布,进而使交通模式选择模型获得更好的估计和解释结果,为达此目的,本发明提供一种基于不完备人口信息的交通模式选择分析方法,包括以下步骤,其特征在于:
步骤一,对城市居民人口信息的多项属性如性别、年龄、收入、受教育程度、工作类型、拥有私家车数量、是否有驾照等建立联合分布,使用贝叶斯网络模型表示各个属性间的相关关系,并生成试验数据集;
步骤二,假定生成的试验人口数据依照一定的选择模型进行出行的交通方式选择,生成其交通模式选择数据;
步骤三,随机删除人口信息数据的部分属性,形成缺失数据集;
步骤四,使用贝叶斯网络模型通过已知的部分属性数据,推理出缺失部分数据的后验概率分布;
步骤五,使用贝叶斯网络和交通模式选择模型对数据联合建模,获得选择模型的估计结果。
本发明的进一步改进,所述步骤1)中模型建立的特征包括:
对各属性数据进行离散化处理,将不受其他因素影响的属性如性别、年龄设置为所建立贝叶斯网络的根节点,各个节点表示模型选取的变量,有向连接线段表示变量之间的条件概率关系,该贝叶斯网络模型将为本方法后续提供试验数据集。
本发明的进一步改进,所述步骤4)中数据推理的特征包括:
贝叶斯网络用条件概率表达各个信息要素之间的相关关系,随机对一个或多个属性数据进行删除,对剩余的部分数据使用贝叶斯网络模型对已缺失的数据集进行推断,获取其后验概率分布。
本发明的进一步改进,所述步骤5)中联合建模的特征包括:
在获得了缺失部分属性数据的后验分布后,对数据再进行模式选择建模,比较不同数据缺失情况、程度下选择模型的估计结果。
本发明提出的一种不完备人口数据下的交通模式选择分析方法,与现有技术相比有点如下:
现有研究中人口数据的合成是通过克隆或复制获得而不是真正的合成来创建的,因此,合成数据的质量在很大程度上取决于可用小样本的准确性和数量。贝叶斯网络作为识别随机变量之间因果关系和依赖关系的另一种建模范式,是一种很有前途的数据驱动框架,它将复杂的关系抽象为一个简单的图形模型,将复杂的相互依赖模式转换为一个简洁紧凑的结构。贝叶斯网络具有强大的不确定性问题处理能力,在部分属性数据缺失的情况下仍能进行学习和推理。本发明克服了前人模型中的缺陷,将机器学习的方法与交通选择模型相结合,通过部分数据推理出缺失数据的后验分布,为更加优化了交通选择建模的估计结果。
附图说明
图1为本发明的技术路线流程图;
图2为本发明中使用的贝叶斯网络模型结构示意图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明提供一种基于不完备人口信息的交通模式选择分析方法,通过贝叶斯网络模型建立人口属性特征的联合分布,针对人口调查资料部分不完全、存在缺失问题,在交通模式选择建模中,通过部分人口属性数据推理出其他缺失属性的后验分布,使在不完备人口数据的情况下建立的交通选择模型可获得良好的解释结果。本发明在人口属性数据不足或缺失时,通过贝叶斯网络对多个人口属性特征进行联合建模,得到缺失数据的概率分布,进而使交通模式选择模型获得更好的估计和解释结果。
图1为本发明的技术路线流程图。下面结合流程图对本发明的步骤作详细介绍。
1)对城市居民人口信息的多项属性如性别、年龄、收入、受教育程度、工作类型、拥有私家车数量、是否有驾照等建立联合分布,使用贝叶斯网络模型表示各个属性间的相关关系。
一组变量的贝叶斯网络由两部分组成:(1)定性部分是一个有向无环图(DAG)形式的网络结构G,其中节点与随机变量X成一对一的映射关系,连接表示变量之间的依赖关系;(2)定量部分是一组局部概率分布或表θ。每个节点在给定其父节点的情况下其后验概率为:我们应用禁忌搜索算法,学习贝叶斯网络的结构,在寻找最佳结构时,我们选择AIC作为得分函数。并采用极大似然估计法对其模型参数进行学习。
使用得到的贝叶斯网络模型生成若干人口作为后续试验的数据集。
2)假定生成的试验人口数据依照一定的选择模型进行出行的交通方式选择,生成其交通模式选择数据。
3)随机删除人口信息数据的部分属性,形成缺失数据集。
将模型中提到的人口属性数据进行随机删除,删除操作分为对一个至多个属性数据的完全删除,与对数据按比例进行部分删除,由此形成多个缺失数据集。
4)使用贝叶斯网络模型通过已知的部分属性数据,推理出缺失部分数据的后验概率分布。给定已知变量的数据,可计算推理出缺失变量的后验概率分布,能有效地按信息的相关关系进行融合。
5)使用贝叶斯网络和交通模式选择模型对数据联合建模,获得选择模型的估计结果。交通模式选择的影响因素均为非连续数据,且并不是互不相关的,因此采用混合Logit模型进行建模。第n个个体选择第i种交通出行方式的概率为:
通过对不同缺失数据的试验,估计结果表明,本发明提出的模型方法能使交通选择模型获得更好的解释与估计结果。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (4)
1.一种基于不完备人口信息的交通模式选择分析方法,包括以下步骤,其特征在于:
步骤一,对城市居民人口信息的多项属性如性别、年龄、收入、受教育程度、工作类型、拥有私家车数量、是否有驾照等建立联合分布,使用贝叶斯网络模型表示各个属性间的相关关系,并生成试验数据集;
步骤二,假定生成的试验人口数据依照一定的选择模型进行出行的交通方式选择,生成其交通模式选择数据;
步骤三,随机删除人口信息数据的部分属性,形成缺失数据集;
步骤四,使用贝叶斯网络模型通过已知的部分属性数据,推理出缺失部分数据的后验概率分布;
步骤五,使用贝叶斯网络和交通模式选择模型对数据联合建模,获得选择模型的估计结果。
2.根据权利要求1所述的一种基于不完备人口信息的交通模式选择分析方法,其特征在于:所述步骤1)中模型建立的特征包括:
对各属性数据进行离散化处理,将不受其他因素影响的属性如性别、年龄设置为所建立贝叶斯网络的根节点,各个节点表示模型选取的变量,有向连接线段表示变量之间的条件概率关系,该贝叶斯网络模型将为本方法后续提供试验数据集。
3.根据权利要求1所述的一种基于不完备人口信息的交通模式选择分析方法,其特征在于:所述步骤4)中数据推理的特征包括:
贝叶斯网络用条件概率表达各个信息要素之间的相关关系,随机对一个或多个属性数据进行删除,对剩余的部分数据使用贝叶斯网络模型对已缺失的数据集进行推断,获取其后验概率分布。
4.根据权利要求1所述的一种基于不完备人口信息的交通模式选择分析方法,其特征在于:所述步骤5)中联合建模的特征包括:
在获得了缺失部分属性数据的后验分布后,对数据再进行模式选择建模,比较不同数据缺失情况、程度下选择模型的估计结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911165903.4A CN110941651B (zh) | 2019-11-25 | 2019-11-25 | 一种基于不完备人口信息的交通模式选择分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911165903.4A CN110941651B (zh) | 2019-11-25 | 2019-11-25 | 一种基于不完备人口信息的交通模式选择分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110941651A true CN110941651A (zh) | 2020-03-31 |
CN110941651B CN110941651B (zh) | 2020-06-26 |
Family
ID=69907478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911165903.4A Active CN110941651B (zh) | 2019-11-25 | 2019-11-25 | 一种基于不完备人口信息的交通模式选择分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110941651B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102436740A (zh) * | 2011-09-29 | 2012-05-02 | 东南大学 | 一种高速公路交通事件自动检测方法 |
US20130148513A1 (en) * | 2011-12-08 | 2013-06-13 | Telefonaktiebolaget Lm | Creating packet traffic clustering models for profiling packet flows |
CN103366566A (zh) * | 2013-06-25 | 2013-10-23 | 中国科学院信息工程研究所 | 一种针对特定车辆潜在群体的行驶轨迹预测方法 |
CN103699698A (zh) * | 2014-01-16 | 2014-04-02 | 北京泰乐德信息技术有限公司 | 一种基于改进贝叶斯的轨道交通故障识别方法及系统 |
CN104008647A (zh) * | 2014-06-12 | 2014-08-27 | 北京航空航天大学 | 一种基于机动车行驶模式的道路交通能耗量化方法 |
CN104751631A (zh) * | 2015-03-13 | 2015-07-01 | 同济大学 | 基于gps定位和模糊理论判断出行链交通方式的方法 |
US9424745B1 (en) * | 2013-11-11 | 2016-08-23 | Emc Corporation | Predicting traffic patterns |
CN110414833A (zh) * | 2019-07-26 | 2019-11-05 | 东南大学 | 一种城市多模式交通网络运能协调评价方法 |
-
2019
- 2019-11-25 CN CN201911165903.4A patent/CN110941651B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102436740A (zh) * | 2011-09-29 | 2012-05-02 | 东南大学 | 一种高速公路交通事件自动检测方法 |
US20130148513A1 (en) * | 2011-12-08 | 2013-06-13 | Telefonaktiebolaget Lm | Creating packet traffic clustering models for profiling packet flows |
CN103366566A (zh) * | 2013-06-25 | 2013-10-23 | 中国科学院信息工程研究所 | 一种针对特定车辆潜在群体的行驶轨迹预测方法 |
US9424745B1 (en) * | 2013-11-11 | 2016-08-23 | Emc Corporation | Predicting traffic patterns |
CN103699698A (zh) * | 2014-01-16 | 2014-04-02 | 北京泰乐德信息技术有限公司 | 一种基于改进贝叶斯的轨道交通故障识别方法及系统 |
CN104008647A (zh) * | 2014-06-12 | 2014-08-27 | 北京航空航天大学 | 一种基于机动车行驶模式的道路交通能耗量化方法 |
CN104751631A (zh) * | 2015-03-13 | 2015-07-01 | 同济大学 | 基于gps定位和模糊理论判断出行链交通方式的方法 |
CN110414833A (zh) * | 2019-07-26 | 2019-11-05 | 东南大学 | 一种城市多模式交通网络运能协调评价方法 |
Non-Patent Citations (1)
Title |
---|
李大韦等: "交通事件持续时间预测贝叶斯网方法研究", 《 武汉理工大学学报(交通科学与工程版)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110941651B (zh) | 2020-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Niyogisubizo et al. | Predicting student's dropout in university classes using two-layer ensemble machine learning approach: A novel stacked generalization | |
CN111431742B (zh) | 网络信息检测方法、装置、存储介质和计算机设备 | |
Torabi et al. | A particle swarm optimization for a fuzzy multi-objective unrelated parallel machines scheduling problem | |
CN112199608B (zh) | 基于网络信息传播图建模的社交媒体谣言检测方法 | |
US20190272553A1 (en) | Predictive Modeling with Entity Representations Computed from Neural Network Models Simultaneously Trained on Multiple Tasks | |
CN109242149A (zh) | 一种基于教育数据挖掘的学生成绩早期预警方法及系统 | |
US11561950B2 (en) | System and method for facilitating an objective-oriented data structure and an objective via the data structure | |
WO2021208535A1 (zh) | 基于自动特征分组的推荐方法及装置 | |
CN115114421A (zh) | 一种问答模型训练方法 | |
CN110889450A (zh) | 超参数调优、模型构建方法和装置 | |
WO2024051000A1 (zh) | 一种结构化仿真数据生成系统及生成方法 | |
Mousa et al. | School student’s performance prediction using data mining classification | |
Saghaei et al. | Using structural equation modeling in causal relationship design for Balanced-Scorecards' strategic map | |
Gal et al. | A new workflow for human-ai collaboration in citizen science | |
Singh et al. | A computational framework for exploring the socio-cognitive features of teams and their influence on design outcomes | |
CN110941651B (zh) | 一种基于不完备人口信息的交通模式选择分析方法 | |
CN111079175B (zh) | 数据处理方法、装置、计算机可读存储介质和计算机设备 | |
US12014296B2 (en) | Test and training data | |
Chabot | How does socioeconomic homophily emerge? Testing for the contribution of different processes to socioeconomic segregation in adolescent friendships | |
CN113946651B (zh) | 维修知识推荐方法、装置、电子设备、介质及产品 | |
Xu et al. | A Unified 5-Dimensional Framework for Student Models. | |
Bohner | Decision-support systems for sustainable urban planning | |
CN112532463A (zh) | 一种计算机网络故障诊断方法 | |
CN113887008A (zh) | 信息处理方法、电子设备和计算机存储介质 | |
Kukic et al. | Hybrid Simulator for Capturing Dynamics of Synthetic Populations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |