CN110147419B - 基于地铁空间的传染病扩散分析方法及系统 - Google Patents
基于地铁空间的传染病扩散分析方法及系统 Download PDFInfo
- Publication number
- CN110147419B CN110147419B CN201910338603.5A CN201910338603A CN110147419B CN 110147419 B CN110147419 B CN 110147419B CN 201910338603 A CN201910338603 A CN 201910338603A CN 110147419 B CN110147419 B CN 110147419B
- Authority
- CN
- China
- Prior art keywords
- subway
- train
- transfer
- station
- individual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000015181 infectious disease Diseases 0.000 title claims abstract description 61
- 208000035473 Communicable disease Diseases 0.000 title claims abstract description 48
- 238000004458 analytical method Methods 0.000 title claims abstract description 20
- 238000009792 diffusion process Methods 0.000 title claims abstract description 19
- 230000002265 prevention Effects 0.000 claims abstract description 15
- 230000007480 spreading Effects 0.000 claims abstract description 14
- 238000012546 transfer Methods 0.000 claims description 105
- 238000000034 method Methods 0.000 claims description 32
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 230000002458 infectious effect Effects 0.000 claims description 8
- 238000004659 sterilization and disinfection Methods 0.000 claims description 8
- 238000005728 strengthening Methods 0.000 claims description 8
- 208000032370 Secondary transmission Diseases 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 6
- 230000014599 transmission of virus Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 abstract description 5
- 238000011160 research Methods 0.000 description 7
- 230000005541 medical transmission Effects 0.000 description 3
- 241000700605 Viruses Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000001490 Dengue Diseases 0.000 description 1
- 206010012310 Dengue fever Diseases 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 208000025729 dengue disease Diseases 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
- G01C21/206—Instruments for performing navigational calculations specially adapted for indoor navigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Radar, Positioning & Navigation (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Tourism & Hospitality (AREA)
- Epidemiology (AREA)
- Marketing (AREA)
- Automation & Control Theory (AREA)
- Pathology (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Train Traffic Observation, Control, And Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于地铁空间的传染病扩散分析方法,包括:根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻;根据地铁线路图和地铁刷卡数据推断个体乘客的出行路径;根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间;根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。本发明还涉及一种基于地铁空间的传染病扩散分析系统。本发明能够更加准确地提取和度量个体之间的物理接触,通过与传染源个体发生物理接触的个体在地铁系统内的传播路径,准确分析地铁空间中的传染病扩散情况。
Description
技术领域
本发明涉及一种基于地铁空间的传染病扩散分析方法及系统。
背景技术
现在有关个体交互的传染病扩散研究一是基于建筑物等固定活动场所,比如家、工作地等,二是基于公共交通系统等移动性场所。在同一时间处于同一空间的个体对之间通常被认为发生了物理接触。当个体之间发生物理接触时,传染病通常通过空气传播(包括微粒、带菌飞沫和尘埃)和蚊子媒介传播。提取大规模个体间的物理接触关系,度量个体间的物理接触强度是研究呼吸道疾病、流感和登革热等传染病传播规律和现象并设计精准防控策略的关键基础。
目前,已有针对公交车的研究,尚未有面向地铁系统的研究。而地铁具有人流量大、密闭性高、覆盖范围广等特点,在其中极易发生个体间物理接触,这在一定程度上加速了传染病的扩散,因此,研究其内部的传染病扩散规律、制定精准防控措施是十分必要的。
由自动收费系统收集的地铁刷卡数据为调查大规模个体的物理接触提供了机会。由于地铁系统比公交系统更为庞大和复杂,提取地铁系统中的人-人物理接触存在诸多挑战(例如,换乘、上/下列车均无记录,难以判断个体在地铁系统中的具体乘车行为),导致提取人-人物理接触存在较大难度。
现有的传染病扩散分析技术的缺点如下:
第一,目前有关个体交互的传染病扩散研究一是基于建筑物等固定活动场所,比如家、工作地等,二是基于公共交通系统等移动性场所,已有针对公交车的研究,尚未有面向地铁系统的研究;
第二,由于地铁系统内部结构的庞大和复杂,研究其中的个体物理接触需要考虑多种情况,提取人-人物理接触存在较大难度。
发明内容
有鉴于此,有必要提供一种基于地铁空间的传染病扩散分析方法及系统。
本发明提供一种基于地铁空间的传染病扩散分析方法,该方法包括如下步骤:a.根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻;b.根据地铁线路图和地铁刷卡数据推断个体乘客的出行路径;c.根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间;d.根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。
其中,所述的步骤a具体包括:
获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表;
根据获取的地铁站乘客及地铁运行的源数据,推断列车到达和离开每个站点的时刻,并对每辆列车进行编号。
所述的步骤b具体包括:
根据上述处理后的地铁刷卡数据,得到OD记录数据,对得到的OD记录数据进行异常数据清洗;
结合地铁线路图,使用Dijkstra算法搜索时间最短路径来确定个体乘客的出行路径。
所述的步骤c具体包括如下步骤:
c1,根据地铁刷卡数据,计算个体乘客在每个站点的进出站步行时间;
c2,根据出站刷卡时间戳计算下车时间戳,将非换乘个体乘客匹配到特定列车;
c3,根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘个体乘客匹配到特定列车;
c4,根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;
c5,用步骤c3推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。
所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
本发明提供一种基于地铁空间的传染病扩散分析系统,该系统包括该系统包括计算模块、推断模块、匹配模块、分析模块,其中:所述计算模块用于根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻;所述推断模块用于根据地铁线路图和地铁刷卡数据推断个体乘客的出行路径;所述匹配模块用于根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间;所述分析模块用于根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。
其中,所述的计算模块具体用于:
获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表;
根据获取的地铁站乘客及地铁运行的源数据,推断列车到达和离开每个站点的时刻,并对每辆列车进行编号。
所述的推断模块具体用于:
根据上述处理后的地铁刷卡数据,得到OD记录数据,对得到的OD记录数据进行异常数据清洗;
结合地铁线路图,使用Dijkstra算法搜索时间最短路径来确定个体乘客的出行路径。
所述的匹配模块具体用于:
根据地铁刷卡数据,计算个体乘客在每个站点的进出站步行时间;
根据出站刷卡时间戳计算下车时间戳,将非换乘个体乘客匹配到特定列车;
根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘个体乘客匹配到特定列车;
根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;
推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。
所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
本申请对地铁系统中发生的物理接触进行研究,针对地铁系统内部结构复杂、个体在系统内的出行行为难以识别的特点,提出了一种将个体与特定列车匹配的方法对个体出行进行划分,从而有助于更加准确地提取和度量个体之间的物理接触,通过与传染源个体发生物理接触的个体在地铁系统内的传播路径,分析地铁空间中的传染病扩散情况,提供了一种基于个体物理接触的传染病分析方法和系统。
附图说明
图1为本发明基于地铁空间的传染病扩散分析方法的流程图;
图2是乘客刷卡出站事件示意图;
图3是乘客匹配到特定列车示意图;
图4是传染病传播扩散示意图;
图5为本发明基于地铁空间的传染病扩散分析系统的硬件架构图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细的说明。
参阅图1所示,是本发明基于地铁空间的传染病扩散分析方法较佳实施例的作业流程图。
步骤S1,根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻。在本实施例中,从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔计算得到列车到达和离开每个站点的时刻。具体而言:
首先,获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表。
在本实施例中,所述源数据包括深圳市2012年9月20个工作日的地铁刷卡数据、深圳市2012年9月地铁线路图、深圳市2012年9月地铁列车运营时刻表。所述地铁刷卡数据包括:卡片ID、日期、时间戳、站点名称和类型;其中,所述类型包括:刷卡进站或刷卡出站。
然后,根据获取的地铁站乘客及地铁运行的源数据,推断详细的列车运行时刻表。根据从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔,推断列车到达和离开每个站点的时刻,对每辆列车进行编号。
步骤S2,根据上述地铁线路图和地铁刷卡数据推断个体乘客的出行路径。具体而言:
首先,对上述获取的源数据进行数据预处理。采用地铁刷卡数据,将连续两次进出站记录作为一次出行进行OD匹配,得到OD记录数据;对得到的OD记录数据进行数据清洗:删除OD记录数据中进出站相同的记录。
然后,给定一对OD记录数据,结合地铁线路图,使用Dijkstra(迪杰斯特拉)算法搜索时间最短路径来确定个体的出行路径(即经过的站点序列),并据此将个体出行分为:非换乘出行、单次换乘出行和多次换乘出行三类。
步骤S3,根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间。具体而言:
步骤S301:计算个体乘客在每个站点的进出站步行时间,所述进出站步行时间即为从刷卡闸机到站台的步行时间和从站台到刷卡闸机的步行时间,两个步行时间相同。
在本实施例中,如图2(1)所示,当列车M到达时,个体乘客从列车下车,从站台步行到刷卡闸机,使时间线中的刷卡出站事件相对频繁(如图2(2)所示)。在这一群个体乘客中,第一个刷卡出站的个体乘客没有在刷卡闸机前等待或者在站点内逗留,因此所述个体乘客从站台到刷卡闸机的步行时间可以代表站点的进出站步行时间。
采用DBSCAN聚类算法对个体乘客出站刷卡时间戳进行聚类。每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳的差值。由于每趟列车均可计算得到一个进出站步行时间,而一天内存在多趟列车,每个站点可得到多个进出站步行时间。采用箱线图法(异常值被定义为小于QL-1.5IQR或大于QU+1.5IQR的值。QL称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;QU称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;IQR称为四分位数间距,是上四分位数QU与下四分位数QL之差)剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间。
步骤S302:将非换乘个体乘客匹配到特定列车。根据出站刷卡时间戳减去出站站点的进出站步行时间计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车。
在本实施例中,根据出站刷卡时间戳减去出站站点的进出站步行时间(即Td-ΔSd)计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车(如图3(1)所示)。通过这种方式,所有的非换乘个体乘客都可以匹配到特定的列车上。
步骤S303:将单次换乘个体乘客匹配到特定列车。以步骤S302的方法匹配换乘后的列车;根据进站刷卡时间戳加上进站站点的进出站步行时间计算换乘前的上车时间戳,将此后最近到达的列车作为其换乘前的列车。
在本实施例中,以步骤S302的方法匹配换乘后的列车(即列车M2);根据进站刷卡时间戳加上进站站点的进出站步行时间(即To+ΔSo)计算换乘前的上车时间戳,将此后最近到达的列车(即列车M1)作为其换乘前的列车(如图3(2)所示)。通过这种方式,所有的单次换乘个体乘客都可以匹配到特定的列车上。
步骤S304:计算换乘站点的换乘时间。该站点从一条线路站台到另一条线路站台的换乘时间可以推断为换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值。同样,可以得到换乘时间的多个值,用箱线图法剔除异常值后,将数据中的最小值作为该换乘站从一条线到另一条线的换乘时间。
步骤S305:将多次换乘个体乘客匹配到特定列车。
以二次换乘为例,用步骤S303中的方法推断出个体乘客乘坐的第一列和最后一列列车(即M1和M3);考虑到换乘站1、2(即ΔF1和ΔF2)的换乘时间,认为在换乘站1换乘后发车、在换乘站2换乘前到达的列车是个体乘坐的中间列车(即M2)(如图3(3)所示)。通过这种方式,所有的多次换乘个体都可以匹配到特定的列车。
步骤S4,根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。具体而言:
所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
为了直观地展示传染病的传播过程,从地铁刷卡数据中选取两名具有代表性的个体,认为他们是传染病的携带者,可以感染附近的人群,即传染源个体。其中一位个体非常活跃,在地铁系统20天中遇到的其他个体数最多;另一位则非常不活跃,在同样时间里遇到的其他个体数最少。
计算得到由两名传染源个体引起的疾病传播情况,如图4所示,浅灰色点的大小代表两位个体在地铁站的出现频率,而深灰色点则代表在地铁系统中遇到两位传染源个体的其他个体的目的地站,即由传染源个体所带来的传染病的传播扩散情况。可以看到活跃个体(如图4(1)所示)带来了比非活跃个体(如图4(2)所示)更大空间范围和更高频次的传播。
结果直观显示了个体引起的传染病传播扩散的影响,有助于在适当的时候对目标地点、列车甚至个人采取有效的干预行动,如在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
参阅图2所示,是本发明基于地铁空间的传染病扩散分析系统10的硬件架构图。该系统包括:计算模块101、推断模块102、匹配模块103、分析模块104。
所述计算模块101用于根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻。在本实施例中,从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔计算得到列车到达和离开每个站点的时刻。具体而言:
首先,所述计算模块101获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表。
在本实施例中,所述源数据包括深圳市2012年9月20个工作日的地铁刷卡数据、深圳市2012年9月地铁线路图、深圳市2012年9月地铁列车运营时刻表。所述地铁刷卡数据包括:卡片ID、日期、时间戳、站点名称和类型;其中,所述类型包括:刷卡进站或刷卡出站。
然后,所述计算模块101根据获取的地铁站乘客及地铁运行的源数据,推断详细的列车运行时刻表。根据从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔,推断列车到达和离开每个站点的时刻,对每辆列车进行编号。
所述推断模块102用于根据上述地铁线路图和地铁刷卡数据推断个体乘客的出行路径。具体而言:
首先,所述推断模块102对上述获取的源数据进行数据预处理。采用地铁刷卡数据,将连续两次进出站记录作为一次出行进行OD匹配,得到OD记录数据;对得到的OD记录数据进行数据清洗:删除OD记录数据中进出站相同的记录。
然后,给定一对OD记录数据,所述推断模块102结合地铁线路图,使用Dijkstra(迪杰斯特拉)算法搜索时间最短路径来确定个体的出行路径(即经过的站点序列),并据此将个体出行分为:非换乘出行、单次换乘出行和多次换乘出行三类。
所述匹配模块103用于根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间。具体而言:
所述匹配模块103计算个体乘客在每个站点的进出站步行时间,所述进出站步行时间即为从刷卡闸机到站台的步行时间和从站台到刷卡闸机的步行时间,两个步行时间相同。
在本实施例中,如图2(1)所示,当列车M到达时,个体乘客从列车下车,从站台步行到刷卡闸机,使时间线中的刷卡出站事件相对频繁(如图2(2)所示)。在这一群个体乘客中,第一个刷卡出站的个体乘客没有在刷卡闸机前等待或者在站点内逗留,因此所述个体乘客从站台到刷卡闸机的步行时间可以代表站点的进出站步行时间。
采用DBSCAN聚类算法对个体乘客出站刷卡时间戳进行聚类。每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳的差值。由于每趟列车均可计算得到一个进出站步行时间,而一天内存在多趟列车,每个站点可得到多个进出站步行时间。采用箱线图法(异常值被定义为小于QL-1.5IQR或大于QU+1.5IQR的值。QL称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;QU称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;IQR称为四分位数间距,是上四分位数QU与下四分位数QL之差)剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间。
所述匹配模块103将非换乘个体乘客匹配到特定列车。根据出站刷卡时间戳减去出站站点的进出站步行时间计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车。
在本实施例中,根据出站刷卡时间戳减去出站站点的进出站步行时间(即Td-ΔSd)计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车(如图3(1)所示)。通过这种方式,所有的非换乘个体乘客都可以匹配到特定的列车上。
所述匹配模块103将单次换乘个体乘客匹配到特定列车。匹配换乘后的列车后,根据进站刷卡时间戳加上进站站点的进出站步行时间计算换乘前的上车时间戳,将此后最近到达的列车作为其换乘前的列车。
在本实施例中,匹配换乘后的列车(即列车M2)后,根据进站刷卡时间戳加上进站站点的进出站步行时间(即To+ΔSo)计算换乘前的上车时间戳,将此后最近到达的列车(即列车M1)作为其换乘前的列车(如图3(2)所示)。通过这种方式,所有的单次换乘个体乘客都可以匹配到特定的列车上。
所述匹配模块103计算换乘站点的换乘时间。该站点从一条线路站台到另一条线路站台的换乘时间可以推断为换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值。同样,可以得到换乘时间的多个值,用箱线图法剔除异常值后,将数据中的最小值作为该换乘站从一条线到另一条线的换乘时间。
所述匹配模块103将多次换乘个体乘客匹配到特定列车。
以二次换乘为例,推断出个体乘客乘坐的第一列和最后一列列车(即M1和M3);考虑到换乘站1、2(即ΔF1和ΔF2)的换乘时间,认为在换乘站1换乘后发车、在换乘站2换乘前到达的列车是个体乘坐的中间列车(即M2)(如图3(3)所示)。通过这种方式,所有的多次换乘个体都可以匹配到特定的列车。
所述分析模块104用于根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。具体而言:
所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
为了直观地展示传染病的传播过程,从地铁刷卡数据中选取两名具有代表性的个体,认为他们是传染病的携带者,可以感染附近的人群,即传染源个体。其中一位个体非常活跃,在地铁系统20天中遇到的其他个体数最多;另一位则非常不活跃,在同样时间里遇到的其他个体数最少。
计算得到由两名传染源个体引起的疾病传播情况,如图4所示,浅灰色点的大小代表两位个体在地铁站的出现频率,而深灰色点则代表在地铁系统中遇到两位传染源个体的其他个体的目的地站,即由传染源个体所带来的传染病的传播扩散情况。可以看到活跃个体(如图4(1)所示)带来了比非活跃个体(如图4(2)所示)更大空间范围和更高频次的传播。
结果直观显示了个体引起的传染病传播扩散的影响,有助于在适当的时候对目标地点、列车甚至个人采取有效的干预行动,如在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。
Claims (6)
1.一种基于地铁空间的传染病扩散分析方法,其特征在于,该方法包括如下步骤:
a.根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻;
b.根据地铁线路图和地铁刷卡数据推断个体乘客的出行路径;
c.根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间;
d.根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施;
所述的步骤b具体包括:
对地铁刷卡数据处理,得到OD记录数据,对得到的OD记录数据进行异常数据清洗;
结合地铁线路图,使用Dijkstra算法搜索时间最短路径来确定个体乘客的出行路径,并据此将个体出行分为:非换乘出行、单次换乘出行和多次换乘出行三类;
所述的步骤c具体包括如下步骤:
c1,根据地铁刷卡数据,计算个体乘客在每个站点的进出站步行时间:采用DBSCAN聚类算法对个体乘客出站刷卡时间戳进行聚类,每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳的差值,采用箱线图法剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间;
c2,根据出站刷卡时间戳计算下车时间戳,将非换乘个体乘客匹配到特定列车;
c3,根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘个体乘客匹配到特定列车;
c4,根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;
c5,用步骤c3推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。
2.如权利要求1所述的方法,其特征在于,所述的步骤a具体包括:
获取地铁站乘客及地铁运行的源数据,其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表;
根据获取的地铁站乘客及地铁运行的源数据,推断列车到达和离开每个站点的时刻,并对每辆列车进行编号。
3.如权利要求2所述的方法,其特征在于:所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
4.一种基于地铁空间的传染病扩散分析系统,其特征在于,该系统包括计算模块、推断模块、匹配模块、分析模块,其中:
所述计算模块用于根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻;
所述推断模块用于根据地铁线路图和地铁刷卡数据推断个体乘客的出行路径;
所述匹配模块用于根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间;
所述分析模块用于根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施;
所述的推断模块具体用于:
对地铁刷卡数据处理,得到OD记录数据,对得到的OD记录数据进行异常数据清洗;
结合地铁线路图,使用Dijkstra算法搜索时间最短路径来确定个体乘客的出行路径,并据此将个体出行分为:非换乘出行、单次换乘出行和多次换乘出行三类;
所述的匹配模块具体用于:
根据地铁刷卡数据,计算个体乘客在每个站点的进出站步行时间:采用DBSCAN聚类算法对个体乘客出站刷卡时间戳进行聚类,每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳的差值,采用箱线图法剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间;
根据出站刷卡时间戳计算下车时间戳,将非换乘个体乘客匹配到特定列车;
根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘个体乘客匹配到特定列车;
根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;
推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。
5.如权利要求4所述的系统,其特征在于,所述的计算模块具体用于:
获取地铁站乘客及地铁运行的源数据,其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表;
根据获取的地铁站乘客及地铁运行的源数据,推断列车到达和离开每个站点的时刻,并对每辆列车进行编号。
6.如权利要求5所述的系统,其特征在于:所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910338603.5A CN110147419B (zh) | 2019-04-25 | 2019-04-25 | 基于地铁空间的传染病扩散分析方法及系统 |
PCT/CN2019/126267 WO2020215760A1 (zh) | 2019-04-25 | 2019-12-18 | 基于地铁空间的传染病扩散分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910338603.5A CN110147419B (zh) | 2019-04-25 | 2019-04-25 | 基于地铁空间的传染病扩散分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110147419A CN110147419A (zh) | 2019-08-20 |
CN110147419B true CN110147419B (zh) | 2022-07-19 |
Family
ID=67594420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910338603.5A Active CN110147419B (zh) | 2019-04-25 | 2019-04-25 | 基于地铁空间的传染病扩散分析方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110147419B (zh) |
WO (1) | WO2020215760A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147419B (zh) * | 2019-04-25 | 2022-07-19 | 中国科学院深圳先进技术研究院 | 基于地铁空间的传染病扩散分析方法及系统 |
CN110569181A (zh) * | 2019-08-27 | 2019-12-13 | 神华包神铁路集团有限责任公司 | 系统能力评估方法及装置、计算机设备 |
CN113496781A (zh) * | 2020-04-01 | 2021-10-12 | 中国科学院深圳先进技术研究院 | 城市内部传染病扩散模拟方法、系统及电子设备 |
CN111836202A (zh) * | 2020-06-17 | 2020-10-27 | 广州通达汽车电气股份有限公司 | 一种基于公交车辆进行人员定位预警的方法及装置 |
CN111784165A (zh) * | 2020-07-01 | 2020-10-16 | 宿迁海沁节能科技有限公司 | 一种基于5G NB-IoT的载运工具病毒健康智能预警系统与方法 |
CN114638385A (zh) * | 2020-12-15 | 2022-06-17 | 上海擎感智能科技有限公司 | 约车传染防护方法及计算机存储介质 |
CN113536493A (zh) * | 2021-06-23 | 2021-10-22 | 南京理工大学 | 基于聚类反推的有效路径生成方法及断面客流估算方法 |
CN113889284B (zh) * | 2021-09-16 | 2022-07-05 | 同济大学 | 一种基于公共交通知识图谱的传染病接触目标追踪方法 |
CN114723163B (zh) * | 2022-04-26 | 2023-04-07 | 深圳市城市交通规划设计研究中心股份有限公司 | 分时段客流时空分配方法、系统、电子设备及存储介质 |
CN116564551B (zh) * | 2023-05-17 | 2024-01-26 | 北京交通大学 | 一种数据-知识驱动的城市轨道交通风险辨识方法 |
CN117290618B (zh) * | 2023-11-27 | 2024-03-01 | 江西鹭鹭行科技有限公司 | 城市、城际轨道交通的时空伴随人群搜寻方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108151756A (zh) * | 2017-12-21 | 2018-06-12 | 深圳市综合交通运行指挥中心 | 一种城市公共交通系统的行程时间计算方法和装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8560339B2 (en) * | 2007-04-02 | 2013-10-15 | Kamran Khan | System and method to predict the global spread of infectious agents via commercial air travel |
CN102129363A (zh) * | 2010-01-13 | 2011-07-20 | 中国科学院遥感应用研究所 | 呼吸道社区传播疾病时空建模与模拟系统 |
CN104331964B (zh) * | 2014-10-29 | 2017-02-15 | 深圳先进技术研究院 | 基于智能卡数据计算地铁进站时间和换乘时间的方法及系统 |
CN105447592A (zh) * | 2015-11-12 | 2016-03-30 | 中国科学院深圳先进技术研究院 | 一种乘客路径选择的分析方法及装置 |
CN105740615B (zh) * | 2016-01-28 | 2018-10-16 | 中山大学 | 利用手机轨迹追踪传染源和预测传染病流行趋势的方法 |
US20170351831A1 (en) * | 2016-06-01 | 2017-12-07 | International Business Machines Corporation | Personal travel health vulnerability navigator |
CN107133901B (zh) * | 2017-05-05 | 2020-11-03 | 中国科学院深圳先进技术研究院 | 一种传染病防控方法及系统 |
KR101885031B1 (ko) * | 2017-05-24 | 2018-08-03 | 서울시립대학교 산학협력단 | 교통 네트워크에 기반하여 질병 위험 지역을 감시하고 정보를 제공하는 장치 및 방법 |
CN108198630A (zh) * | 2018-03-09 | 2018-06-22 | 中华人民共和国陕西出入境检验检疫局 | 一种机场疾病预警与防控方法 |
CN109378079A (zh) * | 2018-09-27 | 2019-02-22 | 同济大学 | 一种基于发热症状监测传染病的系统及方法 |
CN109360660A (zh) * | 2018-10-31 | 2019-02-19 | 河南省疾病预防控制中心 | 一种疾控与出行信息互联的防控方法及防控系统 |
CN110147419B (zh) * | 2019-04-25 | 2022-07-19 | 中国科学院深圳先进技术研究院 | 基于地铁空间的传染病扩散分析方法及系统 |
-
2019
- 2019-04-25 CN CN201910338603.5A patent/CN110147419B/zh active Active
- 2019-12-18 WO PCT/CN2019/126267 patent/WO2020215760A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108151756A (zh) * | 2017-12-21 | 2018-06-12 | 深圳市综合交通运行指挥中心 | 一种城市公共交通系统的行程时间计算方法和装置 |
Non-Patent Citations (1)
Title |
---|
"基于SVR的地铁载客人数预测算法研究";商志巍;《现代计算机(专业版)》;20190305(第07期);第42-44+48页 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020215760A1 (zh) | 2020-10-29 |
CN110147419A (zh) | 2019-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110147419B (zh) | 基于地铁空间的传染病扩散分析方法及系统 | |
Tirachini et al. | COVID-19 and public transportation: Current assessment, prospects, and research needs | |
Zhu et al. | A probabilistic passenger-to-train assignment model based on automated data | |
WO2021243516A1 (zh) | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 | |
CN106297288B (zh) | 一种公交乘客客流数据采集与分析方法 | |
Bohari et al. | Improving the Quality of Public Transportation System: Application of simulation model for passenger movement | |
Liu et al. | A survey of COVID-19 in public transportation: Transmission risk, mitigation and prevention | |
CN112785735A (zh) | 一种基于收费数据的高速公路路况的监测方法及装置 | |
US20220044335A1 (en) | Friend recommendation method and system orented toward subway passengers | |
Liu et al. | Investigating physical encounters of individuals in urban metro systems with large-scale smart card data | |
CN108364464B (zh) | 一种基于概率模型的公交车辆旅行时间建模方法 | |
Ulak et al. | Analyzing network-wide patterns of rail transit delays using Bayesian network learning | |
Mo et al. | Inferring passenger responses to urban rail disruptions using smart card data: A probabilistic framework | |
Zargari et al. | Impact of mobility on COVID-19 spread–A time series analysis | |
JP2008189180A (ja) | 列車運行管理システム | |
Wahaballa et al. | Estimation of platform waiting time distribution considering service reliability based on smart card data and performance reports | |
Sadeghinasr et al. | Estimating commuting patterns from high resolution phone GPS data | |
CN105933463B (zh) | 基于智能设备标识信息的城市人员进出城监测方法与系统 | |
Hansen | Improving railway punctuality by automatic piloting | |
Boudou et al. | Spatio-temporal evolution of COVID-19 in the Republic of Ireland and the Greater Dublin Area (March to November 2020): A space-time cluster frequency approach | |
Burdzik | Probability of transmission of SARS-CoV-2 virus pathogens in long-distance passenger transport | |
Shi et al. | Generating synthetic passenger data through joint traffic-passenger modeling and simulation | |
JP2022006482A (ja) | ナビゲーション装置、及びナビゲーション方法 | |
JP7460500B2 (ja) | 旅客影響度算出装置及び旅客影響度算出方法 | |
Zachreson et al. | Risk mapping for COVID-19 outbreaks using mobility data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |