CN116167616A - 一种数据驱动的突发事件下城市轨道交通风险点量化方法 - Google Patents

一种数据驱动的突发事件下城市轨道交通风险点量化方法 Download PDF

Info

Publication number
CN116167616A
CN116167616A CN202211708495.4A CN202211708495A CN116167616A CN 116167616 A CN116167616 A CN 116167616A CN 202211708495 A CN202211708495 A CN 202211708495A CN 116167616 A CN116167616 A CN 116167616A
Authority
CN
China
Prior art keywords
risk
propagation
receptor
station
train
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211708495.4A
Other languages
English (en)
Other versions
CN116167616B (zh
Inventor
秦勇
何洁
孙璇
郭建媛
郑宣传
贾利民
张卓
薛玉
王月玥
孙琦
周亚鹏
孙方
张庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202211708495.4A priority Critical patent/CN116167616B/zh
Publication of CN116167616A publication Critical patent/CN116167616A/zh
Application granted granted Critical
Publication of CN116167616B publication Critical patent/CN116167616B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明提供了一种数据驱动的突发事件下城市轨道交通风险点量化方法。该方法包括:对突发公共卫生事件下城市轨道交通风险传播机理进行分析,挖掘突发公共卫生事件下风险场景的风险传播规律,构建基于风险源‑风险传播载体‑风险传播受体‑风险叠加量化的突发公共卫生事件下城市轨道交通风险传播结构范式和城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元;基于城市轨道交通风险传播耦合模式的三元组单元对流调报告文本数据进行规范化拆解,构建病例出行链,构建城市轨道交通风险传播知识图谱模型,进行城市轨道交通风险点量化。本发明方法可以辅助城市轨道交通运营企业及时调整运营策略,对政府制定防治措施提供重要参考。

Description

一种数据驱动的突发事件下城市轨道交通风险点量化方法
技术领域
本发明涉及突发事件管控技术领域,尤其涉及一种数据驱动的突发事件下城市轨道交通风险点量化方法。
背景技术
由于城市轨道交通空间封闭、人流密集,一旦有突发公共卫生事件发生,极易引发危害大、波及面广、扩散性强的传播风险。因此快速排查接触者并量化风险是运营企业、政府、公安、卫健委重点关注问题。
目前,面对突发公共事件的追踪手段有人工追踪法和轨迹追踪法,人工方法虽不可替代但效率低下,轨迹追踪法多基于手机信令和GPS(Global Positioning System,全球定位系统)数据等,具有隐私泄露等问题;风险量化手段主要是构建风险关联关系网络并及时发布信息,无法高效快速衡量风险程度。
因此,亟待开发一种数据驱动的风险传播知识图谱高效搜索和风险量化方法,以辅助城市轨道交通运营企业及时调整运营策略,对政府制定防治措施提供重要参考。
发明内容
本发明的实施例提供了一种数据驱动的突发事件下城市轨道交通风险点量化方法,以实现有效地辅助城市轨道交通运营企业及时调整运营策略。
为了实现上述目的,本发明采取了如下技术方案。
一种数据驱动的突发事件下城市轨道交通风险点量化方法,包括:
对突发公共卫生事件下城市轨道交通风险传播机理进行分析,确定突发公共卫生事件下城市轨道交通风险传播路径,挖掘突发公共卫生事件下风险场景的风险传播规律;
根据所述突发公共卫生事件下风险场景的风险传播规律构建基于风险源-风险传播载体-风险传播受体-风险叠加量化的突发公共卫生事件下城市轨道交通风险传播结构范式;
根据所述突发公共卫生事件下城市轨道交通风险传播结构范式对风险传播耦合模式进行知识抽取,构建突发公共卫生事件下城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元;
基于所述城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元对流调报告文本数据进行规范化拆解,构建病例出行链;
基于轨道交通自动售检票系统AFC数据和所述病例出行链数据,根据城市轨道交通风险传播耦合模式构建城市轨道交通风险传播知识图谱模型;
基于所述城市轨道交通风险传播知识图谱模型进行城市轨道交通风险点量化。
优选地,所述的对突发公共卫生事件下城市轨道交通风险传播机理进行分析,确定突发公共卫生事件下城市轨道交通风险传播路径,挖掘突发公共卫生事件下风险场景的风险传播规律,包括:
根据所有个体的购票、安检、站台候车和上车行为数据得到城市轨道交通出行流线数据,
设置城市轨道交通风险传播包括站内传播和站间传播,所述站内传播为风险源进站经过风险节点后在站内存在时空交互行为进而造成风险传播,所述站间传播为风险源通过风险传播载体进而在站间造成风险传播;
当个体在出行过程中存在候车行为的站点Sp和乘坐的列车Tp与风险源产生时空交集时,该个体被定义为突发公共卫生事件下城市轨道交通的风险传播受体。
优选地,所述的根据所述突发公共卫生事件下风险场景的风险传播规律构建基于风险源-风险传播载体-风险传播受体-风险叠加量化的突发公共卫生事件下城市轨道交通风险传播结构范式,包括:
将风险传播结构范式表达为风险源->风险传播载体->风险传播受体;
将风险源在出行过程中存在候车行为的站点定义为站点风险传播载体Spsta={Opsta、Tpsta|(Tpsta1、Tpsta2……Tpstan)},其中Opsta表示风险源起点站,Tpsta表示风险源换乘站,包括{Tpsta1、Tpsta2……Tpstan},其中n表示第n个换乘站;
将风险源在出行过程中乘坐的列车定义为列车风险传播载体Tp{Tp1、Tp2……Tpi},其中Tpi表示风险源乘坐的第i列车;
与风险源在同一站点均存在候车行为的个体考虑为站点风险传播受体,与风险源乘坐同一辆列车的个体考虑为列车风险传播受体,站点风险传播受体与列车风险传播受体共同组成风险传播受体;
个体感染风险为站点风险传播受体与列车风险传播受体的叠加量化,站点感染风险为风险源候车站点风险与站点风险传播受体的叠加量化,列车感染风险为风险源乘坐列车风险与列车风险传播受体的叠加量化,个体、站点和列车风险共同组成人-车-路网传播风险。
优选地,所述的根据所述突发公共卫生事件下城市轨道交通风险传播结构范式对风险传播耦合模式进行知识抽取,构建突发公共卫生事件下城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元,包括:
结合AFC数据、流调数据抽取风险源相关信息,该风险源相关信息包括风险源编号实体Node_PpID和风险源数据记录实体Node_PIDp,风险源编号实体的属性为名称,风险源数据记录实体的属性包括数据记录编号和站点进出站时间;
结合列车运行数据和线路基础数据抽取风险传播载体相关信息,风险传播载体包括列车Node_Ti和站点Node_S,列车类风险传播载体属性包括列车编号、列车离开时间和列车到达时间,站点类风险传播载体包括起点站实体Node_Osta、换乘站实体Node_Tsta和终点站实体Node_Dsta,对应属性包括站点编号、站点所在线路;
风险传播受体包括受体编号实体Node_PID和受体数据记录号实体Node_PID,受体编号实体的属性为名称;受体数据记录实体的属性包括数据记录编号、站点进出站时间;
对于个体类实体与列车类实体,若列车实体为第一次列车则抽取关系为“乘坐”即“TAKE”,反之,则抽取关系为“换乘”即“TRANS”;对于个体类实体中编号类实体与数据记录类实体抽取关系“包含”即“HAS”;
对于列车类载体与站点类载体,抽取关系为“出发”即“FROM”;
对于站点类载体之间,起点站实体与换乘站实体、换乘站实体与换乘站实体、换乘站实体与终点站实体均抽取关系为“到达”即“TO”;
建立表1所示的“实体-属性-属性值”三元组,建立表2所示的“实体-关系-实体”三元组;
表1“实体-属性-属性值”三元组
Figure SMS_1
表2“实体-关系-实体”三元组
Figure SMS_2
优选地,所述的基于所述城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元对流调报告文本数据进行规范化拆解,构建病例出行链,包括:
建立城市轨道交通站、城市轨道交通线路和交通地名的用户自定义词典;
读取流调报告文本数据,去除流调报告文本数据中的换行符、语气词获得输入文本数据;
采用语言技术平台LTP模型对输入文本数据进行切词,利用规则提取风险源出行路径涉及的站点数据;
利用规则对输入文本数据提取风险源的出行日期、时间、乘坐线路、起点站、换乘站和终点站数据,利用提取的数据形成风险源的出行链结构化数据。
优选地,所述的基于轨道交通自动售检票系统AFC数据和所述病例出行链数据,根据城市轨道交通风险传播耦合层构建城市轨道交通风险传播知识图谱模型,包括:
根据风险源的出行链结构化数据匹配AFC数据,获取风险源具体出行的AFC数据,并对AFC数据增加风险源0/1属性;
对AFC数据进行指代消解,解决多个指称对应同一对象问题,针对换乘站对应不同站点编号不同线路属性进行知识处理,将换乘站对应实体及属性进行合并,形成同一实体多名称多属性形式;
确定城市轨道交通风险传播知识图谱的节点、关系和属性,在Neo4j平台上通过“实体-属性-属性值”三元组创建节点,再通过“实体-关系-实体”三元组创建边,进而建立城市轨道交通风险传播耦合层;
在Neo4j平台上利用原生语言Cypher批量导入三元组数据和城市轨道交通风险传播耦合层,构建城市轨道交通风险传播知识图谱模型。
优选地,所述的基于所述城市轨道交通风险传播知识图谱模型进行城市轨道交通风险点量化,包括:
根据所述城市轨道交通风险传播知识图谱模型构建多目标的索引映射关系和量化指标;
基于所述索引映射关系和量化指标根据相似度度量和K-means聚类的方法实现个体、站点、列车的风险量化。
优选地,所述的根据所述城市轨道交通风险传播知识图谱模型构建多目标的索引映射关系和量化指标,包括:
步骤S061、根据风险源AFC数据确定风险源编号PpID、风险源数据记录号PIDp、起点站Op、终点站Dp、进/出站时间{Spin_tm、Spout_tm}和上/下车时间{Tpin_tm、Tpout_tm},作为Neo4j图数据库查询的输入数据;
步骤S062、通过Cypher在Neo4j中确定风险源的出行链,利用出行链抽象化显示风险源的乘坐列车Ti、起点站Op、终点站Dp、换乘站Tp、上/下车时间{Tin_tm、Tout_tm}和进/出站时间{Sin_tm、Sout_tm}时空信息,即:match(p:Patient),(o:O_Station),(d:D_Station),P=(p)-[:TAKE]->(t1:Train1)-[:FROM]->(o)-[:TO]->(t:T_Station)-[:TO]->(d),P2=(p)-[:TRANS]->(t2:Train2)-[:FROM]->(t);
步骤S063、基于知识图谱搜索列车类风险传播载体的风险传播受体,即与风险源存在“同乘”行为的受体集合:
步骤S063 01,如果风险源出行不存在换乘,则利用Cypher搜索风险源“乘坐”列车并返回搜索的列车集合{Ti};即:match(p:Patiet),(o:O_Station),(d:D_Station),P0=(p)-[r0:TAKE]->(t10:Trainl)-[:FROM]->(o)-[:TO]->(t:T_Station)-[:TO]->(d)return t10:
步骤S063 02,如果风险源出行存在换乘,则搜索风险源“乘坐”列车以及风险源“换乘”列车,并对搜索结果进行合并并返回搜索的列车集合{Ti};即match(p:Patiet),(o:O_Station),(d:D_Station),P0=(p)-[r0:TRANS]->(t20:Train2)-[:FROM]->(t:T Station)-[:TO]->(d),P=(p)-[r0:TAKE]->(t10:Trainl)-[:FROM]->(o)-[:TO]->(t:T_Station)-[:TO]->(d)return t10,t20:
步骤S06303,遍历列车集合{Ti},通过图数据库的反关系搜索获取每辆列车的风险传播受体即“同乘”受体作为索引,并返回索引的受体编号PiID、受体数据记录号PIDi和受体上/下车时间{Tiin_tm、Tiout_tm}数据。即P1=(pas1:Passenger)-[r:TAKE]->(t10:Train1),P2=(pas2:Passenger)-[r:TRANS]->(t20:Train2)returnpas1,pas2;
步骤S06304,初步筛选风险传播受体,比较风险传播受体的上车时间与风险源的下车时间,若风险源的下车时间大于风险传播受体的上车时间,则考虑存在感染风险输出为“同乘”风险传播受体集合{from_Ti},反之,则考虑为普通个体舍弃;
步骤S064、利用知识图谱搜索站点类风险传播载体的风险传播受体,即与风险源存在“同候”行为的风险传播受体集合:
步骤S06401,如果风险源出行不存在换乘,则将风险源出行起点站作为站点风险传播载体集合{Si}={Oi};
步骤S06402,如果风险源出行存在换乘,则将风险源出行起点站以及换乘站作为站点风险传播载体集合{Si}={Oi,Ti};
步骤S06403,遍历站点风险传播载体集合{Si},通过图数据库的反关系搜索获取每个站点的风险传播受体即“同候”受体作为索引,并返回索引的受体编号PiID、受体数据记录号PIDi、受体进/出站时间{Siin_tm、Siout_tm}数据;
步骤S06404,初步筛选风险传播受体。比较受体的进站时间与风险源的出站时间,若风险源出站时间大于受体进站时间,则为考虑存在感染风险输出为“同候”受体集合{from_Si};反之,则考虑为普通个体舍弃;
步骤S065、建立风险量化指标:
步骤S06501,“同乘”受体与风险源同乘时间相似度越高,则受体感染概率越大;对于“同乘”受体建立上/下车时间作为间接量化指标;利用欧几里得公式计算受体与风险源关于二维数据上/下车时间的欧氏距离
Figure SMS_3
将其作为直接风险量化指标,即:
Figure SMS_4
其中,Tiin_tm代表同乘受体上车时间,Tpin_tm代表风险源上车时间,Tpin_tm代表同乘受体下车时间,Tpout_tm代表风险源下车时间,
Figure SMS_5
代表同乘受体与风险源关于上/下车时间的欧氏距离;
步骤S06502,“同候”受体与风险源同候时间相似度越高,则受体感染概率越大,对于“同候”受体建立进/出站时间作为间接量化指标,利用欧几里得公式计算受体与风险源关于进/出站时间的欧氏距离
Figure SMS_6
将其作为直接风险量化指标,即:/>
Figure SMS_7
其中,Siin_tm代表同候受体进站时间,Spin_tm代表风险源进站时间,Spin_tm代表同候受体出站时间,Spout_tm代表风险源出站时间,
Figure SMS_8
代表同候受体与风险源关于进/出站时间的欧氏距离。
优选地,所述的基于所述索引映射关系和量化指标根据相似度度量和K-means聚类的方法实现个体、站点、列车的风险量化,包括:
对于“同乘”受体,将上/下车时间欧式距离作为相似度度量指标;
对于“同候”受体,将进/出站时间欧式距离作为相似度度量指标;
分别对个体、站点和列车进行风险叠加量化:
利用K-means对欧氏距离
Figure SMS_9
进行聚类,选择k值为3,对“同候”受体和“同乘”受体的距离进行聚类,获得个体风险量化等级;
对列车进行风险叠加量化:获取受体乘坐列车集合{Ti}以及列车对应的受体数量{Ti:TNpi},每辆列车受体所占比例作为列车的风险量化等级,并将列车风险量化等级更新到风险传播知识图谱当中,即:
Figure SMS_10
其中,TNpi代表第i辆列车的乘坐受体数量,
Figure SMS_11
代表n辆列车的受体总量,/>
Figure SMS_12
代表第i辆列车的量化风险;
对站点进行风险叠加量化:获取受体候车站点集合{Si}以及站点对应的受体数量{Si:SNpi},每个站点受体所占比例作为站点的风险量化等级,并将站点风险量化等级更新到风险传播知识图谱当中,即:
Figure SMS_13
其中,SNpi代表第i个站点的进站受体数量,
Figure SMS_14
代表m个站点的受体总量,/>
Figure SMS_15
代表第i个站点的量化风险。
由上述本发明的实施例提供的技术方案可以看出,本发明提出了一种数据驱动的风险传播知识图谱高效搜索和风险量化方法,辅助城市轨道交通运营企业及时调整运营策略,对政府制定防治措施提供重要参考。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据驱动的突发事件下城市轨道交通风险点量化方法的处理流程图;
图2为本发明实施例提供的一种突发公共卫生事件下城市轨道交通风险传播机理图;
图3为本发明实施例提供的一种构建风险传播范式示意图;
图4为本发明实施例提供的一种对风险传播耦合模式进行知识抽取并构建三元组单元示意图;
图5为本发明实施例提供的一种对流调报告文本数据进行规范化拆解及病例出行链构建图;
图6为本发明实施例提供的一种关联数据并构建城市轨道交通风险传播知识图谱模型;
图7为本发明实施例提供的一种构建多目标的索引映射关系和量化指标;
图8为本发明实施例提供的一种风险量化流程图;
图9为本发明实施例提供的一种知识图谱模式层;
图10为本发明实施例提供的一种知识图谱数据层;
图11为本发明实施例提供的一种个体出行链知识图谱展示;
图12为本发明实施例提供的一种“同乘”和“同候”风险传播受体搜索结果示意图;
图13为本发明实施例提供的一种风险量化指标结果示意图;
图14为本发明实施例提供的一种个体风险量化等级示意图;
图15为本发明实施例提供的一种列车和站点风险量化等级示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明实施例提出的一种数据驱动的突发事件下城市轨道交通风险点量化方法的处理流程如图1所示,包括如下的处理步骤:
步骤S10、对突发公共卫生事件下城市轨道交通风险传播机理进行分析,确定突发公共卫生事件下轨道交通风险传播路径,挖掘病例出行场景下的风险传播的本质规律。
步骤S20、根据突发公共卫生事件下风险场景的发生和演化规律,构建一套基于“风险源-风险传播载体-风险传播受体-风险叠加量化”的突发公共卫生事件下城市轨道交通风险传播结构范式。
步骤S30、根据突发公共卫生事件下城市轨道交通风险传播结构范式对风险传播耦合模式进行知识抽取,涉及实体、关系、属性抽取,构建突发公共卫生事件下城市轨道交通风险传播耦合模式的基本三元组单元。
步骤S40、对流调报告文本数据进行规范化拆解及病例出行链构建。
步骤S50、关联AFC(Automatic Fare Collection,轨道交通自动售检票系统)数据和流调报告文本数据,根据城市轨道交通风险传播耦合模式构建城市轨道交通风险传播知识图谱模型。
步骤S60、构建多目标的索引映射关系和量化指标。
步骤S70、根据相似度度量和K-means聚类的方法实现个体、站点、列车风险量化。
具体的,上述步骤S10具体包括:
步骤S011、微观角度,城市轨道交通出行流线即个体进站在节点处进行购票、安检等行为后,至于站台候车并上车到目的地。
步骤S012、宏观角度,基于城市轨道交通风险传播包括站内传播和站间传播。站内传播即风险源进站经过风险节点后在站内存在时空交互行为进而造成风险传播,站间传播即风险源通过风险传播载体进而在站间造成风险传播。
步骤S013、突发公共卫生事件下城市轨道交通风险传播载体考虑为存在候车行为的站点和乘坐的列车,即通过站点和列车存在与风险源产生时空交集进而被定义为风险传播受体。
具体的,本发明实施例提供的一种突发公共卫生事件下城市轨道交通风险传播机理图如图2所示,构建风险传播范式示意图如图3所示。上述步骤S20具体包括:
步骤S021、风险传播结构范式可表达为“风险源—>风险传播载体—>风险传播受体”。
步骤S022、将风险源在出行过程中存在候车行为的站点定义为站点风险传播载体={、|(1、2……)},其中表示风险源起点站,表示风险源换乘站,包括{1、2……},其中n表示第n个换乘站。
步骤S0223、将风险源在出行过程中乘坐的列车定义为列车风险传播载体{1、2……},其中表示风险源乘坐的第i列车。
步骤S0224、与风险源在同一站点均存在候车行为的个体考虑为站点风险传播受体,与风险源乘坐同一辆列车的个体考虑为列车风险传播受体。站点风险传播受体与列车风险传播受体共同组成风险传播受体。
步骤S0225、个体感染风险即为站点风险传播受体与列车风险传播受体叠加量化,站点感染风险即为风险源候车站点风险与站点风险传播受体叠加量化,列车感染风险即为风险源乘坐列车风险与列车风险传播受体叠加量化。个体、站点、列车风险共同组成人-车-路网传播风险。
具体的,图4为本发明实施例提供的一种对风险传播耦合模式进行知识抽取并构建三元组单元示意图。上述步骤S30具体包括:
步骤S031、结合AFC数据、流调数据,抽取风险源相关信息,包括风险源编号实体_、风险源数据记录实体_P。风险源编号实体的属性为名称;风险源数据记录实体的属性包括数据记录编号、站点进出站时间。
步骤S032、结合列车运行数据、线路基础数据,抽取风险传播载体相关信息,风险传播载体包括列车_,和站点_,列车类风险传播载体属性包括列车编号、列车离开时间、列车到达时间。站点类风险传播载体包括起点站实体_、换乘站实体_、终点站实体_,对应属性包括站点编号、站点所在线路。
步骤S033、风险传播受体与风险源类似,包括受体编号实体_、受体数据记录号实体_。受体编号实体的属性为名称;受体数据记录实体的属性包括数据记录编号、站点进出站时间。
步骤S034、对于个体类实体与列车类实体,若列车实体为第一次列车则抽取关系为“乘坐”即“TAKE”,反之,则抽取关系为“换乘”即“TRANS”;对于个体类实体中编号类实体与数据记录类实体抽取关系“包含”即“HAS”。
步骤S035、对于列车类载体与站点类载体,抽取关系为“出发”即“FROM”。
步骤S036、对于站点类载体之间,起点站实体与换乘站实体、换乘站实体与换乘站实体、换乘站实体与终点站实体均抽取关系为“到达”即“TO”。
步骤S037、建立“实体-属性-属性值”三元组;建立“实体-关系-实体”三元组。
表1“实体-属性-属性值”三元组
Figure SMS_16
Figure SMS_17
表2“实体-关系-实体”三元组
Figure SMS_18
具体的,图5为本发明实施例提供的一种对流调报告文本数据进行规范化拆解及病例出行链构建图,上述步骤S40具体包括:
步骤S041、建立城市轨道交通站、城市轨道交通线路、交通地名的用户自定义词典。
步骤S042、读取流调报告文本文件,去除文本数据中的换行符、语气词获得输入文本数据content。
步骤S043、采用LTP(Language Technology Platform,语言技术平台)中的中文分词模型对输入文本数据进行切词,利用规则提取风险源出行路径涉及站点数据。
步骤S044、利用规则对输入文本数据提取风险源的出行日期、时间、乘坐线路、起点站、换乘站(若有)和终点站数据,利用提取的数据形成风险源的出行链结构化数据。
具体的,图6为本发明实施例提供的一种关联数据并构建城市轨道交通风险传播知识图谱模型示意图,图9为本发明实施例提供的一种知识图谱模式层示意图,图10为本发明实施例提供的一种知识图谱数据层示意图。上述步骤S50具体包括:
步骤S051、根据风险源出行链结构化数据匹配AFC数据,获取风险源具体出行的AFC数据,并对AFC数据增加风险源0/1属性。
步骤S052、进行指代消解,解决多个指称对应同一对象问题,针对换乘站对应不同站点编号不同线路属性进行知识处理,将换乘站对应实体及属性进行合并形成同一实体多名称多属性形式以建立有效准确的连接。
步骤S053、建立知识图谱模式层,确定风险传播知识图谱的节点、关系、属性。在Neo4j平台上通过“实体一属性-属性值”三元组创建节点,再通过“实体-关系-实体”三元组创建边,进而确定风险传播模式层。
步骤S054、建立知识图谱模式层。在Neo4j平台上利用原生语言Cypher批量导入三元组数据和城市轨道交通风险传播耦合层,构建城市轨道交通风险传播知识图谱模型。
具体的,图7为本发明实施例提供的一种构建多目标的索引映射关系和量化指标,图8为本发明实施例提供的一种风险量化流程图,上述步骤S60具体包括:
步骤S061、根据风险源AFC数据确定风险源编号PpID、风险源数据记录号PIDp、起点站Op、终点站Dp、进/出站时间{Spin_tm、Spout_tm}、上/下车时间{Tpin_tm、Tpout_tm}作为Neo4j图数据库查询的输入数据。
步骤S062、通过Cypher在Neo4j中确定风险源的出行链,利用出行链抽象化显示风险源的乘坐列车Ti、起点站Op、终点站Dp、换乘站Tp、上/下车时间{Tin_tm、Tout_tm}、进/出站时间{Sin_tm、Sout_tm}等时空信息。即:match(p:Patient),(o:O_Station),(d:D_Station),P=(p)-[:TAKE]->(t1:Trainl)-[:FROM]->(o)-[:TO]->(t:T_Station)-[:TO]->(d),P2=(p)-[:TRANS]->(t2:Train2)-[:FROM]->(t)。
步骤S063、基于知识图谱搜索列车类风险传播载体的风险传播受体,即与风险源存在“同乘”行为的受体集合:
步骤S063 01,如果风险源出行不存在换乘,则利用Cypher搜索风险源“乘坐”列车并返回搜索的列车集合{Ti);即match(p:Patiet),(o:O_Station),(d:D_Station),P0=(p)-[r0:TAKE]->(t10:Train1)-[:FROM]->(o)-[:TO]->(t:T_Station)-[:TO]->(d)return t10;
步骤S063 02,如果风险源出行存在换乘,则搜索风险源“乘坐”列车以及风险源“换乘”列车并对搜索结果进行合并并返回搜索的列车集合{Ti};即match(p:Patiet),(o:O_Station),(d:D_Station),P0=(p)-[r0:TRANS]->(t20:Train2)-[:FROM]->(t:T_Station)-[:TO]->(d),P=(p)-[r0:TAKE]->(t10:Trainl)-[:FROM]->(o)-[:TO]->(t:T_Station)-[:TO]->(d)return t10,t20;
步骤S063 03,遍历列车集合{Ti},通过图数据库的反关系搜索获取每辆列车的风险传播受体即“同乘”受体作为索引,并返回索引的受体编号PiID、受体数据记录号PIDi、受体上/下车时间{Tiin_tm、Tiout_tm}数据。即P1=(pas1:Passenger)一[r:TAKE]->(t10:Trainl),P2=(pas2:Passenger)-[r:TRANS]->(t20:Train2)return pas 1,pas2。
步骤S06304,初步筛选风险传播受体。比较受体的上车时间与风险源的下车时间,若风险源下车时间大于受体上车时间,则考虑存在感染风险输出为“同乘”风险传播受体集合{from_Ti},反之,则考虑为普通个体舍弃。
步骤S064、利用知识图谱搜索站点类风险传播载体的风险传播受体,即与风险源存在“同候”行为的风险传播受体集合:
步骤S06401,如果风险源出行不存在换乘,则将风险源出行起点站作为站点风险传播载体集合{Si}={Oi}。
步骤S06402,如果风险源出行存在换乘,则将风险源出行起点站以及换乘站作为站点风险传播载体集合{Si}={Oi,Ti}。
步骤S06403,遍历站点风险传播载体集合{Si},通过图数据库的反关系搜索获取每个站点的风险传播受体即“同候”受体作为索引,并返回索引的受体编号PiID、受体数据记录号PIDi、受体进/出站时间{Siin_tm、Siout_tm}数据。
步骤S06404,初步筛选风险传播受体。比较受体的进站时间与风险源的出站时间,若风险源出站时间大于受体进站时间,则为考虑存在感染风险输出为“同候”受体集合{from_Si},反之,则考虑为普通个体舍弃。
步骤S065、建立风险量化指标:
步骤S065 01,“同乘”受体与风险源同乘时间相似度越高,则受体感染概率越大。对于“同乘”受体建立上/下车时间作为间接量化指标。利用欧几里得公式计算受体与风险源关于二维数据上/下车时间的欧氏距离
Figure SMS_19
将其作为直接风险量化指标。即:
Figure SMS_20
其中,Tiin_tm代表同乘受体上车时间,Tpin_tm代表风险源上车时间,Tpin_tm代表同乘受体下车时间,Tpout_tm代表风险源下车时间,
Figure SMS_21
代表同乘受体与风险源关于上/下车时间的欧氏距离。
步骤S065 02,“同候”受体与风险源同候时间相似度越高,则受体感染概率越大。对于“同候”受体建立进/出站时间作为间接量化指标。利用欧几里得公式计算受体与风险源关于进/出站时间的欧氏距离
Figure SMS_22
将其作为直接风险量化指标。即:
Figure SMS_23
其中,Siin_tm代表同候受体进站时间,Spin_tm代表风险源进站时间,Spin_tm代表同候受体出站时间,Spout_tm代表风险源出站时间,
Figure SMS_24
代表同候受体与风险源关于进/出站时间的欧氏距离。
具体的,图11为本发明实施例提供的一种个体出行链知识图谱展示示意图,图12为本发明实施例提供的一种“同乘”和“同候”风险传播受体搜索结果示意图,图13为本发明实施例提供的一种风险量化指标结果示意图,图14为本发明实施例提供的一种个体风险量化等级示意图,图15为本发明实施例提供的一种列车和站点风险量化等级示意图。上述步骤S70具体包括:
步骤S071、将欧式距离作为相似度度量指标:
步骤S07101,对于“同乘”受体,上/下车时间欧式距离
Figure SMS_25
作为相似度度量指标。
步骤S07102,对于“同候”受体,进/出站时间欧式距离
Figure SMS_26
作为相似度度量指标。
步骤S072、分别对个体、站点、列车进行风险叠加量化:
步骤S07201,利用K-means对欧氏距离
Figure SMS_27
进行聚类。选择k值为3,对“同候”受体和“同乘”受体的距离进行聚类,获得个体风险量化等级。
步骤S07202,对列车进行风险叠加量化:获取受体乘坐列车集合{Ti}以及列车对应的受体数量{Ti:TNpi},每辆列车受体所占比例作为列车的风险量化等级,并将列车风险量化等级更新到风险传播知识图谱当中。即:
Figure SMS_28
其中,TNpi代表第i辆列车的乘坐受体数量,
Figure SMS_29
代表n辆列车的受体总量,/>
Figure SMS_30
代表第i辆列车的量化风险。
步骤S07203,对站点进行风险叠加量化:获取受体候车站点集合{Si}以及站点对应的受体数量{Si:SNpi},每个站点受体所占比例作为站点的风险量化等级,并将站点风险量化等级更新到风险传播知识图谱当中。即:
Figure SMS_31
/>
其中,SNpi代表第i个站点的进站受体数量,
Figure SMS_32
代表m个站点的受体总量,/>
Figure SMS_33
代表第i个站点的量化风险。
实施例一:
以COVID-19在北京地铁传播为例进行风险传播图谱构建及量化,本发明过程如下:
1、COVID-19地铁风险传播载体考虑为存在候车行为的站点Sp和乘坐的列车Tp,即通过站点和列车存在与风险源产生时空交集进而被定义为风险传播受体。
2、风险传播结构范式表示为:风险源—>站点—>受体,风险源—>列车—>受体。
3、构建COVID-19事件下地铁风险传播耦合模式的基本三元组单元,具体三元组信息如下:
表1“实体-属性-属性值”三元组
Figure SMS_34
表2“实体-关系-实体”三元组
Figure SMS_35
4、建立地铁站、地铁线路、交通地名的用户自定义词典,即:
地铁站字典={“苹果园”,“古城”,“八角游乐园”,“八宝山”,“玉泉路”,“五棵松”,“万寿路”,“公主坟”,“军事博物馆”,“木樨地”……};
地铁线路字典={“6号线”,“S1线”,“昌平线”,“1号线”,“大兴线”……};
5、读取流调报告文本文件,去除文本数据中的换行符、语气词获得输入文本数据content。
文本报告_例=“我是XXX,今天是1月6日,从朝阳门站出发到达玉泉路站,在木樨地站换乘。嗯。采用百度地图,7点58分进站,8点03分到达站台,08:05上车,08:46下车,轻微拥堵,8点48分到达换乘站台,08:49上车,09:30下车,轻微拥堵,09:35出站。”
6、采用LTP模型对content进行切词并利用规则提取风险源出行路径涉及站点数据。利用规则对content提取风险源基于地铁出行的日期、时间、乘坐线路数据。提取的结构化出行数据:
Figure SMS_36
7、关联AFC数据和流调报告文本数据。关联后的AFC数据示例:
Figure SMS_37
8、关联列车运行数据、线路基础数据。关联后的出行链数据如下:
Figure SMS_38
Figure SMS_39
9、进行指代消解,解决多个指称对应同一对象问题,针对换乘站对应不同站点编号不同线路属性进行知识处理,将换乘站对应实体及属性进行合并形成同一实体多名称多属性形式以建立有效准确的连接。进行指代消解后换乘站点及属性数据示例:
Figure SMS_40
10、建立知识图谱模式层,确定风险传播知识图谱的节点、关系、属性。在Neo4j平台上通过“实体一属性-属性值”三元组创建节点,再通过“实体-关系-实体”三元组创建边。
11、建立知识图谱模式层。在Neo4j平台上利用原生语言Cypher批量导入三元组数据,建立突公共卫生事件风险传播知识图谱。模式层如图9。
12、根据风险源AFC数据确定风险源编号PpID、风险源数据记录号PIDp、起点站Op、终点站Dp、进/出站时间{Spin_tm、Spout_tm}、上/下车时间{Tpin_tm、Tpout_tm}作为Neo4j图数据库查询的输入数据。数据层如图10。病例出行链如图11。
13、基于知识图谱搜索列车类传播载体的传播受体,即与风险源存在“同乘”行为的受体集合。“同乘”接触者如下,其中“JieChu”表示接触者详细信息,。“JieChu_hum”表示接触者数据记录号,“train_hum”表示同乘的列车,“board_time”表示上车时间,“alight_time”表示下车时间。
14、基于知识图谱搜索站点类传播载体的传播受体,即与风险源存在“同候”行为的传播受体集合。“同候”接触者如下,其中“JieChu”表示接触者详细信息,。“JieChu_num”表示接触者数据记录号,“sta_hum”表示同候的站点编号。
15、利用欧几里得公式计算受体与风险源关于二维数据上/下车时间的距离,将欧氏距离
Figure SMS_41
作为直接风险量化指标。即,其中“dist”表示上/下车时间的欧氏距离/>
Figure SMS_42
16、利用欧几里得公式计算受体与风险源关于二维数据进/出站时间的距离,将欧氏距离
Figure SMS_43
作为直接风险量化指标。即,其中“dist”表示进/出站时间的欧氏距离/>
Figure SMS_44
17、利用k-means对欧氏距离
Figure SMS_45
进行聚类。选择k值为4,对“同候”受体和“同乘”受体的距离进行聚类,获得个体风险量化等级。
18、对列车进行风险叠加量化:获取受体乘坐列车集合{Ti}以及列车对应的受体数量{Ti:TNpi},每辆列车受体所占比例作为列车的风险量化等级,并将列车风险量化等级更新到风险传播知识图谱当中。
19、对站点进行风险叠加量化:获取受体候车站点集合{Si}以及站点对应的受体数量{Si:SNpi},每个站点受体所占比例作为站点的风险量化等级,并将站点风险量化等级更新到风险传播知识图谱当中。
综上所述,本发明实施例提出了一种数据驱动的风险传播知识图谱高效搜索和风险量化方法,辅助城市轨道交通运营企业及时调整运营策略,对政府制定防治措施提供重要参考。
由于拥塞的城市轨道交通出行中车站、列车内部空间的相对封闭性,成为风险传播的关键因素,从大规模出行数据中如何高效地挖掘出准确的知识以用于风险辨识及追踪方面仍存在挑战。对于百万级的人群流行病调查规模,人工流调方法显然存在效率低下问题,本发明通过构建风险传播知识图谱实现自动化高效搜索,提高追踪效率和准确性。本发明有益成果体现在三方面:能够预计个体风险站点、路径并及时推送的个性化服务,有效规避风险路段;为城轨运营企业封站、调整运营方案提供辅助决策;对于政府及卫健委提供一种快速精准的数字化流调排查追踪方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (9)

1.一种数据驱动的突发事件下城市轨道交通风险点量化方法,其特征在于,包括:
对突发公共卫生事件下城市轨道交通风险传播机理进行分析,确定突发公共卫生事件下城市轨道交通风险传播路径,挖掘突发公共卫生事件下风险场景的风险传播规律;
根据所述突发公共卫生事件下风险场景的风险传播规律构建基于风险源一风险传播载体-风险传播受体-风险叠加量化的突发公共卫生事件下城市轨道交通风险传播结构范式;
根据所述突发公共卫生事件下城市轨道交通风险传播结构范式对风险传播耦合模式进行知识抽取,构建突发公共卫生事件下城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元;
基于所述城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元对流调报告文本数据进行规范化拆解,构建病例出行链;
基于轨道交通自动售检票系统AFC数据和所述病例出行链数据,根据城市轨道交通风险传播耦合模式构建城市轨道交通风险传播知识图谱模型;
基于所述城市轨道交通风险传播知识图谱模型进行城市轨道交通风险点量化。
2.根据权利要求1所述的方法,其特征在于,所述的对突发公共卫生事件下城市轨道交通风险传播机理进行分析,确定突发公共卫生事件下城市轨道交通风险传播路径,挖掘突发公共卫生事件下风险场景的风险传播规律,包括:
根据所有个体的购票、安检、站台候车和上车行为数据得到城市轨道交通出行流线数据,
设置城市轨道交通风险传播包括站内传播和站间传播,所述站内传播为风险源进站经过风险节点后在站内存在时空交互行为进而造成风险传播,所述站间传播为风险源通过风险传播载体进而在站间造成风险传播;
当个体在出行过程中存在候车行为的站点Sp和乘坐的列车Tp与风险源产生时空交集时,该个体被定义为突发公共卫生事件下城市轨道交通的风险传播受体。
3.根据权利要求2所述的方法,其特征在于,所述的根据所述突发公共卫生事件下风险场景的风险传播规律构建基于风险源一风险传播载体-风险传播受体-风险叠加量化的突发公共卫生事件下城市轨道交通风险传播结构范式,包括:
将风险传播结构范式表达为风险源->风险传播载体->风险传播受体;
将风险源在出行过程中存在候车行为的站点定义为站点风险传播载体Spsta={Opsta、Tpsta|(Tpstal、Tpsta2……Tpstan)},其中Opsta表示风险源起点站,Tpsta表示风险源换乘站,包括{Tpsta1、Tpsta2……Tpstan},其中n表示第n个换乘站;
将风险源在出行过程中乘坐的列车定义为列车风险传播载体Tp{Tp1、Tp2……Tpi},其中Tpi表示风险源乘坐的第i列车;
与风险源在同一站点均存在候车行为的个体考虑为站点风险传播受体,与风险源乘坐同一辆列车的个体考虑为列车风险传播受体,站点风险传播受体与列车风险传播受体共同组成风险传播受体;
个体感染风险为站点风险传播受体与列车风险传播受体的叠加量化,站点感染风险为风险源候车站点风险与站点风险传播受体的叠加量化,列车感染风险为风险源乘坐列车风险与列车风险传播受体的叠加量化,个体、站点和列车风险共同组成人-车-路网传播风险。
4.根据权利要求3所述的方法,其特征在于,所述的根据所述突发公共卫生事件下城市轨道交通风险传播结构范式对风险传播耦合模式进行知识抽取,构建突发公共卫生事件下城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元,包括:
结合AFC数据、流调数据抽取风险源相关信息,该风险源相关信息包括风险源编号实体Node-PpID和风险源数据记录实体Node-PIDp,风险源编号实体的属性为名称,风险源数据记录实体的属性包括数据记录编号和站点进出站时间;
结合列车运行数据和线路基础数据抽取风险传播载体相关信息,风险传播载体包括列车Node_Ti和站点Node_S,列车类风险传播载体属性包括列车编号、列车离开时间和列车到达时间,站点类风险传播载体包括起点站实体Node_Osta、换乘站实体Node_Tsta和终点站实体Node_Dsta,对应属性包括站点编号、站点所在线路;
风险传播受体包括受体编号实体Node_PID和受体数据记录号实体Node_PID,受体编号实体的属性为名称;受体数据记录实体的属性包括数据记录编号、站点进出站时间;
对于个体类实体与列车类实体,若列车实体为第一次列车则抽取关系为“乘坐”即“TAKE”,反之,则抽取关系为“换乘”即“TRANS”;对于个体类实体中编号类实体与数据记录类实体抽取关系“包含”即“HAS”;
对于列车类载体与站点类载体,抽取关系为“出发”即“FROM”;
对于站点类载体之间,起点站实体与换乘站实体、换乘站实体与换乘站实体、换乘站实体与终点站实体均抽取关系为“到达”即“T0”;
建立表1所示的“实体-属性-属性值”三元组,建立表2所示的“实体-关系-实体”三元组;
表1“实体-属性-属性值”三元组
Figure FDA0004026588150000021
Figure FDA0004026588150000031
/>
表2“实体-关系-实体”三元组
Figure FDA0004026588150000032
5.根据权利要求4所述的方法,其特征在于,所述的基于所述城市轨道交通风险传播耦合模式的实体、关系和属性三元组单元对流调报告文本数据进行规范化拆解,构建病例出行链,包括:
建立城市轨道交通站、城市轨道交通线路和交通地名的用户自定义词典;
读取流调报告文本数据,去除流调报告文本数据中的换行符、语气词获得输入文本数据;
采用语言技术平台LTP模型对输入文本数据进行切词,利用规则提取风险源出行路径涉及的站点数据;
利用规则对输入文本数据提取风险源的出行日期、时间、乘坐线路、起点站、换乘站和终点站数据,利用提取的数据形成风险源的出行链结构化数据。
6.根据权利要求5所述的方法,其特征在于,所述的基于轨道交通自动售检票系统AFC数据和所述病例出行链数据,根据城市轨道交通风险传播耦合层构建城市轨道交通风险传播知识图谱模型,包括:
根据风险源的出行链结构化数据匹配AFC数据,获取风险源具体出行的AFC数据,并对AFC数据增加风险源0/1属性;
对AFC数据进行指代消解,解决多个指称对应同一对象问题,针对换乘站对应不同站点编号不同线路属性进行知识处理,将换乘站对应实体及属性进行合并,形成同一实体多名称多属性形式;
确定城市轨道交通风险传播知识图谱的节点、关系和属性,在Neo4j平台上通过“实体-属性-属性值”三元组创建节点,再通过“实体-关系-实体”三元组创建边,进而建立城市轨道交通风险传播耦合层;
在Neo4j平台上利用原生语言Cypher批量导入三元组数据和城市轨道交通风险传播耦合层,构建城市轨道交通风险传播知识图谱模型。
7.根据权利要求6所述的方法,其特征在于,所述的基于所述城市轨道交通风险传播知识图谱模型进行城市轨道交通风险点量化,包括:
根据所述城市轨道交通风险传播知识图谱模型构建多目标的索引映射关系和量化指标;
基于所述索引映射关系和量化指标根据相似度度量和K-means聚类的方法实现个体、站点、列车的风险量化。
8.根据权利要求7所述的方法,其特征在于,所述的根据所述城市轨道交通风险传播知识图谱模型构建多目标的索引映射关系和量化指标,包括:
步骤S061、根据风险源AFC数据确定风险源编号PpID、风险源数据记录号PIDp、起点站Op、终点站Dp、进/出站时间{Spin_tm、Spout_tm}和上/下车时间{Tpin_tm、Tpout_tm},作为Neo4j图数据库查询的输入数据;
步骤S062、通过Cypher在Neo4j中确定风险源的出行链,利用出行链抽象化显示风险源的乘坐列车Ti、起点站Op、终点站Dp、换乘站Tp、上/下车时间{Tin_tm、Tout_tm}和进/出站时间{Sin_tm、Sout_tm}时空信息,即:match(p:Patient),(o:0Station),(d:D_Station),P=(p)-[:TAKE]->(t1:Train1)-[:FROM]->(o)-[:T0]->(t:T_Station)-[:T0]->(d),P2=(p)-[:TRANS]->(t2:Train2)-[:FR0M]->(t);
步骤S063、基于知识图谱搜索列车类风险传播载体的风险传播受体,即与风险源存在“同乘”行为的受体集合:
步骤S06301,如果风险源出行不存在换乘,则利用Cypher搜索风险源
“乘坐”列车并返回搜索的列车集合{Ti};即:match(p:Patiet),(o:0Station),(d:D_Station),P0=(p)-[r0:TAKE]->(t10:Trainl)-[:FROM]->(o)-[:T0]->(t:T_Station)-[:T0]->(d)returnt10;
步骤S06302,如果风险源出行存在换乘,则搜索风险源“乘坐”列车以及风险源“换乘”列车,并对搜索结果进行合并并返回搜索的列车集合{Ti};即match(p:Patiet),(o:0Station),(d:D_Station),P0=(p)-[r0:TRANS]->(t20:Train2)-[:FROM]->(t:T Station)-[:T0]->(d),P=(p)一[r0:TAKE]->(t10:Trainl)-[:FROM]->(o)-[:T0]->(t:T_Station)-[:T0]->(d)return t10,t20;
步骤S06303,遍历列车集合{Ti},通过图数据库的反关系搜索获取每辆列车的风险传播受体即“同乘”受体作为索引,并返回索引的受体编号PiID、受体数据记录号PIDi和受体上/下车时间{Tiin_tm、Tiout_tm}数据,即P1=(pas1:Passenger)-[r:TAKE]->(t10:Trainl),P2=(pas2:Passenger)-[r:TRANS]->(t20:Train2)return pas 1,pas2;
步骤S06304,初步筛选风险传播受体,比较风险传播受体的上车时间与风险源的下车时间,若风险源的下车时间大于风险传播受体的上车时间,则考虑存在感染风险输出为“同乘”风险传播受体集合{from_Ti},反之,则考虑为普通个体舍弃;
步骤S064、利用知识图谱搜索站点类风险传播载体的风险传播受体,即与风险源存在“同候”行为的风险传播受体集合:
步骤S06401,如果风险源出行不存在换乘,则将风险源出行起点站作为站点风险传播载体集合{Si}={Oi};
步骤S06402,如果风险源出行存在换乘,则将风险源出行起点站以及换乘站作为站点风险传播载体集合{Si}={Oi,Ti};
步骤S06403,遍历站点风险传播载体集合{Si},通过图数据库的反关系搜索获取每个站点的风险传播受体即“同候”受体作为索引,并返回索引的受体编号PiID、受体数据记录号PIDi、受体进/出站时间{Siin_tm、Siout_tm}数据;
步骤S06404,初步筛选风险传播受体,比较受体的进站时间与风险源的出站时间,若风险源出站时间大于受体进站时间,则为考虑存在感染风险输出为“同候”受体集合{from_Si};反之,则考虑为普通个体舍弃;
步骤S065、建立风险量化指标:
步骤S06501,“同乘”受体与风险源同乘时间相似度越高,则受体感染概率越大;对于“同乘”受体建立上/下车时间作为间接量化指标;利用欧几里得公式计算受体与风险源关于二维数据上/下车时间的欧氏距离
Figure FDA0004026588150000052
将其作为直接风险量化指标,即:
Figure FDA0004026588150000051
其中,Tiin_tm代表同乘受体上车时间,Tpin_tm代表风险源上车时间,Tpin_tm代表同乘受体下车时间,Tpout_tm代表风险源下车时间,
Figure FDA0004026588150000068
代表同乘受体与风险源关于上/下车时间的欧氏距离;
步骤S06502,“同候”受体与风险源同候时间相似度越高,则受体感染概率越大,对于“同候”受体建立进/出站时间作为间接量化指标,利用欧几里得公式计算受体与风险源关于进/出站时间的欧氏距离
Figure FDA00040265881500000611
将其作为直接风险量化指标,即:
Figure FDA0004026588150000061
其中,Siin_tm代表同候受体进站时间,Spin_tm代表风险源进站时间,Spin_tm代表同候受体出站时间,Spout_tm代表风险源出站时间,
Figure FDA0004026588150000069
代表同候受体与风险源关于进/出站时间的欧氏距离。
9.根据权利要求8所述的方法,其特征在于,所述的基于所述索引映射关系和量化指标根据相似度度量和K-means聚类的方法实现个体、站点、列车的风险量化,包括:
对于“同乘”受体,将上/下车时间欧式距离作为相似度度量指标;
对于“同候”受体,将进/出站时间欧式距离作为相似度度量指标;
分别对个体、站点和列车进行风险叠加量化:
利用K-means对欧氏距离
Figure FDA00040265881500000610
进行聚类,选择k值为3,对“同候”受体和“同乘”受体的距离进行聚类,获得个体风险量化等级;
对列车进行风险叠加量化:获取受体乘坐列车集合{Ti}以及列车对应的受体数量{Ti:TNpi},每辆列车受体所占比例作为列车的风险量化等级,并将列车风险量化等级更新到风险传播知识图谱当中,即:
Figure FDA0004026588150000062
其中,TNpi代表第i辆列车的乘坐受体数量,
Figure FDA0004026588150000063
代表n辆列车的受体总量,/>
Figure FDA0004026588150000064
代表第i辆列车的量化风险;
对站点进行风险叠加量化:获取受体候车站点集合{Si}以及站点对应的受体数量{Si:SNpi},每个站点受体所占比例作为站点的风险量化等级,并将站点风险量化等级更新到风险传播知识图谱当中,即:
Figure FDA0004026588150000065
其中,SNpi代表第i个站点的进站受体数量,
Figure FDA0004026588150000066
代表m个站点的受体总量,/>
Figure FDA0004026588150000067
代表第i个站点的量化风险。/>
CN202211708495.4A 2022-12-29 2022-12-29 一种数据驱动的突发事件下城市轨道交通风险点量化方法 Active CN116167616B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211708495.4A CN116167616B (zh) 2022-12-29 2022-12-29 一种数据驱动的突发事件下城市轨道交通风险点量化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211708495.4A CN116167616B (zh) 2022-12-29 2022-12-29 一种数据驱动的突发事件下城市轨道交通风险点量化方法

Publications (2)

Publication Number Publication Date
CN116167616A true CN116167616A (zh) 2023-05-26
CN116167616B CN116167616B (zh) 2023-07-28

Family

ID=86415715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211708495.4A Active CN116167616B (zh) 2022-12-29 2022-12-29 一种数据驱动的突发事件下城市轨道交通风险点量化方法

Country Status (1)

Country Link
CN (1) CN116167616B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400065A (zh) * 2019-07-12 2019-11-01 北京交通大学 基于传染病模型的轨道交通系统风险链群构建方法
CN112131392A (zh) * 2020-08-01 2020-12-25 赛飞特工程技术集团有限公司 基于知识图谱的公共卫生疫情预警方法及系统
CN112215491A (zh) * 2020-10-12 2021-01-12 济南轨道交通集团有限公司 一种城市轨道交通疫情传播风险量化评估方法及系统
CN112365171A (zh) * 2020-11-16 2021-02-12 广州杰赛科技股份有限公司 基于知识图谱的风险预测方法、装置、设备及存储介质
CN115081918A (zh) * 2022-07-07 2022-09-20 北京交通大学 基于数据驱动的轨道交通风险点预测方法及系统
CN115238079A (zh) * 2021-11-10 2022-10-25 济南市公安局交通警察支队 一种基于实时交通流数据的疫情预警分析方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400065A (zh) * 2019-07-12 2019-11-01 北京交通大学 基于传染病模型的轨道交通系统风险链群构建方法
CN112131392A (zh) * 2020-08-01 2020-12-25 赛飞特工程技术集团有限公司 基于知识图谱的公共卫生疫情预警方法及系统
CN112215491A (zh) * 2020-10-12 2021-01-12 济南轨道交通集团有限公司 一种城市轨道交通疫情传播风险量化评估方法及系统
CN112365171A (zh) * 2020-11-16 2021-02-12 广州杰赛科技股份有限公司 基于知识图谱的风险预测方法、装置、设备及存储介质
CN115238079A (zh) * 2021-11-10 2022-10-25 济南市公安局交通警察支队 一种基于实时交通流数据的疫情预警分析方法及系统
CN115081918A (zh) * 2022-07-07 2022-09-20 北京交通大学 基于数据驱动的轨道交通风险点预测方法及系统

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
KIM JY, ZHAO XG , SHAH AUA, ET AL: "System Risk Quantification and Decision Making Support using Functional Modeling and Dynamic Bayesian Network", 《RELIABILITY ENGINEERING & SYSTEM SAFETY》 *
VADYALA SR, BETGERI SN, SHERER EA, ET AL: "Prediction of the Number of COVID-19 Confirmed Cases Based on K-Means-LSTM", 《ARRAY》 *
刘奕,钱静,范维澄: "走向精准:突发事件风险分析方法发展综述", 《中国安全科学学报》 *
刘雅姝: "多维视角的重大突发事件演变机理及应对策略研究", 中国优秀博士学位论文全文数据库 信息科技辑》 *
李玥琪,王晰巍,王楠阿雪等: "突发事件下社交媒体网络舆情风险识别及预警模型研究", 《情报学报》 *
王恩达,石京: "基于互信息理论的多风险因素下交通事故风险量化与分析", 《交通工程》 *
郑宣传,魏运,秦勇等: "一种改进K-means模型的城市轨道交通突发事件分级方法", 《交通运输系统工程与信息》 *

Also Published As

Publication number Publication date
CN116167616B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN109903553B (zh) 多源数据挖掘的公交车上下车站点识别和检验方法
CN111931998B (zh) 一种基于移动定位数据的个体出行模式预测方法及系统
Egu et al. How comparable are origin-destination matrices estimated from automatic fare collection, origin-destination surveys and household travel survey? An empirical investigation in Lyon
CN115168529B (zh) 一种基于手机定位数据的枢纽客流溯源方法
CN111932925A (zh) 一种公共交通站点的出行客流的确定方法、装置及系统
CN106951549A (zh) 一种基于轨道ic卡和手机信令数据的乘客出行路线识别方法
Yu et al. Data-driven approach for solving the route choice problem with traveling backward behavior in congested metro systems
CN114358808A (zh) 基于多源数据融合的公交od估计及分配方法
CN111584091B (zh) 一种城轨线路级密切接触者交叉感染风险辨识方法和装置
CN110969861A (zh) 一种车辆识别方法、装置、设备及计算机存储介质
Lee et al. Exploring for route preferences of subway passengers using smart card and train log data
Ji et al. Research on classification and influencing factors of metro commuting patterns by combining smart card data and household travel survey data
CN115862331A (zh) 考虑卡口网络拓扑结构的车辆出行轨迹重构方法
CN116564551B (zh) 一种数据-知识驱动的城市轨道交通风险辨识方法
Yona et al. Data science and GIS-based system analysis of transit passenger complaints to improve operations and planning
CN114420306A (zh) 一种传染病密切接触人员追踪系统及方法
US20230170096A1 (en) Systems, devices, and methods for managing contact instances of persons of interest
CN116167616B (zh) 一种数据驱动的突发事件下城市轨道交通风险点量化方法
Qian et al. Exploring the potential role of bikeshare to complement public transit: The case of San Francisco amid the coronavirus crisis
CN116307931B (zh) 一种面向城市货运物流链的多源数据融合分析方法
Narboneta et al. A Study of Metro Manila's Public Transportation Sector: Implementing a Multimodal Public Transportation Route Planner
CN115587503B (zh) 基于多模式仿真的个体出行链还原方法
Sodikov et al. DEVELOPING NOVEL REGISTRATION OF ROAD TRAFFIC ACCIDENTS.
Wickramasinghe et al. Plus go: Intelligent complementary ride-sharing system
Han et al. Analyzing the accessibility of subway stations for transport-vulnerable population segments in Seoul: Case of bus-to-subway transfer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant