CN111832801A - 基于合作机制的化工园区巡逻车调度方法、系统及介质 - Google Patents

基于合作机制的化工园区巡逻车调度方法、系统及介质 Download PDF

Info

Publication number
CN111832801A
CN111832801A CN202010478820.7A CN202010478820A CN111832801A CN 111832801 A CN111832801 A CN 111832801A CN 202010478820 A CN202010478820 A CN 202010478820A CN 111832801 A CN111832801 A CN 111832801A
Authority
CN
China
Prior art keywords
patrol
node
attacker
chemical industry
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010478820.7A
Other languages
English (en)
Other versions
CN111832801B (zh
Inventor
陈彬
陈斐然
王一多
赵勇
陈海亮
朱正秋
季雅泰
艾川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202010478820.7A priority Critical patent/CN111832801B/zh
Publication of CN111832801A publication Critical patent/CN111832801A/zh
Application granted granted Critical
Publication of CN111832801B publication Critical patent/CN111832801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于合作机制的化工园区巡逻车调度方法、系统及介质,本发明方法包括对化工园区的道路网络建模为图模型G;确定巡逻车的初始配置,包括巡逻车的数量r和初始位置sp;将图模型G分成r个区域,每个区域分配一辆巡逻车;构建各辆巡逻车的巡逻转移图pG;将化工厂区、巡逻车建立巡逻博弈模型,在得到各辆巡逻车的巡逻转移图的基础上求解巡逻博弈模型得到各辆巡逻车的最佳巡逻路线。本发明将博弈模型和合作巡逻机制结合在一起,提出基于合作机制的化工园区环保巡逻博弈模型,将化工园区静态划分为多个区域避免冲突以实现合作,能够提高资源的利用率、保证巡逻的效果,可有效减少化工厂区排放过量大气污染物的概率。

Description

基于合作机制的化工园区巡逻车调度方法、系统及介质
技术领域
本发明涉及公共安全领域,具体涉及一种基于合作机制的化工园区巡逻车调度方法、系统及介质。
背景技术
对于包括化工园区巡逻、边境巡逻、港口巡逻等在内的多种安防场景,采用巡逻车代替人工进行巡逻,能够降低巡逻人员的人力负担、防止巡逻人员发生意外人身伤害。
考虑到化工园区的占地面积较大,少量巡逻车无法对园区范围进行有效的时空覆盖,因此使用多辆巡逻车同时进行巡逻。在不引入巡逻车合作机制的情况下,在实际巡逻过程中,各巡逻车会根据当前的状态各自选择巡逻路线,有可能会出现多辆巡逻车同时巡逻同一个化工厂区的情况,这就会造成巡逻资源的浪费。为了提高资源的利用率,保证巡逻的效果,要求多辆巡逻车在同时巡逻时尽量避免出现上述提到的问题,这就需要多辆巡逻车在巡逻过程中有一定的合作机制。
博弈论研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略实施对应的策略,有时也称为对策论,是研究具有斗争或竞争性质现象的理论和方法。20世纪50年代,冯·诺伊曼(von Neumann)和奥斯卡·摩根斯坦(Morgenstern)首次对博弈论系统化和形式化,并引入经济学,至今仍为经济分析的主要工具之一。随着博弈论的发展与完善,该理论已经在公共安全领域得到广泛应用。美国将博弈论应用于安防领域并开发了多款系统,如用于规划机场检查点的设置及警犬巡逻路线的ARMOR系统、为航班进行调度分配空中警察的IRIS系统、用于规划海岸警卫队巡逻路线的PORTECT系统等,都取得了一定的效果。根据Tambe等人的观点,博弈论利用合理的数学方法在多个利益相关者的情况下对有限资源部署进行建模方面具有优势。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于合作机制的化工园区巡逻车调度方法、系统及介质,本发明将博弈模型和合作巡逻机制结合在一起,提出基于合作机制的化工园区环保巡逻博弈模型,在巡逻过程中,将化工园区静态划分为多个区域避免冲突以实现合作,在此基础上给出各巡逻车的优化使用方案,能够提高资源的利用率、保证巡逻的效果,可有效减少化工厂区排放过量大气污染物的概率。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于合作机制的化工园区巡逻车调度方法,实施步骤包括:
1)对化工园区的道路网络进行建模得到图模型G;
2)确定巡逻车的初始配置,包括巡逻车的数量r和每辆巡逻车的初始位置sp;
3)将图模型G进行区域划分成r个区域,每个区域分配一辆巡逻车;
4)构建各辆巡逻车的巡逻转移图pG;
5)将化工厂区、巡逻车建立巡逻博弈模型,在得到各辆巡逻车的巡逻转移图的基础上求解巡逻博弈模型得到各辆巡逻车的最佳巡逻路线。
可选地,步骤1)中得到图模型G由节点集合V和连边集合E构成,其中节点集合V中的节点由化工园区内每个化工厂区的车辆出入口或道路交叉口构成,连边集合E中的连边由图模型G中的节点根据化工园区内实际的化工厂区及道路的连接情况连接而成,且同一个化工厂区的多个不同车辆出入口节点之间增加连边连接。
可选地,步骤2)的详细步骤包括:
2.1)对时间进行离散化处理为指定时间粒度,对图模型G中节点和连边涉及时间的参数都进行离散化为整数,所述图模型G中节点和连边涉及时间的参数包括任意节点i的巡逻检视时间
Figure BDA0002516653560000021
在连边e的转移时间
Figure BDA0002516653560000022
基于图模型G定义超邻接矩阵sC(i,j)表示图模型G中任意一个节点到另一个节点的转移时间,若两个节点属于不同的化工厂区或其中至少有一个是交叉路口节点,那么超邻接矩阵sC(i,j)中对应位置的元素表示巡逻车在两个节点之间的转移时间
Figure BDA0002516653560000023
若两个节点是一个化工厂区的不同出入口或同一出入口,超邻接矩阵sC(i,j)中对应位置的元素表示巡逻车在该化工厂区内的巡逻检视时间
Figure BDA0002516653560000024
2.2)计算图模型G中所有节点的节点度ndi,将图模型G中所有节点根据节点度ndi从大到小的顺序进行排序;
2.3)当有多个节点的节点度相同时,根据化工园区污染物排放历史数据确定其中排放超量污染物概率较大的化工厂区,分别计算各个节点到这些化工厂的最短距离之和,并将图模型G中节点度相同的节点按照计算得到的最短距离从小到大的顺序重新排序,得到完整的节点序列;
2.4)针对排序得到的节点序列,将排在第一的节点作为第一辆巡逻车的初始位置sp1
2.5)计算已有所有节点的总覆盖厂区率cp,若总覆盖厂区率cp高于设定的第一阈值,则跳转执行步骤2.7);否则,从节点序列中选取下一个节点,跳转执行下一步;
2.6)计算该节点和已有节点的重复覆盖率cr,若重复覆盖率高于设定的第二阈值,则将该节点从节点序列中剔除,从节点序列中选取下一个节点,跳转执行步骤2.6);否则将该节点设置为下一个巡逻车的初始位置spi,跳转执行步骤2.5);
2.7)判定满足条件、输出巡逻车的数量r和每辆巡逻车的初始位置sp。
可选地,步骤3)中将图模型G进行区域划分成r个区域时得到各个区域各自的图模型为:
G1(V1,E1),G2(V2,E2),…,Gr(Vr,Er)
上式中,G1(V1,E1)~Gr(Vr,Er)分别为第1~r个区域的图模型,V1~Vr分别为第1~r个区域的节点集合,E1~Er分别为第1~r个区域的连边集合;且图模型G的超邻接矩阵sC(i,j)也同样被划分为r个区域的超邻接矩阵sC1(i,j),sC2(i,j),…,sCr(i,j)。
可选地,步骤4)中构建各辆巡逻车的巡逻转移图具体是指:针对任意负责区域k的巡逻车的图模型Gk(Vk,Ek),根据对应区域k的超邻接矩阵sCk(i,j)构建巡逻转移图pGk(pVk,pEk),巡逻转移图pGk(pVk,pEk)中横轴表示时间t,纵轴表示化工园区经过区域划分后区域k中的所有节点i,图中的每一个节点是二元组(t,i),表示巡逻车在当前时间t时处于位置节点i,其中pVk表示巡逻转移图pGk(pVk,pEk)中的节点数组,pEk表示巡逻转移图pGk(pVk,pEk)中连边数组。
可选地,根据对应区域k的超邻接矩阵sCk(i,j)构建巡逻转移图pGk(pVk,pEk)的详细步骤包括:
4.1)构建空的临时节点数组tNL、节点数组pV和连边数组pE;
4.2)设置巡逻车初始位置节点pv=(0,sp),其中sp表示该巡逻车初始位置节点;
4.3)数组初始化,将巡逻车初始位置节点pv赋值给临时节点数组tNL和节点数组pV;
4.4)判断临时节点数组tNL是否为空,如果临时节点数组tNL非空则跳转执行下一步;否则,跳转执行步骤4.6);
4.4)从临时节点数组tNL中遍历取出一个节点,定义为当前节点cv=(ct,cn),其中ct表示当前的时间,cn表示巡逻车当前所处位置节点;
4.5)构建cv的后续节点:在图模型G中,根据对应区域k的超邻接矩阵sCk(i,j)找到所有和巡逻车当前所处位置节点cn相连的节点,放入数组ccn;对数组ccn中每个节点nd,如果当前的时间ct加上转移时间符合总巡逻时间要求,那么构建一个新的节点nv=(ct+sC(cn,nd),nd)、从当前节点cv到新的节点nv的有向边ne;将有向边ne加入连边数组pE;如果新的节点nv在节点数组pV中已经存在则继续,否则将新的节点nv插入临时节点数组tNL,将新的节点nv加入节点数组pV;将当前节点cv从临时节点数组tNL中移除;跳转执行步骤4.4);
4.6)将节点数组pV和连边数组pE构建得到区域k的巡逻转移图pGk(pVk,pEk),跳转执行步骤5)。
可选地,步骤5)的详细步骤包括:
5.1)将化工厂区、巡逻车建立的巡逻博弈模型:
对参与者进行建模,将化工厂区定义为攻击者、各辆巡逻车定义为防守者;
对策略进行建模:
生成任意区域k中第i个攻击者的策略
Figure BDA0002516653560000041
如下式所示:
Figure BDA0002516653560000042
上式中,t为释放过量大气污染物的具体开始时间,dk,i为排放源的工作持续时间;
生成任意区域k中唯一的一辆巡逻车的策略
Figure BDA0002516653560000043
如下式所示:
Figure BDA0002516653560000044
上式中,策略
Figure BDA0002516653560000045
表示为区域k的巡逻转移图pGk的边际覆盖向量,其中ck(s,e)表示巡逻车在区域k中的状态s到达状态e的边际覆盖率,Π表示巡逻转移图pGk中所有连边的笛卡尔积,即区域k的巡逻转移图pGk中连边数组pEk包含的所有连边;
对收益进行建模:
生成任意区域k中防守者的收益
Figure BDA0002516653560000046
和攻击者的收益
Figure BDA0002516653560000047
如下式所示:
Figure BDA0002516653560000048
Figure BDA0002516653560000049
上式中,
Figure BDA00025166535600000410
表示攻击失败情况下的防守者获益,
Figure BDA00025166535600000411
表示攻击成功情况下的防守者损失,
Figure BDA00025166535600000412
表示攻击成功情况下的攻击者获益,
Figure BDA00025166535600000413
表示攻击失败情况下的攻击者损失,fk为攻击成功或失败的概率,概率fk的计算函数表达式如下式所示:
Figure BDA00025166535600000414
上式中,
Figure BDA00025166535600000415
为区域k中化工厂区过量排放大气污染物被固定监测站、传感器等固定监测资源探测到的概率,
Figure BDA00025166535600000416
为被巡逻车探测到的概率,概率
Figure BDA00025166535600000417
的计算函数表达式如下式所示:
Figure BDA00025166535600000418
上式中,只有当巡逻车在正在排放过量大气污染物的化工厂区内巡逻时才有一定概率探测到,在巡逻转移图pGk上表现为攻击者策略和巡逻者策略有重叠的部分,m表示重叠的情况种类数量,
Figure BDA00025166535600000419
为每一种重叠情况下的探测概率,
Figure BDA00025166535600000420
为巡逻车处于相应重叠情况的概率;
将概率
Figure BDA00025166535600000421
作为选择相应巡逻策略的概率,将防守者的策略用边际覆盖向量
Figure BDA00025166535600000422
表示,确定
Figure BDA00025166535600000423
Figure BDA00025166535600000424
的线性多项式:
Figure BDA00025166535600000425
上式中,Coem为系数矩阵,由区域k的巡逻转移图pGk得到;
最终,建立参与者、策略和收益三个要素构成的巡逻博弈模型如下式所示:
Figure BDA0002516653560000051
Figure BDA0002516653560000052
Figure BDA0002516653560000053
上式中,fk为攻击成功或失败的概率,m表示重叠的情况种类数量,
Figure BDA0002516653560000054
为区域k中化工厂区过量排放大气污染物被固定监测站、传感器等固定监测资源探测到的概率,
Figure BDA0002516653560000055
为每一种重叠情况下的探测概率,Coem为系数矩阵,
Figure BDA0002516653560000056
为边际覆盖向量,
Figure BDA0002516653560000057
表示攻击失败情况下的防守者获益,
Figure BDA0002516653560000058
表示攻击成功情况下的防守者损失,
Figure BDA0002516653560000059
表示攻击成功情况下的攻击者获益,
Figure BDA00025166535600000510
表示攻击失败情况下的攻击者损失;
5.2)在得到区域k的巡逻车的巡逻转移图pGk的基础上求解巡逻博弈模型得到各辆巡逻车的最佳巡逻路线:针对任意区域k中每个攻击者的策略(t,dk,i)计算区域k中防守者的收益
Figure BDA00025166535600000511
和攻击者的收益
Figure BDA00025166535600000512
假设攻击者策略是攻击者的最佳响应如下式所示:
Figure BDA00025166535600000513
上式中,
Figure BDA00025166535600000527
表示攻击者收益的最大值,
Figure BDA00025166535600000515
表示任意攻击者采取任意攻击策略时的收益值,t为释放过量大气污染物的具体开始时间,dk,i为排放源的工作持续时间,
Figure BDA00025166535600000516
为区域k中任意攻击者的所有攻击策略的集合;t#表示攻击者收益最大时的攻击开始时间,即攻击者收益最大时释放过量大气污染物的开始时间,
Figure BDA00025166535600000517
表示攻击者收益最大时的攻击持续时间,即攻击者收益最大时排放源的工作持续时间,
Figure BDA00025166535600000518
为用于表示防守者巡逻策略的边际覆盖向量;
设置防守者的目标如下式所示:
Figure BDA00025166535600000519
上式中,
Figure BDA00025166535600000520
表示防守者的目标,t#表示攻击者收益最大时的攻击开始时间,
Figure BDA00025166535600000521
表示攻击者收益最大时的攻击持续时间,
Figure BDA00025166535600000522
表示攻击者采取最佳攻击策略时防守者的最佳巡逻策略的边际覆盖向量,
Figure BDA00025166535600000523
为用于表示防守者巡逻策略的边际覆盖向量,
Figure BDA00025166535600000524
表示区域k中防守者的策略集合,
Figure BDA00025166535600000528
表示攻击者收益最大时防守者采取策略
Figure BDA00025166535600000526
的收益;求解获得巡逻博弈模型均衡解如下式所示:
Figure BDA0002516653560000061
上式中,
Figure BDA0002516653560000062
表示最终得到的边际覆盖向量,t*表示防守者收益最大时攻击者的攻击开始时间,
Figure BDA0002516653560000063
表示防守者收益最大时攻击者的攻击持续时间,t#表示攻击者收益最大时的攻击开始时间,
Figure BDA0002516653560000064
表示攻击者收益最大时的攻击持续时间,
Figure BDA0002516653560000065
为区域k中任意攻击者的所有攻击策略的集合,
Figure BDA0002516653560000066
表示防守者的目标;从而得到最终得到的边际覆盖向量
Figure BDA0002516653560000067
即为防守者的最优巡逻策略,并将最优巡逻策略在巡逻转移图上表示为最优巡逻路线。
此外,本实施例还提供一种基于合作机制的化工园区巡逻车调度系统,包括计算机设备,该计算机设备被编程或配置以执行所述基于合作机制的化工园区巡逻车调度方法的步骤。
此外,本实施例还提供一种基于合作机制的化工园区巡逻车调度系统,包括计算机设备,该计算机设备的存储器上存储有被编程或配置以执行所述基于合作机制的化工园区巡逻车调度方法的计算机程序。
此外,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行所述基于合作机制的化工园区巡逻车调度方法的计算机程序。
和现有技术相比,本发明具有下述优点:
1、对于化工园区环保巡逻问题,园区管理团队和化工厂区是利益相关者,也就是说,将博弈论的知识应用到化工园区内巡逻资源的日常巡逻路径安排是十分合适的。将博弈论研究应用到化工园区的巡逻车调度合作时,从微观角度考虑每一辆巡逻车在巡逻过程中的合作和冲突,解决多巡逻车中每辆车可行巡逻路线问题是一个指数增长的问题,因此从宏观的角度来考虑合作机制,根据巡逻车的初始数量,在巡逻开始前将整个化工园区划分成相同数量的区域,每个区域分配一辆巡逻车进行巡逻。因此本发明将博弈模型和合作巡逻机制结合在一起,提出基于合作机制的化工园区环保巡逻博弈模型。在巡逻过程中,本发明将化工园区静态划分为多个区域避免冲突以实现合作,在此基础上给出各巡逻车的优化使用方案,能够提高资源的利用率、保证巡逻的效果,可有效减少化工厂区排放过量大气污染物的概率。
2、本发明适用于多种安防场景的巡逻问题,具有用户定制能力好、开发过程简单高效、效果好的优点。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例中建立图模型G的后续化工园区道路网络建模流程示意图。
图3为本发明实施例中确定巡逻车初始配置的流程示意图。
图4为本发明实施例中化工园区区域划分的流程示意图。
图5为本发明实施例中构建巡逻转移图的流程示意图。
图6为本发明实施例中分区后某个区域k的道路网络的图模型。
图7为根据图6所示区域k的超邻接矩阵构建得到的巡逻转移图。
图8为本发明实施例中双方收益的建模流程示意图。
具体实施方式
下文以针对上海化工园区进行基于合作机制的环保巡逻博弈建模为例,对本发明基于合作机制的化工园区巡逻车调度方法、系统及介质进行进一步的详细说明。需说明的是,本实施例还可以应用到其他各个不同的化工园区以及其他安防领域中,在此不再赘述。
如图1所示,本实施例基于合作机制的化工园区巡逻车调度方法的实施步骤包括:
1)对化工园区的道路网络进行建模得到图模型G;
2)确定巡逻车的初始配置,包括巡逻车的数量r和每辆巡逻车的初始位置sp;
3)将图模型G进行区域划分成r个区域,每个区域分配一辆巡逻车;
4)构建各辆巡逻车的巡逻转移图pG;
5)将化工厂区、巡逻车建立巡逻博弈模型,在得到各辆巡逻车的巡逻转移图的基础上求解巡逻博弈模型得到各辆巡逻车的最佳巡逻路线。
每一片待巡逻的化工园区都由多个化工厂区组成,对园区内的道路网络进行建模,将实际的化工园区待巡逻区域转化成由点和连边组成的图模型,以便后续根据实际巡逻情况将时间离散化,确定巡逻时间和转移时间并得到超邻接矩阵。本实施例中,步骤1)中得到图模型G由节点集合V和连边集合E构成,其中节点集合V中的节点由化工园区内每个化工厂区的车辆出入口或道路交叉口构成,连边集合E中的连边由图模型G中的节点根据化工园区内实际的化工厂区及道路的连接情况连接而成,且同一个化工厂区的多个不同车辆出入口节点之间增加连边连接,图模型G可表示为G(V,E)。
本实施例提出的巡逻博弈模型包含多辆巡逻车,需要在巡逻开始前确定巡逻车的初始配置,包括所需巡逻车的数量r和各辆巡逻车的初始位置sp。
如图3所示,本实施例中步骤2)的详细步骤包括:
2.1)对时间进行离散化处理为指定时间粒度(指定的h分钟或秒或小时,可根据实际巡逻情况确定),对图模型G中节点和连边涉及时间的参数都进行离散化为整数,所述图模型G中节点和连边涉及时间的参数包括任意节点i的巡逻检视时间
Figure BDA0002516653560000071
在连边e的转移时间
Figure BDA0002516653560000072
基于图模型G定义超邻接矩阵sC(i,j)表示图模型G中任意一个节点到另一个节点的转移时间,若两个节点属于不同的化工厂区或其中至少有一个是交叉路口节点,那么超邻接矩阵sC(i,j)中对应位置的元素表示巡逻车在两个节点之间的转移时间
Figure BDA0002516653560000073
若两个节点是一个化工厂区的不同出入口或同一出入口,超邻接矩阵sC(i,j)中对应位置的元素表示巡逻车在该化工厂区内的巡逻检视时间
Figure BDA0002516653560000081
2.2)计算图模型G中所有节点的节点度ndi,将图模型G中所有节点根据节点度ndi从大到小的顺序进行排序;
2.3)当有多个节点的节点度相同时,根据化工园区污染物排放历史数据确定其中排放超量污染物概率较大的化工厂区,分别计算各个节点到这些化工厂的最短距离之和,并将图模型G中节点度相同的节点按照计算得到的最短距离从小到大的顺序重新排序,得到完整的节点序列;
2.4)针对排序得到的节点序列,将排在第一的节点作为第一辆巡逻车的初始位置sp1
2.5)计算已有所有节点的总覆盖厂区率cp,若总覆盖厂区率cp高于设定的第一阈值,则跳转执行步骤2.7);否则从节点序列中选取下一个节点,跳转执行下一步;
2.6)计算该节点和已有节点的重复覆盖率cr,若重复覆盖率高于设定的第二阈值,则将该节点从节点序列中剔除,从节点序列中选取下一个节点,跳转执行步骤2.6);否则将该节点设置为下一个巡逻车的初始位置spi,跳转执行步骤2.5);
2.7)判定满足条件、输出巡逻车的数量r和每辆巡逻车的初始位置sp。
确定巡逻车的初始配置包括巡逻车的数量和每辆巡逻车的初始位置,本实施例中采用贪婪算法的思想设计了节点度ndi、总覆盖厂区率cp和重复覆盖率cr三个量作为优选标准。
节点度ndi:节点度是指与一个节点相关联的边的条数。本实施例中的节点有化工厂区车辆出入口和十字路口之分,其中表示十字路口的节点只是起到连接作用,而表示化工厂区车辆出入口的节点才是巡逻的重点对象,因此本实施例中的节点度ndi定义为与该节点连接的所有表示化工厂区车辆出入口的节点(包括该节点自身)的数量,而不是传统意义上的关联的边的数量。
总覆盖厂区率cp:先定义节点覆盖范围
Figure BDA0002516653560000082
为与节点i连接的所有节点(包括该节点自身)代表的化工厂区,定义节点覆盖厂区率
Figure BDA0002516653560000083
为节点i覆盖范围
Figure BDA0002516653560000084
中包含的化工厂区的数量占整个化工园区场景内化工厂区总量的比例,其中代表一个化工厂区的多个不同的出入口节点表示同一个化工厂区。总覆盖厂区率cp为所有巡逻车初始节点覆盖范围内的不同化工厂区的总数量占整个化工园区化工厂区总量的比例。
重复覆盖率cr:当巡逻车数量大于1,也就是初始位置节点数量大于1时,每新增加一个初始节点就有可能造成不同节点的覆盖范围包含相同的节点,也就是覆盖范围发生重叠,将重复覆盖率cr定义为包含的相同节点数量占总覆盖范围内表示化工厂区的不同节点总数量的比例。
在实际巡逻过程中,使用多辆巡逻车同时进行巡逻时,每辆巡逻车自主选择巡逻路线,有可能出现多辆巡逻车同时巡逻一条道路或一个化工厂区的情况,造成资源浪费。为了提高资源利用率,提高巡逻效果,需要考虑多辆巡逻车的合作机制。本实施例根据巡逻车的数量r,将待巡逻化工园区划分成r个区域,每个区域分配一辆巡逻车进行巡逻。对化工园区区域进行划分,这是合作巡逻的机制。通过几个约束条件,获得多种区域划分的方案,以一定的约束条件为标准,选出最优的区域划分方案,对于划分后每个独立的区域,都要进行道路网络建模,计算超邻接矩阵。本实施例中步骤3)中将图模型G进行区域划分成r个区域时得到各个区域各自的图模型为:
G1(V1,E1),G2(V2,E2),…,Gr(Vr,Er)
上式中,G1(V1,E1)~Gr(Vr,Er)分别为第1~r个区域的图模型,V1~Vr分别为第1~r个区域的节点集合,E1~Er分别为第1~r个区域的连边集合;且图模型G的超邻接矩阵sC(i,j)也同样被划分为r个区域的超邻接矩阵sC1(i,j),sC2(i,j),…,sCr(i,j)。化工园区具体的区域划分时,以每辆巡逻车的初始位置sp为中心划分区域,计算各个节点到各个初始位置的最短距离,将距离初始位置最近的节点和该初始位置节点划分在同一个区域,如果某一个节点到多个初始位置距离相同,那么待其他节点分配完后分配给包含节点较少的区域,以此保证每个区域内节点数量尽量相等。另外,化工园区中有两个及两个以上出入口的化工厂区在划分时要求同一个化工厂区的多个出入口划分在同一个区域内。区域划分好后,将两个区域交界处代表不同区域的两个节点之间的道路直接去掉,形成多个独立的区域。对划分好的各个区域重新进行道路网络建模,构建各自的图模型Gk(Vk,Ek),同时定义区域划分后每个区域的超邻接矩阵sCk(i,j)。本实施例中在图模型中巡逻车的巡逻过程如下:(a)多辆巡逻车在巡逻开始时从不同的初始位置节点出发;(b)巡逻车在图G中的节点和连边上移动;(c)当到达一个节点时,若该节点是化工厂区车辆出入口,那么巡逻车将决定是否花费特定时间段
Figure BDA0002516653560000091
检查该厂区,或者消耗一段时间
Figure BDA0002516653560000092
立即转移到另一个节点,若该节点是十字路口节点,则巡逻车选择一条路径消耗时间
Figure BDA0002516653560000093
转移到其他节点;(d)当巡逻车的最大预算巡逻时间T消耗完时,巡逻队终止巡逻。在上面描述中,
Figure BDA0002516653560000094
Figure BDA0002516653560000095
分别表示在节点i中的巡逻检视时间和连边e上的转移时间;T表示最大预算巡逻时间。
图6所示为一个案例分区后其中一个区域的道路网络的图模型,圆圈表示化工厂区的出入口节点,Cr表示交叉路口节点,道路建模成连边;该区域的超邻接矩阵如下:
表1:该区域的超邻接矩阵。
节点 B1 B2 Cr2 F1 Cr3 H1
B1 11 11 1
B2 11 11 2
Cr2 1 2 2
F1 2 7 2
Cr3 2 2 1
H1 1 4
上表中,超邻接矩阵中的元素为巡逻检视时间或转移时间,∞表示未直接相连。
本实施例中,步骤4)中构建各辆巡逻车的巡逻转移图具体是指:针对任意负责区域k的巡逻车的图模型Gk(Vk,Ek),根据对应区域k的超邻接矩阵sCk(i,j)构建巡逻转移图pGk(pVk,pEk),巡逻转移图pGk(pVk,pEk)中横轴表示时间t,纵轴表示化工园区经过区域划分后区域k中的所有节点i,图中的每一个节点是二元组(t,i),表示巡逻车在当前时间t时处于位置节点i,其中pVk表示巡逻转移图pGk(pVk,pEk)中的节点数组,pEk表示巡逻转移图pGk(pVk,pEk)中连边数组。
本实施例中,根据对应区域k的超邻接矩阵sCk(i,j)构建巡逻转移图pGk(pVk,pEk)的详细步骤包括:
4.1)构建空的临时节点数组tNL、节点数组pV和连边数组pE;
4.2)设置巡逻车初始位置节点pv=(0,sp),其中sp表示该巡逻车初始位置节点;
4.3)数组初始化,将巡逻车初始位置节点pv赋值给临时节点数组tNL和节点数组pV;
4.4)判断临时节点数组tNL是否为空,如果临时节点数组tNL非空则跳转执行下一步;否则,跳转执行步骤4.6);
4.4)从临时节点数组tNL中遍历取出一个节点,定义为当前节点cv=(ct,cn),其中ct表示当前的时间,cn表示巡逻车当前所处位置节点;
4.5)构建cv的后续节点:在图模型G中,根据对应区域k的超邻接矩阵sCk(i,j)找到所有和巡逻车当前所处位置节点cn相连的节点,放入数组ccn;对数组ccn中每个节点nd,如果当前的时间ct加上转移时间符合总巡逻时间要求,那么构建一个新的节点nv=(ct+sC(cn,nd),nd)、从当前节点cv到新的节点nv的有向边ne;将有向边ne加入连边数组pE;如果新的节点nv在节点数组pV中已经存在则继续,否则将新的节点nv插入临时节点数组tNL,将新的节点nv加入节点数组pV;将当前节点cv从临时节点数组tNL中移除;跳转执行步骤4.4);
4.6)将节点数组pV和连边数组pE构建得到区域k的巡逻转移图pGk(pVk,pEk),跳转执行步骤5)。
图7为根据图6所示区域的超邻接矩阵构建得到的巡逻转移图,横坐标是时间,纵坐标是化工厂区节点,图中的节点表示巡逻车在时间t所处的位置。在图7中,巡逻车在时间0从交叉路口节点Cr2开始巡逻,可以以一定的概率前往节点B1、B2或F1,到达后可以选择巡逻或者转移至另一个节点。
巡逻博弈模型中包含参与者、策略和收益三个重要因素,需要依次对这三个要素进行建模。参与者被建模为两个对抗的理性行为人,分别是化工厂区和化工园区的巡逻队即多辆巡逻车,后者在博弈中是“防守者”或“领导者”,目标是通过合理配置多辆巡逻车的巡逻计划,以较低的成本检测出更多化工厂区排放过量大气污染物的行为,提高自身收益;前者是“攻击者”或“跟随者”,在观察巡逻车的巡逻路线后,试图通过释放过量的大气污染物以增加他们的利润。攻击者(化工厂区)的策略由两部分组成:释放过量大气污染物的具体开始时间t和排放源的工作持续时间k;防守者(多辆巡逻车)有多个,但经过区域划分后每个区域中只有一辆巡逻车,每一辆巡逻车的策略是其所在区域的巡逻转移图的边际覆盖率。最后再对攻击者和防守者的收益进行建模,通过攻击者成功或失败的概率f来表示,概率f与化工厂区过量排放大气污染物被固定监测站、传感器等固定监测资源探测到的概率和被巡逻车探测到的概率都是相关的。本实施例中,攻击者的收益由其未经废气处理设备工作排放过量大气污染物得到的经济收获Ga、过量排放被探测到的惩罚Pa和攻击成功的概率f决定,相似得,防守者的收益由巡逻车成功探测到攻击者排放过量大气污染物行为的奖励Rd、未成功探测的损失Ld和成功探测的概率f决定,攻击者攻击成功则意味着防守者未成功探测到。其中,Ga、Pa、Rd和Ld均是由化工园区管理团队的专家提供的数据,只有概率f的值需要通过计算得到。化工园区中除了使用巡逻车探测化工厂区的违规行为,固定监测站和传感器同样也会对园区内的污染物气体进行监测,这些固定监测资源有fcpep的概率探测到化工厂区的违规行为,这个数值通过其他的博弈模型计算获得,使用巡逻车探测到化工厂区违规行为的概率为fp。巡逻车能够探测到化工厂区违规行为要求化工厂区排放过量大气污染物时恰好巡逻车正在该化工厂区内巡逻,也就是说,巡逻车的策略和攻击者的策略有重叠的情况下,巡逻车存在一定概率探测到化工厂区违规行为。
图7所示的巡逻转移图中所有的细线是巡逻车在该区域内所有可能的巡逻策略,一个完整的巡逻路线由图中的一系列边组成,满足第一条边的起点的入度为0(是初始巡逻位置节点),最后一条边的终点的出度为0(在图中没有后续节点),中间其他边的节点前后相互连接。上侧黑色加粗的线段就是其中一种可能的巡逻路线,用边际覆盖向量表示。紧靠横坐标上侧的加粗线段为攻击者的策略,图7中攻击者从t=1开始攻击化工厂区B。巡逻车探测到攻击者在巡逻转移图中表现为紧靠横坐标上侧的加粗线段和细线的重叠(细线表示多种巡逻策略),概率
Figure BDA0002516653560000121
通过重叠情况计算得到,每种重叠情况下被探测到的概率σm不同,τm为相应巡逻策略的概率。
本实施例中,步骤5)的详细步骤包括:
5.1)将化工厂区、巡逻车建立的巡逻博弈模型:
对参与者进行建模,将化工厂区定义为攻击者、各辆巡逻车定义为防守者;
对策略进行建模:
生成任意区域k中第i个攻击者的策略
Figure BDA0002516653560000122
如下式所示:
Figure BDA0002516653560000123
上式中,t为释放过量大气污染物的具体开始时间,dk,i为排放源的工作持续时间;
生成任意区域k中唯一的一辆巡逻车的策略
Figure BDA0002516653560000124
如下式所示:
Figure BDA0002516653560000125
上式中,策略
Figure BDA0002516653560000126
表示为区域k的巡逻转移图pGk的边际覆盖向量,其中ck(s,e)表示巡逻车在区域k中的状态s到达状态e的边际覆盖率,Π表示巡逻转移图pGk中所有连边的笛卡尔积,即区域k的巡逻转移图pGk中连边数组pEk包含的所有连边;
对收益进行建模:
生成任意区域k中防守者的收益
Figure BDA0002516653560000127
和攻击者的收益
Figure BDA0002516653560000128
如下式所示:
Figure BDA0002516653560000129
Figure BDA00025166535600001210
上式中,
Figure BDA00025166535600001211
表示攻击失败情况下的防守者获益,
Figure BDA00025166535600001212
表示攻击成功情况下的防守者损失,
Figure BDA00025166535600001213
表示攻击成功情况下的攻击者获益,
Figure BDA00025166535600001214
表示攻击失败情况下的攻击者损失,fk为攻击成功或失败的概率,概率fk的计算函数表达式如下式所示:
Figure BDA00025166535600001215
上式中,
Figure BDA00025166535600001216
为区域k中化工厂区过量排放大气污染物被固定监测站、传感器等固定监测资源探测到的概率,
Figure BDA00025166535600001217
为被巡逻车探测到的概率,概率
Figure BDA00025166535600001218
的计算函数表达式如下式所示:
Figure BDA00025166535600001219
上式中,只有当巡逻车在正在排放过量大气污染物的化工厂区内巡逻时才有一定概率探测到,在巡逻转移图pGk上表现为攻击者策略和巡逻者策略有重叠的部分,m表示重叠的情况种类数量,
Figure BDA0002516653560000131
为每一种重叠情况下的探测概率,
Figure BDA0002516653560000132
为巡逻车处于相应重叠情况的概率;
将概率
Figure BDA0002516653560000133
作为选择相应巡逻策略的概率,将防守者的策略用边际覆盖向量
Figure BDA0002516653560000134
表示,确定
Figure BDA0002516653560000135
Figure BDA0002516653560000136
的线性多项式:
Figure BDA0002516653560000137
上式中,Coem为系数矩阵,由区域k的巡逻转移图pGk得到;
最终,建立参与者、策略和收益三个要素构成的巡逻博弈模型如下式所示:
Figure BDA0002516653560000138
Figure BDA0002516653560000139
Figure BDA00025166535600001310
上式中,fk为攻击成功或失败的概率,m表示重叠的情况种类数量,
Figure BDA00025166535600001311
为区域k中化工厂区过量排放大气污染物被固定监测站、传感器等固定监测资源探测到的概率,
Figure BDA00025166535600001312
为每一种重叠情况下的探测概率,Coem为系数矩阵,
Figure BDA00025166535600001313
为边际覆盖向量,
Figure BDA00025166535600001314
表示攻击失败情况下的防守者获益,
Figure BDA00025166535600001315
表示攻击成功情况下的防守者损失,
Figure BDA00025166535600001316
表示攻击成功情况下的攻击者获益,
Figure BDA00025166535600001317
表示攻击失败情况下的攻击者损失;
5.2)在得到区域k的巡逻车的巡逻转移图pGk的基础上求解巡逻博弈模型得到各辆巡逻车的最佳巡逻路线:针对任意区域k中每个攻击者的策略(t,dk,i)计算区域k中防守者的收益
Figure BDA00025166535600001318
和攻击者的收益
Figure BDA00025166535600001319
假设攻击者策略是攻击者的最佳响应如下式所示:
Figure BDA00025166535600001320
上式中,
Figure BDA00025166535600001321
表示攻击者收益的最大值,
Figure BDA00025166535600001322
表示任意攻击者采取任意攻击策略时的收益值,t为释放过量大气污染物的具体开始时间,dk,i为排放源的工作持续时间,
Figure BDA00025166535600001323
为区域k中任意攻击者的所有攻击策略的集合;t#表示攻击者收益最大时的攻击开始时间,即攻击者收益最大时释放过量大气污染物的开始时间,
Figure BDA00025166535600001324
表示攻击者收益最大时的攻击持续时间,即攻击者收益最大时排放源的工作持续时间,
Figure BDA00025166535600001325
为用于表示防守者巡逻策略的边际覆盖向量;
设置防守者的目标如下式所示:
Figure BDA00025166535600001326
上式中,
Figure BDA0002516653560000141
表示防守者的目标,t#表示攻击者收益最大时的攻击开始时间,
Figure BDA0002516653560000142
表示攻击者收益最大时的攻击持续时间,
Figure BDA0002516653560000143
表示攻击者采取最佳攻击策略时防守者的最佳巡逻策略的边际覆盖向量,
Figure BDA0002516653560000144
为用于表示防守者巡逻策略的边际覆盖向量,
Figure BDA0002516653560000145
表示区域k中防守者的策略集合,
Figure BDA0002516653560000146
表示攻击者收益最大时防守者采取策略
Figure BDA00025166535600001426
的收益;求解获得巡逻博弈模型均衡解如下式所示:
Figure BDA0002516653560000148
上式中,
Figure BDA0002516653560000149
表示最终得到的边际覆盖向量,t*表示防守者收益最大时攻击者的攻击开始时间,
Figure BDA00025166535600001410
表示防守者收益最大时攻击者的攻击持续时间,t#表示攻击者收益最大时的攻击开始时间,
Figure BDA00025166535600001411
表示攻击者收益最大时的攻击持续时间,
Figure BDA00025166535600001412
为区域k中任意攻击者的所有攻击策略的集合,
Figure BDA00025166535600001413
表示防守者的目标;从而得到最终得到的边际覆盖向量
Figure BDA00025166535600001414
即为防守者的最优巡逻策略,并将最优巡逻策略在巡逻转移图上表示为最优巡逻路线。
如图8所示,针对任意区域k中每个攻击者的策略(t,dk,i)计算区域k中防守者的收益
Figure BDA00025166535600001415
和攻击者的收益
Figure BDA00025166535600001416
的步骤如下:当巡逻者巡逻路径中一条连边pe(pe为连边集合pE中的元素)时,首先判断连边pe的起点和终点为同一个化工厂区、连边pe和攻击者策略有重叠是否同时成立,如果成立则计算攻击者被巡逻车探测到的概率
Figure BDA00025166535600001417
计算攻击者攻击成功或失败的概率fk,最后根据下式计算区域k中防守者的收益
Figure BDA00025166535600001418
和攻击者的收益
Figure BDA00025166535600001419
Figure BDA00025166535600001420
Figure BDA00025166535600001421
上式中,
Figure BDA00025166535600001422
表示攻击失败情况下的防守者获益,
Figure BDA00025166535600001423
表示攻击成功情况下的防守者损失,
Figure BDA00025166535600001424
表示攻击成功情况下的攻击者获益,
Figure BDA00025166535600001425
表示攻击失败情况下的攻击者损失,fk为攻击成功或失败的概率。
综上所述,本实施例基于合作机制的化工园区巡逻车调度方法将化工园区道路网络进行图建模,将时间离散化;确定巡逻车的初始配置,包括所需巡逻车的数量和每辆巡逻车的初始位置;基于合作巡逻机制和各种约束条件,将待巡逻的整个化工园区区域划分成多个小区域;针对每个区域的巡逻场景构建巡逻转移图;构建环保巡逻博弈模型并计算给出每辆巡逻车的巡逻路线。本实施例基于合作机制的化工园区巡逻车调度方法适用于多种安防场景的巡逻问题,具有用户定制能力好、开发过程简单高效、效果好的优点。本实施例基于合作机制的化工园区巡逻车调度方法通过实现较大空间的化工园区的环保巡逻博弈建模,在该模型中运用合作机制将较大空间的化工园区划分成多个区域,对每个区域进行环保巡逻博弈建模,既保证了模型的有效性,也更符合化工园区面积大的现实实际,为化工园区管理者团队的巡逻车巡逻路径提供支撑。
此外,本实施例还提供一种基于合作机制的化工园区巡逻车调度系统,包括计算机设备,该计算机设备被编程或配置以执行所述基于合作机制的化工园区巡逻车调度方法的步骤,或者该计算机设备的存储器上存储有被编程或配置以执行所述基于合作机制的化工园区巡逻车调度方法的计算机程序。
此外,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行所述基于合作机制的化工园区巡逻车调度方法的计算机程序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于合作机制的化工园区巡逻车调度方法,其特征在于实施步骤包括:
1)对化工园区的道路网络进行建模得到图模型G;
2)确定巡逻车的初始配置,包括巡逻车的数量r和每辆巡逻车的初始位置sp;
3)将图模型G进行区域划分成r个区域,每个区域分配一辆巡逻车;
4)构建各辆巡逻车的巡逻转移图pG;
5)将化工厂区、巡逻车建立巡逻博弈模型,在得到各辆巡逻车的巡逻转移图的基础上求解巡逻博弈模型得到各辆巡逻车的最佳巡逻路线。
2.根据权利要求1所述的基于合作机制的化工园区巡逻车调度方法,其特征在于,步骤1)中得到图模型G由节点集合V和连边集合E构成,其中节点集合V中的节点由化工园区内每个化工厂区的车辆出入口或道路交叉口构成,连边集合E中的连边由图模型G中的节点根据化工园区内实际的化工厂区及道路的连接情况连接而成,且同一个化工厂区的多个不同车辆出入口节点之间增加连边连接。
3.根据权利要求1所述的基于合作机制的化工园区巡逻车调度方法,其特征在于,步骤2)的详细步骤包括:
2.1)对时间进行离散化处理为指定时间粒度,对图模型G中节点和连边涉及时间的参数都进行离散化为整数,所述图模型G中节点和连边涉及时间的参数包括任意节点i的巡逻检视时间
Figure FDA0002516653550000011
在连边e的转移时间
Figure FDA0002516653550000012
基于图模型G定义超邻接矩阵sC(i,j)表示图模型G中任意一个节点到另一个节点的转移时间,若两个节点属于不同的化工厂区或其中至少有一个是交叉路口节点,那么超邻接矩阵sC(i,j)中对应位置的元素表示巡逻车在两个节点之间的转移时间
Figure FDA0002516653550000013
若两个节点是一个化工厂区的不同出入口或同一出入口,超邻接矩阵sC(i,j)中对应位置的元素表示巡逻车在该化工厂区内的巡逻检视时间
Figure FDA0002516653550000014
2.2)计算图模型G中所有节点的节点度ndi,将图模型G中所有节点根据节点度ndi从大到小的顺序进行排序;
2.3)当有多个节点的节点度相同时,根据化工园区污染物排放历史数据确定其中排放超量污染物概率较大的化工厂区,分别计算各个节点到这些化工厂区的最短距离之和,并将图模型G中节点度相同的节点按照计算得到的最短距离从小到大的顺序重新排序,得到完整的节点序列;
2.4)针对排序得到的节点序列,将排在第一的节点作为第一辆巡逻车的初始位置sp1
2.5)计算已有所有节点的总覆盖厂区率cp,若总覆盖厂区率cp高于设定的第一阈值,则跳转执行步骤2.7);否则从节点序列中选取下一个节点,跳转执行下一步;
2.6)计算该节点和已有节点的重复覆盖率cr,若重复覆盖率高于设定的第二阈值,则将该节点从节点序列中剔除,从节点序列中选取下一个节点,跳转执行步骤2.6);否则将该节点设置为下一个巡逻车的初始位置spi,跳转执行步骤2.5);
2.7)判定满足条件、输出巡逻车的数量r和每辆巡逻车的初始位置sp。
4.根据权利要求3所述的基于合作机制的化工园区巡逻车调度方法,其特征在于,步骤3)中将图模型G进行区域划分成r个区域时得到各个区域各自的图模型为:
G1(V1,E1),G2(V2,E2),…,Gr(Vr,Er)
上式中,G1(V1,E1)~Gr(Vr,Er)分别为第1~r个区域的图模型,V1~Vr分别为第1~r个区域的节点集合,E1~Er分别为第1~r个区域的连边集合;且图模型G的超邻接矩阵sC(i,j)也同样被划分为r个区域的超邻接矩阵sC1(i,j),sC2(i,j),…,sCr(i,j)。
5.根据权利要求4所述的基于合作机制的化工园区巡逻车调度方法,其特征在于,步骤4)中构建各辆巡逻车的巡逻转移图具体是指:针对任意负责区域k的巡逻车的图模型Gk(Vk,Ek),根据对应区域k的超邻接矩阵sCk(i,j)构建巡逻转移图pGk(pVk,pEk),巡逻转移图pGk(pVk,pEk)中横轴表示时间t,纵轴表示化工园区经过区域划分后区域k中的所有节点i,图中的每一个节点是二元组(t,i),表示巡逻车在当前时间t时处于位置节点i,其中pVk表示巡逻转移图pGk(pVk,pEk)中的节点数组,pEk表示巡逻转移图pGk(pVk,pEk)中连边数组。
6.根据权利要求5所述的基于合作机制的化工园区巡逻车调度方法,其特征在于,根据对应区域k的超邻接矩阵sCk(i,j)构建巡逻转移图pGk(pVk,pEk)的详细步骤包括:
4.1)构建空的临时节点数组tNL、节点数组pV和连边数组pE;
4.2)设置巡逻车初始位置节点pv=(0,sp),其中sp表示该巡逻车初始位置节点;
4.3)数组初始化,将巡逻车初始位置节点pv赋值给临时节点数组tNL和节点数组pV;
4.4)判断临时节点数组tNL是否为空,如果临时节点数组tNL非空则跳转执行下一步;否则,跳转执行步骤4.6);
4.4)从临时节点数组tNL中遍历取出一个节点,定义为当前节点cv=(ct,cn),其中ct表示当前的时间,cn表示巡逻车当前所处位置节点;
4.5)构建cv的后续节点:在图模型G中,根据对应区域k的超邻接矩阵sCk(i,j)找到所有和巡逻车当前所处位置节点cn相连的节点,放入数组ccn;对数组ccn中每个节点nd,如果当前的时间ct加上转移时间符合总巡逻时间要求,那么构建一个新的节点nv=(ct+sC(cn,nd),nd)、从当前节点cv到新的节点nv的有向边ne;将有向边ne加入连边数组pE;如果新的节点nv在节点数组pV中已经存在则继续,否则将新的节点nv插入临时节点数组tNL,将新的节点nv加入节点数组pV;将当前节点cv从临时节点数组tNL中移除;跳转执行步骤4.4);
4.6)将节点数组pV和连边数组pE构建得到区域k的巡逻转移图pGk(pVk,pEk),跳转执行步骤5)。
7.根据权利要求1所述的基于合作机制的化工园区巡逻车调度方法,其特征在于,步骤5)的详细步骤包括:
5.1)将化工厂区、巡逻车建立的巡逻博弈模型:
对参与者进行建模,将化工厂区定义为攻击者、各辆巡逻车定义为防守者;
对策略进行建模:
生成任意区域k中第i个攻击者的策略
Figure FDA0002516653550000031
如下式所示:
Figure FDA0002516653550000032
上式中,t为释放过量大气污染物的具体开始时间,dk,i为排放源的工作持续时间;
生成任意区域k中唯一的一辆巡逻车的策略
Figure FDA0002516653550000033
如下式所示:
Figure FDA0002516653550000034
上式中,策略
Figure FDA0002516653550000035
表示为区域k的巡逻转移图pGk的边际覆盖向量,其中ck(s,e)表示巡逻车在区域k中的状态s到达状态e的边际覆盖率,Π表示巡逻转移图pGk中所有连边的笛卡尔积,即区域k的巡逻转移图pGk中连边数组pEk包含的所有连边;
对收益进行建模:
生成任意区域k中防守者的收益
Figure FDA0002516653550000036
和攻击者的收益
Figure FDA0002516653550000037
如下式所示:
Figure FDA0002516653550000038
Figure FDA0002516653550000039
上式中,
Figure FDA00025166535500000310
表示攻击失败情况下的防守者获益,
Figure FDA00025166535500000311
表示攻击成功情况下的防守者损失,
Figure FDA00025166535500000312
表示攻击成功情况下的攻击者获益,
Figure FDA00025166535500000313
表示攻击失败情况下的攻击者损失,fk为攻击成功或失败的概率,概率fk的计算函数表达式如下式所示:
Figure FDA00025166535500000314
上式中,
Figure FDA00025166535500000315
为区域k中化工厂区过量排放大气污染物被固定监测站、传感器等固定监测资源探测到的概率,
Figure FDA00025166535500000316
为被巡逻车探测到的概率,概率
Figure FDA00025166535500000317
的计算函数表达式如下式所示:
Figure FDA00025166535500000318
上式中,只有当巡逻车在正在排放过量大气污染物的化工厂区内巡逻时才有一定概率探测到,在巡逻转移图pGk上表现为攻击者策略和巡逻者策略有重叠的部分,m表示重叠的情况种类数量,
Figure FDA0002516653550000041
为每一种重叠情况下的探测概率,
Figure FDA0002516653550000042
为巡逻车处于相应重叠情况的概率;
将概率
Figure FDA0002516653550000043
作为选择相应巡逻策略的概率,将防守者的策略用边际覆盖向量
Figure FDA0002516653550000044
表示,确定
Figure FDA0002516653550000045
Figure FDA0002516653550000046
的线性多项式:
Figure FDA0002516653550000047
上式中,Coem为系数矩阵,由区域k的巡逻转移图pGk得到;
最终,建立参与者、策略和收益三个要素构成的巡逻博弈模型如下式所示:
Figure FDA0002516653550000048
Figure FDA0002516653550000049
Figure FDA00025166535500000410
上式中,fk为攻击成功或失败的概率,m表示重叠的情况种类数量,
Figure FDA00025166535500000411
为区域k中化工厂区过量排放大气污染物被固定监测站、传感器等固定监测资源探测到的概率,
Figure FDA00025166535500000412
为每一种重叠情况下的探测概率,Coem为系数矩阵,
Figure FDA00025166535500000413
为边际覆盖向量,
Figure FDA00025166535500000414
表示攻击失败情况下的防守者获益,
Figure FDA00025166535500000415
表示攻击成功情况下的防守者损失,
Figure FDA00025166535500000416
表示攻击成功情况下的攻击者获益,
Figure FDA00025166535500000417
表示攻击失败情况下的攻击者损失;
5.2)在得到区域k的巡逻车的巡逻转移图pGk的基础上求解巡逻博弈模型得到各辆巡逻车的最佳巡逻路线:针对任意区域k中每个攻击者的策略(t,dk,i)计算区域k中防守者的收益
Figure FDA00025166535500000418
和攻击者的收益
Figure FDA00025166535500000419
假设攻击者策略是攻击者的最佳响应如下式所示:
Figure FDA00025166535500000420
上式中,
Figure FDA00025166535500000421
表示攻击者收益的最大值,
Figure FDA00025166535500000422
表示任意攻击者采取任意攻击策略时的收益值,t为释放过量大气污染物的具体开始时间,dk,i为排放源的工作持续时间,
Figure FDA00025166535500000423
为区域k中任意攻击者的所有攻击策略的集合;t#表示攻击者收益最大时的攻击开始时间,即攻击者收益最大时释放过量大气污染物的开始时间,
Figure FDA00025166535500000424
表示攻击者收益最大时的攻击持续时间,即攻击者收益最大时排放源的工作持续时间,
Figure FDA00025166535500000425
为用于表示防守者巡逻策略的边际覆盖向量;
设置防守者的目标如下式所示:
Figure FDA00025166535500000426
上式中,
Figure FDA00025166535500000427
表示防守者的目标,t#表示攻击者收益最大时的攻击开始时间,
Figure FDA0002516653550000051
表示攻击者收益最大时的攻击持续时间,
Figure FDA0002516653550000052
表示攻击者采取最佳攻击策略时防守者的最佳巡逻策略的边际覆盖向量,
Figure FDA0002516653550000053
为用于表示防守者巡逻策略的边际覆盖向量,
Figure FDA0002516653550000054
表示区域k中防守者的策略集合,
Figure FDA0002516653550000055
表示攻击者收益最大时防守者采取策略
Figure FDA0002516653550000056
的收益;求解获得巡逻博弈模型均衡解如下式所示:
Figure FDA0002516653550000057
上式中,
Figure FDA0002516653550000058
表示最终得到的边际覆盖向量,t*表示防守者收益最大时攻击者的攻击开始时间,
Figure FDA0002516653550000059
表示防守者收益最大时攻击者的攻击持续时间,t#表示攻击者收益最大时的攻击开始时间,
Figure FDA00025166535500000510
表示攻击者收益最大时的攻击持续时间,
Figure FDA00025166535500000511
为区域k中任意攻击者的所有攻击策略的集合,
Figure FDA00025166535500000512
表示防守者的目标;从而得到最终得到的边际覆盖向量
Figure FDA00025166535500000513
即为防守者的最优巡逻策略,并将最优巡逻策略在巡逻转移图上表示为最优巡逻路线。
8.一种基于合作机制的化工园区巡逻车调度系统,包括计算机设备,其特征在于,该计算机设备被编程或配置以执行权利要求1~7中任意一项所述基于合作机制的化工园区巡逻车调度方法的步骤。
9.一种基于合作机制的化工园区巡逻车调度系统,包括计算机设备,其特征在于,该计算机设备的存储器上存储有被编程或配置以执行权利要求1~7中任意一项所述基于合作机制的化工园区巡逻车调度方法的计算机程序。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有被编程或配置以执行权利要求1~7中任意一项所述基于合作机制的化工园区巡逻车调度方法的计算机程序。
CN202010478820.7A 2020-05-29 2020-05-29 基于合作机制的化工园区巡逻车调度方法、系统及介质 Active CN111832801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010478820.7A CN111832801B (zh) 2020-05-29 2020-05-29 基于合作机制的化工园区巡逻车调度方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010478820.7A CN111832801B (zh) 2020-05-29 2020-05-29 基于合作机制的化工园区巡逻车调度方法、系统及介质

Publications (2)

Publication Number Publication Date
CN111832801A true CN111832801A (zh) 2020-10-27
CN111832801B CN111832801B (zh) 2022-07-05

Family

ID=72913761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010478820.7A Active CN111832801B (zh) 2020-05-29 2020-05-29 基于合作机制的化工园区巡逻车调度方法、系统及介质

Country Status (1)

Country Link
CN (1) CN111832801B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096425A (zh) * 2021-03-29 2021-07-09 紫清智行科技(北京)有限公司 一种应用于大型场景下的自动驾驶巡逻车的调度方法及系统
CN113935621A (zh) * 2021-10-14 2022-01-14 哈尔滨工业大学 一种安保巡逻资源部署方法及系统
CN115273459A (zh) * 2022-06-25 2022-11-01 河南机电职业学院 一种无人驾驶的安全巡逻车

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176784A1 (en) * 2012-05-24 2013-11-28 University Of Southern California Optimal strategies in security games
US20140279818A1 (en) * 2013-03-15 2014-09-18 University Of Southern California Game theory model for patrolling an area that accounts for dynamic uncertainty
CN106447109A (zh) * 2016-09-28 2017-02-22 南京森林警察学院 一种基于深度学习算法的社区治安巡逻路径优化设计方法
CN108596464A (zh) * 2018-04-17 2018-09-28 南京邮电大学 基于动态非合作博弈的电动汽车与云储能经济调度方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176784A1 (en) * 2012-05-24 2013-11-28 University Of Southern California Optimal strategies in security games
US20140279818A1 (en) * 2013-03-15 2014-09-18 University Of Southern California Game theory model for patrolling an area that accounts for dynamic uncertainty
CN106447109A (zh) * 2016-09-28 2017-02-22 南京森林警察学院 一种基于深度学习算法的社区治安巡逻路径优化设计方法
CN108596464A (zh) * 2018-04-17 2018-09-28 南京邮电大学 基于动态非合作博弈的电动汽车与云储能经济调度方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
代桂平: "网格服务组合任务调度的合作博弈模型", 《北京工业大学学报》, 15 March 2012 (2012-03-15), pages 380 - 384 *
解易等: "基于Stackelberg策略的多Agent强化学习警力巡逻路径规划", 《北京理工大学学报》, no. 01, 15 January 2017 (2017-01-15), pages 93 - 99 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096425A (zh) * 2021-03-29 2021-07-09 紫清智行科技(北京)有限公司 一种应用于大型场景下的自动驾驶巡逻车的调度方法及系统
CN113935621A (zh) * 2021-10-14 2022-01-14 哈尔滨工业大学 一种安保巡逻资源部署方法及系统
CN115273459A (zh) * 2022-06-25 2022-11-01 河南机电职业学院 一种无人驾驶的安全巡逻车

Also Published As

Publication number Publication date
CN111832801B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
CN111832801B (zh) 基于合作机制的化工园区巡逻车调度方法、系统及介质
Sheldon et al. Maximizing the spread of cascades using network design
Tian et al. Dual-objective scheduling of rescue vehicles to distinguish forest fires via differential evolution and particle swarm optimization combined algorithm
Çelik et al. The post-disaster debris clearance problem under incomplete information
Ferreira et al. Robocup rescue as multiagent task allocation among teams: experiments with task interdependencies
Parker et al. Exploiting spatial locality and heterogeneity of agents for search and rescue teamwork
US20210348928A1 (en) Multi-police-officer collaborative round-up task allocation and path planning method under constraint of road network
Pujol-Gonzalez et al. Efficient inter-team task allocation in robocup rescue
Peer et al. Shunting trains with deep reinforcement learning
Fanti et al. A risk assessment framework for Hazmat transportation in highways by colored Petri nets
Darmoul et al. Artificial immunity to control disturbances in public transportation systems: concepts, mechanisms and a prototype implementation of a knowledge based decision support system
Yang et al. Pedestrian choice modeling and simulation of staged evacuation strategies in Daya Bay Nuclear Power Plant
Fang et al. Deploying PAWS to combat poaching: game-theoretic patrolling in areas with complex terrain
Krausburg et al. SMART–JaCaMo: An organisation-based team for the multi-agent programming contest
Tan et al. An IVC-based nuclear emergency parallel evacuation system
Wu et al. Agile planning for real-world disaster response
CN113741418B (zh) 异构车机编队协同路径的生成方法和装置
Kimms et al. Network design to anticipate selfish evacuation routing
CN113935621A (zh) 一种安保巡逻资源部署方法及系统
Collins et al. Petri net models of adversarial scenarios in safety and security
Messelis et al. An algorithm selection approach for nurse rostering
Krausburg et al. Modelling a chain of command in the incident command system using sequential characteristic function games
Peres et al. SMART–JaCaMo: An Organisation-Based Team for the Multi-Agent Programming Contest
Gutierrez A visualization and simulation tool that will generate effective patrolling strategies to protect the US borders from illegal intrusion using game theoretic methods and models
Tan et al. Study on the emergency rescue vrp based on ant colony optimization and generalized distance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant