CN114758788A - 异常场所识别方法、装置、设备及存储介质 - Google Patents

异常场所识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114758788A
CN114758788A CN202210435691.2A CN202210435691A CN114758788A CN 114758788 A CN114758788 A CN 114758788A CN 202210435691 A CN202210435691 A CN 202210435691A CN 114758788 A CN114758788 A CN 114758788A
Authority
CN
China
Prior art keywords
place
identified
abnormal
preset
input vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210435691.2A
Other languages
English (en)
Inventor
唐蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210435691.2A priority Critical patent/CN114758788A/zh
Publication of CN114758788A publication Critical patent/CN114758788A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本申请涉及人工智能,本申请提供一种异常场所识别方法、装置、设备及存储介质,所述异常场所识别方法将待识别场所自身参数(即人口信息和状态信息)对应的第一输入向量与场所之间参数(即传播概率)对应的第二输入向量两者结合,生成表示待识别场所的输入向量,然后通过聚类分析模型,得到待识别场所对应的场所特征向量,并根据所述场所特征向量与预设标准场所的特征向量的比对结果,确定所述待识别场所是否为异常场所,由此,进一步增加场所之间参数构建表示待识别场所的场所特征向量,不仅提高了待识别场所的异常识别准确率,而且基于场所之间传播率进行场所异常预警,提高了待识别场所的异常识别效率。

Description

异常场所识别方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种异常场所识别方法、装置、设备及计算机可读存储介质。
背景技术
传染病爆发不仅影响公众的生命健康,还会对国家安全产生严重影响,为了防止传染病爆发,需要对场所内是否会发生传染病等异常情况进行识别。目前的异常场所识别方法是对各个场所分别进行异常识别。由于传染病具有爆发快和传播迅速的特点,使得目前的异常场所识别仅能识别出已发生传染病的场所,识别效率较低。因此,如何提高异常场所的识别准确率成为了目前亟待解决的问题。
发明内容
本发明的主要目的在于提供一种异常场所识别方法、装置、设备及计算机可读存储介质,旨在提高异常场所的识别准确率。
为实现上述目的,本发明提供一种异常场所识别方法,所述异常场所识别方法包括:获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向量;获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量;基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。
此外,为实现上述目的,本发明还提供一种异常场所识别装置,所述异常场所识别装置包括:场所转换模块,用于获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向量;场所间转换模块,用于获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量;异常分析模块,用于基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。
此外,为实现上述目的,本发明还提供一种异常场所识别设备,所述异常场所识别设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的异常场所识别程序,其中所述异常场所识别程序被所述处理器执行时,实现如上述的异常场所识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有异常场所识别程序,其中所述异常场所识别程序被处理器执行时,实现如上述的异常场所识别方法的步骤。
本发明提供一种异常场所识别方法,所述异常场所识别方法包括以下步骤:获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向量;获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量;基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。通过上述方式,本发明将待识别场所自身参数(即人口信息和状态信息)与场所之间参数(即传播概率)两者结合,生成表示待识别场所的输入向量,然后通过聚类分析模型,得到待识别场所对应的场所特征向量,并根据所述场所特征向量与预设标准场所的特征向量的比对结果,确定所述待识别场所是否为异常场所,由此,进一步增加场所之间参数构建表示待识别场所的场所特征向量,不仅提高了待识别场所的异常识别准确率,而且基于场所之间传播率进行场所异常预警,提高了待识别场所的异常识别效率。
附图说明
图1为本发明实施例方案中涉及的异常场所识别设备的硬件结构示意图;
图2为本发明异常场所识别方法第一实施例的流程示意图;
图3为本发明异常场所识别方法第二实施例的流程示意图;
图4为本发明异常场所识别装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的异常场所识别方法主要应用于异常场所识别设备,该异常场所识别设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的异常场所识别设备的硬件结构示意图。本发明实施例中,异常场所识别设备可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对异常场所识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及异常场所识别程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的异常场所识别程序,并执行本发明实施例提供的异常场所识别方法。
本发明实施例提供了一种异常场所识别方法。
参照图2,图2为本发明异常场所识别方法第一实施例的流程示意图。
本实施例中,所述异常场所识别方法包括以下步骤:
步骤S10,获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向。
本实施例中,所述预设时间段是指统计待识别场所选定时间内的数据,可以是一个小时、一天、七天、八天、九天等,实际选取时可根据监测需要选取合适天数。
具体的,在每个监测时间窗口t内(例如t为天,即监测1天的数据),从两个方面分别获取待识别场所的所述人口信息以及所述状态信息,一个方面是待识别场所内的流通人员以及常驻人员的人口信息学统计数据,即在监测时间窗口t,统计待识别场所内的流通人员以及常驻人员的性别结构、年龄结构、职业结构、行业结构,民族结构等等,其中,所述待识别场所可以是学校、机关企事业单位、图书馆、博物馆、健身房、影院、建筑工地、商超等人口聚集多或场所密封的场所,所述待识别场所,即学校、写字楼等,人口信息学数据都可获得。另一个方面是待识别场所内重点关注的症状的分布,重点关注的症状(即传染病监测的目标症状,专家整理的已有症状列表),即发烧、头痛、喷射性呕吐、休克等症状的分布,其中,症状数据通过待识别场所内人员上报的症状中获得,待识别场所为学校时,学生请病假会说明典型症状,待识别场所为写字楼时,员工请病假会说明典型症状。
所述预设转换模型为自编码器(autoencoder)神经网络,所述自编码器神经网络(autoencoder,AE)是一类在半监督学习和非监督学习中使用的人工神经网络(ArtificialNeural Networks,ANNs),所述自编码器神经网络的功能是通过将输入信息作为学习目标,对输入信息进行表征学习(representation learning),所述自编码器神经网络包含编码器(encoder)和解码器(decoder)两部分,按学习范式,所述自编码器神经网络可以被分为收缩自编码器(contractive autoencoder)、正则自编码器(regularized autoencoder)和变分自编码器(Variational AutoEncoder,VAE),其中,前两者是判别模型、后者是生成模型,按构筑类型,所述自编码器神经网络可以是前馈结构或递归结构的神经网络,所述自编码器神经网络被应用于降维(dimensionality reduction)和异常值检测(anomalydetection),包含卷积层构筑的自编码器神经网络可被应用于计算机视觉问题,包括图像降噪(image denoising)、神经风格迁移(neural style transfer)等。
具体地,将所述人口信息以及状态信息进行组合拼接成第一模型输入量,将所述第一模型输入量输入到所述自编码器神经网络中,所述自编码器神经网络中的编码器网络对所述第一模型输入量进行编码,将所述第一模型输入量映射到维度更低的第一中间向量,所述自编码器神经网络中的解码器网络对所述第一向量进行解码,将所述第一中间向量映射回所述第一模型输入量同维度的第一输出向量中,其中,将所述第一中间向量作为所述第一输入向量。
步骤S20,获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量。
具体地,对于所述待识别场所与任意一个相邻场所之间传染病传播的概率,通过三个方面的特征数据来对所述传播概率进行计算,第一个方面是所述待识别场所与相邻场所的距离情况,通过所述待识别场所与相邻场所的直线距离来表示,所述待识别场所与相邻场所距离越近传播概率越高;第二个方面是所述待识别场所与相邻场所之间的交通情况,通过所述待识别场所与相邻场所之间的公共交通路线数来表示,公共交通路线越多传播概率越高;第三个方面是所述待识别场所与相邻场所之间的人口情况,通过所述待识别场所与相邻场所的人口之和来表示,人口越多传播概率越高;所述待识别场所与相邻场所之间的的传染病传播概率为所述距离数值与距离权重的积、所述连通路线数量与公共交通权重的积、人口总数与人口权重的积与初始权重四者相加的和;其中,所述权重是自编码器神经网络经过训练后产生的对距离、线路和入口总数三个方面表示的占比概率。
可以理解的是,在所述待识别场所的相邻场所唯一时,所述待识别场所与相邻场所之间的传播概率唯一;在所述待识别场所的相邻场所为多个时,所述待识别场所与相邻场所之间的传播概率为概率集,所述概率集包括多个传播概率。
本实施例中,将所述待识别场所与相邻场所之间的传播概率转成第二模型输入量,将所述第二模型输入量输入到所述自编码器神经网络中,所述自编码器神经网络中的编码器网络对所述第二模型输入量进行编码,将所述第二模型输入量映射到维度更低的第二中间向量,所述自编码器神经网络中的解码器网络对所述第二中间向量进行解码,将所述第二中间向量映射回所述第二模型输入量同维度的第二输出向量中,其中,将所述第二中间向量作为所述第二输入向量。
步骤S30,基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。
具体的,基于聚类算法DBSCAN,将所述第一输入向量和所述第二输入向量输入聚类算法DBSCAN中计算,得到所述场所特征向量,将所述场所特征向量与预设标准场所的特征向量进行比对,得到的比对结果若大于预设数值,则确定与所述场所特征向量对应的待识别场所为异常场所。
其中,所述聚类算法DBSCAN((Density-Based Spatial Clustering ofApplications with Noise)具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法,该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。
聚类算法DBSCAN算法基于一个事实:一个聚类可以由其中的任何核心对象唯一确定,等价表述为:任一满足核心对象条件的数据对象p,数据库D中所有从p密度可达的数据对象o所组成的集合构成了一个完整的聚类C,且p属于C。
进一步地,具体聚类过程如下:
扫描整个数据集,找到任意一个核心点,对该核心点进行扩充,扩充的方法是寻找从所述核心点出发的所有密度相连的数据点,遍历该核心点的ε邻域内的所有核心点(因为边界点是无法扩充的),寻找与这些数据点密度相连的点,直到没有可以扩充的数据点为止,最后聚类成的簇的边界节点都是非核心数据点,之后重新扫描数据集(不包括之前寻找到的簇中的任何数据点),寻找没有被聚类的核心点,再重复上面的步骤,对该核心点进行扩充直到数据集中没有新的核心点为止,数据集中没有包含在任何簇中的数据点就构成异常点。
所述预设标准场所特征是在训练聚类算法DBSCAN时,通过将大量正常场所的人口信息以及状态信息以及正常场所之间的传播概率输入聚类算法DBSCAN中计算,得到代表正常场所的场所特征,所述代表正常场所的场所特征即所述标准场所特征。
本实施例提供一种异常场所识别方法,所述异常场所识别方法包括以下步骤:获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向量;获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量;基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。通过上述方式,本发明将待识别场所自身参数(即人口信息和状态信息)与场所之间参数(即传播概率)两者结合,生成表示待识别场所的输入向量,然后通过聚类分析模型,得到待识别场所对应的场所特征向量,并根据所述场所特征向量与预设标准场所的特征向量的比对结果,确定所述待识别场所是否为异常场所,由此,进一步增加场所之间参数构建表示待识别场所的场所特征向量,不仅提高了待识别场所的异常识别准确率,而且基于场所之间传播率进行场所异常预警,提高了待识别场所的异常识别效率。
参照图3,图3为本发明异常场所识别方法第二实施例的流程示意图。
基于上述图2所示实施例,本实施例中,所述步骤S20,还包括:
步骤S21,获取所述待识别场所与相邻场所的距离数值、连通路线数量和人口总数;
具体地,通过三个方面获取所述待识别场所与相邻场所之间的特征数据,其中,所述特征数据包括距离数值、连通路线数量和人口总数;第一个方面是所述待识别场所与相邻场所的距离情况,通过所述待识别场所与相邻场所的直线距离d来表示,所述待识别场所与相邻场所距离越近传播概率越高;第二个方面是所述待识别场所与相邻场所之间的交通情况,通过所述待识别场所与相邻场所之间的公共交通路线数l来表示,公共交通路线越多传播概率越高;第三个方面是所述待识别场所与相邻场所之间的人口情况,通过所述待识别场所与相邻场所的人口之和o来表示,人口越多传播概率越高;例如,所述待识别场所与相邻场所的直线距离为一千米,所述待识别场所与相邻场所之间的公共交通路线数为7条,所述待识别场所与相邻场所的人口之和为3000人。
步骤S22,根据预设公式以及所述距离数值、所述连通路线数量、人口总数进行计算,得到所述待识别场所与相邻场所之间的传播概率,其中,所述预设公式为:
pij=w0+w1·dij+w2·lij+w3·ij
pij为所述待识别场所i与一相邻场所j之间的传播概率,w0为预设初始权重,dij为i与j之间的距离数值,w3为距离数值对应的权重,lij为i与j之间的连通路线数量,w3为连通路线数量对应的权重,oij为i与j的人口总数,w3为人口总数对应的权重。
具体地,所述待识别场所与相邻场所(例如重点场所i和重点场所j)之间的的传染病传播概率pij=w0+w1dij+w2lij+w3oij,其中,w0为初始权重,w1为距离权重,w2为公共交通权重,w3为人口权重。当所述待识别场所与相邻场所的直线距离为一千米,所述待识别场所与相邻场所之间的公共交通路线数为7条,所述待识别场所与相邻场所的人口之和为3000人时,所述待识别场所与相邻场所之间的传播概率pij=w0+1000w2+7w2+3000w3
步骤S23:根据预先训练的自编码器神经网络对所述传播概率进行特征提取,得到第二中间向量,将所述第二中间向量作为所述第二输入向量。
本实施例中,对一个待识别场所i,构造其它p个相邻场所到这个待识别场所场所的传染病传播概率向量pi=(pi1,pi2,pi3,...,pip),同样的,构造自编码器(autoencoder)神经网络,所述自编码器神经网络由编码器和解码器网络结构组成,首先通过编码器网络将第二模型输入量映射到维度更低(例如q维,q远小于p)的第二中间向量h=(h1,h2,h3,...,hq),然后再通过解码器网络将第二中间向量映射回到第二输出向量,即第二模型输入量和第二输出向量都为pi=(pi1,pi2,pi3,...,pip),通过自编码器神经网络结构,将高维度数据转换为低维度数据,从数据中捕获显著的特征,最终将第二中间向量h=(h1,h2,h3,...,hq)作为第二输入向量。
基于上述图2所示实施例,本实施例中,所述步骤S30中的所述根据所述场所特征向量与预设标准场所的特征向量,确定所述待识别场所的异常识别结果,具体包括:
步骤S31,将所述场所特征向量转换为场所坐标点,并计算所述场所坐标点与预设标准坐标点集的最短距离,其中,所述标准坐标点集为所述标准场所的特征向量对应的坐标点集合;
步骤S32,根据所述最短距离与预设数值的比对结果,确定所述待识别场所的异常识别结果。
具体地,将所述场所特征向量转换为场所坐标点,使得所述场所特征向量能够在坐标系中作为坐标点进行显示,其中,所述场所坐标点即对应于待识别场所;
计算所述场所坐标点与所述标准坐标点集的最短距离,将所述最短距离与预设数值进行比较,如果所述最短距离大于预设数值,则确定所述场所坐标点不属于所述标准坐标点集,所述场所坐标点属于离群点,也即异常点,则确定所述待识别场所属于异常场所。
进一步地,所述步骤S32还包括:
计算所述场所坐标点与所述标准坐标点集中各个坐标点之间的欧几里德距离,并从得到的所述欧几里德距离中选取最小欧几里德距离作为所述最短距离。
具体地,计算所述场所坐标点与所述标准坐标点集中各个坐标点的欧几里德距离,获取计算结果,选取计算结果中欧几里德距离数值最小的一个,作为所述场所坐标点与预设标准坐标点集的最短距离。
基于上述图2所示实施例,本实施例中,所述基于预设转换模型,生成所述人口信息和所述状态信息对应的第一输入向量,具体包括:
步骤S11,根据预先训练的自编码器神经网络对所述人口信息和所述状态信息进行特征提取,得到第一中间向量,将所述第一中间向量作为所述第一输入向量。
其中,所述人口信息和所述状态信息获取途径包括:对每个监测时间窗口t内(例如t为天,即监测1天的数据),从两个方面获取待识别场所的特征,一个方面是待识别场所内的流通人员以及常驻人员的人口信息学统计数据,即在监测时间窗口t,统计待识别场所内的流通人员以及常驻人员的性别结构、年龄结构、职业结构、行业结构,民族结构等等,其中,所述待识别场所可以是学校、机关企事业单位、图书馆、博物馆、健身房、影院、建筑工地、商超等人口聚集多或场所密封的场所,所述待识别场所,即学校、写字楼等,人口信息学数据都可获得。另一个方面是待识别场所内重点关注的症状的分布,重点关注的症状(即传染病监测的目标症状,专家整理的已有症状列表),即发烧、头痛、喷射性呕吐、休克等症状的分布。
在本实施例中,从每个监测时间窗口t内构造待识别场所内m个人口信息学统计特征d=(d1,d2,d3,...,dm)和n个重点症状监测特征s=(s1,s2,s3,...,sn)作为第一模型输入量,即x=(d1,d2,d3,...,dm,s1,s2,s3,...,sn),构造自编码器(autoencoder)神经网络,首先通过编码器网络将第一模型输入量映射到维度更低(例如k维,k远小于m+n)的第一中间向量v=(v1,v2,v3,vk),然后再通过解码器网络将第一中间向量映射回到第一输出向量,即第一输入向量和第一输出向量都为x=(d1,d2,d3,...,dm,s1,s2,s3,...,sn),通过自编码器神经网络结构,将高维度数据转换为低维度数据,从数据中捕获显著的特征,最终将第一中间向量v=(v1,v2,v3,vk)作为待识别场所自身的向量表示。
其中,将高维度数据转换为低维度数据是通过构建的基于深度学习的自编码器神经网络(autoencoder)来进行,自编码器网络由编码器(encoder)和解码器(decoder)组成,具体来说,首先将1000维的输入向量x通过编码器网络映射得到100维的向量y,再通过解码器网络将y映射回1000维的输出向量x,即自编码网络的输出和输出是一样的,都为x,通过非监督式的方式学习自编码器神经网络中的网络参数,将自编码器神经网络中的编码器的输出y作为待识别场所自身的向量表示y=(y1,y2,y3,yk)。
进一步地,所述基于预设转换模型,生成所述人口信息和所述状态信息对应的第一输入向量,包括:
基于预设转换模型,构建所述人口信息对应的特征以及所述状态信息对应的特征,其中,所述人口信息对应的特征包括所述待识别场所内人口的性别分布、年龄段分布以及职业分布,所述状态信息对应的特征包括预设症状列表中的各个症状信息;
根据所述人口信息对应的特征以及所述状态信息对应的特征,生成所述第一输入向量
在本实施例中,一个人的的年龄是30,性别是男,职业是工程师(当然还有更多人口信息在这里省略)。人口信息为人口信息学统计特征d=(d1,d2,d3,...,dm)具体为:(年龄段[0,1),年龄段[1,6),年龄段[6,14),年龄段[14,45),年龄段[45,65),年龄段[65,-),性别男,性别女,学生,公务员,教师,工程师,工人,…),对于举例的人的信息来说,人口统计学特征对应于(0,0,0,1,0,0,1,0,0,0,0,1,0,…),其中,0表示无对应人口学信息,1表示有对应人口学信息。特征向量中的3个1按顺序表示为年龄段[14,45),性别男,工程师。
一个人的症状是发热、头痛。状态信息为症状监测特征s=(s1,s2,s3,...,sn)具体为(发热,头痛,腹泻,胸闷,…),对于举例的人来说,对应的症状监测特征为(1,1,0,0,…)。其中,0表示无对应症状,1表示有对应症状。症状监测特征中的2个1按照顺序表示为发热,头痛这两个症状。
从每个监测时间窗口t内构造待识别场所内m个人口信息学统计特征d=(d1,d2,d3,...,dm)和n个重点症状监测特征s=(s1,s2,s3,...,sn)作为第一模型输入量,即x=(d1,d2,d3,...,dm,s1,s2,s3,...,sn),构造自编码器(autoencoder)神经网络,首先通过编码器网络将第一模型输入量映射到维度更低(例如k维,k远小于m+n)的第一中间向量v=(v1,v2,v3,vk),然后再通过解码器网络将第一中间向量映射回到第一输出向量,即第一输入向量和第一输出向量都为x=(d1,d2,d3,...,dm,s1,s2,s3,...,sn),通过自编码器神经网络结构,将高维度数据转换为低维度数据,从数据中捕获显著的特征,最终将第一中间向量v=(v1,v2,v3,vk)作为待识别场所自身的向量表示,即第一输入向量。
进一步地,所述基于预设聚类分析模型,生成所述第一输入向量和所述第二输入向量对应的场所特征向量,包括:
基于聚类算法DBSCAN对所述第一输入向量和所述第二输入向量降维,生成所述场所特征向量。
具体地,综合待识别场所自身以及相邻场所之间的向量作为待识别场所的最终向量表示,即对重点场所i,向量表示为wi=(vi,hi)=(vi1,vi2,vi3,...,vik,hi1,hi2,hi3,...,hip),应用聚类算法DBSCAN(Density-based spatial clustering of applications withnoise)建立聚类分析模型,将识别出的异常点作为异常重点场所进行预警。
应用的聚类算法DBSCAN是非监督学习算法,通过该方法对由特征向量表示的待识别场所进行聚类,通常的,大量的正常的场所特征相似,会聚集在一起,而异常的场所特征与正常的场所的特征不一致,不会聚成一类,通常作为异常点聚类一类,对这类异常的场所进行传染病预警。
此外,本发明实施例还提供一种异常场所识别装置。
参照图4,图4为本发明异常场所识别装置第一实施例的功能模块示意图。
本实施例中,所述异常场所识别装置包括:
场所转换模块10,用于获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向量;
场所间转换模块20,用于获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量;
异常分析模块30,用于基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。
进一步地,所述场所间转换模块20具体包括:
场所间信息收集单元,用于获取所述待识别场所与相邻场所的距离数值、连通路线数量和人口总数;
场所间计算单元,用于根据预设公式以及所述距离数值、所述连通路线数量、人口总数进行计算,得到所述待识别场所与相邻场所之间的传播概率,其中,所述预设公式为:
pij=w0+w1·dij+w2·lij+w3·oij
pij为所述待识别场所i与一相邻场所j之间的传播概率,w0为预设初始权重,dij为i与j之间的距离数值,w3为距离数值对应的权重,lij为i与j之间的连通路线数量,w3为连通路线数量对应的权重,oij为i与j的人口总数,w3为人口总数对应的权重。
第二特征降维单元,用于根据预先训练的自编码器神经网络对所述传播概率进行特征提取,得到第二中间向量,将所述第二中间向量作为所述第二输入向量。
进一步地,所述异常分析模块30具体包括:
距离计算单元,用于将所述场所特征向量转换为场所坐标点,并计算所述场所坐标点与预设标准坐标点集的最短距离,其中,所述标准坐标点集为所述标准场所的特征向量对应的坐标点集合;
识别单元,用于根据所述最短距离与预设数值的比对结果,确定所述待识别场所的异常识别结果。
进一步地,所述距离计算单元包括:
距离分析单元,用于计算所述场所坐标点与所述标准坐标点集中各个坐标点之间的欧几里德距离,并从得到的所述欧几里德距离中选取最小欧几里德距离作为所述最短距离。
进一步地,所述场所转换模块10具体包括:
第一特征降维单元,用于根据预先训练的自编码器神经网络对所述人口信息和所述状态信息进行特征提取,得到第一中间向量,将所述第一中间向量作为所述第一输入向量。
进一步地,所述场所转换模块10具体包括:
信息特征获取单元,用于基于预设转换模型,构建所述人口信息对应的特征以及所述状态信息对应的特征,其中,所述人口信息对应的特征包括所述待识别场所内人口的性别分布、年龄段分布以及职业分布,所述状态信息对应的特征包括预设症状列表中的各个症状信息。
信息特征降维单元,用于根据所述人口信息对应的特征以及所述状态信息对应的特征,生成所述第一输入向量。
进一步地,所述异常场所识别装置包括聚类分析模块,所述聚类分析模块包括:
特征提取单元,用于基于聚类算法DBSCAN对所述第一输入向量和所述第二输入向量降维,生成所述场所特征向量。
其中,上述异常场所识别装置中各个模块与上述异常场所识别方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有异常场所识别程序,其中所述异常场所识别程序被处理器执行时,实现如上述的异常场所识别方法的步骤。
其中,异常场所识别程序被执行时所实现的方法可参照本发明异常场所识别方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种异常场所识别方法,其特征在于,所述异常场所识别方法包括以下步骤:
获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向量;
获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量;
基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。
2.如权利要求1所述的异常场所识别方法,其特征在于,所述获取所述待识别场所与相邻场所之间的传播概率,包括:
获取所述待识别场所与相邻场所的距离数值、连通路线数量和人口总数;
根据预设公式以及所述距离数值、所述连通路线数量、人口总数进行计算,得到所述待识别场所与相邻场所之间的传播概率,其中,所述预设公式为:
pij=w0+w1·dij+w2·lij+w3·oij
pij为所述待识别场所i与一相邻场所j之间的传播概率,w0为预设初始权重,dij为i与j之间的距离数值,w3为距离数值对应的权重,lij为i与j之间的连通路线数量,w3为连通路线数量对应的权重,oij为i与j的人口总数,w3为人口总数对应的权重。
3.如权利要求1所述的异常场所识别方法,其特征在于,所述根据所述场所特征向量与预设标准场所的特征向量,确定所述待识别场所的异常识别结果,包括:
将所述场所特征向量转换为场所坐标点,并计算所述场所坐标点与预设标准坐标点集的最短距离,其中,所述标准坐标点集为所述标准场所的特征向量对应的坐标点集合;
根据所述最短距离与预设数值的比对结果,确定所述待识别场所的异常识别结果。
4.如权利要求3所述的异常场所识别方法,其特征在于,所述计算所述场所坐标点与预设标准坐标点集的最短距离,还包括:
计算所述场所坐标点与所述标准坐标点集中各个坐标点之间的欧几里德距离,并从得到的所述欧几里德距离中选取最小欧几里德距离作为所述最短距离。
5.如权利要求1所述的异常场所识别方法,其特征在于,所述基于预设转换模型,生成所述人口信息和所述状态信息对应的第一输入向量,包括:
根据预先训练的自编码器神经网络对所述人口信息和所述状态信息进行特征提取,得到第一中间向量,将所述第一中间向量作为所述第一输入向量。
6.如权利要求5所述的异常场所识别方法,其特征在于,所述基于预设转换模型,生成所述人口信息和所述状态信息对应的第一输入向量,包括:
基于预设转换模型,构建所述人口信息对应的特征以及所述状态信息对应的特征,其中,所述人口信息对应的特征包括所述待识别场所内人口的性别分布、年龄段分布以及职业分布,所述状态信息对应的特征包括预设症状列表中的各个症状信息;
根据所述人口信息对应的特征以及所述状态信息对应的特征,生成所述第一输入向量。
7.如权利要求1-6中任一项所述的异常场所识别方法,其特征在于,所述基于预设聚类分析模型,生成所述第一输入向量和所述第二输入向量对应的场所特征向量,包括:
基于聚类算法DBSCAN对所述第一输入向量和所述第二输入向量降维,生成所述场所特征向量。
8.一种异常场所识别装置,其特征在于,所述异常场所识别装置包括:
场所转换模块,用于获取待识别场所内预设时间段的人口信息以及状态信息,并基于预设的转换模型,生成与所述人口信息和所述状态信息相对应的第一输入向量;
场所间转换模块,用于获取所述待识别场所与相邻场所之间的传播概率,并基于所述转换模型,生成所述传播概率对应的第二输入向量;
异常分析模块,用于基于预设聚类分析模型,生成与所述第一输入向量和所述第二输入向量相对应的场所特征向量,并根据预设标准场所的特征向量与所述场所特征向量,确定所述待识别场所的异常识别结果。
9.一种异常场所识别设备,其特征在于,所述异常场所识别设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的异常场所识别程序,其中所述异常场所识别程序被所述处理器执行时,实现如权利要求1至7中任一项所述的异常场所识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有异常场所识别程序,其中所述异常场所识别程序被处理器执行时,实现如权利要求1至7中任一项所述的异常场所识别方法的步骤。
CN202210435691.2A 2022-04-24 2022-04-24 异常场所识别方法、装置、设备及存储介质 Pending CN114758788A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210435691.2A CN114758788A (zh) 2022-04-24 2022-04-24 异常场所识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210435691.2A CN114758788A (zh) 2022-04-24 2022-04-24 异常场所识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114758788A true CN114758788A (zh) 2022-07-15

Family

ID=82332282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210435691.2A Pending CN114758788A (zh) 2022-04-24 2022-04-24 异常场所识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114758788A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795354A (zh) * 2023-02-06 2023-03-14 北京志翔科技股份有限公司 三合一场所的识别方法和识别装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795354A (zh) * 2023-02-06 2023-03-14 北京志翔科技股份有限公司 三合一场所的识别方法和识别装置
CN115795354B (zh) * 2023-02-06 2023-04-25 北京志翔科技股份有限公司 三合一场所的识别方法和识别装置

Similar Documents

Publication Publication Date Title
Al-Molegi et al. STF-RNN: Space time features-based recurrent neural network for predicting people next location
CN109359564B (zh) 一种图像场景图生成方法及装置
CN108650614B (zh) 一种自动推断社会关系的移动用户位置预测方法与装置
Ermagun et al. Development and application of the network weight matrix to predict traffic flow for congested and uncongested conditions
CN111191040A (zh) 城市运行知识图谱构建方法、装置和计算机设备
CN109960722B (zh) 一种信息处理方法及装置
US20220351039A1 (en) Federated learning using heterogeneous model types and architectures
He et al. An efficient and accurate nonintrusive load monitoring scheme for power consumption
CN113065974A (zh) 一种基于动态网络表示学习的链路预测方法
CN112231592A (zh) 基于图的网络社团发现方法、装置、设备以及存储介质
CN114758788A (zh) 异常场所识别方法、装置、设备及存储介质
Tarbush et al. Homophily in online social networks
CN103345552A (zh) 电力ict通信网可靠性的评估方法及系统
CN112182498B (zh) 一种基于网络表示学习的老人看护装置与方法
CN114118570A (zh) 业务数据预测方法及装置、电子设备和存储介质
CN116431827A (zh) 信息处理方法、装置、存储介质及计算机设备
CN113762648B (zh) 公卫黑天鹅事件预测方法、装置、设备及介质
CN109961319A (zh) 一种户型改造信息的获取方法及装置
CN110457650B (zh) 宜居设计生成方法、装置、介质及电子设备
WO2022105117A1 (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN114358186A (zh) 一种数据处理方法、装置及计算机可读存储介质
Jamshad et al. Geographic information systems (GIS) image analysis for prioritizing power system restoration
Zhang et al. End‐to‐end generation of structural topology for complex architectural layouts with graph neural networks
Emam et al. Faults repairing analysis using rough sets after implementation of labor force redistribution algorithm: A case study in Telecom Egypt
JP7218633B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination