CN110288140B - 一种基于地理相关性模型的阿片类药物空间传播预测方法 - Google Patents
一种基于地理相关性模型的阿片类药物空间传播预测方法 Download PDFInfo
- Publication number
- CN110288140B CN110288140B CN201910515694.5A CN201910515694A CN110288140B CN 110288140 B CN110288140 B CN 110288140B CN 201910515694 A CN201910515694 A CN 201910515694A CN 110288140 B CN110288140 B CN 110288140B
- Authority
- CN
- China
- Prior art keywords
- administrative
- area
- areas
- model
- administrative region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Epidemiology (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Chemical & Material Sciences (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于地理相关性模型的阿片类药物空间传播预测方法,包括以下步骤:1)通过下级行政区域药物传播特点与上级行政区域药物传播特点建立地理相关性模型;2)通过聚类分析对每个上级行政区域中所有下级行政区域进行打包分区,确定该上级行政区域的聚类中心;3)针对各上级行政区域聚类中心,建立案发数量的微分扩散模型,并进行空间自相关分析,获得各上级行政区域一区聚类中心的阿片类药物传播特征;4)通过分析扩散模型的临界值,给出高案发率下级行政区域的判断依据;5)利用BP神经网络对未来各下级行政区域的案发数量进行预测,筛选超过扩散模型临界值的下级行政区域。本发明的预测精度较高。
Description
技术领域
本发明涉及公共卫生安全与防控领域,具体涉及一种基于地理相关性模型的阿片类药物空间传播预测方法,通过参考模型来表征传播特点并进行准确预测,筛选出危险地点。
背景技术
现在所谓的“阿片类药物流行病”实际上始于20世纪90年代中后期,而且伴随着复杂的社会环境和公共卫生安全问题,为了打击吸毒犯罪及阿片类药物贩运,需要设计一种基于地理相关性模型的阿片类药物空间传播预测方法,通过该方法建立地理相关性模型分析阿片类药物的空间传播特征,进而开展预测研究,为制定相关方案提供依据。在阿片类药物空间传播的预测方法设计中,高品质的模型辨识以及精确的地理定位是获得良好预测的关键。
发明内容
本发明的目的在于针对上述现有技术中的问题,提供一种基于地理相关性模型的阿片类药物空间传播预测方法,建立的预测模型能够精准地预测出药物传播严重的地点。
为了实现上述目的,本发明采用的技术方案包括以下步骤:
1)通过下级行政区域药物传播特点与上级行政区域药物传播特点建立地理相关性模型;2)通过聚类分析对每个上级行政区域中所有下级行政区域进行打包分区,确定该上级行政区域的聚类中心;3)针对各上级行政区域聚类中心,建立案发数量的微分扩散模型,并进行空间自相关分析,获得各上级行政区域一区聚类中心的阿片类药物传播特征;4)通过分析扩散模型的临界值,给出高案发率下级行政区域的判断依据;5)利用BP神经网络对未来各下级行政区域的案发数量进行预测,筛选超过扩散模型临界值的下级行政区域。
所述的步骤2)确定聚类中心的方法为:首先利用反映各下级行政区域案情严重程度的两个指标,包括案发数量和占对应上级行政区域案发总数的比例,通过K-means聚类分析将各上级行政区域中所有下级行政区域打包分层为三区;然后按照一区到三区案情严重程度递减的原则,将一区的聚类中心作为该上级行政区域的聚类中心;最后使用遍历搜索方法,利用聚类分析的分区结果,并结合各下级行政区域的经纬度坐标,根据最短欧式距离法获得一区中距离其余所有下级行政区域的距离总和最小的下级行政区域,即为打包区域的聚类中心。
所述的步骤3)所建立的微分扩散模型为二元微分扩散模型,以各上级行政区域聚类中心的经度和纬度为自变量并考虑时间因素,具体的模型表达式如下:
ut-a2(uxx+uyy)=f(x,y,t)
对于固定的t,u=u(x,y,t)表示t时刻在位置(x,y)的案发概率,x和y分别为经度和纬度。
所述的步骤3)进行空间自相关分析时,通过局部Moran指数衡量每个上级行政区域地理位置对案发情况的影响,局部Moran指数中的较高值表示具有相似变量值的区域单位在空间中聚合,局部Moran指数中的较低值表示不同变量的面积单位是空间聚合的。
所述的局部Moran指数的计算公式为:
其中,ωi,j=1,表示区域i和区域j相邻接,ωi,j=0,表示区域i和区域j不相邻接。
所述的步骤4)定义某药物在上级行政区域的概率密度为该药物在上级行政区域的案发数与其对应的下级行政区域总数之比,阈值为某国各上级行政区域在若干年当中的年概率密度的平均值;判断阿片类药物高案发率下级行政区域的数学表达式如下:
F(x,y,t)≥F0
其中,F(x,y,t)为阿片类药物的概率密度,F0为阈值。
所述的步骤5)首先对BP神经网络利用历史数据训练并进行可行性检验,然后以当年数据为例预测下一年的案发数量,最后通过与阈值进行比较筛选出下一年高案发率地点。
与现有技术相比,本发明具有如下的有益效果:基于地理相关性建立预测模型能够精准地预测案发严重的地点,实现预测模型和危险地点的最小结构差别,在此基础上基于空间自相关分析得到优化BP神经网络以提高预测地点准确度,解决了多样本地点情况下预测精度低的固有缺陷,压缩需要进行担忧评估的地点,在担忧地点的预测模型中实现了对模型准确性的检验以提高预测精度的效果。本发明基于地理相关性模型的阿片类药物空间传播预测方法,考虑该算法运算准确度增长的缺陷,利用空间相关特征来提取进行下级行政区域消减,并对其进行仿真验证,结果表明该预测模型具有较好的预测效果和很强的准确度。
附图说明
图1基本BP算法的流程图;
图2某上级行政区域聚类分析图;
图3D区药物案发数量的变化图;
图4微分方程边界求解图;
图5 2010年和2017年的五个上级行政区域案发率比较图:(a)2010年;(b)2017年;
图6所有下级行政区域的自检验结果图;
图7 2017年灰色预测模型真实值与预测值对比图;
图8 2018年案发数量超过阈值的下级行政区域散点图。
具体实施方式
下面结合附图对本发明做进一步的详细说明。
1、下级行政区域药物传播特点:
1.1聚类分析定义:聚类分析的目标就是在相似的基础上收集数据来分类。从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。选择每个下级行政区域某种毒品案件的具体表现的两个指标,案发数量和占对应上级行政区域案发总数的比例作为聚类分析的输入;聚类分析的输出为各上级行政区域对应的下级行政区域分层结果。
1.2遍历搜索定义:所谓遍历,是指沿着某条搜索路线,依次对树中每个结点均做一次且仅做一次访问。访问结点所做的操作依赖于具体的应用问题。设计遍历搜索的目的就是找到上级行政区域一区打包区域的聚类中心。使用遍历搜索方法,对于通过聚类分析获得的每个上级行政区域的分区结果,遍历每个上级行政区域一区中的所有下级行政区域,并结合每个下级行政区域的经纬度坐标,找到距离其余所有下级行政区域的最短欧式距离的总和,对应的下级行政区域即为要找的打包区域的聚类中心。欧式距离的定义如下:
其中,xk,yk分别表示一区中各下级行政区域的经度和纬度,p表示一区中下级行政区域的总数。
2、上级行政区域药物传播特点:
2.1微分扩散模型:使用微分扩散模型的目的就是找到案发率随着时间推移的空间变化情况。传播源经度和纬度以及时间创建的扩散模型如下所示:
ut-a2(uxx+uyy)=f(x,y,t)
式中,x和y分别表示各上级行政区域聚类中心的经度和纬度为,u=u(x,y,t),对于固定的t,u=u(x,y,t)表示t时刻在位置(x,y)的案发概率。
2.2空间自相关分析:地理数据由于受空间相互作用和空间扩散的影响,具有空间依赖。用局部Moran指数考虑每个上级行政区域受地理位置的影响,空间自相关分析的目的是通过局部Moran指数分析上级行政区域的相关性,高值的局部Moran指数表示具有相似变量值的区域单位在空间中聚合;低值的局部Moran指数表示不同变量的面积单位是空间聚合的。
3、BP神经网络预测模型:
3.1高案发率下级行政区域的判断依据:判断的目的是找到案发概率大于阈值的地点,为政府公共卫生安全与防控工作提供参考依据,便于政府工作的进一步展开和降低政府开支。评价阿片类药物的概率密度大于其相应的阈值的数学表达式如下:
F(x,y,t)≥F0
其中,F(x,y,t)为阿片类药物的概率密度,F0为各上级行政区域的阈值。
3.2案发数量预测:
预测的目的是给出高案发率地点的未来案发数量估计,便于政府着手安全卫生与防控相关政策方针的制定与实施。因为神经网络具有自学习功能,所以用新数据来训练网络,可以根据环境变化来修正预测模型。而且当训练好网络后,网络的计算则是相当容易而快捷的,对于解决实时调度问题具有极大的好处。因此,此处用BP神经网络模型进行预测。
参见图1,本发明阿片类药物空间传播预测方法包括:通过下级行政区域药物传播特点与上级行政区域药物传播特点两部分组成空间相关性系统进行特征分析;下级行政区域药物传播特点:在下级行政区域案发情况和地理位置飞行器实际模型输入和输出数据的基础上,利用聚类分析离线辨识一个与所测系统等价的模型;上级行政区域药物传播特点:在下级行政区域药物传播特点模型的基础上,根据系统输入和输出数据,给出上级行政区域药物传播特点;最后给出高案发率地点的判断依据并用BP神经网络预测阿片类药物案发数量。
1、下级行政区域药物传播特点模型按照以下步骤搭建:
1.1.下级行政区域分层;
采用分裂法计算聚类分析。首先创建k个划分,k为要创建的划分个数;然后利用一个循环定位技术将对象从一个划分移到另一个划分来帮助改善划分质量。选择每个下级行政区域某种毒品案件的主要指标作为聚类分析的输入,包括案发数量和占对应上级行政区域案发总数的比例;聚类分析的输出为各上级行政区域对应的下级行政区域分层结果。
1.2遍历搜索方法确定聚类中心;
距离计算通过衡量对象之间的差异度来反应对象之间的相似度关系。
基于距离计算的相似度为:
Sim(a,b)=1/(1+d(a,b))
其中,d(a,b)表示对象a,b的测量距离,Sim(a,b)表示对象a,b之间的相似度。
为了确保新增对象不会影响到任意两个对象之间的距离,在此采用欧氏距离度量距离。
欧式距离的公式如下所示:
其中,xk,yk分别表示一区中各下级行政区域的经度和纬度,p表示一区中下级行政区域的总数。
使用遍历搜索方法,通过聚类分析获得的每个上级行政区域分区结果。遍历每个上级行政区域一区中的所有下级行政区域,并结合每个下级行政区域的经纬度坐标,找到距离其余所有下级行政区域的欧式距离最小总和,该下级行政区域即为对应上级行政区域的聚类中心。
2、上级行政区域药物传播特点模型按照以下步骤搭建:
2.1药物扩散传播特点:利用下级行政区域间的聚类分析结果,建立考虑时间因素的二元扩散模型,分析合成阿片类药物的案发数量与时间之间的关系。
使用传播源经度和纬度以及时间创建的扩散模型如下所示:
ut-a2(uxx+uyy)=f(x,y,t)
其中,x和y分别表示各上级行政区域聚类中心的经度和纬度,u=u(x,y,t),对于固定的t,u=u(x,y,t)表示t时刻在位置(x,y)的案发概率。
2.2药物的空间自相关性
地理数据由于受空间相互作用和空间扩散的影响,具有空间依赖。利用局部Moran指数考虑每个上级行政区域受地理位置的影响,局部Moran指数的计算公式为:
其中,ωij=1,表示区域i和区域j相邻接,ωij=0,表示区域i和区域j不相邻接。
(ωij)n×n构成空间权重矩阵:
高值的局部Moran指数表示具有相似变量值的区域单位在空间中聚合;
低值的局部Moran指数表示不同变量的面积单位是空间聚合的。
3、药物预测模型按照以下步骤搭建:
3.1高案发率下级行政区域的判断依据:
判断阿片类药物是否需要担忧的数学表达式如下:
F(x,y,t)≥F0
其中,F(x,y,t)为阿片类药物的概率密度,F0为各上级行政区域的阈值。
某药物的概率密度即为该药物在每个上级行政区域的案发总数与其对应的下级行政区域总数之比,阈值为某国各上级行政区域在研究时间段内年概率密度的平均值。当概率密度大于其相应的阈值时政府需要对该地区给予高度关注,反之则可以放松警惕。
3.2BP神经网络预测药物案发数量:建立BP神经网络模型,利用2011年数据对2010年数据训练的神经网络进行了可行性检验,发现该模型具有较高的可信度。最后,以2017年为例,该模型给出了2018年高案发率下级行政区域的预测。
BP神经网络预测前首先要训练网络,通过训练使网络具有联想记忆和预测能力。
参见图1,BP神经网络的训练过程如下所示:
步骤一:网络初始化。
根据系统输入输出序列(X,Y)确定网络输入层节点数n,隐含层节点数l、输出层节点数m、初始化输入层、隐含层和输出层神经元之间的连接权值ωij,ωjk,初始化隐含层阈值a,给定输出层阈值b,给定学习速率和神经元激励函数。
步骤二:隐含层输出计算。
根据输入向量,输入层和隐含层间连接权值,以及隐含层阈值,计算隐含层输出。
步骤三:输出层输出计算。
根据隐含层输出,连接权值和阈值计算BP神经网络预测输出。
步骤四:误差计算根据网络输出和预期输出,计算网络预测误差。
步骤五:权值更新。根据网络预测更新网络连接权值。
步骤六:阈值更新。根据网络预测误差更新网络节点阈值。
步骤七:判断算法迭代是否结束,若没有结束,返回步骤二。
实施例
某国的某五个上级行政区域(A、B、C、D、E)针对阿片类药物空间传播的预测。
1下级行政区域药物传播特点:
1.1聚类分析将下级行政区域分层;
其中,上级行政区域B聚类分析的结论如下所示:
根据图2,该上级行政区域分为三类,其中每类对应下级行政区域的代码如下表所示:
表1聚类分区结果表
1.2遍历搜索方法得到上级行政区域的聚类中心;
遍历搜索方法得到每个上级行政区域的一区聚类中心如下所示:
表2聚类中心
A | B | C | D | E | |
纬度 | 38.0331 | 40.4098 | 40.8936 | 37.4914 | 38.9154 |
经度 | -84.9031 | -82.9516 | -77.4765 | -78.2577 | -80.7476 |
2、上级行政区域药物传播特点;
2.1阿片类药物的微分扩散模型;
首先,各上级行政区域每年合成阿片类药物的平均数量是根据2010年至2017年各上级行政区域各种药物案例的发生次数得出的,各年期间的案件数量如表3所示。
表3各上级行政区域在2010年至2017年期间案件数量
年份 | A | B | C | D | E |
2010 | 30.9333333 | 110.397727 | 104.149253 | 44.6870229 | 33.8727272 |
2011 | 75.4583333 | 99.1363636 | 112.179104 | 38.5419847 | 39.5090909 |
2012 | 66.8416666 | 89.3636363 | 93.5522388 | 42.0229007 | 36.8 |
2013 | 54.75 | 89.2727272 | 76.7761194 | 50.0152671 | 37.8545454 |
2014 | 51.5333333 | 95.0113636 | 84.1044776 | 40.4503816 | 29.5818181 |
2015 | 42.4083333 | 104.284090 | 77.7611940 | 35.1145038 | 23.4181818 |
2016 | 33.875 | 126.852272 | 70.9104477 | 35.3206106 | 20.4909090 |
2017 | 28.9916666 | 192.488636 | 81.3880597 | 34.7404580 | 10.6 |
可以发现每个上级行政区域的阿片类药物案发数量随着时间的推移单调变化,表明各种状态下阿片类药物的发病率随着时间的推移已经扩散到其他行政区域。以上级行政区域D为例,2010-2017年期间该上级行政区域合成阿片类药物案发数量的变化趋势如图3所示。
因此,使用微分扩散模型来分析五个上级行政区域之间的传播特征。
使用传播源经度和纬度以及时间创建的扩散模型如下:
ut-a2(uxx+uyy)=f(x,y,t)
其中,u=u(x,y,t),对于固定的t,u=u(x,y,t)表示t时刻在位置(x,y)的案发概率。
MATLAB工具箱可用于调试方程式。扩散方程可以近似为二维齐次偏微分方程,如下:
ut-1.04(uxx+uyy)=0
偏微分方程的初始条件是:
u|t=2010=10.88x2-829.7x+1.586×104
以五个上级行政区域对应所有下级行政区域的纬度和经度分别作为水平和竖直坐标绘制散点图,如图4所示。从图中可以很容易地发现所有下级行政区域的纬度和经度数据制成散点图的形状近似是平行四边形。对于二维偏微分方程,四边形的边缘是上述波动方程的边界。通过MATLAB工具箱测试,给出波动方程的边界条件如下:
u|y=0.04167x+45.13=0.381
u|y=1.186x+141.9=0.394
利用MATLAB软件进行仿真,得到了2010-2017年所有下级行政区域阿片类药物经度,纬度和案发概率的动态变化。截取了动态图的初始状态和结束状态,即2010年和2017年上述四边形阿片类药物的案发比例,如图5(a)与图5(b)所示。
结合五个上级行政区域经纬度,可以发现阿片类药物的扩散方向为A—B—E—D—C。
2.2阿片类药物的空间自相关性
对于空间自相关模型,通过MATLAB获得局部Moran指数,归一化数据后得到的表为:
表4标准化数据表
上级行政区域 | A | B | C | D | E |
莫兰指数 | 0.304929 | 0.087891 | 0.087891 | 0.286668 | 0.270743 |
结合Moran指数分区,获得两组具有较高相关性的组,B、C为一组,A、D、E为一组。
3阿片类药物空间传播的预测
3.1担忧的判断依据
2010—2017年各上级行政区域的概率密度如下表所示:
表5 2010—2017年各上级行政区域的概率密度如下表
2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | |
A | 0.09546 | 0.20683 | 0.20342 | 0.17737 | 0.17138 | 0.14986 | 0.11784 | 0.08325 |
B | 0.34069 | 0.27173 | 0.27196 | 0.28921 | 0.31598 | 0.36851 | 0.44130 | 0.55279 |
C | 0.32140 | 0.30748 | 0.28471 | 0.24873 | 0.27971 | 0.27478 | 0.24668 | 0.23373 |
D | 0.13790 | 0.10564 | 0.12789 | 0.16203 | 0.13452 | 0.12408 | 0.12287 | 0.09976 |
E | 0.10453 | 0.1082 | 0.11199 | 0.12263 | 0.09838 | 0.08275 | 0.07128 | 0.03044 |
计算上表中概率密度的平均值,获得2010年和2017年之间概率密度的阈值,如下所示:
表6 2010年和2017年之间概率密度的阈值
2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | |
阈值 | 0.19638 | 0.17442 | 0.19366 | 0.20616 | 0.21163 | 0.22487 | 0.22138 | 0.18275 |
通过比较每个上级行政区域聚类中心的经纬度,得到2010—2017年间各年需要优先关注的上级行政区域如下所示:
表7 2010—2017年间政府需要优先关注的上级行政区域
年份 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 |
上级行政区域 | B C | B C E | B C E | B C | B C | B C | B C | B C |
从上表可以看出,政府需要在2010年至2017年每年都优先考虑B和C,表明上级行政区域B和C的案发率最大。
3.2)BP神经网络预测阿片类药物案发数量
使用2010年五个所有下级行政区域的总数据来训练网络并预测2011年的数据。预测结束后,使用2011年的原始数据来测试和比较结果,发现有良好的预测效果。
参见图6,其中,经度报告的变化反映在左图中,纬度报告的变化反映在右图中;从图中可以看出,2011年药物报告的实际值与预测值基本吻合,预测效果较好。
因此,使用2010-2017年的案发数量作为预测模型输入,预测2018年的案发数量。由于实际预测中,未来某一时间的总药物报告往往是未知的。因此在使用神经网络预测未来之前,首先建立灰色预测模型,并利用现有的历史总药物报告数据预测未来一年的总药物报告。
对灰色预测模型进行可能性检验。以现有2010-2016年的总药物案发数量为输入预测模型输出,将模型2017年预测值与问题中给出的2017年数据进行对比,绘制散点如图7所示。
其中,真实值与预测值基本重合,表明预测效果更可靠。
因此,将使用2010年至2017年的现有总药物报告预测模型输入,预测2018年的输出,得到2018年案发数量超过阈值的下级行政区域散点如图8所示。
Claims (5)
1.一种基于地理相关性模型的阿片类药物空间传播预测方法,其特征在于,包括以下步骤:1)通过下级行政区域药物传播特点与上级行政区域药物传播特点建立地理相关性模型;2)通过聚类分析对每个上级行政区域中所有下级行政区域进行打包分区,确定该上级行政区域的聚类中心;3)针对各上级行政区域聚类中心,建立案发数量的微分扩散模型,并进行空间自相关分析,获得各上级行政区域一区聚类中心的阿片类药物传播特征;4)通过分析扩散模型的临界值,给出高案发率下级行政区域的判断依据;5)利用BP神经网络对未来各下级行政区域的案发数量进行预测,筛选超过扩散模型临界值的下级行政区域;步骤2)确定聚类中心的方法为:首先利用反映各下级行政区域案情严重程度的两个指标,包括案发数量和占对应上级行政区域案发总数的比例,通过K-means聚类分析将各上级行政区域中所有下级行政区域打包分层为三区;然后按照一区到三区案情严重程度递减的原则,将一区的聚类中心作为该上级行政区域的聚类中心;最后使用遍历搜索方法,利用聚类分析的分区结果,并结合各下级行政区域的经纬度坐标,根据最短欧式距离法获得一区中距离其余所有下级行政区域的距离总和最小的下级行政区域,即为打包区域的聚类中心;
步骤3)所建立的微分扩散模型为二元微分扩散模型,以各上级行政区域聚类中心的经度和纬度为自变量并考虑时间因素,具体的模型表达式如下:
ut-a2(uxx+uyy)=f(x,y,t)
对于固定的t,u=u(x,y,t)表示t时刻在位置(x,y)的案发概率,x和y分别为经度和纬度。
2.根据权利要求1所述的基于地理相关性模型的阿片类药物空间传播预测方法,其特征在于,所述的步骤3)进行空间自相关分析时,通过局部Moran指数衡量每个上级行政区域地理位置对案发情况的影响,局部Moran指数中的较高值表示具有相似变量值的区域单位在空间中聚合,局部Moran指数中的较低值表示不同变量的面积单位是空间聚合的。
4.根据权利要求1所述的基于地理相关性模型的阿片类药物空间传播预测方法,其特征在于,所述的步骤4)定义某药物在上级行政区域的概率密度为该药物在上级行政区域的案发数与其对应的下级行政区域总数之比,阈值为某国各上级行政区域在若干年当中的年概率密度的平均值;判断阿片类药物高案发率下级行政区域的数学表达式如下:
F(x,y,t)≥F0
其中,F(x,y,t)为阿片类药物的概率密度,F0为阈值。
5.根据权利要求4所述的基于地理相关性模型的阿片类药物空间传播预测方法,其特征在于,所述步骤5)首先对BP神经网络利用历史数据训练并进行可行性检验,然后以当年数据为例预测下一年的案发数量,最后通过与阈值进行比较筛选出下一年高案发率地点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910515694.5A CN110288140B (zh) | 2019-06-14 | 2019-06-14 | 一种基于地理相关性模型的阿片类药物空间传播预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910515694.5A CN110288140B (zh) | 2019-06-14 | 2019-06-14 | 一种基于地理相关性模型的阿片类药物空间传播预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110288140A CN110288140A (zh) | 2019-09-27 |
CN110288140B true CN110288140B (zh) | 2023-04-07 |
Family
ID=68005002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910515694.5A Active CN110288140B (zh) | 2019-06-14 | 2019-06-14 | 一种基于地理相关性模型的阿片类药物空间传播预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110288140B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218668A (zh) * | 2013-02-01 | 2013-07-24 | 东南大学 | 一种基于地理加权泊松回归的县级交通事故的预测方法 |
KR20140079643A (ko) * | 2012-12-18 | 2014-06-27 | 송정환 | 컴퓨터 판독이 가능한 기록 매체, 지도 정보를 이용한 쇼핑 서비스 제공 시스템 및 그 방법 |
CN106055689A (zh) * | 2016-06-08 | 2016-10-26 | 中国科学院计算机网络信息中心 | 一种基于时序相关性的空间聚类方法 |
CN106991510A (zh) * | 2017-05-31 | 2017-07-28 | 福建江夏学院 | 一种基于时空分布特征预测城市交通事故的方法 |
CN107194499A (zh) * | 2017-04-28 | 2017-09-22 | 国网冀北电力有限公司 | 区域风电短期功率的预测方法及预测装置 |
CN107767954A (zh) * | 2017-10-16 | 2018-03-06 | 中国科学院地理科学与资源研究所 | 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法 |
CN108288120A (zh) * | 2017-12-25 | 2018-07-17 | 沈阳大学 | 一种洪涝灾害应急物资分配分析方法 |
CN108876136A (zh) * | 2018-06-11 | 2018-11-23 | 北京工商大学 | 基于位置推荐改进算法的恐怖袭击事件风险评估方法 |
CN109524125A (zh) * | 2019-01-24 | 2019-03-26 | 易保互联医疗信息科技(北京)有限公司 | 基于医疗大数据的药品库存分析方法、存储介质及设备 |
CN109545386A (zh) * | 2018-11-02 | 2019-03-29 | 深圳先进技术研究院 | 一种基于深度学习的流感时空预测方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9477787B2 (en) * | 2011-08-30 | 2016-10-25 | Nokia Technologies Oy | Method and apparatus for information clustering based on predictive social graphs |
-
2019
- 2019-06-14 CN CN201910515694.5A patent/CN110288140B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140079643A (ko) * | 2012-12-18 | 2014-06-27 | 송정환 | 컴퓨터 판독이 가능한 기록 매체, 지도 정보를 이용한 쇼핑 서비스 제공 시스템 및 그 방법 |
CN103218668A (zh) * | 2013-02-01 | 2013-07-24 | 东南大学 | 一种基于地理加权泊松回归的县级交通事故的预测方法 |
CN106055689A (zh) * | 2016-06-08 | 2016-10-26 | 中国科学院计算机网络信息中心 | 一种基于时序相关性的空间聚类方法 |
CN107194499A (zh) * | 2017-04-28 | 2017-09-22 | 国网冀北电力有限公司 | 区域风电短期功率的预测方法及预测装置 |
CN106991510A (zh) * | 2017-05-31 | 2017-07-28 | 福建江夏学院 | 一种基于时空分布特征预测城市交通事故的方法 |
CN107767954A (zh) * | 2017-10-16 | 2018-03-06 | 中国科学院地理科学与资源研究所 | 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法 |
CN108288120A (zh) * | 2017-12-25 | 2018-07-17 | 沈阳大学 | 一种洪涝灾害应急物资分配分析方法 |
CN108876136A (zh) * | 2018-06-11 | 2018-11-23 | 北京工商大学 | 基于位置推荐改进算法的恐怖袭击事件风险评估方法 |
CN109545386A (zh) * | 2018-11-02 | 2019-03-29 | 深圳先进技术研究院 | 一种基于深度学习的流感时空预测方法及装置 |
CN109524125A (zh) * | 2019-01-24 | 2019-03-26 | 易保互联医疗信息科技(北京)有限公司 | 基于医疗大数据的药品库存分析方法、存储介质及设备 |
Non-Patent Citations (1)
Title |
---|
基于多种预测模型的阿片药物分布研究;彭巧娟 等;《现代计算机》;20190515;13-18 * |
Also Published As
Publication number | Publication date |
---|---|
CN110288140A (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Silva et al. | A novel unsupervised approach based on a genetic algorithm for structural damage detection in bridges | |
CN109492822A (zh) | 空气污染物浓度时空域关联预测方法 | |
CN112446559B (zh) | 一种基于深度学习的大范围地面沉降时空预测方法和系统 | |
CN110703057A (zh) | 基于数据增强和神经网络的电力设备局部放电诊断方法 | |
CN110164129B (zh) | 基于gernn的单交叉口多车道交通流量预测方法 | |
CN113947197B (zh) | 基于cnn考虑冲击地压前兆信息的微震事件危险性预测方法 | |
Ai et al. | Generation of constrained network Voronoi diagram using linear tessellation and expansion method | |
CN110826244B (zh) | 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法 | |
Bai et al. | A forecasting method of forest pests based on the rough set and PSO-BP neural network | |
CN114245337A (zh) | 一种基于图卷积网络的供水管网泄露定位传感器布置方法 | |
CN116596321B (zh) | 基于神经网络的建筑风险监测与评估方法和系统 | |
CN116341901B (zh) | 一种滑坡面域-单体危险性预警的一体化评价方法 | |
CN106056577B (zh) | 基于mds-srm混合级联的sar图像变化检测方法 | |
CN112327903A (zh) | 一种基于深度混合密度网络的航空器轨迹生成方法 | |
CN116861694A (zh) | 一种基于人工智能的电缆温度预测方法 | |
CN117408167A (zh) | 基于深度神经网络的泥石流灾害易发性预测方法 | |
CN106844626B (zh) | 利用微博关键词和位置信息模拟空气质量的方法及系统 | |
CN110288140B (zh) | 一种基于地理相关性模型的阿片类药物空间传播预测方法 | |
Haining | Data problems in spatial econometric modeling | |
CN114036829B (zh) | 地质剖面图生成方法、系统、设备及存储介质 | |
CN114880954A (zh) | 一种基于机器学习的滑坡敏感性的评估方法 | |
Croicu et al. | A fast spatial multiple imputation procedure for imprecise armed conflict events | |
CN111339446B (zh) | 一种兴趣点挖掘方法、装置、电子设备和存储介质 | |
Manganelli et al. | Spatial analysis and statistics for zoning of urban areas | |
Ziat et al. | Learning Embeddings for Completion and Prediction of Relationnal Multivariate Time-Series. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |