CN115204475A - 一种戒毒场所安全事件风险评估方法 - Google Patents
一种戒毒场所安全事件风险评估方法 Download PDFInfo
- Publication number
- CN115204475A CN115204475A CN202210762726.3A CN202210762726A CN115204475A CN 115204475 A CN115204475 A CN 115204475A CN 202210762726 A CN202210762726 A CN 202210762726A CN 115204475 A CN115204475 A CN 115204475A
- Authority
- CN
- China
- Prior art keywords
- input
- sample
- drug
- calculating
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000003814 drug Substances 0.000 title claims abstract description 35
- 229940079593 drug Drugs 0.000 title claims abstract description 35
- 238000012502 risk assessment Methods 0.000 title claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims description 32
- 210000002569 neuron Anatomy 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 7
- 239000010755 BS 2869 Class G Substances 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 6
- 230000005856 abnormality Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 206010000117 Abnormal behaviour Diseases 0.000 claims description 3
- 238000009529 body temperature measurement Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 208000007271 Substance Withdrawal Syndrome Diseases 0.000 claims 1
- 238000002156 mixing Methods 0.000 abstract description 4
- 230000002194 synthesizing effect Effects 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241001622623 Coeliadinae Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种戒毒场所安全事件风险评估方法,采用融合Borderline‑SMOTE算法和Bagging算法,降低噪音少数类样本对合成样本集准确率的影响,避免合成过多冗余数据影响分类性能,最大限度降低人工合成样本带来噪音的负面影响;同时,本发明方法采用集成LightGBM‑Blending算法能有效解决类别字段过多的问题;智能分析研判评估通过计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,根据权重贡献率大小,判断输入因子对输出的影响程度,从而确定其重要性;本发明方法的目的在于提供全面、有效、稳定的戒毒场所安全事件风险评估方法。
Description
技术领域
本发明涉及人工智能、大数据技术和物联网领域,特别是涉及一种戒毒场所安全事件风险评估方法。
背景技术
现有的戒毒场所安全风险管理智慧化水平仍有待进一步提高,主要表现为:一是场所重大安全风险响应不及时,戒毒场所安全研判、风险感知尚未建立完备的体系和模型,对于场所的安全风险预警和综合研判分析亟待解决;二是安全风险预警智能化效果不佳,场所安全、人员风险预测研判基本依靠民警经验,人工智能手段应用不充分;三是所情安全态势评估不智能,无法及时获取业务状态、设施设备运行状态监测数据,基于人工智能的情安全态势评估方法应用不足;四是数据利用率低,安防数据、预警数据、运维数据等没有得到充分利用,无法形成用数据管理和研判、决策闭环。
借力大数据、人工智能等高新技术发展浪潮,提升场所治理精细化水平,推动戒毒工作与社会治理、国家治理同步同向实现现代化,已成为新形势下急需回应的重大命题。大数据时代,开展戒毒场所安全风险评估,对推动新时代司法行政戒毒工作高质量发展具有十分重要的理论与现实意义。
基于戒毒所通过各种途径(综合业务系统、综合安防系统等)记录的关于戒毒人员的41个指标的数据采用大数据算法开展对戒毒人员的风险识别,面临以下3个问题:戒毒人员有风险和无风险的人员在比例上不平衡程度极高,即样本不平衡性高,会造成模型训练效果差、识别精度低;高维样本点的样本空间复杂性在给人工合成新样本增加了难度;戒毒人员行为、心理异常,安防系统捕捉人员异常风险信息识别度难度高,造成数据点在数据空间中有大量噪音点,这部分数据点对分类器有较大影响;戒毒场所安全态势评估面临大量类别字段,而类别型字段由于无法直接作为输入字段使用,往往需要进行二次加工,将进一步加大模型产生误差概率,为保证戒毒场所安全态势评估的可信度,需寻找合理策略处理大量的类别型字段。
发明内容
鉴于以上所述现有技术的缺点,本发明借助人工智能与大数据技术,采用融合Borderline-SMOTE算法和Bagging算法,降低噪音少数类样本对合成样本集准确率的影响,避免合成过多冗余数据影响分类性能,最大限度降低人工合成样本带来噪音的负面影响;同时,本发明方法采用集成LightGBM-Blending算法能有效解决类别字段过多的问题;智能分析研判评估通过计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,根据权重贡献率大小,判断输入因子对输出的影响程度,从而确定其重要性;本发明方法的目的在于提供实时、高效、智慧的戒毒场所安全事件风险评估方法。
为实现上述目的及其他相关目的,为实现上述目的及其他相关目的,本发明采用的技术方案如下:
一种戒毒场所安全事件风险评估方法,包括步骤:
S1)进行戒毒人员风险评估;
S11)输入样本集S,采用k均值聚类算法将S划分为少数类数据集Ss和多数类数据集Sm,其中xi∈Ss,i=1,2,3,…,L(Ss).;
S13)用少数类数据集Ss和多数类数据集Sm元素个数比例计算正负类样本不平衡比例后确定采样倍率,从少数类数据集Ss的元素xi(i=1,2,3,…,L(Ss))的k近邻中随机抽取若干个样本xk(1≤k≤L(Ss),k≠i),记xik=xi+random(0,1)*(xi-xk),1≤i,k≤L(Ss),i≠k为构造的少数类新样本,将xik添加到少数类数据集Ss,重复步骤S13),直到少数类数据集Ss和多数类数据集Sm元素个数比例接近1;
S14)从S中随机抽样b1条样本,输入弱分类器A1,作为第一个基学习器B1;
S15)从S中有放回随机抽样b2条样本,输入弱分类器A2,作为第二个基学习器B2;
S16)以S14)、S15)的方式重复n次,构建n个基学习器B1至Bn;
S17)输入测试集T到n个基学习器进行测试,通过voting决定测试集T样本的分类结果,其中测试集T第j个样本Pj通过n个基学习器voting后,预测为多数类的票数有m票,则预测为少数类的有n-m票,若n-m≤m,则样本Pj被判定为多数类样本;反之,被判定为少数类样本;
S2)进行戒毒场所安全态势评估,按行业字段对样本集S进行划分后输入基于LightGBM算法的基分类器进行训练,再输入基于LinearBlending算法的次级学习器进行训练,形成戒毒人员风险识别模型Mf;
S3)进行智能分析研判评估;
S31)采集相应的异常行为、门禁设备异常、测温筛查、设备故障、医疗监测以及生理特征六个维度的数据,构建基于BP神经网络模型,进行网络初始化,给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数e,给定计算精度值ε和最大学习次数M;
S32)随机选取第k个输入样本以及对应的期望输出:
S33)计算隐含层各神经元的输入和输出:
S34)利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k);
S38)当误差达到E预设精度或者学习次数大于设定的最大次数M,则结束算法,否则,选取下一个学习样本以及对应的输出期望,返回S33)进入下一轮学习;
S39)利用训练好的神经网络模型进行预测,并计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,其中输入节点i的权重贡献率计算公式为:式中bi为第i个输入结点的权重贡献率,Wij为输入层结点i与隐层结点j的连接权值,Vj为隐层结点j与输出节点的连接权值;
S4)进行所情安全态势评估,输入样本集D=(x1,x2,...,xn),输入相似矩阵的生成方式,输入降维后的维度k1,输入聚类方法,输入聚类后的维度k2;
S41)根据输入的相似矩阵的生成方式构建样本的相似矩阵SS;
S42)根据相似矩阵SS构建度矩阵D,计算出拉普拉斯矩阵L;
S45)特征向量fa,a=1,2,3,…,k1组成的矩阵按行标准化,最终组成L(fa)×k1维的特征矩阵F;
S46)对特征矩阵F中的每一行作为一个k1维的样本,共L(fa)个样本,用输入的聚类方法进行聚类,聚类维数为k2;
S47)得到簇划分C(c1,c2,...ck2);
S48)计算每个簇的样本量、最终的类中心值及类中心间的距离,并以此测算各安全级别对业务执行状态以及设备运行状态具体影响因素的关注程度以及差异;
S5)进行戒治效能分析;
S51)输入戒毒人员画像分析、心理评测分析、诊断评估分析效能描述3方面的指标数据,建立XGBoost模型;
S52)用一部分历史数据和专家打分得出的效能值作为训练集训练XGBoost的效能预测模型,完成模型的训练与优化;
S53)将未打分的历史数据输入模型得出各自的效能得分,这样得到每个戒毒人员戒毒前后的效能对比,并用相对效能和绝对效能得分来得出戒毒人员的戒治效能综合指标评判体系;
S6)对S1)、S2)、S3)、S4)、S5)步骤的输出进行排序得到综合评估。
进一步地,L(Ss)为集合Ss的长度。
进一步地,L(fa)为向量fa的长度。
可选地,相似矩阵的生成方式是基于高斯核距离的全连接方式。
可选地,步骤S4)所述的聚类方法为K-Means。
如上所述,本发明方法提供一种戒毒场所安全事件风险评估方法,具有以下有益效果:戒毒安全风险评估数据集存在大量类别型字段,数据集具有明显的非平衡性,因此需要针对不同数据类型、决策目标研究不同人工智能安全风险评估方法。发明方法通过构建基于机器学习的大数据特征选择、分类、聚类和学习训练模型,解决大数据评价多源、多维、异构难题,解决大数据环境下戒毒安全风险评估“维数灾难”问题。首先通过综合比较主流样本合成算法在合成样本的精细度以及分类器算法对非平衡样本集少数类样本识别能力,针对戒毒大数据中心平台样本数据非平衡性及高噪声异质性,提出Borderline-SMOTEBagging集成评估方法,该集成评估方法具备良好的样本分类能力和优秀的泛化能力,能有效降低因合成样本形成的噪音所带来的负面影响,且具备良好的少数类样本识别能力。然后针对戒毒人员存在高类型差异性及评价类别型字段过多问题,为防止评估过程出现严重过拟合现象和因二次加工产生的误差,发明方法提供集成LightGBM-Blending集成评估方法,该集成评估方法通过构建以LightGBM为基础的多基分类器,避免对类别特征进行二次处理。
附图说明
图1为一实施例提供的一种戒毒场所安全事件风险评估方法结构示意图;
图2为一实施例提供的一种戒毒场所安全事件风险评估方法实施示意图;
具体实施方式
为了使本发明的目的、技术方案及优点更清楚明白,一下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明。
在一实施例中,一种戒毒场所安全事件风险评估方法,整体架构结构如图1所示;实施流程如图2所示,包括步骤:
S1)进行戒毒人员风险评估;
S11)输入样本集S,采用k均值聚类算法将S划分为少数类数据集Ss和多数类数据集Sm,其中xi∈Ss,i=1,2,3,…,L(Ss).;
S13)用少数类数据集Ss和多数类数据集Sm元素个数比例计算正负类样本不平衡比例后确定采样倍率,从少数类数据集Ss的元素xi(i=1,2,3,…,L(Ss))的k近邻中随机抽取20个样本xk(1≤k≤L(Ss),k≠i),记xik=xi+random(0,1)*(xi-xk),1≤i,k≤L(Ss),i≠k为构造的少数类新样本,将xik添加到少数类数据集Ss,重复步骤S13),直到少数类数据集Ss和多数类数据集Sm元素个数比例接近1;
S14)从S中随机抽样b1=100条样本,输入弱分类器A1,作为第一个基学习器B1;
S15)从S中有放回随机抽样b2=20条样本,输入弱分类器A2,作为第二个基学习器B2;
S16)以S14)、S15)的方式重复n=10次,构建n=10个基学习器B1至Bn;
S17)输入测试集T到n=10个基学习器进行测试,通过voting决定测试集T样本的分类结果,其中测试集T第j个样本Pj通过n=10个基学习器voting后,预测为多数类的票数有m票,则预测为少数类的有n-m票,若n-m≤m,则样本Pj被判定为多数类样本;反之,被判定为少数类样本;
S2)进行戒毒场所安全态势评估,按行业字段对样本集S进行划分后输入基于LightGBM算法的基分类器进行训练,再输入基于LinearBlending算法的次级学习器进行训练,形成戒毒人员风险识别模型Mf;
S3)进行智能分析研判评估;
S31)采集相应的异常行为、门禁设备异常、测温筛查、设备故障、医疗监测以及生理特征六个维度的数据,构建基于BP神经网络模型,进行网络初始化,给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数e,给定计算精度值ε=1_3和最大学习次数M=8;
S32)随机选取第k=90个输入样本以及对应的期望输出:
S33)计算隐含层各神经元的输入和输出:
S34)利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k);
S38)当误差达到E预设精度或者学习次数大于设定的最大次数M,则结束算法,否则,选取下一个学习样本以及对应的输出期望,返回S33)进入下一轮学习;
S39)利用训练好的神经网络模型进行预测,并计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,其中输入节点i的权重贡献率计算公式为:式中bi为第i个输入结点的权重贡献率,Wij为输入层结点i与隐层结点j的连接权值,Vj为隐层结点j与输出节点的连接权值;
S4)进行所情安全态势评估,输入样本集D=(x1,x2,...,xn),输入基于高斯核距离的全连接方式的相似矩阵生成方式,输入降维后的维度k1=20,输入聚类方法K-Means,输入聚类后的维度k2=20;
S41)根据输入的相似矩阵的生成方式构建样本的相似矩阵SS;
S42)根据相似矩阵SS构建度矩阵D,计算出拉普拉斯矩阵L;
S45)特征向量fa,a=1,2,3,…,k1组成的矩阵按行标准化,最终组成L(fa)×k1维的特征矩阵F;
S46)对特征矩阵F中的每一行作为一个k1维的样本,共L(fa)个样本,用输入的聚类方法进行聚类,聚类维数为k2;
S47)得到簇划分C(c1,c2,...ck2);
S48)计算每个簇的样本量、最终的类中心值及类中心间的距离,并以此测算各安全级别对业务执行状态以及设备运行状态具体影响因素的关注程度以及差异;
S5)进行戒治效能分析;
S51)输入戒毒人员画像分析、心理评测分析、诊断评估分析效能描述3方面的指标数据,建立XGBoost模型;
S52)用一部分历史数据和专家打分得出的效能值作为训练集训练XGBoost的效能预测模型,完成模型的训练与优化;
S53)将未打分的历史数据输入模型得出各自的效能得分,这样得到每个戒毒人员戒毒前后的效能对比,并用相对效能和绝对效能得分来得出戒毒人员的戒治效能综合指标评判体系;
S6)对S1)、S2)、S3)、S4)、S5)步骤的输出进行升序排序得到综合评估。
本发明的有益效果是:本发明使用实时频次计数方法简化了当前大多数拼音纠错算法使用的噪声通道模型,有效提高纠错算法效率;而诸如搜索优化(Martins和Silva,2004;Gao等,2010)、机器翻译(Belinkov和Bisk,2017)、词性标记(Van Rooy和Schafer,2002;Sak-aguchi等,2012)等纠错算法,需要全面掌握单词相似性、语言建模和推理,不但复杂度高,而且规模庞大;本发明相对这些算法的规模和复杂度而言,是一个非常轻量级的方法。另外,本发明采用字符字母直接替换方法取代传统的编辑距离计算方法,避免使用其他拼音纠错算法频繁地计算编辑距离。对于词典词库的建立和管理都是针对使用者个体的本地化而言,个性化高、针对性强、规模小。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种戒毒场所安全事件风险评估方法,其特征在于,包括步骤:
S1)进行戒毒人员风险评估;
S2)进行戒毒场所安全态势评估,按行业字段对样本集S进行划分后输入基于LightGBM算法的基分类器进行训练,再输入基于LinearBlending算法的次级学习器进行训练,形成戒毒人员风险识别模型Mf;
S3)进行智能分析研判评估;
S4)进行所情安全态势评估,输入样本集D=(x1,x2,...,xn),输入相似矩阵的生成方式,输入降维后的维度k1,输入聚类方法,输入聚类后的维度k2;
S41)根据输入的相似矩阵的生成方式构建样本的相似矩阵SS;
S42)根据相似矩阵SS构建度矩阵D,计算出拉普拉斯矩阵L;
S45)特征向量fa,a=1,2,3,…,k1组成的矩阵按行标准化,最终组成L(fa)×k1维的特征矩阵F;
S46)对特征矩阵F中的每一行作为一个k1维的样本,共L(fa)个样本,用输入的聚类方法进行聚类,聚类维数为k2;
S47)得到簇划分C(c1,c2,...ck2);
S48)计算每个簇的样本量、最终的类中心值及类中心间的距离,并以此测算各安全级别对业务执行状态以及设备运行状态具体影响因素的关注程度以及差异;
S5)进行戒治效能分析;
S51)输入戒毒人员画像分析、心理评测分析、诊断评估分析效能描述3方面的指标数据,建立XGBoost模型;
S52)用一部分历史数据和专家打分得出的效能值作为训练集训练XGBoost的效能预测模型,完成模型的训练与优化;
S53)将未打分的历史数据输入模型得出各自的效能得分,这样得到每个戒毒人员戒毒前后的效能对比,并用相对效能和绝对效能得分来得出戒毒人员的戒治效能综合指标评判体系;
S6)对S1)、S2)、S3)、S4)、S5)步骤的输出进行排序得到综合评估。
2.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,步骤S1中,所述的进行戒毒人员风险评估包括步骤:
S11)输入样本集S,采用k均值聚类算法将S划分为少数类数据集Ss和多数类数据集Sm,其中xi∈Ss,i=1,2,3,…,L(Ss).;
S13)用少数类数据集Ss和多数类数据集Sm元素个数比例计算正负类样本不平衡比例后确定采样倍率,从少数类数据集Ss的元素xi(i=1,2,3,…,L(Ss))的k近邻中随机抽取若干个样本xk(1≤k≤L(Ss),k≠i),记xik=xi+random(0,1)*(xi-xk),1≤i,k≤L(Ss),i≠k为构造的少数类新样本,将xik添加到少数类数据集Ss,重复步骤S13),直到少数类数据集Ss和多数类数据集Sm元素个数比例接近1;
S14)从S中随机抽样b1条样本,输入弱分类器A1,作为第一个基学习器B1;
S15)从S中有放回随机抽样b2条样本,输入弱分类器A2,作为第二个基学习器B2;
S16)以S14)、S15)的方式重复n次,构建n个基学习器B1至Bn;
S17)输入测试集T到n个基学习器进行测试,通过voting决定测试集T样本的分类结果,其中测试集T第j个样本Pj通过n个基学习器voting后,预测为多数类的票数有m票,则预测为少数类的有n-m票,若n-m≤m,则样本Pj被判定为多数类样本;反之,被判定为少数类样本。
3.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,步骤S3中,所述的进行智能分析研判评估包括步骤:
S31)采集相应的异常行为、门禁设备异常、测温筛查、设备故障、医疗监测以及生理特征六个维度的数据,构建基于BP神经网络模型,进行网络初始化,给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数e,给定计算精度值ε和最大学习次数M;
S32)随机选取第k个输入样本以及对应的期望输出:
S33)计算隐含层各神经元的输入和输出:
S34)利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k);
S38)当误差达到E预设精度或者学习次数大于设定的最大次数M,则结束算法,否则,选取下一个学习样本以及对应的输出期望,返回S33)进入下一轮学习;
4.根据权利要求2所述的进行戒毒人员风险评估,其特征在于,所述的L(Ss)为集合Ss的长度。
5.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,所述的L(fa)为向量fa的长度。
6.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,所述的评估相似矩阵的生成方式是基于高斯核距离的全连接方式。
7.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,步骤S4)所述的聚类方法为K-Means。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210762726.3A CN115204475A (zh) | 2022-06-30 | 2022-06-30 | 一种戒毒场所安全事件风险评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210762726.3A CN115204475A (zh) | 2022-06-30 | 2022-06-30 | 一种戒毒场所安全事件风险评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204475A true CN115204475A (zh) | 2022-10-18 |
Family
ID=83578663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210762726.3A Pending CN115204475A (zh) | 2022-06-30 | 2022-06-30 | 一种戒毒场所安全事件风险评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204475A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116434950A (zh) * | 2023-06-05 | 2023-07-14 | 山东建筑大学 | 基于数据分簇和集成学习的孤独症谱系障碍的诊断系统 |
-
2022
- 2022-06-30 CN CN202210762726.3A patent/CN115204475A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116434950A (zh) * | 2023-06-05 | 2023-07-14 | 山东建筑大学 | 基于数据分簇和集成学习的孤独症谱系障碍的诊断系统 |
CN116434950B (zh) * | 2023-06-05 | 2023-08-29 | 山东建筑大学 | 基于数据分簇和集成学习的孤独症谱系障碍的诊断系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ramezani et al. | A novel hybrid intelligent system with missing value imputation for diabetes diagnosis | |
CN110110809B (zh) | 基于机器故障诊断的模糊自动机的构建方法 | |
Cui et al. | CONAN: complementary pattern augmentation for rare disease detection | |
CN108416364A (zh) | 分包融合集成学习数据分类方法 | |
CN112756759B (zh) | 点焊机器人工作站故障判定方法 | |
EP3968337A1 (en) | Target object attribute prediction method based on machine learning and related device | |
CN108647707A (zh) | 概率神经网络创建方法、故障诊断方法及装置、存储介质 | |
CN109164794B (zh) | 基于偏f值selm的多变量工业过程故障分类方法 | |
CN115204475A (zh) | 一种戒毒场所安全事件风险评估方法 | |
Mounika et al. | Machine learning and deep learning models for diagnosis of parkinson’s disease: a performance analysis | |
Wang et al. | The criticality of spare parts evaluating model using artificial neural network approach | |
Wang et al. | Early diagnosis of Parkinson's disease with Speech Pronunciation features based on XGBoost model | |
Kai et al. | Notice of Retraction: A Novel Forecasting Model of Fuzzy Time Series Based on K-means Clustering | |
Trstenjak et al. | Adaptable web prediction framework for disease prediction based on the hybrid Case Based Reasoning model | |
Mahendra et al. | Optimizing convolutional neural network by using genetic algorithm for COVID-19 detection in chest X-ray image | |
Amaral et al. | SummerTime: variable-length time series summarization with application to physical activity analysis | |
Yu et al. | An automatic recognition method of journal impact factor manipulation | |
CN115293249A (zh) | 一种基于动态时序预测的电力系统典型场景概率预测方法 | |
CN112836645A (zh) | 面向大规模运动心率序列的代跑检测方法 | |
Assegaf | Student academic performance prediction on problem based learning using support vector machine and K-nearest neighbor | |
Mistry et al. | Estimating missing data and determining the confidence of the estimate data | |
CN116226629B (zh) | 一种基于特征贡献的多模型特征选择方法及系统 | |
Nurmalasari et al. | Retinal Fundus Images Classification to Diagnose the Severity of Diabetic Retinopathy using CNN | |
Ding et al. | A Novel LSTM-1DCNN-based Deep Network for Fault Diagnosis in Chemical Process | |
Shinde et al. | COVID-19 prediction through CNN and LSTM deep learning models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |