CN115204475A - 一种戒毒场所安全事件风险评估方法 - Google Patents

一种戒毒场所安全事件风险评估方法 Download PDF

Info

Publication number
CN115204475A
CN115204475A CN202210762726.3A CN202210762726A CN115204475A CN 115204475 A CN115204475 A CN 115204475A CN 202210762726 A CN202210762726 A CN 202210762726A CN 115204475 A CN115204475 A CN 115204475A
Authority
CN
China
Prior art keywords
input
sample
drug
calculating
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210762726.3A
Other languages
English (en)
Inventor
沈俊鑫
沈冰亮
马跃文
尹朝敢
王保青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Drug Rehabilitation Administration
Hangzhou Hikvision Digital Technology Co Ltd
Kunming University of Science and Technology
Original Assignee
Yunnan Drug Rehabilitation Administration
Hangzhou Hikvision Digital Technology Co Ltd
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Drug Rehabilitation Administration, Hangzhou Hikvision Digital Technology Co Ltd, Kunming University of Science and Technology filed Critical Yunnan Drug Rehabilitation Administration
Priority to CN202210762726.3A priority Critical patent/CN115204475A/zh
Publication of CN115204475A publication Critical patent/CN115204475A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种戒毒场所安全事件风险评估方法,采用融合Borderline‑SMOTE算法和Bagging算法,降低噪音少数类样本对合成样本集准确率的影响,避免合成过多冗余数据影响分类性能,最大限度降低人工合成样本带来噪音的负面影响;同时,本发明方法采用集成LightGBM‑Blending算法能有效解决类别字段过多的问题;智能分析研判评估通过计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,根据权重贡献率大小,判断输入因子对输出的影响程度,从而确定其重要性;本发明方法的目的在于提供全面、有效、稳定的戒毒场所安全事件风险评估方法。

Description

一种戒毒场所安全事件风险评估方法
技术领域
本发明涉及人工智能、大数据技术和物联网领域,特别是涉及一种戒毒场所安全事件风险评估方法。
背景技术
现有的戒毒场所安全风险管理智慧化水平仍有待进一步提高,主要表现为:一是场所重大安全风险响应不及时,戒毒场所安全研判、风险感知尚未建立完备的体系和模型,对于场所的安全风险预警和综合研判分析亟待解决;二是安全风险预警智能化效果不佳,场所安全、人员风险预测研判基本依靠民警经验,人工智能手段应用不充分;三是所情安全态势评估不智能,无法及时获取业务状态、设施设备运行状态监测数据,基于人工智能的情安全态势评估方法应用不足;四是数据利用率低,安防数据、预警数据、运维数据等没有得到充分利用,无法形成用数据管理和研判、决策闭环。
借力大数据、人工智能等高新技术发展浪潮,提升场所治理精细化水平,推动戒毒工作与社会治理、国家治理同步同向实现现代化,已成为新形势下急需回应的重大命题。大数据时代,开展戒毒场所安全风险评估,对推动新时代司法行政戒毒工作高质量发展具有十分重要的理论与现实意义。
基于戒毒所通过各种途径(综合业务系统、综合安防系统等)记录的关于戒毒人员的41个指标的数据采用大数据算法开展对戒毒人员的风险识别,面临以下3个问题:戒毒人员有风险和无风险的人员在比例上不平衡程度极高,即样本不平衡性高,会造成模型训练效果差、识别精度低;高维样本点的样本空间复杂性在给人工合成新样本增加了难度;戒毒人员行为、心理异常,安防系统捕捉人员异常风险信息识别度难度高,造成数据点在数据空间中有大量噪音点,这部分数据点对分类器有较大影响;戒毒场所安全态势评估面临大量类别字段,而类别型字段由于无法直接作为输入字段使用,往往需要进行二次加工,将进一步加大模型产生误差概率,为保证戒毒场所安全态势评估的可信度,需寻找合理策略处理大量的类别型字段。
发明内容
鉴于以上所述现有技术的缺点,本发明借助人工智能与大数据技术,采用融合Borderline-SMOTE算法和Bagging算法,降低噪音少数类样本对合成样本集准确率的影响,避免合成过多冗余数据影响分类性能,最大限度降低人工合成样本带来噪音的负面影响;同时,本发明方法采用集成LightGBM-Blending算法能有效解决类别字段过多的问题;智能分析研判评估通过计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,根据权重贡献率大小,判断输入因子对输出的影响程度,从而确定其重要性;本发明方法的目的在于提供实时、高效、智慧的戒毒场所安全事件风险评估方法。
为实现上述目的及其他相关目的,为实现上述目的及其他相关目的,本发明采用的技术方案如下:
一种戒毒场所安全事件风险评估方法,包括步骤:
S1)进行戒毒人员风险评估;
S11)输入样本集S,采用k均值聚类算法将S划分为少数类数据集Ss和多数类数据集Sm,其中xi∈Ss,i=1,2,3,…,L(Ss).;
S12)给定阈值Tk,计算xi(i=1,2,3,…,L(Ss))与多数类数据集Sm的欧氏距离di,若
Figure BDA0003723371670000021
则xi归为安全类Gs,若
Figure BDA0003723371670000022
则xi归为边界类Ge,若di=Tk则xi归为噪声类Gn
S13)用少数类数据集Ss和多数类数据集Sm元素个数比例计算正负类样本不平衡比例后确定采样倍率,从少数类数据集Ss的元素xi(i=1,2,3,…,L(Ss))的k近邻中随机抽取若干个样本xk(1≤k≤L(Ss),k≠i),记xik=xi+random(0,1)*(xi-xk),1≤i,k≤L(Ss),i≠k为构造的少数类新样本,将xik添加到少数类数据集Ss,重复步骤S13),直到少数类数据集Ss和多数类数据集Sm元素个数比例接近1;
S14)从S中随机抽样b1条样本,输入弱分类器A1,作为第一个基学习器B1
S15)从S中有放回随机抽样b2条样本,输入弱分类器A2,作为第二个基学习器B2
S16)以S14)、S15)的方式重复n次,构建n个基学习器B1至Bn
S17)输入测试集T到n个基学习器进行测试,通过voting决定测试集T样本的分类结果,其中测试集T第j个样本Pj通过n个基学习器voting后,预测为多数类的票数有m票,则预测为少数类的有n-m票,若n-m≤m,则样本Pj被判定为多数类样本;反之,被判定为少数类样本;
S2)进行戒毒场所安全态势评估,按行业字段对样本集S进行划分后输入基于LightGBM算法的基分类器进行训练,再输入基于LinearBlending算法的次级学习器进行训练,形成戒毒人员风险识别模型Mf
S3)进行智能分析研判评估;
S31)采集相应的异常行为、门禁设备异常、测温筛查、设备故障、医疗监测以及生理特征六个维度的数据,构建基于BP神经网络模型,进行网络初始化,给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数e,给定计算精度值ε和最大学习次数M;
S32)随机选取第k个输入样本以及对应的期望输出:
Figure BDA0003723371670000031
S33)计算隐含层各神经元的输入和输出:
Figure BDA0003723371670000032
S34)利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k);
S35)利用输出层各神经元的δo(k)和隐含层各神经元的输出来修正连接权值
Figure BDA0003723371670000041
S36)利用隐含层各神经元的δh(k)和输入层各神经元的输入修正连接权值:
Figure BDA0003723371670000042
S37)计算全局误差:
Figure BDA0003723371670000043
S38)当误差达到E预设精度或者学习次数大于设定的最大次数M,则结束算法,否则,选取下一个学习样本以及对应的输出期望,返回S33)进入下一轮学习;
S39)利用训练好的神经网络模型进行预测,并计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,其中输入节点i的权重贡献率计算公式为:
Figure BDA0003723371670000044
式中bi为第i个输入结点的权重贡献率,Wij为输入层结点i与隐层结点j的连接权值,Vj为隐层结点j与输出节点的连接权值;
S4)进行所情安全态势评估,输入样本集D=(x1,x2,...,xn),输入相似矩阵的生成方式,输入降维后的维度k1,输入聚类方法,输入聚类后的维度k2
S41)根据输入的相似矩阵的生成方式构建样本的相似矩阵SS;
S42)根据相似矩阵SS构建度矩阵D,计算出拉普拉斯矩阵L;
S43)构建标准化后的拉普拉斯矩阵
Figure BDA0003723371670000045
S44)计算
Figure BDA0003723371670000046
最小的k1个特征值所各自对应的特征向量fa,a=1,2,3,…,k1
S45)特征向量fa,a=1,2,3,…,k1组成的矩阵按行标准化,最终组成L(fa)×k1维的特征矩阵F;
S46)对特征矩阵F中的每一行作为一个k1维的样本,共L(fa)个样本,用输入的聚类方法进行聚类,聚类维数为k2
S47)得到簇划分C(c1,c2,...ck2);
S48)计算每个簇的样本量、最终的类中心值及类中心间的距离,并以此测算各安全级别对业务执行状态以及设备运行状态具体影响因素的关注程度以及差异;
S5)进行戒治效能分析;
S51)输入戒毒人员画像分析、心理评测分析、诊断评估分析效能描述3方面的指标数据,建立XGBoost模型;
S52)用一部分历史数据和专家打分得出的效能值作为训练集训练XGBoost的效能预测模型,完成模型的训练与优化;
S53)将未打分的历史数据输入模型得出各自的效能得分,这样得到每个戒毒人员戒毒前后的效能对比,并用相对效能和绝对效能得分来得出戒毒人员的戒治效能综合指标评判体系;
S6)对S1)、S2)、S3)、S4)、S5)步骤的输出进行排序得到综合评估。
进一步地,L(Ss)为集合Ss的长度。
进一步地,L(fa)为向量fa的长度。
可选地,相似矩阵的生成方式是基于高斯核距离的全连接方式。
可选地,步骤S4)所述的聚类方法为K-Means。
如上所述,本发明方法提供一种戒毒场所安全事件风险评估方法,具有以下有益效果:戒毒安全风险评估数据集存在大量类别型字段,数据集具有明显的非平衡性,因此需要针对不同数据类型、决策目标研究不同人工智能安全风险评估方法。发明方法通过构建基于机器学习的大数据特征选择、分类、聚类和学习训练模型,解决大数据评价多源、多维、异构难题,解决大数据环境下戒毒安全风险评估“维数灾难”问题。首先通过综合比较主流样本合成算法在合成样本的精细度以及分类器算法对非平衡样本集少数类样本识别能力,针对戒毒大数据中心平台样本数据非平衡性及高噪声异质性,提出Borderline-SMOTEBagging集成评估方法,该集成评估方法具备良好的样本分类能力和优秀的泛化能力,能有效降低因合成样本形成的噪音所带来的负面影响,且具备良好的少数类样本识别能力。然后针对戒毒人员存在高类型差异性及评价类别型字段过多问题,为防止评估过程出现严重过拟合现象和因二次加工产生的误差,发明方法提供集成LightGBM-Blending集成评估方法,该集成评估方法通过构建以LightGBM为基础的多基分类器,避免对类别特征进行二次处理。
附图说明
图1为一实施例提供的一种戒毒场所安全事件风险评估方法结构示意图;
图2为一实施例提供的一种戒毒场所安全事件风险评估方法实施示意图;
具体实施方式
为了使本发明的目的、技术方案及优点更清楚明白,一下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明。
在一实施例中,一种戒毒场所安全事件风险评估方法,整体架构结构如图1所示;实施流程如图2所示,包括步骤:
S1)进行戒毒人员风险评估;
S11)输入样本集S,采用k均值聚类算法将S划分为少数类数据集Ss和多数类数据集Sm,其中xi∈Ss,i=1,2,3,…,L(Ss).;
S12)给定阈值Tk=5.1,计算xi(i=1,2,3,…,L(Ss))与多数类数据集Sm的欧氏距离di,若
Figure BDA0003723371670000061
则xi归为安全类Gs,若
Figure BDA0003723371670000062
则xi归为边界类Ge,若di=Tk则xi归为噪声类Gn
S13)用少数类数据集Ss和多数类数据集Sm元素个数比例计算正负类样本不平衡比例后确定采样倍率,从少数类数据集Ss的元素xi(i=1,2,3,…,L(Ss))的k近邻中随机抽取20个样本xk(1≤k≤L(Ss),k≠i),记xik=xi+random(0,1)*(xi-xk),1≤i,k≤L(Ss),i≠k为构造的少数类新样本,将xik添加到少数类数据集Ss,重复步骤S13),直到少数类数据集Ss和多数类数据集Sm元素个数比例接近1;
S14)从S中随机抽样b1=100条样本,输入弱分类器A1,作为第一个基学习器B1
S15)从S中有放回随机抽样b2=20条样本,输入弱分类器A2,作为第二个基学习器B2
S16)以S14)、S15)的方式重复n=10次,构建n=10个基学习器B1至Bn
S17)输入测试集T到n=10个基学习器进行测试,通过voting决定测试集T样本的分类结果,其中测试集T第j个样本Pj通过n=10个基学习器voting后,预测为多数类的票数有m票,则预测为少数类的有n-m票,若n-m≤m,则样本Pj被判定为多数类样本;反之,被判定为少数类样本;
S2)进行戒毒场所安全态势评估,按行业字段对样本集S进行划分后输入基于LightGBM算法的基分类器进行训练,再输入基于LinearBlending算法的次级学习器进行训练,形成戒毒人员风险识别模型Mf
S3)进行智能分析研判评估;
S31)采集相应的异常行为、门禁设备异常、测温筛查、设备故障、医疗监测以及生理特征六个维度的数据,构建基于BP神经网络模型,进行网络初始化,给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数e,给定计算精度值ε=1_3和最大学习次数M=8;
S32)随机选取第k=90个输入样本以及对应的期望输出:
Figure BDA0003723371670000081
S33)计算隐含层各神经元的输入和输出:
Figure BDA0003723371670000082
S34)利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k);
S35)利用输出层各神经元的δo(k)和隐含层各神经元的输出来修正连接权值
Figure BDA0003723371670000083
S36)利用隐含层各神经元的δh(k)和输入层各神经元的输入修正连接权值:
Figure BDA0003723371670000084
S37)计算全局误差:
Figure BDA0003723371670000085
S38)当误差达到E预设精度或者学习次数大于设定的最大次数M,则结束算法,否则,选取下一个学习样本以及对应的输出期望,返回S33)进入下一轮学习;
S39)利用训练好的神经网络模型进行预测,并计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,其中输入节点i的权重贡献率计算公式为:
Figure BDA0003723371670000086
式中bi为第i个输入结点的权重贡献率,Wij为输入层结点i与隐层结点j的连接权值,Vj为隐层结点j与输出节点的连接权值;
S4)进行所情安全态势评估,输入样本集D=(x1,x2,...,xn),输入基于高斯核距离的全连接方式的相似矩阵生成方式,输入降维后的维度k1=20,输入聚类方法K-Means,输入聚类后的维度k2=20;
S41)根据输入的相似矩阵的生成方式构建样本的相似矩阵SS;
S42)根据相似矩阵SS构建度矩阵D,计算出拉普拉斯矩阵L;
S43)构建标准化后的拉普拉斯矩阵
Figure BDA0003723371670000091
S44)计算
Figure BDA0003723371670000092
最小的k1个特征值所各自对应的特征向量fa,a=1,2,3,…,k1
S45)特征向量fa,a=1,2,3,…,k1组成的矩阵按行标准化,最终组成L(fa)×k1维的特征矩阵F;
S46)对特征矩阵F中的每一行作为一个k1维的样本,共L(fa)个样本,用输入的聚类方法进行聚类,聚类维数为k2
S47)得到簇划分C(c1,c2,...ck2);
S48)计算每个簇的样本量、最终的类中心值及类中心间的距离,并以此测算各安全级别对业务执行状态以及设备运行状态具体影响因素的关注程度以及差异;
S5)进行戒治效能分析;
S51)输入戒毒人员画像分析、心理评测分析、诊断评估分析效能描述3方面的指标数据,建立XGBoost模型;
S52)用一部分历史数据和专家打分得出的效能值作为训练集训练XGBoost的效能预测模型,完成模型的训练与优化;
S53)将未打分的历史数据输入模型得出各自的效能得分,这样得到每个戒毒人员戒毒前后的效能对比,并用相对效能和绝对效能得分来得出戒毒人员的戒治效能综合指标评判体系;
S6)对S1)、S2)、S3)、S4)、S5)步骤的输出进行升序排序得到综合评估。
本发明的有益效果是:本发明使用实时频次计数方法简化了当前大多数拼音纠错算法使用的噪声通道模型,有效提高纠错算法效率;而诸如搜索优化(Martins和Silva,2004;Gao等,2010)、机器翻译(Belinkov和Bisk,2017)、词性标记(Van Rooy和Schafer,2002;Sak-aguchi等,2012)等纠错算法,需要全面掌握单词相似性、语言建模和推理,不但复杂度高,而且规模庞大;本发明相对这些算法的规模和复杂度而言,是一个非常轻量级的方法。另外,本发明采用字符字母直接替换方法取代传统的编辑距离计算方法,避免使用其他拼音纠错算法频繁地计算编辑距离。对于词典词库的建立和管理都是针对使用者个体的本地化而言,个性化高、针对性强、规模小。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种戒毒场所安全事件风险评估方法,其特征在于,包括步骤:
S1)进行戒毒人员风险评估;
S2)进行戒毒场所安全态势评估,按行业字段对样本集S进行划分后输入基于LightGBM算法的基分类器进行训练,再输入基于LinearBlending算法的次级学习器进行训练,形成戒毒人员风险识别模型Mf
S3)进行智能分析研判评估;
S4)进行所情安全态势评估,输入样本集D=(x1,x2,...,xn),输入相似矩阵的生成方式,输入降维后的维度k1,输入聚类方法,输入聚类后的维度k2
S41)根据输入的相似矩阵的生成方式构建样本的相似矩阵SS;
S42)根据相似矩阵SS构建度矩阵D,计算出拉普拉斯矩阵L;
S43)构建标准化后的拉普拉斯矩阵
Figure FDA0003723371660000011
S44)计算
Figure FDA0003723371660000012
最小的k1个特征值所各自对应的特征向量fa,a=1,2,3,…,k1
S45)特征向量fa,a=1,2,3,…,k1组成的矩阵按行标准化,最终组成L(fa)×k1维的特征矩阵F;
S46)对特征矩阵F中的每一行作为一个k1维的样本,共L(fa)个样本,用输入的聚类方法进行聚类,聚类维数为k2
S47)得到簇划分C(c1,c2,...ck2);
S48)计算每个簇的样本量、最终的类中心值及类中心间的距离,并以此测算各安全级别对业务执行状态以及设备运行状态具体影响因素的关注程度以及差异;
S5)进行戒治效能分析;
S51)输入戒毒人员画像分析、心理评测分析、诊断评估分析效能描述3方面的指标数据,建立XGBoost模型;
S52)用一部分历史数据和专家打分得出的效能值作为训练集训练XGBoost的效能预测模型,完成模型的训练与优化;
S53)将未打分的历史数据输入模型得出各自的效能得分,这样得到每个戒毒人员戒毒前后的效能对比,并用相对效能和绝对效能得分来得出戒毒人员的戒治效能综合指标评判体系;
S6)对S1)、S2)、S3)、S4)、S5)步骤的输出进行排序得到综合评估。
2.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,步骤S1中,所述的进行戒毒人员风险评估包括步骤:
S11)输入样本集S,采用k均值聚类算法将S划分为少数类数据集Ss和多数类数据集Sm,其中xi∈Ss,i=1,2,3,…,L(Ss).;
S12)给定阈值Tk,计算xi(i=1,2,3,…,L(Ss))与多数类数据集Sm的欧氏距离di,若
Figure FDA0003723371660000021
则xi归为安全类Gs,若
Figure FDA0003723371660000022
则xi归为边界类Ge,若di=Tk则xi归为噪声类Gn
S13)用少数类数据集Ss和多数类数据集Sm元素个数比例计算正负类样本不平衡比例后确定采样倍率,从少数类数据集Ss的元素xi(i=1,2,3,…,L(Ss))的k近邻中随机抽取若干个样本xk(1≤k≤L(Ss),k≠i),记xik=xi+random(0,1)*(xi-xk),1≤i,k≤L(Ss),i≠k为构造的少数类新样本,将xik添加到少数类数据集Ss,重复步骤S13),直到少数类数据集Ss和多数类数据集Sm元素个数比例接近1;
S14)从S中随机抽样b1条样本,输入弱分类器A1,作为第一个基学习器B1
S15)从S中有放回随机抽样b2条样本,输入弱分类器A2,作为第二个基学习器B2
S16)以S14)、S15)的方式重复n次,构建n个基学习器B1至Bn
S17)输入测试集T到n个基学习器进行测试,通过voting决定测试集T样本的分类结果,其中测试集T第j个样本Pj通过n个基学习器voting后,预测为多数类的票数有m票,则预测为少数类的有n-m票,若n-m≤m,则样本Pj被判定为多数类样本;反之,被判定为少数类样本。
3.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,步骤S3中,所述的进行智能分析研判评估包括步骤:
S31)采集相应的异常行为、门禁设备异常、测温筛查、设备故障、医疗监测以及生理特征六个维度的数据,构建基于BP神经网络模型,进行网络初始化,给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数e,给定计算精度值ε和最大学习次数M;
S32)随机选取第k个输入样本以及对应的期望输出:
Figure FDA0003723371660000031
S33)计算隐含层各神经元的输入和输出:
Figure FDA0003723371660000032
S34)利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k);
S35)利用输出层各神经元的δo(k)和隐含层各神经元的输出来修正连接权值who(k):
Figure FDA0003723371660000033
S36)利用隐含层各神经元的δh(k)和输入层各神经元的输入修正连接权值:
Figure FDA0003723371660000034
S37)计算全局误差:
Figure FDA0003723371660000035
S38)当误差达到E预设精度或者学习次数大于设定的最大次数M,则结束算法,否则,选取下一个学习样本以及对应的输出期望,返回S33)进入下一轮学习;
S39)利用训练好的神经网络模型进行预测,并计算与输入因子相联系的输入节点连接权值占全部输入节点总权值对网络输出贡献的比例大小,其中输入节点i的权重贡献率计算公式为:
Figure FDA0003723371660000041
式中bi为第i个输入结点的权重贡献率,Wij为输入层结点i与隐层结点j的连接权值,Vj为隐层结点j与输出节点的连接权值。
4.根据权利要求2所述的进行戒毒人员风险评估,其特征在于,所述的L(Ss)为集合Ss的长度。
5.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,所述的L(fa)为向量fa的长度。
6.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,所述的评估相似矩阵的生成方式是基于高斯核距离的全连接方式。
7.根据权利要求1所述的一种戒毒场所安全事件风险评估方法,其特征在于,步骤S4)所述的聚类方法为K-Means。
CN202210762726.3A 2022-06-30 2022-06-30 一种戒毒场所安全事件风险评估方法 Pending CN115204475A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210762726.3A CN115204475A (zh) 2022-06-30 2022-06-30 一种戒毒场所安全事件风险评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210762726.3A CN115204475A (zh) 2022-06-30 2022-06-30 一种戒毒场所安全事件风险评估方法

Publications (1)

Publication Number Publication Date
CN115204475A true CN115204475A (zh) 2022-10-18

Family

ID=83578663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210762726.3A Pending CN115204475A (zh) 2022-06-30 2022-06-30 一种戒毒场所安全事件风险评估方法

Country Status (1)

Country Link
CN (1) CN115204475A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434950A (zh) * 2023-06-05 2023-07-14 山东建筑大学 基于数据分簇和集成学习的孤独症谱系障碍的诊断系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434950A (zh) * 2023-06-05 2023-07-14 山东建筑大学 基于数据分簇和集成学习的孤独症谱系障碍的诊断系统
CN116434950B (zh) * 2023-06-05 2023-08-29 山东建筑大学 基于数据分簇和集成学习的孤独症谱系障碍的诊断系统

Similar Documents

Publication Publication Date Title
Ramezani et al. A novel hybrid intelligent system with missing value imputation for diabetes diagnosis
CN110110809B (zh) 基于机器故障诊断的模糊自动机的构建方法
Cui et al. CONAN: complementary pattern augmentation for rare disease detection
CN108416364A (zh) 分包融合集成学习数据分类方法
CN112756759B (zh) 点焊机器人工作站故障判定方法
EP3968337A1 (en) Target object attribute prediction method based on machine learning and related device
CN108647707A (zh) 概率神经网络创建方法、故障诊断方法及装置、存储介质
CN109164794B (zh) 基于偏f值selm的多变量工业过程故障分类方法
CN115204475A (zh) 一种戒毒场所安全事件风险评估方法
Mounika et al. Machine learning and deep learning models for diagnosis of parkinson’s disease: a performance analysis
Wang et al. The criticality of spare parts evaluating model using artificial neural network approach
Wang et al. Early diagnosis of Parkinson's disease with Speech Pronunciation features based on XGBoost model
Kai et al. Notice of Retraction: A Novel Forecasting Model of Fuzzy Time Series Based on K-means Clustering
Trstenjak et al. Adaptable web prediction framework for disease prediction based on the hybrid Case Based Reasoning model
Mahendra et al. Optimizing convolutional neural network by using genetic algorithm for COVID-19 detection in chest X-ray image
Amaral et al. SummerTime: variable-length time series summarization with application to physical activity analysis
Yu et al. An automatic recognition method of journal impact factor manipulation
CN115293249A (zh) 一种基于动态时序预测的电力系统典型场景概率预测方法
CN112836645A (zh) 面向大规模运动心率序列的代跑检测方法
Assegaf Student academic performance prediction on problem based learning using support vector machine and K-nearest neighbor
Mistry et al. Estimating missing data and determining the confidence of the estimate data
CN116226629B (zh) 一种基于特征贡献的多模型特征选择方法及系统
Nurmalasari et al. Retinal Fundus Images Classification to Diagnose the Severity of Diabetic Retinopathy using CNN
Ding et al. A Novel LSTM-1DCNN-based Deep Network for Fault Diagnosis in Chemical Process
Shinde et al. COVID-19 prediction through CNN and LSTM deep learning models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination