CN110826852A

CN110826852A - 一种强制隔离戒毒人员风险评估方法及系统

Info

Publication number: CN110826852A
Application number: CN201910924733.7A
Authority: CN
Inventors: 张时雄; 马韵洁; 孙威蔚; 张金良; 徐小兵; 王勇平
Original assignee: Anhui Sun Create Electronic Co Ltd
Current assignee: Anhui Sun Create Electronic Co Ltd
Priority date: 2019-09-27
Filing date: 2019-09-27
Publication date: 2020-02-21
Anticipated expiration: 2039-09-27

Abstract

本发明涉及大数据分析技术领域，具体是涉及一种强制隔离戒毒人员风险评估方法及系统。戒毒管理人员对强制隔离戒毒人员的样本数据和用户画像标签筛选出的风险评估数据，形成强制隔离戒毒人员风险评估标签；将训练集中每个强制隔离戒毒人员的用户画像标签和测试集中每个强制隔离戒毒人员的用户画像标签输入到LightGBM分类模型，当分类准确率和召回率满足设定值时，获得标准LightGBM分类模型，通过标准LightGBM分类模型获取待评估的强制隔离戒毒人员的风险评估结果。本发明可以有效预测和防范强制隔离戒毒人员异常行为发生，为后期实施监管提供决策支持。

Description

一种强制隔离戒毒人员风险评估方法及系统

技术领域

本发明涉及大数据分析技术领域，具体是涉及一种强制隔离戒毒人员风险评估方法及系统。

背景技术

近年来，戒毒业务系统发生了一些新问题和新情况，如逃跑、自杀、施暴、破坏等异常行为，这些给戒毒业务系统安全稳定和人员监管带来了前所未有的挑战，也成为戒毒业务系统信息化建设必须解决的课题。

目前，对强制隔离戒毒人员风险评估主要通过基层民警经验的主观判断，这种方式存在以下问题：一是过于依赖人工评估，不能全面、准确地评估戒毒人员存在的风险，这种传统被动式人工监管模式已无法满足新形势下的监管工作需求，特别对突发事件无法做到第一时间的防范和处理；二是对戒毒业务系统产生的强制隔离戒毒人员基础信息、购物信息、信件记录、教育谈话记录、亲情电话记录、亲情会见记录、入所评估、奖惩得分、民警汇报信息、强制隔离戒毒人员汇报信息等海量信息，没有将其充分发挥作用。亟需一种风险评估方法以便对强制隔离戒毒人员进行风险评估。

发明内容

为解决上述技术问题，本发明的目的之一是提供了一种强制隔离戒毒人员风险评估方法，能够对强制隔离戒毒人员进行风险评估，可以有效预测和防范强制隔离戒毒人员异常行为发生，可为后期实施监管提供决策支持。

为实现上述目的，本发明采用了以下技术方案：

一种强制隔离戒毒人员风险评估方法，包括如下步骤：

S1，从戒毒业务系统获取强制隔离戒毒人员的原始数据，并进行数据清洗，去除有数值缺失的原始数据，得到样本数据；

S2，由样本数据建立强制隔离戒毒人员用户画像标签；

S3，根据戒毒管理人员对强制隔离戒毒人员的样本数据和用户画像标签筛选出的风险评估数据，形成强制隔离戒毒人员风险评估标签；

S4，将样本数据按照获取的时间先后顺序排列，将排列在前面A％的样本数据作为训练集，剩余的样本数据作为测试集；

S5，将训练集中每个强制隔离戒毒人员的用户画像标签输入到LightGBM分类模型，将每个强制隔离戒毒人员风险评估标签作为LightGBM分类模型的输出即模型标签，训练LightGBM分类模型的模型参数，直至LightGBM分类模型输出的模型标签与测试集的风险评估标签满足设定条件，此时的LightGBM分类模型为训练后LightGBM分类模型；

S6，将测试集中每个强制隔离戒毒人员的用户画像标签输入到步骤S5中的训练后LightGBM分类模型，输出测试集的风险评估结果；

S7，根据测试集中的风险评估标签与步骤S5中的测试集的风险评估结果，计算训练后LightGBM分类模型的分类准确率和召回率；

S8，若分类准确率大于等于第一设定值且召回率大于等于第二设定值，则步骤S6中的训练后LightGBM分类模型为标准LightGBM分类模型，否则进行步骤S9；

S9，重新从戒毒业务系统获取样本数据，重复步骤S5-S7，直至分类准确率大于等于第一设定值且召回率大于等于第二设定值，获取标准LightGBM分类模型，其中第一设定值和第二设定值相互独立；

S10，将戒毒业务系统中待评估的强制隔离戒毒人员的用户画像标签输入到标准LightGBM分类模型，获取待评估的强制隔离戒毒人员的风险评估结果。

进一步，所述用户画像标签至少包括自然属性标签、吸毒信息标签、在戒毒所的信息标签、心理情况标签；风险评估标签包括正常标签、脱逃标签、自杀标签、施暴标签、破环标签。

进一步优选的，A的取值为80。

进一步优选的，所述分类准确率AC和召回率RE的计算公式如下：

AC＝TAC/(TAC+FAC)

RE＝TAC/(TAC+FNO)

其中，AC表示分类准确率，RE表示召回率，TAC为测试集中正类风险评估标签判定为正类风险评估标签的数量，FAC为测试集中负类风险评估标签判定为正类风险评估标签的数量，FNO为测试集中正类风险评估标签判定为负类风险评估标签的数量。

进一步，所述自然属性标签至少包括年龄标签、性别标签、籍贯标签、居住地标签、婚姻状况标签、子女状况标签、原生家庭状况标签、文化程度标签、入戒毒所前的职业标签、是否有自杀自伤自残史的标签；

吸毒信息标签至少包括吸毒时长标签、吸毒动机标签、吸毒次数标签、首次吸毒年龄标签、吸食毒品种类标签、吸食毒品方式标签、毒资来源标签、入戒毒所年龄的标签、入戒毒所时间的标签；

在戒毒所的信息标签至少包括亲情信件标签、亲情电话标签、亲情会见标签、教育谈话标签、奖惩情况标签、民警报告标签、强制隔离戒毒人员汇报标签、购物消费标签；

心理情况标签至少包括躯体化标签、强迫症状标签、人际关系敏感标签、抑郁标签、焦虑标签、敌对标签、恐怖标签、偏执标签、精神病性标签、饮食睡眠标签。

进一步优选的，第一设定值为98％；第二设定值为95％。

本发明的目的之二是提供了一种强制隔离戒毒人员风险评估系统，该风险评估系统包括样本数据获取单元、用户画像标签构建单元、风险评估标签形成单元、分类模型训练单元、风险评估单元，其中：

样本数据获取单元对从戒毒业务系统中获取强制隔离戒毒人员的原始数据进行数据清洗，得到样本数据，样本数据获取单元将样本数据传送给用户画像标签构建单元；

用户画像标签构建单元根据样本数据建立强制隔离戒毒人员用户画像标签，用户画像标签构建单元将用户画像标签传送给风险评估标签形成单元；

风险评估标签形成单元根据样本数据和用户画像标签形成风险评估标签，风险评估标签形成单元将风险评估标签传送给分类模型训练单元；

分类模型训练单元根据用户画像标签和风险评估标签，训练LightGBM分类模型；

风险评估单元从戒毒业务系统中获取待评估的强制隔离戒毒人员的数据，并使用训练后的LightGBM分类模型对该数据进行风险评估。

进一步，分类模型训练单元包括参数训练模块、计算模块、确定模块、调整模块，其中：

参数训练模块：按照获取样本数据的时间先后顺序选择风险评估标签形成单元传送过来的样本数据的前80％作为训练集，将训练集中的每个强制隔离戒毒人员用户画像标签作为LightGBM分类模型的输入，训练LightGBM分类模型参数；

计算模块：按照获取样本数据的时间先后顺序选择样本数据的后20％作为测试集，使用训练后的LightGBM分类模型对测试集中的样本数据进行风险评估，得到风险评估结果；

确定模块：根据测试集中每个强制隔离戒毒人员的风险评估标签和计算模块输出的风险评估结果，计算LightGBM分类模型的分类准确率和召回率是否均大于等于各自的设定值；

调整模块：重新从戒毒业务系统获取样本数据，直至训练得到的LightGBM分类模型的分类准确率和召回率均大于等于各自的设定值，将LightGBM分类模型参数传送给风险评估单元。

本发明的有益效果如下：

(1)采用用户画像技术，将多种强制隔离戒毒人员信息进行整合，构建强制隔离戒毒人员用户画像标签，为强制隔离戒毒人员风险评估奠定基础；采用大数据技术，通过LightGBM分类模型这种机器学习算法获取强制隔离戒毒人员的风险评估结果，提高强制隔离戒毒人员风险评估的准确率和突发事件的处置水平，为后期实施监管措施提供决策支持。

(2)采用测试集计算分类准确率和召回率，以此判断LightGBM分类模型的模型参数是否能够满足计算需要，提高LightGBM分类模型对强制隔离戒毒人员风险评估的准确率。

(3)采用基于历史数据的预测方法，将按获取时间顺序排在前80％样本数据即历史数据作为训练集训练模型参数，并将按获取时间顺序排在后20％样本数据即近期数据作为测试集测试模型训练结果，确保了本风险评估方法的科学性、合理性和准确性。

(4)采用测试集计算分类准确率和召回率，以此判断LightGBM分类模型的模型参数是否能够满足计算需要，提高LightGBM分类模型对强制隔离戒毒人员风险评估的准确率。

附图说明

图1为本发明的评估方法的流程图；

图2为本发明的评估系统的结构示意图。

具体实施方式

以下结合实施例和说明书附图，对本发明中的技术方案进行清楚、完整地描述。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图1所示，一种强制隔离戒毒人员风险评估方法，包括如下步骤：

S1，从戒毒业务系统中抽取强制隔离戒毒人员基础信息、购物信息、信件记录、教育谈话记录、亲情电话记录、亲情会见记录、入所评估、奖惩得分、民警汇报信息、强制隔离戒毒人员汇报信息作为原始数据，对原始数据进行缺失值清洗、格式内容清洗、逻辑错误清洗等数据清洗，得到样本数据。所述样本数据包括强制隔离戒毒人员基础信息、购物信息、信件记录、教育谈话记录、亲情电话记录、亲情会见记录、入所评估、奖惩得分、民警汇报信息、强制隔离戒毒人员汇报信息；

S2，分析样本数据，建立强制隔离戒毒人员用户画像标签，包括自然属性标签、吸毒信息标签、在戒毒所的信息标签、心理情况标签；其中自然属性标签包括年龄标签、性别标签、籍贯标签、居住地标签、婚姻状况标签、子女状况标签、原生家庭状况标签、文化程度标签、入戒毒所前的职业标签、是否有自杀自伤自残史的标签；吸毒信息标签至少包括吸毒时长标签、吸毒动机标签、吸毒次数标签、首次吸毒年龄标签、吸食毒品种类标签、吸食毒品方式标签、毒资来源标签、入戒毒所年龄的标签、入戒毒所时间的标签；在戒毒所的信息标签至少包括亲情信件标签、亲情电话标签、亲情会见标签、教育谈话标签、奖惩情况标签、民警报告标签、强制隔离戒毒人员汇报标签、购物消费标签；心理情况标签至少包括躯体化标签、强迫症状标签、人际关系敏感标签、抑郁标签、焦虑标签、敌对标签、恐怖标签、偏执标签、精神病性标签、饮食睡眠标签，具体内容如表1所示。

S3，形成风险评估标签：在戒毒人员管理中，每个强制隔离戒毒人员每个月需要戒毒管理人员进行多次风险评估，即评估强制隔离戒毒人员是正常和异常，其中异常标签包括脱逃标签、自杀标签、施暴标签、破环标签。

S4，将样本数据按照获取其的时间先后顺序排列，将排列在前80％的样本数据作为训练集，后20％的样本数据作为测试集。

S5，将训练集中的每个强制隔离戒毒人员用户画像标签作为LightGBM分类模型的输入，将每个强制隔离戒毒人员风险评估标签作为LightGBM分类模型的输出即模型标签，训练LightGBM分类模型参数，直至模型通过测试即测试集输出的风险评估结果满足设定条件为止；

S7，根据测试集中的风险评估标签与测试集的风险评估结果，计算训练后LightGBM分类模型的分类准确率AC和召回率RE。

AC＝TAC/(TAC+FAC)

RE＝TAC/(TAC+FNO)

(1)正常标签：TAC为测试集中所有被判定为正常而实际为正常的数量，FAC为测试集中实际为脱逃、自杀、施暴、破环等非正常被判定为正常的数量，FNO为测试集中实际为正常被判定为脱逃、自杀、施暴、破环等非正常的数量；

(2)脱逃标签：TAC为测试集中所有被判定为有脱逃风险为真实有脱逃风险的数量，FAC为测试集中实际没有脱逃风险被判定为有脱逃风险的数量，FNO为测试集中实际有脱逃风险被判定为没有脱逃风险的数量；

(3)自杀标签：TAC为测试集中所有被判定为有自杀风险为真实有自杀风险的数量，FAC为测试集中实际没有自杀风险被判定为有自杀风险的数量，FNO为测试集中实际有自杀风险被判定为没有自杀风险的数量；

(4)施暴标签：TAC为测试集中所有被判定为有施暴风险为真实有施暴风险的数量，FAC为测试集中实际没有施暴风险被判定为有施暴风险的数量，FNO为测试集中实际有施暴风险被判定为没有施暴风险的数量；

(5)破坏标签：TAC为测试集中所有被判定为有破坏风险为真实有破坏风险的数量，FAC为测试集中实际没有破坏风险被判定为有破坏风险的数量，FNO为测试集中实际有破坏风险被判定为没有破坏风险的数量。

S8，若分类准确率大于等于第一设定值且召回率大于等于第二设定值，本实施例中，第一设定值为98％，第二设定值为95％，则步骤S2中的训练后LightGBM分类模型为标准LightGBM分类模型，否则进行步骤S9；

S9，重新从戒毒业务系统获取样本数据，重复步骤S5-S7，直至分类准确率大于等于第一设定值且召回率大于等于第二设定值，获取标准LightGBM分类模型；

实施例2

如图2所示，一种强制隔离戒毒人员风险评估系统，该风险评估系统包括样本数据获取单元、用户画像标签构建单元、风险评估标签形成单元、分类模型训练单元、风险评估单元，其中：

分类模型训练单元包括参数训练模块、计算模块、确定模块、调整模块，其中：

参数训练模块：按照获取样本数据的时间先后顺序选择样本数据的前80％作为训练集，将训练集中的每个强制隔离戒毒人员用户画像标签作为LightGBM分类模型的输入，训练LightGBM分类模型参数；

调整模块：重新从戒毒业务系统获取样本数据，直至训练得到的LightGBM分类模型的分类准确率和召回率均大于等于各自的设定值。

表1

Claims

1.一种强制隔离戒毒人员风险评估方法，其特征在于，包括如下步骤：

S2，由样本数据建立强制隔离戒毒人员用户画像标签；

2.如权利要求1所述的强制隔离戒毒人员风险评估方法，其特征在于：所述用户画像标签至少包括自然属性标签、吸毒信息标签、在戒毒所的信息标签、心理情况标签；风险评估标签包括正常标签、脱逃标签、自杀标签、施暴标签、破环标签。

3.如权利要求1所述的强制隔离戒毒人员风险评估方法，其特征在于，A的取值为80。

4.如权利要求2所述的强制隔离戒毒人员风险评估方法，其特征在于，所述分类准确率AC和召回率RE的计算公式如下：

AC＝TAC/(TAC+FAC)

RE＝TAC/(TAC+FNO)

5.如权利要求2所述的强制隔离戒毒人员风险评估方法，其特征在于：所述自然属性标签至少包括年龄标签、性别标签、籍贯标签、居住地标签、婚姻状况标签、子女状况标签、原生家庭状况标签、文化程度标签、入戒毒所前的职业标签、是否有自杀自伤自残史的标签；

6.如权利要求1所述的强制隔离戒毒人员风险评估方法，其特征在于：第一设定值为98％；第二设定值为95％。

7.基于权利要求2或5所述的风险评估方法的强制隔离戒毒人员风险评估系统，其特征在于，该风险评估系统包括样本数据获取单元、用户画像标签构建单元、风险评估标签形成单元、分类模型训练单元、风险评估单元，其中：

样本数据获取单元对从戒毒业务系统中获取强制隔离戒毒人员的原始数据进行数据清洗，去除数值有缺失的原始数据，得到样本数据，样本数据获取单元将样本数据传送给用户画像标签构建单元；

风险评估标签形成单元根据强制隔离戒毒人员的样本数据和用户画像标签筛选出的风险评估数据形成风险评估标签，风险评估标签形成单元将风险评估标签传送给分类模型训练单元；

8.如权利要求7所述的风险评估系统，其特征在于，分类模型训练单元包括参数训练模块、计算模块、确定模块、调整模块，其中：