CN110826852A - 一种强制隔离戒毒人员风险评估方法及系统 - Google Patents
一种强制隔离戒毒人员风险评估方法及系统 Download PDFInfo
- Publication number
- CN110826852A CN110826852A CN201910924733.7A CN201910924733A CN110826852A CN 110826852 A CN110826852 A CN 110826852A CN 201910924733 A CN201910924733 A CN 201910924733A CN 110826852 A CN110826852 A CN 110826852A
- Authority
- CN
- China
- Prior art keywords
- label
- drug
- classification model
- sample data
- risk assessment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003814 drug Substances 0.000 title claims abstract description 108
- 229940079593 drug Drugs 0.000 title claims abstract description 108
- 238000002955 isolation Methods 0.000 title claims abstract description 61
- 238000012502 risk assessment Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000013145 classification model Methods 0.000 claims abstract description 76
- 238000011156 evaluation Methods 0.000 claims abstract description 61
- 206010013663 drug dependence Diseases 0.000 claims abstract description 11
- 208000011117 substance-related disease Diseases 0.000 claims abstract description 11
- 206010010144 Completed suicide Diseases 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 7
- 208000019901 Anxiety disease Diseases 0.000 claims description 3
- 206010033864 Paranoia Diseases 0.000 claims description 3
- 208000027099 Paranoid disease Diseases 0.000 claims description 3
- 230000036506 anxiety Effects 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 235000005911 diet Nutrition 0.000 claims description 3
- 230000000378 dietary effect Effects 0.000 claims description 3
- 230000008450 motivation Effects 0.000 claims description 3
- 208000028017 Psychotic disease Diseases 0.000 claims description 2
- 208000027418 Wounds and injury Diseases 0.000 claims description 2
- 208000014674 injury Diseases 0.000 claims description 2
- 230000035945 sensitivity Effects 0.000 claims description 2
- 206010000117 Abnormal behaviour Diseases 0.000 abstract description 3
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000001784 detoxification Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241001622623 Coeliadinae Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及大数据分析技术领域,具体是涉及一种强制隔离戒毒人员风险评估方法及系统。戒毒管理人员对强制隔离戒毒人员的样本数据和用户画像标签筛选出的风险评估数据,形成强制隔离戒毒人员风险评估标签;将训练集中每个强制隔离戒毒人员的用户画像标签和测试集中每个强制隔离戒毒人员的用户画像标签输入到LightGBM分类模型,当分类准确率和召回率满足设定值时,获得标准LightGBM分类模型,通过标准LightGBM分类模型获取待评估的强制隔离戒毒人员的风险评估结果。本发明可以有效预测和防范强制隔离戒毒人员异常行为发生,为后期实施监管提供决策支持。
Description
技术领域
本发明涉及大数据分析技术领域,具体是涉及一种强制隔离戒毒人员风险评估方法及系统。
背景技术
近年来,戒毒业务系统发生了一些新问题和新情况,如逃跑、自杀、施暴、破坏等异常行为,这些给戒毒业务系统安全稳定和人员监管带来了前所未有的挑战,也成为戒毒业务系统信息化建设必须解决的课题。
目前,对强制隔离戒毒人员风险评估主要通过基层民警经验的主观判断,这种方式存在以下问题:一是过于依赖人工评估,不能全面、准确地评估戒毒人员存在的风险,这种传统被动式人工监管模式已无法满足新形势下的监管工作需求,特别对突发事件无法做到第一时间的防范和处理;二是对戒毒业务系统产生的强制隔离戒毒人员基础信息、购物信息、信件记录、教育谈话记录、亲情电话记录、亲情会见记录、入所评估、奖惩得分、民警汇报信息、强制隔离戒毒人员汇报信息等海量信息,没有将其充分发挥作用。亟需一种风险评估方法以便对强制隔离戒毒人员进行风险评估。
发明内容
为解决上述技术问题,本发明的目的之一是提供了一种强制隔离戒毒人员风险评估方法,能够对强制隔离戒毒人员进行风险评估,可以有效预测和防范强制隔离戒毒人员异常行为发生,可为后期实施监管提供决策支持。
为实现上述目的,本发明采用了以下技术方案:
一种强制隔离戒毒人员风险评估方法,包括如下步骤:
S1,从戒毒业务系统获取强制隔离戒毒人员的原始数据,并进行数据清洗,去除有数值缺失的原始数据,得到样本数据;
S2,由样本数据建立强制隔离戒毒人员用户画像标签;
S3,根据戒毒管理人员对强制隔离戒毒人员的样本数据和用户画像标签筛选出的风险评估数据,形成强制隔离戒毒人员风险评估标签;
S4,将样本数据按照获取的时间先后顺序排列,将排列在前面A%的样本数据作为训练集,剩余的样本数据作为测试集;
S5,将训练集中每个强制隔离戒毒人员的用户画像标签输入到LightGBM分类模型,将每个强制隔离戒毒人员风险评估标签作为LightGBM分类模型的输出即模型标签,训练LightGBM分类模型的模型参数,直至LightGBM分类模型输出的模型标签与测试集的风险评估标签满足设定条件,此时的LightGBM分类模型为训练后LightGBM分类模型;
S6,将测试集中每个强制隔离戒毒人员的用户画像标签输入到步骤S5中的训练后LightGBM分类模型,输出测试集的风险评估结果;
S7,根据测试集中的风险评估标签与步骤S5中的测试集的风险评估结果,计算训练后LightGBM分类模型的分类准确率和召回率;
S8,若分类准确率大于等于第一设定值且召回率大于等于第二设定值,则步骤S6中的训练后LightGBM分类模型为标准LightGBM分类模型,否则进行步骤S9;
S9,重新从戒毒业务系统获取样本数据,重复步骤S5-S7,直至分类准确率大于等于第一设定值且召回率大于等于第二设定值,获取标准LightGBM分类模型,其中第一设定值和第二设定值相互独立;
S10,将戒毒业务系统中待评估的强制隔离戒毒人员的用户画像标签输入到标准LightGBM分类模型,获取待评估的强制隔离戒毒人员的风险评估结果。
进一步,所述用户画像标签至少包括自然属性标签、吸毒信息标签、在戒毒所的信息标签、心理情况标签;风险评估标签包括正常标签、脱逃标签、自杀标签、施暴标签、破环标签。
进一步优选的,A的取值为80。
进一步优选的,所述分类准确率AC和召回率RE的计算公式如下:
AC=TAC/(TAC+FAC)
RE=TAC/(TAC+FNO)
其中,AC表示分类准确率,RE表示召回率,TAC为测试集中正类风险评估标签判定为正类风险评估标签的数量,FAC为测试集中负类风险评估标签判定为正类风险评估标签的数量,FNO为测试集中正类风险评估标签判定为负类风险评估标签的数量。
进一步,所述自然属性标签至少包括年龄标签、性别标签、籍贯标签、居住地标签、婚姻状况标签、子女状况标签、原生家庭状况标签、文化程度标签、入戒毒所前的职业标签、是否有自杀自伤自残史的标签;
吸毒信息标签至少包括吸毒时长标签、吸毒动机标签、吸毒次数标签、首次吸毒年龄标签、吸食毒品种类标签、吸食毒品方式标签、毒资来源标签、入戒毒所年龄的标签、入戒毒所时间的标签;
在戒毒所的信息标签至少包括亲情信件标签、亲情电话标签、亲情会见标签、教育谈话标签、奖惩情况标签、民警报告标签、强制隔离戒毒人员汇报标签、购物消费标签;
心理情况标签至少包括躯体化标签、强迫症状标签、人际关系敏感标签、抑郁标签、焦虑标签、敌对标签、恐怖标签、偏执标签、精神病性标签、饮食睡眠标签。
进一步优选的,第一设定值为98%;第二设定值为95%。
本发明的目的之二是提供了一种强制隔离戒毒人员风险评估系统,该风险评估系统包括样本数据获取单元、用户画像标签构建单元、风险评估标签形成单元、分类模型训练单元、风险评估单元,其中:
样本数据获取单元对从戒毒业务系统中获取强制隔离戒毒人员的原始数据进行数据清洗,得到样本数据,样本数据获取单元将样本数据传送给用户画像标签构建单元;
用户画像标签构建单元根据样本数据建立强制隔离戒毒人员用户画像标签,用户画像标签构建单元将用户画像标签传送给风险评估标签形成单元;
风险评估标签形成单元根据样本数据和用户画像标签形成风险评估标签,风险评估标签形成单元将风险评估标签传送给分类模型训练单元;
分类模型训练单元根据用户画像标签和风险评估标签,训练LightGBM分类模型;
风险评估单元从戒毒业务系统中获取待评估的强制隔离戒毒人员的数据,并使用训练后的LightGBM分类模型对该数据进行风险评估。
进一步,分类模型训练单元包括参数训练模块、计算模块、确定模块、调整模块,其中:
参数训练模块:按照获取样本数据的时间先后顺序选择风险评估标签形成单元传送过来的样本数据的前80%作为训练集,将训练集中的每个强制隔离戒毒人员用户画像标签作为LightGBM分类模型的输入,训练LightGBM分类模型参数;
计算模块:按照获取样本数据的时间先后顺序选择样本数据的后20%作为测试集,使用训练后的LightGBM分类模型对测试集中的样本数据进行风险评估,得到风险评估结果;
确定模块:根据测试集中每个强制隔离戒毒人员的风险评估标签和计算模块输出的风险评估结果,计算LightGBM分类模型的分类准确率和召回率是否均大于等于各自的设定值;
调整模块:重新从戒毒业务系统获取样本数据,直至训练得到的LightGBM分类模型的分类准确率和召回率均大于等于各自的设定值,将LightGBM分类模型参数传送给风险评估单元。
本发明的有益效果如下:
(1)采用用户画像技术,将多种强制隔离戒毒人员信息进行整合,构建强制隔离戒毒人员用户画像标签,为强制隔离戒毒人员风险评估奠定基础;采用大数据技术,通过LightGBM分类模型这种机器学习算法获取强制隔离戒毒人员的风险评估结果,提高强制隔离戒毒人员风险评估的准确率和突发事件的处置水平,为后期实施监管措施提供决策支持。
(2)采用测试集计算分类准确率和召回率,以此判断LightGBM分类模型的模型参数是否能够满足计算需要,提高LightGBM分类模型对强制隔离戒毒人员风险评估的准确率。
(3)采用基于历史数据的预测方法,将按获取时间顺序排在前80%样本数据即历史数据作为训练集训练模型参数,并将按获取时间顺序排在后20%样本数据即近期数据作为测试集测试模型训练结果,确保了本风险评估方法的科学性、合理性和准确性。
(4)采用测试集计算分类准确率和召回率,以此判断LightGBM分类模型的模型参数是否能够满足计算需要,提高LightGBM分类模型对强制隔离戒毒人员风险评估的准确率。
附图说明
图1为本发明的评估方法的流程图;
图2为本发明的评估系统的结构示意图。
具体实施方式
以下结合实施例和说明书附图,对本发明中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,一种强制隔离戒毒人员风险评估方法,包括如下步骤:
S1,从戒毒业务系统中抽取强制隔离戒毒人员基础信息、购物信息、信件记录、教育谈话记录、亲情电话记录、亲情会见记录、入所评估、奖惩得分、民警汇报信息、强制隔离戒毒人员汇报信息作为原始数据,对原始数据进行缺失值清洗、格式内容清洗、逻辑错误清洗等数据清洗,得到样本数据。所述样本数据包括强制隔离戒毒人员基础信息、购物信息、信件记录、教育谈话记录、亲情电话记录、亲情会见记录、入所评估、奖惩得分、民警汇报信息、强制隔离戒毒人员汇报信息;
S2,分析样本数据,建立强制隔离戒毒人员用户画像标签,包括自然属性标签、吸毒信息标签、在戒毒所的信息标签、心理情况标签;其中自然属性标签包括年龄标签、性别标签、籍贯标签、居住地标签、婚姻状况标签、子女状况标签、原生家庭状况标签、文化程度标签、入戒毒所前的职业标签、是否有自杀自伤自残史的标签;吸毒信息标签至少包括吸毒时长标签、吸毒动机标签、吸毒次数标签、首次吸毒年龄标签、吸食毒品种类标签、吸食毒品方式标签、毒资来源标签、入戒毒所年龄的标签、入戒毒所时间的标签;在戒毒所的信息标签至少包括亲情信件标签、亲情电话标签、亲情会见标签、教育谈话标签、奖惩情况标签、民警报告标签、强制隔离戒毒人员汇报标签、购物消费标签;心理情况标签至少包括躯体化标签、强迫症状标签、人际关系敏感标签、抑郁标签、焦虑标签、敌对标签、恐怖标签、偏执标签、精神病性标签、饮食睡眠标签,具体内容如表1所示。
S3,形成风险评估标签:在戒毒人员管理中,每个强制隔离戒毒人员每个月需要戒毒管理人员进行多次风险评估,即评估强制隔离戒毒人员是正常和异常,其中异常标签包括脱逃标签、自杀标签、施暴标签、破环标签。
S4,将样本数据按照获取其的时间先后顺序排列,将排列在前80%的样本数据作为训练集,后20%的样本数据作为测试集。
S5,将训练集中的每个强制隔离戒毒人员用户画像标签作为LightGBM分类模型的输入,将每个强制隔离戒毒人员风险评估标签作为LightGBM分类模型的输出即模型标签,训练LightGBM分类模型参数,直至模型通过测试即测试集输出的风险评估结果满足设定条件为止;
S6,将测试集中每个强制隔离戒毒人员的用户画像标签输入到步骤S5中的训练后LightGBM分类模型,输出测试集的风险评估结果;
S7,根据测试集中的风险评估标签与测试集的风险评估结果,计算训练后LightGBM分类模型的分类准确率AC和召回率RE。
AC=TAC/(TAC+FAC)
RE=TAC/(TAC+FNO)
其中,AC表示分类准确率,RE表示召回率,TAC为测试集中正类风险评估标签判定为正类风险评估标签的数量,FAC为测试集中负类风险评估标签判定为正类风险评估标签的数量,FNO为测试集中正类风险评估标签判定为负类风险评估标签的数量。
(1)正常标签:TAC为测试集中所有被判定为正常而实际为正常的数量,FAC为测试集中实际为脱逃、自杀、施暴、破环等非正常被判定为正常的数量,FNO为测试集中实际为正常被判定为脱逃、自杀、施暴、破环等非正常的数量;
(2)脱逃标签:TAC为测试集中所有被判定为有脱逃风险为真实有脱逃风险的数量,FAC为测试集中实际没有脱逃风险被判定为有脱逃风险的数量,FNO为测试集中实际有脱逃风险被判定为没有脱逃风险的数量;
(3)自杀标签:TAC为测试集中所有被判定为有自杀风险为真实有自杀风险的数量,FAC为测试集中实际没有自杀风险被判定为有自杀风险的数量,FNO为测试集中实际有自杀风险被判定为没有自杀风险的数量;
(4)施暴标签:TAC为测试集中所有被判定为有施暴风险为真实有施暴风险的数量,FAC为测试集中实际没有施暴风险被判定为有施暴风险的数量,FNO为测试集中实际有施暴风险被判定为没有施暴风险的数量;
(5)破坏标签:TAC为测试集中所有被判定为有破坏风险为真实有破坏风险的数量,FAC为测试集中实际没有破坏风险被判定为有破坏风险的数量,FNO为测试集中实际有破坏风险被判定为没有破坏风险的数量。
S8,若分类准确率大于等于第一设定值且召回率大于等于第二设定值,本实施例中,第一设定值为98%,第二设定值为95%,则步骤S2中的训练后LightGBM分类模型为标准LightGBM分类模型,否则进行步骤S9;
S9,重新从戒毒业务系统获取样本数据,重复步骤S5-S7,直至分类准确率大于等于第一设定值且召回率大于等于第二设定值,获取标准LightGBM分类模型;
S10,将戒毒业务系统中待评估的强制隔离戒毒人员的用户画像标签输入到标准LightGBM分类模型,获取待评估的强制隔离戒毒人员的风险评估结果。
实施例2
如图2所示,一种强制隔离戒毒人员风险评估系统,该风险评估系统包括样本数据获取单元、用户画像标签构建单元、风险评估标签形成单元、分类模型训练单元、风险评估单元,其中:
样本数据获取单元对从戒毒业务系统中获取强制隔离戒毒人员的原始数据进行数据清洗,得到样本数据,样本数据获取单元将样本数据传送给用户画像标签构建单元;
用户画像标签构建单元根据样本数据建立强制隔离戒毒人员用户画像标签,用户画像标签构建单元将用户画像标签传送给风险评估标签形成单元;
风险评估标签形成单元根据样本数据和用户画像标签形成风险评估标签,风险评估标签形成单元将风险评估标签传送给分类模型训练单元;
分类模型训练单元根据用户画像标签和风险评估标签,训练LightGBM分类模型;
风险评估单元从戒毒业务系统中获取待评估的强制隔离戒毒人员的数据,并使用训练后的LightGBM分类模型对该数据进行风险评估。
分类模型训练单元包括参数训练模块、计算模块、确定模块、调整模块,其中:
参数训练模块:按照获取样本数据的时间先后顺序选择样本数据的前80%作为训练集,将训练集中的每个强制隔离戒毒人员用户画像标签作为LightGBM分类模型的输入,训练LightGBM分类模型参数;
计算模块:按照获取样本数据的时间先后顺序选择样本数据的后20%作为测试集,使用训练后的LightGBM分类模型对测试集中的样本数据进行风险评估,得到风险评估结果;
确定模块:根据测试集中每个强制隔离戒毒人员的风险评估标签和计算模块输出的风险评估结果,计算LightGBM分类模型的分类准确率和召回率是否均大于等于各自的设定值;
调整模块:重新从戒毒业务系统获取样本数据,直至训练得到的LightGBM分类模型的分类准确率和召回率均大于等于各自的设定值。
表1
Claims (8)
1.一种强制隔离戒毒人员风险评估方法,其特征在于,包括如下步骤:
S1,从戒毒业务系统获取强制隔离戒毒人员的原始数据,并进行数据清洗,去除有数值缺失的原始数据,得到样本数据;
S2,由样本数据建立强制隔离戒毒人员用户画像标签;
S3,根据戒毒管理人员对强制隔离戒毒人员的样本数据和用户画像标签筛选出的风险评估数据,形成强制隔离戒毒人员风险评估标签;
S4,将样本数据按照获取的时间先后顺序排列,将排列在前面A%的样本数据作为训练集,剩余的样本数据作为测试集;
S5,将训练集中每个强制隔离戒毒人员的用户画像标签输入到LightGBM分类模型,将每个强制隔离戒毒人员风险评估标签作为LightGBM分类模型的输出即模型标签,训练LightGBM分类模型的模型参数,直至LightGBM分类模型输出的模型标签与测试集的风险评估标签满足设定条件,此时的LightGBM分类模型为训练后LightGBM分类模型;
S6,将测试集中每个强制隔离戒毒人员的用户画像标签输入到步骤S5中的训练后LightGBM分类模型,输出测试集的风险评估结果;
S7,根据测试集中的风险评估标签与步骤S5中的测试集的风险评估结果,计算训练后LightGBM分类模型的分类准确率和召回率;
S8,若分类准确率大于等于第一设定值且召回率大于等于第二设定值,则步骤S6中的训练后LightGBM分类模型为标准LightGBM分类模型,否则进行步骤S9;
S9,重新从戒毒业务系统获取样本数据,重复步骤S5-S7,直至分类准确率大于等于第一设定值且召回率大于等于第二设定值,获取标准LightGBM分类模型,其中第一设定值和第二设定值相互独立;
S10,将戒毒业务系统中待评估的强制隔离戒毒人员的用户画像标签输入到标准LightGBM分类模型,获取待评估的强制隔离戒毒人员的风险评估结果。
2.如权利要求1所述的强制隔离戒毒人员风险评估方法,其特征在于:所述用户画像标签至少包括自然属性标签、吸毒信息标签、在戒毒所的信息标签、心理情况标签;风险评估标签包括正常标签、脱逃标签、自杀标签、施暴标签、破环标签。
3.如权利要求1所述的强制隔离戒毒人员风险评估方法,其特征在于,A的取值为80。
4.如权利要求2所述的强制隔离戒毒人员风险评估方法,其特征在于,所述分类准确率AC和召回率RE的计算公式如下:
AC=TAC/(TAC+FAC)
RE=TAC/(TAC+FNO)
其中,AC表示分类准确率,RE表示召回率,TAC为测试集中正类风险评估标签判定为正类风险评估标签的数量,FAC为测试集中负类风险评估标签判定为正类风险评估标签的数量,FNO为测试集中正类风险评估标签判定为负类风险评估标签的数量。
5.如权利要求2所述的强制隔离戒毒人员风险评估方法,其特征在于:所述自然属性标签至少包括年龄标签、性别标签、籍贯标签、居住地标签、婚姻状况标签、子女状况标签、原生家庭状况标签、文化程度标签、入戒毒所前的职业标签、是否有自杀自伤自残史的标签;
吸毒信息标签至少包括吸毒时长标签、吸毒动机标签、吸毒次数标签、首次吸毒年龄标签、吸食毒品种类标签、吸食毒品方式标签、毒资来源标签、入戒毒所年龄的标签、入戒毒所时间的标签;
在戒毒所的信息标签至少包括亲情信件标签、亲情电话标签、亲情会见标签、教育谈话标签、奖惩情况标签、民警报告标签、强制隔离戒毒人员汇报标签、购物消费标签;
心理情况标签至少包括躯体化标签、强迫症状标签、人际关系敏感标签、抑郁标签、焦虑标签、敌对标签、恐怖标签、偏执标签、精神病性标签、饮食睡眠标签。
6.如权利要求1所述的强制隔离戒毒人员风险评估方法,其特征在于:第一设定值为98%;第二设定值为95%。
7.基于权利要求2或5所述的风险评估方法的强制隔离戒毒人员风险评估系统,其特征在于,该风险评估系统包括样本数据获取单元、用户画像标签构建单元、风险评估标签形成单元、分类模型训练单元、风险评估单元,其中:
样本数据获取单元对从戒毒业务系统中获取强制隔离戒毒人员的原始数据进行数据清洗,去除数值有缺失的原始数据,得到样本数据,样本数据获取单元将样本数据传送给用户画像标签构建单元;
用户画像标签构建单元根据样本数据建立强制隔离戒毒人员用户画像标签,用户画像标签构建单元将用户画像标签传送给风险评估标签形成单元;
风险评估标签形成单元根据强制隔离戒毒人员的样本数据和用户画像标签筛选出的风险评估数据形成风险评估标签,风险评估标签形成单元将风险评估标签传送给分类模型训练单元;
分类模型训练单元根据用户画像标签和风险评估标签,训练LightGBM分类模型;
风险评估单元从戒毒业务系统中获取待评估的强制隔离戒毒人员的数据,并使用训练后的LightGBM分类模型对该数据进行风险评估。
8.如权利要求7所述的风险评估系统,其特征在于,分类模型训练单元包括参数训练模块、计算模块、确定模块、调整模块,其中:
参数训练模块:按照获取样本数据的时间先后顺序选择风险评估标签形成单元传送过来的样本数据的前80%作为训练集,将训练集中的每个强制隔离戒毒人员用户画像标签作为LightGBM分类模型的输入,训练LightGBM分类模型参数;
计算模块:按照获取样本数据的时间先后顺序选择样本数据的后20%作为测试集,使用训练后的LightGBM分类模型对测试集中的样本数据进行风险评估,得到风险评估结果;
确定模块:根据测试集中每个强制隔离戒毒人员的风险评估标签和计算模块输出的风险评估结果,计算LightGBM分类模型的分类准确率和召回率是否均大于等于各自的设定值;
调整模块:重新从戒毒业务系统获取样本数据,直至训练得到的LightGBM分类模型的分类准确率和召回率均大于等于各自的设定值,将LightGBM分类模型参数传送给风险评估单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910924733.7A CN110826852B (zh) | 2019-09-27 | 一种强制隔离戒毒人员风险评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910924733.7A CN110826852B (zh) | 2019-09-27 | 一种强制隔离戒毒人员风险评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110826852A true CN110826852A (zh) | 2020-02-21 |
CN110826852B CN110826852B (zh) | 2024-05-31 |
Family
ID=
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461949A (zh) * | 2020-04-17 | 2020-07-28 | 南京慧智灵杰信息技术有限公司 | 基于大数据的社区矫正方案智能生成系统 |
CN112598184A (zh) * | 2020-12-27 | 2021-04-02 | 上海达梦数据库有限公司 | 一种戒毒人员复吸风险预测的方法和装置 |
CN113658680A (zh) * | 2021-07-29 | 2021-11-16 | 广西友迪资讯科技有限公司 | 基于随机森林的戒毒人员戒治效果的评估方法 |
CN113869356A (zh) * | 2021-08-17 | 2021-12-31 | 杭州华亭科技有限公司 | 一种基于贝叶斯分类的人员脱逃倾向性判断方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092311A (ja) * | 2004-09-24 | 2006-04-06 | Takenaka Komuten Co Ltd | 犯罪リスク評価装置、犯罪リスク評価方法及び犯罪リスク評価プログラム |
US20110119211A1 (en) * | 2009-11-17 | 2011-05-19 | William Michael Lay | System and method for assessing risk |
CN106446488A (zh) * | 2015-08-07 | 2017-02-22 | 纬创资通股份有限公司 | 风险评估系统及数据处理方法 |
CN109543986A (zh) * | 2018-11-16 | 2019-03-29 | 湖南数定智能科技有限公司 | 基于用户画像的监狱罪犯三预风险评估方法及系统 |
WO2019078101A1 (ja) * | 2017-10-18 | 2019-04-25 | 日本電気株式会社 | 情報処理装置、リスク予測方法、およびプログラム |
CN109949154A (zh) * | 2018-12-17 | 2019-06-28 | 深圳平安综合金融服务有限公司 | 客户信息分类方法、装置、计算机设备和存储介质 |
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092311A (ja) * | 2004-09-24 | 2006-04-06 | Takenaka Komuten Co Ltd | 犯罪リスク評価装置、犯罪リスク評価方法及び犯罪リスク評価プログラム |
US20110119211A1 (en) * | 2009-11-17 | 2011-05-19 | William Michael Lay | System and method for assessing risk |
CN106446488A (zh) * | 2015-08-07 | 2017-02-22 | 纬创资通股份有限公司 | 风险评估系统及数据处理方法 |
WO2019078101A1 (ja) * | 2017-10-18 | 2019-04-25 | 日本電気株式会社 | 情報処理装置、リスク予測方法、およびプログラム |
CN109543986A (zh) * | 2018-11-16 | 2019-03-29 | 湖南数定智能科技有限公司 | 基于用户画像的监狱罪犯三预风险评估方法及系统 |
CN109949154A (zh) * | 2018-12-17 | 2019-06-28 | 深圳平安综合金融服务有限公司 | 客户信息分类方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
王雨晨;过仲阳;王媛媛;: "基于随机森林的犯罪风险预测模型研究", 华东师范大学学报(自然科学版), no. 04, 25 July 2017 (2017-07-25) * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461949A (zh) * | 2020-04-17 | 2020-07-28 | 南京慧智灵杰信息技术有限公司 | 基于大数据的社区矫正方案智能生成系统 |
CN112598184A (zh) * | 2020-12-27 | 2021-04-02 | 上海达梦数据库有限公司 | 一种戒毒人员复吸风险预测的方法和装置 |
CN112598184B (zh) * | 2020-12-27 | 2024-02-02 | 上海达梦数据库有限公司 | 一种戒毒人员复吸风险预测的方法和装置 |
CN113658680A (zh) * | 2021-07-29 | 2021-11-16 | 广西友迪资讯科技有限公司 | 基于随机森林的戒毒人员戒治效果的评估方法 |
CN113658680B (zh) * | 2021-07-29 | 2023-10-27 | 广西友迪资讯科技有限公司 | 基于随机森林的戒毒人员戒治效果的评估方法 |
CN113869356A (zh) * | 2021-08-17 | 2021-12-31 | 杭州华亭科技有限公司 | 一种基于贝叶斯分类的人员脱逃倾向性判断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105184315B (zh) | 一种质检处理方法及系统 | |
CN106886481B (zh) | 一种系统健康度静态分析预测方法及装置 | |
CN107888574A (zh) | 检测数据库风险的方法、服务器及存储介质 | |
CN106790019A (zh) | 基于特征自学习的加密流量识别方法及装置 | |
CN114388103A (zh) | 一种针对青少年心理预警分析的算法 | |
CN111639845A (zh) | 一种考虑完整性和可操作性的应急预案有效性评估方法 | |
CN107945003A (zh) | 信用评估方法及装置 | |
US20200372985A1 (en) | Method and system for managing health care patient record data | |
CN110222513B (zh) | 一种线上活动的异常监测方法、装置及存储介质 | |
CN114519524A (zh) | 基于知识图谱的企业风险预警方法、装置及存储介质 | |
CN113889271A (zh) | 针对学生的心理健康测试方法及装置 | |
CN112948823A (zh) | 一种数据泄露风险评估方法 | |
CN114879613A (zh) | 一种工业控制系统信息安全攻击风险评估方法及系统 | |
CN110111011B (zh) | 一种教学质量监管方法、装置及电子设备 | |
CN111898385A (zh) | 一种地震灾害评估方法及系统 | |
CN110457601A (zh) | 社交账号的识别方法和装置、存储介质及电子装置 | |
CN110826852B (zh) | 一种强制隔离戒毒人员风险评估方法及系统 | |
CN110826852A (zh) | 一种强制隔离戒毒人员风险评估方法及系统 | |
CN116010886B (zh) | 安全监测方法、装置、电子设备和存储介质 | |
CN107193872A (zh) | 问答数据处理方法及装置 | |
CN103853933B (zh) | 面向Android数字取证的用户行为分析方法及系统 | |
CN111813922B (zh) | 一种基于微博文本数据的高温事件检测方法及系统 | |
CN115293275A (zh) | 数据识别方法、装置、电子设备和存储介质 | |
Nelson et al. | Methodology for supporting the determination of human error probabilities from simulator sourced data | |
CN116596320B (zh) | 一种煤矿作业人员的风险评估方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |