CN111784180B - 一种罪犯改造质量评估系统评估结果分析解释方法 - Google Patents

一种罪犯改造质量评估系统评估结果分析解释方法 Download PDF

Info

Publication number
CN111784180B
CN111784180B CN202010669829.6A CN202010669829A CN111784180B CN 111784180 B CN111784180 B CN 111784180B CN 202010669829 A CN202010669829 A CN 202010669829A CN 111784180 B CN111784180 B CN 111784180B
Authority
CN
China
Prior art keywords
criminal
data set
vector
reconstruction quality
test data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010669829.6A
Other languages
English (en)
Other versions
CN111784180A (zh
Inventor
狄小华
黄文海
杨剑
陆浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Huaiye Information Technology Co ltd
Nanjing Huaiye Intelligent Technology Co ltd
Nanjing University
Original Assignee
Jiangsu Huaiye Information Technology Co ltd
Nanjing Huaiye Intelligent Technology Co ltd
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Huaiye Information Technology Co ltd, Nanjing Huaiye Intelligent Technology Co ltd, Nanjing University filed Critical Jiangsu Huaiye Information Technology Co ltd
Priority to CN202010669829.6A priority Critical patent/CN111784180B/zh
Publication of CN111784180A publication Critical patent/CN111784180A/zh
Application granted granted Critical
Publication of CN111784180B publication Critical patent/CN111784180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种罪犯改造质量评估系统评估结果分析解释方法,属于罪犯改造质量评估技术领域,该方法通过对罪犯改造质量评估系统的基线预测准确率进行计算,通过对测试数据集中的特征值进行随机扰动,得出一系列的预测准确率变化值的绝对值,根据预测准确率变化值的绝对值的大小判断对应扰动特征值的特征对评估结果的影响程度,可以清晰的了解到每一个特征的特征值变化对最终评估结果的影响程度,使得可以根据罪犯的动态指标变化情况对罪犯改造质量评估系统给出的评估结果进行解释,使得罪犯改造质量评估系统的评估结果具有说服力。

Description

一种罪犯改造质量评估系统评估结果分析解释方法
技术领域
本发明涉及罪犯改造质量评估技术领域,具体是一种罪犯改造质量评估系统评估结果分析解释方法。
背景技术
罪犯改造质量评估系统是指对罪犯服刑改造的质量进行评估和预测,罪犯改造质量评估系统是应用于司法领域的,根据所采集的罪犯的在一定周期内的指标,对罪犯的改造质量进行评估并给出评估结果,评估结果是基于二分类模型,罪犯改造质量评估系统只会给出罪犯改造合格或者不合格,因为应用于司法领域,如果只是单纯的给出评估结果,不具备很强的说服力,而对罪犯在一定周期内的指标变化对评估结果造成的影响进行分析,可以给出每一个指标变化对评估结果造成影响的程度,所以,人们急需一种罪犯改造质量评估系统评估结果分析解释方法来解决上述问题。
发明内容
本发明的目的在于提供一种罪犯改造质量评估系统评估结果分析解释方法,以解决现有技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种罪犯改造质量评估系统评估结果分析解释方法,该评估结果分析解释方法利用测试数据集、标签提取模块、罪犯改造质量评估系统、特征扰动模块、数据转换模块、准确率计算模块、变化值计算模块和特征排序模块进行分析解释;
评估结果分析解释方法具体包括以下步骤:
S1、所述标签提取模块接收测试数据集,并对测试数据集中的标签进行提取,得到标签向量y;
S2、所述特征扰动模块对测试数据集T中的特征值进行随机改变,改变的特征值对应特征集F中的特征,得到新的数据集Ti
S3、所述罪犯改造质量评估系统的评估包括以下步骤:
S301、所述罪犯改造质量评估系统对测试数据集T进行评估,得到预测结果矩阵j;
S302、所述罪犯改造质量评估系统接收S2输出的新的数据集Ti,并对新的数据集进行Ti评估,得到扰动预测结果矩阵ji
S4、所述数据转换模块包括数据转换模块一和数据转换模块二:
S401、所述数据转换模块一对S301中的预测结果矩阵j进行转换,得到预测结果向量y';
S402、所述数据转换模块二对S302中的扰动预测结果矩阵ji进行转换,得到扰动预测结果向量yi
S5、所述准确率计算模块包括准确率计算模块一和准确率计算模块二:
S501、所述准确率计算模块一利用S401输出的预测结果向量y′和S1输出的标签向量y计算罪犯改造质量评估系统的预测准确率,得到基线预测准确率A;
S502、所述准确率计算模块二利用S402输出的扰动预测结果向量yi和S1输出的标签向量y计算罪犯改造质量评估系统的预测准确率,得到预测准确率Ai
S6、所述变化值计算模块根据S501输出的基线预测准确率A和S502输出的预测准确率Ai计算预测准确率变化值的绝对值,得到预测准确率变化值的绝对值Pi
S7、所述特征排序模块根据S6输出的预测准确率变化值的绝对值Pi对特征集F中的特征进行排序,得到特征重要性图。
根据上述技术方案,在S1中:
所述测试数据集为T={(x1,y1),(x2,y2),…,(xs,ys)},其中,s=|T|,(xk,yk)表示测试数据集中的任意一个样例,xk表示样例中的特征值集,yk表示样例的标签,yk∈{0,1},所述标签提取模块对测试数据集T中的标签进行提取,得到标签向量y。
根据上述技术方案,在S2中:
所述特征扰动模块对测试数据集T中的第i列特征值进行复制并暂存,随机改变测试数据集T中第i列特征的特征值,得到新的数据集Ti
将测试数据集T的第i列恢复为此前复制并暂存的那一份,并对测试数据集T中的第i+1列特征值进行复制并暂存,随机改变测试数据集T的第i+1列特征的特征值,得到新的数据集Ti+1,重复S2,直至完成测试数据集T中第s列特征值的随机改变。
根据上述技术方案,在S3中:
所述罪犯改造质量评估系统输出的预测结果矩阵j和扰动预测结果矩阵ji中包括罪犯改造质量评估结果为“合格”和“不合格”的概率。
根据上述技术方案,在S4中:
所述预测结果向量y’和扰动预测结果向量yi中的每个分量满足y′(k)∈{0,1},其中,/>表示扰动预测结果向量yi的第j个分量,y′(k)表示预测结果向量y’的第k个分量,“0”代表不合格,“1”代表合格,所述合格用正例表示,所述不合格用反例表示。
根据上述技术方案,在S5中:
根据下列公式对罪犯改造质量评估系统的预测准确率进行计算:
其中,TP表示S1输入的测试数据集T中真正例的个数,TN表示S1输入的测试数据集T中真反例的个数,FP表示S1输入的测试数据集T中假正例的个数,FN表示S1输入的测试数据集T中假反例的个数;
其中,所述真反例表示实际情况为不合格,罪犯改造质量评估系统的评估结果也为不合格的情况,所述真正例表示实际情况为合格,罪犯改造质量评估系统的评估结果也为合格的情况,所述假反例表示实际情况为合格,罪犯改造质量评估系统的评估结果为不合格的情况,所述假正例表示实际情况为不合格,罪犯改造质量评估系统的评估结果为合格的情况。
所述准确率计算模块一根据下列公式对罪犯改造质量评估系统的基线预测准确率A进行计算:
A=accuracy(y',y);
其中,accuracy表示计算准确率的函数,y'表示对测试数据集T进行评估得到的预测结果向量,y表示测试数据集提取之后的标签向量,基线预测准确率A表示在不改变测试数据集T中任意一列特征值的情况下,罪犯改造质量评估系统的预测准确率。
根据上述技术方案,在S6中:
所述变化值计算模块根据下列公式对S502输出的预测准确率Ai与S501输出的基线预测准确率A之间的变化值的绝对值Pi进行计算:
Pi=|accuracy(yi,y)-A|,i∈[1,s];
其中,Pi反应了随机改变测试数据集T中第i列特征的特征值对罪犯改造质量评估系统的评估结果的影响程度。
根据上述技术方案,在S7中:
所述特征排序模块将预测准确率变化值的绝对值组成集合P={P1,P2,P3,...,Ps},其中,P1-Ps表示随机改变测试数据集T中对应列的特征值所得到的预测准确率与基线预测准确率A之间变化值的绝对值,所述特征排序模块根据预测准确率变化值的绝对值集合P={P1,P2,P3,...,Ps}中预测准确率变化值的绝对值的变化大小,对特征集F中的特征进行排序,并根据排序的结果利用代码生成图片,得到特征重要性图。
通过特征重要性图,可以清晰的了解到特征集F中的每个特征对于罪犯改造质量评估系统评估结果的影响程度,可以实现对罪犯改造质量评估系统的解释,使得评估结果更加的具有说服力。
根据上述技术方案,所述罪犯改造质量评估系统所使用的特征集F中对应着动态指标和静态指标,所述动态指标包括源动态指标和对比动态指标;
所述动态指标用Id={D1,D2,...,Dm}表示,其中,m表示罪犯改造质量评估系统中所有动态指标的个数,D1-Dm表示动态指标值;
所述静态指标用Is={S1,S2,...,Sn}表示,其中,n表示改造质量评估体系中所有静态指标的个数,S1-Sn表示静态指标值;
那么有:
If=Id∪Is
其中,If表示全指标集,表示罪犯改造质量评估系统中所有的指标值;
则:所述特征集F={src_D1,cmp_D1,src_D2,cmp_D2,...,src_Dm,cmp_Dm,S1,S2,...,Sn};
其中,“src_”和“cmp_”开头的特征分别表示源动态指标值和对比动态指标值。
根据上述技术方案,所述源动态指标是指罪犯在一个时间点所收集的所有动态指标的指标值;
所述对比动态指标是指该罪犯在另一个时间点所收集的所有动态指标的指标值;
所述静态指标是指该罪犯不可变指标的指标值。
与现有技术相比,本发明的有益效果是:通过测试数据集T中每一列的特征值进行随机的扰动,得出一系列的预测准确率变化值的绝对值,根据预测准确率变化值的绝对值的大小判断对应扰动的特征对评估结果的影响程度,可以清晰的了解到特征集F中每一个特征的变化对最终评估结果的影响程度,使得可以根据罪犯的动态指标变化情况对罪犯改造质量评估系统给出的评估结果进行解释,使得罪犯改造质量评估系统的评估结果更加的具有说服力。
附图说明
图1为本发明一种罪犯改造质量评估系统评估结果解释方法中罪犯改造质量评估系统的评估流程示意图;
图2为本发明一种罪犯改造质量评估系统评估结果解释方法中中罪犯改造质量评估系统的向量降纬模块的中文流程示意图;
图3为本发明一种罪犯改造质量评估系统评估结果解释方法中中罪犯改造质量评估系统的向量降纬模块的英文流程示意图;
图4为本发明一种罪犯改造质量评估系统评估结果分析解释方法的流程示意图;
图5为本发明一种罪犯改造质量评估系统评估结果分析解释方法测试数据集T的示意图;
图6为本发明一种罪犯改造质量评估系统评估结果分析解释方法的特征重要性图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:如图1~3所示,一种基于机器学习的罪犯改造质量评估系统,该系统包括输入模块、编码模块、降纬模块、指标变化表征计算模块、最终特征生成模块、概率计算模块和输出模块;
T1、所述输入模块用于接受样例的输入,对样例进行整合并输出源动态指标值序列、对比动态指标值序列和静态指标值序列;
所述源动态指标值序列和对比动态指标值序列统称为动态指标值序列;
所述源动态指标值序列是指在一个时间点针对某个罪犯所收集的该罪犯的所有动态指标的指标值,例如:入狱一个月时的认罪态度、思想表现、学习情况、生产劳动、遵章守纪等;
所述对比动态指标值序列是指在另一个时间点对某个罪犯所收集的该罪犯的所有动态指标的指标值,例如:入狱七个月时的认罪态度、思想表现、学习情况、生产劳动、遵章守纪等;
所述静态指标值序列是指该罪犯不可变指标的指标值,例如:抚养方式(主要由谁带大的)、受到(难以忘记的)虐待、中止学业、初犯年龄、再犯年龄、犯罪次数等。
T2、所述编码模块包括编码模块一、编码模块二和编码模块三;
T201、所述编码模块一将T1输出的源动态指标值序列编码为向量,得到源动态指标向量;
T202、所述编码模块二将T1输出的对比动态指标值序列编码为向量,得到对比动态指标向量;
T203、所述编码模块三将T1输出的静态指标值序列编码为向量,得到静态指标向量;
因为罪犯改造质量评估系统是基于神经网络模型的,其直接输入只能是向量,所以,需要对T1输出的源动态指标值序列、对比动态指标值序列和静态指标值序列进行编码,得到源动态指标向量、对比动态指标向量和静态指标向量,使得罪犯改造质量评估系统可以对T1输入的样例进行评估,可以对罪犯的改造质量进行预测。
所述编码模块对T1输出的源动态指标值序列、对比动态指标值序列和静态指标值序列进行编码时,T1输出的所述源动态指标值序列、对比动态指标值序列和静态指标值序列分为数值型数据和分类型数据:
所述数值型数据无需编码;
所述分类型数据包括单选型和多选型:
所述单选型使用one-hot encoding进行编码;
所述多选型使用multi-hot encoding进行编码;
T1输出的所述源动态指标值序列通过one-hot encoding和multi-hot encoding中的至少一个进行编码,得到源动态指标向量Vsrc,所述源动态指标向量Vsrc利用以下公式表示:
Vsrc=(xi1,xi2,...xim);
T1输出的所述对比动态指标值序列通过one-hot encoding和multi-hotencoding中的至少一个进行编码,得到对比动态指标向量Vcmp,所述对比动态指标向量Vcmp利用以下公式表示;
Vcmp=(xj1,xj2,...xjm);
其中,m为T1输出的源动态指标值序列和对比动态指标值序列的大小,xim表示某罪犯在源时间点在第m个源动态指标上的取值所对应的编码值,xjm表示某罪犯在对比时间点在第m个对比动态指标上的取值所对应的编码值;
所述静态指标值应用one-hot encoding和multi-hot encoding中的至少一个进行编码,得到静态指标向量Vst
T3、所述降纬模块分别对T201输出的源动态指标向量和T202输出的对比动态指标向量进行降纬,获得源动态指标紧凑向量和对比动态指标紧凑向量;
所述降纬模块包括降纬模块一和降纬模块二;
所述降纬模块一和降纬模块二分别对T201输出的源动态指标向量Vsrc和T202输出的对比动态指标向量Vcmp进行降纬处理得到:
Vsrc′=DimReduce(Vsrc);
Vcmp′=DimReduce(Vcmp);
其中,Vsrc′和Vcmp′分别表示源动态指标向量Vsrc和对比动态指标向量Vcmp降纬之后输出的源动态指标紧凑向量和对比动态指标紧凑向量,DimReduce表示降维算法。
因为T1输出的源动态指标值序列和对比动态指标值序列绝大多数都是分类型数据,这些数据经过T2中的编码模块编码之后转换为罪犯改造质量评估系统能够直接处理的源动态指标向量和对比动态指标向量,源动态指标向量和对比动态指标向量的纬度相比于原始的源动态指标值序列和对比动态指标值序列会扩大,另外,对罪犯的改造质量评估的一个重要手段是对罪犯在两个时间段内的源动态指标值序列和对比动态指标值序列进行比较,源动态指标值序列和对比动态指标值序列分别表示同一个罪犯在一个时间点(源时间点)和另外一个时间点(对比时间点)在相应动态指标上的指标值,但是源动态指标值序列和对比动态指标值序列会进一步加剧T2输出的源动态指标向量和对比动态指标向量的纬度,因此,对源动态指标向量和对比动态指标向量进行绛纬显得尤为重要。
所述降纬模块对源动态指标向量Vsrc和对比动态指标向量Vcmp进行降纬的降纬算法DimReduce如下,T2输出的源动态指标向量Vsrc和对比动态指标向量Vcmp均用输入向量Vd表示:
T301、为了避免产生过拟合的风险,对输入向量Vd加入噪音,得到向量Vdn
T302、将T301输出的向量Vdn输入T3中降纬模块的编码层来抽取向量Vdn中包含的抽象特征,得到T301中输入的输入向量Vd的紧凑向量V′d
T303、将T302输出的紧凑向量V′d输入T3中降纬模块的解码层来对紧凑向量V′d进行解码得到输入向量Vd的近似向量Vd≈,所述近似向量Vd≈为输入向量Vd的低纬表示。
通过使用Mean Squared Root Error作为损失函数来使优化器逐步减少Vd≈和Vd之间的距离,我们便可以得到该神经网络的参数,这些参数会使得V′d成为Vd的低纬表示,通过获取网络结构中的结点“compact_encoding_0”的输出我们就可以得到V′d
所述降纬模块为自动编码器,所述自动编码器是一种监督式学习。
T301中的过拟合是指:系统在训练阶段没能找到训练集中的数据所隐含的规律、知识,而仅仅是对这些数据进行了记忆,使得其使用新的数据进行预测(评估改造质量)时表现欠佳。
T301中的噪音是指:在利用训练数据集对罪犯改造质量评估系统进行训练时,加入干扰数据,使得罪犯改造质量评估系统自动对干扰项进行排除,使得罪犯改造质量评估系统可以寻找到需要评估的数据之间的规律,使得罪犯改造质量评估系统可以对训练数据集之外的数据进行准确的评估。
T4、所述指标变化表征计算模块计算T2输出的源动态指标紧凑向量和对比动态指标紧凑向量,得出余弦相似度标量、欧氏距离标量和方向余弦向量;所述余弦相似度标量和欧氏距离标量用于衡量动态指标的变化情况,用不同标量反应源动态指标和对比动态指标的相似程度,标量只反应大小,增加方向余弦向量表示变化的方向,用于反映罪犯改造变好或者恶化;变化大小和变化方向共同反映了罪犯改造质量情况。
所述指标变化表征计算模块输出的余弦相似度标量为T3输出的源动态指标紧凑向量V′src和对比动态指标紧凑向量V′cmp之间的余弦相似度,用于反映T1输出的源动态指标值序列与对比动态指标值序列之间的变化情况;
所述指标变化表征计算模块输出的欧氏距离标量为T3输出的对比动态指标紧凑向量V′cmp和源动态指标紧凑向量V′src之间的欧氏距离,用于反映T1输出的源动态指标值序列与对比动态指标值序列之间的变化情况;
T4输出的所述余弦相似度标量和欧氏距离标量都是为了反映罪犯改造质量变化的情况,而罪犯改造质量变化的情况可以是变好或者恶化;
所述指标变化表征计算模块输出的方向余弦向量为T3输出的对比动态指标紧凑向量V′cmp和源动态指标紧凑向量V′src之间差向量的方向余弦,用于反映T1输出的源动态指标值序列与对比动态指标值序列之间的变化情况,即用于反映罪犯改造质量向着变好的方向变化或者向着恶化的方向变化。
所述指标变化表征计算模块对其自身输出的余弦相似度标量进行计算时,根据下列公式表示T1输出的源动态指标值序列与对比动态指标值序列之间的余弦相似度标量:
其中,θ表示V′src和V′cmp在潜在空间中的夹角;
所述指标变化表征计算模块为了产生其输出的欧氏距离标量和方向余弦向量而进行的计算包括以下步骤:
T401、根据公式计算源动态指标紧凑向量V′src与对比动态指标紧凑向量V′cmp之间的差向量:
其中,表示源动态指标紧凑向量V′src与对比动态指标紧凑向量V′cmp之间的差向量,它反应了T1输出的源动态指标值序列与对比动态指标值序列之间的变化情况;
T402、在T401基础上计算输出的欧氏距离标量,其计算公式为:
其中,表示欧氏距离标量,也就是/>的模,所述欧氏距离标量表示在低纬潜在空间中T1输出的源动态指标值序列与对比动态指标值序列之间变化的情况,di表示中的每个分量,n表示/>中分量的个数;
T403、在T401输出的差向量和T402输出的欧氏距离标量/>的基础上计算T4输出的方向余弦向量,其计算公式为:
其中,表示方向余弦向量,它表示源动态指标值序列与对比动态指标值序列之间的变化情况。
T5、所述最终特征生成模块用于将T203输出的静态指标向量和T4输出的余弦相似度标量、欧氏距离标量和方向余弦向量合并成一个最终特征向量;T1-T5用于实现对输入样例的特征提取。
所述最终特征生成模块将T203输出的静态指标向量Vst与T4输出的余弦相似度标量欧氏距离标量/>和方向余弦向量/>合并成最终特征向量Vfina
T6、所述概率计算模块将T5输出的最终特征向量进行分布概率计算,最终得出罪犯改造质量等级分布概率,罪犯改造质量等级分布概率为罪犯改造质量为“不合格”或者“合格”分别对应的概率;
所述概率计算模块根据最终特征向量Vfinal计算出相应的改造质量评估等级的分布概率,该模块使用多层感知器来计算改造质量评估等级的分布概率。
T7、所述输出模块用于将T6输出的改造质量等级分布概率依照JSON格式组织起来并作为系统的输出。
对于罪犯改造质量评估系统的评估结果的分析解释方法如下:
如图4~5所示,一种罪犯改造质量评估系统评估结果分析解释方法,该评估结果分析解释方法利用测试数据集、标签提取模块、罪犯改造质量评估系统、特征扰动模块、数据转换模块、准确率计算模块、变化值计算模块和特征排序模块进行分析解释;
评估结果分析解释方法具体包括以下步骤:
S1、所述标签提取模块接收测试数据集,并对测试数据集中的标签进行提取,得到标签向量y;
所述测试数据集为T={(x1,y1),(x2,y2),…,(xs,ys)},其中,s=|T|,(xk,yk)表示测试数据集中的任意一个样例,xk表示样例中的特征值集,xk可以为:为了钱财、为了报复、为了朋友、恶作剧等,yk表示样例的标签,yk∈{0,1},“0”表示不合格,“1”表示合格,所述标签提取模块对测试数据集T中的标签进行提取,得到标签向量y。
S2、所述特征扰动模块对测试数据集T中的特征值进行随机改变,改变的特征值对应特征集F中的特征,得到新的数据集Ti
所述特征扰动模块对测试数据集T中的第i列特征值进行复制并暂存,随机改变测试数据集T中第i列特征的特征值,得到新的数据集Ti
将测试数据集T的第i列恢复为此前复制并暂存的那一份,并对测试数据集T中的第i+1列特征值进行复制并暂存,随机改变测试数据集T的第i+1列特征的特征值,得到新的数据集Ti+1,重复S2,直至完成测试数据集T中第s列特征值的随机改变。
S3、所述罪犯改造质量评估系统的评估包括以下步骤:
S301、所述罪犯改造质量评估系统对测试数据集T进行评估,得到预测结果矩阵j;
S302、所述罪犯改造质量评估系统接收S2输出的新的数据集Ti,并对新的数据集进行Ti评估,得到扰动预测结果矩阵ji
所述罪犯改造质量评估系统输出的预测结果矩阵j和扰动预测结果矩阵ji中包括罪犯改造质量评估结果为“合格”和“不合格”的概率。
S4、所述数据转换模块包括数据转换模块一和数据转换模块二:
S401、所述数据转换模块一对S301中的预测结果矩阵j进行转换,得到预测结果向量y';
S402、所述数据转换模块二对S302中的扰动预测结果矩阵ji进行转换,得到扰动预测结果向量yi
所述预测结果向量y’和扰动预测结果向量yi中的每个分量满足y′(k)∈{0,1},其中,/>表示扰动预测结果向量yi的第j个分量,y′(k)表示预测结果向量y’的第k个分量,“0”代表不合格,“1”代表合格,所述合格用正例表示,所述不合格用反例表示。
S5、所述准确率计算模块包括准确率计算模块一和准确率计算模块二:
S501、所述准确率计算模块一利用S401输出的预测结果向量y′和S1输出的标签向量y计算罪犯改造质量评估系统的预测准确率,得到基线预测准确率A;
S502、所述准确率计算模块二利用S402输出的扰动预测结果向量yi和S1输出的标签向量y计算罪犯改造质量评估系统的预测准确率,得到预测准确率Ai
根据下列公式对罪犯改造质量评估系统的预测准确率进行计算:
其中,TP表示S1输入的测试数据集T中真正例的个数,TN表示S1输入的测试数据集T中真反例的个数,FP表示S1输入的测试数据集T中假正例的个数,FN表示S1输入的测试数据集T中假反例的个数;
其中,所述真反例表示实际情况为不合格,罪犯改造质量评估系统的评估结果也为不合格的情况,所述真正例表示实际情况为合格,罪犯改造质量评估系统的评估结果也为合格的情况,所述假反例表示实际情况为合格,罪犯改造质量评估系统的评估结果为不合格的情况,所述假正例表示实际情况为不合格,罪犯改造质量评估系统的评估结果为合格的情况。
所述准确率计算模块一根据下列公式对罪犯改造质量评估系统的基线预测准确率A进行计算:
A=accuracy(y',y);
其中,accuracy表示计算准确率的函数,y'表示对测试数据集T进行评估得到的预测结果向量,y表示测试数据集提取之后的标签向量,基线预测准确率A表示在不改变测试数据集T中任意一列特征值的情况下,罪犯改造质量评估系统的预测准确率。
上述公式为accuracy函数算法的公式表示,其中,和y′(j)分别表示yi和y′的第j个分量,I表示指示器函数,该函数在其输入参数中的条件成立时返回1,否则返回0,该函数为现有技术,因为在此没有做过多赘述。
例如:标签向量y的五个分量依次分别为:0,1,0,0,1,预测结果向量y'的五个分量依次为:0,1,0,1,1,则通过accuracy函数计算之后的基线预测准确率A=0.8。
S6、所述变化值计算模块根据S501输出的基线预测准确率A和S502输出的预测准确率Ai计算预测准确率变化值的绝对值,得到预测准确率变化值的绝对值Pi
所述变化值计算模块根据下列公式对S502输出的预测准确率Ai与S501输出的基线预测准确率A之间的变化值的绝对值Pi进行计算:
Pi=|accuracy(yi,y)-A|,i∈[1,s];
其中,Pi反应了随机改变测试数据集T中第i列特征的特征值对罪犯改造质量评估系统的评估结果的影响程度。
S7、所述特征排序模块根据S6输出的预测准确率变化值的绝对值Pi对特征集F中的特征进行排序,得到特征重要性图。
所述特征排序模块将预测准确率变化值的绝对值组成集合P={P1,P2,P3,...,Ps},其中,P1-Ps表示随机改变测试数据集T中对应列的特征值所得到的预测准确率与基线预测准确率A之间变化值的绝对值,所述特征排序模块根据预测准确率变化值的绝对值集合P={P1,P2,P3,...,Ps}中预测准确率变化值的绝对值的变化大小,对特征集F中的特征进行排序,并根据排序的结果利用代码生成图片,得到特征重要性图。
通过特征重要性图,可以清晰的了解到特征集F中的每个特征对于罪犯改造质量评估系统评估结果的影响程度,可以实现对罪犯改造质量评估系统的解释,使得评估结果更加的具有说服力。
所述罪犯改造质量评估系统所使用的特征集F中对应着动态指标和静态指标,所述动态指标包括源动态指标和对比动态指标;
所述动态指标用Id={D1,D2,...,Dm}表示,其中,m表示罪犯改造质量评估系统中所有动态指标的个数,D1-Dm表示动态指标值;
所述静态指标用Is={S1,S2,...,Sn}表示,其中,n表示改造质量评估体系中所有静态指标的个数,S1-Sn表示静态指标值;
那么有:
If=Id∪Is
其中,If表示全指标集,表示罪犯改造质量评估系统中所有的指标值;
则:所述特征集F={src_D1,cmp_D1,src_D2,cmp_D2,...,src_Dm,cmp_Dm,S1,S2,...,Sn};
其中,“src_”和“cmp_”开头的特征分别表示源动态指标值和对比动态指标值。
所述源动态指标是指罪犯在一个时间点所收集的所有动态指标的指标值;
所述对比动态指标是指该罪犯在另一个时间点所收集的所有动态指标的指标值;
所述静态指标是指该罪犯不可变指标的指标值。
例如:如图6所示,根据上述解释系统可以看出,犯罪目的为罪犯改造质量评估系统中对评估结果影响最大的特征。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:该评估结果分析解释方法利用测试数据集、标签提取模块、罪犯改造质量评估系统、特征扰动模块、数据转换模块、准确率计算模块、变化值计算模块和特征排序模块进行分析解释;
评估结果分析解释方法具体包括以下步骤:
S1、所述标签提取模块接收测试数据集,并对测试数据集中的标签进行提取,得到标签向量y;
S2、所述特征扰动模块对测试数据集T中的特征值进行随机改变,改变的特征值对应特征集F中的特征,得到新的数据集Ti
S3、所述罪犯改造质量评估系统的评估包括以下步骤:
S301、所述罪犯改造质量评估系统对测试数据集T进行评估,得到预测结果矩阵j;
S302、所述罪犯改造质量评估系统接收S2输出的新的数据集Ti,并对新的数据集进行Ti评估,得到扰动预测结果矩阵ji
S4、所述数据转换模块包括数据转换模块一和数据转换模块二:
S401、所述数据转换模块一对S301中的预测结果矩阵j进行转换,得到预测结果向量y';
S402、所述数据转换模块二对S302中的扰动预测结果矩阵ji进行转换,得到扰动预测结果向量yi
S5、所述准确率计算模块包括准确率计算模块一和准确率计算模块二:
S501、所述准确率计算模块一利用S401输出的预测结果向量y′和S1输出的标签向量y计算罪犯改造质量评估系统的预测准确率,得到基线预测准确率A;
S502、所述准确率计算模块二利用S402输出的扰动预测结果向量yi和S1输出的标签向量y计算罪犯改造质量评估系统的预测准确率,得到预测准确率Ai
S6、所述变化值计算模块根据S501输出的基线预测准确率A和S502输出的预测准确率Ai计算预测准确率变化值的绝对值,得到预测准确率变化值的绝对值Pi
S7、所述特征排序模块根据S6输出的预测准确率变化值的绝对值Pi对特征集F中的特征进行排序,得到特征重要性图。
2.根据权利要求1所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:在S1中:
所述测试数据集为T={(x1,y1),(x2,y2),…,(xs,ys)},其中,s=|T|,(xk,yk)表示测试数据集中的任意一个样例,xk表示样例中的特征值集,yk表示样例的标签,yk∈{0,1},所述标签提取模块对测试数据集T中的标签进行提取,得到标签向量y。
3.根据权利要求2所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:在S2中:
所述特征扰动模块对测试数据集T中的第i列特征值进行复制并暂存,随机改变测试数据集T中第i列特征的特征值,得到新的数据集Ti
将测试数据集T的第i列恢复为此前复制并暂存的那一份,并对测试数据集T中的第i+1列特征值进行复制并暂存,随机改变测试数据集T的第i+1列特征的特征值,得到新的数据集Ti+1,重复S2,直至完成测试数据集T中第s列特征值的随机改变。
4.根据权利要求3所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:在S3中:
所述罪犯改造质量评估系统输出的预测结果矩阵j和扰动预测结果矩阵ji中均包括罪犯改造质量评估结果为“合格”和“不合格”的概率。
5.根据权利要求4所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:在S4中:
所述预测结果向量y’和扰动预测结果向量yi中的每个分量满足y′(k)∈{0,1},其中,/>表示扰动预测结果向量yi的第j个分量,y′(k)表示预测结果向量y’的第k个分量,“0”代表不合格,“1”代表合格,所述合格用正例表示,所述不合格用反例表示。
6.根据权利要求5所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:在S5中:
根据下列公式对罪犯改造质量评估系统的预测准确率进行计算:
其中,TP表示S1输入的测试数据集T中真正例的个数,TN表示S1输入的测试数据集T中真反例的个数,FP表示S1输入的测试数据集T中假正例的个数,FN表示S1输入的测试数据集T中假反例的个数;
其中,所述真反例表示实际情况为不合格,罪犯改造质量评估系统的评估结果也为不合格的情况,所述真正例表示实际情况为合格,罪犯改造质量评估系统的评估结果也为合格的情况,所述假反例表示实际情况为合格,罪犯改造质量评估系统的评估结果为不合格的情况,所述假正例表示实际情况为不合格,罪犯改造质量评估系统的评估结果为合格的情况;
所述准确率计算模块一根据下列公式对罪犯改造质量评估系统的基线预测准确率A进行计算:
A=accuracy(y',y);
其中,accuracy表示计算准确率的函数,y'表示对测试数据集T进行评估得到的预测结果向量,y表示测试数据集提取之后的标签向量,基线预测准确率A表示在不改变测试数据集T中任意一列特征值的情况下,罪犯改造质量评估系统的预测准确率。
7.根据权利要求6所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:在S6中:
所述变化值计算模块根据下列公式对S502输出的预测准确率Ai与S501输出的基线预测准确率A之间的变化值的绝对值Pi进行计算:
Pi=|accuracy(yi,y)-A|,i∈[1,s];
其中,Pi反应了随机改变测试数据集T中第i列特征的特征值对罪犯改造质量评估系统的评估结果的影响程度。
8.根据权利要求7所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:在S7中:
所述特征排序模块将预测准确率变化值的绝对值组成集合P={P1,P2,P3,...,Ps},其中,P1-Ps表示随机改变测试数据集T中对应列的特征值所得到的预测准确率与基线预测准确率A之间变化值的绝对值,所述特征排序模块根据预测准确率变化值的绝对值集合P={P1,P2,P3,...,Ps}中预测准确率变化值的绝对值的大小,对特征集F中的特征进行排序,并根据排序的结果生成图片,得到特征重要性图。
9.根据权利要求8所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:所述罪犯改造质量评估系统所使用的特征集F中对应着动态指标和静态指标,所述动态指标包括源动态指标和对比动态指标;
所述动态指标用Id={D1,D2,...,Dm}表示,其中,m表示罪犯改造质量评估系统中所有动态指标的个数,D1-Dm表示动态指标值;
所述静态指标用Is={S1,S2,...,Sn}表示,其中,n表示改造质量评估体系中所有静态指标的个数,S1-Sn表示静态指标值;
那么有:
If=Id∪Is
其中,If表示全指标集,表示罪犯改造质量评估系统中所有的指标值;
则:所述特征集F={src_D1,cmp_D1,src_D2,cmp_D2,...,src_Dm,cmp_Dm,S1,S2,...,Sn};
其中,“src_”和“cmp_”开头的特征分别表示源动态指标值和对比动态指标值。
10.根据权利要求9所述的一种罪犯改造质量评估系统评估结果分析解释方法,其特征在于:所述源动态指标是指罪犯在一个时间点所收集的所有动态指标的指标值;
所述对比动态指标是指该罪犯在另一个时间点所收集的所有动态指标的指标值;
所述静态指标是指该罪犯不可变指标的指标值。
CN202010669829.6A 2020-07-13 2020-07-13 一种罪犯改造质量评估系统评估结果分析解释方法 Active CN111784180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010669829.6A CN111784180B (zh) 2020-07-13 2020-07-13 一种罪犯改造质量评估系统评估结果分析解释方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010669829.6A CN111784180B (zh) 2020-07-13 2020-07-13 一种罪犯改造质量评估系统评估结果分析解释方法

Publications (2)

Publication Number Publication Date
CN111784180A CN111784180A (zh) 2020-10-16
CN111784180B true CN111784180B (zh) 2024-04-09

Family

ID=72768519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010669829.6A Active CN111784180B (zh) 2020-07-13 2020-07-13 一种罪犯改造质量评估系统评估结果分析解释方法

Country Status (1)

Country Link
CN (1) CN111784180B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090079398A (ko) * 2008-01-17 2009-07-22 한남대학교 산학협력단 위험분석 평가 시스템 및 그 동작 방법
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
CN108596386A (zh) * 2018-04-20 2018-09-28 上海市司法局 一种预测犯人重复犯罪概率的方法及系统
CN108983966A (zh) * 2018-06-13 2018-12-11 济南博图信息技术有限公司 基于虚拟现实和眼动技术的罪犯改造评估系统和方法
CN109998570A (zh) * 2019-03-11 2019-07-12 山东大学 服刑人员心理状态评估方法、终端、设备及系统
CN110942088A (zh) * 2019-11-04 2020-03-31 山东大学 一种基于监狱服刑人员有效影响因子的危险性等级评估方法及其实现系统
CN110991694A (zh) * 2019-10-30 2020-04-10 南京大学 一种基于深度学习的量刑预测方法
CN111784181A (zh) * 2020-07-13 2020-10-16 南京大学 一种罪犯改造质量评估系统评估结果解释方法
CN111832941A (zh) * 2020-07-13 2020-10-27 江苏怀业信息技术股份有限公司 一种罪犯改造质量评估系统的子训练集处理方法
CN111832942A (zh) * 2020-07-13 2020-10-27 江苏怀业信息技术股份有限公司 一种基于机器学习的罪犯改造质量评估系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090079398A (ko) * 2008-01-17 2009-07-22 한남대학교 산학협력단 위험분석 평가 시스템 및 그 동작 방법
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
CN108596386A (zh) * 2018-04-20 2018-09-28 上海市司法局 一种预测犯人重复犯罪概率的方法及系统
CN108983966A (zh) * 2018-06-13 2018-12-11 济南博图信息技术有限公司 基于虚拟现实和眼动技术的罪犯改造评估系统和方法
CN109998570A (zh) * 2019-03-11 2019-07-12 山东大学 服刑人员心理状态评估方法、终端、设备及系统
CN110991694A (zh) * 2019-10-30 2020-04-10 南京大学 一种基于深度学习的量刑预测方法
CN110942088A (zh) * 2019-11-04 2020-03-31 山东大学 一种基于监狱服刑人员有效影响因子的危险性等级评估方法及其实现系统
CN111784181A (zh) * 2020-07-13 2020-10-16 南京大学 一种罪犯改造质量评估系统评估结果解释方法
CN111832941A (zh) * 2020-07-13 2020-10-27 江苏怀业信息技术股份有限公司 一种罪犯改造质量评估系统的子训练集处理方法
CN111832942A (zh) * 2020-07-13 2020-10-27 江苏怀业信息技术股份有限公司 一种基于机器学习的罪犯改造质量评估系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于风险地形建模的毒品犯罪风险评估和警务预测;张宁;王大为;;地理科学进展;20180903(第08期);正文全文 *
智能化再犯风险评估司法应用的法律风险及其防范;狄小华;;学术界;20200515(第05期);正文全文 *

Also Published As

Publication number Publication date
CN111784180A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN110347839B (zh) 一种基于生成式多任务学习模型的文本分类方法
CN112101426B (zh) 基于自编码器的无监督学习图像异常检测方法
JP6725547B2 (ja) 人工ニューラルネットワークの関連性スコア割当て
CN110895705B (zh) 异常样本检测装置及其训练装置和训练方法
CN110765878A (zh) 一种短时降雨预测方法
Yu et al. Corrosion and coating defect assessment of coal handling and preparation plants (CHPP) using an ensemble of deep convolutional neural networks and decision-level data fusion
CN115131580B (zh) 基于注意力机制的空间目标小样本识别方法
CN115587335A (zh) 异常值检测模型的训练方法、异常值检测方法及系统
CN110717602B (zh) 一种基于噪音数据的机器学习模型鲁棒性评估方法
CN117115581A (zh) 一种基于多模态深度学习的智能误操作预警方法及系统
CN116433333B (zh) 基于机器学习的数字商品交易风险防控方法及装置
CN111784180B (zh) 一种罪犯改造质量评估系统评估结果分析解释方法
CN117217368A (zh) 预测模型的训练方法、装置、设备、介质及程序产品
CN111784181B (zh) 一种罪犯改造质量评估系统评估结果解释方法
Ma et al. Denoised labels for financial time series data via self-supervised learning
CN114610871B (zh) 基于人工智能算法的情报系统建模分析方法
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
CN114757183B (zh) 一种基于对比对齐网络的跨领域情感分类方法
CN115098681A (zh) 一种基于有监督对比学习的开放服务意图检测方法
CN115310559A (zh) 一种基于贝叶斯-Transformer神经网络模型的目标识别方法
CN111832941A (zh) 一种罪犯改造质量评估系统的子训练集处理方法
CN111832942A (zh) 一种基于机器学习的罪犯改造质量评估系统
CN114220145A (zh) 人脸检测模型生成方法和装置、伪造人脸检测方法和装置
CN114118526A (zh) 一种企业风险预测方法、装置、设备及存储介质
CN114925808B (zh) 一种基于云网端资源中不完整时间序列的异常检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant