CN111914166A - 应用于社区矫正人员的矫正策略个性化推荐系统 - Google Patents
应用于社区矫正人员的矫正策略个性化推荐系统 Download PDFInfo
- Publication number
- CN111914166A CN111914166A CN202010632336.5A CN202010632336A CN111914166A CN 111914166 A CN111914166 A CN 111914166A CN 202010632336 A CN202010632336 A CN 202010632336A CN 111914166 A CN111914166 A CN 111914166A
- Authority
- CN
- China
- Prior art keywords
- community
- personnel
- corrected
- data
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 100
- 238000013136 deep learning model Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000000605 extraction Methods 0.000 claims abstract description 4
- 238000005067 remediation Methods 0.000 claims abstract description 4
- 230000009467 reduction Effects 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 claims description 2
- 239000013598 vector Substances 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000004140 cleaning Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了应用于社区矫正人员的矫正策略个性化推荐系统,应用于服务器端,包括:获取模块,其被配置为:响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;特征提取模块,其被配置为:对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;矫正策略推荐模块,其被配置为:将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
Description
技术领域
本申请涉及智能推荐技术领域,特别是涉及应用于社区矫正人员的矫正策略个性化推荐系统。
背景技术
本部分的陈述仅仅是提到了与本申请相关的背景技术,并不必然构成现有技术。
随着社会对矫正人员的关注逐步提高,本专利的目的是实现对矫正人员更便捷、更科学的管理,在矫正方案推荐技术方面形成突破,实现对假释、暂予监外执行人员的个性化矫正,促进司法社区矫正工作的跨越式升级。因为现阶段社会上的对于矫正策略的自动推荐技术缺失,对矫正人员的智能管控手段固化,基本还处于人工处理的阶段,为实现减轻工作人员的工作量的目的,实现精准施矫,需要搭建基于矫正人员信息的推荐系统,实现矫正策略的定量、科学。
在实现本申请的过程中,发明人发现现有技术中存在以下技术问题:
因为数据采集是通过对社区矫正人员信息的采集,会出现采集错误、犯人不配合等问题,也需对数据进行一定的清洗,现有技术中缺乏对社区矫正人员进行信息实时采集的客户端;
当前普遍应用的矫正流程为人工制定矫正策略,矫正人员信息获取和分析具有一定的难度,矫正策略的推荐也需要一定的专业人员进行编写;现有技术中的矫正策略无法实现智能推荐,矫正策略的制定无法基于待矫正人员的特征,实现个性化推荐;
在实际工作中,因为犯人信息涉及个人隐私,所以需要相关部门的配合来保证数据的真实性和数据的安全性,现有技术的策略无法实现部门之间的信息共享,当待矫正人员因为自身工作需要离开当前社区后,其他接纳社区无法第一时间掌握待矫正人员的基础数据,也无法第一时间提供核实的矫正策略。
发明内容
为了解决现有技术的不足,本申请提供了应用于社区矫正人员的矫正策略个性化推荐系统;
第一方面,本申请提供了应用于社区矫正人员的矫正策略个性化推荐系统;
应用于社区矫正人员的矫正策略个性化推荐系统,应用于服务器端,包括:
获取模块,其被配置为:响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
特征提取模块,其被配置为:对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
矫正策略推荐模块,其被配置为:将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
第二方面,本申请还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行步骤包括:
响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
第三方面,本申请还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,执行步骤包括:
响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
与现有技术相比,本申请的有益效果是:
1.本申请通过设置社区矫正人员使用的客户端,来实现对社区矫正人员的信息实时采集;
2.本申请通过深度学习模型,实现待矫正人员矫正策略的个性化推荐;
3.本申请通过本社区服务器与其他社区服务器时间的信息共享,实现待矫正人员矫正策略的信息共享;
4.原始的矫正人员信息和矫正策略是基于选择题的格式,这种结构化的数据表示形式有利于推荐的产生和展示,能更好的实现新的矫正策略的形成和推荐,最终达到近似于矫正专家推荐的效果。
5.使用特征组合模式能最大程度的保存信息并且为之后的可视化做出保证,在减少输入的维度的同时最大的保证推荐的性能不会出现难以接受的误差。
6.基于聚类中心批量更新,可以避免每次新增数据后重新进行tsne降维操作的运算消耗较大的问题。
7.根据处理后的矫正人员信息和专家的矫正策略,实现了基于原先的矫正策略对新的矫正人员的矫正策略的推荐,对矫正策略的客观、定量、科学提供了保证。
8.利用机器学习进行矫正策略的推荐,使得推荐的矫正策略随着采集数据的增加,实现日益提升的矫正效果。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为第一个实施例的推荐系统框架示意图;
图2(a)-图2(c)为第一个实施例的降维流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
术语解释:
1.矫正人员信息是对矫正人员的基本信息的采集而形成的数据
2.MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理。
3.TSNE就是一种数据可视化的工具,能够将高维数据降到2-3维(降维),然后画成图。
4.Matlplotlib是Python的一个2D图形库,能够生成各种格式的图形(诸如折线图,散点图,直方图等等),界面可交互(可以利用鼠标对生成图形进行点击操作),同时该2D图形库跨平台。
实施例一
本实施例提供了应用于社区矫正人员的矫正策略个性化推荐系统;
如图1所示,应用于社区矫正人员的矫正策略个性化推荐系统,应用于服务器端,包括:
获取模块,其被配置为:响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
特征提取模块,其被配置为:对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
矫正策略推荐模块,其被配置为:将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
进一步地,所述客户端为:手机、智能手表或者智能眼镜;所述客户端在使用时由社区矫正人员使用。
进一步地,所述服务器端,设置在社区管理中心,当前社区管理中心的服务器与其他社区管理中心的服务器进行通信连接,实现矫正策略的共享。
进一步地,所述获取由客户端采集的社区待矫正人员的基本信息,其中基本信息,包括但不限于:问卷信息和文档信息;
所述问卷信息,包括:家庭信息、个人信息、社会信息、心理信息;
所述文档信息,通过网络爬虫的形式进行获取。
示例性的,矫正人员的问卷信息。通过咨询相关专家来设计需要采集的矫正人员的问题,从问题的全面性,真实性,可采集等各个方面进行综合考虑。通过实际验证,从问题的难易程度和实现方式发现将对矫正人员的问题的选项设计成选择题的形式,并将矫正人员信息表格交由被矫正人员填写。
示例性的,所述文档信息,包括:矫正人员的思想汇报。利用文字识别技术,提取文档中有用的信息,按照表格的方式按类存储,并将其与矫正人员基本信息进行合并,形成完整的信息。
进一步地,对社区待矫正人员的基本信息进行处理,包括:
对社区待矫正人员的文档信息进行文字识别处理,将文字识别的结果与问卷信息合并后,进行分类存储。
进一步地,提取社区待矫正人员的特征,包括:
将分类存储后的数据,进行特征组合降维处理,得到社区待矫正人员的特征。
进一步地,将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略;具体步骤包括:
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的类别,根据社区待矫正人员的类别查找到对应类别的矫正策略,将矫正策略发送给客户端,并在客户端进行显示。
进一步地,所述预训练好的深度学习模型,其训练步骤包括:
构建深度学习模型;构建训练集;
将训练集输入到深度学习模型中进行训练,输出损失函数最小值所对应的深度学习模型,即得到训练好的深度学习模型。
进一步地,所述深度学习模型,例如:神经网络或梯度提升树模型。
进一步地,所述训练集为已知矫正人员类别和已知矫正人员特征的数据。
进一步地,所述训练集的获取步骤包括:
获取社区已矫正人员的问卷信息、文档信息和矫正策略信息;
对获取社区已矫正人员的数据进行预处理;
将预处理后的数据通过特征组合的形式进行降维处理,得到数据特征;
将降维处理后的数据特征,通过聚类的形式进行特征聚类,得到社区已矫正人员的类别和对应类别的矫正人员的特征。
示例性的,所述社区已矫正人员的矫正策略信息,是将社区已矫正人员的综合信息交给社区矫正工作人员观看,并让矫正工作人员在已经量化为选择题的矫正策略中进行选择,通过多位矫正工作人员平均做出决策,每个已矫正人员构成一个案例。
利用数据库进行存储,将社区已矫正人员信息和矫正策略按照社区已矫正人员的ID编号分别对应存储。其中该数据库经过脱密以后,存放到远程服务器中,并通过程序进行数据的读取利用,为接下来的数据处理做好准备。
进一步地,所述对获取社区已矫正人员的数据进行预处理;具体步骤包括:
对社区已矫正人员的文档信息进行文字识别,将文字识别结果与问卷进行数据合并,将数据合并结果进行无用数据的过滤,对过滤后的数据进行丢失数据的填充,再将填充后的数据进行数字化处理。
进一步地,所述对获取社区已矫正人员的数据进行预处理;还包括:数据扩充步骤;
所述数据扩充步骤是对数字化处理后的数据进行扩充。
示例性的,所述数据扩充是对数据特征进行分析,根据目标对现有的特征进行深度的特征构造,产生更多实用的数据,对特征的处理可以使得数据再一次丰富。特征的构建包括相似的特征相加,相反的特征相加,根据特征进行再进一步的细化分类,构造成更细的类别特征,有助于更好的推荐。将构造特征后的矫正人员数据标为数据B。
进一步地,如图2(a)-图2(c)所示,将预处理后的数据通过特征组合的形式进行降维处理,得到数据特征;具体步骤包括:
将预处理后的社区已矫正人员的数据,按照内容相似性划分为M个组;
每个组内包括若干个特征,将每一个组的所有特征均降维处理;
通过对降维处理后的特征,按照组间特征组合的形式进行特征组合,其中特征组合包括:两两特征组合、三三特征组合或四四特征组合;
将组合后的特征输入到深度学习模型中,输出预测准确率最高的组合形式,将准确率最高的组合作为最优组合,用最优组合来表示社区已矫正人员的数据。
示例性的,所述将预处理后的数据通过特征组合的形式进行降维处理,得到数据特征;
将原始的高维度的矫正人员基本信息,在尽量少损失信息的条件下,降维到低维度。降维方法通过特征组合进行。以tsne技术为例。输入的矫正人员基本信息特征(简化为选择题的个数)为N维,那么将N维特征按照内容的相似性(例如矫正人员采集的信息中包含个人信息,社区信息,心理信息等,分别根据个人基本信息,犯罪信息,心理信息等进行特征分组)分为M个组,每个组内包含多个特征,将每一组的特征降维到低维(一般取2维),通过M个组之间将降维后的2维特征的两两组合、三三组合、四四组合一直到所有M个组的特征组合,遍历这些特征组合,计算组合后输入到机器学习模型中的准确率(准确率=所有预测正确的样本/总的样本),获得一个最优的组合方式,使用这最新的组合方式来表示整个数据。通过组合特征并降维,即得到了一个比较好的可视化的数据,该数据又比较好的代替原先的数据。
进一步地,将降维处理后的数据特征,通过聚类的形式进行特征聚类,得到社区已矫正人员的类别和对应类别的矫正人员的特征,具体步骤包括:
将降维后的数据特征,利用无监督聚类算法进行聚类,输出社区已矫正人员的类别。
示例性的,所述将降维处理后的数据特征,通过聚类的形式进行特征聚类,得到社区已矫正人员的类别和对应类别的矫正人员的特征,是:
基于降维后的矫正人员信息数据,利用无监督聚类算法进行特征聚类,例如kmeans算法,其中距离计算公式使用曼哈顿距离或欧氏距离等典型的距离计算公式:
两个n维向量a(x11,x12,…,x1n)与b(x11,x12,…,x1n)间的曼哈顿距离
其中,dab是指向量a和向量b之间的距离。x1k是指向量a的第k维数据,x2k是指向量b的第k维数据;
两个n维向量a(x11,x12,…,x1n)与b(x11,x12,…,x1n)间的欧氏距离:
其中dab是指向量a和向量b之间的距离。x1k是指向量a的第k维数据,x2k是指向量b的第k维数据。
将数据放入算法中,通过选择聚类中心显示效果来进一步调整降维数据,重复以上操作以达到最好的显示效果。其中kmeans显示N类数据,假设原始数据为A,降维后的数据为B,将降维后的数据B放入kmeans中聚类成N类。根据聚类的效果可以进行对B的调整,如果效果太差就重新进行对数据A的降维获得新的数据B。
进一步地,聚类算法的聚类中心,通过批量更新机制进行更新。
当新的社区已矫正人员数据量超过设定阈值,则启动聚类中心更新步骤;否则不启动。
示例性的,为了避免新增数据后进行降维操作的运算消耗较大的问题(数据更新后,tsne算法需要全部重新进行计算),所以采用批量更新机制的处理新来的数据。首先对所有的数据进行降维,降维后再使用聚类算法,例如kmeans得到N个聚类中心C1,C2,C3…Cn并分别寻找距离N个聚类中心最近的案例E1,E2,E…En。当新增案例X时,只计算X与案例E1,E2,E…En的距离,并不进行全局的更新,从而可以得到每个聚类中心C1到Cn的索引和新来的数据之间的距离,从而计算案例X属于哪一类。只有当新来的数据达到一定的数量,才将所有的数据进行tsne降维,并重新计算聚类中心。
为了验证数据的好坏对矫正人员策略的推荐的影响,做了以下实验:
1.使用未处理的原始数据。在使用原始数据而未加处理的情况下,将数据输入到模型中显示矫正人员的分类效果一般,对矫正人员的矫正策略的推荐效果产生一些不好的影响,推荐策略会偶尔产生不符合逻辑的推荐。
2.使用初步清理后的数据。在对原始的特征进行初步清理,填充缺失值,清理冗余特征。将处理后的数据放入模型中,矫正策略大幅好转,基本符合矫正专家的推荐策略。
3.将数据进行特征组合进而产生新的特征并进一步对数据进行清理,特征从二二组合以及更高级别的组合,将组合后的特征放入模型中多次实验选择最好的特征组合方式,进行多次策略的模拟。其中组合方式共有个,实际使用中不可能逐个去比较,所以采取不同批次的特征进行使用,且可使用随机森林的算法可进行特征的筛选,通过比较矫正策略,最终得到矫正策略比初步处理后产生的策略有提升,符合矫正专家真实推荐的策略。
实施例二
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行步骤包括:
响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
每个步骤的具体执行过程与实施例一是一一对应的,此处不再赘述。
实施例三
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成执行步骤包括:
响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
每个步骤的具体执行过程与实施例一是一一对应的,此处不再赘述。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.应用于社区矫正人员的矫正策略个性化推荐系统,其特征是,应用于服务器端,包括:
获取模块,其被配置为:响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
特征提取模块,其被配置为:对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
矫正策略推荐模块,其被配置为:将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
2.如权利要求1所述的系统,其特征是,提取社区待矫正人员的特征,包括:
将分类存储后的数据,进行特征组合降维处理,得到社区待矫正人员的特征。
3.如权利要求1所述的系统,其特征是,将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略;具体步骤包括:
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的类别,根据社区待矫正人员的类别查找到对应类别的矫正策略,将矫正策略发送给客户端,并在客户端进行显示。
4.如权利要求1所述的系统,其特征是,所述预训练好的深度学习模型,其训练步骤包括:
构建深度学习模型;构建训练集;
将训练集输入到深度学习模型中进行训练,输出损失函数最小值所对应的深度学习模型,即得到训练好的深度学习模型。
5.如权利要求1所述的系统,其特征是,所述训练集的获取步骤包括:
获取社区已矫正人员的问卷信息、文档信息和矫正策略信息;
对获取社区已矫正人员的数据进行预处理;
将预处理后的数据通过特征组合的形式进行降维处理,得到数据特征;
将降维处理后的数据特征,通过聚类的形式进行特征聚类,得到社区已矫正人员的类别和对应类别的矫正人员的特征。
6.如权利要求5所述的系统,其特征是,所述对获取社区已矫正人员的数据进行预处理;具体步骤包括:
对社区已矫正人员的文档信息进行文字识别,将文字识别结果与问卷进行数据合并,将数据合并结果进行无用数据的过滤,对过滤后的数据进行丢失数据的填充,再将填充后的数据进行数字化处理。
7.如权利要求5所述的系统,其特征是,将预处理后的数据通过特征组合的形式进行降维处理,得到数据特征;具体步骤包括:
将预处理后的社区已矫正人员的数据,按照内容相似性划分为M个组;
每个组内包括若干个特征,将每一个组的所有特征均降维处理;
通过对降维处理后的特征,按照组间特征组合的形式进行特征组合,其中特征组合包括:两两特征组合、三三特征组合或四四特征组合;
将组合后的特征输入到深度学习模型中,输出预测准确率最高的组合形式,将准确率最高的组合作为最优组合,用最优组合来表示社区已矫正人员的数据。
8.如权利要求5所述的系统,其特征是,将降维处理后的数据特征,通过聚类的形式进行特征聚类,得到社区已矫正人员的类别和对应类别的矫正人员的特征,具体步骤包括:
将降维后的数据特征,利用无监督聚类算法进行聚类,输出社区已矫正人员的类别;
或者,
聚类算法的聚类中心,通过批量更新机制进行更新:当新的社区已矫正人员数据量超过设定阈值,则启动聚类中心更新步骤;否则不启动。
9.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行步骤包括:
响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成执行步骤包括:
响应于客户端的矫正策略个性化推荐请求,获取由客户端采集的社区待矫正人员的基本信息;
对社区待矫正人员的基本信息进行处理,提取社区待矫正人员的特征;
将社区待矫正人员的特征,输入到预训练好的深度学习模型中,输出社区待矫正人员的个性化矫正策略。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010632336.5A CN111914166B (zh) | 2020-07-03 | 2020-07-03 | 应用于社区矫正人员的矫正策略个性化推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010632336.5A CN111914166B (zh) | 2020-07-03 | 2020-07-03 | 应用于社区矫正人员的矫正策略个性化推荐系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914166A true CN111914166A (zh) | 2020-11-10 |
CN111914166B CN111914166B (zh) | 2024-02-27 |
Family
ID=73227232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010632336.5A Active CN111914166B (zh) | 2020-07-03 | 2020-07-03 | 应用于社区矫正人员的矫正策略个性化推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914166B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667919A (zh) * | 2020-12-28 | 2021-04-16 | 山东大学 | 一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法 |
CN113515599A (zh) * | 2021-06-30 | 2021-10-19 | 中国电子科技集团公司第十五研究所 | 一种安置帮教语义分析与方案推荐的方法 |
CN114240699A (zh) * | 2021-12-22 | 2022-03-25 | 长春嘉诚信息技术股份有限公司 | 一种基于循征矫正的罪犯改造手段推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127546A (zh) * | 2016-06-20 | 2016-11-16 | 重庆房慧科技有限公司 | 一种基于智慧社区大数据的商品推荐方法 |
CN110457608A (zh) * | 2019-08-09 | 2019-11-15 | 浙江财经大学 | 一种面向大规模社交媒体数据的双目标采样可视分析方法 |
CN111125525A (zh) * | 2019-12-24 | 2020-05-08 | 山东大学 | 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法 |
US20210011935A1 (en) * | 2017-11-29 | 2021-01-14 | John MacLaren Walsh | Recommender methods and systems for patent processing |
-
2020
- 2020-07-03 CN CN202010632336.5A patent/CN111914166B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127546A (zh) * | 2016-06-20 | 2016-11-16 | 重庆房慧科技有限公司 | 一种基于智慧社区大数据的商品推荐方法 |
US20210011935A1 (en) * | 2017-11-29 | 2021-01-14 | John MacLaren Walsh | Recommender methods and systems for patent processing |
CN110457608A (zh) * | 2019-08-09 | 2019-11-15 | 浙江财经大学 | 一种面向大规模社交媒体数据的双目标采样可视分析方法 |
CN111125525A (zh) * | 2019-12-24 | 2020-05-08 | 山东大学 | 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法 |
Non-Patent Citations (1)
Title |
---|
柳阳: "融合BERT语义特征的社区矫正方案推荐技术", 《电子设计工程》, vol. 28, no. 6 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667919A (zh) * | 2020-12-28 | 2021-04-16 | 山东大学 | 一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法 |
CN113515599A (zh) * | 2021-06-30 | 2021-10-19 | 中国电子科技集团公司第十五研究所 | 一种安置帮教语义分析与方案推荐的方法 |
CN114240699A (zh) * | 2021-12-22 | 2022-03-25 | 长春嘉诚信息技术股份有限公司 | 一种基于循征矫正的罪犯改造手段推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111914166B (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914166A (zh) | 应用于社区矫正人员的矫正策略个性化推荐系统 | |
CN111967761B (zh) | 一种基于知识图谱的监控预警方法、装置及电子设备 | |
CN113779272B (zh) | 基于知识图谱的数据处理方法、装置、设备及存储介质 | |
CN113222149B (zh) | 模型训练方法、装置、设备和存储介质 | |
CN104866831B (zh) | 特征加权的人脸识别算法 | |
US10387805B2 (en) | System and method for ranking news feeds | |
CN117422936B (zh) | 一种遥感图像分类方法及系统 | |
CN107871103A (zh) | 一种人脸认证方法和装置 | |
CN117290462B (zh) | 一种数据大模型的智能决策系统及方法 | |
CN110765285A (zh) | 基于视觉特征的多媒体信息内容管控方法及系统 | |
CN113886562A (zh) | 一种ai简历筛选方法、系统、设备和存储介质 | |
CN117909466A (zh) | 领域问答系统、构造方法、电子设备及存储介质 | |
CN116843955A (zh) | 一种基于计算机视觉的微生物分类识别方法和系统 | |
CN117669726A (zh) | 自然语言问题处理方法、电子设备及计算机可读存储介质 | |
CN111062484B (zh) | 基于多任务学习的数据集选取方法及装置 | |
CN110737773B (zh) | 一种基于神经网络的信息分类方法和系统 | |
CN113742495A (zh) | 基于预测模型的评级特征权重确定方法及装置、电子设备 | |
CN114385876A (zh) | 一种模型搜索空间生成方法、装置及系统 | |
Hui et al. | Analysis of decision tree classification algorithm based on attribute reduction and application in criminal behavior | |
CN109308565B (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
CN115687632B (zh) | 一种刑事量刑情节分解分析的方法和系统 | |
CN117787244B (zh) | 一种面向Handle标识解析的数据解析方法和系统 | |
CN115292388B (zh) | 一种基于历史数据的方案自动挖掘系统 | |
CN116108158B (zh) | 在线互动问答文本特征构造方法和系统 | |
CN116644233A (zh) | 线上学习平台的课程推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |