CN111125525B

CN111125525B - 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法

Info

Publication number: CN111125525B
Application number: CN201911344189.5A
Authority: CN
Inventors: 李玉军; 马宝森; 刘治; 贲晛烨; 朱孔凡
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2019-12-24
Filing date: 2019-12-24
Publication date: 2023-09-15
Anticipated expiration: 2039-12-24
Also published as: CN111125525A

Abstract

本发明涉及一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法，包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端；犯人心理数据采集模块用于测量服刑人员的心理数据；知识库包括心理学模型总结整理的大量专家案例数据，知识库为服刑人员生成对应的矫正方案和矫正策略；推荐模块对相应的服刑人员提供针对性的个性化矫正资源推荐；整个过程中，将完整的矫正方案、实施步骤以及对应的矫正资源列表发送到监狱干警的干警平板终端，只将对应的矫正资源及使用提示发送到服刑人员的犯人平板终端设备中，确保监狱干警对服刑人员整个矫正过程及时跟踪与指导。

Description

一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法

技术领域

本发明涉及一种通过大数据和人工智能分析技术，根据服刑人员的个体特点，建立个性化的改造矫正策略并进行精准推荐的方法，并基于此方法设计了服刑人员个性化改造策略推荐系统，属于司法改造矫正技术领域。

背景技术

监狱服刑人员是一个特殊的社会群体，加强和提升服刑人员的教育改造效果，对于提高服刑人员出狱后的社会融入能力、降低其重新犯罪风险、推动社会和谐发展具有重要意义。

目前，传统的罪犯矫正策略和已有改造措施，由于缺乏科学的改造矫正策略模型，以及先进的技术手段，导致矫正对象分类不清，矫正策略不足。同时由于没有对服刑人员进行科学分类并实施个性化矫正，矫正效果不尽人意。因此，如何构建科学的矫正策略模型，根据不同服刑人员的特点，制定个性化改造方案并实现改造矫正策略的精准推荐是监狱面临的一个重要挑战。

发明内容

针对现有技术的不足，本发明提供了一种面向服刑人员的个性化改造矫正策略推荐系统，该推荐系统包含知识库模块、推荐系统模块、终端模块。通过监狱干警与服刑人员各自终端设备与推荐系统进行数据交互以及推荐资源与推荐方案的推送。

本发明还提供了上述面向服刑人员的个性化改造矫正策略推荐系统的运行方法。

术语解释：

1、大数据平台：以存储、运算、展现作为目的的平台。集合了知识库和推荐系统模块，该平台集数据接入、数据处理、数据存储、查询检索、分析挖掘等、应用接口等为一体。

2、知识库：由心理学专家根据心理学测量数据、矫正策略和矫正方案案例数据构建而成，心理学数据的来源包括已有犯人的心理数据汇总和外部网站的数据收集，包含罪犯文本信息、矫正策略与矫正方案，数据库是以一定方式储存在一起、能与多个用户共享，用户可以对文件中的数据进行新增、查询、更新、删除等操作。

3、推荐系统：基于监狱服刑人员的量表数据和个体文本信息以及知识库中包含的矫正资源、矫正方案，对服刑人员的矫正资源矫正方案进行个性化推荐的模块。

4、终端：终端模块是用于收集新入刑人员心理测量数据的设备，设备收集的新入刑人员心理测量数据送入大数据平台并把大数据平台内的知识库、推荐系统生成的矫正方案、矫正资源提供给对应的狱警和入刑人员。

5、BERT：全称为“Bidirectional Encoder Representations fromTransformers”，基于Transformer的将罪犯的文本描述向量化的双向编码器表征，其中“双向”表示模型在处理某一个词时，它能同时利用前面的词和后面的词两部分信息。

6、监狱犯人量表，通过收集问卷，采集犯人心理不同方面，包括技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因这6维犯罪成因，主要为数值数据。

7、神经网络模型，BERT，是一个语言表征模型(1anguage representationmodel)，通过超大数据、巨大模型、和极大的计算开销训练而成，在11个自然语言处理的任务中取得了最优(state-of-the-art，SOTA)结果。它代表Transformer的双向编码器表示，BERT旨在通过联合调节所有层中的上下文来预先训练深度双向表示。预训练的BERT表示可以通过一个额外的输出层进行微调，适用于广泛任务的最先进模型的构建。

本发明的技术方案为：

一种面向服刑人员的个性化改造矫正策略推荐系统，包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端；

所述犯人心理数据采集模块连接所述知识库，所述知识库分别连接所述推荐模块、干警平板终端，所述犯人行为数据采集模块连接所述推荐模块，所述推荐模块连接所述犯人平板终端；

所述犯人心理数据采集模块用于测量服刑人员的心理数据，服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员，并将测量的心理数据发送至所述知识库；

所述知识库包括心理学模型总结整理的大量专家案例数据，专家案例数据包括心理学测量数据、矫正策略和矫正方案；所述知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据，为服刑人员生成对应的矫正方案和矫正策略，并把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块，同时将矫正方案发送给所述干警平板终端；

所述犯人行为数据采集模块用于获取服刑人员的行为数据；

所述推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案，以及监狱拥有的各种矫正资源(心理学资源、视频、音频、读物、游戏等)对相应的服刑人员提供针对性的个性化矫正资源推荐，针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源，并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到所述干警平板终端，所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的所述犯人平板终端上；

整个过程中，将完整的矫正方案、实施步骤以及对应的矫正资源列表发送到监狱干警的干警平板终端，只将对应的矫正资源及使用提示发送到服刑人员的犯人平板终端设备中，确保监狱干警对服刑人员整个矫正过程及时跟踪与指导。

所述干警平板终端用于实时获取新入刑的服刑人员的基本资料，新入刑的服刑人员的基本资料包括年龄、性别、所犯罪名及对应刑期，接收服刑人员的6维犯罪成因，接收所述知识库发送的服刑人员对应的矫正方案和矫正策略，以及接收所述推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源；

所述犯人平板终端用于记录新入刑的服刑人员的基本资料，接收所述知识库发送的服刑人员对应的矫正方案和矫正策略，接收所述推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源。

根据本发明优选的，所述推荐模块还包括数据分析模块、矫正资源推荐模块，

所述数据分析模块得到知识库发送来的服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案，通过数据预处理后根据这些内容使用推荐系统研究领域的模型(初步使用biasSVD算法，后续使用基于回归树上下文特征自动编码的偏置张量分解算法，模型的具体算法不做限制，可以根据监狱内实际数据规模进行更改)进行处理；

所述矫正资源推荐模块用于根据数据分析模块对服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案处理后得到的信息，结合监狱内现有的各种矫正资源(视频资源、图书资源、音频资源)为对应犯人提供矫正资源的个性化推荐。

根据本发明优选的，所述干警平板终端及所述犯人平板终端均为平板电脑。

上述面向服刑人员的个性化改造矫正策略推荐系统的运行方法，包括步骤如下：

(1)在大数据平台上搭建知识库

把心理学专家总结整理的大量专家案例数据整合到知识库，专家案例数据包括心理学测量数据、矫正策略和矫正方案，完成大数据平台上知识库的搭建；

(2)测量服刑人员的心理数据

所述犯人心理数据采集模块测量服刑人员的心理数据，通过设置问卷问题让犯人回答，根据犯人的回答情况总结6维犯罪成因，心理数据包括6维犯罪成因，6维犯罪成因包括：技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因；服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员，并将测量的心理数据发送至所述知识库；

(3)知识库为服刑人员生成对应的矫正方案和矫正策略

所述知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据，为服刑人员生成对应的矫正方案和矫正策略，并把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块，同时将矫正方案发送给所述干警平板终端；服刑人员基本信息包括服刑人员编号、性别、年龄、罪名、籍贯、文化水平；

(4)推荐模块进行推荐

推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案，以及监狱拥有的各种矫正资源，各种矫正资源包括视频资源、图书资源与音乐资源；对相应的服刑人员提供针对性的个性化矫正资源推荐，针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源，如果监狱里没有该矫正方案中提到的资源，则推荐模块会推荐与该资源最相似的资源给犯人，并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到所述干警平板终端，所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的所述犯人平板终端上；

(5)测量服刑人员的行为数据

所述犯人行为数据采集模块测量服刑人员的行为数据。行为数据是指犯人在服刑过程中使用矫正资源的过程记录，包括犯人观看视频、听音频、进行游戏的时间点、时间长度以及活动的其他参与人员名单，其他的行为数据可以根据现实情况进行调整。

本发明针对监狱服刑人员的性格差异，采用知识库与推荐模块相结合的策略，通过构建结构化和标准化案例知识库，构建各类服刑人员矫正需求的备选指标体系，开发个性化矫正策略；同时本发明通过构建推荐模块，根据矫正方案初步推荐犯人必需的资源，再根据犯人的基本属性信息、行为数据个性化推荐矫正资源。本发明优化了监狱服刑人员矫正资源与矫正方案的个性化推荐流程。

根据本发明优选的，所述步骤(1)，在大数据平台上搭建知识库，包括步骤如下：

A、原始数据搜集；原始数据通过监狱犯人量表和中国法律服务网爬虫获取；

在监狱内向犯人发放问卷采集服刑人员的心理数据；在心理学专家的指导下分析总结问卷中的问题得到量表数据，量表数据就是指存储心理数据的表格，各种因素的心理数据都以数值数据的形式呈现，分数的判定由心理学专家制定规则，每一个心理因素都设置多个问题，每一问题的不同选项对应不同的分数；具体打分规则可以根据实际情况做调整，如用百分制评分，某一因素的分数越高则这个因素对该犯人犯罪影响越大；

通过爬虫对中国法律服务网公开资料进行采集，并采用正则解析等技术收集犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告，进行下一步的分析和矫正；

B、原始数据处理；对通过网络爬虫和监狱实地问卷采集收取罪犯的文本信息，提取出犯人的基本信息以及心理状况等描述。在获得犯人的相关原始数据后，在专家帮助下，对步骤A搜集到的原始数据进行文本数据分析，对对应的犯人类型打标签，构建犯因关键词库，标签反映罪犯的犯罪成因，不同的标签均对应不同的矫正策略，根据矫正策略制定详细的矫正方案，矫正策略与矫正方案一一对应，得到专家案例数据。

(1)假设新入监的犯人为刘某，刘某通过平板问卷进行了心理状态测量，并将测量结果进行了提交；

(2)犯人在平板上的心理测评提交操作，将首先触发测评数据输入到知识库的操作，知识库根据送来的数据进行分正则匹配、文本分析进行关键词匹配，计算文本匹配的关键词数目，生成本案例犯因标签(共有6种犯因标签：技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因)然后触发知识库系统为刘某生成矫正策略和矫正方案，假定刘某的矫正策略为“以亲情召唤，社会支持为核心的矫正策略”，则对应的矫正方案概要如表2所示。

知识库的关键技术包含数据库的设计、文本数据的生成、矫正策略和矫正方案的生成。通过监狱问卷调查获取的量表数据存储在构建的数据表1中，通过爬虫获取的文本数据存储在数据表2中；文本数据的生成主要采用基于语义的文本分类处理和利用关键词匹配的关键词库。知识库根据新入库的服刑人员心理测量数据和专家输入案例的心理测量数据，为新入库的服刑人员生成矫正策略。

根据本发明优选的，所述步骤B中，对步骤A搜集到的原始数据进行文本数据分析，对对应的服刑人员类型打标签，构建犯因关键词库，利用BERT(Bidirectional EncoderRepresentations from Transformers)引入大量的外部语义知识，将罪犯的文本描述向量化，计算文本向量的相似度进而实现文本的分类。构建关键词库，利用关键词进行匹配，进而实现罪犯的分类，给不同类型的罪犯打上不同的关键词/标签。包括步骤如下：

a、通过分析服刑人员的心理数据，制定6维犯罪成因；6维犯罪成因包括：技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因；

b、每种犯罪成因选取典型案例，接着采用爬虫获取的本数据集X进行文本相似度匹配，根据相似度的数值打标签；爬虫获取的本数据集X即犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告；

设定x_i表示第i篇待分类的文本，1≤i≤|X|，|X|表示文本数据集X中的文本篇数；|X|篇文本构成词库集W＝{w₁，w₂…w_|W|}，w_j表示第j个词语，|W|表示词库集W中的词语个数；

S1：利用神经网络模型BERT构造词间相似度矩阵S_|W|×|W|；

将每个词语输至入神经网络模型BERT，获得每个词语的向量表示，第j个词语的向量表示为

利用余弦函数计算词间相似度，如式(I)所示：

式(I)中，j′≠j^*，分别代表第j′个词语和第j^*个词语；

用所有词间相似度构造出词间相似度矩阵S_|W|×|W|；

S2：对词间相似度矩阵S_|W|×|W|进行截断奇异值分解，分解为∑为低秩矩阵，/>为转移矩阵，U是矩阵论中对一个矩阵进行奇异值分解后得到的酉矩阵，k＜＜|W|；

S3：计算矩阵如式(II)所示：

式(II)中，是X行低维文本向量构成的矩阵，矩阵/>的每行表示一个文本低维向量；利用余弦函数计算得到文本的相似度，根据相似度的值实现文本的分类；

S4：对采用爬虫获取的本数据集X进行正则匹配，获取到服刑人员基本信息以及描述心理的文本描述，描述心理的文本描述就是通过正则匹配的方式，获取文本中服刑人员心里描述的相关文本描述的文字内容；

S5：分析文本数据，制定6种犯罪成因的标签，并制定对应的关键词库。

为了提高准确率，通过分析罪犯的文本数据，制定6种主要的犯罪成因。同时构建关键词库，对描述罪犯的文本数据进行关键词的匹配，进而获得罪犯的主要犯因。

根据本发明优选的，所述步骤(3)，知识库为服刑人员生成对应的矫正方案和矫正策略，包括步骤如下：

C、对服刑人员的心理数据进行数据分析，生成关键词/标签；

取所有的问卷数据，包括每个问卷题目的得分，计算反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷七个维度的总得分；

判断是否打对应的七种关键词/标签：七种关键词/标签包括反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷；根据问卷回答的问题对这七个维度打分，并对每一个维度的分数设置一个阈值，若某一维度的得分大于设置的该阈值，则存在此关键词/标签，可以所有维度设置相同阈值，也可以不同维度设置不同阈值，具体阈值规则的制定在专家指导下根据当地监狱犯人的实际情况进行设置；对得分数据进行标准化处理，计算每个犯人的关键词/标签重要程度；

①标准化处理：将数据按比例缩放，使之落入一个特定区间；在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权；

②计算每个犯人关键词/标签重要程度：对这七个维度的得分x₁，x₂，x₃，x₄，x₅，x₆，x₇进行变换，如式(III)所示：

式(III)中，min_1≤j≤7x_j是指x₁，x₂，x₃，x₄，x₅，x₆，x₇中的最小值，max_{1＜＜j＜＜7} x_j是指x₁，x₂，x₃，x₄，x₅，x₆，x₇中的最大值，y_i是指变换后的值，变换后的值y_i越高，则对应关键词/标签越重要，取最高得分的一项作为关键词/标签；

D、将步骤C生成的关键词与生成的犯因关键词库进行关键词匹配，分析得到服刑人员犯罪成因，并针对其犯罪成因生成对应的矫正策略，知识库根据矫正策略生成对应矫正方案；

E、知识库把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块，同时将矫正方案发送给所述干警平板终端。

根据本发明优选的，所述步骤(4)，推荐模块进行推荐，包括步骤如下：

F、推荐模块接收到服刑人员基本信息及对应的矫正策略与矫正方案，以及终端服刑人员的平板终端送来的服刑人员的交互信息及矫正资源信息进行整合；服刑人员的交互信息包括服刑人员ID、资源ID、资源观看时长或评分，服刑人员ID为服刑人员在监狱内的犯人编号，资源ID为监狱内图书资源、视频资源、音乐资源在监狱内制定的编号，资源观看时长为服刑人员使用每一种资源所花费的时间长度，评分为各种资源的评分(选取这些资源在豆瓣网站的评分)；矫正资源信息包括资源ID、名称、类别，视频需提供总时长，名称为每一项资源原有的名字，类别为每一个资源按照内容所分出的类别，视频需提供总时长为每份视频的时间长度；

G、数据分析模块处理服刑人员基本信息及对应的矫正策略与矫正方案，以及服刑人员的交互信息及矫正资源信息，得到服刑人员交互行为分析和民警矫正方案干预；

H、步骤G得到的服刑人员交互行为分析和民警矫正方案干预通过数据接口传送到干警平板终端，同时将步骤G得到的服刑人员交互行为分析和民警矫正方案干预发送到推荐模块内的矫正资源推荐模块，经过矫正资源推荐模块处理后得到服刑人员的矫正资源列表，通过数据接口传送到犯人平板终端。

进一步优选的，所述步骤H中，推过基于模型的协同过滤算法的处理后，得到适合服刑人员的矫正资源列表，包括步骤如下：

矩阵分解：将评分矩阵分解为用户特征矩阵和物品特征矩阵，评分矩阵包括用户编号、物品编号及用户对该物品的评分；通过用户特征矩阵和物品特征矩阵的乘积拟合评分矩阵；用户特征矩阵是指用户的兴趣，物品特征矩阵是指物品的特点，且每一个维度相互对应，用户特征矩阵和物品特征矩阵的乘积表示用户对该物品的喜好程度；使用biasSVD算法；

预测模型如下所示：

是指预测评分，μ是指全局平均分，b_u是指用户偏置，b_i是指物品偏置，K是指特征矩阵维度，P_ud是指用户特征矩阵，Q_id是指物品特征矩阵；

目标损失函数如下所示：

λ是指正则化参数，用户u对物品i的真实评分r_ui，是指预测评分，P_u是指目标用户特征矩阵，Q_i是指目标物品特征矩阵，L是指犯人对所有资源的预测评分，即Top-N推荐列表；

在推荐模型中加入一些上下文信息(例如心情、时间地点等)被认为对提高推荐精度是有效的。此外，一个用户以往的所有行为信息也反映着用户的潜在偏好，在用户当前行为信息不充足的情况下，在模型中融入用户的历史行为记录(即隐式反馈)，也能够有效地提升推荐系统的推荐效果。

上下文自编码：

张量中上下文维度D是系统中所有上下文特征取值的笛卡尔积。这使得D随上下文特征的个数以指数的形式增长。使用基于回归树的上下文特征编码机制，不仅可以有效地控制上下文维度，还能提高算法的精度。考虑到每个训练样本经过张量分解对应上下文空间的一个向量，使用单棵决策树进行编码，通过控制回归树的深度可以有效控制编码后的上下文维度。

预测模型如式(IV)、式(V)所示：

参数：预测评分全局平均分μ、用户偏置b_u、物品偏置b_u、上下文偏置b_k、特征矩阵维度D；u_ud、I_id、C_kd分别为用户、物品、上下文特征矩阵；I_uk代表用户u在上下文k下的历史评分集合，r_i代表用户u历史评分项目的特征矩阵；

目标损失函数如式(VI)所示：

参数：正则化参数λ、用户u在上下文k下对物品i的真实评分r_uik，预测评分全局平均分u、用户偏置b_u、物品偏置b_i、上下文偏置b_k、特征矩阵维度D。u、I_i、C_k分别为用户、物品、上下文特征矩阵。I_uk代表用户u在上下文k下的历史评分集合，

算法输出：犯人对所有资源的预测评分，Top-N推荐列表即适合服刑人员的矫正资源列表。

本发明的有益效果为：

本发明构建结构化和标准化的知识库，构建各类服刑人员矫正需求的备选指标体系，开发个性化矫正策略，并收集大量矫正案例建立知识库。对新入刑的服刑人员进行心理测量，知识库根据测量数据与知识库中已有的案例和资料进行匹配，为新入刑的服刑人员生成矫正策略和矫正方案，接着根据矫正方案初步推荐犯人必需的资源，并在得到的资源中，根据犯人的基本属性信息、行为数据个性化推荐矫正资源。通过矫正方案和矫正资源的配合实施，加强和提升服刑人员的教育改造效果，对于提高服刑人员出狱后的社会融入能力，降低其重新犯罪风险，推动社会和谐发展具有重要意义。

附图说明

图1为本发明面向服刑人员的个性化改造矫正策略推荐系统的结构框图；

图2为知识库的结构框图；

图3为推荐模块的结构框图；

图4为基于语义的文本分类方法的文本相似度处理流程示意图；

图5为评分矩阵分解过程示意图。

具体实施方式

下面结合说明书附图和实施例对本发明作进一步限定，但不限于此。

实施例1

一种面向服刑人员的个性化改造矫正策略推荐系统，如图1所示，包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端；

犯人心理数据采集模块连接知识库，知识库分别连接推荐模块、干警平板终端，犯人行为数据采集模块连接推荐模块，推荐模块连接犯人平板终端；

犯人心理数据采集模块用于测量服刑人员的心理数据，服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员，并将测量的心理数据发送至知识库；

知识库包括心理学模型总结整理的大量专家案例数据，专家案例数据包括心理学测量数据、矫正策略和矫正方案；知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据，为服刑人员生成对应的矫正方案和矫正策略，并把服刑人员基本信息及对应的矫正策略与矫正方案发送给推荐模块，同时将矫正方案发送给干警平板终端；

犯人行为数据采集模块用于获取服刑人员的行为数据；

推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案，以及监狱拥有的各种矫正资源(心理学资源、视频、音频、读物、游戏等)对相应的服刑人员提供针对性的个性化矫正资源推荐，针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源，并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到干警平板终端，干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的犯人平板终端上；

干警平板终端用于实时获取新入刑的服刑人员的基本资料，新入刑的服刑人员的基本资料包括年龄、性别、所犯罪名及对应刑期，接收服刑人员的6维犯罪成因，接收知识库发送的服刑人员对应的矫正方案和矫正策略，以及接收推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源；

犯人平板终端用于记录新入刑的服刑人员的基本资料，接收知识库发送的服刑人员对应的矫正方案和矫正策略，接收推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源。

实施例2

根据实施例1所述的一种面向服刑人员的个性化改造矫正策略推荐系统，其区别在于：

推荐模块还包括数据分析模块、矫正资源推荐模块，

数据分析模块得到知识库发送来的服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案，通过数据预处理后根据这些内容使用推荐系统研究领域的模型(初步使用biasSVD算法，后续使用基于回归树上下文特征自动编码的偏置张量分解算法，模型的具体算法不做限制，可以根据监狱内实际数据规模进行更改)进行处理；

矫正资源推荐模块用于根据数据分析模块对服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案处理后得到的信息，结合监狱内现有的各种矫正资源(视频资源、图书资源、音频资源)为对应犯人提供矫正资源的个性化推荐。

干警平板终端及犯人平板终端均为平板电脑。

实施例3

实施例1或2所述的一种面向服刑人员的个性化改造矫正策略推荐系统的运行方法，包括步骤如下：

(1)在大数据平台上搭建知识库

心理学测量数据就是指犯人回答的问卷答案；

七种人格标签对应七种矫正策略，如表1所示：

表1

标签/关键词	矫正策略
		人格障碍	以人格价值观培养为目标的矫正策略
精神病态	以精神生理干预为核心的矫正策略
		冲动	以情绪管理为主题的矫正策略
人际反应	以培养共情心为核心的矫正策略
		道德推脱	以道德修养教育为核心的矫正策略
童年不幸	以亲情召唤，社会支持为核心的矫正策略
		认知缺陷	以认知行为治疗为核心的矫正策略

矫正策略就是指“名字”，例如，“以人格价值观培养为目标的矫正策略”就是一个矫正策略，矫正方案指的是具体实施的活动内容；

假定，某犯人的矫正策略为“以亲情召唤，社会支持为核心的矫正策略”，则对应的矫正方案概要如表2所示：

表2

(2)测量服刑人员的心理数据

犯人心理数据采集模块测量服刑人员的心理数据，通过设置问卷问题让犯人回答，根据犯人的回答情况总结6维犯罪成因，心理数据包括6维犯罪成因，6维犯罪成因包括：技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因；服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员，并将测量的心理数据发送至所述知识库；

(3)知识库为服刑人员生成对应的矫正方案和矫正策略

知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据，为服刑人员生成对应的矫正方案和矫正策略，并把服刑人员基本信息及对应的矫正策略与矫正方案发送给推荐模块，同时将矫正方案发送给干警平板终端；服刑人员基本信息包括服刑人员编号、性别、年龄、罪名、籍贯、文化水平；

(4)推荐模块进行推荐

推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案，以及监狱拥有的各种矫正资源，各种矫正资源包括视频资源、图书资源与音乐资源；对相应的服刑人员提供针对性的个性化矫正资源推荐，针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源，如果监狱里没有该矫正方案中提到的资源，则推荐模块会推荐与该资源最相似的资源给犯人，并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到干警平板终端，所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的犯人平板终端上；

(5)测量服刑人员的行为数据

犯人行为数据采集模块测量服刑人员的行为数据。行为数据是指犯人在服刑过程中使用矫正资源的过程记录，包括犯人观看视频、听音频、进行游戏的时间点、时间长度以及活动的其他参与人员名单，其他的行为数据可以根据现实情况进行调整。

步骤(1)，在大数据平台上搭建知识库，如图2所示，包括步骤如下：

步骤B中，对步骤A搜集到的原始数据进行文本数据分析，对对应的服刑人员类型打标签，构建犯因关键词库，利用BERT(Bidirectional Encoder Representations fromTransformers)引入大量的外部语义知识，将罪犯的文本描述向量化，计算文本向量的相似度进而实现文本的分类。构建关键词库，利用关键词进行匹配，进而实现罪犯的分类，给不同类型的罪犯打上不同的关键词/标签。包括步骤如下：

设定x_i表示第i篇待分类的文本，1≤i≤|X|，|X|表示文本数据集X中的文本篇数；|X|篇文本构成词库集W＝{w₁，w₂…w_|W|}，w_j表示第j个词语，|W|表示词库集W中的词语个数；如图4所示。

S1：利用神经网络模型BERT构造词间相似度矩阵S_|W|×|W|；

利用余弦函数计算词间相似度，如式(I)所示：

式(I)中，j′≠j^*，分别代表第j′个词语和第j^*个词语；

用所有词间相似度构造出词间相似度矩阵S_|W|×|W|；

S3：计算矩阵如式(II)所示：

S5：分析文本数据，制定6种犯罪成因的标签，并制定对应的关键词库。如表3所示：

表3

步骤(3)，知识库为服刑人员生成对应的矫正方案和矫正策略，包括步骤如下：

步骤(4)，推荐模块进行推荐，如图3所示，包括步骤如下：

步骤H中，推过基于模型的协同过滤算法的处理后，得到适合服刑人员的矫正资源列表，包括步骤如下：

矩阵分解：将评分矩阵分解为用户特征矩阵和物品特征矩阵，评分矩阵包括用户编号、物品编号及用户对该物品的评分；如图5所示，第一列为用户编号，第一行为物品编号，矩阵中的数字为用户对该物品的评分，通过用户特征矩阵和物品特征矩阵的乘积拟合评分矩阵；用户特征矩阵是指用户的兴趣，物品特征矩阵是指物品的特点，且每一个维度相互对应，用户特征矩阵和物品特征矩阵的乘积表示用户对该物品的喜好程度；使用biasSVD算法；

预测模型如下所示：

目标损失函数如下所示：

上下文自编码：

预测模型如式(IV)、式(V)所示：

目标损失函数如式(VI)所示：

实施例4

根据实施例3所述的一种面向服刑人员的个性化改造矫正策略推荐系统的运行方法，其区别在于：本实施例通过下面的具体例子来说明整个系统的运行过程，包括步骤如下：

(1)假设新入监的犯人为刘某，对刘某进行了心理状态测量，并将心理数据进行了提交。

(2)将心理数据输入到知识库的，触发知识库为刘某生成矫正策略和矫正方案，假定刘某的矫正策略为“以亲情召唤，社会支持为核心的矫正策略”，则对应的矫正方案概要如表2所示；

(3)为该服刑人员推荐个性化的矫正资源，如表4所示：

表4

/>

Claims

1.一种面向服刑人员的个性化改造矫正策略推荐系统，其特征在于，包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端；

所述推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案，以及监狱拥有的各种矫正资源对相应的服刑人员提供针对性的个性化矫正资源推荐，针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源，并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到所述干警平板终端，所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的所述犯人平板终端上；

所述犯人行为数据采集模块用于获取服刑人员的行为数据；

所述干警平板终端用于实时获取新入刑的服刑人员的基本资料，新入刑的服刑人员的基本资料包括年龄、性别、所犯罪名及对应刑期，接收服刑人员的6维犯罪成因，接收所述知识库发送的服刑人员对应的矫正方案和矫正策略，以及接收所述推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源；6维犯罪成因包括：技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因；

2.根据权利要求1所述的一种面向服刑人员的个性化改造矫正策略推荐系统，其特征在于，所述推荐模块还包括数据分析模块、矫正资源推荐模块；

所述数据分析模块得到知识库发送来的服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案，通过数据预处理后根据这些内容使用推荐系统研究领域的模型进行处理；

所述矫正资源推荐模块用于根据数据分析模块对服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案处理后得到的信息，结合监狱内现有的各种矫正资源为对应犯人提供矫正资源的个性化推荐。

3.根据权利要求1所述的一种面向服刑人员的个性化改造矫正策略推荐系统，其特征在于，所述干警平板终端及所述犯人平板终端均为平板电脑。

4.权利要求1-3任一所述面向服刑人员的个性化改造矫正策略推荐系统的运行方法，其特征在于，包括步骤如下：

(1)在大数据平台上搭建知识库

(2)测量服刑人员的心理数据

所述犯人心理数据采集模块测量服刑人员的心理数据，通过设置问卷问题让犯人回答，根据犯人的回答情况总结6维犯罪成因，心理数据包括6维犯罪成因；服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员，并将测量的心理数据发送至所述知识库；

(3)知识库为服刑人员生成对应的矫正方案和矫正策略

(4)推荐模块进行推荐

(5)测量服刑人员的行为数据

所述犯人行为数据采集模块测量服刑人员的行为数据。

5.根据权利要求4所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法，其特征在于，所述步骤(1)，在大数据平台上搭建知识库，包括步骤如下：

在监狱内向犯人发放问卷采集服刑人员的心理数据；

B、原始数据处理；对步骤A搜集到的原始数据进行文本数据分析，对对应的犯人类型打标签，构建犯因关键词库，标签反映罪犯的犯罪成因，不同的标签均对应不同的矫正策略，根据矫正策略制定详细的矫正方案，矫正策略与矫正方案一一对应，得到专家案例数据。

6.根据权利要求5所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法，其特征在于，所述步骤B中，对步骤A搜集到的原始数据进行文本数据分析，对对应的服刑人员类型打标签，构建犯因关键词库，包括步骤如下：

设定x_i表示第i篇待分类的文本，1≤i≤|X|，|X|表示文本数据集X中的文本篇数；|X|篇文本构成词库集W＝{w₁,w₂...w_|W|}，w_j表示第j个词语，|W|表示词库集W中的词语个数；

S1：利用神经网络模型BERT构造词间相似度矩阵S_|W|×|W|；

利用余弦函数计算词间相似度，如式(I)所示：

式(I)中，j'≠j^*，分别代表第j'个词语和第j^*个词语；

用所有词间相似度构造出词间相似度矩阵S_|W|×|W|；

S2：对词间相似度矩阵S_|W|×|W|进行截断奇异值分解，分解为Σ为低秩矩阵，/>为转移矩阵，U是矩阵论中对一个矩阵进行奇异值分解后得到的酉矩阵，k<<|W|；

S3：计算矩阵如式(II)所示：

7.根据权利要求4所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法，其特征在于，所述步骤(3)，知识库为服刑人员生成对应的矫正方案和矫正策略，包括步骤如下：

②计算每个犯人关键词/标签重要程度：对这七个维度的得分x₁，x₂，x₃，x₄，x₅，x₆，x₇进行变换，如式(Ⅲ)所示：

式(Ⅲ)中，min_1≤j≤7x_j是指x₁，x₂，x₃，x₄，x₅，x₆，x₇中的最小值，max_{1＜＜j＜＜7}x_j是指x₁，x₂，x₃，x₄，x₅，x₆，x₇中的最大值，y_i是指变换后的值，变换后的值y_i越高，则对应关键词/标签越重要，取最高得分的一项作为关键词/标签；

8.根据权利要求4所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法，其特征在于，所述步骤(4)，推荐模块进行推荐，包括步骤如下：

F、推荐模块接收到服刑人员基本信息及对应的矫正策略与矫正方案，以及终端服刑人员的平板终端送来的服刑人员的交互信息及矫正资源信息进行整合；服刑人员的交互信息包括服刑人员ID、资源ID、资源观看时长或评分，服刑人员ID为服刑人员在监狱内的犯人编号，资源ID为监狱内图书资源、视频资源、音乐资源在监狱内制定的编号，资源观看时长为服刑人员使用每一种资源所花费的时间长度，评分为各种资源的评分；矫正资源信息包括资源ID、名称、类别，视频需提供总时长，名称为每一项资源原有的名字，类别为每一个资源按照内容所分出的类别，视频需提供总时长为每份视频的时间长度；

9.根据权利要求8所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法，其特征在于，所述步骤H中，推过基于模型的协同过滤算法的处理后，得到适合服刑人员的矫正资源列表，包括步骤如下：

预测模型如式(Ⅳ)、式(Ⅴ)所示：

参数：预测评分全局平均分μ、用户偏置b_u、物品偏置b_i、上下文偏置b_k、特征矩阵维度D；u_ud、I_id、0_kd分别为用户、物品、上下文特征矩阵；I_uk代表用户u在上下文k下的历史评分集合，r_i代表用户u历史评分项目的特征矩阵；

目标损失函数如式(Ⅵ)所示：

参数：正则化参数λ、用户u在上下文k下对物品i的真实评分r_uik，预测评分全局平均分u、用户偏置b_u、物品偏置b_i、上下文偏置b_k、特征矩阵维度D；u、I_i、C_k分别为用户、物品、上下文特征矩阵；I_uk代表用户u在上下文k下的历史评分集合；