CN111125525B - 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法 - Google Patents

一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法 Download PDF

Info

Publication number
CN111125525B
CN111125525B CN201911344189.5A CN201911344189A CN111125525B CN 111125525 B CN111125525 B CN 111125525B CN 201911344189 A CN201911344189 A CN 201911344189A CN 111125525 B CN111125525 B CN 111125525B
Authority
CN
China
Prior art keywords
correction
prisoner
data
prisoners
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911344189.5A
Other languages
English (en)
Other versions
CN111125525A (zh
Inventor
李玉军
马宝森
刘治
贲晛烨
朱孔凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201911344189.5A priority Critical patent/CN111125525B/zh
Publication of CN111125525A publication Critical patent/CN111125525A/zh
Application granted granted Critical
Publication of CN111125525B publication Critical patent/CN111125525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明涉及一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法,包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端;犯人心理数据采集模块用于测量服刑人员的心理数据;知识库包括心理学模型总结整理的大量专家案例数据,知识库为服刑人员生成对应的矫正方案和矫正策略;推荐模块对相应的服刑人员提供针对性的个性化矫正资源推荐;整个过程中,将完整的矫正方案、实施步骤以及对应的矫正资源列表发送到监狱干警的干警平板终端,只将对应的矫正资源及使用提示发送到服刑人员的犯人平板终端设备中,确保监狱干警对服刑人员整个矫正过程及时跟踪与指导。

Description

一种面向服刑人员的个性化改造矫正策略推荐系统及其运行 方法
技术领域
本发明涉及一种通过大数据和人工智能分析技术,根据服刑人员的个体特点,建立个性化的改造矫正策略并进行精准推荐的方法,并基于此方法设计了服刑人员个性化改造策略推荐系统,属于司法改造矫正技术领域。
背景技术
监狱服刑人员是一个特殊的社会群体,加强和提升服刑人员的教育改造效果,对于提高服刑人员出狱后的社会融入能力、降低其重新犯罪风险、推动社会和谐发展具有重要意义。
目前,传统的罪犯矫正策略和已有改造措施,由于缺乏科学的改造矫正策略模型,以及先进的技术手段,导致矫正对象分类不清,矫正策略不足。同时由于没有对服刑人员进行科学分类并实施个性化矫正,矫正效果不尽人意。因此,如何构建科学的矫正策略模型,根据不同服刑人员的特点,制定个性化改造方案并实现改造矫正策略的精准推荐是监狱面临的一个重要挑战。
发明内容
针对现有技术的不足,本发明提供了一种面向服刑人员的个性化改造矫正策略推荐系统,该推荐系统包含知识库模块、推荐系统模块、终端模块。通过监狱干警与服刑人员各自终端设备与推荐系统进行数据交互以及推荐资源与推荐方案的推送。
本发明还提供了上述面向服刑人员的个性化改造矫正策略推荐系统的运行方法。
术语解释:
1、大数据平台:以存储、运算、展现作为目的的平台。集合了知识库和推荐系统模块,该平台集数据接入、数据处理、数据存储、查询检索、分析挖掘等、应用接口等为一体。
2、知识库:由心理学专家根据心理学测量数据、矫正策略和矫正方案案例数据构建而成,心理学数据的来源包括已有犯人的心理数据汇总和外部网站的数据收集,包含罪犯文本信息、矫正策略与矫正方案,数据库是以一定方式储存在一起、能与多个用户共享,用户可以对文件中的数据进行新增、查询、更新、删除等操作。
3、推荐系统:基于监狱服刑人员的量表数据和个体文本信息以及知识库中包含的矫正资源、矫正方案,对服刑人员的矫正资源矫正方案进行个性化推荐的模块。
4、终端:终端模块是用于收集新入刑人员心理测量数据的设备,设备收集的新入刑人员心理测量数据送入大数据平台并把大数据平台内的知识库、推荐系统生成的矫正方案、矫正资源提供给对应的狱警和入刑人员。
5、BERT:全称为“Bidirectional Encoder Representations fromTransformers”,基于Transformer的将罪犯的文本描述向量化的双向编码器表征,其中“双向”表示模型在处理某一个词时,它能同时利用前面的词和后面的词两部分信息。
6、监狱犯人量表,通过收集问卷,采集犯人心理不同方面,包括技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因这6维犯罪成因,主要为数值数据。
7、神经网络模型,BERT,是一个语言表征模型(1anguage representationmodel),通过超大数据、巨大模型、和极大的计算开销训练而成,在11个自然语言处理的任务中取得了最优(state-of-the-art,SOTA)结果。它代表Transformer的双向编码器表示,BERT旨在通过联合调节所有层中的上下文来预先训练深度双向表示。预训练的BERT表示可以通过一个额外的输出层进行微调,适用于广泛任务的最先进模型的构建。
本发明的技术方案为:
一种面向服刑人员的个性化改造矫正策略推荐系统,包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端;
所述犯人心理数据采集模块连接所述知识库,所述知识库分别连接所述推荐模块、干警平板终端,所述犯人行为数据采集模块连接所述推荐模块,所述推荐模块连接所述犯人平板终端;
所述犯人心理数据采集模块用于测量服刑人员的心理数据,服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员,并将测量的心理数据发送至所述知识库;
所述知识库包括心理学模型总结整理的大量专家案例数据,专家案例数据包括心理学测量数据、矫正策略和矫正方案;所述知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据,为服刑人员生成对应的矫正方案和矫正策略,并把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块,同时将矫正方案发送给所述干警平板终端;
所述犯人行为数据采集模块用于获取服刑人员的行为数据;
所述推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案,以及监狱拥有的各种矫正资源(心理学资源、视频、音频、读物、游戏等)对相应的服刑人员提供针对性的个性化矫正资源推荐,针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源,并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到所述干警平板终端,所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的所述犯人平板终端上;
整个过程中,将完整的矫正方案、实施步骤以及对应的矫正资源列表发送到监狱干警的干警平板终端,只将对应的矫正资源及使用提示发送到服刑人员的犯人平板终端设备中,确保监狱干警对服刑人员整个矫正过程及时跟踪与指导。
所述干警平板终端用于实时获取新入刑的服刑人员的基本资料,新入刑的服刑人员的基本资料包括年龄、性别、所犯罪名及对应刑期,接收服刑人员的6维犯罪成因,接收所述知识库发送的服刑人员对应的矫正方案和矫正策略,以及接收所述推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源;
所述犯人平板终端用于记录新入刑的服刑人员的基本资料,接收所述知识库发送的服刑人员对应的矫正方案和矫正策略,接收所述推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源。
根据本发明优选的,所述推荐模块还包括数据分析模块、矫正资源推荐模块,
所述数据分析模块得到知识库发送来的服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案,通过数据预处理后根据这些内容使用推荐系统研究领域的模型(初步使用biasSVD算法,后续使用基于回归树上下文特征自动编码的偏置张量分解算法,模型的具体算法不做限制,可以根据监狱内实际数据规模进行更改)进行处理;
所述矫正资源推荐模块用于根据数据分析模块对服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案处理后得到的信息,结合监狱内现有的各种矫正资源(视频资源、图书资源、音频资源)为对应犯人提供矫正资源的个性化推荐。
根据本发明优选的,所述干警平板终端及所述犯人平板终端均为平板电脑。
上述面向服刑人员的个性化改造矫正策略推荐系统的运行方法,包括步骤如下:
(1)在大数据平台上搭建知识库
把心理学专家总结整理的大量专家案例数据整合到知识库,专家案例数据包括心理学测量数据、矫正策略和矫正方案,完成大数据平台上知识库的搭建;
(2)测量服刑人员的心理数据
所述犯人心理数据采集模块测量服刑人员的心理数据,通过设置问卷问题让犯人回答,根据犯人的回答情况总结6维犯罪成因,心理数据包括6维犯罪成因,6维犯罪成因包括:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因;服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员,并将测量的心理数据发送至所述知识库;
(3)知识库为服刑人员生成对应的矫正方案和矫正策略
所述知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据,为服刑人员生成对应的矫正方案和矫正策略,并把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块,同时将矫正方案发送给所述干警平板终端;服刑人员基本信息包括服刑人员编号、性别、年龄、罪名、籍贯、文化水平;
(4)推荐模块进行推荐
推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案,以及监狱拥有的各种矫正资源,各种矫正资源包括视频资源、图书资源与音乐资源;对相应的服刑人员提供针对性的个性化矫正资源推荐,针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源,如果监狱里没有该矫正方案中提到的资源,则推荐模块会推荐与该资源最相似的资源给犯人,并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到所述干警平板终端,所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的所述犯人平板终端上;
(5)测量服刑人员的行为数据
所述犯人行为数据采集模块测量服刑人员的行为数据。行为数据是指犯人在服刑过程中使用矫正资源的过程记录,包括犯人观看视频、听音频、进行游戏的时间点、时间长度以及活动的其他参与人员名单,其他的行为数据可以根据现实情况进行调整。
本发明针对监狱服刑人员的性格差异,采用知识库与推荐模块相结合的策略,通过构建结构化和标准化案例知识库,构建各类服刑人员矫正需求的备选指标体系,开发个性化矫正策略;同时本发明通过构建推荐模块,根据矫正方案初步推荐犯人必需的资源,再根据犯人的基本属性信息、行为数据个性化推荐矫正资源。本发明优化了监狱服刑人员矫正资源与矫正方案的个性化推荐流程。
根据本发明优选的,所述步骤(1),在大数据平台上搭建知识库,包括步骤如下:
A、原始数据搜集;原始数据通过监狱犯人量表和中国法律服务网爬虫获取;
在监狱内向犯人发放问卷采集服刑人员的心理数据;在心理学专家的指导下分析总结问卷中的问题得到量表数据,量表数据就是指存储心理数据的表格,各种因素的心理数据都以数值数据的形式呈现,分数的判定由心理学专家制定规则,每一个心理因素都设置多个问题,每一问题的不同选项对应不同的分数;具体打分规则可以根据实际情况做调整,如用百分制评分,某一因素的分数越高则这个因素对该犯人犯罪影响越大;
通过爬虫对中国法律服务网公开资料进行采集,并采用正则解析等技术收集犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告,进行下一步的分析和矫正;
B、原始数据处理;对通过网络爬虫和监狱实地问卷采集收取罪犯的文本信息,提取出犯人的基本信息以及心理状况等描述。在获得犯人的相关原始数据后,在专家帮助下,对步骤A搜集到的原始数据进行文本数据分析,对对应的犯人类型打标签,构建犯因关键词库,标签反映罪犯的犯罪成因,不同的标签均对应不同的矫正策略,根据矫正策略制定详细的矫正方案,矫正策略与矫正方案一一对应,得到专家案例数据。
(1)假设新入监的犯人为刘某,刘某通过平板问卷进行了心理状态测量,并将测量结果进行了提交;
(2)犯人在平板上的心理测评提交操作,将首先触发测评数据输入到知识库的操作,知识库根据送来的数据进行分正则匹配、文本分析进行关键词匹配,计算文本匹配的关键词数目,生成本案例犯因标签(共有6种犯因标签:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因)然后触发知识库系统为刘某生成矫正策略和矫正方案,假定刘某的矫正策略为“以亲情召唤,社会支持为核心的矫正策略”,则对应的矫正方案概要如表2所示。
知识库的关键技术包含数据库的设计、文本数据的生成、矫正策略和矫正方案的生成。通过监狱问卷调查获取的量表数据存储在构建的数据表1中,通过爬虫获取的文本数据存储在数据表2中;文本数据的生成主要采用基于语义的文本分类处理和利用关键词匹配的关键词库。知识库根据新入库的服刑人员心理测量数据和专家输入案例的心理测量数据,为新入库的服刑人员生成矫正策略。
根据本发明优选的,所述步骤B中,对步骤A搜集到的原始数据进行文本数据分析,对对应的服刑人员类型打标签,构建犯因关键词库,利用BERT(Bidirectional EncoderRepresentations from Transformers)引入大量的外部语义知识,将罪犯的文本描述向量化,计算文本向量的相似度进而实现文本的分类。构建关键词库,利用关键词进行匹配,进而实现罪犯的分类,给不同类型的罪犯打上不同的关键词/标签。包括步骤如下:
a、通过分析服刑人员的心理数据,制定6维犯罪成因;6维犯罪成因包括:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因;
b、每种犯罪成因选取典型案例,接着采用爬虫获取的本数据集X进行文本相似度匹配,根据相似度的数值打标签;爬虫获取的本数据集X即犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告;
设定xi表示第i篇待分类的文本,1≤i≤|X|,|X|表示文本数据集X中的文本篇数;|X|篇文本构成词库集W={w1,w2…w|W|},wj表示第j个词语,|W|表示词库集W中的词语个数;
S1:利用神经网络模型BERT构造词间相似度矩阵S|W|×|W|
将每个词语输至入神经网络模型BERT,获得每个词语的向量表示,第j个词语的向量表示为
利用余弦函数计算词间相似度,如式(I)所示:
式(I)中,j′≠j*,分别代表第j′个词语和第j*个词语;
用所有词间相似度构造出词间相似度矩阵S|W|×|W|
S2:对词间相似度矩阵S|W|×|W|进行截断奇异值分解,分解为∑为低秩矩阵,/>为转移矩阵,U是矩阵论中对一个矩阵进行奇异值分解后得到的酉矩阵,k<<|W|;
S3:计算矩阵如式(II)所示:
式(II)中,是X行低维文本向量构成的矩阵,矩阵/>的每行表示一个文本低维向量;利用余弦函数计算得到文本的相似度,根据相似度的值实现文本的分类;
S4:对采用爬虫获取的本数据集X进行正则匹配,获取到服刑人员基本信息以及描述心理的文本描述,描述心理的文本描述就是通过正则匹配的方式,获取文本中服刑人员心里描述的相关文本描述的文字内容;
S5:分析文本数据,制定6种犯罪成因的标签,并制定对应的关键词库。
为了提高准确率,通过分析罪犯的文本数据,制定6种主要的犯罪成因。同时构建关键词库,对描述罪犯的文本数据进行关键词的匹配,进而获得罪犯的主要犯因。
根据本发明优选的,所述步骤(3),知识库为服刑人员生成对应的矫正方案和矫正策略,包括步骤如下:
C、对服刑人员的心理数据进行数据分析,生成关键词/标签;
取所有的问卷数据,包括每个问卷题目的得分,计算反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷七个维度的总得分;
判断是否打对应的七种关键词/标签:七种关键词/标签包括反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷;根据问卷回答的问题对这七个维度打分,并对每一个维度的分数设置一个阈值,若某一维度的得分大于设置的该阈值,则存在此关键词/标签,可以所有维度设置相同阈值,也可以不同维度设置不同阈值,具体阈值规则的制定在专家指导下根据当地监狱犯人的实际情况进行设置;对得分数据进行标准化处理,计算每个犯人的关键词/标签重要程度;
①标准化处理:将数据按比例缩放,使之落入一个特定区间;在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权;
②计算每个犯人关键词/标签重要程度:对这七个维度的得分x1,x2,x3,x4,x5,x6,x7进行变换,如式(III)所示:
式(III)中,min1≤j≤7xj是指x1,x2,x3,x4,x5,x6,x7中的最小值,max1<<j<<7 xj是指x1,x2,x3,x4,x5,x6,x7中的最大值,yi是指变换后的值,变换后的值yi越高,则对应关键词/标签越重要,取最高得分的一项作为关键词/标签;
D、将步骤C生成的关键词与生成的犯因关键词库进行关键词匹配,分析得到服刑人员犯罪成因,并针对其犯罪成因生成对应的矫正策略,知识库根据矫正策略生成对应矫正方案;
E、知识库把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块,同时将矫正方案发送给所述干警平板终端。
根据本发明优选的,所述步骤(4),推荐模块进行推荐,包括步骤如下:
F、推荐模块接收到服刑人员基本信息及对应的矫正策略与矫正方案,以及终端服刑人员的平板终端送来的服刑人员的交互信息及矫正资源信息进行整合;服刑人员的交互信息包括服刑人员ID、资源ID、资源观看时长或评分,服刑人员ID为服刑人员在监狱内的犯人编号,资源ID为监狱内图书资源、视频资源、音乐资源在监狱内制定的编号,资源观看时长为服刑人员使用每一种资源所花费的时间长度,评分为各种资源的评分(选取这些资源在豆瓣网站的评分);矫正资源信息包括资源ID、名称、类别,视频需提供总时长,名称为每一项资源原有的名字,类别为每一个资源按照内容所分出的类别,视频需提供总时长为每份视频的时间长度;
G、数据分析模块处理服刑人员基本信息及对应的矫正策略与矫正方案,以及服刑人员的交互信息及矫正资源信息,得到服刑人员交互行为分析和民警矫正方案干预;
H、步骤G得到的服刑人员交互行为分析和民警矫正方案干预通过数据接口传送到干警平板终端,同时将步骤G得到的服刑人员交互行为分析和民警矫正方案干预发送到推荐模块内的矫正资源推荐模块,经过矫正资源推荐模块处理后得到服刑人员的矫正资源列表,通过数据接口传送到犯人平板终端。
进一步优选的,所述步骤H中,推过基于模型的协同过滤算法的处理后,得到适合服刑人员的矫正资源列表,包括步骤如下:
矩阵分解:将评分矩阵分解为用户特征矩阵和物品特征矩阵,评分矩阵包括用户编号、物品编号及用户对该物品的评分;通过用户特征矩阵和物品特征矩阵的乘积拟合评分矩阵;用户特征矩阵是指用户的兴趣,物品特征矩阵是指物品的特点,且每一个维度相互对应,用户特征矩阵和物品特征矩阵的乘积表示用户对该物品的喜好程度;使用biasSVD算法;
预测模型如下所示:
是指预测评分,μ是指全局平均分,bu是指用户偏置,bi是指物品偏置,K是指特征矩阵维度,Pud是指用户特征矩阵,Qid是指物品特征矩阵;
目标损失函数如下所示:
λ是指正则化参数,用户u对物品i的真实评分rui是指预测评分,Pu是指目标用户特征矩阵,Qi是指目标物品特征矩阵,L是指犯人对所有资源的预测评分,即Top-N推荐列表;
在推荐模型中加入一些上下文信息(例如心情、时间地点等)被认为对提高推荐精度是有效的。此外,一个用户以往的所有行为信息也反映着用户的潜在偏好,在用户当前行为信息不充足的情况下,在模型中融入用户的历史行为记录(即隐式反馈),也能够有效地提升推荐系统的推荐效果。
上下文自编码:
张量中上下文维度D是系统中所有上下文特征取值的笛卡尔积。这使得D随上下文特征的个数以指数的形式增长。使用基于回归树的上下文特征编码机制,不仅可以有效地控制上下文维度,还能提高算法的精度。考虑到每个训练样本经过张量分解对应上下文空间的一个向量,使用单棵决策树进行编码,通过控制回归树的深度可以有效控制编码后的上下文维度。
预测模型如式(IV)、式(V)所示:
参数:预测评分全局平均分μ、用户偏置bu、物品偏置bu、上下文偏置bk、特征矩阵维度D;uud、Iid、Ckd分别为用户、物品、上下文特征矩阵;Iuk代表用户u在上下文k下的历史评分集合,ri代表用户u历史评分项目的特征矩阵;
目标损失函数如式(VI)所示:
参数:正则化参数λ、用户u在上下文k下对物品i的真实评分ruik,预测评分全局平均分u、用户偏置bu、物品偏置bi、上下文偏置bk、特征矩阵维度D。u、Ii、Ck分别为用户、物品、上下文特征矩阵。Iuk代表用户u在上下文k下的历史评分集合,
算法输出:犯人对所有资源的预测评分,Top-N推荐列表即适合服刑人员的矫正资源列表。
本发明的有益效果为:
本发明构建结构化和标准化的知识库,构建各类服刑人员矫正需求的备选指标体系,开发个性化矫正策略,并收集大量矫正案例建立知识库。对新入刑的服刑人员进行心理测量,知识库根据测量数据与知识库中已有的案例和资料进行匹配,为新入刑的服刑人员生成矫正策略和矫正方案,接着根据矫正方案初步推荐犯人必需的资源,并在得到的资源中,根据犯人的基本属性信息、行为数据个性化推荐矫正资源。通过矫正方案和矫正资源的配合实施,加强和提升服刑人员的教育改造效果,对于提高服刑人员出狱后的社会融入能力,降低其重新犯罪风险,推动社会和谐发展具有重要意义。
附图说明
图1为本发明面向服刑人员的个性化改造矫正策略推荐系统的结构框图;
图2为知识库的结构框图;
图3为推荐模块的结构框图;
图4为基于语义的文本分类方法的文本相似度处理流程示意图;
图5为评分矩阵分解过程示意图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
实施例1
一种面向服刑人员的个性化改造矫正策略推荐系统,如图1所示,包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端;
犯人心理数据采集模块连接知识库,知识库分别连接推荐模块、干警平板终端,犯人行为数据采集模块连接推荐模块,推荐模块连接犯人平板终端;
犯人心理数据采集模块用于测量服刑人员的心理数据,服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员,并将测量的心理数据发送至知识库;
知识库包括心理学模型总结整理的大量专家案例数据,专家案例数据包括心理学测量数据、矫正策略和矫正方案;知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据,为服刑人员生成对应的矫正方案和矫正策略,并把服刑人员基本信息及对应的矫正策略与矫正方案发送给推荐模块,同时将矫正方案发送给干警平板终端;
犯人行为数据采集模块用于获取服刑人员的行为数据;
推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案,以及监狱拥有的各种矫正资源(心理学资源、视频、音频、读物、游戏等)对相应的服刑人员提供针对性的个性化矫正资源推荐,针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源,并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到干警平板终端,干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的犯人平板终端上;
整个过程中,将完整的矫正方案、实施步骤以及对应的矫正资源列表发送到监狱干警的干警平板终端,只将对应的矫正资源及使用提示发送到服刑人员的犯人平板终端设备中,确保监狱干警对服刑人员整个矫正过程及时跟踪与指导。
干警平板终端用于实时获取新入刑的服刑人员的基本资料,新入刑的服刑人员的基本资料包括年龄、性别、所犯罪名及对应刑期,接收服刑人员的6维犯罪成因,接收知识库发送的服刑人员对应的矫正方案和矫正策略,以及接收推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源;
犯人平板终端用于记录新入刑的服刑人员的基本资料,接收知识库发送的服刑人员对应的矫正方案和矫正策略,接收推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源。
实施例2
根据实施例1所述的一种面向服刑人员的个性化改造矫正策略推荐系统,其区别在于:
推荐模块还包括数据分析模块、矫正资源推荐模块,
数据分析模块得到知识库发送来的服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案,通过数据预处理后根据这些内容使用推荐系统研究领域的模型(初步使用biasSVD算法,后续使用基于回归树上下文特征自动编码的偏置张量分解算法,模型的具体算法不做限制,可以根据监狱内实际数据规模进行更改)进行处理;
矫正资源推荐模块用于根据数据分析模块对服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案处理后得到的信息,结合监狱内现有的各种矫正资源(视频资源、图书资源、音频资源)为对应犯人提供矫正资源的个性化推荐。
干警平板终端及犯人平板终端均为平板电脑。
实施例3
实施例1或2所述的一种面向服刑人员的个性化改造矫正策略推荐系统的运行方法,包括步骤如下:
(1)在大数据平台上搭建知识库
把心理学专家总结整理的大量专家案例数据整合到知识库,专家案例数据包括心理学测量数据、矫正策略和矫正方案,完成大数据平台上知识库的搭建;
心理学测量数据就是指犯人回答的问卷答案;
七种人格标签对应七种矫正策略,如表1所示:
表1
标签/关键词 矫正策略
人格障碍 以人格价值观培养为目标的矫正策略
精神病态 以精神生理干预为核心的矫正策略
冲动 以情绪管理为主题的矫正策略
人际反应 以培养共情心为核心的矫正策略
道德推脱 以道德修养教育为核心的矫正策略
童年不幸 以亲情召唤,社会支持为核心的矫正策略
认知缺陷 以认知行为治疗为核心的矫正策略
矫正策略就是指“名字”,例如,“以人格价值观培养为目标的矫正策略”就是一个矫正策略,矫正方案指的是具体实施的活动内容;
假定,某犯人的矫正策略为“以亲情召唤,社会支持为核心的矫正策略”,则对应的矫正方案概要如表2所示:
表2
(2)测量服刑人员的心理数据
犯人心理数据采集模块测量服刑人员的心理数据,通过设置问卷问题让犯人回答,根据犯人的回答情况总结6维犯罪成因,心理数据包括6维犯罪成因,6维犯罪成因包括:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因;服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员,并将测量的心理数据发送至所述知识库;
(3)知识库为服刑人员生成对应的矫正方案和矫正策略
知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据,为服刑人员生成对应的矫正方案和矫正策略,并把服刑人员基本信息及对应的矫正策略与矫正方案发送给推荐模块,同时将矫正方案发送给干警平板终端;服刑人员基本信息包括服刑人员编号、性别、年龄、罪名、籍贯、文化水平;
(4)推荐模块进行推荐
推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案,以及监狱拥有的各种矫正资源,各种矫正资源包括视频资源、图书资源与音乐资源;对相应的服刑人员提供针对性的个性化矫正资源推荐,针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源,如果监狱里没有该矫正方案中提到的资源,则推荐模块会推荐与该资源最相似的资源给犯人,并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到干警平板终端,所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的犯人平板终端上;
(5)测量服刑人员的行为数据
犯人行为数据采集模块测量服刑人员的行为数据。行为数据是指犯人在服刑过程中使用矫正资源的过程记录,包括犯人观看视频、听音频、进行游戏的时间点、时间长度以及活动的其他参与人员名单,其他的行为数据可以根据现实情况进行调整。
本发明针对监狱服刑人员的性格差异,采用知识库与推荐模块相结合的策略,通过构建结构化和标准化案例知识库,构建各类服刑人员矫正需求的备选指标体系,开发个性化矫正策略;同时本发明通过构建推荐模块,根据矫正方案初步推荐犯人必需的资源,再根据犯人的基本属性信息、行为数据个性化推荐矫正资源。本发明优化了监狱服刑人员矫正资源与矫正方案的个性化推荐流程。
步骤(1),在大数据平台上搭建知识库,如图2所示,包括步骤如下:
A、原始数据搜集;原始数据通过监狱犯人量表和中国法律服务网爬虫获取;
在监狱内向犯人发放问卷采集服刑人员的心理数据;在心理学专家的指导下分析总结问卷中的问题得到量表数据,量表数据就是指存储心理数据的表格,各种因素的心理数据都以数值数据的形式呈现,分数的判定由心理学专家制定规则,每一个心理因素都设置多个问题,每一问题的不同选项对应不同的分数;具体打分规则可以根据实际情况做调整,如用百分制评分,某一因素的分数越高则这个因素对该犯人犯罪影响越大;
通过爬虫对中国法律服务网公开资料进行采集,并采用正则解析等技术收集犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告,进行下一步的分析和矫正;
B、原始数据处理;对通过网络爬虫和监狱实地问卷采集收取罪犯的文本信息,提取出犯人的基本信息以及心理状况等描述。在获得犯人的相关原始数据后,在专家帮助下,对步骤A搜集到的原始数据进行文本数据分析,对对应的犯人类型打标签,构建犯因关键词库,标签反映罪犯的犯罪成因,不同的标签均对应不同的矫正策略,根据矫正策略制定详细的矫正方案,矫正策略与矫正方案一一对应,得到专家案例数据。
(1)假设新入监的犯人为刘某,刘某通过平板问卷进行了心理状态测量,并将测量结果进行了提交;
(2)犯人在平板上的心理测评提交操作,将首先触发测评数据输入到知识库的操作,知识库根据送来的数据进行分正则匹配、文本分析进行关键词匹配,计算文本匹配的关键词数目,生成本案例犯因标签(共有6种犯因标签:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因)然后触发知识库系统为刘某生成矫正策略和矫正方案,假定刘某的矫正策略为“以亲情召唤,社会支持为核心的矫正策略”,则对应的矫正方案概要如表2所示。
知识库的关键技术包含数据库的设计、文本数据的生成、矫正策略和矫正方案的生成。通过监狱问卷调查获取的量表数据存储在构建的数据表1中,通过爬虫获取的文本数据存储在数据表2中;文本数据的生成主要采用基于语义的文本分类处理和利用关键词匹配的关键词库。知识库根据新入库的服刑人员心理测量数据和专家输入案例的心理测量数据,为新入库的服刑人员生成矫正策略。
步骤B中,对步骤A搜集到的原始数据进行文本数据分析,对对应的服刑人员类型打标签,构建犯因关键词库,利用BERT(Bidirectional Encoder Representations fromTransformers)引入大量的外部语义知识,将罪犯的文本描述向量化,计算文本向量的相似度进而实现文本的分类。构建关键词库,利用关键词进行匹配,进而实现罪犯的分类,给不同类型的罪犯打上不同的关键词/标签。包括步骤如下:
a、通过分析服刑人员的心理数据,制定6维犯罪成因;6维犯罪成因包括:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因;
b、每种犯罪成因选取典型案例,接着采用爬虫获取的本数据集X进行文本相似度匹配,根据相似度的数值打标签;爬虫获取的本数据集X即犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告;
设定xi表示第i篇待分类的文本,1≤i≤|X|,|X|表示文本数据集X中的文本篇数;|X|篇文本构成词库集W={w1,w2…w|W|},wj表示第j个词语,|W|表示词库集W中的词语个数;如图4所示。
S1:利用神经网络模型BERT构造词间相似度矩阵S|W|×|W|
将每个词语输至入神经网络模型BERT,获得每个词语的向量表示,第j个词语的向量表示为
利用余弦函数计算词间相似度,如式(I)所示:
式(I)中,j′≠j*,分别代表第j′个词语和第j*个词语;
用所有词间相似度构造出词间相似度矩阵S|W|×|W|
S2:对词间相似度矩阵S|W|×|W|进行截断奇异值分解,分解为∑为低秩矩阵,/>为转移矩阵,U是矩阵论中对一个矩阵进行奇异值分解后得到的酉矩阵,k<<|W|;
S3:计算矩阵如式(II)所示:
式(II)中,是X行低维文本向量构成的矩阵,矩阵/>的每行表示一个文本低维向量;利用余弦函数计算得到文本的相似度,根据相似度的值实现文本的分类;
S4:对采用爬虫获取的本数据集X进行正则匹配,获取到服刑人员基本信息以及描述心理的文本描述,描述心理的文本描述就是通过正则匹配的方式,获取文本中服刑人员心里描述的相关文本描述的文字内容;
S5:分析文本数据,制定6种犯罪成因的标签,并制定对应的关键词库。如表3所示:
表3
为了提高准确率,通过分析罪犯的文本数据,制定6种主要的犯罪成因。同时构建关键词库,对描述罪犯的文本数据进行关键词的匹配,进而获得罪犯的主要犯因。
步骤(3),知识库为服刑人员生成对应的矫正方案和矫正策略,包括步骤如下:
C、对服刑人员的心理数据进行数据分析,生成关键词/标签;
取所有的问卷数据,包括每个问卷题目的得分,计算反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷七个维度的总得分;
判断是否打对应的七种关键词/标签:七种关键词/标签包括反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷;根据问卷回答的问题对这七个维度打分,并对每一个维度的分数设置一个阈值,若某一维度的得分大于设置的该阈值,则存在此关键词/标签,可以所有维度设置相同阈值,也可以不同维度设置不同阈值,具体阈值规则的制定在专家指导下根据当地监狱犯人的实际情况进行设置;对得分数据进行标准化处理,计算每个犯人的关键词/标签重要程度;
①标准化处理:将数据按比例缩放,使之落入一个特定区间;在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权;
②计算每个犯人关键词/标签重要程度:对这七个维度的得分x1,x2,x3,x4,x5,x6,x7进行变换,如式(III)所示:
式(III)中,min1≤j≤7xj是指x1,x2,x3,x4,x5,x6,x7中的最小值,max1<<j<<7 xj是指x1,x2,x3,x4,x5,x6,x7中的最大值,yi是指变换后的值,变换后的值yi越高,则对应关键词/标签越重要,取最高得分的一项作为关键词/标签;
D、将步骤C生成的关键词与生成的犯因关键词库进行关键词匹配,分析得到服刑人员犯罪成因,并针对其犯罪成因生成对应的矫正策略,知识库根据矫正策略生成对应矫正方案;
E、知识库把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块,同时将矫正方案发送给所述干警平板终端。
步骤(4),推荐模块进行推荐,如图3所示,包括步骤如下:
F、推荐模块接收到服刑人员基本信息及对应的矫正策略与矫正方案,以及终端服刑人员的平板终端送来的服刑人员的交互信息及矫正资源信息进行整合;服刑人员的交互信息包括服刑人员ID、资源ID、资源观看时长或评分,服刑人员ID为服刑人员在监狱内的犯人编号,资源ID为监狱内图书资源、视频资源、音乐资源在监狱内制定的编号,资源观看时长为服刑人员使用每一种资源所花费的时间长度,评分为各种资源的评分(选取这些资源在豆瓣网站的评分);矫正资源信息包括资源ID、名称、类别,视频需提供总时长,名称为每一项资源原有的名字,类别为每一个资源按照内容所分出的类别,视频需提供总时长为每份视频的时间长度;
G、数据分析模块处理服刑人员基本信息及对应的矫正策略与矫正方案,以及服刑人员的交互信息及矫正资源信息,得到服刑人员交互行为分析和民警矫正方案干预;
H、步骤G得到的服刑人员交互行为分析和民警矫正方案干预通过数据接口传送到干警平板终端,同时将步骤G得到的服刑人员交互行为分析和民警矫正方案干预发送到推荐模块内的矫正资源推荐模块,经过矫正资源推荐模块处理后得到服刑人员的矫正资源列表,通过数据接口传送到犯人平板终端。
步骤H中,推过基于模型的协同过滤算法的处理后,得到适合服刑人员的矫正资源列表,包括步骤如下:
矩阵分解:将评分矩阵分解为用户特征矩阵和物品特征矩阵,评分矩阵包括用户编号、物品编号及用户对该物品的评分;如图5所示,第一列为用户编号,第一行为物品编号,矩阵中的数字为用户对该物品的评分,通过用户特征矩阵和物品特征矩阵的乘积拟合评分矩阵;用户特征矩阵是指用户的兴趣,物品特征矩阵是指物品的特点,且每一个维度相互对应,用户特征矩阵和物品特征矩阵的乘积表示用户对该物品的喜好程度;使用biasSVD算法;
预测模型如下所示:
是指预测评分,μ是指全局平均分,bu是指用户偏置,bi是指物品偏置,K是指特征矩阵维度,Pud是指用户特征矩阵,Qid是指物品特征矩阵;
目标损失函数如下所示:
λ是指正则化参数,用户u对物品i的真实评分rui是指预测评分,Pu是指目标用户特征矩阵,Qi是指目标物品特征矩阵,L是指犯人对所有资源的预测评分,即Top-N推荐列表;
在推荐模型中加入一些上下文信息(例如心情、时间地点等)被认为对提高推荐精度是有效的。此外,一个用户以往的所有行为信息也反映着用户的潜在偏好,在用户当前行为信息不充足的情况下,在模型中融入用户的历史行为记录(即隐式反馈),也能够有效地提升推荐系统的推荐效果。
上下文自编码:
张量中上下文维度D是系统中所有上下文特征取值的笛卡尔积。这使得D随上下文特征的个数以指数的形式增长。使用基于回归树的上下文特征编码机制,不仅可以有效地控制上下文维度,还能提高算法的精度。考虑到每个训练样本经过张量分解对应上下文空间的一个向量,使用单棵决策树进行编码,通过控制回归树的深度可以有效控制编码后的上下文维度。
预测模型如式(IV)、式(V)所示:
参数:预测评分全局平均分μ、用户偏置bu、物品偏置bu、上下文偏置bk、特征矩阵维度D;uud、Iid、Ckd分别为用户、物品、上下文特征矩阵;Iuk代表用户u在上下文k下的历史评分集合,ri代表用户u历史评分项目的特征矩阵;
目标损失函数如式(VI)所示:
参数:正则化参数λ、用户u在上下文k下对物品i的真实评分ruik,预测评分全局平均分u、用户偏置bu、物品偏置bi、上下文偏置bk、特征矩阵维度D。u、Ii、Ck分别为用户、物品、上下文特征矩阵。Iuk代表用户u在上下文k下的历史评分集合,
算法输出:犯人对所有资源的预测评分,Top-N推荐列表即适合服刑人员的矫正资源列表。
实施例4
根据实施例3所述的一种面向服刑人员的个性化改造矫正策略推荐系统的运行方法,其区别在于:本实施例通过下面的具体例子来说明整个系统的运行过程,包括步骤如下:
(1)假设新入监的犯人为刘某,对刘某进行了心理状态测量,并将心理数据进行了提交。
(2)将心理数据输入到知识库的,触发知识库为刘某生成矫正策略和矫正方案,假定刘某的矫正策略为“以亲情召唤,社会支持为核心的矫正策略”,则对应的矫正方案概要如表2所示;
(3)为该服刑人员推荐个性化的矫正资源,如表4所示:
表4
/>

Claims (9)

1.一种面向服刑人员的个性化改造矫正策略推荐系统,其特征在于,包括犯人心理数据采集模块、知识库、推荐模块、干警平板终端、犯人行为数据采集模块、犯人平板终端;
所述犯人心理数据采集模块连接所述知识库,所述知识库分别连接所述推荐模块、干警平板终端,所述犯人行为数据采集模块连接所述推荐模块,所述推荐模块连接所述犯人平板终端;
所述犯人心理数据采集模块用于测量服刑人员的心理数据,服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员,并将测量的心理数据发送至所述知识库;
所述知识库包括心理学模型总结整理的大量专家案例数据,专家案例数据包括心理学测量数据、矫正策略和矫正方案;所述知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据,为服刑人员生成对应的矫正方案和矫正策略,并把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块,同时将矫正方案发送给所述干警平板终端;
所述推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案,以及监狱拥有的各种矫正资源对相应的服刑人员提供针对性的个性化矫正资源推荐,针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源,并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到所述干警平板终端,所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的所述犯人平板终端上;
所述犯人行为数据采集模块用于获取服刑人员的行为数据;
所述干警平板终端用于实时获取新入刑的服刑人员的基本资料,新入刑的服刑人员的基本资料包括年龄、性别、所犯罪名及对应刑期,接收服刑人员的6维犯罪成因,接收所述知识库发送的服刑人员对应的矫正方案和矫正策略,以及接收所述推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源;6维犯罪成因包括:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因;
所述犯人平板终端用于记录新入刑的服刑人员的基本资料,接收所述知识库发送的服刑人员对应的矫正方案和矫正策略,接收所述推荐模块给出的服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源。
2.根据权利要求1所述的一种面向服刑人员的个性化改造矫正策略推荐系统,其特征在于,所述推荐模块还包括数据分析模块、矫正资源推荐模块;
所述数据分析模块得到知识库发送来的服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案,通过数据预处理后根据这些内容使用推荐系统研究领域的模型进行处理;
所述矫正资源推荐模块用于根据数据分析模块对服刑人员基本信息、犯人的心理数据分析结论、犯人的矫正策略和矫正方案处理后得到的信息,结合监狱内现有的各种矫正资源为对应犯人提供矫正资源的个性化推荐。
3.根据权利要求1所述的一种面向服刑人员的个性化改造矫正策略推荐系统,其特征在于,所述干警平板终端及所述犯人平板终端均为平板电脑。
4.权利要求1-3任一所述面向服刑人员的个性化改造矫正策略推荐系统的运行方法,其特征在于,包括步骤如下:
(1)在大数据平台上搭建知识库
把心理学专家总结整理的大量专家案例数据整合到知识库,专家案例数据包括心理学测量数据、矫正策略和矫正方案,完成大数据平台上知识库的搭建;
(2)测量服刑人员的心理数据
所述犯人心理数据采集模块测量服刑人员的心理数据,通过设置问卷问题让犯人回答,根据犯人的回答情况总结6维犯罪成因,心理数据包括6维犯罪成因;服刑人员包括新入刑的服刑人员或者未进行心理测量的服刑人员,并将测量的心理数据发送至所述知识库;
(3)知识库为服刑人员生成对应的矫正方案和矫正策略
所述知识库根据接收的服刑人员的心理数据和知识库中已有的大量专家案例数据,为服刑人员生成对应的矫正方案和矫正策略,并把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块,同时将矫正方案发送给所述干警平板终端;服刑人员基本信息包括服刑人员编号、性别、年龄、罪名、籍贯、文化水平;
(4)推荐模块进行推荐
推荐模块根据接收到的服刑人员基本信息及对应的矫正策略与矫正方案,以及监狱拥有的各种矫正资源,各种矫正资源包括视频资源、图书资源与音乐资源;对相应的服刑人员提供针对性的个性化矫正资源推荐,针对性的个性化矫正资源包括微调后的个性化矫正方案和其他矫正方案中的可用资源,如果监狱里没有该矫正方案中提到的资源,则推荐模块会推荐与该资源最相似的资源给犯人,并把该服刑人员的微调后的个性化矫正方案和其他矫正方案中的可用资源送到所述干警平板终端,所述干警平板终端对接收到的微调后的个性化矫正方案和其他矫正方案中的可用资源经过微调后结合矫正资源送入到对应服刑人员的所述犯人平板终端上;
(5)测量服刑人员的行为数据
所述犯人行为数据采集模块测量服刑人员的行为数据。
5.根据权利要求4所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法,其特征在于,所述步骤(1),在大数据平台上搭建知识库,包括步骤如下:
A、原始数据搜集;原始数据通过监狱犯人量表和中国法律服务网爬虫获取;
在监狱内向犯人发放问卷采集服刑人员的心理数据;
通过爬虫对中国法律服务网公开资料进行采集,并采用正则解析等技术收集犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告,进行下一步的分析和矫正;
B、原始数据处理;对步骤A搜集到的原始数据进行文本数据分析,对对应的犯人类型打标签,构建犯因关键词库,标签反映罪犯的犯罪成因,不同的标签均对应不同的矫正策略,根据矫正策略制定详细的矫正方案,矫正策略与矫正方案一一对应,得到专家案例数据。
6.根据权利要求5所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法,其特征在于,所述步骤B中,对步骤A搜集到的原始数据进行文本数据分析,对对应的服刑人员类型打标签,构建犯因关键词库,包括步骤如下:
a、通过分析服刑人员的心理数据,制定6维犯罪成因;6维犯罪成因包括:技能不足、教育水平低下、性格缺陷、不良习惯、结交社会不良人员、家庭原因;
b、每种犯罪成因选取典型案例,接着采用爬虫获取的本数据集X进行文本相似度匹配,根据相似度的数值打标签;爬虫获取的本数据集X即犯人的年龄、性别、民族、健康状况、受教育程度、婚姻状况静态指标以及监狱方对其犯罪原因报告;
设定xi表示第i篇待分类的文本,1≤i≤|X|,|X|表示文本数据集X中的文本篇数;|X|篇文本构成词库集W={w1,w2...w|W|},wj表示第j个词语,|W|表示词库集W中的词语个数;
S1:利用神经网络模型BERT构造词间相似度矩阵S|W|×|W|
将每个词语输至入神经网络模型BERT,获得每个词语的向量表示,第j个词语的向量表示为
利用余弦函数计算词间相似度,如式(I)所示:
式(I)中,j'≠j*,分别代表第j'个词语和第j*个词语;
用所有词间相似度构造出词间相似度矩阵S|W|×|W|
S2:对词间相似度矩阵S|W|×|W|进行截断奇异值分解,分解为Σ为低秩矩阵,/>为转移矩阵,U是矩阵论中对一个矩阵进行奇异值分解后得到的酉矩阵,k<<|W|;
S3:计算矩阵如式(II)所示:
式(II)中,是X行低维文本向量构成的矩阵,矩阵/>的每行表示一个文本低维向量;利用余弦函数计算得到文本的相似度,根据相似度的值实现文本的分类;
S4:对采用爬虫获取的本数据集X进行正则匹配,获取到服刑人员基本信息以及描述心理的文本描述,描述心理的文本描述就是通过正则匹配的方式,获取文本中服刑人员心里描述的相关文本描述的文字内容;
S5:分析文本数据,制定6种犯罪成因的标签,并制定对应的关键词库。
7.根据权利要求4所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法,其特征在于,所述步骤(3),知识库为服刑人员生成对应的矫正方案和矫正策略,包括步骤如下:
C、对服刑人员的心理数据进行数据分析,生成关键词/标签;
取所有的问卷数据,包括每个问卷题目的得分,计算反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷七个维度的总得分;
判断是否打对应的七种关键词/标签:七种关键词/标签包括反社会人格障碍、精神病态、冲动、人际反应、道德推脱、童年不幸、认知缺陷;根据问卷回答的问题对这七个维度打分,并对每一个维度的分数设置一个阈值,若某一维度的得分大于设置的该阈值,则存在此关键词/标签,可以所有维度设置相同阈值,也可以不同维度设置不同阈值,具体阈值规则的制定在专家指导下根据当地监狱犯人的实际情况进行设置;对得分数据进行标准化处理,计算每个犯人的关键词/标签重要程度;
①标准化处理:将数据按比例缩放,使之落入一个特定区间;在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权;
②计算每个犯人关键词/标签重要程度:对这七个维度的得分x1,x2,x3,x4,x5,x6,x7进行变换,如式(Ⅲ)所示:
式(Ⅲ)中,min1≤j≤7xj是指x1,x2,x3,x4,x5,x6,x7中的最小值,max1<<j<<7xj是指x1,x2,x3,x4,x5,x6,x7中的最大值,yi是指变换后的值,变换后的值yi越高,则对应关键词/标签越重要,取最高得分的一项作为关键词/标签;
D、将步骤C生成的关键词与生成的犯因关键词库进行关键词匹配,分析得到服刑人员犯罪成因,并针对其犯罪成因生成对应的矫正策略,知识库根据矫正策略生成对应矫正方案;
E、知识库把服刑人员基本信息及对应的矫正策略与矫正方案发送给所述推荐模块,同时将矫正方案发送给所述干警平板终端。
8.根据权利要求4所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法,其特征在于,所述步骤(4),推荐模块进行推荐,包括步骤如下:
F、推荐模块接收到服刑人员基本信息及对应的矫正策略与矫正方案,以及终端服刑人员的平板终端送来的服刑人员的交互信息及矫正资源信息进行整合;服刑人员的交互信息包括服刑人员ID、资源ID、资源观看时长或评分,服刑人员ID为服刑人员在监狱内的犯人编号,资源ID为监狱内图书资源、视频资源、音乐资源在监狱内制定的编号,资源观看时长为服刑人员使用每一种资源所花费的时间长度,评分为各种资源的评分;矫正资源信息包括资源ID、名称、类别,视频需提供总时长,名称为每一项资源原有的名字,类别为每一个资源按照内容所分出的类别,视频需提供总时长为每份视频的时间长度;
G、数据分析模块处理服刑人员基本信息及对应的矫正策略与矫正方案,以及服刑人员的交互信息及矫正资源信息,得到服刑人员交互行为分析和民警矫正方案干预;
H、步骤G得到的服刑人员交互行为分析和民警矫正方案干预通过数据接口传送到干警平板终端,同时将步骤G得到的服刑人员交互行为分析和民警矫正方案干预发送到推荐模块内的矫正资源推荐模块,经过矫正资源推荐模块处理后得到服刑人员的矫正资源列表,通过数据接口传送到犯人平板终端。
9.根据权利要求8所述的面向服刑人员的个性化改造矫正策略推荐系统的运行方法,其特征在于,所述步骤H中,推过基于模型的协同过滤算法的处理后,得到适合服刑人员的矫正资源列表,包括步骤如下:
矩阵分解:将评分矩阵分解为用户特征矩阵和物品特征矩阵,评分矩阵包括用户编号、物品编号及用户对该物品的评分;通过用户特征矩阵和物品特征矩阵的乘积拟合评分矩阵;用户特征矩阵是指用户的兴趣,物品特征矩阵是指物品的特点,且每一个维度相互对应,用户特征矩阵和物品特征矩阵的乘积表示用户对该物品的喜好程度;使用biasSVD算法;
预测模型如式(Ⅳ)、式(Ⅴ)所示:
参数:预测评分全局平均分μ、用户偏置bu、物品偏置bi、上下文偏置bk、特征矩阵维度D;uud、Iid、0kd分别为用户、物品、上下文特征矩阵;Iuk代表用户u在上下文k下的历史评分集合,ri代表用户u历史评分项目的特征矩阵;
目标损失函数如式(Ⅵ)所示:
参数:正则化参数λ、用户u在上下文k下对物品i的真实评分ruik,预测评分全局平均分u、用户偏置bu、物品偏置bi、上下文偏置bk、特征矩阵维度D;u、Ii、Ck分别为用户、物品、上下文特征矩阵;Iuk代表用户u在上下文k下的历史评分集合;
算法输出:犯人对所有资源的预测评分,Top-N推荐列表即适合服刑人员的矫正资源列表。
CN201911344189.5A 2019-12-24 2019-12-24 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法 Active CN111125525B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911344189.5A CN111125525B (zh) 2019-12-24 2019-12-24 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911344189.5A CN111125525B (zh) 2019-12-24 2019-12-24 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法

Publications (2)

Publication Number Publication Date
CN111125525A CN111125525A (zh) 2020-05-08
CN111125525B true CN111125525B (zh) 2023-09-15

Family

ID=70501684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911344189.5A Active CN111125525B (zh) 2019-12-24 2019-12-24 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法

Country Status (1)

Country Link
CN (1) CN111125525B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914166B (zh) * 2020-07-03 2024-02-27 山东大学 应用于社区矫正人员的矫正策略个性化推荐系统
CN111913572B (zh) * 2020-07-03 2022-03-15 山东大学 用于用户劳动学习的人机交互系统及方法
CN112270971A (zh) * 2020-10-12 2021-01-26 江苏大学 一种心理健康自动检测与精准阅疗书方推荐方法与系统
CN112667919A (zh) * 2020-12-28 2021-04-16 山东大学 一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法
CN112860992B (zh) * 2021-01-25 2023-03-24 西安博达软件股份有限公司 基于网站内容数据推荐的特征优化预训练方法
CN113515599A (zh) * 2021-06-30 2021-10-19 中国电子科技集团公司第十五研究所 一种安置帮教语义分析与方案推荐的方法
CN113486255B (zh) * 2021-09-08 2021-11-16 南京麦豆健康管理有限公司 一种基于互联网的产后线上咨询匹配系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101950383A (zh) * 2010-09-08 2011-01-19 山东中磁远程视讯技术有限公司 服刑人员社会帮教系统及其实现方法
CN203166898U (zh) * 2013-03-28 2013-08-28 林宝宗 社区矫正手表监控器
CN109998570A (zh) * 2019-03-11 2019-07-12 山东大学 服刑人员心理状态评估方法、终端、设备及系统
CN110507335A (zh) * 2019-08-23 2019-11-29 山东大学 基于多模态信息的服刑人员心理健康状态评估方法及系统
CN110543594A (zh) * 2019-08-06 2019-12-06 山东科技大学 一种基于知识库的服刑人员个性化循证矫正推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101203695B1 (ko) * 2011-05-30 2012-11-22 경희대학교 산학협력단 사용자 심리지수에 기초한 조언 추천 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101950383A (zh) * 2010-09-08 2011-01-19 山东中磁远程视讯技术有限公司 服刑人员社会帮教系统及其实现方法
CN203166898U (zh) * 2013-03-28 2013-08-28 林宝宗 社区矫正手表监控器
CN109998570A (zh) * 2019-03-11 2019-07-12 山东大学 服刑人员心理状态评估方法、终端、设备及系统
CN110543594A (zh) * 2019-08-06 2019-12-06 山东科技大学 一种基于知识库的服刑人员个性化循证矫正推荐方法
CN110507335A (zh) * 2019-08-23 2019-11-29 山东大学 基于多模态信息的服刑人员心理健康状态评估方法及系统

Also Published As

Publication number Publication date
CN111125525A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111125525B (zh) 一种面向服刑人员的个性化改造矫正策略推荐系统及其运行方法
CN110188272B (zh) 一种基于用户背景的社区问答网站标签推荐方法
Murphy A hands-on guide to conducting psychological research on Twitter
CN111709575A (zh) 基于c-lstm的学业成绩预测方法
Zörgő et al. Exploring the effects of segmentation on semi-structured interview data with epistemic network analysis
CN113656687B (zh) 基于教研数据的教师画像构建方法
CN111651584A (zh) 一种基于用户行为特征及文章属性的保险文章推荐方法
CN116741411A (zh) 一种基于医疗大数据分析的智慧健康科普推荐方法、系统
Belloni et al. Measuring and detecting errors in occupational coding: an analysis of share data
Chung et al. Text-mining open-ended survey responses using structural topic modeling: a practical demonstration to understand parents’ coping methods during the COVID-19 pandemic in Singapore
CN117333037A (zh) 一种面向出版大数据的产业大脑构建方法及装置
Van Atteveldt et al. Studying political decision making with automatic text analysis
Xiao et al. Research on adaptive learning prediction based on XAPI
Bhadra et al. Enhancing the efficacy of depression detection system using optimal feature selection from EHR
Ash et al. Measuring judicial sentiment: Methods and application to us circuit courts
Prüfer et al. Data science for institutional and organizational economics
CN114358014A (zh) 基于自然语言的工单智能诊断方法、装置、设备及介质
CN117217808B (zh) 一种智能的活动邀请裂变能力分析预测方法
KR102476612B1 (ko) 인공지능에 기반한 심리 맞춤 솔루션 제공 방법 및 시스템
Weismayer Investigating the affective part of subjective well-being (SWB) by means of sentiment analysis
Pentland et al. Does accuracy matter? Methodological considerations when using automated speech-to-text for social science research
Stankevich et al. Predicting personality traits from social network profiles
CN114862006A (zh) 一种基于人工智能的社会工作服务方案自动化生成方法和装置
CN113222471A (zh) 一种基于新媒体数据的资产风控方法及设备
Stewart et al. Dissimilarity is used as evidence of category membership in multidimensional perceptual categorization: A test of the similarity–dissimilarity generalized context model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Li Yujun

Inventor after: Ma Baosen

Inventor after: Liu Zhi

Inventor after: Ben Xianye

Inventor after: Zhu Kongfan

Inventor before: Li Yujun

Inventor before: Ma Baosen

Inventor before: Liu Zhi

Inventor before: Ben Xianye

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant