CN110610005A

CN110610005A - 基于深度学习的盗窃罪辅助量刑方法

Info

Publication number: CN110610005A
Application number: CN201910870274.9A
Authority: CN
Inventors: 叶麟; 张宏莉; 方滨兴; 李尚�; 郭镔; 蔡怡蕾; 郭小丁; 陈喆
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2019-09-16
Filing date: 2019-09-16
Publication date: 2019-12-24

Abstract

基于深度学习的盗窃罪辅助量刑方法属于计算机领域；无法实现在较少人工标注情况下的案情语义表示和特定罪名的刑期精准预测；包括根据刑法规定和关于盗窃罪的量刑规定，结合已公开的盗窃罪一审判决书，从被盗窃物品价值、犯罪主体信息、犯罪事实描述、判决结果角度定义形式化描述盗窃案的11维特征；对裁判文书进行文本预处理；整合为语料集，训练词向量；完成除被盗窃物品价值和刑期之外特征的提取，使用循环神经网络为每一维特征分别构建特征生成器，从而提取特征值；使用线性回归和多层神经网络模型作为预测器，输入案件特征向量，输出刑期预测结果；能够在较少依赖人工标注的情况下实现对案情的深度语义理解和给出明确的刑期预测值。

Description

基于深度学习的盗窃罪辅助量刑方法

技术领域

本发明属于计算机领域，尤其涉及一种基于深度学习的盗窃罪辅助量刑方法。

背景技术

在过去几年中，司法领域的数据量迅速增长。这些数据涉及各类法律案件的裁判文书、法律法规和司法解释。法官、律师和检察官等法律专业人员不仅要处理大量案件，还需要查阅大量与案件相关的文件以供参考和分析。这使得法律专业人员的负担日益增加，并可能导致工作效率降低和司法工作出错的风险增加。为了更好地捍卫司法公正、保障公共安全，采用基于人工智能和数据挖掘技术的辅助量刑方法亟待应用于司法实践。

辅助量刑的任务不同于指控罪名预测，其目的是通过分析针对案情文本事实描述，预测某类刑事罪名的处罚期限(例如，以年或月计算的有期徒刑，终身监禁或死刑)，而不是针对特定案件确定适当的指控(例如，盗窃，诈骗，抢劫和故意伤害罪)。由于中国内地采用的是大陆法系，法院基于成文法和当前案件的事实描述进行审判量刑，而不是参照先例案件的判决。法官将当前案件具体情况进行分析，根据适用的法律条文做出最终决定。在已有的某些司法智能辅助系统中，通过已判决生效的类似案例训练机器学习分类模型能够完成简化的刑期预测任务，但参照法律条文进行量刑在法理上更有说服力。目前，根据法律条文和案件事实描述训练机器学习模型预测刑期并非易事。

目前已有的相关工作大多采用文本分类的思路来解决刑期预测任务。这些工作或采用经典的机器学习分类模型，从文本或案例简介中提取浅层特征，或通过人工定义特征和手动标注案例来获得对案例描述的更深层次语义理解。尽管机器学习和自然语言处理方法的引入可以法律文本分析，但尚无法实现在较少人工标注情况下的案情语义表示和特定罪名的刑期精准预测。

发明内容

本发明克服了上述现有技术的不足，提供一种基于深度学习的盗窃罪辅助量刑方法，根据《刑法》中的相关规定对盗窃案定义了11维特征，针对盗窃罪一审判决书的文本预处理，过滤对特征抽取产生干扰的文本部分和无关词语，使用循环神经网络分别对不同维度的案件特征构建生成器，使用线性回归和多层神经网络模型进行训练，根据输入的案件特征计算以月为单位的刑期预测结果，有效的解决了无法实现在较少人工标注情况下的案情语义表示和特定罪名的刑期精准预测的技术问题。

本发明的技术方案：

一种基于深度学习的盗窃罪辅助量刑方法，包括以下步骤：

步骤a、根据刑法规定和关于盗窃罪的量刑规定，结合已公开的盗窃罪一审判决书，从被盗窃物品价值、犯罪主体信息、犯罪事实描述、判决结果角度定义形式化描述盗窃案的11维特征，所述11维特征包括被盗窃物品价值、被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节以及判决刑期；

步骤b、对裁判文书进行文本预处理；

步骤c、将预处理后得到的所有文本整合为语料集，训练词向量；

步骤d、完成除被盗窃物品价值和刑期之外其余9维特征的提取，使用循环神经网络为每一维特征分别构建特征生成器，以句子为单位对词向量序列进行训练从而提取特征值；

步骤e、使用线性回归和多层神经网络模型作为预测器，案件特征向量作为输入，输出以月为单位的刑期预测结果。

进一步地，所述将预处理后得到的所有文本整合为语料集，使用Word2Vec训练词向量，参数设置为使用CBOW模型、使用负采样方法优化，分别训练向量维度为100、150、200、250和300的5组词向量。

进一步地，所述文本预处理包括无关段落去除、数值型特征提取和无关词语去除。

进一步地，所述无关段落包括辩护人信息、审理流程描述、公诉机关的判决建议、被告人和辩护人的辩护意见和法院经审理查明的事实，采用正则表达式匹配所述无关段落的起始段与结束段，将起始段与结束段连同中间段落一并删去。

进一步地，所述数值型特征包括被盗窃物品价值和刑期，采用基于规则的方法提取。

进一步地，所述被盗窃物品价值是指盗窃物品的总金额，所述被盗窃物品的金额信息包含在案件事实描述，所述金额信息具有固定格式，通过正则表达式提取所有符合所述格式的字符串，得到所有金额数值，同时判断金额字符串所在的句子是否包括“返还、赔偿、退赔、退缴、归还、退还、赔款、上交、补偿或赃款”关键词，如果包含则不将所述句子中的金额计算到总金额中，通过上述方式对每句话进行处理后，累加得到的数值便是被盗窃物品的总价值。

进一步地，所述刑期包含在法院判决意见中，刑期表示为“有期徒刑”主刑词加上“某年”字样的时长信息，其中表示数值的并非阿拉伯数字而是中文数字，通过正则表达式提取法院判决意见中符合上述格式的字符串，将其中的中文数字转换为数值后，为将其统一表示为月，将表示“年”的数值乘以12后加上表示“月”的数值得到最终的刑期结果，所述某年为一年、二年、两年、三年、四年、五年、六年、七年、八年、九年或十年。

进一步地，所述无关词语包括人名、机构名、地名、时间以及出现频率低于阈值的词，通过政策表达式去除。

进一步地，所述9维特征包括被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节。

进一步地，所述线性回归用于回归任务，多层神经网络模型用于处理非线性问题，其因变量和自变量的数目能够设置为多个。

本发明相对于现有技术具有以下有益效果：

本发明提供了一种基于深度学习的盗窃罪辅助量刑方法，案件类别是刑事案件中的盗窃案；根据《刑法》中的相关规定对盗窃案定义了11维特征，针对盗窃罪一审判决书的文本预处理，过滤对特征抽取产生干扰的文本部分和无关词语，使用循环神经网络分别对不同维度的案件特征构建生成器，使用线性回归和多层神经网络模型进行训练，根据输入的案件特征计算以月为单位的刑期预测结果，有效的解决了无法实现在较少人工标注情况下的案情语义表示和特定罪名的刑期精准预测的技术问题。本发明能够在法理基础上提取有效的盗窃案特征；能够在较少依赖人工标注的情况下实现对案情的深度语义理解；能够给出明确的刑期预测值，而非模糊的时间范围。

附图说明

图1是本发明流程示意图；

图2是无关词语去除流程示意图。

具体实施方式

以下将结合附图对本发明进行详细说明。

具体实施方式一

一种基于深度学习的盗窃罪辅助量刑方法，如图1所示，包括以下步骤：

步骤b、对裁判文书进行文本预处理；

步骤e、使用线性回归和多层神经网络模块作为预测器，案件特征向量作为输入，输出以月为单位的刑期预测结果。

具体地，所述将预处理后得到的所有文本整合为语料集，使用Word2Vec训练词向量，参数设置为使用CBOW模型、使用负采样方法优化，分别训练向量维度为100、150、200、250和300的5组词向量。

具体地，所述文本预处理包括无关段落去除、数值型特征提取和无关词语去除。

具体地，所述无关段落包括辩护人信息、审理流程描述、公诉机关的判决建议、被告人和辩护人的辩护意见和法院经审理查明的事实，采用正则表达式匹配所述无关段落的起始段与结束段，将起始段与结束段连同中间段落一并删去。

具体地，所述数值型特征包括被盗窃物品价值和刑期，采用基于规则的方法提取。

具体地，所述被盗窃物品价值是指盗窃物品的总金额，所述被盗窃物品的金额信息包含在案件事实描述，所述金额信息具有固定格式，通过正则表达式提取所有符合所述格式的字符串，得到所有金额数值，同时判断金额字符串所在的句子是否包括“返还、赔偿、退赔、退缴、归还、退还、赔款、上交、补偿或赃款”关键词，如果包含则不将所述句子中的金额计算到总金额中，通过上述方式对每句话进行处理后，累加得到的数值便是被盗窃物品的总价值。

具体地，所述刑期包含在法院判决意见中，刑期表示为“有期徒刑”主刑词加上“某年”字样的时长信息，其中表示数值的并非阿拉伯数字而是中文数字，通过正则表达式提取法院判决意见中符合上述格式的字符串，将其中的中文数字转换为数值后，为将其统一表示为月，将表示“年”的数值乘以12后加上表示“月”的数值得到最终的刑期结果，所述某年为一年、二年、两年、三年、四年、五年、六年、七年、八年、九年或十年。

具体地，所述无关词语包括人名、机构名、地名、时间以及出现频率低于阈值的词，通过政策表达式去除。

具体地，所述9维特征包括被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节。

具体地，所述线性回归用于回归任务，多层神经网络模块用于处理非线性问题，其因变量和自变量的数目能够设置为多个。

具体实施方式二

在具体实施方式一的基础上，另一种实现的基于深度学习的盗窃罪辅助量刑方法，包括：

步骤a、经过对《中华人民共和国刑法》第一编第四章关于刑罚具体运用的规定以及第二编第五章第二百六十四条关于盗窃罪的量刑规定相关法条的梳理，结合对已公开的盗窃罪一审判决书的分析，包括被盗窃物品价值、犯罪主体信息、犯罪事实描述和判决结果，归纳出盗窃案件的如下11维特征，包括被盗窃物品价值、被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节和以及判决刑期。其中，被盗窃物品价值是盗窃罪的基本量刑要素；被告人是否为未成年人与是否为残疾人属于犯罪主体信息，对这类特殊人员可以从轻、减轻或者免除处罚；入户行窃、携带凶器、扒窃或其他严重情节则会在一般的盗窃情节上加重犯罪的严重程度，可以从重处罚，其中严重情节包括但不限于冲撞、火烧、抗拒追捕等；被告人是累犯的一般应当从重处罚；退赔、自首情节属于犯罪行为后的补救措施，可以从轻或者减轻处罚；最后是判决结果，关注的重点在管制、拘役、有期徒刑这三类主刑的期限。

因此，盗窃案的案件模型便可表示为：

C＝(a,j,d,b,w,p,o,r,c,s,t) (1)

其中，各维度的含义、值域如表1所示。

表1案件模型各维度说明

步骤b、对裁判文书进行文本预处理；包括：

1、无关段落去除。裁判文书通常由首部、事实、理由、判决结果、尾部等部分构成，但并非所有内容都适合于训练量刑模型，例如关于审理流程的陈述性语句或辩护人的信息介绍等，事先将这些信息去除可以避免对模型训练造成干扰。裁判文书是以自然段的形式划分的，因此无关部分也是成段出现的，无关部分包括以下几种情况：

辩护人信息仅包含其自然信息介绍，与案情无关。

审理流程描述包含指控罪名、指控日期，审理程序、审理日期，检察员、被告人、辩护人的出席信息，公诉机关提供证据的情况以及对物证、书证、证人证言等的描述，这些仅为法院审理过程的记录，同样与案情无关。

公诉机关的判决建议是公诉机关根据被告人的犯罪事实做出的量刑建议，仅供法官参考，与最后的法院判决结果性质不同。

被告人和辩护人的辩护意见从理论上讲可能对犯罪事实做出修正，但经过对含有辩称以及辩护意见的数据的观察，仅有少数几例中法院采纳了辩称以及辩护意见，其原因为公诉机关的调查过程出现较大的失误。因此在本发明中不考虑辩护意见对判决结果的影响。

法院经审理查明的事实仅为公诉机关指控事实的复述，而重复出现的事实会对案件特征的提取造成干扰。

因此，需要去除的无关段落包括辩护人信息、审理流程描述、公诉机关的判决建议、被告人和辩护人的辩护意见、法院经审理查明的事实这5个部分，采用正则表达式匹配这些部分的起始段与结束段，将起始段与结束段连同中间段落一并删去。

2、数值型特征提取。在盗窃案案件模型的11维特征中，被盗窃物品价值与刑期这两个特征是具体的数值而非布尔型的逻辑值。对于数值型的文本，由于其携带的并非语义，因此每一种取值都对应一种表示形式，而数值是无法全部枚举出来的，因此采用基于规则的方法提取被盗窃物品价值与刑期。

被盗窃物品价值是指盗窃物品的总金额，因此需要将案件涉及的各项盗窃物品的金额进行累加。在去除无关段落后，判决书文本还包括3个部分，分别是犯罪主体信息、案件事实描述以及法院判决意见，被盗窃物品的金额信息便包含在案件事实描述。金额的格式一般为“数字+小数点+逗号”的组合再加上“元”字，因此通过正则表达式提取所有符合该格式的字符串，便得到了所有金额数值，使用的正则表达式如表2所示。为区分表示被盗窃物品金额的字符串与表示赃款与退赔金额的字符串，还要判断金额字符串所在的这句话是否包括“赃款”、“退赔”等关键词，如果包含则不将这句话中的金额计算到总金额中。通过该方式对每句话进行处理后，累加得到的数值便是被盗窃物品的总价值。

刑期则包含在法院判决意见中，表示为“有期徒刑”等主刑词加上如“一年”字样的时长信息，其中表示数值的并非阿拉伯数字而是中文数字。通过如表3所示的正则表达式提取法院意见中符合上述格式的字符串，将其中的中文数字转换为数值后，为将其统一表示为月，将表示“年”的数值乘以12后加上表示“月”的数值便得到了最终的刑期结果。

表2数值型特征提取相关正则表达式

3、无关词语去除。去除无关词语的目的是将可能对案件特征提取产生干扰的信息尽量去除，这些信息包括人名、机构名、地名、时间以及出现频率较低的词。其中，时间可在分词之前直接通过正则表达式去除，人名分为两种，一种为正常姓名，而另一种则将名以“某某”代替，对于后一种也可直接使用正则表达式处理，而对于前一种人名以及机构名、地名则需要借助其词性和实体类别来处理。时间与人名对应的正则表达式如表4所示。无关词语去除的完整流程如图2所示。其中，使用了哈工大社会计算与信息检索研究中心开发的语言技术平台LTP(Language Technology Platform，语言技术平台)提供的中文分词、词性标注、命名实体识别工具，其中分词得到的结果为分隔开的单词，词性标注得到的结果为每个词的词性标签，命名实体识别得到的结果是每个词的实体标签。

表3无关词语去除相关正则表达式

由于判决书中含有较多的法律专业词汇与不常见的地名，而分词、词性标注、命名实体识别并非针对法律领域而设计，导致了分词与词性标注结果出现错误。为纠正这些错误以加强无关词语去除的效果，在该过程中需要人工介入调整分词的词典以及词性标注的词典。在得到分词、词性标注、命名实体识别结果后，通过人工判断分词结果是否包含错误分词，然后将错误分词部分经人工划分后添加到词典，以保证分词的准确性；同时，再由人工观察命名实体识别结果是否正确，如果有错误则找到与其对应的词性标注结果，将正确的词性标签添加到词典中，以保证词性标注的准确性。在完善词典之后，再次对数据进行分词、词性标注、命名实体识别并重复上述操作，对此过程进行迭代直到结果基本不出现错误为止。在得到基于词典的结果后，将被标记为人名、机构名、地名实体的词一并删除。为去除出现次数较少的词，首先统计每个词的文档频率，其计算方法如式(2)所示，之后将文档频率低于阈值的词全部去除，在中阈值设定为总文档数的0.1％，结果显示，在该阈值下绝大部分无用词可被去除。

式中，|D|：语料库中的文件总数；|{d∈D：t∈d}|：包含词语t的文件数目；df(t，D)：词文档频率。

步骤c、经过预处理后，案件文本已被划分为若干句子，每个句子中的词则由空格隔开，之后便可进行词向量生成工作。将所有文本整合为语料集并使用Word2Vec训练词向量，参数设置为使用CBOW(Continuous Bag-of-Words，连续词袋)模型、使用负采样方法优化，分别训练了向量维度为100、150、200、250和300的5组词向量。由于不同维度的词向量需要通过具体才能区分效果的优劣，因此最终词向量维度的选择是通过后续辅助量刑的效果来决定的，以LSTM(Long Short-Term Memory，长短期记忆网络)和GRU GRU (GatedRecurrent Unit，门控循环单元)模型在特征提取中的结果为例，其各维度下的准确率如表4所示，其中LSTM的最高准确率对应的词向量维度是150，而GRU对应的是 300。因此，对于每个模型都选择能使其效果达到最优的词向量维度，以该维度下得到的结果作为其最终结果。

表4词向量维度结果(准确率％)

步骤d、盗窃案件模型共包含11维特征，由于辅助量刑的目的是对刑期进行预测，因此在这11维特征中，除刑期外的其他10维特征便可视为辅助量刑所需的输入值。其中，由于被盗窃物品价值已在预处理阶段提取完成，因此需要提取的特征共包括被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节这9 维特征，这9维特征的共同点是只有两种可能的结果，即“是”或“否”，因此每一个特征都对应着一个二分类问题，由此可以对每个特征分别构造一个二分类器进行提取，之后再将得到的结果合并成一个向量。因此，可以将案件文本生成的词向量序列作为输入，通过神经网络模型进行特征值提取，并对最后的隐含层结构做出调整以适用于分类任务。分别使用CNN(Convolutional Neural Networks，卷积神经网络)、LSTM(Long Short-Term Memory，长短期记忆网络)、GRU(Gated Recurrent Unit，门控循环单元)、Bi-LSTM (BidirectionalLong Short-Term Memory Network，双向长短期记忆网络)、Bi-GRU (BidirectionalGated Recurrent Unit，双向门控循环单元)这5种模型连接隐含层进行特征提取，结果如表5所示。其中，使用GRU模型、词向量维度设为300时取得了最高准确率99.45％。

表5特征提取准确度(％)

步骤e、在得到案件特征值后，便可进行刑期预测步骤，一个特征值只能有一个特征向量，其输入为案件特征向量，而输出为以月为单位的刑期预测结果。由于刑期是一个连续型整数值而非布尔值，因此可以将刑期预测转化为回归问题。为解决该回归问题，分别采用了线性回归LR(Linear Regression，线性回归)模型与多层神经网络NN(NeuralNetworks，神经网络)模型作为预测器，其中线性回归可直接应用于回归任务，而多层神经网络的特点则是可以处理非线性问题，其因变量和自变量的数目都可以设置为多个。多层神经网络常被应用于分类问题中，若要对回归问题进行处理则需要去掉输出层的激活函数，使输出层变为线性计算，并且将输出层的节点数设置为1，同时使用均方误差作为适用于回归问题的损失函数。

在刑期预测中，使用采集自《中国裁判文书网》的41481篇盗窃案一审判决书构造数据集，其中60％作为训练集，20％作为验证集，其余20％作为测试集。为了与本实施方式提出的方法，即GRU(Gated Recurrent Unit，门控循环单元)作为特征提取器、LR(LinearRegression，线性回归)或NN(Neural Networks，神经网络)作为预测器，分别表示为 GRU+LR和GRU+NN进行对比，使用LSTM(Long Short-Term Memory，长短期记忆网络)、Bi-LSTM(Bidirectional Long Short-Term Memory Network，双向长短期记忆网络)、GRU (GatedRecurrent Unit，门控循环单元)、Bi-GRU(Bidirectional Gated Recurrent Unit，双向门控循环单元)模型同时完成特征提取和刑期预测。采用的评价指标包括3个，MAE (MeanAbsolute Deviation，平均绝对误差)为预测刑期与实际刑期的平均绝对误差值， Acc_e3为预测刑期相比于实际刑期误差不超过3个月的比例，Acc_e6为预测刑期相比于实际刑期误差不超过6个月的比例。结果如表6所示，可以发现本实施方式提出的GRU+LR 和GRU+NN方法显著优于其余4种参照方法，其中GRU+NN方法取得了MAE(Mean Absolute Deviation，平均绝对误差)为3.2087个月、Acc_e3(预测刑期相比于实际刑期误差不超过3个月的比例)为72.54％、Acc_e6(预测刑期相比于实际刑期误差不超过6个月的比例)为90.01％的最佳性能。

表6预测模型性能对比

Claims

1.一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，包括以下步骤：

步骤b、对裁判文书进行文本预处理；

2.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述将预处理后得到的所有文本整合为语料集，使用Word2Vec训练词向量，参数设置为使用CBOW模型、使用负采样方法优化，分别训练向量维度为100、150、200、250和300的5组词向量。

3.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述文本预处理包括无关段落去除、数值型特征提取和无关词语去除。

4.根据权利要求3所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述无关段落包括辩护人信息、审理流程描述、公诉机关的判决建议、被告人和辩护人的辩护意见和法院经审理查明的事实，采用正则表达式匹配所述无关段落的起始段与结束段，将起始段与结束段连同中间段落一并删去。

5.根据权利要求3所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述数值型特征包括被盗窃物品价值和刑期，采用基于规则的方法提取。

6.根据权利要求5所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述被盗窃物品价值是指盗窃物品的总金额，所述被盗窃物品的金额信息包含在案件事实描述，所述金额信息具有固定格式，通过正则表达式提取所有符合所述格式的字符串，得到所有金额数值，同时判断金额字符串所在的句子是否包括“返还、赔偿、退赔、退缴、归还、退还、赔款、上交、补偿或赃款”关键词，如果包含则不将所述句子中的金额计算到总金额中，通过上述方式对每句话进行处理后，累加得到的数值便是被盗窃物品的总价值。

7.根据权利要求5所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述刑期包含在法院判决意见中，刑期表示为“有期徒刑”主刑词加上“某年”字样的时长信息，其中表示数值的并非阿拉伯数字而是中文数字，通过正则表达式提取法院判决意见中符合上述格式的字符串，将其中的中文数字转换为数值后，为将其统一表示为月，将表示“年”的数值乘以12后加上表示“月”的数值得到最终的刑期结果，所述某年为一年、二年、两年、三年、四年、五年、六年、七年、八年、九年或十年。

8.根据权利要求3所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述无关词语包括人名、机构名、地名、时间以及出现频率低于阈值的词，通过政策表达式去除。

9.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述9维特征包括被告人是否为未成年人、被告人是否为残疾人、是否有入户行窃情节、是否有携带凶器情节、是否有扒窃情节、是否有其他严重情节、被告人是否累犯、是否有退赔情节、是否有自首情节。

10.根据权利要求1所述一种基于深度学习的盗窃罪辅助量刑方法，其特征在于，所述线性回归用于回归任务，多层神经网络模块用于处理非线性问题，其因变量和自变量的数目能够设置为多个。