CN107818138A - 一种案件法律条例推荐方法及系统 - Google Patents
一种案件法律条例推荐方法及系统 Download PDFInfo
- Publication number
- CN107818138A CN107818138A CN201710893794.2A CN201710893794A CN107818138A CN 107818138 A CN107818138 A CN 107818138A CN 201710893794 A CN201710893794 A CN 201710893794A CN 107818138 A CN107818138 A CN 107818138A
- Authority
- CN
- China
- Prior art keywords
- mrow
- legal regulation
- legal
- msub
- case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000013598 vector Substances 0.000 claims abstract description 62
- 239000011159 matrix material Substances 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000036541 health Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 9
- 238000013135 deep learning Methods 0.000 description 5
- 230000009849 deactivation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种案件法律条例推荐方法,包括步骤1,获取裁判文书信息和基本的判案法律条例信息,并对裁判文书涉及到的敏感信息进行处理;步骤2,将获取的裁判文书进行预处理得到结构化信息和非结构化信息;步骤3,将结构化信息向量化,非结构化信息分句分词后向量化,并向量化基础上将的结构化信息和非结构化信息共同编码形成裁判文书向量;步骤4,将裁判文书向量输入到犯罪类型预测模型获取相应案件的详细类别,以及这个类别中应用的法律条例;步骤5,预测案件的犯罪类型得到法律条文的相关度矩阵,并且计算相似案例应用的法律条例置信度,最后基于犯罪类型及相似案件给出案件应用的法律条文推荐组合。
Description
技术领域
本发明属于司法领域和自然语言处理领域,涉及一种案件法律条例推荐方法 及系统。
背景技术
世界信息化快速发展,互联网、大数据渗透到生活的各个角落,司法领域 信息化受到广泛关注,“互联网+法治”的大数据法制时代已经悄然来临。随着 国民素质的提高,人民群众的法律意识越来越强,司法需求日趋多元,我国积 极推动司法信息化发展,近年来各级法院信息化建设蓬勃发展,信息化与各项 业务工作的良性互动格局基本形成,借助网上办案平台,立案网络化、裁判文 书公开化、审判流程可视化等司法举措已落地有声。2013年7月1日,中国裁 判文书网上线,生效裁判文书开始在互联网公布,到2017年8月中国裁判文书 网累计公开裁判文书超过3247万篇,总访问量突破100亿次,日均访问量达1729 万人次,单日最高访问量高达5000万人次。其中超过17.5亿的访问量来自海外, 访问范围覆盖全球210多个国家和地区。中国裁判文书网已成为全球最大的裁 判文书公开平台。
案件数量的不断增长,给法律服务带来巨大压力。但是,司法领域需要很 强的专业性,我国适用的法律条例众多,专业律师也很难涉猎所有的法律条款, 并且案件种类繁多,从海量的法律条款中找到恰当的支持本案件的法律条款耗 时耗力。因此,如何借助人工智能推进司法信息化,提高办案人员工作效率保 障人民群众的司法需求是亟待解决的问题。目前,有很多法律条款的辅助查询 工具,但是根据案件基本情况推荐适用的法律的资料较少,专利 CN201410356389.3是存储法律问题及法律对应的解决方案等生成法律知识模型 库,根据查询语句从法律知识模型库中查找匹配的法律问题,从而给出对应的 法律条款生成可编辑法律文书;专利CN201510528314.3公开了一种用于法律咨 询服务的智能法律知识库及其查询系统,输入法律需求可获得对应的法律条例; 专利CN201510869254.1通过获取查询文本的关键词,并用含义相同或者相近的 法律词来进行关键词扩充,从而获取与查询相关的裁判文书,生成对应的法律 条文。
首先,大部分法律条文查询系统基于创建的法律条文知识库,查询结果受 限于知识库的规模和准确性,某些法律条文可能不适合同时应用,并且不能根 据输入的案件信息进行智能推荐;其次,针对某个法律问题,当事人不同或者 犯罪情节及过程等有差别,会影响查询结果;并且,一个案件情况可能涉及多 种法律问题,查询单个问题不是最好的查询方式。
发明内容
本发明提出了一种推荐准确性高、可扩展的案件法律条例推荐方法及系统。
本发明采用的技术方案是:
一种案件法律条例推荐方法,其特征在于:包括
步骤1,获取裁判文书信息和基本的判案法律条例信息,并对裁判文书涉及 到的敏感信息进行处理;
步骤2,将获取的裁判文书进行预处理得到结构化信息和非结构化信息;
步骤3,将结构化信息向量化,非结构化信息分句分词后向量化,并在向量 化的基础上将结构化信息和非结构化信息共同编码形成裁判文书向量;
步骤4,将裁判文书向量输入到犯罪类型预测模型获取相应案件的详细类别 C,以及这个类别中应用的法律条例tL;
步骤5,待检索的裁判文书的推荐法律条文输出,包括
(1)将待检索的裁判文书经步骤1和步骤2进行向量化得到的搜索案件向 量,并计算与步骤3中训练数据相似的裁判文书,进行相似案例的法律条例置 信度计算,并提取置信度排名靠前s′的相似案例对应的法律条例 sLAW={sL1,sL2,...,sLs′};
(2)根据案件犯罪类型获取应用多的法律条例,统计犯罪类型对应的法律 条例tL和每条法律条例对应的应用次数nL,按照nL降序排序,取类别中应用较 多的t条法律条例,则由犯罪类型获得相关的法律推荐tLAW=[tL1,tL2,…,tLt],并通 过应用次数nL构建法律条例相关度矩阵M;
(3)将sLAW中的每条法律条例与tLAW中的法律条例相对应,从法律条例 相关度矩阵M中获取对应上的法律条例的相关系数,并根据相关系数的相关度 输出推荐的法律条例,并且将推荐的多组法律条例进行排序输出。
进一步,结构化信息包括性别,年龄,职业,身体状况,案发地,犯罪类 型,法律条例,非结构化信息包括案情信息。
进一步,步骤3中通过词编码模型与句编码模型对结构化信息和非结构化 信息进行向量化,具体包括:
词编码模型2对结构化信息进行编码,输出维度为dim2的词向量;
词编码模型1对非结构化信息分局分词后的单词进行编码,输出维度为dim1的词向量;
句编码模型1是将经过词编码模型1词编码后的单词再进行编码,输出维 度为dim2的句向量;
句编码模型2是将句编码模型1编码后的句向量和词编码模型2编码后的 词向量进一步编码为裁判文书向量。
进一步,步骤5的(1)中置信度计算步骤包括:
搜索案件向量Vdoc和某个训练数据的裁判文书向量doci通过夹角余弦的形 式如公式(1),经过降序排序,获取前s个最相似案例,s取值要适中,
分别统计s个相似案例中应用了哪些法律条例,分别计算这些法律条例的置 信度,某个案件适用法律条例j的置信度如公式(2)
其中,sLj是案件适用法律i的置信度,num(j)是s个相似案例中使用法律j的 案件数量,s是总的相似案例数量,sLj的值在0到1之间,对sLj进行降序排 序,值越大则置信度越高。
进一步,步骤5的(1)中
进一步,步骤5的(2)中t的选取可按照公式(3)计算,
通过应用次数构建法律条例相关度矩阵M,如公式(4)
其中,num(·)是取个数的函数,表示取满足条件的个数,max()是取最大值 函数,α是一个系数在0到1之间,表示占最大值的百分比,num(nL>αmax(nL)) 是处理整个类别中应用的法律条例不是特别多的情况;Th是一个常数阈值;mij是 t条法律中第i,j条法律条例的相关系数,且i,j∈[1,t],计算如公式(5)
其中∩表示同时出现法律条例i,j,num(·)是取个数的函数,则分子表示同 时出现第i,j条法律条例的案件个数;分母是时出现第i,j条法律条例并且j从1 到t的和,mij∈[0,1]值越大相关性越高,根据相关性组合输出推荐的法律条例。
进一步,步骤5的(3)中推荐的法律条例的输出具体步骤包括:
将sLAW中的每条法律条例与tLAW中的法律条例相对应,当sLAW中的某条 法律sLp与tLAW中法律条例tLq相对应,则取的关度矩阵M中的q行 mqj,j={1,2,...,t}并进行排序,取前t′个mqj,j={1,2,...,t}对应的条法律条例 GLp={sLp,l1,l2,...,lt′},构成一组法律推荐输出,GLp中至少包一条sLAW中 的法律条例,l是与tLq相关度高的前t′个法律条例;
当sLAW所有的法律条例均能与tLAW中的法律条例对应上,则sLAW共有s′ 条置信度高的法律条例,则根据相关度矩阵共有s′组法律推荐输出,将sLAW与 tLAW中无法对应的法律条例丢弃,如果sLAW中所有的法律条例均无法对应到 tLAW,则推荐失败;
对推荐的法律条例组GL进行排序输出,当每组法律条例中包含LAW中法律 条例多,则优先输出;当包含的sLAW中法律条例个数相同,则总置信度高的法 律条例组优先输出。
一种案件法律条例推荐系统,其特征在于:包括依次连接的数据输入模块、 文书预处理模块、法律推荐预处理模块、法律推荐模块、输出模块;
数据输入模块,用于输入待查查询的案件;
文书预处理模块,用于将待查询的案件进行信息提取并向量化;
法律推荐预处理模块,用于初步筛选可能适用的法律条例,根据犯罪类型 获得法律条例相关度矩阵,根据相似案例获得法律的置信度;
法律推荐模块,用于计算搜索案件适用的法律条例;
输出模块,用于展示推荐结果。
进一步,所述法律推荐预处理模块包括犯罪类型预测模型和相似案例计算 模型,所述相似案例计算模型的置信度计算步骤包括:
待查询案件的搜索案件向量Vdoc和某个训练数据的裁判文书向量doci通过 夹角余弦的形式如公式(1),经过降序排序,获取前s个最相似案例,s取值要 适中,
分别统计s个相似案例中应用了哪些法律条例,分别计算这些法律条例的置 信度,某个案件适用法律条例j的置信度如公式(2)
其中,sLj是案件适用法律i的置信度,num(j)是s个相似案例中使用法律j的 案件数量,s是总的相似案例数量,sLj的值在0到1之间,对sLj进行降序排 序,值越大则置信度越高。
进一步,基于所述犯罪类型预测模型的法律条例相关矩阵计算步骤包括:
统计犯罪类型对应的法律条例tL和每条法律条例对应的应用次数nL,按照 nL降序排序,取类别中应用较多的t条法律条例,则由犯罪类型获得相关的法律 推荐tLAW=[tL1,tL2,…,tLt],这里t的选取可按照公式(3)计算,通过应用次数构 建法律条例相关度矩阵M,如公式(4)
其中,num(·)是取个数的函数,表示取满足条件的个数,max()是取最大值 函数,α是一个系数在0到1之间,表示占最大值的百分比,num(nL>αmax(nL)) 是处理整个类别中应用的法律条例不是特别多的情况,Th是一个常数阈值;mij是t条法律中第i,j条法律条例的相关系数,且i,j∈[1,t],计算如公式(5)
其中∩表示同时出现法律条例i,j,num(·)是取个数的函数,则分子表示同 时出现第i,j条法律条例的案件个数;分母是时出现第i,j条法律条例并且j从1 到t的和,mij∈[0,1]值越大相关性越高,根据相关性组合输出推荐的法律条例。
本发明的有益效果:
1、先预测犯罪类型,并结合犯罪类型给出推荐的法律条款及法律条款之间 的相关度矩阵,模型结构简化,利用相似案例的法律条款进行修正,提高推荐 的准确性。
2、提取裁判文书案情信息和当事人、罪名等案件结构化特征信息信息,并 对结构化信息进行归并对应处理,比整个裁判文书或者部分文书信息进行向量 化更具有代表性。
3、先对文本数据进行词编码,在此基础上再进行句子编码,最后将裁判文 书案件信息和提取的结构化向量化,句编码过程中运用深度学习的方法,深度 挖掘文本信息。
4、具有一定的可扩展性。
附图说明
图1为本发明的系统图。
图2为本发明的文本向量化流程图。
图3为某一具体的裁判文书信息示意图。
图4为某个案件的具体详情示意图。
具体实施方式
下面结合具体实施例来对本发明进行进一步说明,但并不将本发明局限于 这些具体实施方式。本领域技术人员应该认识到,本发明涵盖了权利要求书范 围内所可能包括的所有备选方案、改进方案和等效方案。
参见图1,一种案件法律条例推荐系统,包括依次连接的数据输入模块、文 书预处理模块、法律推荐预处理模块、法律推荐模块、输出模块;
数据输入模块,用于输入待查查询的案件;
文书预处理模块,用于将待查询的案件进行信息提取并向量化;
法律推荐预处理模块,用于初步筛选可能适用的法律条例,根据犯罪类型 获得法律条例相关度矩阵,根据相似案例获得法律的置信度;
法律推荐模块,用于计算搜索案件适用的法律条例;
输出模块,用于展示推荐结果。
具体的推荐方法如下:
本实施例以上海地区的刑事裁判文书为例,共有164902个裁判文书,犯罪类 型有248种,应用法律类型有280种,如《刑法》《环境保护法》《土地法等》。
步骤1:数据获取
授权获取裁判文书信息,并对裁判文书中涉及到的隐私信息进行处理,从 裁判文书中可以看到被告人信息、犯罪类型、案情简介、应用的法律条文、判 决结果等信息。获取具体的裁判文书信息如图3所示。
授权获取法律条文信息,如:《刑法》、《民法》、《知识产权法》等,并保存。
步骤2:裁判文书预处理
裁判文书一般都有固定的格式,记录了犯罪当事人的基本信息(包括姓名、 性别、出生年月、职业,身体状况),辩护人信息、立案审讯信息、原告或者检 察院的指控信息(包含案发地、案发时间、犯罪具体描述)、法院根据双方提供 的证据认定的犯罪事实描述(以下统称案情信息)、犯罪类型信息、案件应用的 法律条例信息等。
将步骤1中获取到的裁判文书数据作为训练数据,进行预处理。由于不同 的当事人犯案可能会对应不同的法律条例,存在一些地方性法律条款信息,根 据案发时间可以判断当事人犯案时的年龄,因此采用自然语言处理实体识别技 术或者正则表达式的形式提取裁判文书中信息,包括:当事人基本信息、案发 地、案发时间、案情信息、犯罪类型信息、案件应用的法律条例信息。
(1)将当事人性别编码为男、女,当事人基本信息中按照当事人出生年月 和案发时间,计算当事人犯案时的年龄,对应到:未成年、青年、中年、老年; 同样按照法律上规定的特殊人员信息将当事人的职业映射为:普通、军人、公 务员、警察等;将当事人的身体状况映射为:健康,怀孕妇女,哺乳期妇女, 残疾人,精神疾病患者,癌症等。经过处理后的当事人信息构成结构化的特征: 性别,年龄,职业,身体状况。
(2)案发地按照中国的行政区(最小粒度为省直辖市)进行处理,案情信 息是一段描述性文本信息,需要将文本向量化之后使用,犯罪类型信息也进行 唯一编码,方便一一对应并为后续处理做好准备。
(3)将法律条例信息进行处理,标记法律出台或者修订的时间,将一条法 律中的多个条款信息进行拆分。将法律类型和法律条例分别编码处理,如《刑 法》001,第一条001,出台时间1979年,则刑法第一条编码为0010011979, 法律条例的编码具有唯一性。
最终,裁判文书经过预处理之后得到结构化信息:性别,年龄,职业,身 体状况,案发地,犯罪类型,法律条例,和非结构化信息:案情信息。
提取裁判文书中的当事人信息、案发地和案发时间信息、案情信息、犯罪 类型信息及判刑应用的法律条例信息,例如:
字段 | 描述 |
姓别 | 女 |
年龄 | 未成年 |
职业 | 普通 |
身体状况 | 健康 |
案发地 | 上海 |
案发时间 | 20140128 |
案情信息 | 被告人周**以非法…. |
法律条例 | 0010011979(《刑法》第二百六十四条) |
步骤3:文本向量化
整个裁判文书文本较长,案情信息描述文本不会过于冗长,如果将整个裁 判文书进行向量化,会引入不必要的干扰不能突出重点,然而传统的自然语言 处理one-hot,tf-idf等向量化方式不考虑上下文之间的关联,向量化过程中不能 很好的表示裁判文书所表达的信息。只提取案情信息则包含的当事人信息较少, 不同的犯案当事人的判决结果可能存在差别。为了更好的表示裁判文书信息, 本实施例采用深度学习及步骤2中提取的结构化信息f进行向量化,算法示意图 如图2。
计算机无法直接处理文本信息,首先需要将文本进行分词处理,中文不像 英语,单词中没有明确的分割符需要借助分词工具完成分词。本实施例中通过 制作司法领域专用词典和无意义词的停用词典,采用jieba分词基于词典和停用 词典进行分词。步骤2中的案情信息先进行分句,得到n个句子 ws=[ws1,ws2,...,wsn],对每个句子进行分词,例如第i(1≤i≤n)句wsi经过分词后得 到wsi=[w1,w2,...],w1,w2是wsi分词后的单词,vs=[vs1,vs2,...,vsn]是ws对应句子的 单词经过词编码器编码后的向量,例如,句子wsi经过编码后得到vsi=[vw1,vw2,...], vw1是单词w1经过词编码器的词向量,维度为dim1;s=[s1,s2,…,sn]是对应vs中句子 所有的词向量经过句子编码器1后的句向量,s1是vs1的句向量维度为dim2;f=[性 别,年龄,职业,身体状况,案发地]是步骤2中结构化的特征向量,vf是经过词编码模型2后的词向量,向量维度为dim2,将特征向量vf与句向量s共同经过 句子编码模型2,得到文书向量doc,vf与s的维度相同。裁判文书向量是结构 化向量和案情信息文本共同编码的。
(1)词编码模型
词编码模型1和词编码模型2的模型结构相同,维度不同。本实施例首先 采用词编码模型1对分词后的单词编码为词向量,词向量维度为dim1,即用一个 维度为dim1的向量表示一个单词,dim1的取值按照实际的业务需求来定。对特征 f采用词编码模型2进行编码,维度为dim2与句子编码模型输出的句子向量维度 相同。这里的词编码模型是将单词进行向量化,word2vec[1]、glove[2]或者其他深 度学习等向量化模型均可适用。
(2)句编码模型
句编码模型1是将经过词编码后的单词再进行编码,输出句向量;句编码 模型2是将句向量进一步编码为文本向量,即用一个向量表示整个输入的文本 信息。深度学习LSTM[3]时间递归神经网络或者GRU[4]等模型均可进行编码,深 度挖掘文本隐含的信息量。
具体的,法律文书是非结构化信息,计算机无法直接计算,首先需要将文 本进行分词处理,中文不像英语,单词中没有明确的分割符需要借助分词工具 完成分词。本实施例中通过制作司法领域专用词典和无意义词的停用词典,采 用jieba分词基于词典和停用词典进行分词。如某个案件详情如图4所示。
首先按照标点符号断句分为4句,然后进行分词得到:
1:被告/单位/公司/被告人/违反/发票/法规/被告人/人为/被告/单位/虚开/ 增值税/专用发票/虚开/税款/数额较大/致使/国家/税款/情节严重/被告/单位/公 司/构成/虚开/增值税/专用发票/被告人/责任人员/行为/构成/单位/虚开/增值税 /专用发票/
2:公诉/机关/成立/本院/予以/支持/
3:被告人/投案/犯罪事实/被告人/被告/单位/认定/自首/结合/被告/单位/ 补缴/税款/被告/依法/处罚/被告人/依法/减轻/处罚/
4:辩护人/要求/被告人/处罚/意见/本院/予以/采纳
经过分句后得到4个句子,每个句子有若干单词,本实施例选取word2vec 词编码模型,并设置dim1=dim2=100,经过词编码后的单词向量均为100维;本 实施例选取LSTM短时记忆模型作为句编码模型,经过据编码模型后的向量维度 为100维,最后将步骤2中的特征值向量和经过句子编码模型2的向量进行编 码,得到最终的文本向量doc。
步骤4:犯罪类型预测模型
相同的犯罪类型,根据犯案情节轻重,当事人的具体信息,认罪情况等往 往会有不同的判案依据和量刑标准,犯罪类型预测模型是在目前法律规定的犯 罪类型上再进行进一步细化,以提供更准确的法律依据。
步骤2中已经提取出了犯罪类型和应用的法律条例信息,并将这些信息进 行了结构化,步骤3中获得了裁判文书的文本向量,即每个向量化的裁判文书 可以对应到相应的犯罪类型和法律条例。将经过处理的裁判文书按照法律上规 定的犯罪类型进行划分,为案件数量多的犯罪类型构建预测模型,即将裁判文 书进行更详细的划分。这里的预测模型可以采用Kmeans模型或者其他聚类模 型,将向量化的裁判文书信息作为输入,针对不同的犯罪类型构建预测模型。
裁判文书中原告或者检察院会指控被告人的犯罪类型,或者法院根据原告 和被告的陈述可以比较容易的知道案件的犯罪类型,输入一个案件,经过步骤2 和步骤3得到案件的向量化,输入到对应的预测模型中,可获得这个案件属于 哪个详细的类别C,以及这个类别中应用了哪些法律条例tL。
步骤5:推荐法律条文输出
比较相似的案例一般应用的法律依据也具有一定的相似性,相同的犯罪类 型应用的法律依据也具有相似性,只运用相似案例或者犯罪类型来推荐法律条 例具有一定的片面性,结合相似案例和犯罪类型共同推荐法律条例更具有准确 性和适用性。
(1)基于相似案例的法律条例置信度计算
经过步骤3已经得到很多训练数据的裁判文书向量doc,输入待检索的裁判 文书,经过步骤1和步骤2进行向量化得到搜索案件向量Vdoc,搜索案件Vdoc和 某个训练数据doci通过夹角余弦的形式如公式(1),经过降序排序,获取前s个 最相似案例,s取值要适中。本实施例中s取值为100。
分别统计s个相似案中应用了哪些法律条例,分别计算这些法律条例的置信 度,某个案件适用法律条例j的置信度如公式(2)
其中,sLj是案件适用法律i的置信度,num(j)是s个相似案例中使用法律j的 案件数量,s是总的相似案例数量,sLj的值在0到1之间。对sLj进行降序排 序,值越大则置信度越高。
(2)基于犯罪类型的法律条例相关矩阵计算
步骤5中(1)根据案件的相似度获得置信度高的法律条例,步骤4根据案 件犯罪类型获取应用多的法律条例,统计犯罪类型对应的法律条例tL和每条法 律条例对应的应用次数nL,按照nL降序排序,取类别中应用较多的t条法律条例, 则由犯罪类型获得相关的法律推荐tLAW=[tL1,tL2,…,tLt]。但是一些法律条例规定 的内容或者出台的时间不同,不会应用于一个案件中,计算法律条例的相关性, 查看哪些法律条例经常应用于一种案件。通过应用次数构建法律条例相关度矩 阵M,如公式(4)
其中,num(·)是取个数的函数,表示取满足条件的个数,max()是取最大值 函数,α是一个系数在0到1之间,本实施例可取值为0.5,根据实际需要确定, 表示占最大值的百分比,num(nL>αmax(nL))是处理整个类别中应用的法律条例 不是特别多的情况。Th是一个常数阈值,根据实际的业务需求确定,t的取值 太大相关度矩阵较大,取值太小导致信息不全,本实施例Th取值为100。mij是t 条法律中第i,j条法律条例的相关系数,且i,j∈[1,t],计算如公式(5)
其中∩表示同时出现法律条例i,j,num(·)是取个数的函数,则分子表示同 时出现第i,j条法律条例的案件个数;分母是时出现第i,j条法律条例并且j从1 到t的和,mij∈[0,1]值越大相关性越高,根据相关性组合输出推荐的法律条例。
(3)获得推荐的法律条例
步骤5中(1)中对sLi进行降序排序,提取置信度排名为前s′的法律条例 sLAW={sL1,sL2,...,sLs′},s′不能太大,本实施例s′取值为10。根据步骤5 中(2)步计算的法律条例相关度矩阵,输出推荐的法律条例:
①将sLAW中的每条法律条例与tLAW中的法律条例相对应,例如,sLAW中 的某条法律sLp与tLAW中法律条例tLq相对应,则取的关度矩阵M中的q行 mqj,j={1,2,...,t}并进行排序,取前t′个mqj,j={1,2,...,t}对应的条法律条例 GLp={sLp,l1,l2,...,lt′},t′取值为5,构成一组法律推荐输出,GLp中至少包一条sLAW 中的法律条例,l是与tLq相关度高的前t′个法律条例。
②如果sLAW所有的法律条例均能与tLAW中的法律条例对应上,则sLAW共 有s′条置信度高的法律条例,则根据相关度矩阵共有s′组法律推荐输出,将sLAW 与tLAW中无法对应的法律条例丢弃,如果sLAW中所有的法律条例均无法对应到 tLAW,则推荐失败。
③对推荐的法律条例组GL进行排序输出。排序的思想是每组法律条例中包 含LAW中法律条例多,则优先输出;如果包含的sLAW中法律条例个数相同,则 总置信度高的法律条例组优先输出。
本发明首先运用结构化特征信息和案件详情信息对文本进行向量化,其次预 测案件的犯罪类型得到法律条文的相关度矩阵,并且计算相似案例应用的法律 条例置信度,最后基于犯罪类型及相似案件给出案件应用的法律条文推荐组合。
本发明先预测犯罪类型,并结合犯罪类型给出推荐的法律条款及法律条款之 间的相关度矩阵,模型结构简化,利用相似案例的法律条款进行修正,提高推 荐的准确性;提取裁判文书案情信息和当事人、罪名等案件结构化特征信息信 息,并对结构化信息进行归并对应处理,比整个裁判文书或者部分文书信息进 行向量化更具有代表性;先对文本数据进行词编码,在此基础上再进行句子编 码,最后将裁判文书案件信息和提取的结构化向量化,句编码过程中运用深度 学习的方法,深度挖掘文本信息;具有一定的可扩展性。
Claims (10)
1.一种案件法律条例推荐方法,其特征在于:包括
步骤1,获取裁判文书信息和基本的判案法律条例信息,并对裁判文书涉及到的敏感信息进行处理;
步骤2,将获取的裁判文书进行预处理得到结构化信息和非结构化信息;
步骤3,将结构化信息向量化,非结构化信息分句分词后向量化,并在向量化基础上将结构化信息和非结构化信息共同编码形成裁判文书向量;
步骤4,将裁判文书向量输入到犯罪类型预测模型获取相应案件的详细类别C,以及这个类别中应用的法律条例tL;
步骤5,待检索的裁判文书的推荐法律条文输出,包括
(1)将待检索的裁判文书经步骤1和步骤2进行向量化得到的搜索案件向量,并计算与步骤3中训练数据相似的裁判文书,进行相似案例的法律条例置信度计算,并提取置信度排名靠前s′的相似案例对应的法律条例sLAW={sL1,sL2,...,sLs′};
(2)根据案件犯罪类型获取应用多的法律条例,统计犯罪类型对应的法律条例tL和每条法律条例对应的应用次数nL,按照nL降序排序,取类别中应用较多的t条法律条例,则由犯罪类型获得相关的法律推荐tLAW=[tL1,tL2,…,tLt],并通过应用次数nL构建法律条例相关度矩阵M;
(3)将sLAW中的每条法律条例与tLAW中的法律条例相对应,从法律条例相关度矩阵M中获取对应上的法律条例的相关系数,并根据相关系数的相关度输出推荐的法律条例,并且将推荐的多组法律条例进行排序输出。
2.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:结构化信息包括性别,年龄,职业,身体状况,案发地,犯罪类型,法律条例,非结构化信息包括案情信息。
3.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:步骤3中通过词编码模型与句编码模型对结构化信息和非结构化信息进行向量化,具体包括:
词编码模型2对结构化信息进行编码,输出维度为dim2的词向量;
词编码模型1对非结构化信息分局分词后的单词进行编码,输出维度为dim1的词向量;
句编码模型1是将经过词编码模型1词编码后的单词再进行编码,输出维度为dim2的句向量;
句编码模型2是将句编码模型1编码后的句向量和词编码模型2编码后的词向量进一步编码为裁判文书向量。
4.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:步骤5的(1)中置信度计算步骤包括:
搜索案件向量Vdoc和某个训练数据的裁判文书向量doci通过夹角余弦的形式如公式(1),经过降序排序,获取前s个最相似案例,s取值要适中,
<mrow>
<mi>c</mi>
<mi>o</mi>
<mi>s</mi>
<mo><</mo>
<mi>V</mi>
<mi>d</mi>
<mi>o</mi>
<mi>c</mi>
<mo>,</mo>
<msub>
<mi>doc</mi>
<mi>i</mi>
</msub>
<mo>></mo>
<mo>=</mo>
<mfrac>
<mrow>
<mo><</mo>
<mi>V</mi>
<mi>d</mi>
<mi>o</mi>
<mi>c</mi>
<mo>,</mo>
<msub>
<mi>doc</mi>
<mi>i</mi>
</msub>
<mo>></mo>
</mrow>
<mrow>
<mo>|</mo>
<mi>V</mi>
<mi>d</mi>
<mi>o</mi>
<mi>c</mi>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>doc</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
分别统计s个相似案例中应用了哪些法律条例,分别计算这些法律条例的置信度,某个案件适用法律条例j的置信度如公式(2)
<mrow>
<msub>
<mi>sL</mi>
<mi>j</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
<mi>s</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,sLj是案件适用法律i的置信度,num(j)是s个相似案例中使用法律j的案件数量,s是总的相似案例数量,sLj的值在0到1之间,对sLj进行降序排序,值越大则置信度越高。
5.根据权利要求4所述的一种案件法律条例推荐方法,其特征在于:步骤5的(1)中
6.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:步骤5的(2)中t的选取可按照公式(3)计算,
<mrow>
<mi>t</mi>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>></mo>
<mi>&alpha;</mi>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>h</mi>
<mo><</mo>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>></mo>
<mi>&alpha;</mi>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>T</mi>
<mi>h</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>e</mi>
<mi>l</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
通过应用次数构建法律条例相关度矩阵M,如公式(4)
其中,num(·)是取个数的函数,表示取满足条件的个数,max()是取最大值函数,α是一个系数在0到1之间,表示占最大值的百分比,num(nL>αmax(nL))是处理整个类别中应用的法律条例不是特别多的情况;Th是一个常数阈值;mij是t条法律中第i,j条法律条例的相关系数,且i,j∈[1,t],计算如公式(5)
<mrow>
<msub>
<mi>m</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>tL</mi>
<mi>i</mi>
</msub>
<mo>&cap;</mo>
<msub>
<mi>tL</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>t</mi>
</msubsup>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>tL</mi>
<mi>i</mi>
</msub>
<mo>&cap;</mo>
<msub>
<mi>tL</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中∩表示同时出现法律条例i,j,num(·)是取个数的函数,则分子表示同时出现第i,j条法律条例的案件个数;分母是时出现第i,j条法律条例并且j从1到t的和,mij∈[0,1]值越大相关性越高,根据相关性组合输出推荐的法律条例。
7.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:步骤5的(3)中推荐的法律条例的输出具体步骤包括:
将sLAW中的每条法律条例与tLAW中的法律条例相对应,当sLAW中的某条法律sLp与tLAW中法律条例tLq相对应,则取的关度矩阵M中的q行mqj,j={1,2,...,t}并进行排序,取前t′个mqj,j={1,2,...,t}对应的条法律条例构成一组法律推荐输出,GLp中至少包一条sLAW中的法律条例,l是与tLq相关度高的前t′个法律条例;
当sLAW所有的法律条例均能与tLAW中的法律条例对应上,则sLAW共有s′条置信度高的法律条例,则根据相关度矩阵共有s′组法律推荐输出,将sLAW与tLAW中无法对应的法律条例丢弃,如果sLAW中所有的法律条例均无法对应到tLAW,则推荐失败;
对推荐的法律条例组GL进行排序输出,当每组法律条例中包含LAW中法律条例多,则优先输出;当包含的sLAW中法律条例个数相同,则总置信度高的法律条例组优先输出。
8.一种案件法律条例推荐系统,其特征在于:包括依次连接的数据输入模块、文书预处理模块、法律推荐预处理模块、法律推荐模块、输出模块;
数据输入模块,用于输入待查查询的案件;
文书预处理模块,用于将待查询的案件进行信息提取并向量化;
法律推荐预处理模块,用于初步筛选可能适用的法律条例,根据犯罪类型获得法律条例相关度矩阵,根据相似案例获得法律的置信度;
法律推荐模块,用于计算搜索案件适用的法律条例;
输出模块,用于展示推荐结果。
9.根据权利要求8所述的一种案件法律条例推荐系统,其特征在于:所述法律推荐预处理模块包括犯罪类型预测模型和相似案例计算模型,所述相似案例计算模型的置信度计算步骤包括:
待查询案件的搜索案件向量Vdoc和某个训练数据的裁判文书向量doci通过夹角余弦的形式如公式(1),经过降序排序,获取前s个最相似案例,s取值要适中,
<mrow>
<mi>c</mi>
<mi>o</mi>
<mi>s</mi>
<mo><</mo>
<mi>V</mi>
<mi>d</mi>
<mi>o</mi>
<mi>c</mi>
<mo>,</mo>
<msub>
<mi>doc</mi>
<mi>i</mi>
</msub>
<mo>></mo>
<mo>=</mo>
<mfrac>
<mrow>
<mo><</mo>
<mi>V</mi>
<mi>d</mi>
<mi>o</mi>
<mi>c</mi>
<mo>,</mo>
<msub>
<mi>doc</mi>
<mi>i</mi>
</msub>
<mo>></mo>
</mrow>
<mrow>
<mo>|</mo>
<mi>V</mi>
<mi>d</mi>
<mi>o</mi>
<mi>c</mi>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>doc</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
分别统计s个相似案例中应用了哪些法律条例,分别计算这些法律条例的置信度,某个案件适用法律条例j的置信度如公式(2)
<mrow>
<msub>
<mi>sL</mi>
<mi>j</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
<mi>s</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,sLj是案件适用法律i的置信度,num(j)是s个相似案例中使用法律j的案件数量,s是总的相似案例数量,sLj的值在0到1之间,对sLj进行降序排序,值越大则置信度越高。
10.根据权利要求9所述的一种案件法律条例推荐系统,其特征在于:基于所述犯罪类型预测模型的法律条例相关矩阵计算步骤包括:
统计犯罪类型对应的法律条例tL和每条法律条例对应的应用次数nL,按照nL降序排序,取类别中应用较多的t条法律条例,则由犯罪类型获得相关的法律推荐tLAW=[tL1,tL2,…,tLt],这里t的选取可按照公式(3)计算,通过应用次数构建法律条例相关度矩阵M,如公式(4)
<mrow>
<mi>t</mi>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>></mo>
<mi>&alpha;</mi>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>h</mi>
<mo><</mo>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>></mo>
<mi>&alpha;</mi>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>(</mo>
<mi>n</mi>
<mi>L</mi>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>T</mi>
<mi>h</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>e</mi>
<mi>l</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,num(·)是取个数的函数,表示取满足条件的个数,max()是取最大值函数,α是一个系数在0到1之间,表示占最大值的百分比,num(nL>αmax(nL))是处理整个类别中应用的法律条例不是特别多的情况,Th是一个常数阈值;mij是t条法律中第i,j条法律条例的相关系数,且i,j∈[1,t],计算如公式(5)
<mrow>
<msub>
<mi>m</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>tL</mi>
<mi>i</mi>
</msub>
<mo>&cap;</mo>
<msub>
<mi>tL</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>t</mi>
</msubsup>
<mi>n</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>tL</mi>
<mi>i</mi>
</msub>
<mo>&cap;</mo>
<msub>
<mi>tL</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中∩表示同时出现法律条例i,j,num(·)是取个数的函数,则分子表示同时出现第i,j条法律条例的案件个数;分母是时出现第i,j条法律条例并且j从1到t的和,mij∈[0,1]值越大相关性越高,根据相关性组合输出推荐的法律条例。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710893794.2A CN107818138B (zh) | 2017-09-28 | 2017-09-28 | 一种案件法律条例推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710893794.2A CN107818138B (zh) | 2017-09-28 | 2017-09-28 | 一种案件法律条例推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107818138A true CN107818138A (zh) | 2018-03-20 |
CN107818138B CN107818138B (zh) | 2020-05-19 |
Family
ID=61607544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710893794.2A Active CN107818138B (zh) | 2017-09-28 | 2017-09-28 | 一种案件法律条例推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107818138B (zh) |
Cited By (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563703A (zh) * | 2018-03-26 | 2018-09-21 | 北京北大英华科技有限公司 | 一种罪名的判定方法、装置及计算机设备、存储介质 |
CN108573057A (zh) * | 2018-04-25 | 2018-09-25 | 王慧 | 一种法律文书与法律法规对应性检索方法 |
CN108595532A (zh) * | 2018-04-02 | 2018-09-28 | 三峡大学 | 一种法律文本的量子聚类系统及方法 |
CN108681551A (zh) * | 2018-03-30 | 2018-10-19 | 北京智慧正安科技有限公司 | 文书对比方法、电子装置及计算机可读存储介质 |
CN108763484A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于lda主题模型的法条推荐方法 |
CN109213864A (zh) * | 2018-08-30 | 2019-01-15 | 广州慧睿思通信息科技有限公司 | 基于深度学习的刑事案件预判系统及其构建和预判方法 |
CN109299317A (zh) * | 2018-11-12 | 2019-02-01 | 百度在线网络技术(北京)有限公司 | 音乐作品推荐的方法、装置、存储介质和终端设备 |
CN109299091A (zh) * | 2018-09-05 | 2019-02-01 | 中国平安财产保险股份有限公司 | 基于数据分析的智能推荐律师的方法、装置及计算机设备 |
CN109409625A (zh) * | 2018-08-16 | 2019-03-01 | 上海绿狮智能信息科技股份有限公司 | 一种对法律事务进行量化评估的方法 |
CN109446416A (zh) * | 2018-09-26 | 2019-03-08 | 南京大学 | 基于词向量模型的法条推荐方法 |
CN109582964A (zh) * | 2018-11-29 | 2019-04-05 | 天津工业大学 | 基于婚姻法司法判决文书大数据的智能法律咨询辅助系统 |
CN109739950A (zh) * | 2018-12-25 | 2019-05-10 | 中国政法大学 | 筛选适用法律条文的方法及装置 |
CN109739888A (zh) * | 2018-12-25 | 2019-05-10 | 北京市律典通科技有限公司 | 同案同判方法和系统 |
CN109829055A (zh) * | 2019-02-22 | 2019-05-31 | 苏州大学 | 基于过滤门机制的用户法条预测方法 |
CN109871452A (zh) * | 2019-01-31 | 2019-06-11 | 深度好奇(北京)科技有限公司 | 确定犯罪特征的方法、装置以及存储介质 |
CN109918495A (zh) * | 2019-02-28 | 2019-06-21 | 南京大学 | 一种面向交通事故责任纠纷案件的法条推荐方法 |
CN110046259A (zh) * | 2019-03-15 | 2019-07-23 | 浙江大学城市学院 | 一种基于判决书文本的涉毒案件深度分析方法 |
CN110069609A (zh) * | 2019-03-15 | 2019-07-30 | 平安科技(深圳)有限公司 | 裁判文书分析方法、装置、计算机设备及存储介质 |
CN110069598A (zh) * | 2019-03-12 | 2019-07-30 | 北京睿企信息科技有限公司 | 一种智能调解方法及系统 |
CN110196977A (zh) * | 2019-05-31 | 2019-09-03 | 广西南宁市博睿通软件技术有限公司 | 一种智能警情督导处理系统及方法 |
CN110276068A (zh) * | 2019-05-08 | 2019-09-24 | 清华大学 | 法律案情分析方法及装置 |
CN110377618A (zh) * | 2019-06-17 | 2019-10-25 | 平安科技(深圳)有限公司 | 裁决结果分析方法、装置、计算机设备和存储介质 |
CN110647631A (zh) * | 2018-06-25 | 2020-01-03 | 阿里巴巴集团控股有限公司 | 案例推荐的方法及装置、存储介质、处理器 |
CN110826316A (zh) * | 2019-11-06 | 2020-02-21 | 北京交通大学 | 一种应用于裁判文书中敏感信息的识别方法 |
CN110851584A (zh) * | 2019-11-13 | 2020-02-28 | 成都华律网络服务有限公司 | 一种法律条文精准推荐系统和方法 |
CN110858269A (zh) * | 2018-08-09 | 2020-03-03 | 清华大学 | 刑事罪名预测方法及装置 |
CN110955812A (zh) * | 2018-09-26 | 2020-04-03 | 北京国双科技有限公司 | 一种敏感案件识别方法及装置 |
CN110968689A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 罪名及法条预测模型的训练方法以及罪名及法条预测方法 |
CN110969276A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 判决预测方法、判决预测模型获得方法及装置 |
CN110990522A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法和系统 |
CN110990560A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种司法数据处理方法及系统 |
CN110990523A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法及系统 |
CN111178817A (zh) * | 2018-11-13 | 2020-05-19 | 北大方正集团有限公司 | 基于深度学习的裁判结果获取方法和装置 |
CN111177382A (zh) * | 2019-12-23 | 2020-05-19 | 四川大学 | 基于FastText算法的智能法条推荐辅助系统 |
CN111191455A (zh) * | 2018-10-26 | 2020-05-22 | 南京大学 | 一种交通事故损害赔偿中法律条文预测方法 |
CN111198953A (zh) * | 2018-11-16 | 2020-05-26 | 北京智慧正安科技有限公司 | 基于案件文本信息推荐类案的方法、系统及计算机可读存储介质 |
CN111242307A (zh) * | 2018-11-13 | 2020-06-05 | 北大方正集团有限公司 | 基于深度学习的裁判结果获取方法、装置及存储介质 |
CN111461932A (zh) * | 2020-04-09 | 2020-07-28 | 北京北大软件工程股份有限公司 | 基于大数据的行政处罚自由裁量权合理性评估方法及装置 |
CN111797221A (zh) * | 2020-06-16 | 2020-10-20 | 北京北大软件工程股份有限公司 | 类似案件推荐方法及装置 |
CN112100321A (zh) * | 2020-07-31 | 2020-12-18 | 东南大学 | 一种基于网络表示学习的相似案例推荐方法 |
CN112241466A (zh) * | 2020-09-22 | 2021-01-19 | 天津永兴泰科技股份有限公司 | 一种基于动物识图的野生动物保护法律推荐系统 |
CN112396539A (zh) * | 2019-07-30 | 2021-02-23 | 曾建生 | 一种基于人工智能的行政执法自适应辅助系统实现方法 |
WO2021031383A1 (zh) * | 2019-08-16 | 2021-02-25 | 平安科技(深圳)有限公司 | 智能辅助审判方法、装置、计算机设备及存储介质 |
CN112581325A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种辅助裁量方法、装置、设备及存储介质 |
CN112884618A (zh) * | 2020-12-22 | 2021-06-01 | 王磊 | 法律条文推荐方法 |
CN113095851A (zh) * | 2021-04-02 | 2021-07-09 | 浙江玖重科技有限公司 | 烟草信息采集方法、装置、系统及可读存储介质 |
WO2021143056A1 (zh) * | 2020-01-16 | 2021-07-22 | 平安科技(深圳)有限公司 | 文本结论智能推荐方法、装置、计算机设备及计算机可读存储介质 |
CN113536780A (zh) * | 2021-06-29 | 2021-10-22 | 华东师范大学 | 一种基于自然语言处理的企业破产案件智能辅助判案方法 |
CN115545671A (zh) * | 2022-11-02 | 2022-12-30 | 广州明动软件股份有限公司 | 一种法律法规结构化处理的方法、系统 |
CN116049368A (zh) * | 2023-02-10 | 2023-05-02 | 南京智云兴禾信息科技有限公司 | 一种基于法律文本矢量分析的内容抓取系统 |
CN117473074A (zh) * | 2023-11-01 | 2024-01-30 | 中国通信建设集团有限公司数智科创分公司 | 一种基于人工智能的司法案例智能信息匹配系统及方法 |
CN117609487A (zh) * | 2024-01-19 | 2024-02-27 | 武汉百智诚远科技有限公司 | 基于人工智能的法律条文快速检索方法及系统 |
CN118095249A (zh) * | 2024-04-03 | 2024-05-28 | 北京天融信网络安全技术有限公司 | 标准法规自动匹配测试用例的方法、处理器及计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101454776A (zh) * | 2005-10-04 | 2009-06-10 | 汤姆森环球资源公司 | 用于识别相关法律文件的系统、方法、和软件 |
US20170004548A1 (en) * | 2015-06-30 | 2017-01-05 | Linkedin Corporation | Generating and ranking service provider recommendations in a social network |
CN107122451A (zh) * | 2017-04-26 | 2017-09-01 | 北京科技大学 | 一种法律文书案由分类器的自动构建方法 |
-
2017
- 2017-09-28 CN CN201710893794.2A patent/CN107818138B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101454776A (zh) * | 2005-10-04 | 2009-06-10 | 汤姆森环球资源公司 | 用于识别相关法律文件的系统、方法、和软件 |
CN107103027A (zh) * | 2005-10-04 | 2017-08-29 | 汤姆森路透社全球资源公司 | 用于识别相关法律文件的系统、方法、和软件 |
US20170004548A1 (en) * | 2015-06-30 | 2017-01-05 | Linkedin Corporation | Generating and ranking service provider recommendations in a social network |
CN107122451A (zh) * | 2017-04-26 | 2017-09-01 | 北京科技大学 | 一种法律文书案由分类器的自动构建方法 |
Non-Patent Citations (1)
Title |
---|
李永海: "基于相似案例分析的决策方法与应用研究", 《中国博士学位论文全文数据库》 * |
Cited By (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563703A (zh) * | 2018-03-26 | 2018-09-21 | 北京北大英华科技有限公司 | 一种罪名的判定方法、装置及计算机设备、存储介质 |
CN108681551A (zh) * | 2018-03-30 | 2018-10-19 | 北京智慧正安科技有限公司 | 文书对比方法、电子装置及计算机可读存储介质 |
CN108595532A (zh) * | 2018-04-02 | 2018-09-28 | 三峡大学 | 一种法律文本的量子聚类系统及方法 |
CN108573057A (zh) * | 2018-04-25 | 2018-09-25 | 王慧 | 一种法律文书与法律法规对应性检索方法 |
CN108763484A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于lda主题模型的法条推荐方法 |
CN110647631A (zh) * | 2018-06-25 | 2020-01-03 | 阿里巴巴集团控股有限公司 | 案例推荐的方法及装置、存储介质、处理器 |
CN110858269A (zh) * | 2018-08-09 | 2020-03-03 | 清华大学 | 刑事罪名预测方法及装置 |
CN110858269B (zh) * | 2018-08-09 | 2022-03-08 | 清华大学 | 事实描述文本预测方法及装置 |
CN109409625A (zh) * | 2018-08-16 | 2019-03-01 | 上海绿狮智能信息科技股份有限公司 | 一种对法律事务进行量化评估的方法 |
CN109409625B (zh) * | 2018-08-16 | 2021-09-14 | 上海绿狮智能信息科技股份有限公司 | 一种对法律事务进行量化评估的方法 |
CN109213864A (zh) * | 2018-08-30 | 2019-01-15 | 广州慧睿思通信息科技有限公司 | 基于深度学习的刑事案件预判系统及其构建和预判方法 |
CN109299091A (zh) * | 2018-09-05 | 2019-02-01 | 中国平安财产保险股份有限公司 | 基于数据分析的智能推荐律师的方法、装置及计算机设备 |
CN109299091B (zh) * | 2018-09-05 | 2024-05-07 | 中国平安财产保险股份有限公司 | 基于数据分析的智能推荐律师的方法、装置及计算机设备 |
CN110955812A (zh) * | 2018-09-26 | 2020-04-03 | 北京国双科技有限公司 | 一种敏感案件识别方法及装置 |
CN109446416A (zh) * | 2018-09-26 | 2019-03-08 | 南京大学 | 基于词向量模型的法条推荐方法 |
CN110955812B (zh) * | 2018-09-26 | 2023-04-07 | 北京国双科技有限公司 | 一种敏感案件识别方法及装置 |
CN109446416B (zh) * | 2018-09-26 | 2021-09-28 | 南京大学 | 基于词向量模型的法条推荐方法 |
CN110969276B (zh) * | 2018-09-30 | 2022-08-12 | 北京国双科技有限公司 | 判决预测方法、判决预测模型获得方法及装置 |
CN110990522A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法和系统 |
CN110990522B (zh) * | 2018-09-30 | 2023-07-04 | 北京国双科技有限公司 | 一种法律文书的确定方法和系统 |
CN110990523A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法及系统 |
CN110990560A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种司法数据处理方法及系统 |
CN110990560B (zh) * | 2018-09-30 | 2023-07-07 | 北京国双科技有限公司 | 一种司法数据处理方法及系统 |
CN110968689A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 罪名及法条预测模型的训练方法以及罪名及法条预测方法 |
CN110969276A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 判决预测方法、判决预测模型获得方法及装置 |
CN111191455A (zh) * | 2018-10-26 | 2020-05-22 | 南京大学 | 一种交通事故损害赔偿中法律条文预测方法 |
CN109299317A (zh) * | 2018-11-12 | 2019-02-01 | 百度在线网络技术(北京)有限公司 | 音乐作品推荐的方法、装置、存储介质和终端设备 |
CN111242307A (zh) * | 2018-11-13 | 2020-06-05 | 北大方正集团有限公司 | 基于深度学习的裁判结果获取方法、装置及存储介质 |
CN111178817A (zh) * | 2018-11-13 | 2020-05-19 | 北大方正集团有限公司 | 基于深度学习的裁判结果获取方法和装置 |
CN111198953A (zh) * | 2018-11-16 | 2020-05-26 | 北京智慧正安科技有限公司 | 基于案件文本信息推荐类案的方法、系统及计算机可读存储介质 |
CN109582964A (zh) * | 2018-11-29 | 2019-04-05 | 天津工业大学 | 基于婚姻法司法判决文书大数据的智能法律咨询辅助系统 |
CN109739950A (zh) * | 2018-12-25 | 2019-05-10 | 中国政法大学 | 筛选适用法律条文的方法及装置 |
CN109739888A (zh) * | 2018-12-25 | 2019-05-10 | 北京市律典通科技有限公司 | 同案同判方法和系统 |
CN109871452B (zh) * | 2019-01-31 | 2021-04-02 | 深度好奇(北京)科技有限公司 | 确定犯罪特征的方法、装置以及存储介质 |
CN109871452A (zh) * | 2019-01-31 | 2019-06-11 | 深度好奇(北京)科技有限公司 | 确定犯罪特征的方法、装置以及存储介质 |
CN109829055A (zh) * | 2019-02-22 | 2019-05-31 | 苏州大学 | 基于过滤门机制的用户法条预测方法 |
CN109918495A (zh) * | 2019-02-28 | 2019-06-21 | 南京大学 | 一种面向交通事故责任纠纷案件的法条推荐方法 |
CN110069598A (zh) * | 2019-03-12 | 2019-07-30 | 北京睿企信息科技有限公司 | 一种智能调解方法及系统 |
CN110069609B (zh) * | 2019-03-15 | 2023-04-18 | 平安科技(深圳)有限公司 | 裁判文书分析方法、装置、计算机设备及存储介质 |
CN110046259A (zh) * | 2019-03-15 | 2019-07-23 | 浙江大学城市学院 | 一种基于判决书文本的涉毒案件深度分析方法 |
CN110069609A (zh) * | 2019-03-15 | 2019-07-30 | 平安科技(深圳)有限公司 | 裁判文书分析方法、装置、计算机设备及存储介质 |
CN110276068B (zh) * | 2019-05-08 | 2020-08-28 | 清华大学 | 法律案情分析方法及装置 |
CN110276068A (zh) * | 2019-05-08 | 2019-09-24 | 清华大学 | 法律案情分析方法及装置 |
CN110196977B (zh) * | 2019-05-31 | 2023-06-09 | 广西南宁市博睿通软件技术有限公司 | 一种智能警情督导处理系统及方法 |
CN110196977A (zh) * | 2019-05-31 | 2019-09-03 | 广西南宁市博睿通软件技术有限公司 | 一种智能警情督导处理系统及方法 |
CN110377618B (zh) * | 2019-06-17 | 2024-01-05 | 平安科技(深圳)有限公司 | 裁决结果分析方法、装置、计算机设备和存储介质 |
CN110377618A (zh) * | 2019-06-17 | 2019-10-25 | 平安科技(深圳)有限公司 | 裁决结果分析方法、装置、计算机设备和存储介质 |
CN112396539A (zh) * | 2019-07-30 | 2021-02-23 | 曾建生 | 一种基于人工智能的行政执法自适应辅助系统实现方法 |
WO2021031383A1 (zh) * | 2019-08-16 | 2021-02-25 | 平安科技(深圳)有限公司 | 智能辅助审判方法、装置、计算机设备及存储介质 |
CN112581325A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种辅助裁量方法、装置、设备及存储介质 |
CN110826316A (zh) * | 2019-11-06 | 2020-02-21 | 北京交通大学 | 一种应用于裁判文书中敏感信息的识别方法 |
CN110826316B (zh) * | 2019-11-06 | 2021-08-10 | 北京交通大学 | 一种应用于裁判文书中敏感信息的识别方法 |
CN110851584A (zh) * | 2019-11-13 | 2020-02-28 | 成都华律网络服务有限公司 | 一种法律条文精准推荐系统和方法 |
CN110851584B (zh) * | 2019-11-13 | 2023-12-15 | 成都华律网络服务有限公司 | 一种法律条文精准推荐系统和方法 |
CN111177382A (zh) * | 2019-12-23 | 2020-05-19 | 四川大学 | 基于FastText算法的智能法条推荐辅助系统 |
CN111177382B (zh) * | 2019-12-23 | 2023-12-08 | 四川大学 | 基于FastText算法的智能法条推荐辅助系统 |
WO2021143056A1 (zh) * | 2020-01-16 | 2021-07-22 | 平安科技(深圳)有限公司 | 文本结论智能推荐方法、装置、计算机设备及计算机可读存储介质 |
CN111461932A (zh) * | 2020-04-09 | 2020-07-28 | 北京北大软件工程股份有限公司 | 基于大数据的行政处罚自由裁量权合理性评估方法及装置 |
CN111461932B (zh) * | 2020-04-09 | 2024-05-14 | 北京北大软件工程股份有限公司 | 基于大数据的行政处罚自由裁量权合理性评估方法及装置 |
CN111797221B (zh) * | 2020-06-16 | 2023-12-08 | 北京北大软件工程股份有限公司 | 类似案件推荐方法及装置 |
CN111797221A (zh) * | 2020-06-16 | 2020-10-20 | 北京北大软件工程股份有限公司 | 类似案件推荐方法及装置 |
CN112100321A (zh) * | 2020-07-31 | 2020-12-18 | 东南大学 | 一种基于网络表示学习的相似案例推荐方法 |
CN112241466A (zh) * | 2020-09-22 | 2021-01-19 | 天津永兴泰科技股份有限公司 | 一种基于动物识图的野生动物保护法律推荐系统 |
CN112884618A (zh) * | 2020-12-22 | 2021-06-01 | 王磊 | 法律条文推荐方法 |
CN113095851A (zh) * | 2021-04-02 | 2021-07-09 | 浙江玖重科技有限公司 | 烟草信息采集方法、装置、系统及可读存储介质 |
CN113536780A (zh) * | 2021-06-29 | 2021-10-22 | 华东师范大学 | 一种基于自然语言处理的企业破产案件智能辅助判案方法 |
CN115545671B (zh) * | 2022-11-02 | 2023-10-03 | 广州明动软件股份有限公司 | 一种法律法规结构化处理的方法、系统 |
CN115545671A (zh) * | 2022-11-02 | 2022-12-30 | 广州明动软件股份有限公司 | 一种法律法规结构化处理的方法、系统 |
CN116049368B (zh) * | 2023-02-10 | 2023-09-12 | 南京智云兴禾信息科技有限公司 | 一种基于法律文本矢量分析的内容抓取系统 |
CN116049368A (zh) * | 2023-02-10 | 2023-05-02 | 南京智云兴禾信息科技有限公司 | 一种基于法律文本矢量分析的内容抓取系统 |
CN117473074A (zh) * | 2023-11-01 | 2024-01-30 | 中国通信建设集团有限公司数智科创分公司 | 一种基于人工智能的司法案例智能信息匹配系统及方法 |
CN117609487A (zh) * | 2024-01-19 | 2024-02-27 | 武汉百智诚远科技有限公司 | 基于人工智能的法律条文快速检索方法及系统 |
CN117609487B (zh) * | 2024-01-19 | 2024-04-09 | 武汉百智诚远科技有限公司 | 基于人工智能的法律条文快速检索方法及系统 |
CN118095249A (zh) * | 2024-04-03 | 2024-05-28 | 北京天融信网络安全技术有限公司 | 标准法规自动匹配测试用例的方法、处理器及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107818138B (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818138A (zh) | 一种案件法律条例推荐方法及系统 | |
CN111950273B (zh) | 基于情感信息抽取分析的网络舆情突发事件自动识别方法 | |
CN108073569B (zh) | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 | |
CN109543178B (zh) | 一种司法文本标签体系构建方法及系统 | |
CN109271529B (zh) | 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法 | |
CN106484664B (zh) | 一种短文本间相似度计算方法 | |
CN104820629B (zh) | 一种智能的舆情突发事件应急处理系统及方法 | |
CN110032648A (zh) | 一种基于医学领域实体的病历结构化解析方法 | |
CN102314519B (zh) | 一种基于公安领域知识本体模型的信息搜索方法 | |
CN109684642B (zh) | 一种结合页面解析规则和nlp文本向量化的摘要提取方法 | |
CN111078889A (zh) | 一种基于多种实体注意力和改进预训练语言模型的药物间关系抽取方法 | |
CN112559556A (zh) | 表格模式解析和序列掩码的语言模型预训练方法及系统 | |
CN110188192B (zh) | 一种多任务网络构建与多尺度的罪名法条联合预测方法 | |
CN110287323B (zh) | 一种面向目标的情感分类方法 | |
CN103049569A (zh) | 基于向量空间模型的文本相似性匹配方法 | |
CN104462053A (zh) | 一种文本内的基于语义特征的人称代词指代消解方法 | |
CN109800349A (zh) | 基于用户发布内容量化新闻价值的数据处理方法和装置 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
CN109740164A (zh) | 基于深度语义匹配的电力缺陷等级识别方法 | |
CN113869053A (zh) | 一种面向司法文本命名实体识别的方法及系统 | |
CN110162787A (zh) | 一种基于主题信息的类别预测方法及装置 | |
CN115730078A (zh) | 用于类案检索的事件知识图谱构建方法、装置及电子设备 | |
CN112100212A (zh) | 一种基于机器学习和规则匹配的案件情节抽取方法 | |
CN114997288A (zh) | 一种设计资源关联方法 | |
CN108681977A (zh) | 一种律师信息处理方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 310012 1st floor, building 1, 223 Yile Road, Hangzhou City, Zhejiang Province Patentee after: Yinjiang Technology Co.,Ltd. Address before: 310012 1st floor, building 1, 223 Yile Road, Hangzhou City, Zhejiang Province Patentee before: ENJOYOR Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder |