CN104850905A - 一种基于机器学习的法律风险量化评估系统及其方法 - Google Patents

一种基于机器学习的法律风险量化评估系统及其方法 Download PDF

Info

Publication number
CN104850905A
CN104850905A CN201510245648.XA CN201510245648A CN104850905A CN 104850905 A CN104850905 A CN 104850905A CN 201510245648 A CN201510245648 A CN 201510245648A CN 104850905 A CN104850905 A CN 104850905A
Authority
CN
China
Prior art keywords
risk
case
machine learning
legal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510245648.XA
Other languages
English (en)
Inventor
谢飞
刘孜文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai This Information Technology Service Of Collection Co Ltd
Original Assignee
Shanghai This Information Technology Service Of Collection Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai This Information Technology Service Of Collection Co Ltd filed Critical Shanghai This Information Technology Service Of Collection Co Ltd
Priority to CN201510245648.XA priority Critical patent/CN104850905A/zh
Publication of CN104850905A publication Critical patent/CN104850905A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种利用人工智能领域的机器学习技术分析海量法律数据,并基于分析结果进行法律风险评估的法律信息化系统及其方法,属于人工智能,数据分析领域。本发明所涉及的系统和方法,能够利用机器学习技术对大量法律案例数据进行分析,并构建风险评估函数,用于对法律案例风险进行量化评估;能充分发挥计算机人工智能的作用,给出量化的法律风险评估,具有广泛的应用前景。

Description

一种基于机器学习的法律风险量化评估系统及其方法
技术领域
本发明涉及一种利用人工智能领域的机器学习技术分析海量法律数据,并基于分析结果进行法律风险评估的法律信息化系统及方法,属于人工智能,数据分析领域。
背景技术
近年来,机器学习技术在分析处理领域内数据中得到广泛的应用,其核心技术在于收集某一领域内大量相关事例的数据,并基于领域或行业知识对数据进行建模,最后通过计算机模拟人脑学习的方式从大量数据中找到规律。 这类技术应用的优势在于利用计算机系统强大的计算能力,快速处理大量事例,从而在短期内获得一个人类专家需要花数十年时间积累的行业经验,从而代替专家做出决策。除此之外,机器学习技术可以通过对海量数据的处理,发现领域内尚不明确或不为人所知的规律,从而扩充相关领域的知识积累。该类技术在文本搜索、图像视频识别、语音识别等领域有广泛应用,具有良好的经济和社会效益。
法律服务由于其高度的专业性、知识性和逻辑分析,长期以来主要以人工服务为主,信息化程度有限,对人工智能方面的应用不够。目前,计算机科学在法律服务上的应用,主要集中在对法律法规条文、案例、咨询等要素信息的关键字检索,以及基于关键字进行关联。比如,申请号CN201020230720,名称为“一种法律知识库系统”的实用新型专利和申请号CN201020230735,名称为“一种法律问题智能诊断系统”的实用新型专利,都是对法律信息化系统的直接应用。这些应用虽然可以帮助普通人迅速检索相关案例和法律法规,但缺乏对案例的建模和分析能力。这些系统中法律素材的数字化程度不高,只是使用了传统数据库和文本分析技术,不能充分发挥计算机人工智能的作用,更无法给出量化的法律风险评估。
发明内容
有鉴于此,本发明主要提供一种基于机器学习的法律风险量化评估系统和方法,能够利用机器学习技术对大量法律案例数据进行分析,并构建风险评估函数,用于对法律案例风险进行量化评估。
为了实现上述目的,本发明的技术方案是这样实现的:
一种基于机器学习的法律风险量化评估系统,它包括数据导入模块、预处理模块、存储模块、机器学习模块;
所述数据导入模块与存储模块连接,从原始法律数据中找出已知法律风险的案例,将同一案例的数据放入一个案例包中,并将案例包保存在存储模块;
所述预处理模块从存储模块中读出案例包数据,将数据进行必要的处理,将处理后的数据保存在存储模块中,供机器学习模块使用;
所述机器学习模块从存储模块中读取预处理模块处理过的法律数据,用机器学习算法进行分析建模,输出风险评估函数;
给定案例信息,所述风险评估函数在未知该案例法律风险的条件下,给出该案例法律风险的预测。
进一步的,
所述预处理模块用案例法律风险相关信息构建风险特征向量,案例中的其他信息用于构建案例特征向量;一个案例包可生成一个或多个风险特征向量和案例特征向量。
进一步的,
所述案例特征向量包含一组到多组案例特征值,一个特征值是对相应案例某个特征的描述,所述风险特征向量包含一组或多组风险特征值,一个风险特征值是对相应案例某个风险特征的描述。
进一步的,
所述风险评估函数输出风险评估特征向量,所述风险评估特征向量包含一组或多组评估风险特征值,一个评估风险特征值包含对相应案例某个风险特征的评估。
一种基于机器学习的法律风险量化评估方法,数据导入模块与存储模块连接,从原始法律数据中找出已知法律风险的案例,将同一案例的数据在一个案例包中,并将案例包保存在存储模块;
预处理模块从存储模块中读出案例包数据,将数据进行必要的处理,将处理后的数据保存在存储模块中,供机器学习模块使用;
机器学习模块从存储模块中读取预处理模块处理过的法律数据,用机器学习算法进行分析建模,输出风险评估函数;
给定案例信息,所述风险评估函数在未知该案例法律风险的条件下,给出该案例法律风险的预测。
进一步的,
所述预处理模块用案例法律风险相关信息构建风险特征向量,案例中的其他信息用于构建案例特征向量;一个案例包可生成一个或多个风险特征向量和案例特征向量。
进一步的,
所述案例特征向量包含一组到多组案例特征值,一个特征值是对相应案例某个特征的描述,所述风险特征向量包含一组或多组风险特征值,一个风险特征值是对相应案例某个风险特征的描述.
进一步的,
所述风险评估函数输出风险评估特征向量,所述风险评估特征向量包含一组或多组评估风险特征值,一个评估风险特征值包含对相应案例某个风险特征的评估。
进一步的,
所述机器学习模块生成风险评估函数的方法如下:
A)、准备第一案例包集合和第二案例包集合;
B)、将第一案例包集合输入机器学习算法,得到第一风险评估函数;
C)、用第一风险评估函数预测第二案例包集合中所有案例的风险,输出风险评估特征向量;
D)、验证风险评估函数,将第二案例包集合中所有案例的风险特征向量和步骤C生成的风险评估特征向量输入判定函数进行比较;
E)、若判定函数验证通过,输出第一风险评估函数;否则,不输出第一风险评估函数。
本发明的有益效果:
本发明所涉及的系统和方法,能够利用机器学习技术对大量法律案例数据进行分析,并构建风险评估函数,用于对法律案例风险进行量化评估;能充分发挥计算机人工智能的作用,给出量化的法律风险评估,具有广泛的应用前景。
附图说明
图1为本发明的系统模块图;
图2为本发明的数据导入流程图;
图3为本发明的数据预处理流程图;
图4为本发明的机器学习模块生成风险评估函数流程图;
图5为本发明的案例特征向量示例图;
图6为本发明的风险特征向量示例图;
图7为本发明的风险评估特征向量示例图。
具体实施方式
下面结合附图对本发明进行详细描述:
图1为本发明系统模块图。如图所示,法律数据从数据导入模块输入系统,数据导入模块将法律数据根据案例打包存入存储模块。存储模块与数据倒入模块、预处理模块、机器学习模块连接。预处理模块从存储模块读取案例数据,将案例信息和案例风险信息转换成特定数据模式,供机器学习模块使用。机器学习模块从存储模块读取案例信息,生成风险评估函数,并输出合格的风险评估函数。
本发明数据导入流程如图2所示。 系统首先判断原始法律数据是否可根据案例分类,非案例的数据不被导入。然后,检查案例数据是否包含法律风险信息,不包含法律风险信息的案例数据不被导入。最后,将法律数据根据案例打包,并标示案例ID,保存在存储模块中。
图3描述了预处理模块处理一个案例包的流程。首先从存储模块读出一个案例包,利用案例包中的风险数据生成一个风险特征向量,同时利用案例包中的案例描述信息生成案例特征向量,最后将生成的特征向量存入存储模块中。
图4描述了机器学习模块生成分先评估函数的流程。首先从存储模块读入案例包集合1,利用机器学习算法得到风险评估函数1;其次从存储模块读入案例包集合2,并利用风险评估函数1计算案例包集合2中案例的风险评估特征向量;然后利用判定函数,比较案例包集合2中案例的评估风向向量和实际风险特征向量;如果判定函数通过检验,则输出风险评估函数1,否则不输出风险评估函数1。
图5是一个风险特征向量的例子。如图所示,该风险特征向量被称为N纬特征向量,因为它包含N个特征。风险特征向量的每一行代表一个风险特征的信息。特征信息包括特征ID,特征名称和特征值。风险特征向量用于描述案例的已知法律风险。该例中风险特征向量包含的部分信息显示,对应案例的被告被判处有期徒刑X1年,并赔偿金额X2万元,案件的律师费话费X3万元,诉讼费话费X4万元,案件的诉讼耗时X5年,被告被剥夺政治权利Xn年。
图6是一个案例特征向量的例子。如图所示,该案例特征向量被称为M维特征向量,因为它含有M个特征。案例特征向量的每一行代表一个案例特征的信息。特征信息包含特征ID,特征名称和特征值。案例特征向量用于描述案例信息。该例中案例特征向量包含的部分信息显示,该案例是一个刑事案件,由X3市的一名拥有X2年经验的律师担任辩护律师,该案经鉴定造成精神伤害程度为X4,人身伤害程度为X5,财产损失X6万元,该案的主审法官有Xm年的审案经验。
图7是一个风险评估特征向量的例子。如图所示,该风险评估特征向量被称为K维特征向量,因为它包含K个特征。风险评估特征向量的每一行代表一个风险评估特征的信息。特征信息包含特征ID,特征名称,预估值和可能性。风险评估特征向量由风险评估函数计算得到,代表对一个案例的风险的量化估值。该例中的风险评估特征向量的部分信息对案件风险的评估如下:对应案件的被告被判处长度为X1年到Y1年之间的有期徒刑的可能性为92%,有98%的可能性不会被判处死刑,该案赔偿金额在X2万元和Y2万元之间的可能性为85%,需付律师费X3万元的可能性为93%,需付X4万元诉讼费的可能性为81%,诉讼耗时为X5年的可能性为96%,被告被剥夺政治权利Xk年的可能性为97%。

Claims (9)

1.一种基于机器学习的法律风险量化评估系统,其特征在于:它包括数据导入模块、预处理模块、存储模块、机器学习模块;
所述数据导入模块与存储模块连接,从原始法律数据中找出已知法律风险的案例,将同一案例的数据放入一个案例包中,并将案例包保存在存储模块;
所述预处理模块从存储模块中读出案例包数据,将数据进行必要的处理,将处理后的数据保存在存储模块中,供机器学习模块使用;
所述机器学习模块从存储模块中读取预处理模块处理过的法律数据,用机器学习算法进行分析建模,输出风险评估函数;
给定案例信息,所述风险评估函数在未知该案例法律风险的条件下,给出该案例法律风险的预测。
2.根据权利要求1所述的基于机器学习的法律风险量化评估系统,其特征在于:
所述预处理模块用案例法律风险相关信息构建风险特征向量,案例中的其他信息用于构建案例特征向量;一个案例包可生成一个或多个风险特征向量和案例特征向量。
3.根据权利要求2所述的基于机器学习的法律风险量化评估系统,其特征在于:
所述案例特征向量包含一组到多组案例特征值,一个特征值是对相应案例某个特征的描述,所述风险特征向量包含一组或多组风险特征值,一个风险特征值是对相应案例某个风险特征的描述。
4.根据权利要求1所述的基于机器学习的法律风险量化评估系统,其特征在于:
所述风险评估函数输出风险评估特征向量,所述风险评估特征向量包含一组或多组评估风险特征值,一个评估风险特征值包含对相应案例某个风险特征的评估。
5.一种基于机器学习的法律风险量化评估方法,其特征在于:数据导入模块与存储模块连接,从原始法律数据中找出已知法律风险的案例,将同一案例的数据在一个案例包中,并将案例包保存在存储模块;
预处理模块从存储模块中读出案例包数据,将数据进行必要的处理,将处理后的数据保存在存储模块中,供机器学习模块使用;
机器学习模块从存储模块中读取预处理模块处理过的法律数据,用机器学习算法进行分析建模,输出风险评估函数;
给定案例信息,所述风险评估函数在未知该案例法律风险的条件下,给出该案例法律风险的预测。
6.根据权利要求5所述的基于机器学习的法律风险量化评估方法,其特征在于:
所述预处理模块用案例法律风险相关信息构建风险特征向量,案例中的其他信息用于构建案例特征向量;一个案例包可生成一个或多个风险特征向量和案例特征向量。
7.根据权利要求6所述的基于机器学习的法律风险量化评估方法,其特征在于:
所述案例特征向量包含一组到多组案例特征值,一个特征值是对相应案例某个特征的描述,所述风险特征向量包含一组或多组风险特征值,一个风险特征值是对相应案例某个风险特征的描述。
8.根据权利要求5所述的基于机器学习的法律风险量化评估方法,其特征在于:
所述风险评估函数输出风险评估特征向量,所述风险评估特征向量包含一组或多组评估风险特征值,一个评估风险特征值包含对相应案例某个风险特征的评估。
9.根据权利要求5所述的基于机器学习的法律风险量化评估方法,其特征在于:
所述机器学习模块生成风险评估函数的方法如下:
A、准备第一案例包集合和第二案例包集合;
B、将第一案例包集合输入机器学习算法,得到第一风险评估函数;
C、用第一风险评估函数预测第二案例包集合中所有案例的风险,输出风险评估特征向量;
D、验证风险评估函数,将第二案例包集合中所有案例的风险特征向量和步骤C生成的风险评估特征向量输入判定函数进行比较;
E、若判定函数验证通过,输出第一风险评估函数;否则,不输出第一风险评估函数。
CN201510245648.XA 2015-05-15 2015-05-15 一种基于机器学习的法律风险量化评估系统及其方法 Pending CN104850905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510245648.XA CN104850905A (zh) 2015-05-15 2015-05-15 一种基于机器学习的法律风险量化评估系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510245648.XA CN104850905A (zh) 2015-05-15 2015-05-15 一种基于机器学习的法律风险量化评估系统及其方法

Publications (1)

Publication Number Publication Date
CN104850905A true CN104850905A (zh) 2015-08-19

Family

ID=53850537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510245648.XA Pending CN104850905A (zh) 2015-05-15 2015-05-15 一种基于机器学习的法律风险量化评估系统及其方法

Country Status (1)

Country Link
CN (1) CN104850905A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355537A (zh) * 2016-08-23 2017-01-25 冯村 一种智能串并案分析方法及系统
CN108665182A (zh) * 2018-05-18 2018-10-16 中国科学技术大学 一种专利诉讼风险预测方法
CN109377000A (zh) * 2018-09-21 2019-02-22 安徽和信科技发展有限责任公司 一种人工智能技术的诉讼风险评估装置
CN110490439A (zh) * 2019-08-05 2019-11-22 北京市律典通科技有限公司 诉讼风险评估方法、装置、电子设备及计算机可存储介质
US10504028B1 (en) 2019-04-24 2019-12-10 Capital One Services, Llc Techniques to use machine learning for risk management
CN110675023A (zh) * 2019-08-22 2020-01-10 中国司法大数据研究院有限公司 一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置
CN111967744A (zh) * 2020-08-05 2020-11-20 广东卓维网络有限公司 一种法律事务管理系统
CN112416754A (zh) * 2020-11-02 2021-02-26 中关村科学城城市大脑股份有限公司 一种模型评测方法、终端、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567069A (zh) * 2009-05-27 2009-10-28 瑞迪法证风险管理科技(北京)有限公司 一种法律风险测评数据处理方法和查询系统
CN201804333U (zh) * 2010-06-18 2011-04-20 上海百事通信息技术有限公司 一种法律问题智能诊断系统
CN104063822A (zh) * 2014-06-06 2014-09-24 长沙裕邦软件开发有限公司 一种法律风险诊断方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567069A (zh) * 2009-05-27 2009-10-28 瑞迪法证风险管理科技(北京)有限公司 一种法律风险测评数据处理方法和查询系统
CN201804333U (zh) * 2010-06-18 2011-04-20 上海百事通信息技术有限公司 一种法律问题智能诊断系统
CN104063822A (zh) * 2014-06-06 2014-09-24 长沙裕邦软件开发有限公司 一种法律风险诊断方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高菲: "基于机器学习的计算机辅助量刑初探", 《中国优秀博硕士学位论文全文数据库 (硕士) 社会科学Ⅰ辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355537A (zh) * 2016-08-23 2017-01-25 冯村 一种智能串并案分析方法及系统
CN108665182A (zh) * 2018-05-18 2018-10-16 中国科学技术大学 一种专利诉讼风险预测方法
CN108665182B (zh) * 2018-05-18 2021-12-14 中国科学技术大学 一种专利诉讼风险预测方法
CN109377000A (zh) * 2018-09-21 2019-02-22 安徽和信科技发展有限责任公司 一种人工智能技术的诉讼风险评估装置
US10504028B1 (en) 2019-04-24 2019-12-10 Capital One Services, Llc Techniques to use machine learning for risk management
CN110490439A (zh) * 2019-08-05 2019-11-22 北京市律典通科技有限公司 诉讼风险评估方法、装置、电子设备及计算机可存储介质
CN110675023A (zh) * 2019-08-22 2020-01-10 中国司法大数据研究院有限公司 一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置
CN110675023B (zh) * 2019-08-22 2022-03-25 中国司法大数据研究院有限公司 一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置
CN111967744A (zh) * 2020-08-05 2020-11-20 广东卓维网络有限公司 一种法律事务管理系统
CN112416754A (zh) * 2020-11-02 2021-02-26 中关村科学城城市大脑股份有限公司 一种模型评测方法、终端、系统及存储介质

Similar Documents

Publication Publication Date Title
CN104850905A (zh) 一种基于机器学习的法律风险量化评估系统及其方法
CN107798136B (zh) 基于深度学习的实体关系抽取方法、装置及服务器
CN104834686B (zh) 一种基于混合语义矩阵的视频推荐方法
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN106651057A (zh) 一种基于安装包序列表的移动端用户年龄预测方法
CN113627447B (zh) 标签识别方法、装置、计算机设备、存储介质及程序产品
CN112860841A (zh) 一种文本情感分析方法、装置、设备及存储介质
CN110472011B (zh) 一种诉讼成本预测方法、装置及终端设备
CN108090178A (zh) 一种文本数据分析方法、装置、服务器和存储介质
CN110968688A (zh) 司法数据的处理方法及系统
CN110990523A (zh) 一种法律文书的确定方法及系统
CN111695335A (zh) 一种智能面试方法、装置及终端设备
CN113379528A (zh) 风控模型建立方法、装置和风险控制方法
CN116522131A (zh) 对象表示方法、装置、电子设备及计算机可读存储介质
Corso et al. Big social data and GIS: visualize predictive crime
KR102282328B1 (ko) Lstm을 이용한 국가별 선호도 예측 시스템 및 방법
CN114661858A (zh) 法律文书中存疑法条的识别方法、装置及相关设备
CN111177526B (zh) 网络意见领袖识别方法及装置
CN113988059A (zh) 一种会话数据类型识别方法、系统、设备及存储介质
CN107886232A (zh) 客服的服务质量评价方法和系统
CN113407727B (zh) 基于法律知识图谱的定性量纪推荐方法及相关设备
CN113963357B (zh) 基于知识图谱的敏感文本检测方法及系统
Gudumotu et al. A Survey on Deep Learning Models to Detect Hate Speech and Bullying in Social Media
CN116702784B (zh) 实体链接方法、装置、计算机设备和存储介质
CN111428033B (zh) 一种基于双层卷积神经网络的自动化威胁情报提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150819

RJ01 Rejection of invention patent application after publication