CN110647631A - 案例推荐的方法及装置、存储介质、处理器 - Google Patents
案例推荐的方法及装置、存储介质、处理器 Download PDFInfo
- Publication number
- CN110647631A CN110647631A CN201810664231.0A CN201810664231A CN110647631A CN 110647631 A CN110647631 A CN 110647631A CN 201810664231 A CN201810664231 A CN 201810664231A CN 110647631 A CN110647631 A CN 110647631A
- Authority
- CN
- China
- Prior art keywords
- case
- cases
- similarity
- target
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 239000000463 material Substances 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 23
- 239000000470 constituent Substances 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 24
- 230000015654 memory Effects 0.000 description 22
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种案例推荐的方法及装置、存储介质、处理器。其中,该方法包括:获取目标案件的法律资料,其中,法律资料是记录了案件情况的材料;从法律资料中提取至少一个案件要素,其中,案件要素为表征案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于相似度从历史案件库中为目标案件推荐案例。本发明解决了相关技术中推荐的类似案件的准确度较低的技术问题。
Description
技术领域
本发明涉及司法领域,具体而言,涉及一种案例推荐的方法及装置、存储介质、处理器。
背景技术
在司法领域,给定一个案件,需要推荐类似的历史案例,以帮助法官审理目前给定案件,可以减轻法官工作量,同时为同案同判的目的提供帮助。在具体的推荐类似案件的方案中,主要采用文本相似度的方法,具体地,把两个要对比的案件处理为两个词列表,然后对比它们的相似度。具体地,在生成词列表是会把一些词进行滤掉。针对在词列表中的剩余的词,通常会采用一些常用方法来计算这些词的重要度,如信息检索与数据挖掘的常用加权技术(Term frequency-inverse document frequency,简称TF-IDF)等,然后采用的是余弦相似度计算词列表中的剩余的词的相似度。然而基于此方法推荐出的类似案件的准确度较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种案例推荐的方法及装置、存储介质、处理器,以至少解决相关技术中推荐的类似案件的准确度较低的技术问题。
根据本发明实施例的一个方面,提供了一种案例推荐的方法,包括:获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
根据本发明实施例的另一方面,还提供了一种案例推荐的装置,包括:获取单元,用于获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;提取单元,用于从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;计算单元,用于计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;第一推荐单元,用于基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以下步骤:获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以下步骤:获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
在本发明实施例中,可以提取目标案件的法律资料中的案件要素,然后再根据提取的案件要素从历史案件库中的多个案例中选取与目标案件相似的案例作为推荐案例,达到了针对案件要素完成对目标案件进行推荐的目的,从而根据案件要素的相似度目标案件推荐相似的案例,可以使推荐案例与目标案件更加类似,提高了类似案件推荐的准确度,进而解决了相关技术中推荐的类似案件的准确度较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了一种案例推荐的方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的一种可选的案例推荐的方法的示意图;
图3是根据本发明实施例的一种可选的案例推荐的方法的示意图;
图4是根据本发明实施例的一种可选的案例推荐的方法的示意图;
图5是根据本发明实施例的一种可选的案例推荐的方法的示意图;
图6是根据本发明实施例的一种可选的案例推荐的方法的示意图;
图7是根据本发明实施例的一种可选的案例推荐的方法的示意图;
图8是根据本申请实施例的一种可选的案件要素的类似案例推荐框架的示意图;
图9是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图10是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图11是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图12是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图13是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图14是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图15是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图16是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图17是根据本申请实施例的一种可选的案例推荐的装置的示意图;
图18是根据本发明实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
知识图谱:结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是【实体-关系-实体】三元组,以及实体及其相关属性一值对,实体之间通过关系相互联结,构成网状的知识结构。
Word2vec:一种开源软件,通过大规模预料学习词语的向量表示。
TransE,TransR,TransH,Random Walk:知识图谱向量表示的一系列学习方法。
客观事实实体:知识图谱中的一类实体,用于描述案件中客观存在的要素。
法律事实实体:知识图谱中的一类实体,用于描述能够引起法律关系发生变化的要素。
实施例1
根据本发明实施例,还提供了一种案例推荐的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现案例推荐的方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的案例推荐的方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的案例推荐的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
图1示出的硬件结构框图,不仅可以作为上述计算机终端10(或移动设备)的示例性框图,还可以作为上述服务器的示例性框图,一种可选实施例中,上述图1所示的计算机终端10(或移动设备)可以作为发送端和/或接收端。计算机终端10(或移动设备)可以经由数据网络连接或电子连接到一个或多个服务器,例如安全服务器、资源服务器、游戏服务器等。一种可选实施例中,上述计算机终端10(或移动设备)可以是任意移动计算设备等。数据网络连接可以是局域网连接、广域网连接、因特网连接,或其他类型的数据网络连接。计算机终端10(或移动设备)可以执行以连接到由一个服务器(例如安全服务器)或一组服务器执行的网络服务。网络服务器是基于网络的用户服务,诸如社交网络、云资源、电子邮件、在线支付或其他在线应用。
在上述运行环境下,本申请提供了如图2所示的案例推荐的方法。图2是根据本发明实施例1的案例推荐的方法的流程图,图2所示的方法可以包括如下步骤:
步骤S21,获取目标案件的法律资料,其中,法律资料是记录了案件情况的材料。
在上述步骤S21中,法律资料可以是法律文书,例如司法行政机关及当事人、律师等在解决诉讼和非讼案件时使用的文书,司法机关的非规范性文件。
此处需要说明的是,上述法律资料还可以是通过音频、视频等多媒体形式记录的资料。
作为一种可选的示例,法律资料可以包括:起诉状、反诉书、答辩状、代理词等法律文书。
步骤S23,从法律资料中提取至少一个案件要素,其中,案件要素为表征案件特征的构成要素。
此处需要说明的是,由于法律资料是记录案件情况的文本,因此可以在法律资料的文本中提取用于表征案件特征构成要素的案件要素,然后再使用提取出的案件要素进行后续分析。
可选地,在法律资料为法律文书的情况下,由于法律文书具有形式的程式性特点,即法律文书的结构固定、用语固定,因此通过对法律文书中指定部分的内容进行分析,即可得到该部分的案件要素。
需要注意的是,法律文书可以具有固定的结构,例如,法律文书中可以包括:首部、正文、尾部,具体内容如下所示:
法律文书的首部包括:1、制作机关、文中名称、编号;2、当事人基本情况;3、案由、审理经过等。
法律文书的正文包括:1、案情事实;2、处理(或请求)理由;3、处理(或请求)意见。
法律文书的尾部包括:1、交代有关事项;2、签署、日期、用印;3、附注说明。
因此,在需要获取案件要素的情况下,可以从法律文书的指定部分中提取指定安检要素。
在本申请提供的一种可选实施例中,如图3所示,在步骤S21中从法律资料中提取至少一个案件要素包括如下步骤:
步骤S231,将法律资料进行结构化处理;
步骤S233,从结构化处理后的法律资料中提取至少一个案件要素。
在上述步骤S231和步骤S233中,通过对法律资料进行结构化处理,然后可以从结构化处理的各部分法律资料中进行案件要素的提取,得到该法律资料的至少一个案件要素,从而完成对案件要素的准确提取。
此处需要说明的是,由于法律资料(如法律文书)通常使用固定结构,即法律资料的各部分的文字所包括的案件要素并不相同。例如,在法律文书的首部的案件要素包括案由;在法律文书的正文部分案件要素包括案件事实。因此法律文书的不同部分所包括的案件要素并不相同,使用同一套案件要素提取方式将可能无法提取不同部分的案件要素,因此需要针对法律资料的每个部分单独使用指定的提取方式,以完成该部分案件要素的提取。故在对法律资料进行案件要素提取前,需要先对法律资料进行结构化处理,以获取结构化的法律资料。
可选地,可以通过机器学习的方式,识别出法律资料的各部分,从而实现对法律资料的结构化处理,进而再从结构化处理后的资料中提取案件要素。
作为一种可选的示例,可以预先将多组已完成结构化标注的法律资料作为训练数据,通过机器学习的方式训练出用于对法律资料进行结构化处理的第一模型,进而在输入目标案件的法律资料后,可以使用第一模型完成对法律资料的结构化处理。
可选地,在对法律资料进行结构化处理后,可以通过机器学习的方式对完成结构化的各部分法律资料进行案件要素提取。
可选地,对于结构化的法律资料,可以对结构化的各部分法律资料使用对应的机器训练模型完成对各部分的案件要素的提取。
此处需要说明的是,案件的不同阶段所使用的法律资料也并不相同。
作为一种可选的实施例,本发明提供的案例推荐的方法可以应用于以下至少一个阶段:案件起诉阶段、案件审理阶段、案件判决阶段。从而可以对于不同阶段的案件所使用的法律资料进行案件要素的提取。
在本申请提供的一种可选实施例中,若案例推荐的方法应用于案件起诉阶段,则案件起诉阶段所使用的法律资料至少包括起诉书,通过步骤S23从法律资料中提取至少一个案件要素包括如下步骤:
如图4所示,步骤S235,从起诉书中提取第一案件要素集合,其中,第一案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律。
在本申请提供的一种可选实施例中,若案例推荐的方法应用于案件审理阶段,则案件审理阶段所使用的法律资料至少包括起诉书和证据资料,通过步骤S23从法律资料中提取至少一个案件要素包括如下步骤:
如图5所示,步骤S237,从起诉书和证据资料中提取第二案件要素集合,其中,第二案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律、争议焦点和证据。
在本申请提供的一种可选实施例中,若案例推荐的方法应用于案件判决阶段,法律资料至少包括起诉书、证据资料和庭审记录,通过步骤S23从法律资料中提取至少一个案件要素包括如下步骤:
如图6所示,步骤S239,从起诉书和证据资料中提取第三案件要素集合,其中,第三案件要素集合中包括以下至少之一的案件要素:认定案由、认定案件事实、诉求、认定适用法律、争议焦点和认定证据。
本申请上述步骤S235至步骤S239中,可以针对案件的不同阶段所对应的不同法律资料,完成案件要素的提取,从而准确提取案件的不同阶段所对应的案件要素。
此处需要说明的是,针对案件的不同阶段,可以使用不同的机器训练模型进行案件要素的提取,可以使提取的案件要素更加准确。
步骤S25,计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度。
本申请上述步骤S25中,在提取案件要素后,可以将提取的案件要素与历史案件库中存储的案件要素进行匹配,确定提取的每个案件要素与历史案件库中存储的案件要素的相似度。
此处需要说明的是,历史案件库中可以存储多个已标注案件要素的案例。
此处需要说明的是,在计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度的过程中,可以使每个案件与历史案件库中的案例进行单独对比。例如,可以使用历史案件库中的某个案例与目标案件进行单独对比,使案例中的案件要素与目标案件中的案件要素进行单独对比,分别计算各案件要素之间的相似度。
步骤S27,基于相似度从历史案件库中为目标案件推荐案例。
在上述步骤S27中,在完成目标案件与历史案件库中的案例进行相似度的计算后,可以根据相似度从历史案件库中选取目标案件的推荐案例,完成对案例的准确推荐。
在本发明实施例中,可以提取目标案件的法律资料中的案件要素,然后再根据提取的案件要素从历史案件库中的多个案例中选取与目标案件相似的案例作为推荐案例,达到了针对案件要素完成对目标案件进行推荐的目的,从而根据案件要素的相似度目标案件推荐相似的案例,可以使推荐案例与目标案件更加类似,提高了类似案件推荐的准确度,进而解决了相关技术中推荐的类似案件的准确度较低的技术问题。
在本申请提供的一种可选实施例中,如图7所示,步骤S27基于相似度从历史案件库中为目标案件推荐案例包括如下步骤:
步骤S271,确定每个案件要素的权重值;
步骤S273,基于每个案件要素的权重值、每个案件要素与历史案件库中每个案例的案件要素之间的相似度,计算相似度总分,其中,相似度总分表示目标案件与历史案件库中进行比对的案例之间的相似分数;
步骤S275,基于相似度总分从历史案件库中为目标案件推荐案例。
本申请上述步骤S271至步骤S275中,可以为每个案件要素设置对应的权重值,在完成对案件要素的相似度计算后,可以根据各案件要素的权重值、以及各案件要素的相似度,计算目标案件与历史案件库中进行对比的案例的相似度总分,然后在基于相似度总分完成对目标案件进行案例推荐。
作为一种可选的示例,目标案件包括案件要素A、案件要素B、以及案件要素C,历史案件库中的案例包括案件要素a、案件要素b。案件要素c,其中,案件要素A与案件要素a的相似度为S1,权重为w1;案件要素B与案件要素b的相似度为S2,权重为w2;案件要素C与案件要素c的相似度为S3,权重为w3,则目标案件与历史案件库中的案例的相似度总分为S1*w1+S2*w2+S3*w3。
此处需要说明的是,可以将数据库的多个案例分别与目标案件进行单独对比,分别得出历史数据库中的多个案例相对于目标案件的相似度总分,然后再针对单个案例的相似度总分进行案例推荐。
需要注意的是,案例的相似度总分,即为历史案件库中的案例与目标案件的相似度总分,用于表示历史案件库中的案例与目标案件的相似程度。
需要注意的是,在基于相似度总分从历史案件库中为目标案件推荐案例的过程中,可以为目标案件推荐相似度总分最大的一个案例;还可以向目标案件推荐相似度总分较高的多个案例。
作为一种可选的实施例,基于相似度总分从历史案件库中为目标案件推荐案例可以包括:推荐历史案件库中与目标案件的相似度总分最大的案例。
此处需要说明的是,在推荐历史案件库中与目标案件的相似度总分最大的案例之前,需要先从多个案例中确定相似度总分最大的案例。
可选地,可以按照相似度总分将历史案件库中存储的多个案例排序,然后再根据排序结果选取相似度总分最大的案例。例如,将历史案件库中的多个案例按照由高到低的顺序排列,或相似度总分由低到高的顺序排列,然后再根据排列的顺序确定排列的首端或尾端的案例为相似度总分最高的案例。
可选地,可以将历史案件库中存储的多个案例依次比对,然后再根据比对结果选取相似度总分的对象。例如,可以从历史数据库中选取任意两个案例进行相似度总分对比,然后将对比后相似度总分高的案例作为参考案例,与历史案件库中其他未对比的案例进行下一次对比,直到历史数据库中的案例均完成对比后,确定最后一次对比过程中相似度总分高的案例为相似度总分最高的案例。
作为另一种可选的实施例,基于相似度总分从历史案件库中为目标案件推荐案例还可以包括:推荐历史案件库中与目标案件的相似度总分大于预设相似分数的至少一个案例。
可选的,可以将历史案件库中的案例,按照相似度总分由高到低的顺序排序,然后按照排列顺序并依次选取预设数量的案例作为目标案件的推荐案例。
在本申请提供的一种可选实施例中,步骤S275基于相似度总分从历史案件库中为目标案件推荐案例包括如下步骤:
步骤S2751,从历史案件库中选择预设数量件与目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合;
步骤S2753,将待推荐案例集合中的案例按照与目标案件的相似度总分大小次序进行推荐。
在上述步骤S2751和步骤S2753中,可以将历史数据库中各案例的相似度总分与预设相似度分数进行对比,选取相似度总分高于预设相似度分数的预设数量的案例作为待推荐案例集合中的案例,然后再将推荐案例集合中的案例按照相似度总分的大小次序进行推荐。
此处需要说明的是,在上述步骤S2751中,可以先预设相似度分数,获取相似度总分高于预设相似度分数的多个案例,然后再从相似度总分高于预设相似度分数的多个案例中,选取预设数量的案例作为待推荐案例集合。可选地,可以对高于预设分数的多个案例按照相似度总分由高到低的顺序排序,然后再按照相似度总分由高到低的顺序获取预设数量的案件作为待推荐案例集合。
在本申请提供的一种可选实施例中,在步骤S2751从历史案件库中选择预设数量件与目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合之后,该实施例还可以包括如下步骤:
步骤S2755,将待推荐案例集合中的案例按照与目标案件中目标案件要素的相似度大小次序进行推荐。
在上述步骤S2755中,可以在目标案件的多个案件要素中确定目标案件要素,然后再根据目标案件要素的相似度大小次序进行推荐,从而可以根据目标案件要素对目标案件进行有针对性的推荐,使推荐的案例更加符合目标案件的使用需求。
此处需要说明的是,在上述步骤S2755中,目标案件要素可以根据使用需求预先设定,然后再根据目标案件要素的相似度大小进行推荐。例如,目标案件包括:案件要素A、案件要素B、案件要素C,可以在目标案件的多个案件要素中选取案件要素B为目标案件要素,然后再将待推荐案例集合中的案件,按照目标案件要素的相似度大小次序进行推荐。
此处需要注意的是,可以先根据案例的相似度总分确定待推荐案例集合,然后再对待推荐案例集合中的多个案例按照目标案件要素的相似度大小次序进行推荐。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
下面通过一种更为详细的实施例来说明本发明,在下述实施例中,详细介绍一种基于案件要素的类似案例推荐方法及框架,其中,该类似案例推荐框架的示意图如图8所示。本发明提供的类似案例推荐框架可以应用在目标案件的起诉阶段、审理阶段、以及案件的判决阶段。
此处需要说明的是,一个案件的流程一般包括:A起诉阶段,B审理阶段和C判决阶段。
在不同的阶段所能获得的信息是不同的,根据这些不同信息所训练的算法也会不同,所能发现的类案也会有所不同。本方法根据这三个不同阶段,来推荐不同的案例,可以更有效的帮助法官判案,具有较强的针对性。
一个案件的要素主要有案件案由、诉求、事实、争议焦点、证据、适用法律法条等。判断两个案件是否相似,主要由这些要素决定。所以在本发明提供给的方案中,通过对案件文本进行结构化,提取这些信息,然后利用这些要素使用机器学习算法来发现相似案例。
可选地,本发明提供的技术方案,由于已经把案件不同要素提取了出来,因此本方法可提供总体排序,也可提供基于不同要素的排序,给法官更多的参考和不同的角度。
需要注意的是,A起诉阶段:这个阶段推荐历史案件可帮助法官了解相似案例,准备庭审,也可以根据相似案例来进行调解。比如如果相似案例中有95%的都判原告败诉,那把这种信息告诉原告后,原告可能会撤诉或寻求在进入庭审前和解,可节省大量审判资源和成本。
A1文本结构化,案件要素提取:在起诉阶段,案件的法律资料主要是起诉书。从起诉书中能提取的信息主要有:案由、案件事实、诉求和原告认为应适用的法律,法规和法条。结构化和信息提取的算法主要是基于深度学习算法和语言学知识及规则,在大量的标注数据基础上训练出信息提取模型,进而提取案由、案件事实、诉求和法条。
本发明使用的算法模型是sentence level CNN+sentence level RNN+doc2vecembedding。卷积神经网络CNN和循环神经网络RNN所使用的词向量为基于word2vec和裁判文书数据训练出来的字嵌入word embedding。具体的提取算法不是本创新的主要内容,所以此处不做更详细叙述。
A2类案计算模块:此模块主要是计算当前案件(主要为案件起诉书)和任意给定历史案例的相似度。
可选地,计算各要素之间的相似度,包括:
步骤S1:计算两个案件案由之间的相似度。其相似度计算方法为Jaccardcoefficient。
步骤S2:两个案件事实之间的相似度。其相似度计算方法为Jaccardcoefficient。
步骤S3:两个案件诉求之间的相似度。其相似度计算方法为Jaccardcoefficient。
步骤S4:两个案件法律之间的相似度。其相似度计算方法为Jaccardcoefficient。
步骤S5:两个案件法条之间的相似度。
此处需要说明的是,在上述S4中,考虑两个案件是否有相同的法律,如交易纠纷法和食品安全法。如果两个案件的适用法律相同,然后再考虑此法律下采用的法条是否相同,如食品安全法45条与食品安全法第43条。其相似度计算方法为Jaccard coefficient。由于以上几个要素在判定类案中的重要性是不同的,使用以下算法公式将他们结合起来,以得到一个综合的相似度总分。相似度总分越高,两个案件相似的可能性越大。相似度总分Score=w1*S1+w2*S2+w3*S3+w4*S4+w5*S5,其中,w1、w2、w3……w5等是几个案件要素的权重。通过训练数据可以找到w1、w2等的最优值。
A3类案排序模块:此模块提供两种排序方法:
1.按照所有案件要素的综合分数的排序方法。也即是A2中的相似度总分Score。
2.针对每一个案件要素,提供一个按照此要素的排序方法。这样可以更好的满足法官的不同需求。
需要注意的是,B.审理阶段相比于案件起诉阶段,在审理阶段拥有更多的案件要素:争议焦点和双方的证据。在审理阶段,原被告双方会各自提供证据,针对不同的争议焦点进行辩论。争议焦点和证据是两种重要的案件要素。
B1文本结构化,案件要素提取:本模块和A1相比,除了A1中已提取的案由、案件事实、诉求、和法律法条外,本模块也提取争议焦点和双方的证据。其提取方法,算法和原理与A1类似。这里不再论述。
B2类案计算模块:除在A2中介绍的5种要素的相似值外,本模块也计算如下两个要素的相似值:
步骤S6:两个案件争议焦点之间的相似度。其相似度计算方法为Jaccardcoefficient。
步骤S7:两个案件证据之间的相似度。证据相似主要考虑证据的类型。其相似度计算方法为Jaccard coefficient。
此处需要说明的是,与A2模块类似,本发明使用以下下算法公式以得到一个综合的相似度总分。相似度总分Score=w1*S1+w2*S2+w3*S3+w4*S4+w5*S5+w6*S6+w7*S7通过训练数据可以找到w1,w2等权重参数的最优值。在上面的公式中,由于增加了两个新的因子,因此需要训练一个新的算法模型。
B3类案排序模块:与A3类似,此模块提供两种排序方法:
1.按考虑所有要素的综合分数的排序方法。
2.针对每一个案件要素,提供一个排序方法。
需要注意的是,C.判决阶段相比于前两个阶段,经过案件的审理过程,在判决阶段拥有的案件要素更有确定性。其中的某些案件要素的值会有变化:案由、事实、法律法条、证据。在起诉阶段,案由、事实、法条是由原告提供,可能并不准确,在判决阶段,法官会根据审理中得出的结论来改变它们。在此阶段认定的证据也可能和审理阶段的有所不同。
C1文本结构化,案件要素提取:本模块和A1、B1相比,某些案件要素的值会不同。案件要素的提取来源也更广泛,包括庭审记录,法官书写的案件审理文档等。但其提取方法,算法和原理与A1、B1类似。
C2类案计算模块:本模块所使用的要素及算法公式和B2模块相同,但由于案件要素的值会有所不同,需要重新训练算法,产出新的算法模块。
C3类案排序模块:和A3、B3类似,此模块提供两种排序方法。
此处需要注意的是,在A2、B2、C2模块中,案件要素的相似度的计算方法也可不用Jaccatrd Coefficient,而采用其它方法,如直接的相同值或余旋相似度。但试验显示Jaccard coefficient的效果最好。
此处需要说明的是,Jaccard coefficient:又称为Jaccard(杰卡德)相似系数(Jaccard similarity coefficient)。用于比较两个样本集之间的相似性。Jaccard值越大,样本相似度越高。若A、B为两个样本集,它们之间的相似度公式为:其中,分子为两个集合的相同部分,分子为两个集合的合集。
需要说明的是,Jaccard coefficient常用于比较文本相似度,计算对象间距离,用于数据聚类等。
一个案件的要素主要有案件案由,诉求,事实,争议焦点,证据,适用法律法条等
为了便于理解,接下来针对案件要素提取进行示例性说明,如下所示:
消费者刘xx在淘宝上从上海YY公司购买了200瓶营养品ZZ。刘xx认为营养品ZZ有非法添加剂,从而起诉上海YY公司和淘宝公司。从起诉书中,将会有以下案件要素:
案由:商品交易纠纷,不安全食品。
事实:2018年6月3日,刘xx从淘宝上购买了200瓶营养品ZZ,卖家为上海YY公司。刘xx于6月10日收到货物。经检查,刘xx认为营养品ZZ有非法添加剂ABC,卖家违反了消费者权益法和食品安全法的相关条款。买家同时认为淘宝作为平台应承担连带责任。
诉求:要求上海YY公司退款,赔偿10倍购买价的罚款,律师费,淘宝公司承担连带责任。
争议焦点:1.是否有非法添加剂,2.原告购买数辆较大,是否超出一般消费者消费行为,属恶意购买。
证据:交易单据,付款证明,收到货证明,商家广告照片,商家产品成分说明等
法律法条:消费者权益法第X条,Y条,食品安全法第X条,Z条,W条。
实施例3
根据本发明实施例,还提供了一种用于实施上述案例推荐的方法的装置,如图9所示,该装置包括:
获取单元81,用于获取目标案件的法律资料,其中,法律资料是记录了案件情况的材料;提取单元83,用于从法律资料中提取至少一个案件要素,其中,案件要素为表征案件特征的构成要素;计算单元85,用于计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;第一推荐单元87,用于基于相似度从历史案件库中为目标案件推荐案例。
此处需要说明的是,上述获取单元81至第一推荐单元87对应于实施例1中的步骤S21至步骤S27,各单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本发明实施例中,可以提取目标案件的法律资料中的案件要素,然后再根据提取的案件要素从历史案件库中的多个案例中选取与目标案件相似的案例作为推荐案例,达到了针对案件要素完成对目标案件进行推荐的目的,从而根据案件要素的相似度目标案件推荐相似的案例,可以使推荐案例与目标案件更加类似,提高了类似案件推荐的准确度,进而解决了相关技术中推荐的类似案件的准确度较低的技术问题。
在本申请提供的一种可选实施例中,如图10所示,第一推荐单元87包括:确定模块871,用于确定每个案件要素的权重值;计算模块873,用于基于每个案件要素的权重值、每个案件要素与历史案件库中每个案例的案件要素之间的相似度,计算相似度总分,其中,相似度总分表示目标案件与历史案件库中进行比对的案例之间的相似分数;第一推荐模块875,用于基于相似度总分从历史案件库中为目标案件推荐案例。
此处需要说明的是,上述确定模块871至第一推荐模块875对应于实施例1中的步骤S271至步骤S275,各单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请提供的一种可选实施例中,如图11所示,第一推荐模块875包括:选择模块8751,用于从历史案件库中选择预设数量件与目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合;第二推荐模块8753,用于将待推荐案例集合中的案例按照与目标案件的相似度总分大小次序进行推荐。
此处需要说明的是,上述选择模块8751和第二推荐模块8753对应于实施例1中的步骤S2751和步骤S2753,各单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请提供的一种可选实施例中,如图12所示,该实施例还可以包括:第二推荐单元8755,用于在从历史案件库中选择预设数量件与目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合之后,将待推荐案例集合中的案例按照与目标案件中目标案件要素的相似度大小次序进行推荐。
在本申请提供的一种可选实施例中,如图13所示,第一推荐单元87包括:第三推荐模块877,用于推荐历史案件库中与目标案件的相似度总分最大的案例。
在本申请提供的一种可选实施例中,如图14所示,提取单元83包括:结构化模块831,用于将法律资料进行结构化处理;第一提取模块833,用于从结构化处理后的法律资料中提取至少一个案件要素。
此处需要说明的是,上述结构化模块831和第一提取模块833对应于实施例1中的步骤S231和步骤S233,各单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
此处需要说明的是,案例推荐的装置应用于以下至少一个阶段:案件起诉阶段、案件审理阶段、案件判决阶段。
在本申请提供的一种可选实施例中,如图15所示,若案例推荐的装置应用于案件起诉阶段,法律资料至少包括起诉书,提取单元83包括:第二提取模块835,用于从起诉书中提取第一案件要素集合,其中,第一案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律。
此处需要说明的是,上述第二提取模块835对应于实施例1中的步骤S235,各单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请提供的一种可选实施例中,如图16所示,若案例推荐的装置应用于案件审理阶段,法律资料至少包括起诉书和证据资料,提取单元83包括:第三提取单元837,用于从起诉书和证据资料中提取第二案件要素集合,其中,第二案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律、争议焦点和证据。
此处需要说明的是,上述第三提取单元837对应于实施例1中的步骤S237,各单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请提供的一种可选实施例中,如图17所示,若案例推荐的装置应用于案件判决阶段,法律资料至少包括起诉书、证据资料和庭审记录,提取单元83包括:第四提取单元839,用于从起诉书和证据资料中提取第三案件要素集合,其中,第三案件要素集合中包括以下至少之一的案件要素:认定案由、认定案件事实、诉求、认定适用法律、争议焦点和认定证据。
此处需要说明的是,上述第三提取单元837对应于实施例1中的步骤S237,各单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
实施例4
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行案例推荐的方法中以下步骤的程序代码:获取目标案件的法律资料,其中,法律资料是记录了案件情况的材料;从法律资料中提取至少一个案件要素,其中,案件要素为表征案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于相似度从历史案件库中为目标案件推荐案例。
可选地,图18是根据本发明实施例的一种计算机终端的结构框图。如图18所示,该计算机终端10可以包括:一个或多个(图中仅示出一个)处理器、存储器。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的案例推荐的方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的案例推荐的方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取目标案件的法律资料,其中,法律资料是记录了案件情况的材料;从法律资料中提取至少一个案件要素,其中,案件要素为表征案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
可选的,上述处理器还可以执行如下步骤的程序代码:确定每个案件要素的权重值;基于每个案件要素的权重值、每个案件要素与历史案件库中每个案例的案件要素之间的相似度,计算相似度总分,其中,相似度总分表示目标案件与历史案件库中进行比对的案例之间的相似分数;基于相似度总分从历史案件库中为目标案件推荐案例。
可选的,上述处理器还可以执行如下步骤的程序代码:从历史案件库中选择预设数量件与目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合;将待推荐案例集合中的案例按照与目标案件的相似度总分大小次序进行推荐。
可选的,上述处理器还可以执行如下步骤的程序代码:将待推荐案例集合中的案例按照与目标案件中目标案件要素的相似度大小次序进行推荐。
可选的,上述处理器还可以执行如下步骤的程序代码:推荐历史案件库中与目标案件的相似度总分最大的案例。
可选的,上述处理器还可以执行如下步骤的程序代码:将法律资料进行结构化处理;从结构化处理后的法律资料中提取至少一个案件要素。
此处需要说明的是,处理器执行的案例推荐的方法可以应用于以下至少一个阶段:案件起诉阶段、案件审理阶段、案件判决阶段。
可选的,若案例推荐的方法应用于案件起诉阶段,法律资料至少包括起诉书上述处理器还可以执行如下步骤的程序代码:从起诉书中提取第一案件要素集合,其中,第一案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律。
可选的,若案例推荐的方法应用于案件审理阶段,法律资料至少包括起诉书和证据资料,上述处理器还可以执行如下步骤的程序代码:从起诉书和证据资料中提取第二案件要素集合,其中,第二案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律、争议焦点和证据。
可选的,若案例推荐的方法应用于案件判决阶段,法律资料至少包括起诉书、证据资料和庭审记录,上述处理器还可以执行如下步骤的程序代码:从起诉书和证据资料中提取第三案件要素集合,其中,第三案件要素集合中包括以下至少之一的案件要素:认定案由、认定案件事实、诉求、认定适用法律、争议焦点和认定证据。
采用本发明实施例,提供了一种推荐案例的方案。在本发明实施例中,可以提取目标案件的法律资料中的案件要素,然后再根据提取的案件要素从历史案件库中的多个案例中选取与目标案件相似的案例作为推荐案例,达到了针对案件要素完成对目标案件进行推荐的目的,从而根据案件要素的相似度目标案件推荐相似的案例,可以使推荐案例与目标案件更加类似,提高了类似案件推荐的准确度,进而解决了相关技术中推荐的类似案件的准确度较低的技术问题。
本领域普通技术人员可以理解,图18所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图18其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图18中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图18所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例5
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的案例推荐的方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取目标案件的法律资料,其中,法律资料是记录了案件情况的材料;从法律资料中提取至少一个案件要素,其中,案件要素为表征案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于相似度从历史案件库中为目标案件推荐案例。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:确定每个案件要素的权重值;基于每个案件要素的权重值、每个案件要素与历史案件库中每个案例的案件要素之间的相似度,计算相似度总分,其中,相似度总分表示目标案件与历史案件库中进行比对的案例之间的相似分数;基于相似度总分从历史案件库中为目标案件推荐案例。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:从历史案件库中选择预设数量件与目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合;将待推荐案例集合中的案例按照与目标案件的相似度总分大小次序进行推荐。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将待推荐案例集合中的案例按照与目标案件中目标案件要素的相似度大小次序进行推荐。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:推荐历史案件库中与目标案件的相似度总分最大的案例。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将法律资料进行结构化处理;从结构化处理后的法律资料中提取至少一个案件要素。
此处需要说明的是,存储介质存储的案例推荐的方法可以应用于以下至少一个阶段:案件起诉阶段、案件审理阶段、案件判决阶段。
可选的,在本实施例中,若案例推荐的方法应用于案件起诉阶段,法律资料至少包括起诉书,存储介质被设置为存储用于执行以下步骤的程序代码:从起诉书中提取第一案件要素集合,其中,第一案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律。
可选的,在本实施例中,若案例推荐的方法应用于案件审理阶段,法律资料至少包括起诉书和证据资料,存储介质被设置为存储用于执行以下步骤的程序代码:从起诉书和证据资料中提取第二案件要素集合,其中,第二案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律、争议焦点和证据。
可选的,在本实施例中,若案例推荐的方法应用于案件判决阶段,法律资料至少包括起诉书、证据资料和庭审记录,存储介质被设置为存储用于执行以下步骤的程序代码:从起诉书和证据资料中提取第三案件要素集合,其中,第三案件要素集合中包括以下至少之一的案件要素:认定案由、认定案件事实、诉求、认定适用法律、争议焦点和认定证据。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (22)
1.一种案例推荐的方法,其特征在于,包括:
获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;
从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;
计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;
基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
2.根据权利要求1所述的方法,其特征在于,基于所述相似度从所述历史案件库中为所述目标案件推荐案例包括:
确定每个案件要素的权重值;
基于每个案件要素的权重值、每个案件要素与历史案件库中每个案例的案件要素之间的相似度,计算相似度总分,其中,所述相似度总分表示所述目标案件与所述历史案件库中进行比对的案例之间的相似分数;
基于所述相似度总分从所述历史案件库中为所述目标案件推荐案例。
3.根据权利要求2所述的方法,其特征在于,基于所述相似度总分从所述历史案件库中为所述目标案件推荐案例包括:
从所述历史案件库中选择预设数量件与所述目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合;
将所述待推荐案例集合中的案例按照与所述目标案件的相似度总分大小次序进行推荐。
4.根据权利要求3所述的方法,其特征在于,在从所述历史案件库中选择预设数量件与所述目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合之后,所述方法还包括:
将所述待推荐案例集合中的案例按照与所述目标案件中目标案件要素的相似度大小次序进行推荐。
5.根据权利要求2所述的方法,其特征在于,基于所述相似度总分从所述历史案件库中为所述目标案件推荐案例包括:推荐所述历史案件库中与所述目标案件的相似度总分最大的案例。
6.根据权利要求1所述的方法,其特征在于,从所述法律资料中提取至少一个案件要素包括:
将所述法律资料进行结构化处理;
从结构化处理后的法律资料中提取至少一个案件要素。
7.根据权利要求1所述的方法,其特征在于,所述案例推荐的方法应用于以下至少一个阶段:案件起诉阶段、案件审理阶段、案件判决阶段。
8.根据权利要求6所述的方法,其特征在于,若所述案例推荐的方法应用于案件起诉阶段,所述法律资料至少包括起诉书,从所述法律资料中提取至少一个案件要素包括:从所述起诉书中提取第一案件要素集合,其中,所述第一案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律。
9.根据权利要求6所述的方法,其特征在于,若所述案例推荐的方法应用于案件审理阶段,所述法律资料至少包括起诉书和证据资料,从所述法律资料中提取至少一个案件要素包括:从所述起诉书和所述证据资料中提取第二案件要素集合,其中,所述第二案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律、争议焦点和证据。
10.根据权利要求6所述的方法,其特征在于,若所述案例推荐的方法应用于案件判决阶段,所述法律资料至少包括起诉书、证据资料和庭审记录,从所述法律资料中提取至少一个案件要素包括:从所述起诉书和所述证据资料中提取第三案件要素集合,其中,所述第三案件要素集合中包括以下至少之一的案件要素:认定案由、认定案件事实、诉求、认定适用法律、争议焦点和认定证据。
11.一种案例推荐的装置,其特征在于,包括:
获取单元,用于获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;
提取单元,用于从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;
计算单元,用于计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;
第一推荐单元,用于基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
12.根据权利要求11所述的装置,其特征在于,所述第一推荐单元包括:
确定模块,用于确定每个案件要素的权重值;
计算模块,用于基于每个案件要素的权重值、每个案件要素与历史案件库中每个案例的案件要素之间的相似度,计算相似度总分,其中,所述相似度总分表示所述目标案件与所述历史案件库中进行比对的案例之间的相似分数;
第一推荐模块,用于基于所述相似度总分从所述历史案件库中为所述目标案件推荐案例。
13.根据权利要求12所述的装置,其特征在于,所述第一推荐模块包括:
选择模块,用于从所述历史案件库中选择预设数量件与所述目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合;
第二推荐模块,用于将所述待推荐案例集合中的案例按照与所述目标案件的相似度总分大小次序进行推荐。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第二推荐单元,用于在从所述历史案件库中选择预设数量件与所述目标案件的相似度总分大于预设相似分数的案例,得到待推荐案例集合之后,将所述待推荐案例集合中的案例按照与所述目标案件中目标案件要素的相似度大小次序进行推荐。
15.根据权利要求12所述的装置,其特征在于,所述第一推荐单元包括:
第三推荐模块,用于推荐所述历史案件库中与所述目标案件的相似度总分最大的案例。
16.根据权利要求1所述的装置,其特征在于,所述提取单元包括:
结构化模块,用于将所述法律资料进行结构化处理;
第一提取模块,用于从结构化处理后的法律资料中提取至少一个案件要素。
17.根据权利要求11所述的装置,其特征在于,所述案例推荐的装置应用于以下至少一个阶段:案件起诉阶段、案件审理阶段、案件判决阶段。
18.根据权利要求16所述的装置,其特征在于,若所述案例推荐的装置应用于案件起诉阶段,所述法律资料至少包括起诉书,所述提取单元包括:第二提取模块,用于从所述起诉书中提取第一案件要素集合,其中,所述第一案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律。
19.根据权利要求16所述的装置,其特征在于,若所述案例推荐的装置应用于案件审理阶段,所述法律资料至少包括起诉书和证据资料,所述提取单元包括:第三提取单元,用于从所述起诉书和所述证据资料中提取第二案件要素集合,其中,所述第二案件要素集合包括以下至少之一的案件要素:案由、案件事实、诉求、适用法律、争议焦点和证据。
20.根据权利要求16所述的装置,其特征在于,若所述案例推荐的装置应用于案件判决阶段,所述法律资料至少包括起诉书、证据资料和庭审记录,所述提取单元包括:第四提取单元,用于从所述起诉书和所述证据资料中提取第三案件要素集合,其中,所述第三案件要素集合中包括以下至少之一的案件要素:认定案由、认定案件事实、诉求、认定适用法律、争议焦点和认定证据。
21.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以下步骤:获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
22.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行以下步骤:获取目标案件的法律资料,其中,所述法律资料是记录了案件情况的材料;从所述法律资料中提取至少一个案件要素,其中,所述案件要素为表征所述案件特征的构成要素;计算每个案件要素与历史案件库中每个案例的案件要素之间的相似度;基于所述相似度从所述历史案件库中为所述目标案件推荐案例。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810664231.0A CN110647631B (zh) | 2018-06-25 | 2018-06-25 | 案例推荐的方法及装置、存储介质、处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810664231.0A CN110647631B (zh) | 2018-06-25 | 2018-06-25 | 案例推荐的方法及装置、存储介质、处理器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110647631A true CN110647631A (zh) | 2020-01-03 |
CN110647631B CN110647631B (zh) | 2023-03-21 |
Family
ID=68988389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810664231.0A Active CN110647631B (zh) | 2018-06-25 | 2018-06-25 | 案例推荐的方法及装置、存储介质、处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110647631B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651997A (zh) * | 2020-04-20 | 2020-09-11 | 北京大学 | 一种类案推荐方法及系统 |
CN111666495A (zh) * | 2020-06-05 | 2020-09-15 | 北京百度网讯科技有限公司 | 案件推荐方法、装置、设备以及存储介质 |
CN111680125A (zh) * | 2020-06-05 | 2020-09-18 | 深圳市华云中盛科技股份有限公司 | 诉讼案件分析方法、装置、计算机设备及存储介质 |
CN111813906A (zh) * | 2020-06-18 | 2020-10-23 | 贵州大学 | 一种基于犯罪行为链的相似案件计算方法 |
CN112084321A (zh) * | 2020-07-30 | 2020-12-15 | 中国民用航空上海航空器适航审定中心 | 适航案例推荐评估方法,系统,装置及存储介质 |
CN112084323A (zh) * | 2020-07-31 | 2020-12-15 | 中国民用航空上海航空器适航审定中心 | 一种适航审定协同工作平台及方法 |
CN112084322A (zh) * | 2020-07-30 | 2020-12-15 | 中国民用航空上海航空器适航审定中心 | 基于符合性向量的适航案例推荐方法 |
CN112487146A (zh) * | 2020-12-02 | 2021-03-12 | 重庆邮电大学 | 一种法律案件争议焦点获取方法、装置以及计算机设备 |
CN113408263A (zh) * | 2020-03-16 | 2021-09-17 | 北京国双科技有限公司 | 刑期预测方法、装置、存储介质及电子设备 |
CN113806590A (zh) * | 2021-09-27 | 2021-12-17 | 北京市律典通科技有限公司 | 一种刑事同案数据智能推送方法及系统 |
CN117033584A (zh) * | 2023-07-31 | 2023-11-10 | 北京华夏电通科技股份有限公司 | 类案文本确定方法、装置及电子设备 |
CN117592451A (zh) * | 2023-11-21 | 2024-02-23 | 北京瑞风协同科技股份有限公司 | 基于智能推荐的试验方案在线编写方法、系统及电子设备 |
CN117609487A (zh) * | 2024-01-19 | 2024-02-27 | 武汉百智诚远科技有限公司 | 基于人工智能的法律条文快速检索方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130246290A1 (en) * | 2012-03-16 | 2013-09-19 | Precision Litigation, LLC | Machine-Assisted Legal Assessments |
CN107273391A (zh) * | 2016-04-08 | 2017-10-20 | 北京国双科技有限公司 | 文书推荐方法和装置 |
CN107818138A (zh) * | 2017-09-28 | 2018-03-20 | 银江股份有限公司 | 一种案件法律条例推荐方法及系统 |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
-
2018
- 2018-06-25 CN CN201810664231.0A patent/CN110647631B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130246290A1 (en) * | 2012-03-16 | 2013-09-19 | Precision Litigation, LLC | Machine-Assisted Legal Assessments |
CN107273391A (zh) * | 2016-04-08 | 2017-10-20 | 北京国双科技有限公司 | 文书推荐方法和装置 |
CN107818138A (zh) * | 2017-09-28 | 2018-03-20 | 银江股份有限公司 | 一种案件法律条例推荐方法及系统 |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408263A (zh) * | 2020-03-16 | 2021-09-17 | 北京国双科技有限公司 | 刑期预测方法、装置、存储介质及电子设备 |
CN111651997A (zh) * | 2020-04-20 | 2020-09-11 | 北京大学 | 一种类案推荐方法及系统 |
CN111666495A (zh) * | 2020-06-05 | 2020-09-15 | 北京百度网讯科技有限公司 | 案件推荐方法、装置、设备以及存储介质 |
CN111680125A (zh) * | 2020-06-05 | 2020-09-18 | 深圳市华云中盛科技股份有限公司 | 诉讼案件分析方法、装置、计算机设备及存储介质 |
CN111666495B (zh) * | 2020-06-05 | 2023-08-11 | 北京百度网讯科技有限公司 | 案件推荐方法、装置、设备以及存储介质 |
CN111813906A (zh) * | 2020-06-18 | 2020-10-23 | 贵州大学 | 一种基于犯罪行为链的相似案件计算方法 |
CN112084321A (zh) * | 2020-07-30 | 2020-12-15 | 中国民用航空上海航空器适航审定中心 | 适航案例推荐评估方法,系统,装置及存储介质 |
CN112084322A (zh) * | 2020-07-30 | 2020-12-15 | 中国民用航空上海航空器适航审定中心 | 基于符合性向量的适航案例推荐方法 |
CN112084322B (zh) * | 2020-07-30 | 2024-08-16 | 中国民用航空上海航空器适航审定中心 | 基于符合性向量的适航案例推荐方法 |
CN112084323A (zh) * | 2020-07-31 | 2020-12-15 | 中国民用航空上海航空器适航审定中心 | 一种适航审定协同工作平台及方法 |
CN112084323B (zh) * | 2020-07-31 | 2024-03-12 | 中国民用航空上海航空器适航审定中心 | 一种适航审定协同工作平台及方法 |
CN112487146A (zh) * | 2020-12-02 | 2021-03-12 | 重庆邮电大学 | 一种法律案件争议焦点获取方法、装置以及计算机设备 |
CN113806590A (zh) * | 2021-09-27 | 2021-12-17 | 北京市律典通科技有限公司 | 一种刑事同案数据智能推送方法及系统 |
CN117033584A (zh) * | 2023-07-31 | 2023-11-10 | 北京华夏电通科技股份有限公司 | 类案文本确定方法、装置及电子设备 |
CN117033584B (zh) * | 2023-07-31 | 2024-04-02 | 北京华夏电通科技股份有限公司 | 类案文本确定方法、装置及电子设备 |
CN117592451A (zh) * | 2023-11-21 | 2024-02-23 | 北京瑞风协同科技股份有限公司 | 基于智能推荐的试验方案在线编写方法、系统及电子设备 |
CN117592451B (zh) * | 2023-11-21 | 2024-07-30 | 北京瑞风协同科技股份有限公司 | 基于智能推荐的试验方案在线编写方法、系统及电子设备 |
CN117609487A (zh) * | 2024-01-19 | 2024-02-27 | 武汉百智诚远科技有限公司 | 基于人工智能的法律条文快速检索方法及系统 |
CN117609487B (zh) * | 2024-01-19 | 2024-04-09 | 武汉百智诚远科技有限公司 | 基于人工智能的法律条文快速检索方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110647631B (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110647631B (zh) | 案例推荐的方法及装置、存储介质、处理器 | |
CN104281622B (zh) | 一种社交媒体中的信息推荐方法和装置 | |
US20130332385A1 (en) | Methods and systems for detecting and extracting product reviews | |
CN108805598B (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
TW201741948A (zh) | 履歷評估方法和裝置 | |
US20170193533A1 (en) | Automatic detection of user personality traits based on social media image posts | |
CN110858353B (zh) | 获取案件裁判结果的方法和系统 | |
US20190205950A1 (en) | Building and matching electronic user profiles using machine learning | |
CN108319888B (zh) | 视频类型的识别方法及装置、计算机终端 | |
CN104361506A (zh) | 一种基于用户问答方式的智能推荐商品方法及系统 | |
CN109101553B (zh) | 用于购买方非受益方的行业的采购用户评价方法和系统 | |
CN103455411B (zh) | 日志分类模型的建立、行为日志分类方法及装置 | |
CN109840319B (zh) | 确定对象实体的方法、系统及计算机设备和存储介质 | |
US11176486B2 (en) | Building and matching electronic standards profiles using machine learning | |
CN110309373B (zh) | 信息处理方法及装置 | |
CN111787042B (zh) | 用于推送信息的方法和装置 | |
Kamath et al. | Board Recommendation in Pinterest. | |
CN109118243B (zh) | 一种产品分享、有用评价识别、推送方法和服务器 | |
CN108595580B (zh) | 新闻推荐方法、装置、服务器及存储介质 | |
CN111680213A (zh) | 信息推荐方法、数据处理方法及装置 | |
CN111523914A (zh) | 用户满意度的评测方法、装置、系统和数据显示平台 | |
US20160110399A1 (en) | Perspective data management for common features of multiple items | |
Wang et al. | A collaborative filtering algorithm fusing user-based, item-based and social networks | |
CN111159575A (zh) | 一种基于手机银行的交友方法及装置 | |
Liu et al. | Research on identification method of anonymous fake reviews in e-commerce |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |