CN109033105B - 获取裁判文书焦点的方法和装置 - Google Patents
获取裁判文书焦点的方法和装置 Download PDFInfo
- Publication number
- CN109033105B CN109033105B CN201710433361.9A CN201710433361A CN109033105B CN 109033105 B CN109033105 B CN 109033105B CN 201710433361 A CN201710433361 A CN 201710433361A CN 109033105 B CN109033105 B CN 109033105B
- Authority
- CN
- China
- Prior art keywords
- focus
- referee document
- document
- referee
- rule engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种获取裁判文书焦点的方法和装置。其中,该方法包括:获取预设的焦点规则引擎,其中,焦点规则引擎根据已确定焦点的第一裁判文书构建;通过焦点规则引擎获取属于目标裁判文书的焦点。本发明解决了现有技术中通过人为标记关键词来获取裁判文书的焦点,获取的裁判文书的焦点主观性较强,导致获取的裁判文书的焦点准确度低的技术问题。
Description
技术领域
本发明涉及数据处理领域,具体而言,涉及一种获取裁判文书焦点的方法和装置。
背景技术
在现有技术中,获取裁判文书的方法通常有如下两种:1)根据裁判文书的规范化程度,由法律专家总结出案由、案号、审理法院、当事人、适用法条等基础维度的正则表达式,然后,机器按照该给定规则提取此类数据;2)由法律专家对裁判文书进行关键词标记,然后将该文书放入裁判文书库,机器通过字符串匹配,找到与该关键词相关联的法律法规、典型案例、裁判文书等。
第一种方法虽然能够读取出裁判文书中的数据,但是限于有规律可循的、表述方式较为单一的基础类数据,如案由、案号、审理法院等,无法识别出法律从业人员真正关心的裁判文书的焦点。
第二种方法虽然是对裁判文书的争议焦点进行关键词匹配,但是存在以下几个缺陷:1)需要法律专家对每一篇裁判文书均进行入库前关键词标记,只要出现一篇新的文书,即需要标记一次关键词;2)由于每个人专业水平、素养的不一致,对同一篇裁判文书可能标记出完全不同的关键词,主观性较强;3)依靠每篇文书2-3个关键词的标记,并不能精确判断文书的焦点。
针对现有技术中通过人为标记关键词来获取裁判文书的焦点,获取的裁判文书的焦点主观性较强,导致获取的裁判文书的焦点准确度低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种获取裁判文书焦点的方法和装置,以至少解决现有技术中通过人为标记关键词来获取裁判文书的焦点,获取的裁判文书的焦点主观性较强,导致获取的裁判文书的焦点准确度低的技术问题。
根据本发明实施例的一个方面,提供了一种方法,包括:获取预设的焦点规则引擎,其中,焦点规则引擎根据已确定焦点的第一裁判文书构建;通过焦点规则引擎获取属于目标裁判文书的焦点。
根据本发明实施例的另一方面,还提供了一种获取裁判文书焦点的装置,包括:第一获取模块,用于获取预设的焦点规则引擎,其中,焦点规则引擎根据已确定焦点的第一裁判文书构建;第二获取模块,用于通过焦点规则引擎获取属于目标裁判文书的焦点。
根据本发明实施例的另一方面,还提供了一种存储介质,包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述获取裁判文书焦点的方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述获取裁判文书焦点的方法。
在本发明实施例中,根据已确定焦点的第一裁判文书构建焦点规则引擎,通过焦点规则引擎获取属于目标裁判文书的焦点。上述方案由已确定焦点的第一裁判文书得到焦点规则引擎,再通过焦点规则引擎来确定待确定焦点的目标裁判文书的焦点,解决了现有技术中通过人为标记关键词来获取裁判文书的焦点,获取的裁判文书的焦点主观性较强,导致获取的裁判文书的焦点准确度低的技术问题,并且提高了确定裁判文书的焦点的效率的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的获取裁判文书焦点的方法的流程图;
图2是根据本申请实施例的一种可选的获取裁判文书焦点的方法的原理示意图;以及
图3是根据本发明实施例的获取裁判文书焦点的装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面,对实施例中出现的词汇进行解释,以便对实施例的理解。
裁判文书:用于记载法院审理案件的过程和结果,是诉讼活动结果的载体,也是人民法院确定和分配当事人义务权利的唯一凭证。
焦点:即争议焦点,简单地说就是纠纷的核心,矛盾的交锋点,案件双方当事人争执的问题所在,在形式上是由法官归纳、并经当事人确认的争点,是引领案件审理、纠纷解决的主线和枢纽,也是体现法官熟悉案情的程度,把握法律与案件联系的能力的一个突出标志。
实施例1
根据本发明实施例,提供了一种获取裁判文书焦点的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的获取裁判文书焦点的方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取预设的焦点规则引擎,其中,焦点规则引擎根据已确定焦点的第一裁判文书构建。
具体的,上述已确定焦点的第一裁判文书可以从预设的文书库中获取,由于第一裁判文书已确定焦点,因此在获取已确定焦点的第一裁判文书的同时,还能够直接得到第一裁判文书的焦点。
步骤S104,通过焦点规则引擎获取属于目标裁判文书的焦点。
具体的,上述目标裁判文书为待确定焦点的裁判文书。在一种可选的实施例中,可以将目标裁判文书输入至上述焦点规则引擎,焦点规则引擎则能够输出目标裁判文书的焦点。
此处需要说明的是,还可以按照预设的周期对焦点规则引擎进行更新,以保持焦点规则引擎的时效性。
由上可知,本申请上述实施例根据已确定焦点的第一裁判文书构建焦点规则引擎,通过焦点规则引擎获取属于目标裁判文书的焦点。上述方案由已确定焦点的第一裁判文书得到焦点规则引擎,再通过焦点规则引擎来确定待确定焦点的目标裁判文书的焦点,解决了现有技术中通过人为标记关键词来获取裁判文书的焦点,获取的裁判文书的焦点主观性较强,导致获取的裁判文书的焦点准确度低的技术问题,并且提高了确定裁判文书的焦点的效率的技术效果。
可选的,根据本申请上述实施例,步骤S102,根据已确定焦点的第一裁判文书构建焦点规则引擎,包括:
步骤S1021,获取预设领域对应的第一裁判文书。
具体的,上述预设领域为构建的焦点规则引擎的领域。例如,当构建的焦点规则引擎为商标侵权领域为例,用于构建该焦点规则引擎的第一裁判文书应该属于商标侵权领域。在一种可选的实施例中,以商标侵权领域为例,可以在文书库中提取出案由为“侵害商标权纠纷”的文书作为该领域的第一裁判文书。
步骤S1023,获取第一裁判文书中的焦点对应的焦点信息。
具体的,上述焦点信息可以包括焦点出现的段落、焦点所在段落中所处的具体行位置以及焦点出现的句式等。
步骤S1025,根据第一裁判文书中的焦点和第一裁判文书中的焦点对应的焦点信息构建预设领域对应的规则引擎。
在一种可选的实施例中,可以通过对第一裁判文书进行学习来得到焦点规则引擎,例如,可以将第一裁判文书以及第一裁判文书的焦点输入至预设的经过初始化后的焦点规则引擎中,对焦点规则引擎进行训练,直至输入任意一个第一裁判文书至焦点规则引擎,焦点规则引擎都能够输出与已确定焦点结果相同的焦点。
由上可知,本申请上述实施例根据某一领域的第一裁判文书构建该领域对应的焦点规则引擎,从而使得焦点规则引擎查找焦点的结果更准确。
可选的,根据本申请上述实施例,为了在构建焦点规则引擎的过程中能够方便的学习并进行训练,且在焦点规则引擎的使用过程中方便的进行结果的输出,可以通过标识的方式来表示焦点内容,因此在获取预设领域对应的第一裁判文书之后,上述方法还可以包括如下步骤:
步骤S1027,提取预设领域对应的第一裁判文书的焦点,构成预设领域对应的焦点库。
步骤S1029,将焦点库中的焦点根据预设的维度进行分类。
具体的,上述预设维度可以为预设的领域对应的焦点类。在一种可选的实施例中,仍以商标侵权领域为例,上述预设的维度可以是经过对法官的思维模式进行梳理得到的五大焦点类:(1)商标类型;(2)行为模式;(3)抗辩理由;(4)侵权责任;(5)其他焦点。
进一步地,还可以对上述类型继续进行分类,例如:(1)商标类型:驰名商标、商品商标、服务商标、证明商标、集体商标、立体商标、声音商标、三维标志商标、地理标志;(2)行为模式:商标假冒/仿冒行为、销售侵犯注册商标专用权的商品、商标辅助侵权行为、企业字号侵害他人注册商标的行为、域名侵害他人注册商标的行为、侵犯驰名商标的行为、其他侵权行为;(3)抗辩理由:在先权利及合理使用、是否具有合法来源/合法渠道、注册商标是否未实际使用、商标共有权人/共有商标;(4)侵权责任:停止侵权/停止销售/销毁、赔偿损失、消除影响;(5)其他焦点:主体是否适格、是否超过诉讼时效、是否构成商标性使用、经行政处罚/经刑事判决、是否构成不正当竞争。
此处需要说明的是,上述分类的步骤不限于是一次或多次,在某个案件类型具有多种分支,或多种变形方式的情况下,可以在一次或多次分类的基础上继续进行分类,直至能够具体到直接对案件的焦点进行分类。
步骤S1031,根据焦点库中的焦点所属的类别进行编码,得到每个焦点对应的标识。
在一种可选的实施例中,仍以上述商标侵权领域为例,可以将上述五大类焦点类(1)商标类型、(2)行为模式、(3)抗辩理由、(4)侵权责任和(5)其他焦点分别编码为A、B、C、D和E,当焦点属于上述任意一类时,可以用焦点类对应的编码代表该焦点。
在另一种可选的实施例中,可以对上述五大类焦点继续进行了分类,以A类焦点(1)商标类型包括:驰名商标、商品商标、服务商标、证明商标、集体商标、立体商标、声音商标、三维标志商标和地理标志为例,还可以再将A类焦点下的子类进行编码,例如,驰名商标、商品商标、服务商标、证明商标、集体商标、立体商标、声音商标、三维标志商标和地理标志可以分别编码为A1、A2、A3、A4、A5、A6、A7、A8和A9。其他焦点类也可以继续进行分类,按照上述规则进行编码。
此处需要说明的是,上述实施例中的编码方式仅用于示例,实际上能够建立起焦点与标识的对应关系的标识方式均能够用于上述方案中。
可选的,根据本申请上述实施例,获取预设领域对应的第一裁判文书,包括:
步骤S1021a,获取多个第二裁判文书。具体的,上述第二裁判文书可以为文书库中的所有文书。
步骤S1021b,根据第二裁判文书的案由确定第二裁判文书所属的领域。
步骤S1021c,将属于预设领域的第二裁判文书作为预设领域对应的第一裁判文书。
由上可知,本申请上述方案根据裁判文书中的案由确定裁判文书的领域,无需人为的依次对每个裁判文书进行确定,极大的提高了获取预设领域的第一裁判文书的效率。
可选的,根据本申请上述实施例,焦点信息包括:焦点位置和焦点属性,通过焦点规则引擎获取属于目标裁判文书的焦点,包括:
步骤S1041,在目标裁判文书中依次查找每个焦点位置。
具体的,上述焦点位置可以包括焦点所在的段落,以及在段落中的行位置,进一步地,还可以包括在行位置中具体的字符位置。焦点属性可以包括焦点出现的句式、用于表征焦点的关键词等。
步骤S1043,如果焦点位置对应的内容的属性与焦点位置所指示的焦点对应的焦点属性相同,则确定目标裁判文书中焦点位置对应的内容为焦点。
在一种可选的实施例中,焦点A1对应的焦点位置为第一裁判文书中的第[0028]段第一行,其属性为出现在“经审理查明”这一句式之后。在向焦点规则引擎输入目标裁判文书之后,焦点规则引擎在目标裁判文书中第[0028]段进行查找,如果查找到“经审理查明”这一句式,则确认该目标裁判文书具有A1这一焦点。
可选的,根据本申请上述实施例,在通过所述焦点规则引擎获取属于目标裁判文书的焦点之后,方法还包括:根据目标裁判文书中所有的焦点对应的标识构成焦点序列;在一种可选的实施例中,可以将每个焦点对应的标识按照标点出现的顺序进行排序,从而得到焦点序列;输出焦点序列,并根据焦点序列中每个焦点对应的焦点内容,输出目标裁判文书的焦点内容。
在生成焦点标识的过程中,焦点与焦点内容一一对应,因此在获取到目标裁判文书的焦点内容后,能够根据焦点与焦点序列中标识的对应关系确定目标裁判文书的焦点内容。
此处需要说明的是,由于焦点标识对应的是焦点库中的预设焦点类的子焦点,所以,焦点序列中每个焦点都代表着预设领域的一种非常具体的焦点类型。仍以商标侵权领域为例,如商品商标领域,被告实施了销售侵犯原告商标专用权商品的行为,法院重点对是否构成近似商标、是否具有合法来源等争议点进行释法说理的案件类型。所以通过焦点规则引擎处理过的裁判文书能直接读取出焦点序列,并根据焦点序列中每个焦点码得到对应的焦点内容。
图2是根据本申请实施例的一种可选的获取裁判文书焦点的方法的原理示意图,结合图2所示,下面分为两个步骤对图2中的示例进行描述。
步骤一:从裁判文书库中获取焦点库,根据焦点库中每个焦点对应的焦点信息,生成焦点规则引擎。具体的,上述裁判文书库为已确定焦点的第一裁判文书构成的裁判文书库,该步骤为在最初始阶段的准备工作,不为每次通过焦点规则引擎获取目标裁判文书的焦点固定步骤;
步骤二,该步骤包括:a,向焦点规则引擎输入目标裁判文书;b,焦点规则引擎输出目标裁判文书的焦点序列。该步骤为每次通过焦点规则引擎获取目标裁判文书的焦点步骤。
实施例2
根据本发明实施例,提供了一种获取裁判文书焦点的装置实施例,图3是根据本发明实施例的获取裁判文书焦点的装置的示意图,如图3所示,该装置包括:
第一获取模块30,用于获取预设的焦点规则引擎,其中,焦点规则引擎根据已确定焦点的第一裁判文书构建。
具体的,上述已确定焦点的第一裁判文书可以从预设的文书库中获取,由于第一裁判文书已确定焦点,因此在获取已确定焦点的第一裁判文书的同时,还能够直接得到第一裁判文书的焦点。
第二获取模块32,用于通过焦点规则引擎获取属于目标裁判文书的焦点。
具体的,上述目标裁判文书为待确定焦点的裁判文书。在一种可选的实施例中,可以将目标裁判文书输入至上述焦点规则引擎,焦点规则引擎则能够输出目标裁判文书的焦点。
此处需要说明的是,还可以按照预设的周期对焦点规则引擎进行更新,以保持焦点规则引擎的时效性。
由上可知,本申请上述实施例采用第一获取模块根据已确定焦点的第一裁判文书构建焦点规则引擎,采用第二获取模块通过焦点规则引擎获取属于目标裁判文书的焦点。上述方案由已确定焦点的第一裁判文书得到焦点规则引擎,再通过焦点规则引擎来确定待确定焦点的目标裁判文书的焦点,解决了现有技术中通过人为标记关键词来获取裁判文书的焦点,获取的裁判文书的焦点主观性较强,导致获取的裁判文书的焦点准确度低的技术问题,并且提高了确定裁判文书的焦点的效率的技术效果。
可选的,根据本申请上述实施例,装置还包括:构建模块,用于在获取预设的焦点规则引擎之前,根据已确定焦点的第一裁判文书构建焦点规则引擎,其中,构建模块包括:
第一获取子模块,用于获取预设领域对应的第一裁判文书。
第二获取子模块,用于获取第一裁判文书中的焦点对应的焦点信息。
构建子模块,用于根据第一裁判文书中的焦点和第一裁判文书中的焦点对应的焦点信息构建预设领域对应的焦点规则引擎。
可选的,根据本申请上述实施例,装置还包括:
提取模块,用于在获取预设领域对应的裁判文书库之后,提取预设领域对应的第一裁判文书库的焦点,构成预设领域对应的焦点库。
分类模块,用于将焦点库中的焦点根据预设的维度进行分类。
编码模块,用于根据焦点库中的焦点所属的类别进行编码,得到每个焦点对应的标识。
可选的,根据本申请上述实施例,第一获取子模块包括:
获取单元,用于获取多个第二裁判文书。
第一确定单元,用于根据第二裁判文书的案由确定第二裁判文书所属的领域。
第二确定单元,用于将属于预设领域的第二裁判文书作为预设领域对应的第一裁判文书。
可选的,根据本申请上述实施例,焦点信息包括:焦点位置和焦点属性,第二获取模块包括:
查找子模块,用于在目标裁判文书中依次查找每个焦点位置;
确定子模块,用于如果焦点位置对应的内容的属性与焦点位置所指示的焦点对应的焦点属性相同,则确定目标裁判文书中焦点位置对应的内容为焦点。
可选的,根据本申请上述实施例,装置还包括:
构建模块,用于在通过焦点规则引擎获取属于目标裁判文书的焦点之后,根据目标裁判文书中所有的焦点对应的标识构成焦点序列;
输出模块,用于输出焦点序列,并根据焦点序列中每个焦点对应的焦点内容,输出目标裁判文书的焦点内容。
所述获取裁判文书焦点的装置包括处理器和存储器,上述第一获取模块和第二获取模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决现有技术中通过人为标记关键词来获取裁判文书的焦点,获取的裁判文书的焦点主观性较强,导致获取的裁判文书的焦点准确度低的技术问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述获取裁判文书焦点的方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述获取裁判文书焦点的方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:(方法权项步骤,独权+从权)。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取预设的焦点规则引擎,其中,焦点规则引擎根据已确定焦点的第一裁判文书构建;通过焦点规则引擎获取属于目标裁判文书的焦点。
当在数据处理设备上执行时,上述计算机程序还适于执行初始化有如下方法步骤的程序:获取预设领域对应的第一裁判文书;获取第一裁判文书中的焦点对应的焦点信息;根据第一裁判文书中的焦点和焦点对应的焦点信息构建预设领域对应的焦点规则引擎。
当在数据处理设备上执行时,上述计算机程序还适于执行初始化有如下方法步骤的程序:提取预设领域对应的第一裁判文书的焦点,构成预设领域对应的焦点库;将焦点库中的焦点根据预设的维度进行分类;根据焦点库中的焦点所属的类别进行编码,得到每个焦点对应的标识。
当在数据处理设备上执行时,上述计算机程序还适于执行初始化有如下方法步骤的程序:在目标裁判文书中依次查找每个焦点位置;如果焦点位置对应的内容的属性与焦点位置所指示的焦点对应的焦点属性相同,则确定目标裁判文书中焦点位置对应的内容为焦点。
当在数据处理设备上执行时,上述计算机程序还适于执行初始化有如下方法步骤的程序:根据目标裁判文书中所有的焦点对应的标识构成焦点序列;输出焦点序列,并根据焦点序列中每个焦点对应的焦点内容,输出目标裁判文书的焦点内容。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (6)
1.一种获取裁判文书焦点的方法,其特征在于,包括:
获取预设的焦点规则引擎,其中,所述焦点规则引擎根据已确定焦点的第一裁判文书构建;
通过所述焦点规则引擎获取属于目标裁判文书的焦点;
其中,在获取预设的焦点规则引擎之前,所述方法还包括:根据已确定焦点的第一裁判文书构建焦点规则引擎,其中,根据已确定焦点的第一裁判文书构建焦点规则引擎的步骤包括:获取预设领域对应的第一裁判文书;获取所述第一裁判文书中的焦点对应的焦点信息;根据所述第一裁判文书中的焦点和所述焦点对应的焦点信息构建所述预设领域对应的焦点规则引擎;
其中,获取预设领域对应的第一裁判文书,包括:获取多个第二裁判文书;根据所述第二裁判文书的案由确定所述第二裁判文书所属的领域;将属于所述预设领域的第二裁判文书作为所述预设领域对应的第一裁判文书;
其中,所述焦点信息包括:焦点位置和焦点属性,通过所述焦点规则引擎获取属于目标裁判文书的焦点,包括:在所述目标裁判文书中依次查找每个焦点位置;如果所述焦点位置对应的内容的属性与所述焦点位置所指示的焦点对应的焦点属性相同,则确定所述目标裁判文书中所述焦点位置对应的内容为焦点;
其中,在通过所述焦点规则引擎获取属于目标裁判文书的焦点之后,所述方法还包括:根据所述目标裁判文书中所有的焦点对应的标识构成焦点序列;输出所述焦点序列,并根据所述焦点序列中每个焦点对应的焦点内容,输出所述目标裁判文书的焦点内容。
2.根据权利要求1所述的方法,其特征在于,在获取预设领域对应的第一裁判文书之后,所述方法还包括:
提取所述预设领域对应的第一裁判文书的焦点,构成所述预设领域对应的焦点库;
将所述焦点库中的焦点根据预设的维度进行分类;
根据所述焦点库中的焦点所属的类别进行编码,得到每个焦点对应的标识。
3.一种获取裁判文书焦点的装置,其特征在于,包括:
第一获取模块,用于获取预设的焦点规则引擎,其中,所述焦点规则引擎根据已确定焦点的第一裁判文书构建;
第二获取模块,用于通过所述焦点规则引擎获取属于目标裁判文书的焦点;
其中,所述装置还包括:构建模块,用于在获取预设的焦点规则引擎之前,根据已确定焦点的第一裁判文书构建焦点规则引擎,其中,所述构建模块包括:
第一获取子模块,用于获取预设领域对应的第一裁判文书;
第二获取子模块,用于获取所述第一裁判文书中的焦点对应的焦点信息;
构建子模块,用于根据所述第一裁判文书中的焦点和所述第一裁判文书中的焦点对应的焦点信息构建所述预设领域对应的焦点规则引擎;
其中,所述第一获取子模块,包括:
获取单元,用于获取多个第二裁判文书;
第一确定单元,用于根据所述第二裁判文书的案由确定所述第二裁判文书所属的领域;
第二确定单元,用于将属于所述预设领域的第二裁判文书作为所述预设领域对应的第一裁判文书;
其中,焦点信息包括:焦点位置和焦点属性,第二获取模块包括:查找子模块,用于在目标裁判文书中依次查找每个焦点位置;确定子模块,用于如果焦点位置对应的内容的属性与焦点位置所指示的焦点对应的焦点属性相同,则确定目标裁判文书中焦点位置对应的内容为焦点;
其中,装置还包括:构建模块,用于在通过焦点规则引擎获取属于目标裁判文书的焦点之后,根据目标裁判文书中所有的焦点对应的标识构成焦点序列;输出模块,用于输出焦点序列,并根据焦点序列中每个焦点对应的焦点内容,输出目标裁判文书的焦点内容。
4.根据权利要求3所述的装置,其特征在于,所述装置还包括:
提取模块,用于在获取预设领域对应的裁判文书库之后,提取所述预设领域对应的第一裁判文书库的焦点,构成所述预设领域对应的焦点库;
分类模块,用于将所述焦点库中的焦点根据预设的维度进行分类;
编码模块,用于根据所述焦点库中的焦点所属的类别进行编码,得到每个焦点对应的标识。
5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1或2所述的获取裁判文书焦点的方法。
6.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1或2所述的获取裁判文书焦点的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710433361.9A CN109033105B (zh) | 2017-06-09 | 2017-06-09 | 获取裁判文书焦点的方法和装置 |
PCT/CN2018/090354 WO2018224028A1 (zh) | 2017-06-09 | 2018-06-08 | 获取裁判文书焦点的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710433361.9A CN109033105B (zh) | 2017-06-09 | 2017-06-09 | 获取裁判文书焦点的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109033105A CN109033105A (zh) | 2018-12-18 |
CN109033105B true CN109033105B (zh) | 2022-03-01 |
Family
ID=64566401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710433361.9A Active CN109033105B (zh) | 2017-06-09 | 2017-06-09 | 获取裁判文书焦点的方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109033105B (zh) |
WO (1) | WO2018224028A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401047A (zh) * | 2018-12-29 | 2020-07-10 | 北京国双科技有限公司 | 法律文书的争议焦点生成方法、装置及计算机设备 |
CN111507095B (zh) * | 2019-01-29 | 2023-05-02 | 阿里云计算有限公司 | 裁判文书的生成方法、装置、存储介质和处理器 |
CN109992664B (zh) * | 2019-03-12 | 2023-04-18 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
CN110516203B (zh) * | 2019-08-28 | 2023-08-04 | 北京市律典通科技有限公司 | 争议焦点分析方法、装置、电子设备及计算机可存储介质 |
CN110765760B (zh) * | 2019-09-03 | 2023-01-06 | 平安科技(深圳)有限公司 | 一种法律案件分配方法、装置、存储介质和服务器 |
CN112541005A (zh) * | 2019-09-23 | 2021-03-23 | 北京国双科技有限公司 | 编号的生成方法、装置及电子设备 |
CN112580338A (zh) * | 2019-09-27 | 2021-03-30 | 北京国双科技有限公司 | 确定争议焦点的方法和装置、存储介质和设备 |
CN112579746B (zh) * | 2019-09-29 | 2024-06-18 | 京东科技控股股份有限公司 | 获取文本对应的行为信息的方法和装置 |
CN112579763A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种文书的推送方法及装置 |
CN110889502B (zh) * | 2019-10-15 | 2024-02-06 | 东南大学 | 一种基于深度学习的争议焦点生成方法 |
CN111563374B (zh) * | 2020-03-23 | 2022-08-19 | 北京交通大学 | 一种基于司法裁判文书的人员社交关系抽取方法 |
CN111753537B (zh) * | 2020-06-12 | 2024-08-16 | 鼎富智能科技有限公司 | 离婚纠纷裁判文书标签提取方法及装置 |
CN111753538B (zh) * | 2020-06-12 | 2024-06-14 | 鼎富智能科技有限公司 | 离婚纠纷裁判文书要素提取方法及装置 |
CN111783472A (zh) * | 2020-06-30 | 2020-10-16 | 鼎富智能科技有限公司 | 一种判决书内容提取方法及相关装置 |
CN111967437A (zh) * | 2020-09-03 | 2020-11-20 | 平安国际智慧城市科技股份有限公司 | 文本识别方法、装置、设备及存储介质 |
CN114092119A (zh) * | 2021-11-29 | 2022-02-25 | 北京金堤科技有限公司 | 供应关系获取方法、装置、存储介质及电子设备 |
CN114428847A (zh) * | 2021-12-28 | 2022-05-03 | 北京华宇元典信息服务有限公司 | 用于争议焦点裁判文书的筛选的模型的训练方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426748A (zh) * | 2014-09-18 | 2016-03-23 | 腾讯科技(深圳)有限公司 | 一种规则文件的更新方法和设备 |
CN106502996A (zh) * | 2016-12-13 | 2017-03-15 | 深圳爱拼信息科技有限公司 | 一种基于语义匹配的裁判文书检索方法和服务器 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0613197D0 (en) * | 2006-07-01 | 2006-08-09 | Ibm | An improved method and system for finding the focus of a document |
EP2788907A2 (en) * | 2011-12-06 | 2014-10-15 | Perception Partners Inc. | Text mining analysis and output system |
US20160103823A1 (en) * | 2014-10-10 | 2016-04-14 | The Trustees Of Columbia University In The City Of New York | Machine Learning Extraction of Free-Form Textual Rules and Provisions From Legal Documents |
CN105988978B (zh) * | 2015-03-04 | 2019-05-28 | 科大讯飞股份有限公司 | 确定文本焦点的方法及系统 |
US20170061482A1 (en) * | 2015-08-24 | 2017-03-02 | TCL Research America Inc. | Focal-point based recommendation method and system |
-
2017
- 2017-06-09 CN CN201710433361.9A patent/CN109033105B/zh active Active
-
2018
- 2018-06-08 WO PCT/CN2018/090354 patent/WO2018224028A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426748A (zh) * | 2014-09-18 | 2016-03-23 | 腾讯科技(深圳)有限公司 | 一种规则文件的更新方法和设备 |
CN106502996A (zh) * | 2016-12-13 | 2017-03-15 | 深圳爱拼信息科技有限公司 | 一种基于语义匹配的裁判文书检索方法和服务器 |
Non-Patent Citations (1)
Title |
---|
庭审实质化背景下刑事裁判文书内容建构与说理探析;边锋 等;《辽宁公安司法管理干部学院学报》;20170601(第03期);33-38 * |
Also Published As
Publication number | Publication date |
---|---|
CN109033105A (zh) | 2018-12-18 |
WO2018224028A1 (zh) | 2018-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033105B (zh) | 获取裁判文书焦点的方法和装置 | |
CN111737499B (zh) | 基于自然语言处理的数据搜索方法及相关设备 | |
CN111738011A (zh) | 违规文本的识别方法及装置、存储介质、电子装置 | |
KR101627398B1 (ko) | 내용기반의 검색엔진을 이용한 개인 콘텐츠 저작권 관리 시스템 및 방법 | |
CN107025239B (zh) | 敏感词过滤的方法和装置 | |
CN108984675A (zh) | 基于评价的数据查询方法和装置 | |
CN110929125A (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN108009137B (zh) | 一种基于配置文件的规范文书处理方法、装置及系统 | |
CN106815265B (zh) | 裁判文书的搜索方法及装置 | |
CN106933878B (zh) | 一种信息处理方法及装置 | |
CN111967437A (zh) | 文本识别方法、装置、设备及存储介质 | |
US9521164B1 (en) | Computerized system and method for detecting fraudulent or malicious enterprises | |
CN110020134B (zh) | 一种知识服务信息的推送方法、系统、存储介质和处理器 | |
CN110955796B (zh) | 一种基于笔录信息的案件特征信息提取方法及装置 | |
CN117745237A (zh) | 内容审查方法、装置、设备以及存储介质 | |
CN111062199B (zh) | 一种不良信息识别方法及装置 | |
TWI575391B (zh) | 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 | |
CN110647504A (zh) | 司法文书的检索方法及装置 | |
CN110097258B (zh) | 一种用户关系网络建立方法、装置及计算机可读存储介质 | |
CN111325562A (zh) | 粮食安全追溯系统及方法 | |
CN111401047A (zh) | 法律文书的争议焦点生成方法、装置及计算机设备 | |
CN114417860A (zh) | 一种信息检测方法、装置及设备 | |
CN110502615B (zh) | 卫生信息数据元标准数据生成方法及系统 | |
CN114092119A (zh) | 供应关系获取方法、装置、存储介质及电子设备 | |
KR102126839B1 (ko) | 딥러닝 기반 국가별 저작물 검색 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |