CN113191922A - 诉讼决策信息请求处理方法及装置 - Google Patents

诉讼决策信息请求处理方法及装置 Download PDF

Info

Publication number
CN113191922A
CN113191922A CN202110387133.9A CN202110387133A CN113191922A CN 113191922 A CN113191922 A CN 113191922A CN 202110387133 A CN202110387133 A CN 202110387133A CN 113191922 A CN113191922 A CN 113191922A
Authority
CN
China
Prior art keywords
litigation
case
information
decision
referee document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110387133.9A
Other languages
English (en)
Inventor
张国良
赵军臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Lulian Oriental Culture Communication Co ltd
Original Assignee
Beijing Lulian Oriental Culture Communication Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Lulian Oriental Culture Communication Co ltd filed Critical Beijing Lulian Oriental Culture Communication Co ltd
Priority to CN202110387133.9A priority Critical patent/CN113191922A/zh
Publication of CN113191922A publication Critical patent/CN113191922A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种诉讼决策信息请求处理方法、装置、电子设备和存储介质,该方法的一具体实施方式包括:接收诉讼决策检索请求,其中,所述诉讼决策检索请求包括案由关键词和/或案情关键词;在裁判文书信息集合中检索与所述诉讼决策检索请求相匹配的裁判文书信息中的诉讼决策信息,其中,裁判文书信息包括案由关键词、案情关键词和诉讼决策信息;按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与所述诉讼决策检索请求对应的诉讼决策信息统计结果。实现了对诉讼决策信息请求的处理,能够得到与诉讼决策检索请求中案由关键词和/或案情关键词对应的诉讼决策信息统计结果,提高诉讼决策信息的匹配程度。

Description

诉讼决策信息请求处理方法及装置
技术领域
本申请涉及信息处理技术,尤其涉及一种诉讼决策信息请求处理方法、装置、电子设备及存储介质。
背景技术
当事人遇到纠纷,在决策是否通过诉讼解决的时候,除了分析官司能不能打得赢,一般还要分析打官司的成本是否值得。
但当事人通过咨询律师等形式所得到的回答通常都很主观,说服力有限;且案件的审理过程中各种变量太多,单靠法律条文很难判断实际打官司的成本。如何提供对当事人案件的诉讼决策信息是当前亟待解决的问题。
发明内容
本公开的实施例提出了诉讼决策信息请求处理方法、装置、电子设备和存储介质。
第一方面,本公开的实施例提供了一种诉讼决策信息请求处理方法,该方法包括:接收诉讼决策检索请求,其中,上述诉讼决策检索请求包括案由关键词和/或案情关键词;在裁判文书信息集合中检索与上述诉讼决策检索请求相匹配的裁判文书信息中的诉讼决策信息,其中,裁判文书信息包括案由关键词、案情关键词和诉讼决策信息;按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与上述诉讼决策检索请求对应的诉讼决策信息统计结果。
在一些可选的实施方式中,上述方法还包括:
按照预设呈现形式呈现上述诉讼决策信息统计结果。
在一些可选的实施方式中,上述裁判文书信息集合由裁判文书信息集合建立步骤预先建立的,上述裁判文书信息集合建立步骤包括:
获取至少一份历史裁判文书数据;
提取每个历史裁判文书数据中的案由关键词、案情关键词和诉讼决策信息;
将各上述历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息对应存储形成上述裁判文书信息集合。
在一些可选的实施方式中,案由关键词包括原始案由关键词和/或标准案由关键词;
上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个上述历史裁判文书数据,基于预设的案由定位词,定位该历史裁判文书数据中的原始案由关键词,基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,以及将定位得到的原始案由关键词和 /或所确定的标准案由关键词确定为该历史裁判文书数据的案由关键词。
在一些可选的实施方式中,上述基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,包括:
计算上述标准案由词库中每个标准案由关键词与定位得到的原始案由关键词的相关系数;
将上述标准案由词库中与定位得到的原始案由关键词的相关系数大于预设相关系数阈值的标准案由关键词确定为与定位得到的原始案由关键词对应的标准案由关键词。
在一些可选的实施方式中,上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
去掉每个历史裁判文书数据的预设停用词;
提取去掉预设停用词后的每个上述历史裁判文书数据的案情关键词。
在一些可选的实施方式中,上述去掉每个历史裁判文书数据的预设停用词,包括:
将每个历史裁判文书数据分词,得到相应的历史裁判文书数据分词序列,从得到的历史裁判文书数据分词序列中去掉预设停用词,得到相应的历史裁判文书数据分词子序列;
上述提取去掉预设停用词后的每个上述历史裁判文书数据的案情关键词,包括:
确定每个上述历史裁判文书数据分词子序列中每个分词的权重;
将每个上述历史裁判文书数据分词子序列中权重大于预设权重阈值的各分词确定为相应历史裁判文书数据的案情关键词。
在一些可选的实施方式中,诉讼决策信息包括时间信息和/或费用信息;以及
上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个历史裁判文书数据,基于预设的诉讼决策信息定位关键词,定位该历史裁判文书数据中的诉讼决策信息所在句子,根据预设的时间数据格式和 /或金额数据格式定位并提取定位得到的句子中的时间信息和/或费用信息,以及将提取到的时间信息和/或费用信息确定为该历史裁判文书数据中的诉讼决策信息。
在一些可选的实施方式中,诉讼决策信息还包括审理周期和/或诉求金额满足率;以及
上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,还包括:
基于每个历史裁判文书数据的诉讼决策信息中的时间信息确定该历史裁判文书数据的诉讼决策信息中的审理周期,和/或,基于每个历史裁判文书数据的诉讼决策信息中的费用信息确定该历史裁判文书数据的诉讼决策信息中的诉求金额满足率。
第二方面,本公开的实施例提供了一种诉讼决策信息请求处理装置,该装置包括:接收单元,被配置成接收诉讼决策检索请求,其中,上述诉讼决策检索请求包括案由关键词和/或案情关键词;检索单元,被配置成在裁判文书信息集合中检索与上述诉讼决策检索请求相匹配的裁判文书信息中的诉讼决策信息,其中,裁判文书信息包括案由关键词、案情关键词和诉讼决策信息;统计单元,被配置成按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与上述诉讼决策检索请求对应的诉讼决策信息统计结果。
在一些可选的实施方式中,上述装置还包括:
呈现单元,被配置成按照预设呈现形式呈现上述诉讼决策信息统计结果。
在一些可选的实施方式中,上述裁判文书信息集合由裁判文书信息集合建立步骤预先建立的,上述裁判文书信息集合建立步骤包括:
获取至少一份历史裁判文书数据;
提取每个历史裁判文书数据中的案由关键词、案情关键词和诉讼决策信息;
将各上述历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息对应存储形成上述裁判文书信息集合。
在一些可选的实施方式中,案由关键词包括原始案由关键词和/或标准案由关键词;
上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个上述历史裁判文书数据,基于预设的案由定位词,定位该历史裁判文书数据中的原始案由关键词,基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,以及将定位得到的原始案由关键词和 /或所确定的标准案由关键词确定为该历史裁判文书数据的案由关键词。
在一些可选的实施方式中,上述基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,包括:
计算上述标准案由词库中每个标准案由关键词与定位得到的原始案由关键词的相关系数;
将上述标准案由词库中与定位得到的原始案由关键词的相关系数大于预设相关系数阈值的标准案由关键词确定为与定位得到的原始案由关键词对应的标准案由关键词。
在一些可选的实施方式中,上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
去掉每个历史裁判文书数据的预设停用词;
提取去掉预设停用词后的每个上述历史裁判文书数据的案情关键词。
在一些可选的实施方式中,上述去掉每个历史裁判文书数据的预设停用词,包括:
将每个历史裁判文书数据分词,得到相应的历史裁判文书数据分词序列,从得到的历史裁判文书数据分词序列中去掉预设停用词,得到相应的历史裁判文书数据分词子序列;
上述提取去掉预设停用词后的每个上述历史裁判文书数据的案情关键词,包括:
确定每个上述历史裁判文书数据分词子序列中每个分词的权重;
将每个上述历史裁判文书数据分词子序列中权重大于预设权重阈值的各分词确定为相应历史裁判文书数据的案情关键词。
在一些可选的实施方式中,诉讼决策信息包括时间信息和/或费用信息;以及
上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个历史裁判文书数据,基于预设的诉讼决策信息定位关键词,定位该历史裁判文书数据中的诉讼决策信息所在句子,根据预设的时间数据格式和 /或金额数据格式定位并提取定位得到的句子中的时间信息和/或费用信息,以及将提取到的时间信息和/或费用信息确定为该历史裁判文书数据中的诉讼决策信息。
在一些可选的实施方式中,诉讼决策信息还包括审理周期和/或诉求金额满足率;以及
上述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,还包括:
基于每个历史裁判文书数据的诉讼决策信息中的时间信息确定该历史裁判文书数据的诉讼决策信息中的审理周期,和/或,基于每个历史裁判文书数据的诉讼决策信息中的费用信息确定该历史裁判文书数据的诉讼决策信息中的诉求金额满足率。
第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,上述计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的实施例提供的诉讼决策信息请求处理方法、装置、电子设备和存储介质,通过首先接收诉讼决策检索请求,其中,上述诉讼决策检索请求包括案由关键词和/或案情关键词;然后,在裁判文书信息集合中检索与上述诉讼决策检索请求相匹配的裁判文书中的诉讼决策信息;最后,按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与上述诉讼决策检索请求对应的诉讼决策信息统计结果。通过响应于包括案由关键词和/或案情关键词诉讼决策检索请求,能够提供与案由关键词和/或案情关键词相对应的诉讼决策信息统计结果,该诉讼决策信息统计结果的案由和/或案情与当事人的待决策案件相对应,对当事人的诉讼决策具有较大的参考价值,进而实现了向当事人的待决策案件提供诉讼决策信息。相对于当事人向律师进行咨询,当事人可以迅速得到待决策案件相关的诉讼决策信息,且不依赖于具体律师的个人经验,提高了当事人的咨询效率。在传统的法律检索工具中,仅根据用户输入给出相关裁判文书列表,用户需要在大量裁判文书中手动点开阅读,并人工总结相关诉讼决策信息,而本公开提供的方案,对相关的诉讼决策信息进行了统计,可以为当时人提供更加直观的诉讼决策信息统计结果,减少了当事人总结相关诉讼决策信息的工作量,提高了当事人判断待决策案件是否具有诉讼价值的决策效率。
附图说明
附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
图1为本公开的一个实施例可以应用于其中的示例性系统架构图;
图2为根据本公开的诉讼决策信息请求处理方法的一个实施例的流程示意图;
图3为根据本公开的诉讼决策信息请求处理方法的又一个实施例的流程示意图;
图4为本公开的裁判文书信息集合建立步骤一个实施例的流程示意图;
图4A为图4所示的建立步骤中步骤402的一个实施例的的分解流程图;
图5为根据本公开的诉讼决策信息请求处理装置的一个实施例的结构示意图;
图6为适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的诉讼决策信息请求处理方法、装置、电子设备和存储介质的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、 102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的终端设备中。其可以实现成多个软件或软件模块(例如用来提供接收诉讼决策检索请求服务),也可以实现成单个软件或软件模块。在此不做具体限定。
在一些情况下,本公开所提供的诉讼决策信息请求处理方法可以由终端设备101、102、103执行,相应地,诉讼决策信息请求处理装置可以设置于终端设备101、102、103中。这时,系统架构100也可以不包括服务器105。
在一些情况下,本公开所提供的诉讼决策信息请求处理方法可以由终端设备101、102、103和服务器105共同执行,例如,“接收诉讼决策检索请求”的步骤可以由终端设备101、102、103执行,“在裁判文书信息集合中检索与诉讼决策检索请求相匹配的裁判文书中的诉讼决策信息”等步骤可以由服务器105 执行。本公开对此不做限定。相应地,诉讼决策信息请求处理装置也可以分别设置于终端设备101、102、103和服务器105中。
在一些情况下,本公开所提供的诉讼决策信息请求处理方法可以由服务器 105执行,相应地,诉讼决策信息请求处理装置也可以设置于服务器105中,这时,系统架构100也可以不包括终端设备101、102、103。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,其示出了根据本公开的诉讼决策请求处理方法的一个实施例的流程200,该诉讼决策请求处理方法包括以下步骤:
步骤201,接收诉讼决策检索请求。
在本实施例中,诉讼决策请求处理方法的执行主体(例如,图1所示的服务器105)可以本地或者远程地从与上述执行主体网络连接的其他电子设备(例如,图1所示的终端设备101、102、103)接收诉讼决策检索请求。其中,诉讼决策检索请求可以包括案由关键词和/或案情关键词。
例如,在一些应用场景中,可以提供一搜索框,用户在搜索框中输入检索语句,比如包括了用户待决策案件的案由关键词和/或案情关键词的检索语句,然后点击提交、查询等按钮,形成诉讼决策检索请求,将诉讼决策检索请求发送给上述执行主体,上述执行主体可以本地接收或者远程从与上述执行主体网络连接的其他电子设备接收诉讼决策检索请求。
本公开中的案由关键词即案由,是人民法院对诉讼案件所涉及的法律关系的性质进行概括后形成的。例如案由关键词可以是:著作权纠纷、隐私权纠纷、租赁权纠纷等。
在一些可选的实施方式中,案由关键词可以包括原始案由关键词和/或标准案由关键词。
标准案由关键词可包括标准案由。标准案由是由法律专家以法定案由为基础而制定的,示例地,本公开中的标准案由可包括2011年2月18日公布的《最高人民法院关于修改〈民事案件案由规定〉的决定》(法〔2011〕41号)中所规定的案由及最高人民法院在中国裁判文书网中所采用的案由。原始案由关键词是指从裁判文书中提取的案由关键词。这里只是对标准案由和原始案由的举例说明,而非具体限定。
可以理解的是,由于裁判文书是由人为进行编写和录入的,因此在实际的司法工作中,由于编写者的文字习惯或案件的具体情况等原因,裁判文书中的案由关键词经常会出现非标准案由的描写方式,例如:在一裁判文书中提取的案由关键词为“养殖回收合同纠纷”,这显然是不属于标准案由定义范围的,其对应的标准案由为“合同纠纷”。
本公开中的案情关键词,是描述与案情相关的、能描述一个事物或者事情的普通关键词,比如胳膊、撞车、图片、手机、软件等,这里只是对案情关键词的举例说明,而非是具体的限定。
步骤202,在裁判文书信息集合中检索与诉讼决策检索请求相匹配的裁判文书中的诉讼决策信息。其中,裁判文书信息包括案由关键词、案情关键词和诉讼决策信息
诉讼决策信息可以包括:与诉讼决策检索请求中案由关键词相匹配的诉讼决策信息、与诉讼决策检索请求中案情关键词相匹配的诉讼决策信息或与诉讼决策检索请求中案由关键词和案情关键词相匹配的诉讼决策信息。
在本实施例中,上述执行主体可以在裁判文书信息集合中检索与诉讼决策检索请求相匹配的裁判文书中的诉讼决策信息。示例地,可将诉讼决策检索请求中的案由关键词和/或案情关键词与裁判文书信息合集中的案由关键词和/或案情关键词进行字符串的匹配,比如:将诉讼决策检索请求中的案由关键词与裁判文书信息合集中的案由关键词相同的视为相匹配,或者,将诉讼决策检索请求中的案由关键词的字符串与裁判文书信息合集中的案由关键词的字符串进行比对,将字符串重叠率大于预设重叠率阈值、字符串重叠长度大于预设重叠字符长度阈值或字符串匹配度大于预设匹配度阈值的视为相匹配。案情关键词的匹配与案由关键词的匹配同理,不再赘述。
裁判文书信息集合可以包括但不限于:存储有至少一份对应的案由关键词、案情关键词和诉讼决策信息的信息集合。
示例地,裁判文书信息集合可以是技术人员基于大量的对裁判文书进行案由关键词、案情关键词和诉讼决策信息的提取所得到的,也可以是通过非监督学习方法训练得到的模型基于大量的对裁判文书进行案由关键词、案情关键词和诉讼决策信息的提取所得到的。
本公开中的诉讼决策信息,是指对诉讼决策有影响力的信息,特别是时间和各类费用等关键信息。作为示例,本公开中的诉讼决策信息可包括:时间信息和/或费用信息。
这里,时间信息可以包括裁判文书中的各种表示时间的信息,例如时间信息可以包括:立案时间、判决时间、刑期等。
费用信息可包括判决赔偿额,简称判赔额,在本公开中,判赔额为裁判文书中法院判决侵权一方赔偿受害一方的金额,分为判赔合计额和判赔明细额,判赔合计额就是法院判决的各项明细费用的合计金额,判赔明细额就是法院判决的各项费用的具体金额;如果一份裁判文书中,法院只判决了一个赔偿额,就视为判赔合计额。
进一步地,本公开中的诉讼决策信息还可包括:审理周期和/或诉求金额满足率。
审理周期为人民法院从立案之日起截至判决时间的时间周期,通常以天为单位。
诉求金额满足率为判赔合计额与诉求金额的比值。可以理解的是,诉求金额满足率反映了诉求金额与判赔合计额的比例关系,能有效反映案件通过诉讼达到预期诉求金额的程度,因此,是当事人在决定是否要发起诉讼要考虑的一个重要因素。
步骤203,按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与诉讼决策检索请求对应的诉讼决策信息统计结果。
诉讼决策信息中的数据可包括:时间信息、费用信息、审理周期和诉求金额满足率等。可以理解的是,诉讼决策信息中的数据包括可以量化的信息,上述步骤203可对可以量化的信息进行统计,得到数据化的诉讼决策信息统计结果。
示例地,步骤203中与诉讼决策检索请求对应的诉讼决策信息统计结果,可包括以下至少之一:
与诉讼决策检索请求中案由关键词对应的诉讼决策信息检索结果,将诉讼决策信息检索结果中可量化的信息进行统计分析,得到统计结果;
与诉讼决策检索请求中案情关键词对应的诉讼决策信息检索结果,将诉讼决策信息检索结果中可量化的信息进行统计分析,得到统计结果;
与诉讼决策检索请求中案情关键词和案由关键词组合对应的诉讼决策信息检索结果,将诉讼决策信息检索结果中可量化的信息进行统计分析,得到统计结果。
其中,上述将诉讼决策信息检索结果中可量化的信息进行统计分析,得到统计结果,可包括:
诉讼决策信息中包括时间信息、审理周期和判赔合计额,按诉讼决策信息检索结果中诉讼决策信息的时间信息,按年份、月份统计审理周期在时间维度上的变化趋势和判赔合计额的在时间维度上的变化趋势;这里的变化趋势可以用柱状图、折线图、条形图等形式体现,这里只是举例说明,本公开变化趋势的表现形式不做具体限定;
诉讼决策信息中包括判决法院地域信息、审理周期和判赔合计额,按诉讼决策信息检索结果中诉讼决策信息的判决法院地域信息,按省或城市,可给出在各地域审理周期的比较图和判赔合计额的比较图;这里的比较图可以用柱形图、着色地图等形式体现,例如,以城市名称为柱形图的横坐标,以审理周期和判赔合计额的数量为纵坐标,或者,在着色地图上以不同审理周期和判赔合计额对应的深浅对地域进行标色,这里只是举例说明,本公开对比较图的表现形式不做具体限定;
确定案由关键词和案情关键词匹配度最高的诉讼决策信息对应的裁判文书,具体地:首先,在检索结果中确定案由关键词匹配度最高的诉讼决策信息,若只有一份,则视为匹配度最高的诉讼决策信息,由于案由是对裁判文书的上位概括,因此案由关键词匹配度最高的可能是多份诉讼决策信息;然后,在多份案由关键词匹配度最高的诉讼决策信息中确定案情关键词匹配度最高的诉讼决策信息为匹配度最高的诉讼决策信息,确定与之对应的裁判文书;
统计上述诉讼决策信息检索结果中可量化的信息中,例如审理周期、判赔合计额等,各信息的最高值和/或中位数和/或众位数;这里的最高值、中位数及众位数的统计对象为诉讼决策信息检索结果中可量化的信息的数值,例如审理周期的天数、判赔合计额的金额数等。
这里只是对统计结果的举例说明,本公开对统计结果的种类多少、排列方式、显示样式等不做具体限定。
本公开的上述实施例提供的方法通过响应于包括案由关键词和/或案情关键词诉讼决策检索请求,能够提供与案由关键词和/或案情关键词相对应的诉讼决策信息统计结果,该诉讼决策信息统计结果的案由和/或案情与当事人的待决策案件相对应,对当事人的诉讼决策具有较大的参考价值,进而实现了向当事人的待决策案件提供诉讼决策信息。相对于当事人向律师进行咨询,当事人可以迅速得到待决策案件相关的诉讼决策信息,且不依赖于具体律师的个人经验,提高了当事人的咨询效率。在传统的法律检索工具中,仅根据用户输入给出相关裁判文书列表,用户需要在大量裁判文书中手动点开阅读,并人工总结相关诉讼决策信息,而本公开提供的方案,对相关的诉讼决策信息进行了统计,可以为当时人提供更加直观的诉讼决策信息统计结果,减少了当事人总结相关诉讼决策信息的工作量,提高了当事人判断待决策案件是否具有诉讼价值的决策效率。
进一步参考图3,其示出了根据本公开的诉讼决策请求处理方法的又一个实施例的流程300,该诉讼决策请求处理方法包括以下步骤
步骤301,接收诉讼决策检索请求。
其中,诉讼决策检索请求可以包括案由关键词和/或案情关键词。
步骤302,在裁判文书信息集合中检索与诉讼决策检索请求相匹配的裁判文书中的诉讼决策信息。
步骤303,按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与诉讼决策检索请求对应的诉讼决策信息统计结果。
上述步骤301至303与图2实施例方法中的步骤201至203相同,具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201至203的相关说明,在此不再赘述。
步骤304,按照预设呈现形式呈现诉讼决策信息统计结果。
对于诉讼决策信息统计结果的具体呈现方式,本公开不做具体限定,示例地,预设的呈现形式可以包括:在执行上述方法的服务器端本机的显示屏呈现,或者,将诉讼决策信息统计结果发送至终端设备,通过终端设备的显示屏呈现。
本公开的上述实施例提供的方法通过按照预设呈现形式呈现诉讼决策信息统计结果,能够便于用户更直观地获得诉讼决策信息统计结果,提高交互体验。
在一些可选的实施方式中,步骤202和步骤302中用到的裁判文书信息集合可以是通过如图4所示的裁判文书信息集合建立步骤预先建立的,继续参考图4,其示出了根据本公开的裁判文书信息集合建立步骤一个实施例的流程 400,该裁判文书信息集合建立步骤可以包括以下步骤:
步骤401,获取至少一份历史裁判文书数据。
这里,裁判文书信息集合建立步骤的执行主体可以与用于诉讼决策请求处理方法的执行主体相同或不同。如果相同,则裁判文书信息集合建立步骤的执行主体可以在建立裁判文书信息集合后将建立的裁判文书信息集合存储在本地。如果不同,则裁判文书信息集合建立步骤的执行主体可以在建立裁判文书信息集合后将建立的裁判文书信息集合发送给用于诉讼决策请求处理方法的执行主体。
裁判文书用于记载人民法院审理过程和结果,它是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的唯一凭证。一份结构完整、要素齐全、逻辑严谨的裁判文书,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。
裁判文书有其特殊的制作规律。常见的有民事裁判文书,刑事裁判文书,行政裁判文书以及其他通用诉讼文书等。在最高人民法院的裁判文书当中,分为民事文书、刑事文书、行政文书、执行文书、涉外文书五项。其中民事文书又包含三小项,即普通民事文书、商事文书、知识产权文书。
裁判文书数据可以是裁判文书的文本数据,或者根据裁判文书的图片或扫描件进行识别得到的裁判文书的文本数据。
历史裁判文书数据可以是当前法院已经发布的裁判文书数据。示例地,技术人员可以通过最高人民法院在中国裁判文书网发布的裁判文书获取历史裁判文书数据。
步骤402,提取每个历史裁判文书数据中的案由关键词、案情关键词和诉讼决策信息。
为了形成步骤202和步骤302中用到的裁判文书信息集合,这里,可以对步骤401中所获取的每个历史裁判文书数据,提取其中的案由关键词、案情关键词和诉讼决策信息。
作为示例,可以采用各种现在已知或者未来开发的关键词提取算法提取每个历史裁判文书数据中的案由关键词、案情关键词和诉讼决策信息,本公开对此不做具体限定。
本公开中的案由关键词即案由,是人民法院对诉讼案件所涉及的法律关系的性质进行概括后形成的。例如:著作权纠纷、隐私权纠纷、租赁权纠纷等。
在一些可选的实施方式中,案由关键词可以包括原始案由关键词和/或标准案由关键词。
标准案由关键词可包括标准案由。标准案由是由法律专家以法定案由为基础而制定的,示例地,本公开中的标准案由可包括2011年2月18日公布的《最高人民法院关于修改〈民事案件案由规定〉的决定》(法〔2011〕41号)中所规定的案由及最高人民法院在中国裁判文书网中所采用的案由。原始案由关键词是指从裁判文书中提取的案由关键词。这里只是对标准案由和原始案由的举例说明,而非具体限定。
可以理解的是,由于裁判文书是由人为进行编写和录入的,因此在实际的司法工作中,由于编写者的文字习惯或案件的具体情况等原因,裁判文书中的案由关键词经常会出现非标准案由的描写方式,例如:在一裁判文书中提取的案由关键词为“养殖回收合同纠纷”,这显然是不属于标准案由定义范围的,其对应的标准案由为“合同纠纷”。
本公开中的案情关键词,是描述与案情相关的、能描述一个事物或者事情的普通关键词,比如胳膊、撞车、图片、手机、软件等,这里只是对案情关键词的举例说明,而非是具体的限定。
本公开中的诉讼决策信息,是指对诉讼决策有影响力的信息,特别是时间和各类费用等关键信息。本公开中的诉讼决策信息可包括:时间信息和/或费用信息。
进一步地,本公开中的诉讼决策信息还可包括:审理周期和/或诉求金额满足率。
在一些可选的实施方式中,上述执行主体在得到时间信息和/或费用信息后,可基于时间信息确定审理周期,和/或,基于费用信息确定诉求金额满足率。
在一些可选的实施方案中,诉讼决策信息为数字型决策信息,数字型决策信息是指具有数字特征并对诉讼决策有影响力的信息,特别是各类时间和各类费用等重要信息,如审理周期、刑期、判赔额及诉讼费等。裁判文书中有各种类型的数字,本公开中统称之为基础数字。在裁判文书中,有的数字型决策信息就是基础数字本身,可以直接提取并运用,有的数字型基础信息需要先提取基础数字然后再通过计算获得。
在一些可选的实施方式中,上述步骤402具体可包括:
对于每个历史裁判文书数据,基于预设的案由定位词,定位该历史裁判文书数据中的原始案由关键词,基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,以及将定位得到的原始案由关键词和/或所确定的标准案由关键词确定为该历史裁判文书数据的案由关键词。
可以理解的是,预设的案由定位词,可根据裁判文书的标准格式确定;具体地,可根据裁判文书中涉及案由部分的撰写规律进行总结得到,也可通过无监督学习算法对裁判文书中的案由定位词进行学习和整理得到。例如:在案例A的部分内容“原告A公司诉被告台山市自然资源局、第三人B公司城市规划行政许可纠纷一案,本院于2020年10月10日立案后,依法组成合议庭进行审理。”中,“一案”可作为案由定位词,识别括号后、纠纷前的内容,对应定位到原始案由“城市规划行政许可纠纷”;在案例A的另一部分内容“本院认为,本案为城市规划行政许可纠纷。本案的争议焦点为: A公司与被诉行政行为是否存在利害关系,其是否本案的适格原告。”中,“本院认为”可作为案由定位词,识别“本案为”之后、“纠纷”之前,“纠纷”有标点,印证了本案的原始案由为“城市规划行政许可纠纷”。又例如:在案例B的部分内容“原告C合作社诉被告a养殖回收合同纠纷一案,本院于2020年12月11日立案受理,依法适用简易程序,公开开庭进行审理。原告C合作社的委托诉讼代理人b、被告c的委托诉讼代理人d到庭参加诉讼,本案现已审理终结。原告e诉被告f、D保险股份有限公司泰安中心支公司机动车交通事故责任纠纷一案,本院受理后,依法适用简易程序,公开开庭进行了审理。原告的委托诉讼代理人g,被告h,被告的委托诉讼代理人i到庭参加诉讼。本案现已审理终结。”中,可根据“一案”作为案由定位词定位到原始案由“养殖回收合同纠纷”。
预设的标准案由词库,可通过最高人民法院判决文书网或最高人民法院就案由规定的相关公告中定义的标准案由整理得到。
在一些可选的实施方式中,基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,可包括:
计算标准案由词库中每个标准案由关键词与定位得到的原始案由关键词的相关系数;将标准案由词库中与定位得到的原始案由关键词的相关系数大于预设相关系数阈值的标准案由关键词确定为与定位得到的原始案由关键词对应的标准案由关键词。
示例地,计算标准案由词库中每个标准案由关键词与定位得到的原始案由关键词的相关系数可包括:将原始案由关键词分词,得到原始案由关键词的分词序列;将标准案由库中每个标准案由关键词分词,得到标准案由库中每个标准案由关键词的分词序列;计算原始案由关键词的分词序列与每个标准案由关键词的分词序列的相关系数。
在一些可选的实施方式中,将标准案由词库中与定位得到的原始案由关键词的相关系数大于预设相关系数阈值的标准案由关键词确定为与定位得到的原始案由关键词对应的标准案由关键词可包括:将相关系数最大的标准案由关键词确定为与原始案由关键词对应的标准案由关键词。可以理解的是,原始案由关键词的表述可能与标准案由关键词相同,也可以与标准案由关键词不同,在一些应用场景中,原始案由关键词可以是标准案由关键词的下位,例如:养殖回收合同纠纷是合同纠纷的下位。
相关度阈值大于预设相关系数阈值的标准案由可包括:能够在原始案由关键词中对应匹配到该标准案由关键词全部内容的标准案由关键词。
如图4A所示,在一些可选的实施方式中,上述步骤402具体可包括:
步骤402a1,去掉每个历史裁判文书数据的预设停用词。
停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。本公开中对于去掉预设停用词的方式不做具体限定,例如,上述执行主体可以采用哈工大停用词表、百度停用词表作为预设停用词,也可以根据实际需要设置的停用词表作为预设停用词。
在一些可选的实施方式中,上述步骤402a1具体可包括:将每个历史裁判文书数据分词,得到相应的历史裁判文书数据分词序列,从得到的历史裁判文书数据分词序列中去掉预设停用词,得到相应的历史裁判文书数据分词子序列。
需要说明的是,如何对文本进行分词是本领域广泛研究和应用的现有技术,在此不再赘述。例如,可以采用基于字符串匹配的分词方法、基于理解的分词方法或者基于统计的分词方法等等。
步骤402a2,提取去掉预设停用词后的每个历史裁判文书数据的案情关键词。
在一些可选的实施方式中,上述步骤402a2具体可包括:
确定每个历史裁判文书数据分词子序列中每个分词的权重,将每个历史裁判文书数据分词子序列中权重大于预设权重阈值的各分词确定为相应历史裁判文书数据的案情关键词。
需要说明的是,如何对文本权重进行计算是本领域广泛研究和应用的现有技术,对于权重计算具体采用的算法或算法组合,本公开不做具体限定。例如:采用词频-逆文本频率指数(TF-IDF,Term frequency–Inverse document frequency)算法,可以至少一份历史裁判文书数据为基本语料库,通过TIF- IDF算法计算关键词的分值,取前N项;词语向量误差修正模型(Word2Vec, word to vector)算法,可以结合上下文计算关键词的分值,取前N项;词频算法,按照词频高低进行降序排序,取前N项。N为正整数
在一些可选的实施方式中,上述步骤402具体可包括:
对于每个历史裁判文书数据,基于预设的诉讼决策信息定位关键词,定位该历史裁判文书数据中的诉讼决策信息所在句子,根据预设的时间数据格式和 /或金额数据格式定位并提取定位得到的句子中的时间信息和/或费用信息,以及将提取到的时间信息和/或费用信息确定为该历史裁判文书数据中的诉讼决策信息。
其中,预设的诉讼决策信息定位关键词,可根据裁判文书的标准格式确定;具体地,可根据裁判文书中涉及诉讼决策信息部分的撰写规律进行总结得到,也可通过无监督学习算法对裁判文书中的诉讼决策信息定位关键词进行学习和整理得到。例如:判赔合计额一般位于判决书尾部;所在句子一般位于关键词“判决如下:”之后,“如不服本判决”之前;判赔合计额所在句子一般包含的关键词是:“赔偿”、“共计”或者“合计”等;判赔合计额就是“共计”或者“合计”等关键词之后的金额。
金额数据格式一般为:数字+元、数字+万元、数字+亿元等;时间格式一般为:*年*月*日;可以正则式表达。
费用信息对应的关键词可根据法规确定,示例地,可包括:医疗费、护理费、误工费、精神损失费、交通费、住院伙食补助费、营养费、鉴定费、丧葬费、诉讼费、律师费等。
费用信息包括判决赔偿额,简称判赔额,在本公开中,判赔额为裁判文书中法院判决侵权一方赔偿受害一方的金额,分为判赔合计额和判赔明细额,判赔合计额就是法院判决的各项明细费用的合计金额,判赔明细额就是法院判决的各项费用的具体金额;如果一份裁判文书中,法院只判决了一个赔偿额,就视为判赔合计额。
判决赔偿额是当事人在决定是否要发起诉讼要考虑的一个重要因素。比如:当一个图片公司发现一家网站擅自使用了自己的图片,那么是否要起诉这家网站,图片公司首先要考虑的是打赢官司可以拿到多少赔偿;一般赔偿多的话,不仅值得打,还可以请律师打;如果赔偿少,打官司就不值得。
示例地,在案例C的部分内容“综上,依照《中华人民共和国侵权责任法》第十六条、第二十二条、第二十六条,《最高人民法院关于适用〈中华人民共和国民法典〉时间效力的若干规定》规定,判决如下:一、E公司于本判决生效之日起七日内赔偿j医疗费2592.9元、误工费6000元、护理费1105 元、交通费50元、住院伙食补助费2350元、营养费2250元、鉴定费1050 元,以上共计15397.9元;二、驳回j其他诉讼请求。如果未按照本判决指定的期间履行给付金钱义务,应当依照《中华人民共国民事诉讼法》第二百五十三条之规定,加倍支付迟延履行期间的债务信息。案件受理费703元,由j负担403元(已缴纳);由E公司负担300元(于本判决生效后七日内交纳)。如不服本判决,可以在判决书送达之日起十五日内,向本院递交上诉状,并按照对方当事人或代表人的人数提出副本,上诉于北京市第二中级人民法院。审判员聂宗霞;二〇二一年一月二十日”中,可根据“判决如下”、“赔偿”、“共计”作为诉讼决策信息定位关键词定位到判赔额所在句子,并根据金额数据格式提取到“共计”后的费用信息“15397.9元”。
在一些可选的实施方式中,上述步骤402可包括:
基于每个历史裁判文书数据的诉讼决策信息中的时间信息确定该历史裁判文书数据的诉讼决策信息中的审理周期,和/或,基于每个历史裁判文书数据的诉讼决策信息中的费用信息确定该历史裁判文书数据的诉讼决策信息中的诉求金额满足率。将得到的审理周期,和/或,诉求金额满足率确定为历史裁判文书中的诉讼决策信息。
以审理周期的计算为例:审理周期等于立案时间和判决时间之间的天数,可理解为一种差运算。比如:在案例D中,针对某个合同纠纷的裁判文书,提取立案日期为2020年3月1日,提取判决日期为2020年5月31日,则本案的审理周期为92天。
审理周期是当事人在决定是否要发起诉讼要考虑的一个重要因素。虽然法律规定了审判时限,但是时限范围太大,各种变量太多,单靠法律条文很难判断。所以,当事人如果想知道打官司要花多长时间才能有结果,当事人就需要有一个审理周期的数据支持,做到心中有数,这样才好判断官司要不要打、怎么打。裁判文书上绝大多数都会写明立案日期和判决日期,因此可以基于这两个日期来计算一个案子的审理周期,然后可以统计各个案子的审理周期,然后进行各种统计分析。比如:海南旅游旺季是10月份-次年3月份,某家旅行社和酒店在6月份发生合作纠纷,如果旅行社在6月份起诉,案子可以在9月份之前可以结束,那么旅行社当年业务就不会受到太大影响;如果案子到12月才能结束,那么旅行社当年业务就会受到巨大影响,依靠诉讼解决纠纷可能就不是最佳方案,需要寻求其他商业上更妥当的救济方法。
诉求金额满足率的计算,可通过判赔合计额与诉求金额的比值得到,即诉求金额满足率=判赔合计额÷诉求金额×100%。例如,在案例E中,针对某个合同纠纷的裁判文书,提取诉求金额为50万,提取赔偿合计额为36.9 万,则本案的诉求金额满足率为73.8%。
在一些可选的实施方式中,上述步骤402具体可包括:
提取历史裁判文书数据的案由关键词、案情关键词、诉讼决策信息和案件属性信息。
案件属性信息,包括:判决时间、管辖法院、代理律所、原告、被告等,这些信息都是结构化非常明显的信息,可以根据实际应用需要进行提取。
示例地,管辖法院提取:位置位于开篇第一句;主要关键词:区/县,人民法院;辅助关键词:省。例如,“广东省江门市江海区人民法院”、“山东省惠民县人民法院”中,格式一般为:*省*市*区/县人民法院,*省*县人民法院,*市*区人民法院可用正则式表达。
示例地,判决时间提取:判决时间位于裁判文书尾部,可先通过位置找到判决时间的句子,提取其中的时间;判决时间往往是尾部最后一个时间,紧挨着辅助关键词。定位关键词:审判员;判决时间位于“审判员”的下一行,若有多位审判员,则判决时间位于最后一位“审判员”的下一行,且往往就是判决数的最后一行;时间格式固定为:*年*月*日,可用正则式表达。
裁判文书的格式是一种较为稳定的文书格式,依据上述方法可对判赔额进行有效定位和提取,在当前和未来实践中可依据本思路做具体调整,做具体调整时由本领域技术人员适当调整即可,也应涵盖在本申请的保护范围之内。
步骤403,将各历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息对应存储形成裁判文书信息集合。
可以理解的是,裁判文书信息集合可采用各种形式进行存储,例如可以采用表格进行存储,也可以采用数据库进行存储。
在一些可选的实施方式中,可通过上述可选实施方式的步骤402中建立的对应关系将数据存储关系型数据库或者非关系型数据库。示例地,当采用关系型数据库时,可以是将每个历史裁判文书数据的:案情关键词、案由关键词、诉讼决策信息、案件属性信息和裁判文书对应存储。这里只是举例说明,对应关系中的数据项可以根据实际需要进行顺序调整或增减。
可选地,数据库允许多对多,即案情关键词、案由关键词可交叉对应;例如:比如:“图片”,作为一个案情关键词,可能涉及著作权纠纷、名誉权纠纷、商业秘密纠纷等,每种案件性质不一样,所以案情关键词和案由关键词对应起来,更有参考价值。
上述实施例诉讼决策信息请求处理方法可广泛应用于各种类型的案件诉讼决策,例如:图片侵权纠纷、音乐侵权纠纷、医疗侵权纠纷、交通事故纠纷、商标侵权纠纷、工伤纠纷等;这里只是举例说明,而非对本公开诉讼决策方法应用范围的具体限定。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种诉讼决策信息请求处理装置的一个实施例,该装置实施例与图2和图3所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
本实施例的诉讼决策信息请求处理装置500包括:接收单元501、检索单元502和统计单元503。其中,接收单元501,被配置成接收诉讼决策检索请求,其中,所述诉讼决策检索请求包括案由关键词和/或案情关键词;检索单元 502,被配置成在裁判文书信息集合中检索与所述诉讼决策检索请求相匹配的裁判文书中的诉讼决策信息;统计单元503,被配置成按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与所述诉讼决策检索请求对应的诉讼决策信息统计结果。
在一些可选的实施方式中,诉讼决策信息请求处理装置500还包括:
呈现单元504,被配置成按照预设呈现形式呈现诉讼决策信息统计结果。
在本实施例中,诉讼决策信息请求处理装置500的接收单元501、检索单元502、统计单元503和呈现单元504的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201至203及图3对应实施例中步骤304的相关说明,在此不再赘述。
在一些可选的实施方式中,裁判文书信息集合由裁判文书信息集合建立步骤预先建立的,裁判文书信息集合建立步骤包括:
获取至少一份历史裁判文书数据;
提取每个历史裁判文书数据中的案由关键词、案情关键词和诉讼决策信息;
将各历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息对应存储形成裁判文书信息集合。
在一些可选的实施方式中,案由关键词包括原始案由关键词和/或标准案由关键词;
提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个历史裁判文书数据,基于预设的案由定位词,定位该历史裁判文书数据中的原始案由关键词,基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,以及将定位得到的原始案由关键词和/或所确定的标准案由关键词确定为该历史裁判文书数据的案由关键词。
在一些可选的实施方式中,基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,包括:
计算标准案由词库中每个标准案由关键词与定位得到的原始案由关键词的相关系数;
将标准案由词库中与定位得到的原始案由关键词的相关系数大于预设相关系数阈值的标准案由关键词确定为与定位得到的原始案由关键词对应的标准案由关键词。
在一些可选的实施方式中,提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
去掉每个历史裁判文书数据的预设停用词;
提取去掉预设停用词后的每个历史裁判文书数据的案情关键词。
在一些可选的实施方式中,去掉每个历史裁判文书数据的预设停用词,包括:
将每个历史裁判文书数据分词,得到相应的历史裁判文书数据分词序列,从得到的历史裁判文书数据分词序列中去掉预设停用词,得到相应的历史裁判文书数据分词子序列;
提取去掉预设停用词后的每个历史裁判文书数据的案情关键词,包括:
确定每个历史裁判文书数据分词子序列中每个分词的权重;
将每个历史裁判文书数据分词子序列中权重大于预设权重阈值的各分词确定为相应历史裁判文书数据的案情关键词。
在一些可选的实施方式中,诉讼决策信息包括时间信息和/或费用信息;以及
提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个历史裁判文书数据,基于预设的诉讼决策信息定位关键词,定位该历史裁判文书数据中的诉讼决策信息所在句子,根据预设的时间数据格式和 /或金额数据格式定位并提取定位得到的句子中的时间信息和/或费用信息,以及将提取到的时间信息和/或费用信息确定为该历史裁判文书数据中的诉讼决策信息。
在一些可选的实施方式中,诉讼决策信息还包括审理周期和/或诉求金额满足率;以及
提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,还包括:
基于每个历史裁判文书数据的诉讼决策信息中的时间信息确定该历史裁判文书数据的诉讼决策信息中的审理周期,和/或,基于每个历史裁判文书数据的诉讼决策信息中的费用信息确定该历史裁判文书数据的诉讼决策信息中的诉求金额满足率。
需要说明的是,本公开的实施例提供的诉讼决策信息请求处理装置中各单元的实现细节和技术效果可以参考本公开中其它实施例的说明,在此不再赘述。
下面参考图6,其示出了适于用来实现本公开的电子设备的计算机系统 600的结构示意图。图6示出的计算机系统600仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有计算机系统600操作所需的各种程序和数据。处理装置601、ROM602以及RAM603通过总线605彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许计算机系统600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备的计算机系统600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从 ROM602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备实现如图2或图3所示的实施例及其可选实施方式示出的诉讼决策信息请求处理方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网 (LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机 (例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,检索单元还可以被描述为“在裁判文书信息集合中检索与所述诉讼决策检索请求相匹配的裁判文书中的诉讼决策信息的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种诉讼决策信息请求处理方法,包括:
接收诉讼决策检索请求,其中,所述诉讼决策检索请求包括案由关键词和/或案情关键词;
在裁判文书信息集合中检索与所述诉讼决策检索请求相匹配的裁判文书信息中的诉讼决策信息,其中,裁判文书信息包括案由关键词、案情关键词和诉讼决策信息;
按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与所述诉讼决策检索请求对应的诉讼决策信息统计结果。
2.根据权利要求1所述的诉讼决策信息统计方法,其中,所述方法还包括:
按照预设呈现形式呈现所述诉讼决策信息统计结果。
3.根据权利要求1或2所述的方法,其中,所述裁判文书信息集合由裁判文书信息集合建立步骤预先建立的,所述裁判文书信息集合建立步骤包括:
获取至少一份历史裁判文书数据;
提取每个历史裁判文书数据中的案由关键词、案情关键词和诉讼决策信息;
将各所述历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息对应存储形成所述裁判文书信息集合。
4.根据权利要求3所述的方法,其中,案由关键词包括原始案由关键词和/或标准案由关键词;
所述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个所述历史裁判文书数据,基于预设的案由定位词,定位该历史裁判文书数据中的原始案由关键词,基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,以及将定位得到的原始案由关键词和/或所确定的标准案由关键词确定为该历史裁判文书数据的案由关键词。
5.根据权利要求4所述的方法,其中,所述基于预设的标准案由词库确定与定位得到的原始案由关键词对应的标准案由关键词,包括:
计算所述标准案由词库中每个标准案由关键词与定位得到的原始案由关键词的相关系数;
将所述标准案由词库中与定位得到的原始案由关键词的相关系数大于预设相关系数阈值的标准案由关键词确定为与定位得到的原始案由关键词对应的标准案由关键词。
6.根据权利要求3所述的方法,其中,所述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
去掉每个历史裁判文书数据的预设停用词;
提取去掉预设停用词后的每个所述历史裁判文书数据的案情关键词。
7.根据权利要求6所述的方法,其中,所述去掉每个历史裁判文书数据的预设停用词,包括:
将每个历史裁判文书数据分词,得到相应的历史裁判文书数据分词序列,从得到的历史裁判文书数据分词序列中去掉预设停用词,得到相应的历史裁判文书数据分词子序列;
所述提取去掉预设停用词后的每个所述历史裁判文书数据的案情关键词,包括:
确定每个所述历史裁判文书数据分词子序列中每个分词的权重;
将每个所述历史裁判文书数据分词子序列中权重大于预设权重阈值的各分词确定为相应历史裁判文书数据的案情关键词。
8.根据权利要求6所述的方法,其中,诉讼决策信息包括时间信息和/或费用信息;以及
所述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,包括:
对于每个历史裁判文书数据,基于预设的诉讼决策信息定位关键词,定位该历史裁判文书数据中的诉讼决策信息所在句子,根据预设的时间数据格式和/或金额数据格式定位并提取定位得到的句子中的时间信息和/或费用信息,以及将提取到的时间信息和/或费用信息确定为该历史裁判文书数据中的诉讼决策信息。
9.根据权利要求8所述的方法,其中,诉讼决策信息还包括审理周期和/或诉求金额满足率;以及
所述提取每个历史裁判文书数据的案由关键词、案情关键词和诉讼决策信息,还包括:
基于每个历史裁判文书数据的诉讼决策信息中的时间信息确定该历史裁判文书数据的诉讼决策信息中的审理周期,和/或,基于每个历史裁判文书数据的诉讼决策信息中的费用信息确定该历史裁判文书数据的诉讼决策信息中的诉求金额满足率。
10.一种诉讼决策信息统计装置,包括:
接收单元,被配置成接收诉讼决策检索请求,其中,所述诉讼决策检索请求包括案由关键词和/或案情关键词;
检索单元,被配置成在裁判文书信息集合中检索与所述诉讼决策检索请求相匹配的裁判文书信息中的诉讼决策信息,裁判文书信息包括历史裁判文书数据中的案由关键词、案情关键词和诉讼决策信息;
统计单元,被配置成按照预设统计规则对检索得到的诉讼决策信息进行统计,得到与所述诉讼决策检索请求对应的诉讼决策信息统计结果。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被一个或多个处理器执行时实现如权利要求1-9中任一所述的方法。
CN202110387133.9A 2021-04-07 2021-04-07 诉讼决策信息请求处理方法及装置 Pending CN113191922A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110387133.9A CN113191922A (zh) 2021-04-07 2021-04-07 诉讼决策信息请求处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110387133.9A CN113191922A (zh) 2021-04-07 2021-04-07 诉讼决策信息请求处理方法及装置

Publications (1)

Publication Number Publication Date
CN113191922A true CN113191922A (zh) 2021-07-30

Family

ID=76975320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110387133.9A Pending CN113191922A (zh) 2021-04-07 2021-04-07 诉讼决策信息请求处理方法及装置

Country Status (1)

Country Link
CN (1) CN113191922A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677727A (zh) * 2015-12-29 2016-06-15 上海律巢网络科技有限公司 数据检索及检索结果呈现方法和系统
CN108197163A (zh) * 2017-12-14 2018-06-22 上海银江智慧智能化技术有限公司 一种基于裁判文书的结构化处理方法
CN110059311A (zh) * 2019-03-27 2019-07-26 银江股份有限公司 一种面向司法文本数据的关键词提取方法及系统
CN110288495A (zh) * 2019-06-25 2019-09-27 北京市律典通科技有限公司 案件诉讼时效智能审查方法及装置
CN110472011A (zh) * 2019-07-19 2019-11-19 平安科技(深圳)有限公司 一种诉讼成本预测方法、装置及终端设备
CN111145052A (zh) * 2019-12-26 2020-05-12 北京法意科技有限公司 司法文书的结构化分析方法及系统
CN112488886A (zh) * 2020-11-19 2021-03-12 武汉华成知识产权代理服务有限责任公司 一种基于Python的诉讼信息提取系统、方法及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677727A (zh) * 2015-12-29 2016-06-15 上海律巢网络科技有限公司 数据检索及检索结果呈现方法和系统
CN108197163A (zh) * 2017-12-14 2018-06-22 上海银江智慧智能化技术有限公司 一种基于裁判文书的结构化处理方法
CN110059311A (zh) * 2019-03-27 2019-07-26 银江股份有限公司 一种面向司法文本数据的关键词提取方法及系统
CN110288495A (zh) * 2019-06-25 2019-09-27 北京市律典通科技有限公司 案件诉讼时效智能审查方法及装置
CN110472011A (zh) * 2019-07-19 2019-11-19 平安科技(深圳)有限公司 一种诉讼成本预测方法、装置及终端设备
CN111145052A (zh) * 2019-12-26 2020-05-12 北京法意科技有限公司 司法文书的结构化分析方法及系统
CN112488886A (zh) * 2020-11-19 2021-03-12 武汉华成知识产权代理服务有限责任公司 一种基于Python的诉讼信息提取系统、方法及设备

Similar Documents

Publication Publication Date Title
CN106651424B (zh) 基于大数据技术的电力用户画像建立与分析方法
Hoque et al. Adoption of information and communication technology for development: A case study of small and medium enterprises in Bangladesh
Rattenbury et al. Principles of data wrangling: Practical techniques for data preparation
CN107851097B (zh) 数据分析系统、数据分析方法、数据分析程序及存储介质
Duverger Curvilinear effects of user-generated content on hotels’ market share: a dynamic panel-data analysis
CN110619506B (zh) 一种岗位画像生成方法、岗位画像生成装置及电子设备
CN104834731B (zh) 一种自媒体信息的推荐方法及装置
Hoekman et al. COVID‐19, public procurement regimes and trade policy
CN107908740A (zh) 信息输出方法和装置
CN106682878A (zh) 一种设计师匹配平台及方法
CN107767070B (zh) 用于信息推广的方法及装置
CN103970753B (zh) 关联知识的推送方法和装置
Buyens et al. Alternative media, alternative voices? A quantitative analysis of actor diversity in alternative and mainstream news outlets
US9336212B2 (en) Systems and methods for collection and automatic analysis of opinions on various types of media
CN109118094B (zh) 一种基于信用体系的企业服务应用系统
WO2020034626A1 (zh) 服务推荐方法、装置、电子设备及存储介质
US20120101928A1 (en) Debt recovery administration and portfolio management system
CN112184302A (zh) 一种产品推荐方法、装置、规则引擎及存储介质
CN110222180B (zh) 一种文本数据分类与信息挖掘方法
CN115375177A (zh) 用户价值评估方法、装置、电子设备及存储介质
Ibrahim et al. Trade facilitation and agriculture sector performance in sub-Saharan Africa: insightful policy implications for economic sustainability
Owda et al. Financial discussion boards irregularities detection system (fdbs-ids) using information extraction
CN112446777B (zh) 一种信用评估方法、装置、设备及存储介质
CN111382977A (zh) 基于用户借阅行为的图书采购方法、装置及存储介质
CN113191922A (zh) 诉讼决策信息请求处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination