CN110209760B - 历审案件关联的方法和装置、电子设备、计算机可读介质 - Google Patents

历审案件关联的方法和装置、电子设备、计算机可读介质 Download PDF

Info

Publication number
CN110209760B
CN110209760B CN201910512547.2A CN201910512547A CN110209760B CN 110209760 B CN110209760 B CN 110209760B CN 201910512547 A CN201910512547 A CN 201910512547A CN 110209760 B CN110209760 B CN 110209760B
Authority
CN
China
Prior art keywords
case
case number
candidate
text
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910512547.2A
Other languages
English (en)
Other versions
CN110209760A (zh
Inventor
彭彬
杨天行
张一麟
宋勋超
杨晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910512547.2A priority Critical patent/CN110209760B/zh
Publication of CN110209760A publication Critical patent/CN110209760A/zh
Application granted granted Critical
Publication of CN110209760B publication Critical patent/CN110209760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本公开提供了一种历审案件关联的方法,该方法包括:获取一个案件文书,以所述案件文书对应的案件的案号为当前案号;根据预设的案号模板,在所述案件文书中查询得到至少一个候选案号;根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号,其中任意所述候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本;将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库。本公开还提供了一种历审案件关联的装置、电子设备、计算机可读介质。

Description

历审案件关联的方法和装置、电子设备、计算机可读介质
技术领域
本公开实施例涉及数据库技术领域,特别涉及历审案件关联的方法和装置、电子设备、计算机可读介质。
背景技术
法律行业知识图谱是具有大量法律行业的相关知识的数据库,可用于让用户查询法律知识、关注案件情况等。
在很多情况下,一个事由(如一起纠纷)可能经历多次裁判(如初审、二审等)而形成多个案件,这些案件都是针对一个事由的“历审案件”,故具有内在联系。
但现有的法律行业知识图谱无法确定哪些案件是相关的历审案件,即无法实现历审案件关联,从而用户很难迅速找到关于一个事由的多起案件,难以聚焦情况的发展。
发明内容
本公开实施例提供一种历审案件关联的方法和装置、电子设备、计算机可读介质。
第一方面,本公开实施例提供一种历审案件关联的方法,其包括:
获取一个案件文书,以所述案件文书对应的案件的案号为当前案号;
根据预设的案号模板,在所述案件文书中查询得到至少一个候选案号;
根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号,其中任意所述候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本;
将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库。
在一些实施例中,所述案件文书为结构化数据,其包括案号项及对应的内容;
所述以所述案件文书对应的案件的案号为当前案号包括:获取所述案件文书的案号项的内容,以所述内容为当前案号。
在一些实施例中,所述根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号包括:
判断任意所述候选案号的相关文本中是否存在与第一模板匹配的文本,所述第一模板为表示引证案件的文本的模板;
若否,则确定该候选案号为前审案号。
在一些实施例中,所述根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号包括:
判断任意所述候选案号的相关文本中是否存在与第二模板匹配的文本,所述第二模板为表示前审案件的文本的模板;
若是,则确定该候选案号为前审案号。
在一些实施例中,在所述将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库,还包括:
将所述案号数据库中的每对关联案号组中的两个案号组合并为一个案号组,其中,若任意两个案号组中具有至少一个相同案号,则该两个案号组构成一对关联案号组。
在一些实施例中,在所述将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库,还包括:
在预设的包括多个案件的案件数据库中,将任意案号组中的多个案号对应的多个案件进行关联。
第二方面,本公开实施例提供一种历审案件关联的装置,其包括:
获取模块,用于获取一个案件文书,以所述案件文书对应的案件的案号为当前案号;
候选案号模块,用于根据预设的案号模板,在所述案件文书中查询得到至少一个候选案号;
前审案号模块,用于根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号,其中任意所述候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本;
案号关联模块,用于将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库。
在一些实施例中,所述案件文书为结构化数据,其包括案号项及对应的内容;
所述获取模块用于获取所述案件文书的案号项的内容,以所述内容为当前案号。
在一些实施例中,所述候选案号模块用于:
判断任意所述候选案号的相关文本中是否存在与第一模板匹配的文本,所述第一模板为表示引证案件的文本的模板;
若否,则确定该候选案号为前审案号。
在一些实施例中,所述候选案号模块用于:
判断任意所述候选案号的相关文本中是否存在与第二模板匹配的文本,所述第二模板为表示前审案件的文本的模板;
若是,则确定该候选案号为前审案号。
在一些实施例中,所述装置还包括合并模块,其用于:
将所述案号数据库中的每对关联案号组中的两个案号组合并为一个案号组,其中,若任意两个案号组中具有至少一个相同案号,则该两个案号组构成一对关联案号组。
在一些实施例中,所述装置还包括:
案件关联模块,用于在预设的包括多个案件的案件数据库中,将任意案号组中的多个案号对应的多个案件进行关联。
第三方面,本公开实施例提供一种电子设备,其包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一种历审案件关联的方法。
第四方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任意一种历审案件关联的方法。
本公开实施例的历审案件关联方法中,根据简单的预设规则从已有的案件文书中筛选出其前审案件的案号,从而也就相当于找到了与当前案件(案件文书对应的案件)相关的前审案件,实现了二者的关联(即实现了历审案件关联)。
利用以上关联,用户可迅速的找到关于一个事由的多个历审案件,以便随时聚焦情况的发展,满足的更多需求。同时,本公开实施例的方法只要通过处理现有的案件文书即可自动进行,其既不需要借助其它第三方的数据,也不需要人工的干预,故其过程简单、效率高、成本低、准确性好。
附图说明
附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其它特征和优点对本领域技术人员将变得更加显而易见,在附图中:
图1为本公开实施例提供的一种历审案件关联的方法的流程图;
图2为本公开实施例提供的另一种历审案件关联的方法的流程图;
图3为本公开实施例提供的另一种历审案件关联的方法中部分步骤的流程图;
图4为本公开实施例提供的一种历审案件关联的装置的组成框图;
图5为本公开实施例提供的另一种历审案件关联的装置的组成框图。
具体实施方式
为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的历审案件关联的方法和装置、电子设备、计算机可读介质进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本公开阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
如本公开所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
本公开所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本公开所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。
当本公开中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。
本公开所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。
本公开的实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。
除非另外限定,否则本公开所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本公开明确如此限定。
技术术语说明
在本公开实施例中,如无特殊说明,则以下技术术语应按照以下解释理解:
实体(或称概念),其是指现实世界中存在或曾经存在的实际物质体或抽象概念,例如事件、概念、人物、物品、结构、产品、建筑、地点、国家、组织、艺术作品、科学技术、科学定理等。
知识图谱,其是表示不同实体间的关系以及实体的属性的数据库。在知识图谱中,以实体为节点;实体与实体之间,以及实体与其对应的属性的值(属性-值,key-value)之间通过边相连,从而构成结构化的、网络状的数据库。
法律行业知识图谱,其是专门表示法律行业的相关内容的知识图谱。具体的,法律行业知识图谱中的实体可包括案件、法官、当事人、法院、法条等,例如,某法院的某法官以某法条判决了某当事人的某个案件,即构成这些实体间的关系;当然,法律行业知识图谱中还可包括其它的属性,如案件的判决时间等。
案件,其是指针对一个事由(如一起纠纷),由裁判机关(如仲裁委员会、法院等)依照法律作出一次裁判(如仲裁、裁定、判决、调节等)的过程。
历审案件,其是指针对一个事由发生的多次案件的总和,例如针对一个事由的仲裁案件、初审案件、二审案件、再审案件、重审案件均为其历审案件。
案件文书,其是指在一个案件的进行过程中产生的各种具有法律效力的文本,例如案件文书具体可包括起诉书、答辩书、判决书、仲裁书、裁定书、调解书、决定书等。
案号,其是由裁判机关(如仲裁委员会、法院等)给出的针对每个案件的、具有确定命名规则的、唯一的标志性编号;案号中具体可包括审判裁判机关的信息、案件类型信息、案件序号等,例如“(2009)威民,某字第某某号”等。
数据库,其是一个或多个数据按照一定形式组成的数据集合,例如,一个法律行业知识图谱即可构成一个数据库。
结构化数据,其是指完全具有特定结构(格式)的数据,即结构化数据的每个部分都是对应特定项目的,当然,结构化数据各部分的具体内容可不同。
图1为本公开实施例的一种历审案件关联的方法的流程图。
第一方面,参照图1,本公开实施例提供一种历审案件关联的方法,其包括:
S101、获取一个案件文书,以案件文书对应的案件的案号为当前案号。
其中,案号是由裁判机关(如仲裁委员会、法院等)给出的针对每个案件的、具有确定命名规则的、唯一的标志性编号。
确定一个待处理的案件文书,该案件文书必然是针对一个案件的,而该案件必然具有确定的、唯一的案号,本步骤中通过该案件文书获得相应的案件的案号,并作为“当前案号”。
S102、根据预设的案号模板,在案件文书中查询得到至少一个候选案号。
其中,由于案号具有确定的命名规则,故必然可得到案号模板。案号模板是包括所有可能的案号命名方式的模板,从而所有的案号必然与案号模板匹配,且与案号模板匹配的文本必然是案号。
在一个在后案件(如二审案件)的案件文书中,很可能提到前审案件(如初审案件)的案号,故可预先设置相应的案号模板,从而将案件文书中所有的案号都提取出来作为候选案号,而这些候选案号有可能是前审案件的案号。
S103、根据各候选案号的相关文本,确定至少一个候选案号为前审案号,其中任意候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本。
一个案件文书中的候选案号不一定都是其前审案件的案号,但其中的前审案件的案号前后文(相关文本)必然符合特定的规律,故可根据各候选案号的相关文本,从中筛选出属于前审案件的候选案号。
S104、将案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库。
将案件文书的当前案号与提取出的前审案号相关联,并将关联结果存储下来(如存储在案号数据库中)。由于前审案号是当前案件的前审案件的案号,且前审案件与当前案件必然是历审案件,因此,本步骤相当于实现了历审案件(当前案件与前审案件)的关联。
当然,以上描述的是对一个案件文书的处理过程;但本公开实施例的方法也可用于对一个数据库(如法律数据库)中的大量案件文书依次进行处理,即每次从数据库中选出一个案件文书并进行以上处理,从而最终实现大量的历审案件关联。
本公开实施例的历审案件关联方法中,根据简单的预设规则从已有的案件文书中筛选出其前审案件的案号,从而也就相当于找到了与当前案件(案件文书对应的案件)相关的前审案件,实现了二者的关联(即实现了历审案件关联)。
利用以上关联,用户可迅速的找到关于一个事由的多个历审案件,以便随时聚焦情况的发展,满足的更多需求。同时,本公开实施例的方法只要通过处理现有的案件文书即可自动进行,其既不需要借助其它第三方的数据,也不需要人工的干预,故其过程简单、效率高、成本低、准确性好。
图2为本公开实施例的另一种历审案件关联的方法的流程图。
参照图2,本公开实施例的另一种历审案件关联的方法包括:
S100、从预设的数据库(如案件数据库)中提取大量案号,并根据这些案号总结出案号模板。
其中,案件数据库是预先已经存在的关于法律知识的数据库,其具体可为法律行业知识图谱等,其中可包括大量的案件及其相关信息,如案号、案件文书等。
其中,案号是由裁判机关(如仲裁委员会、法院等)给出的针对每个案件的、具有确定命名规则的、唯一的标志性编号。
其中,由于案号具有确定的命名规则,故必然可得到案号模板。案号模板是包括所有可能的案号命名方式的模板,从而所有的案号必然与案号模板匹配,且与案号模板匹配的文本必然是案号。
本步骤中,从预先存在的数据库(如案件数据库)中,提取大量的案号(可仅提取案号),并通过人工或机器学习算法总结这些案号的规律,得到案号模板。
其中,案号模板可以是正则表达式的形式,例如,对中国的部分案号总结得到的正则表达式(案号模板)可包括以下几种:
((([0-9]{2,4}))([^\d].*?)字(第[0-9\-、]{0,8}号?)((一|二|三|四|五|六|七|八|九|十|之)*))
((\([0-9]{2,4}\))([^\d]\W{1,10})([0-9\-]+?)(民|刑|行|赔|政|执|财|清)+([^\d\-]\W{0,8})([0-9\-、]+号?)((一|二|三|四|五|六|七|八|九|十|之)*)))
((\([0-9]{2,4}\))([^\d]\W{1,10})([0-9\-]+?)(民|刑|行|赔|政|执|财|清)+([0-9\-、]+号?)((一|二|三|四|五|六|七|八|九|十|之)*)))
((\([0-9]{2,4}\))([^\d]\W{1,10})([0-9\-]*?)(民|刑|行|赔|政|执|财|清)+([^\d\-]\W{0,8})([0-9\-、]+号?)((一|二|三|四|五|六|七|八|九|十|之)*)))
当然,应当理解,根据案号命名规则的不同,案号模板的具体内容不限于以上例子;或者,案号模板也可为正则表达式之外的其它的形式。
S101、获取一个案件文书,以案件文书对应的案件的案号为当前案号。
确定一个待处理的案件文书,该案件文书必然是针对一个案件的,而该案件必然具有确定的、唯一的案号,本步骤中通过该案件文书获得相应的案件的案号,并作为“当前案号”。
具体的,本步骤可为从预设的数据库(如案件数据库)中提取一个案件文书并进行处理。
在一些实施例中,案件文书为结构化数据,其包括案号项及对应的内容,而本步骤(S101)可包括:
S1011、获取一个案件文书,获取案件文书的案号项的内容,以内容为当前案号。
也就是说,案件文书本身可为具有特定结构(格式)的结构化数据,故其中每部分是对应特定项目的,且案件文书对应的案件的案号直接被写在对应案号的项目(案号项)中,故可直接以该案号项的内容作为当前案号。
当然,也可采用其它具体的方式确定案件文书对应的案件的案号,例如,案件文书对应的案件的案号可原本就与案件文书相关联,故确定案件文书也就相当于确定了当前案号。
S102、根据预设的案号模板,在案件文书中查询得到至少一个候选案号。
在一个在后案件(如二审案件)的案件文书中,很可能提到前审案件(如初审案件)的案号,故可预先设置相应的案号模板,从而将案件文书中所有的案号都提取出来作为候选案号,而这些候选案号有可能是前审案件的案号。
其中,案号模板具体可为以上的正则表达式等形式,而候选案号可在案件文书的全文中查询,也可仅在案件文书的特定部分(如正文部分)查询。
S103、根据各候选案号的相关文本,确定至少一个候选案号为前审案号,其中任意候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本。
一个案件文书中的候选案号不一定都是其前审案件的案号,但其中的前审案件的案号前后文(相关文本)必然符合特定的规律,故可根据各候选案号的相关文本,从中筛选出属于前审案件的候选案号。
在一些实施例中,本步骤(S103)可包括:
S1031、判断任意候选案号的相关文本中是否存在与第一模板匹配的文本,第一模板为表示引证案件的文本的模板。
S1032、若否,则确定该候选案号为前审案号。
当然,若是,则候选案号不是前审案号。
在案件文书中,除前审案号外的其它案号主要是作为证据而被引用的其它案件(引证案件)的案号,对这类案号,其前后文(相关文本)中通常有表示引证案件的文本,例如有“证据有”、“证据:”、“定案依据:”、“佐证:”、“作为证据”等文本。因此,可将这些表示引证案件的文本总结为第一模板,从而当某候选案号的相关文本中没有符合第一模板的描述时,则可认为该候选案号是前审案号,而当相关文本中存在符合第一模板的描述时,则该候选案号为引证案件的案号,而不是前审案号。
在另一些实施例中,参照图3,本步骤(S103)也可包括:
S1033、判断任意候选案号的相关文本中是否存在与第二模板匹配的文本,第二模板为表示前审案件的文本的模板。
S1034、若是,则确定该候选案号为前审案号。
当然,若否,则候选案号不是前审案号。
在案件文书中,在前审案号的前后文(相关文本)中通常有表示其是前审案件的文本,例如有“本案的前审案件:”、“不服(候选案号)判决向本院提起上诉”、“(候选案号)判决适用法律错误,发还本院重申”等文本。因此,可将这些表示前审案件的文本总结为第二模板,从而当某候选案号的相关文本中有符合第二模板的描述时,则可认为该候选案号是前审案号,而当相关文本中没有符合第二模板的描述时,则认为该候选案号不是前审案号。
S104、将案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库。
将案件文书的当前案号与提取出的前审案号相关联,并将关联结果存储下来(如存储在案号数据库中)。由于前审案号是当前案件的前审案件的案号,且前审案件与当前案件必然是历审案件,因此,本步骤相当于实现了历审案件(当前案件与前审案件)的关联。
当然,以上描述的是对一个案件文书的处理过程;但本公开实施例的方法也可用于对一个数据库(如法律数据库)中的大量案件文书依次进行处理,即每次从数据库中选出一个案件文书并进行以上处理,从而最终实现大量的历审案件关联。
S105、将案号数据库中的每对关联案号组中的两个案号组合并为一个案号组,其中,若任意两个案号组中具有至少一个相同案号,则该两个案号组构成一对关联案号组。
在S104步骤后,还可包括S105步骤。
在一个案件文书中,不一定包括其对应的案件的所有前审案件的案号:例如,再审案件的案件文书中,可能只提到在之前的二审案件的案号,而没有提到二审案件之前的初审案件的案号;因此,在对初审、二审、再审的案件文书分别进行以上处理(S101至S104步骤)后,得到的是两个案号组,其中一个案号组包括初审案件案号和二审案件案号,另一个则包括二审案件案号和再审案件案号,但初审案件案号和再审案件案号位于不同的案号组中,故并未直接关联。
因此,本步骤中需要将包括相同案号的案号组合并,从而得到具有更多案号(如同时具有初审案件案号、二审案件案号、再审案件案号)的案号组,实现多个案号的关联,即本步骤是将信息有交叉关联的案号离线聚合的过程。
当然,案号组可进行多次合并,例如当一个案号组包括案号A、B,一个案号组包括案号B、C、一个案号组包括案号C、D时,经过两次合并即可得到包括案号A、B、C、D的案号组;当然,三个或更多的案号组也可一次直接合并在一起。
显然,除本次过程(S101-S104步骤)得到的案号组外,案号数据库中还可包括其它的案号组。案号数据库中其它的案号组可通过多次进行多次以上过程(S101-S104步骤)分别得到,即可在多次进行以上过程而将案件数据库中的案件文书全部处理完成后,再进行一次S105步骤;当然,如果是每次进行以上过程后即进行一次S105步骤也是可行的。或者,案号数据库中其它的案号组也可以是通过其它方式预先得到的。
S106、在预设的包括多个案件的案件数据库中,将任意案号组中的多个案号对应的多个案件进行关联。
在S104步骤后(当然也可为在S105步骤后),还可包括S106步骤。
案号组确定了案号之间的关联,故可进一步利用案号的关联,将已有的案件数据库(如法律行业知识图谱)中的相应案件也关联起来,例如将的相应案件的标识(ID)关联起来,或者说,在法律行业知识图谱中,可在相应案件的实体之间形成的边(表示历审案件关系的边),从而最终完成历审案件的关联。
当然,如前,本步骤可以是在每次进行完以上过程(S101-S104步骤)后即进行,也可以是在多次进行以上过程而将案件数据库中的案件文书全部处理完成后统一进行,还可以是在将多个案号组合并(S105步骤)后进行等,在此不再详细描述。
图4为本公开实施例的一种历审案件关联的装置的组成框图。
第二方面,参照图4,本公开实施例提供一种历审案件关联的装置,其包括:
获取模块,用于获取一个案件文书,以案件文书对应的案件的案号为当前案号;
候选案号模块,用于根据预设的案号模板,在案件文书中查询得到至少一个候选案号;
前审案号模块,用于根据各候选案号的相关文本,确定至少一个候选案号为前审案号,其中任意候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本;
案号关联模块,用于将案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库。
在一些实施例中,案件文书为结构化数据,其包括案号项及对应的内容;
获取模块用于获取案件文书的案号项的内容,以内容为当前案号。
在一些实施例中,候选案号模块用于:
判断任意候选案号的相关文本中是否存在与第一模板匹配的文本,第一模板为表示引证案件的文本的模板;
若否,则确定该候选案号为前审案号。
在一些实施例中,候选案号模块用于:
判断任意候选案号的相关文本中是否存在与第二模板匹配的文本,第二模板为表示前审案件的文本的模板;
若是,则确定该候选案号为前审案号。
在一些实施例中,参照图5,装置还包括合并模块,其用于:
将案号数据库中的每对关联案号组中的两个案号组合并为一个案号组,其中,若任意两个案号组中具有至少一个相同案号,则该两个案号组构成一对关联案号组。
在一些实施例中,参照图5,装置还包括:
案件关联模块,用于在预设的包括多个案件的案件数据库中,将任意案号组中的多个案号对应的多个案件进行关联。
第三方面,本公开实施例提供一种电子设备,其包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任意一种历审案件关联的方法。
第四方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现上述任意一种历审案件关联的方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据,并且可包括任何信息递送介质。
本公开已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其它实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

Claims (12)

1.一种历审案件关联的方法,其包括:
获取一个案件文书,以所述案件文书对应的案件的案号为当前案号;
根据预设的案号模板,在所述案件文书中查询得到至少一个候选案号;
根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号,其中任意所述候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本;
将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库;
所述案件文书为结构化数据,其包括案号项及对应的内容;
所述以所述案件文书对应的案件的案号为当前案号包括:获取所述案件文书的案号项的内容,以所述内容为当前案号。
2.根据权利要求1所述的方法,其中,所述根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号包括:
判断任意所述候选案号的相关文本中是否存在与第一模板匹配的文本,所述第一模板为表示引证案件的文本的模板;
若否,则确定该候选案号为前审案号。
3.根据权利要求1所述的方法,其中,所述根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号包括:
判断任意所述候选案号的相关文本中是否存在与第二模板匹配的文本,所述第二模板为表示前审案件的文本的模板;
若是,则确定该候选案号为前审案号。
4.根据权利要求1所述的方法,其中,在所述将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库,还包括:
将所述案号数据库中的每对关联案号组中的两个案号组合并为一个案号组,其中,若任意两个案号组中具有至少一个相同案号,则该两个案号组构成一对关联案号组。
5.根据权利要求1所述的方法,其中,在所述将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库,还包括:
在预设的包括多个案件的案件数据库中,将任意案号组中的多个案号对应的多个案件进行关联。
6.一种历审案件关联的装置,其包括:
获取模块,用于获取一个案件文书,以所述案件文书对应的案件的案号为当前案号;
候选案号模块,用于根据预设的案号模板,在所述案件文书中查询得到至少一个候选案号;
前审案号模块,用于根据各所述候选案号的相关文本,确定至少一个所述候选案号为前审案号,其中任意所述候选案号的相关文本包括该候选案号之前预定长度的文本和/或该候选案号之后预定长度的文本;
案号关联模块,用于将所述案件文书的当前案号与前审案号相关联,得到一个案号组并将其加入案号数据库;
所述案件文书为结构化数据,其包括案号项及对应的内容;
所述获取模块用于获取所述案件文书的案号项的内容,以所述内容为当前案号。
7.根据权利要求6所述的装置,其中,所述候选案号模块用于:
判断任意所述候选案号的相关文本中是否存在与第一模板匹配的文本,所述第一模板为表示引证案件的文本的模板;
若否,则确定该候选案号为前审案号。
8.根据权利要求6所述的装置,其中,所述候选案号模块用于:
判断任意所述候选案号的相关文本中是否存在与第二模板匹配的文本,所述第二模板为表示前审案件的文本的模板;
若是,则确定该候选案号为前审案号。
9.根据权利要求6所述的装置,其中,还包括合并模块,其用于:
将所述案号数据库中的每对关联案号组中的两个案号组合并为一个案号组,其中,若任意两个案号组中具有至少一个相同案号,则该两个案号组构成一对关联案号组。
10.根据权利要求6所述的装置,其中,还包括:
案件关联模块,用于在预设的包括多个案件的案件数据库中,将任意案号组中的多个案号对应的多个案件进行关联。
11.一种电子设备,其包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求1至5任意一项所述的历审案件关联的方法。
12.一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现根据权利要求1至5任意一项所述的历审案件关联的方法。
CN201910512547.2A 2019-06-13 2019-06-13 历审案件关联的方法和装置、电子设备、计算机可读介质 Active CN110209760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910512547.2A CN110209760B (zh) 2019-06-13 2019-06-13 历审案件关联的方法和装置、电子设备、计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910512547.2A CN110209760B (zh) 2019-06-13 2019-06-13 历审案件关联的方法和装置、电子设备、计算机可读介质

Publications (2)

Publication Number Publication Date
CN110209760A CN110209760A (zh) 2019-09-06
CN110209760B true CN110209760B (zh) 2022-04-15

Family

ID=67792695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910512547.2A Active CN110209760B (zh) 2019-06-13 2019-06-13 历审案件关联的方法和装置、电子设备、计算机可读介质

Country Status (1)

Country Link
CN (1) CN110209760B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112540964A (zh) * 2019-09-23 2021-03-23 北京国双科技有限公司 文书文号生成方法及相关装置
CN110717425A (zh) * 2019-09-26 2020-01-21 深圳市商汤科技有限公司 案件关联方法及装置、电子设备和存储介质
CN112948571A (zh) * 2019-12-11 2021-06-11 中国司法大数据研究院有限公司 一种基于裁判文书的历审案件关联方法和装置、电子设备、计算机可读介质
CN112085464B (zh) * 2020-08-24 2023-08-08 北京金堤征信服务有限公司 一种关联数据处理方法和装置
CN112699225A (zh) * 2020-12-28 2021-04-23 企查查科技有限公司 司法案件的聚合方法、设备和存储介质
CN117453856B (zh) * 2023-10-19 2024-05-07 中国司法大数据研究院有限公司 一种基于多源数据融合的历审案件串联的提取方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455964A (zh) * 2013-09-05 2013-12-18 福建榕基软件股份有限公司 一种基于案件信息的案件线索分析系统及方法
CN104636835A (zh) * 2013-11-06 2015-05-20 北京航天长峰科技工业集团有限公司 一种跨部门的案件协同处理系统
CN108255862A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 一种裁判文书的检索方法及装置
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005089526A2 (en) * 2004-03-19 2005-09-29 Oversight Technologies, Inc. Methods and systems for transaction compliance monitoring
US20110270776A1 (en) * 2010-04-29 2011-11-03 Sprecher Robert H Method and system for judicial court case management
CN106991092B (zh) * 2016-01-20 2021-11-05 阿里巴巴集团控股有限公司 基于大数据挖掘相似裁判文书的方法和设备
CN107018354B (zh) * 2016-01-28 2020-02-14 浙江宇视科技有限公司 一种支持案件标签的单兵设备、方法和系统
CN109218014A (zh) * 2017-06-30 2019-01-15 北京国双科技有限公司 视频音频的处理方法、装置及系统
CN108763483A (zh) * 2018-05-25 2018-11-06 南京大学 一种面向裁判文书的文本信息抽取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455964A (zh) * 2013-09-05 2013-12-18 福建榕基软件股份有限公司 一种基于案件信息的案件线索分析系统及方法
CN104636835A (zh) * 2013-11-06 2015-05-20 北京航天长峰科技工业集团有限公司 一种跨部门的案件协同处理系统
CN108255862A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 一种裁判文书的检索方法及装置
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器

Also Published As

Publication number Publication date
CN110209760A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN110209760B (zh) 历审案件关联的方法和装置、电子设备、计算机可读介质
CN107895037B (zh) 一种问答数据处理方法、装置、设备和计算机可读介质
CN110297912A (zh) 欺诈识别方法、装置、设备及计算机可读存储介质
CN105653554B (zh) 一种文件数据比对方法和系统
CN109543022A (zh) 文本纠错方法和装置
CN103970864B (zh) 基于微博文本的情绪分类和情绪成分分析方法及系统
CN109933692B (zh) 建立映射关系的方法和装置、信息推荐的方法和装置
KR101125417B1 (ko) 데이터 품질 진단 방법과 시스템
CN113779358B (zh) 一种事件检测方法和系统
CN111597177A (zh) 用于提升数据质量的数据治理方法
CN111986039A (zh) 赔案风控识别方法、装置、计算机设备及可读存储介质
TW202123026A (zh) 資料歸檔方法、裝置、電腦裝置及存儲介質
US10452780B2 (en) Tone analysis of legal documents
CN106202398A (zh) 一种索引建立的方法及装置
CN112307318A (zh) 一种内容发布方法、系统及装置
CN108595460A (zh) 关键词自动抽取的多路评测方法及系统、计算机程序
CN109657043B (zh) 自动生成文章的方法、装置、设备及存储介质
CN112948429B (zh) 一种数据报送方法、装置和设备
CN110457332B (zh) 一种信息处理方法及相关设备
CN111832266A (zh) 专利申请文件撰写质量的在线分析方法及系统
CN107071553A (zh) 一种修改视频语音的方法、装置和计算机可读存储介质
CN113742498B (zh) 一种知识图谱的构建更新方法
CN107577760B (zh) 一种基于约束规范的文本分类方法及装置
CN116108776A (zh) 一种提高芯片验证测试计划完备性的方法
CN109684392A (zh) 数据处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant