CN113486158B - 基于案情比对的类案检索方法、装置、设备及存储介质 - Google Patents

基于案情比对的类案检索方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113486158B
CN113486158B CN202111049519.5A CN202111049519A CN113486158B CN 113486158 B CN113486158 B CN 113486158B CN 202111049519 A CN202111049519 A CN 202111049519A CN 113486158 B CN113486158 B CN 113486158B
Authority
CN
China
Prior art keywords
case
cognitive model
module
case element
cognitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111049519.5A
Other languages
English (en)
Other versions
CN113486158A (zh
Inventor
贾高峰
艾中良
刘贤艳
孙晓锐
冯德超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Judicial Big Data Research Institute Co ltd
Original Assignee
China Judicial Big Data Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Judicial Big Data Research Institute Co ltd filed Critical China Judicial Big Data Research Institute Co ltd
Priority to CN202111049519.5A priority Critical patent/CN113486158B/zh
Publication of CN113486158A publication Critical patent/CN113486158A/zh
Application granted granted Critical
Publication of CN113486158B publication Critical patent/CN113486158B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于案情比对的类案检索方法、装置、设备及存储介质,属于自然语言处理技术领域。该方法包括:构建面向全案由的案件要素体系;构建案件要素标注语料;面向案件要素体系,利用认知模型构建模块,构建案件要素认知模型;针对历史案件文书,利用预处理模块和案件要素智能认知模块,开展案件要素认知;输入一段案情或一篇文书,进行案由及案件要素认知后,利用类案智能匹配模块,开展类案匹配;针对类案匹配结果,利用结果展现模块进行结果展现。本发明还提供了一种基于案情比对的类案检索的装置、电子设备及存储介质。本发明能够面向全案由提供快速精准的类案检索,能够有效提升类案检索的效率。

Description

基于案情比对的类案检索方法、装置、设备及存储介质
技术领域
本发明涉及数据检索技术领域下的司法类案检索技术领域,尤其是涉及一种基于案情比对的类案检索方法、装置、设备及存储介质。
背景技术
司法公正是法治建设的永恒主题,是司法工作的生命与核心所在。随着依法治国全面推进和公民权利意识的提升,社会各界对司法公正越来越关注和重视。与此同时“同案不同判”也越来越被人们所“关注”。“同案不同判”首先会让当事人在形式上感受到不平等的对待,进而又从结果上发现实质的不平等。“同案同判”已在无形中成为人民群众衡量公平正义的“一杆秤”。促进“同案同判”是推进严格公正司法的必然要求,也是实现依法治国的重大保障。类案检索是有效破解裁判尺度不一,进一步提升审判质效、促进司法为民、推进司法公正等的重要支撑。法官为了对每个案子负责,需要查阅分析大量的类似案件,以避免发生“同案不同判”。通过类案检索有望成为避免裁判偏离、节约法官查阅类案的时间、提升办案效率的一个重要手段。
类案检索在实现上主要有两个技术路径:基于关键词匹配的类案检索路径和基于案情比对的类案检索路径。基于关键词匹配的类案检索路径由于技术门槛相对较低,实现上难度不大,成为当前类案检索普遍采用的路径。该路径在实际类案检索应用中,需要用户通过多轮关键词匹配和过滤来筛选案例,无法达到有效节约用户查阅类案时间和有效提升类案检索效率的目的。基于案情比对的类案检索路径,在实际应用中,用户只需要输入一段案情或一篇文书,会自动对用户输入的信息进行语义解析,确定用户检索意图,然后自动匹配相似案例文书给用户,省时省力。但基于案情比对的类案检索技术需要突破以下几个技术问题:针对用户输入的一段案情或一篇文书,如何通过语义解析确定用户的检索意图;如何根据确定好的用户检索意图,快速匹配到相似案例文书给用户;如何面向全案由快速实施和落地。
因此,如何突破上述几个技术问题,提供一种基于案情比对的类案检索,面向一段案情或一篇文书,快速精准实现类案检索,是本领域技术人员亟待解决的问题。
发明内容
本发明目的是为了实现一种基于案情比对的类案检索,面向全案由提供快速精准的类案检索,以提高法规检索类案的效率。通过本发明,可以面向全部案由,输入一段案情或一篇文书,自动对输入信息进行语义解析,确定用户的检索意图,基于该检索意图匹配相似案例文书给用户,检索过程秒级完成,检索结果精准性较高。
为实现上述发明目的,本发明提供了一种基于案情比对的类案检索方法,该方法包括。
步骤一:构建覆盖全案由的案件要素体系。
步骤二:构建案件要素标注语料:构建案件要素体系中的案件要素的标注语料。
步骤三:面向案件要素体系,利用认知模型构建模块,构建案件要素认知模型。
步骤四:针对历史案件文书,利用预处理模块进行预处理,并利用基于案件要素认知模型的案件要素智能认知模块,进行案件要素认知。
步骤五:输入一段案情或一篇文书,利用案件要素智能认知模块进行案由及案件要素认知后,利用类案智能匹配模块开展类案匹配。
步骤六:针对类案匹配结果,利用结果展现模块进行结果展现。
进一步,所述步骤一构建覆盖全案由的案件要素体系,主要包括:第一步:构建案件要素体系总框架。该步骤主要从程序法和实体法分别梳理。程序法方面主要根据诉讼法及其司法解释规定的程序逻辑构建分支树干。实体法方面分两个路径进行梳理:面向刑事路径,根据定罪问题和量刑问题构建子分支,定罪问题子分支根据犯罪构成的三阶层理论建立下面的分支树干,量刑问题子分支根据通用量刑情节和个性量刑情节构建下面的分支树干;面向民事和行政路径,根据裁定和诉请构建子分支,裁定子分支根据法律法规中规定的裁定逻辑建立下面的分支树干;诉请子分支根据通用诉请分类构建下面的分支树干。第二步,针对每个案由,构建案件要素体系具体框架。结合每个案由具体的法律法规及司法解释,对案件要素体系总框架进行调整,开展体系树干的增、删、改操作,完毕之后再进行体系树干命名规范化处理。第三步,通过人机结合,完成案件要素体系构建。针对每个案由,首先通过使用自然语言处理技术和机器学习技术对法律法规、实务文章、案例文书等进行技术处理,认知和挖掘上述材料中包含的法律要素点,在上述法律要素点基础上,法律专家结合案件要素体系具体框架,进行案件要素的提取和归类,形成案件要素体系。
进一步,所述步骤二构建案件要素标注语料主要包括:针对案件要素体系中的每个案件要素进行关键词识别和提取;对提取的关键词进行同义词/近义词扩展;对扩展后的关键词列表检索历史案件文书并抽取包含关键词列表内容的法律段落形成待标注语料;第四步:人工判断包含关键词列表内容的法律段落是否包含案件要素,形成标注语料。
进一步,所述步骤三提到的认知模型构建模块主要包括:认知模型设计、认知模型优化与评估、认知模型校验与评测及认知模型的输出等几块。认知模型设计采用基于规则匹配的认知模型和基于机器学习算法的认知模型相结合开展。针对识别精准性要求较高的案件要素实现以规则匹配的认知模型为主辅以机器学习认知模型,否则以机器学习认知模型为主辅以规则匹配的认知模型。认知模型优化与评估针对不同认知模型采用方法略不同。针对机器学习认知模型,面向已标注语料,实现对认知模型的训练、优化与评估;针对规则匹配认知模型,通过基于规则模板的规则快速提取技术,结合已标注语料,实现对认知模型的规则扩展、优化及评估。认知模型校验与评测主要通过使用一些预选的标注数据对认知模型进行校验和评测,以确保输出模型的可用性及精准性符合要求。认知模型输出主要实现对评测通过的模型的输出,以方便后续部署和使用。
进一步,所述步骤三提到的面向案件要素体系,利用认知模型构建模块,构建案件要素认知模型,主要包括:逐个获取案件要素体系中的案件要素,然后使用上述的认知模型构建模块,开展认知模型的定义、构建、优化、评估、校验、评测及输出,形成对应的案件要素认知模型,并保存到认知模型库中,供案件要素智能认知模块使用。
进一步,所述步骤四提到的预处理模块主要实现对历史案件文书、用户输入的一段案情或一篇文书的预处理,主要包括:内容编码转换、格式规整、自然段解析、法律段解析等。
进一步,所述步骤四提到的案件要素智能认知模块主要实现对预处理后的内容中案件要素的智能认知。对历史案件文书,首先通过基于规则匹配的案由识别技术识别到文书的案由信息,然后再根据案由信息找到对应的案件要素体系,针对案件要素体系中的每个案件要素逐个调用预生成好的认知模型进行智能认知;认知结果存储在案件要素认知库中,实现要素关联存储,供后续类案匹配使用。
进一步,所述步骤五提到的进行案由及案件要素认知,主要包含:1)案由认知。对用户输入的一段案情或一篇文书,由于案由未必包含在案情或者文书中,同时包含了也未必就是正确的,因此需要使用到案由认知模型进行案由识别。这里的案由认知模型基于机器学习认知模型构建,然后通过使用历史案件文书中的案情和关联案由形成的训练语料训练而得到;案由识别结果可能是一个案由或者是一个案由列表。2)案件要素认知。通过结合案由识别结果,并调用步骤四中提到的预处理模块和案件要素智能认知模块来开展案件要素认知。
进一步,所述步骤五提到的类案智能匹配模块主要实现对输入案情或文书的案情要素树与历史文书的案情要素树的相似性匹配,匹配结果再通过用户检索案由范围、用户检索时间范围、用户检索区域范围、文书白名单、相似性得分等进行多维智能评估,形成评估后的结果,并可进行结果关联计算。结果关联计算可以从历审关联、当事人关联、法信码关联等维度进行关联计算。
进一步,所述步骤六主要包括:通过列表和统计维度进行结果展现;列表维度支持通过分页方式进行案件展现,每页展现10-20条,每条记录重点展现标题、法院、省份、审理程序、本院查明、适用法条、案由、裁判时间等;统计维度支撑从年份、审理程序、案情特征、法院等维度进行案件的统计展现;列表和统计结果均可查询详情;针对结果案例,还支持进行法条关联、法信码关联、当事人信息关联、检索报告生成及历审案件分析等功能。
第二方面,本发明提供了一种基于案情比对的类案检索装置,其包括。
认知模型构建模块,用于面向案件要素体系,通过提供可视化页面实现认知模型的设计、优化、评估、校验、评测及存储工作,形成对应的案件要素认知模型。
预处理模块,用于实现对历史案件文书、输入的一段案情或一篇文书进行内容编码转换、格式规整、自然段解析、法律段解析等处理,输出为法律段解析结果,为后续案件要素智能认知提供保障。
案件要素智能认知模块,用于对预处理后的法律段解析结果,通过案件要素认知模型,实现对案件要素的智能认知,输出为与输入相关联的案件要素树。
类案智能匹配模块,用于对输入的案件要素树,实现与历史文书的案件要素树进行相似性比对,并结合相关的过滤规则进行过滤后,输出匹配结果。
结果展现模块,用于实现对类案匹配结果的多维度展现。
数据库管理模块,用于实现对案件要素体系、标注语料、案件要素认知模型、历史文书的案件要素树等进行统一管理。
第三方面,本发明提供了一种基于案情比对的类案检索电子设备,其包括一个或多个处理器、存储装置及存储在所述存储装置中一个或多个可在所述处理器上运行的计算机程序。 当所述一个或多个程序被所述一个或多个处理器执行时,能够实现上述基于案情比对的类案检索方法。
第四方面,本发明提供了一种可读存储介质,在其上存储了可执行的计算机程序,所述程序执行时实现上述基于案情比对的类案检索方法。
与现有技术相比,本发明具有以下有益效果。
1) 通过构建案件要素体系及认知模型,实现对输入案情或文书的检索意图捕获;2)通过构建案件要素智能认知模块和类案智能匹配模块,实现对输入案情或文书的相似案例快速匹配;3)通过构建面向全案由的案件要素体系及实现案件要素无人工干预下自动认知,实现面向全案由快速实施和落地。
附图说明
此处的附图是用来提供对本发明实施例的进一步理解,构成本发明的一部分内容,但不构成对本发明实施例的限定。
图1是本发明实施例提供的一种基于案情比对的类案检索方法的流程示意图。
图2是本发明实施例提供的一种基于案情比对的类案检索系统的组成示意图。
具体实施方式
为了能够更清楚地理解本发明,以下将结合附图和具体实施例对本发明进行进一步详细描述。需要说明的是,在互相不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
下面描述的很多具体细节是为了便于充分理解本发明。需要说明的是,下述的具体实施例仅用于说明本申请而不用于限制本申请的范围。因此,本发明的包含范围并不受限于下面公开的具体实施例。
除另行说明外,本申请所适用的术语的含义与本领域普通技术人员通常所理解的含义相同。
图1为本发明实施例提供的一种基于案情比对的类案检索方法的流程示意图。参照图1,本发明实施例提供的一种基于案情比对的类案检索方法,具体包括。
S101、构建覆盖全案由的案件要素体系。主要包括。
第一步:构建案件要素体系总框架。该步骤主要从程序法和实体法分别梳理。程序法方面主要根据诉讼法及其司法解释规定的程序逻辑构建分支树干。实体法方面分两个路径进行梳理:面向刑事路径,根据定罪问题和量刑问题构建子分支,定罪问题子分支根据犯罪构成的三阶层理论建立下面的分支树干,量刑问题子分支根据通用量刑情节和个性量刑情节构建下面的分支树干;面向民事和行政路径,根据裁定和诉请构建子分支,裁定子分支根据法律法规中规定的裁定逻辑建立下面的分支树干;诉请子分支根据通用诉请分类构建下面的分支树干。
第二步,针对每个案由,构建案件要素体系具体框架。结合每个案由具体的法律法规及司法解释,对案件要素体系总框架进行调整,开展体系树干的增、删、改操作,完毕之后再进行分支树干命名规范化处理。
第三步,通过人机结合,完成案件要素体系构建。针对每个案由,首先通过使用自然语言处理技术和机器学习技术对法律法规、实务文章、案例文书等进行技术处理,认知和挖掘上述材料中包含的法律要素点,在上述法律要素点基础上,法律专家结合案件要素体系具体框架,进行案件要素的提取和归类,形成案件要素体系。
S102、构建案件要素标注语料。主要包括:第一步:针对案件要素体系中的每个案件要素进行关键词识别和提取;第二步,对提取的关键词进行同义词/近义词扩展;第三步:对扩展后的关键词列表检索历史案件文书并抽取包含关键词的法律段落形成待标注语料;第四步:人工判断包含关键词列表内容的法律段落是否包含案件要素,形成标注语料。
S103、面向案件要素体系,利用认知模型构建模块,构建案件要素认知模型。主要包括:逐个获取案件要素体系中的案件要素,然后使用认知模型构建模块,开展认知模型的定义、构建、优化、评估、校验、评测及输出,形成对应的案件要素认知模型,并保存到认知模型库中,供案件要素智能认知模块部署使用。
上述认知模型构建模块主要包括:认知模型设计、认知模型优化与评估、认知模型校验与评测及认知模型的输出等几块。认知模型设计采用基于规则匹配的认知模型和基于机器学习算法的认知模型相结合开展。针对识别精准性要求较高的案件要素实现以规则匹配的认知模型为主辅以机器学习认知模型,否则以机器学习认知模型为主辅以规则匹配的认知模型。认知模型优化与评估针对不同认知模型采用方法略不同。针对机器学习认知模型,面向已标注语料,实现对认知模型的训练、优化与评估;针对规则匹配认知模型,通过基于规则模板的规则快速提取技术,结合已标注语料,实现对认知模型的规则扩展、优化及评估。认知模型校验与评测主要通过使用一些预定义的测试数据对认知模型进行校验和评测,以确保输出模型的精准性符合要求。认知模型输出主要实现对评测通过模型的输出,以方便后续部署和使用。
S104、针对历史案件文书,利用预处理模块和案件要素智能认知模块,开展案件要素认知。主要包括:逐个获取历史案件文书,首先调用预处理模块进行预处理操作,然后通过基于规则匹配的案由识别技术识别到文书的案由信息,再根据案由信息找到对应的案件要素体系,再调用案件要素智能认知模块,进行案件要素认知,认知结果保存到案件要素认知库,为后续开展在线类案匹配准备数据。上述预处理模块主要实现预处理操作主要包括:内容编码转换、格式规整、自然段解析、法律段解析等。上述案件要素智能认知模块主要实现对预处理后的内容中案件要素的智能认知,认知中用到的模型在S103中生成。认知结果存储在案件要素认知库中,供后续类案匹配使用。
S105、输入一段案情或一篇文书,进行案由及案件要素认知后,利用类案智能匹配模块,开展类案匹配。主要包括:输入一段案情或一篇文书,通过案由认知和案件要素认知,获得案件要素树,然后通过调用类案智能匹配模块,对上述案件要素树进行相似案例文书匹配,开展类案匹配。在上述提到的进行案件要素认知,主要是通过调用S104中提到的预处理模块和案件要素智能认知模块来开展案件要素认知。对上述类案智能匹配模块主要实现当前输入案情或文书的案情要素树与历史文书的案情要素树的相似性匹配,匹配结果再通过用户检索案由、用户检索时间范围、用户检索区域范围、文书白名单、相似性得分等进行多维智能评估,形成评估后的结果。
作为优选,面向案件要素树的相似性匹配模型,可以采用改进的BM25相似性模型来计算, 改进的BM25相似性模型公式:
Figure 221350DEST_PATH_IMAGE001
其中,Score(Q, d)表示Qd的相似性得分,Q为用户输入一段案情或一篇文书,d为历史文书库中的一个历史文书,n为用户输入案情或文书中包含的案件要素个数,q i 为用户输入案情或文书中包含的第i个案件要素,W i 为该案件要素的权重,R(q i ,d)为该案情要素与历史文书的相关性分数。
W i 的计算公式具体如下:
Figure 488383DEST_PATH_IMAGE002
其中,N表示历史文书的总个数,df i 表示包含案件要素q i 的历史文书个数。
R(q i ,d)的计算公式具体如下:
Figure 998868DEST_PATH_IMAGE003
其中K的计算公式如下:
Figure 667746DEST_PATH_IMAGE004
其中,
Figure 723427DEST_PATH_IMAGE005
b是协调因子,取值为2、0.75;dl为历史文书包含案件要素个数;avg_dl为所有历史文书包含案件要素的平均个数。
S106、针对类案匹配结果,利用结果展现模块进行结果展现。主要包括:针对结果案例,通过列表和统计维度面向用户进行展现;列表主要通过分页方式进行展现,每页显示10-20条,每条记录主要展现标题、法院、省份、审理程序、本院查明、适用法条、案由、裁判时间等;单击每个记录,可以进一步查看文书的详情内容;统计维度主要从年份、审理程序、案情特征、法院等维度进行案例的统计展现。针对结果案例,还支持进行法条关联、法信码关联、当事人信息关联、检索报告生成及历审案件分析等功能。
图2为本发明实施例提供的一种基于案情比对的类案检索装置的模块示意图。参照图2,本发明实施例提供的一种基于案情比对的类案检索装置,具体包括:
S201、认知模型构建模块,面向案件要素体系,通过提供可视化页面实现认知模型的设计、优化、评估、校验、评测及存储工作。
S202、预处理模块,实现对输入的历史案件文书、一段案情或一篇文书进行内容编码转换、格式规整、自然段解析、法律段解析等处理,输出为预处理后的结果,为后续案件要素智能认知提供保障。
S203、案件要素智能认知模块,对预处理后的案情或文书内容,通过案件要素认知模型,实现对案件要素的智能认知,输出为案情或文书内容的案件要素树。
S204、类案智能匹配模块,对输入的案情或文书的案件要素树,实现与历史文书的案件要素树进行相似性比对,并结合相关的过滤规整进行过滤后,输出匹配结果。
S205、结果展现模块,实现对类案匹配结果的多维度展现。
S206、数据库管理模块,实现对案件要素体系、标注语料、案件要素认知模型、历史文书的案件要素树等进行统一管理。
本发明的另一实施例提供一种基于案情比对的类案检索电子设备,其包括一个或多个处理器、存储装置及存储在所述存储装置中一个或多个可在所述处理器上运行的计算机程序。 当所述一个或多个程序被所述一个或多个处理器执行时,能够实现上述基于案情比对的类案检索方法。
本发明的另一实施例提供了一种可读存储介质,在其上存储了实现上述基于案情比对的类案检索方法的计算机程序,所述程序执行时实现上述基于案情比对的类案检索方法。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由上述技术任意组合后所形成的技术方案。应指出,对于本技术领域的技术人员而言,在不脱离本发明原理的前提下,做出的若干改进和润饰,均视为本发明的包含范围。

Claims (9)

1.一种基于案情比对的类案检索方法,其特征在于,包括以下步骤:
构建覆盖全案由的案件要素体系;
构建案件要素体系中的案件要素的标注语料;
面向案件要素体系,利用认知模型构建模块,构建案件要素认知模型;
针对历史案件文书,利用预处理模块进行预处理,并利用基于案件要素认知模型的案件要素智能认知模块,进行案件要素认知;
输入一段案情或一篇文书,利用案件要素智能认知模块进行案由及案件要素认知,然后利用类案智能匹配模块开展类案匹配;
针对类案匹配结果,利用结果展现模块进行结果展现;
所述构建覆盖全案由的案件要素体系,包括:
构建案件要素体系总框架,主要从程序法和实体法分别梳理;程序法方面根据诉讼法及其司法解释规定的程序逻辑构建分支树干;实体法方面分两个路径进行梳理:面向刑事路径,根据定罪问题和量刑问题构建子分支,定罪问题子分支根据犯罪构成的三阶层理论建立下面的分支树干,量刑问题子分支根据通用量刑情节和个性量刑情节构建下面的分支树干;面向民事和行政路径,根据裁定和诉请构建子分支,裁定子分支根据法律法规中规定的裁定逻辑建立下面的分支树干,诉请子分支根据通用诉请分类构建下面的分支树干;
针对每个案由,构建案件要素体系具体框架:结合每个案由具体的法律法规及司法解释,对案件要素体系总框架进行调整,开展体系树干的增、删、改操作,完毕之后再进行体系树干命名规范化处理;
通过人机结合,完成案件要素体系构建:针对每个案由,首先通过使用自然语言处理技术和机器学习技术对法律法规、实务文章、案例文书进行技术处理,认知和挖掘其中包含的法律要素点,在法律要素点基础上,法律专家结合案件要素体系具体框架,进行案件要素的提取和归类,形成案件要素体系;
所述构建案件要素体系中的案件要素的标注语料,包括:针对案件要素体系中的每个案件要素进行关键词识别和提取;对提取的关键词进行同义词/近义词扩展;对扩展后的关键词列表检索历史案件文书并抽取包含关键词列表内容的法律段落形成待标注语料;人工判断包含关键词列表内容的法律段落是否包含案件要素,形成标注语料;
所述认知模型构建模块包括认知模型设计、认知模型优化与评估、认知模型校验与评测及认知模型的输出;认知模型设计采用基于规则匹配的认知模型和基于机器学习算法的认知模型相结合开展;
所述类案智能匹配模块实现对输入案情或文书的案情要素树与历史文书的案情要素树的相似性匹配,匹配结果再通过用户检索案由范围、用户检索时间范围、用户检索区域范围、文书白名单、相似性得分进行多维智能评估,形成评估后的结果。
2.根据权利要求1所述的方法,其特征在于,所述认知模型优化与评估针对不同认知模型采用方法略不同,针对机器学习认知模型,面向已标注语料,实现对认知模型的训练、优化与评估,针对规则匹配认知模型,通过基于规则模板的规则快速提取技术,结合已标注语料,实现对认知模型的规则扩展、优化及评估;所述认知模型校验与评测通过使用一些预选的标注数据对认知模型进行校验和评测,以确保输出模型的可用性及精准性符合要求;所述认知模型输出实现对评测通过的模型的输出。
3.根据权利要求1所述的方法,其特征在于,所述面向案件要素体系,利用认知模型构建模块,构建案件要素认知模型,包括:逐个获取案件要素体系中的案件要素,然后使用的认知模型构建模块,开展认知模型的定义、构建、优化、评估、校验、评测及输出,形成对应的案件要素认知模型,并保存到认知模型库中,供案件要素智能认知模块使用。
4.根据权利要求1所述的方法,其特征在于,所述预处理模块实现对历史案件文书、用户输入的一段案情或一篇文书的预处理,包括:内容编码转换、格式规整、自然段解析、法律段解析。
5.根据权利要求1所述的方法,其特征在于,所述案件要素智能认知模块实现对预处理后的内容中案件要素的智能认知;对历史案件文书,首先通过基于规则匹配的案由识别技术识别到文书的案由信息,然后再根据案由信息找到对应的案件要素体系,针对案件要素体系中的每个案件要素逐个调用预生成好的认知模型进行智能认知;认知结果存储在案件要素认知库中,供后续类案匹配使用。
6.根据权利要求1所述的方法,其特征在于,所述针对类案匹配结果,利用结果展现模块进行结果展现,包括:通过列表和统计维度进行结果展现;列表维度支持通过分页方式进行案件展现,每页展现10-20条,每条记录重点展现标题、法院、省份、审理程序、本院查明、适用法条、案由、裁判时间;统计维度支撑从年份、审理程序、案情特征、法院维度进行案件的统计展现;列表和统计结果均能够查询详情;针对结果案例,还支持进行法条关联、法信码关联、当事人信息关联、检索报告生成及历审案件分析功能。
7.一种采用权利要求1~6中任一权利要求所述方法的基于案情比对的类案检索装置,其特征在于,包括:
认知模型构建模块,用于面向案件要素体系,通过提供可视化页面实现认知模型的设计、优化、评估、校验、评测及存储工作,形成对应的案件要素认知模型;
预处理模块,用于实现对历史案件文书、输入的一段案情或一篇文书进行内容编码转换、格式规整、自然段解析、法律段解析等处理,输出为法律段解析结果,为后续案件要素智能认知提供保障;
案件要素智能认知模块,用于对预处理后的法律段解析结果,通过案件要素认知模型,实现对案件要素的智能认知,输出为与输入相关联的案件要素树;
类案智能匹配模块,用于对输入的案件要素树,实现与历史文书的案件要素树进行相似性比对,并结合相关的过滤规则进行过滤后,输出匹配结果;
结果展现模块,用于实现对类案匹配结果的多维度展现;
数据库管理模块,用于实现对案件要素体系、标注语料、案件要素认知模型、历史文书的案件要素树进行统一管理。
8.一种基于案情比对的类案检索电子设备,其特征在于,包括一个或多个处理器、存储装置及存储在所述存储装置中一个或多个能够在所述处理器上运行的计算机程序;当一个或多个所述计算机程序被所述一个或多个处理器执行时,实现权利要求1~6中任一权利要求所述的基于案情比对的类案检索方法。
9.一种可读存储介质,其特征在于,所述可读存储介质存储可执行的计算机程序,所述计算机程序被计算机执行时,实现权利要求1~6中任一权利要求所述的基于案情比对的类案检索方法。
CN202111049519.5A 2021-09-08 2021-09-08 基于案情比对的类案检索方法、装置、设备及存储介质 Active CN113486158B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111049519.5A CN113486158B (zh) 2021-09-08 2021-09-08 基于案情比对的类案检索方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111049519.5A CN113486158B (zh) 2021-09-08 2021-09-08 基于案情比对的类案检索方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113486158A CN113486158A (zh) 2021-10-08
CN113486158B true CN113486158B (zh) 2021-12-14

Family

ID=77946727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111049519.5A Active CN113486158B (zh) 2021-09-08 2021-09-08 基于案情比对的类案检索方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113486158B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114048308B (zh) * 2021-11-03 2022-08-16 中国司法大数据研究院有限公司 一种类案检索报告生成的方法及装置
CN116340348B (zh) * 2023-03-30 2023-09-05 南北联合信息科技有限公司 一种法律事务处理前的量化评估检索方法
CN117033584B (zh) * 2023-07-31 2024-04-02 北京华夏电通科技股份有限公司 类案文本确定方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783640A (zh) * 2018-12-20 2019-05-21 广州恒巨信息科技有限公司 一种类案推荐方法、系统及装置
CN110827177A (zh) * 2018-08-13 2020-02-21 北京国双科技有限公司 类案文书查找方法及装置
CN111198953A (zh) * 2018-11-16 2020-05-26 北京智慧正安科技有限公司 基于案件文本信息推荐类案的方法、系统及计算机可读存储介质
CN111625626A (zh) * 2020-07-30 2020-09-04 杭州识度科技有限公司 一种基于多维度语义联合建模的多用户案例检索系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7593920B2 (en) * 2001-04-04 2009-09-22 West Services, Inc. System, method, and software for identifying historically related legal opinions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827177A (zh) * 2018-08-13 2020-02-21 北京国双科技有限公司 类案文书查找方法及装置
CN111198953A (zh) * 2018-11-16 2020-05-26 北京智慧正安科技有限公司 基于案件文本信息推荐类案的方法、系统及计算机可读存储介质
CN109783640A (zh) * 2018-12-20 2019-05-21 广州恒巨信息科技有限公司 一种类案推荐方法、系统及装置
CN111625626A (zh) * 2020-07-30 2020-09-04 杭州识度科技有限公司 一种基于多维度语义联合建模的多用户案例检索系统

Also Published As

Publication number Publication date
CN113486158A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN113486158B (zh) 基于案情比对的类案检索方法、装置、设备及存储介质
CN108073569B (zh) 一种基于多层级多维度语义理解的法律认知方法、装置和介质
CN102819604B (zh) 基于内容相关性的文件涉密内容检索、密级判定及标注方法
CN107315738B (zh) 一种文本信息的创新度评估方法
CN110968699A (zh) 一种基于事理推荐的逻辑图谱构建及预警方法和装置
CN111144723A (zh) 人岗匹配推荐方法及系统、存储介质
CN106446070B (zh) 一种基于专利群的信息处理装置及方法
CN111105209A (zh) 适用于人岗匹配推荐系统的职位简历匹配方法及装置
CN110287292B (zh) 一种裁判量刑偏离度预测方法及装置
CN113656805A (zh) 一种面向多源漏洞信息的事件图谱自动构建方法及系统
CN111831794A (zh) 一种基于知识图谱的综合管廊行业知识问答系统构建方法
CN112347270A (zh) 一种法律知识图谱构建系统及方法
CN115292450A (zh) 一种基于信息抽取的数据分类分级领域知识库构建方法
CN110728453A (zh) 一种基于大数据的政策自动匹配分析系统及方法
CN110880142A (zh) 一种风险实体获取方法及装置
KR101179613B1 (ko) 빈발항목과 연관규칙을 이용한 특허문서 자동분류 방법
WO2024087754A1 (zh) 一种多维度文本综合辨识方法
US20170132731A1 (en) Intellectual property evaluation system, intellectual property evaluation system control method, and intellectual property evaluation program
CN117726166A (zh) 基于大语言模型的人工智能企业客户风险信息分析评估方法和系统
CN111967437A (zh) 文本识别方法、装置、设备及存储介质
CN110457009B (zh) 基于数据分析的软件安全需求推荐模型的实现方法
CN117216187A (zh) 一种基于术语构建法律知识图谱的语义智能检索方法
Li et al. Evaluating the rationality of judicial decision with LSTM-based case modeling
CN115936932A (zh) 司法文书的处理方法、装置、电子设备和存储介质
CN115879901A (zh) 一种智能人事自助服务平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant