CN115617980A - 一种诉讼案例检索报告生成方法及系统 - Google Patents
一种诉讼案例检索报告生成方法及系统 Download PDFInfo
- Publication number
- CN115617980A CN115617980A CN202211395146.1A CN202211395146A CN115617980A CN 115617980 A CN115617980 A CN 115617980A CN 202211395146 A CN202211395146 A CN 202211395146A CN 115617980 A CN115617980 A CN 115617980A
- Authority
- CN
- China
- Prior art keywords
- keywords
- retrieval
- basic
- keyword
- expanded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012163 sequencing technique Methods 0.000 claims abstract description 10
- 238000012790 confirmation Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 4
- 238000012550 audit Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000969 carrier Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Tourism & Hospitality (AREA)
- Animal Behavior & Ethology (AREA)
- Technology Law (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种诉讼案例检索报告生成方法及系统,该方法通过结合案件争议焦点内容,对基础关键词分解,通过自然语言理解分析基础关键词的相同语义的不同表述方式得到扩展关键词,利用基础关键词和扩展关键词进行检索得到检索结果;根据基础关键词和扩展关键词在文书内容中所处的位置确认关联程度,根据确认的关联程度对基础关键词和扩展关键词进行排序;指定检索范围,通过数据仓库技术,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;按照检索报告规格生成检索报告文档,检索报告文档对关键信息进行标记和摘要。本发明提高检索效率和质量;自动生成检索报告,关键信息明确清晰、省时省力。
Description
技术领域
本发明属于数据处理技术领域,具体涉及一种诉讼案例检索报告生成方法及系统。
背景技术
目前,法律职业人员在工作过程中,需要根据案件争议焦点,输入关键词检索本地诉讼文书数据或通过诉讼文书平台搜索案例,作为诉讼文书撰写参考。
但是,传统技术存在以下问题:
第一、需要根据争议焦点组织各种关键信息进行多次检索,繁琐低效;
第二、已归档诉讼文书,可能已经不适用最新颁布的法律法规条款,容易导致错误的案例参考或不当的法条引用;
第三、检索报告关键信息如观点、主要理由、案件名称、法院、案号、法院认为、法规法条等,需要人工整理校验、标记关键信息,耗时耗力。
如何提高法律工作者检索诉讼文书和编写检索报告的效率和质量,是亟待解决的技术问题
发明内容
为此,本发明提供一种诉讼案例检索报告生成方法及系统,解决传统检索诉讼文书和编写检索报告的效率低,质量差的问题。
为了实现上述目的,本发明提供如下技术方案:一种诉讼案例检索报告生成方法,包括:
结合案件争议焦点内容,对基础关键词分解,通过自然语言理解分析所述基础关键词的相同语义的不同表述方式得到扩展关键词,利用所述基础关键词和所述扩展关键词进行检索得到检索结果;
根据所述基础关键词和所述扩展关键词在文书内容中所处的位置确认关联程度,根据确认的关联程度对所述基础关键词和所述扩展关键词进行排序;
指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;
按照检索报告规格生成检索报告文档,所述检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。
作为诉讼案例检索报告生成方法优选方案,利用所述基础关键词和所述扩展关键词进行检索得到的检索结果中,显示对应关键词检索结果数量供用户筛选参考。
作为诉讼案例检索报告生成方法优选方案,若所述基础关键词或所述扩展关键词出现在文书内容的“争议焦点”部分,则所述基础关键词或所述扩展关键词的关联程度最高,对应所述基础关键词或所述扩展关键词排序第一靠前;
若所述基础关键词或所述扩展关键词出现在文书内容的“本院认为”内容中,则所述基础关键词或所述扩展关键词的关联程度次高,对应所述基础关键词或所述扩展关键词排序第二靠前。
作为诉讼案例检索报告生成方法优选方案,若所述基础关键词或所述扩展关键词在案件一审、二审的文书内容中均涉及,且作为两审的争议焦点,则所述基础关键词或所述扩展关键词具有最高的排序优先级。
作为诉讼案例检索报告生成方法优选方案,检索所述基础关键词或所述扩展关键词所在文书内容的出具法院级别,出具法院级别越高,关联程度越高,对应所述基础关键词或所述扩展关键词排序越靠前。
作为诉讼案例检索报告生成方法优选方案,若所述基础关键词或所述扩展关键词在既往案例作为生成检索报告的次数越多,视作关联程度越高,对应所述基础关键词或所述扩展关键词排序越靠前。
作为诉讼案例检索报告生成方法优选方案,按照检索报告规格信息项,通过语义理解和知识图谱技术进行分析文书内容、提取信息,写入检索报告对应信息项。
本发明还提供一种诉讼案例检索报告生成系统,基于上述的诉讼案例检索报告生成方法,包括:
关键词分解模块,用于结合案件争议焦点内容,对基础关键词分解;
关键词扩展模块,用于通过自然语言理解分析所述基础关键词的相同语义的不同表述方式得到扩展关键词;
关键词检索模块,用于利用所述基础关键词和所述扩展关键词进行检索得到检索结果;
关联程度确认模块,用于根据所述基础关键词和所述扩展关键词在文书内容中所处的位置确认关联程度;
关键词排序模块,用于根据确认的关联程度对所述基础关键词和所述扩展关键词进行排序;
检索内容整理模块,用于指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;
检索报告生成模块,用于按照检索报告规格生成检索报告文档,所述检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。
作为诉讼案例检索报告生成系统优选方案,所述关键词检索模块中,利用所述基础关键词和所述扩展关键词进行检索得到的检索结果中,显示对应关键词检索结果数量供用户筛选参考。
作为诉讼案例检索报告生成系统优选方案,所述关联程度确认模块中,若所述基础关键词或所述扩展关键词出现在文书内容的“争议焦点”部分,则所述基础关键词或所述扩展关键词的关联程度最高;所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序第一靠前。
作为诉讼案例检索报告生成系统优选方案,所述关联程度确认模块中,若所述基础关键词或所述扩展关键词出现在文书内容的“本院认为”内容中,则所述基础关键词或所述扩展关键词的关联程度次高;所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序第二靠前。
作为诉讼案例检索报告生成系统优选方案,所述关联程度确认模块中,若所述基础关键词或所述扩展关键词在案件一审、二审的文书内容中均涉及,且作为两审的争议焦点,则所述基础关键词或所述扩展关键词具有最高的排序优先级。
作为诉讼案例检索报告生成系统优选方案,所述关联程度确认模块中,检索所述基础关键词或所述扩展关键词所在文书内容的出具法院级别,出具法院级别越高,关联程度越高;所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序越靠前。
作为诉讼案例检索报告生成系统优选方案,所述关联程度确认模块中,若所述基础关键词或所述扩展关键词在既往案例作为生成检索报告的次数越多,视作关联程度越高,所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序越靠前。
作为诉讼案例检索报告生成系统优选方案,所述检索报告生成模块中,按照检索报告规格信息项,通过语义理解和知识图谱技术进行分析文书内容、提取信息,写入检索报告对应信息项。
本发明具有如下优点:通过结合案件争议焦点内容,对基础关键词分解,通过自然语言理解分析基础关键词的相同语义的不同表述方式得到扩展关键词,利用基础关键词和扩展关键词进行检索得到检索结果;根据基础关键词和扩展关键词在文书内容中所处的位置确认关联程度,根据确认的关联程度对基础关键词和扩展关键词进行排序;指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;按照检索报告规格生成检索报告文档,检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。本发明通过对案件争议焦点的自然语言理解,进行更全面、更准确的案件检索,提高检索效率和质量;可实现全网数据采集分析,避免既往案例诉讼文书、法条法规的滞后性,导致不准确、不恰当的参考和引用;自动生成检索报告,关键信息明确清晰、省时省力。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
图1为本发明实施例1提供的诉讼案例检索报告生成方法流程示意图;
图2为本发明实施例1提供的诉讼案例检索报告生成方法中分解扩展关键词示意图;
图3为本发明实施例1提供的诉讼案例检索报告生成方法中关键信息标记示意图;
图4为本发明实施例1提供的诉讼案例检索报告生成方法中检索结果统计示意图;
图5为本发明实施例2提供的诉讼案例检索报告生成系统架构示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参见图1、图2和图3,本发明实施例1提供一种诉讼案例检索报告生成方法,包括以下步骤:
S1、结合案件争议焦点内容,对基础关键词分解,通过自然语言理解分析所述基础关键词的相同语义的不同表述方式得到扩展关键词,利用所述基础关键词和所述扩展关键词进行检索得到检索结果;
S2、根据所述基础关键词和所述扩展关键词在文书内容中所处的位置确认关联程度,根据确认的关联程度对所述基础关键词和所述扩展关键词进行排序;
S3、指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;
S4、按照检索报告规格生成检索报告文档,所述检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。
本实施例中,基于案件争议焦点内容,自动分析、分解检索关键词,通过自然语言理解分析关键词相同语义的不同表述方式,扩展关键词进行检索、提供更全面的检索结果;利用所述基础关键词和所述扩展关键词进行检索得到的检索结果中,显示对应关键词检索结果数量供用户筛选参考。
以图2中,检索“离婚后试管婴儿的抚养和夫妻共同财产继承权问题”为例,可以根据输入的信息内容,拆分关键词信息为:“离婚、试管婴儿、共同财产、继承权”,然后根据自然语言语义理解,基于“抚养”扩展关键词“抚养权”,基于“继承权”扩展关键词“继承人、法定继承人、遗产”,基于“离婚、夫妻”扩展关键词“婚姻存续关系”等,根据基础关键词和扩展关键词进行检索,并显示对应关键词检索结果数量供筛选参考。
其中,自然语言理解分析本身属于现有技术,自然语言理解分析是计算机对自然语言文本进行分析处理,从而理解该文本的过程、技术和方法。分词是自然语言处理的基础,分词准确度直接决定了后面的词性标注、句法分析、词向量以及文本分析的质量。当前的分词算法有基于词典的规则匹配方法,和基于统计的机器学习方法。基于词典的分词算法,本质上是字符串匹配。将待匹配的字符串基于算法策略,和一个足够大的词典进行字符串匹配,如果匹配命中,则可以分词。根据不同的匹配策略,又分为正向最大匹配法,逆向最大匹配法,双向匹配分词,全切分路径选择等。
其中,基于统计的分词算法,本质上是一个序列标注问题。将语句中的字,按照在词中的位置进行标注。标注主要有:B(词开始的一个字),E(词最后一个字),M(词中间的字,可能多个),S(一个字表示的词)。
本实施例中,若所述基础关键词或所述扩展关键词出现在文书内容的“争议焦点”部分,则所述基础关键词或所述扩展关键词的关联程度最高,对应所述基础关键词或所述扩展关键词排序第一靠前;若所述基础关键词或所述扩展关键词出现在文书内容的“本院认为”内容中,则所述基础关键词或所述扩展关键词的关联程度次高,对应所述基础关键词或所述扩展关键词排序第二靠前。若所述基础关键词或所述扩展关键词在案件一审、二审的文书内容中均涉及,且作为两审的争议焦点,则所述基础关键词或所述扩展关键词具有最高的排序优先级。检索所述基础关键词或所述扩展关键词所在文书内容的出具法院级别,出具法院级别越高,关联程度越高,对应所述基础关键词或所述扩展关键词排序越靠前。若所述基础关键词或所述扩展关键词在既往案例作为生成检索报告的次数越多,视作关联程度越高,对应所述基础关键词或所述扩展关键词排序越靠前。
具体的,根据检索信息关键词在文书内容中所处的“位置”来确认关联程度及排序,如出现在案例内容“争议焦点”部分,则视为关联程度最高、排序最靠前;其次为案例内容“本院认为”相关内容中;最后为散见于文书其他内容中。如果检索信息关键词所在案件一审、二审都涉及且作为两审的争议焦点,则关联程度和排序优先级更高。检索信息关键词所在案件审理的法院级别,级别越高的关联程度越高、排序越靠前,如示意图2所示,筛选结果左侧支持用户手动切换查看法院级别。检索信息关键词在既往案例作为生成检索报告的次数越多,视作关联程度越高、排序越靠前。另外,如案例审理时间、观点支持情况也对关联程度、排序有影响,且用户可以手动切换排序。
本实施例中,基于案件类型、受理层级、观点,通过分析文书案由、法院信息自动分类为刑事、民事、法院级别、支持情况。还可以切换关键词、分类、观点等的启用/禁用进行展示/隐藏对应的检索结果;同时还可以切换关联程度排序。
以图2中,检索“离婚后试管婴儿的抚养和夫妻共同财产继承权问题”为例,内容自动拆分的基础关键词“离婚、试管婴儿、继承权”默认启用,通过关键词标签右侧的“x”按钮删除对应关键词进行禁用,若需恢复重新对检索内容执行“检索”操作即可,被禁用的关键词则不作为检索信息进行检索,同时从已检索的结果中移除关联内容不再展示。左侧扩展关键词列表,默认展示全部关键词的所有检索结果供查阅,每个关键词右侧显示关联的检索结果数量。点击关键词如“法定继承人(36)”,则仅查看“法定继承人”关联的36条结果,其他的检索结果暂时隐藏。可以通过关键词列表切换关键词查看对应检索结果,通过“关键词”组名标签恢复展示全部的检索结果。
本实施例中,步骤S3,除支持指定的数据来源,如本地文书数据、专业诉讼文书平台,还可以针对全网公开的数据,指定检索范围如公众号、小程序、朋友圈、微博热搜、头条文章等,通过数据仓库技术进行数据抽取、转换、清洗,按照诉讼文书检索规则,整理数据内容、呈现跟检索信息相关的最新法条法规、通知公告、热点事件舆情等,从而获得更进步、更准确的参考案例。
其中,数据仓库技术本身为现有技术,是用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。数据仓库技术是构建数据仓库的重要一环,从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去,目的是将分散、零乱、标准不统一的数据整合到一起,为决策提供分析依据。
本实施例中,按照检索报告规格信息项,通过语义理解和知识图谱技术进行分析文书内容、提取信息,写入检索报告对应信息项。
具体的,法律职业人员选择需要参考的检索结果,利用自然语言理解、知识图谱技术进行分析,按照检索报告规格自动生成报告文档,对观点、法院认为、法规法条等关键信息自动标记和摘要,方便参考查阅;支持统计各关键信息对应的案例数据,做到对案件争议焦点内容判决结果心中有数。
以图2为例,每项检索结果案例右下角的“+检索报告”按钮,可手动将对应检索结果案例标记为加入检索报告内容;右侧悬浮的“文件夹图标+检索报告”按钮,通过红色气泡显示已加入检索报告的检索结果案例数量,点击“文件夹图标+检索报告”按钮,根据手动选择添加的案例自动生成的检索报告页面。
如图3、图4所示,根据上一步从检索结果中手动添加的案例,按照检索报告规格如“观点、主要理由、案件名称、法院、案号、法院认为、法规法条”等信息项,通过语义理解和知识图谱技术进行自动分析案例内容、提取信息,写入检索报告对应信息项,将原本需要人工查阅案例内容、手动挑选组织录入的信息,自动生成清晰干净、一目了然的检索报告。对于重点信息如支持/驳回对应的信息,进行高亮显示如红色文字,方便查阅校对、审核修改参考。
其中,知识图谱技术本身属于现有技术,主要技术包括知识获取、知识表示、知识存储、知识建模、知识融合、知识理解、知识运维等七个方面,通过面向结构化、半结构化和非结构化数据构建知识图谱为不同领域的应用提供支持。知识图谱技术是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
综上所述,本发明通过结合案件争议焦点内容,对基础关键词分解,通过自然语言理解分析基础关键词的相同语义的不同表述方式得到扩展关键词,利用基础关键词和扩展关键词进行检索得到检索结果;根据基础关键词和扩展关键词在文书内容中所处的位置确认关联程度,根据确认的关联程度对基础关键词和扩展关键词进行排序;指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;按照检索报告规格生成检索报告文档,检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。本发明通过对案件争议焦点的自然语言理解,进行更全面、更准确的案件检索,提高检索效率和质量;可实现全网数据采集分析,避免既往案例诉讼文书、法条法规的滞后性,导致不准确、不恰当的参考和引用;自动生成检索报告,关键信息明确清晰、省时省力。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
实施例2
参见图5,本发明实施例2还提供一种诉讼案例检索报告生成系统,基于上述实施例1的诉讼案例检索报告生成方法,包括:
关键词分解模块1,用于结合案件争议焦点内容,对基础关键词分解;
关键词扩展模块2,用于通过自然语言理解分析所述基础关键词的相同语义的不同表述方式得到扩展关键词;
关键词检索模块3,用于利用所述基础关键词和所述扩展关键词进行检索得到检索结果;
关联程度确认模块4,用于根据所述基础关键词和所述扩展关键词在文书内容中所处的位置确认关联程度;
关键词排序模块5,用于根据确认的关联程度对所述基础关键词和所述扩展关键词进行排序;
检索内容整理模块6,用于指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;
检索报告生成模块7,用于按照检索报告规格生成检索报告文档,所述检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。
本实施例中,所述关键词检索模块3中,利用所述基础关键词和所述扩展关键词进行检索得到的检索结果中,显示对应关键词检索结果数量供用户筛选参考。
本实施例中,所述关联程度确认模块4中,若所述基础关键词或所述扩展关键词出现在文书内容的“争议焦点”部分,则所述基础关键词或所述扩展关键词的关联程度最高;所述关键词排序模块5中对应所述基础关键词或所述扩展关键词排序第一靠前。
本实施例中,所述关联程度确认模块4中,若所述基础关键词或所述扩展关键词出现在文书内容的“本院认为”内容中,则所述基础关键词或所述扩展关键词的关联程度次高;所述关键词排序模块5中对应所述基础关键词或所述扩展关键词排序第二靠前。
本实施例中,所述关联程度确认模块4中,若所述基础关键词或所述扩展关键词在案件一审、二审的文书内容中均涉及,且作为两审的争议焦点,则所述关键词排序模块5中对应所述基础关键词或所述扩展关键词具有最高的排序优先级。
本实施例中,所述关联程度确认模块4中,检索所述基础关键词或所述扩展关键词所在文书内容的出具法院级别,出具法院级别越高,关联程度越高;所述关键词排序模块5中对应所述基础关键词或所述扩展关键词排序越靠前。
本实施例中,所述关联程度确认模块4中,若所述基础关键词或所述扩展关键词在既往案例作为生成检索报告的次数越多,视作关联程度越高,所述关键词排序模块5中对应所述基础关键词或所述扩展关键词排序越靠前。
本实施例中,所述检索报告生成模块4中,按照检索报告规格信息项,通过语义理解和知识图谱技术进行分析文书内容、提取信息,写入检索报告对应信息项。
需要说明的是,上述系统各模块之间的信息交互、执行过程等内容,由于与本申请实施例1中的方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
实施例3
本发明实施例3提供一种非暂态计算机可读存储介质,所述计算机可读存储介质中存储有诉讼案例检索报告生成方法的程序代码,所述程序代码包括用于执行实施例1或其任意可能实现方式的诉讼案例检索报告生成方法的指令。
计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(SolidState Disk、SSD))等。
实施例4
本发明实施例4提供一种电子设备,包括:存储器和处理器;
所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行实施例1或其任意可能实现方式的诉讼案例检索报告生成方法。
具体的,处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于所述处理器之外,独立存在。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (10)
1.一种诉讼案例检索报告生成方法,其特征在于,包括:
结合案件争议焦点内容,对基础关键词分解,通过自然语言理解分析所述基础关键词的相同语义的不同表述方式得到扩展关键词,利用所述基础关键词和所述扩展关键词进行检索得到检索结果;
根据所述基础关键词和所述扩展关键词在文书内容中所处的位置确认关联程度,根据确认的关联程度对所述基础关键词和所述扩展关键词进行排序;
指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;
按照检索报告规格生成检索报告文档,所述检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。
2.根据权利要求1所述的一种诉讼案例检索报告生成方法,其特征在于,利用所述基础关键词和所述扩展关键词进行检索得到的检索结果中,显示对应关键词检索结果数量供用户筛选参考。
3.根据权利要求1所述的一种诉讼案例检索报告生成方法,其特征在于,若所述基础关键词或所述扩展关键词出现在文书内容的“争议焦点”部分,则所述基础关键词或所述扩展关键词的关联程度最高,对应所述基础关键词或所述扩展关键词排序第一靠前;
若所述基础关键词或所述扩展关键词出现在文书内容的“本院认为”内容中,则所述基础关键词或所述扩展关键词的关联程度次高,对应所述基础关键词或所述扩展关键词排序第二靠前。
4.根据权利要求3所述的一种诉讼案例检索报告生成方法,其特征在于,若所述基础关键词或所述扩展关键词在案件一审、二审的文书内容中均涉及,且作为两审的争议焦点,则所述基础关键词或所述扩展关键词具有最高的排序优先级。
5.根据权利要求3所述的一种诉讼案例检索报告生成方法,其特征在于,检索所述基础关键词或所述扩展关键词所在文书内容的出具法院级别,出具法院级别越高,关联程度越高,对应所述基础关键词或所述扩展关键词排序越靠前。
6.根据权利要求3所述的一种诉讼案例检索报告生成方法,其特征在于,若所述基础关键词或所述扩展关键词在既往案例作为生成检索报告的次数越多,视作关联程度越高,对应所述基础关键词或所述扩展关键词排序越靠前。
7.根据权利要求1所述的一种诉讼案例检索报告生成方法,其特征在于,按照检索报告规格信息项,通过语义理解和知识图谱技术进行分析文书内容、提取信息,写入检索报告对应信息项。
8.一种诉讼案例检索报告生成系统,基于权利要求1至7任一项所述的诉讼案例检索报告生成方法,其特征在于,包括:
关键词分解模块,用于结合案件争议焦点内容,对基础关键词分解;
关键词扩展模块,用于通过自然语言理解分析所述基础关键词的相同语义的不同表述方式得到扩展关键词;
关键词检索模块,用于利用所述基础关键词和所述扩展关键词进行检索得到检索结果;
关联程度确认模块,用于根据所述基础关键词和所述扩展关键词在文书内容中所处的位置确认关联程度;
关键词排序模块,用于根据确认的关联程度对所述基础关键词和所述扩展关键词进行排序;
检索内容整理模块,用于指定检索范围,通过数据仓库技术进行检索数据抽取、转换和清洗,按照诉讼文书检索规则整理检索数据内容,呈现关于检索信息的法条法规、通知公告或热点事件舆情;
检索报告生成模块,用于按照检索报告规格生成检索报告文档,所述检索报告文档对包括司法观点、法院认为、法规法条的关键信息进行标记和摘要。
9.根据权利要求8所述的一种诉讼案例检索报告生成系统,其特征在于,所述关键词检索模块中,利用所述基础关键词和所述扩展关键词进行检索得到的检索结果中,显示对应关键词检索结果数量供用户筛选参考;
所述关联程度确认模块中,若所述基础关键词或所述扩展关键词出现在文书内容的“争议焦点”部分,则所述基础关键词或所述扩展关键词的关联程度最高;所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序第一靠前;
所述关联程度确认模块中,若所述基础关键词或所述扩展关键词出现在文书内容的“本院认为”内容中,则所述基础关键词或所述扩展关键词的关联程度次高;所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序第二靠前;
所述关联程度确认模块中,若所述基础关键词或所述扩展关键词在案件一审、二审的文书内容中均涉及,且作为两审的争议焦点,则所述基础关键词或所述扩展关键词具有最高的排序优先级;
所述关联程度确认模块中,检索所述基础关键词或所述扩展关键词所在文书内容的出具法院级别,出具法院级别越高,关联程度越高;所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序越靠前;
所述关联程度确认模块中,若所述基础关键词或所述扩展关键词在既往案例作为生成检索报告的次数越多,视作关联程度越高,所述关键词排序模块中对应所述基础关键词或所述扩展关键词排序越靠前。
10.根据权利要求8所述的一种诉讼案例检索报告生成系统,其特征在于,所述检索报告生成模块中,按照检索报告规格信息项,通过语义理解和知识图谱技术进行分析文书内容、提取信息,写入检索报告对应信息项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211395146.1A CN115617980A (zh) | 2022-11-08 | 2022-11-08 | 一种诉讼案例检索报告生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211395146.1A CN115617980A (zh) | 2022-11-08 | 2022-11-08 | 一种诉讼案例检索报告生成方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115617980A true CN115617980A (zh) | 2023-01-17 |
Family
ID=84877811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211395146.1A Pending CN115617980A (zh) | 2022-11-08 | 2022-11-08 | 一种诉讼案例检索报告生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115617980A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116795789A (zh) * | 2023-08-24 | 2023-09-22 | 卓望信息技术(北京)有限公司 | 自动生成专利检索报告的方法及装置 |
-
2022
- 2022-11-08 CN CN202211395146.1A patent/CN115617980A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116795789A (zh) * | 2023-08-24 | 2023-09-22 | 卓望信息技术(北京)有限公司 | 自动生成专利检索报告的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070078889A1 (en) | Method and system for automated knowledge extraction and organization | |
CN107085583B (zh) | 一种基于内容的电子文档管理方法及装置 | |
CN112148889A (zh) | 一种推荐列表的生成方法及设备 | |
JPH05128157A (ja) | 文書検索装置 | |
Im et al. | Linked tag: image annotation using semantic relationships between image tags | |
JP2004287725A (ja) | 検索処理方法及びプログラム | |
JP2020135891A (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
Geiß et al. | Neckar: A named entity classifier for wikidata | |
US20190391976A1 (en) | Research and development auxiliary system using patent database and method thereof | |
JP2017097845A (ja) | 複数のメディアソースからのコンテンツの組織化及び視覚化 | |
CN114722137A (zh) | 基于敏感数据识别的安全策略配置方法、装置及电子设备 | |
US20120179709A1 (en) | Apparatus, method and program product for searching document | |
KR101441219B1 (ko) | 정보 엔터티들의 자동 연관 | |
Spitz et al. | EVELIN: Exploration of event and entity links in implicit networks | |
US20230067688A1 (en) | Knowledge base with type discovery | |
CN115617980A (zh) | 一种诉讼案例检索报告生成方法及系统 | |
KR20160120583A (ko) | 지식 관리 시스템 및 이의 지식 구조 기반의 자료 관리 방법 | |
JP2014102625A (ja) | 情報検索システム、プログラム、および方法 | |
Musabeyezu | Comparative study of annotation tools and techniques | |
Nicholson et al. | Dissemination and discovery of diverse data: do libraries promote their unique research data collections? | |
JP2018156552A (ja) | 計算機システム及び文章データの検索方法 | |
Ayyasamy et al. | Mining Wikipedia knowledge to improve document indexing and classification | |
CN110555196B (zh) | 用于自动生成文章的方法、装置、设备和存储介质 | |
US9530094B2 (en) | Jabba-type contextual tagger | |
Carme et al. | The lixto project: Exploring new frontiers of web data extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |