CN110245210A - 一种要素融合方法及系统 - Google Patents

一种要素融合方法及系统 Download PDF

Info

Publication number
CN110245210A
CN110245210A CN201910556623.XA CN201910556623A CN110245210A CN 110245210 A CN110245210 A CN 110245210A CN 201910556623 A CN201910556623 A CN 201910556623A CN 110245210 A CN110245210 A CN 110245210A
Authority
CN
China
Prior art keywords
data
configuration file
case
fusion
single element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910556623.XA
Other languages
English (en)
Inventor
麦天骥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING LEDICT TECHNOLOGY CO LTD
Original Assignee
BEIJING LEDICT TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING LEDICT TECHNOLOGY CO LTD filed Critical BEIJING LEDICT TECHNOLOGY CO LTD
Priority to CN201910556623.XA priority Critical patent/CN110245210A/zh
Publication of CN110245210A publication Critical patent/CN110245210A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及一种要素融合方法及系统,其中,所述方法包括:获取待融合的案件数据,并根据所述案件数据所属的文书种类,读取所述案件数据的融合配置文件;针对单个要素值,甄别所述单个要素值在所述案件数据中相匹配的数据,并将甄别得到的数据写入所述单个要素值的数据集合中;根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息,所述完整要素信息用于生成判决文书。本申请提供的技术方案,能够提高要素融合的效率以及准确度。

Description

一种要素融合方法及系统
技术领域
本申请涉及数据处理技术领域,特别涉及一种要素融合方法及系统。
背景技术
目前,为了更好地辅助法官进行案件审理,通常需要对多份文书的要素进行融合。当法官在审理当前的案件时,可以基于目前的案件事实,从融合后的数据中提取出与案件事实相关的多个要素,从而提高案件审理的效率。
然而,当前在进行案件要素融合时,通常需要依托于专业人员的人工操作,这样会浪费较多的人力物力。此外,目前的案件要素融合来源较为单一,通常是从卷宗文本格式化的数据中进行要素融合。但是在实际应用中卷宗文本格式化的数据往往无法完全覆盖过往案件的全部信息,从而导致融合后的数据不够完备。
发明内容
本申请的目的在于提供一种要素融合方法及系统,能够提高要素融合的效率以及准确度。
为实现上述目的,本申请提供一种要素融合方法,所述方法包括:
获取待融合的案件数据,并根据所述案件数据所属的文书种类,读取所述案件数据的融合配置文件;
针对单个要素值,甄别所述单个要素值在所述案件数据中相匹配的数据,并将甄别得到的数据写入所述单个要素值的数据集合中;
根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息,所述完整要素信息用于生成判决文书。
进一步地,所述案件数据包括卷宗文本格式化的数据和用户输入的数据。
进一步地,读取所述案件数据的融合配置文件包括:
读取所述案件数据的通用融合配置文件,并判断所述案件数据的归属区域或者案件类型是否存在特殊配置,若存在,读取所述案件数据的特殊融合配置文件。
进一步地,所述方法还包括:
在读取到所述案件数据的通用融合配置文件和特殊融合配置文件后,将所述特殊融合配置文件中限定的数据替换至所述通用融合配置文件中,以获取所述单个要素值的数据集合。
进一步地,甄别所述单个要素值在所述案件数据中相匹配的数据包括:
以所述单个要素值为最小实体,在所述案件数据中查找所述单个要素值具备最大权重值的目标文书,并将所述目标文书中包含的与所述单个要素值相关的内容作为甄别出的相匹配的数据。
进一步地,所述方法还包括:
若读取的融合配置文件包括特殊融合配置文件,按照所述特殊融合配置文件中限定的权重值,甄别与所述单个要素值相匹配的数据。
进一步地,根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息包括:
根据读取的所述融合配置文件确定当前的案件事实,并基于所述案件事实从各个所述数据集合中筛选出不同的要素信息,所述不同的要素信息组合为所述完整要素信息。
为实现上述目的,本申请还提供一种要素融合系统,所述系统包括:
融合配置文件读取单元,用于获取待融合的案件数据,并根据所述案件数据所属的文书种类,读取所述案件数据的融合配置文件;
数据集合确定单元,用于针对单个要素值,甄别所述单个要素值在所述案件数据中相匹配的数据,并将甄别得到的数据写入所述单个要素值的数据集合中;
融合单元,用于根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息,所述完整要素信息用于生成判决文书。
进一步地,所述融合配置文件读取单元还用于读取所述案件数据的通用融合配置文件,并判断所述案件数据的归属区域或者案件类型是否存在特殊配置,若存在,读取所述案件数据的特殊融合配置文件。
进一步地,所述数据集合确定单元包括:
权重值甄别模块,用于以所述单个要素值为最小实体,在所述案件数据中查找所述单个要素值具备最大权重值的目标文书,并将所述目标文书中包含的与所述单个要素值相关的内容作为甄别出的相匹配的数据。
由上可见,本申请提供的技术方案,可以针对卷宗文本格式化的数据和用户输入的数据进行融合,从而能够实现多要素融合的技术,而不仅仅局限于卷宗文本格式化的数据,从而使得融合后的数据更加全面。在进行要素融合时,首先可以读取各个案件数据的融合配置文件,该融合配置文件可以划分为通用融合配置文件和特殊融合配置文件,从而能够更好地贴合案件数据的归属区域和案件类型。后续,可以将单个要素值作为最小实体,确定出单个要素值的数据集合。当需要进行要素融合时,可以根据读取的融合配置文件,从数据集合中融合出与案件事实相匹配的完整要素信息,该完整要素信息可以用于生成判决文书等一系列功能。由上可见,通过多要素融合技术,能够提高要素融合的效率以及准确度。
附图说明
图1为本申请实施例中要素融合方法的步骤图;
图2为本申请实施例中要素融合方法的流程图;
图3为本申请实施例中要素融合系统的功能模块示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施方式,都应当属于本申请保护的范围。
本申请提供的要素融合技术,可以在卷宗多种文书提取完毕后,将多种文书的数据节点(也称要素值)进行权重比较,从而通过多个文书进行甄别、合并出符合案件事实情况的要素信息。由于中文语言的区域性和复杂性,以及不同案件的特殊性,通常需要结合用户输入的数据作为融合技术的辅助手段。鉴于此,本申请提供的技术方案,可以针对多来源的数据进行要素融合。
具体地,请参阅图1和图2,本申请提供的要素融合方法,可以包括以下步骤。
S1:获取待融合的案件数据,并根据所述案件数据所属的文书种类,读取所述案件数据的融合配置文件。
在本实施方式中,可以将卷宗文本格式化的数据和用户输入的数据进行智能的甄别、数据整合、已有数据推导等操作,以完成数据个性化的要求。
具体地,首先可以进行融合数据加载的步骤,当进入融合程序时,可以根据案件类型确认文书种类。例如,文书种类可以是民事一审。在确定了文书种类后,可以得到该文书种类的通用融合配置文件。如果该案件的归属地域或案件类型符合特殊配置的要求,那么还需要读取该案件的特殊融合配置文件。例如,该案件在广州法院,要么需要读取符合广州法院特色的融合配置文件。
鉴于此,如图2所示,在读取所述案件数据的融合配置文件时,可以先读取所述案件数据的通用融合配置文件,并判断所述案件数据的归属区域或者案件类型是否存在特殊配置,若存在,再读取所述案件数据的特殊融合配置文件。
在一个实施方式中,在读取到所述案件数据的通用融合配置文件和特殊融合配置文件后,可以将所述特殊融合配置文件中限定的数据替换至所述通用融合配置文件中,以获取所述单个要素值的数据集合。
具体地,由于案由不同、地域不同等一些因素,在进行要素融合时,通常需要在通用融合配置文件中,人为加入特殊的配置文件进行数据的加工。因此,需要根据当前的案件类型查询是否存在特殊融合配置文件,例如,广州民事一审中融合的要素点与通用不同,那么根据法院名称判定出当前为广州法院时,需要查询是否存在用于处理广州法院特色要素的配置文件。如果存在,则读取该特殊融合配置文件,从而进行进行数据加工操作。
S2:针对单个要素值,甄别所述单个要素值在所述案件数据中相匹配的数据,并将甄别得到的数据写入所述单个要素值的数据集合中。
在本实施方式中,可以将所述单个要素值作为最小实体,在所述案件数据中查找所述单个要素值具备最大权重值的目标文书,并将所述目标文书中包含的与所述单个要素值相关的内容作为甄别出的相匹配的数据。
具体地,单个要素值例如可以是被告姓名,将单个要素值为最小实体进行数据甄别后,可以将甄别得到的数据存入到数据仓库中,存储为一个数据集合。
在实际应用中,若读取的融合配置文件包括特殊融合配置文件,那么可以按照所述特殊融合配置文件中限定的权重值,甄别与所述单个要素值相匹配的数据。
S3:根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息,所述完整要素信息用于生成判决文书。
在本实施方式中,可以根据读取的所述融合配置文件确定当前的案件事实,并基于所述案件事实从各个所述数据集合中筛选出不同的要素信息,所述不同的要素信息组合为所述完整要素信息。
具体地,可以结合通用融合配置文件和特殊融合配置文件,来进行卷宗多文书的数据甄选工作,融合出最符合案件事实的完整要素信息,其中,该完整要素信息为案件的各个要素组成的完整案件信息。融合出的完整要素信息可以进行数据存储入库操作,为后续判决书生成等功能提供数据基础。
请参阅图3,本申请还提供一种要素融合系统,所述系统包括:
融合配置文件读取单元,用于获取待融合的案件数据,并根据所述案件数据所属的文书种类,读取所述案件数据的融合配置文件;
数据集合确定单元,用于针对单个要素值,甄别所述单个要素值在所述案件数据中相匹配的数据,并将甄别得到的数据写入所述单个要素值的数据集合中;
融合单元,用于根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息,所述完整要素信息用于生成判决文书。
在一个实施方式中,所述融合配置文件读取单元还用于读取所述案件数据的通用融合配置文件,并判断所述案件数据的归属区域或者案件类型是否存在特殊配置,若存在,读取所述案件数据的特殊融合配置文件。
在一个实施方式中,所述数据集合确定单元包括:
权重值甄别模块,用于以所述单个要素值为最小实体,在所述案件数据中查找所述单个要素值具备最大权重值的目标文书,并将所述目标文书中包含的与所述单个要素值相关的内容作为甄别出的相匹配的数据。
由上可见,本申请提供的技术方案,可以针对卷宗文本格式化的数据和用户输入的数据进行融合,从而能够实现多要素融合的技术,而不仅仅局限于卷宗文本格式化的数据,从而使得融合后的数据更加全面。在进行要素融合时,首先可以读取各个案件数据的融合配置文件,该融合配置文件可以划分为通用融合配置文件和特殊融合配置文件,从而能够更好地贴合案件数据的归属区域和案件类型。后续,可以将单个要素值作为最小实体,确定出单个要素值的数据集合。当需要进行要素融合时,可以根据读取的融合配置文件,从数据集合中融合出与案件事实相匹配的完整要素信息,该完整要素信息可以用于生成判决文书等一系列功能。由上可见,通过多要素融合技术,能够提高要素融合的效率以及准确度。
上面对本申请的各种实施方式的描述以描述的目的提供给本领域技术人员。其不旨在是穷举的、或者不旨在将本发明限制于单个公开的实施方式。如上所述,本申请的各种替代和变化对于上述技术所属领域技术人员而言将是显而易见的。因此,虽然已经具体讨论了一些另选的实施方式,但是其它实施方式将是显而易见的,或者本领域技术人员相对容易得出。本申请旨在包括在此已经讨论过的本发明的所有替代、修改、和变化,以及落在上述申请的精神和范围内的其它实施方式。

Claims (10)

1.一种要素融合方法,其特征在于,所述方法包括:
获取待融合的案件数据,并根据所述案件数据所属的文书种类,读取所述案件数据的融合配置文件;
针对单个要素值,甄别所述单个要素值在所述案件数据中相匹配的数据,并将甄别得到的数据写入所述单个要素值的数据集合中;
根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息,所述完整要素信息用于生成判决文书。
2.根据权利要求1所述的方法,其特征在于,所述案件数据包括卷宗文本格式化的数据和用户输入的数据。
3.根据权利要求1所述的方法,其特征在于,读取所述案件数据的融合配置文件包括:
读取所述案件数据的通用融合配置文件,并判断所述案件数据的归属区域或者案件类型是否存在特殊配置,若存在,读取所述案件数据的特殊融合配置文件。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在读取到所述案件数据的通用融合配置文件和特殊融合配置文件后,将所述特殊融合配置文件中限定的数据替换至所述通用融合配置文件中,以获取所述单个要素值的数据集合。
5.根据权利要求1所述的方法,其特征在于,甄别所述单个要素值在所述案件数据中相匹配的数据包括:
以所述单个要素值为最小实体,在所述案件数据中查找所述单个要素值具备最大权重值的目标文书,并将所述目标文书中包含的与所述单个要素值相关的内容作为甄别出的相匹配的数据。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若读取的融合配置文件包括特殊融合配置文件,按照所述特殊融合配置文件中限定的权重值,甄别与所述单个要素值相匹配的数据。
7.根据权利要求1所述的方法,其特征在于,根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息包括:
根据读取的所述融合配置文件确定当前的案件事实,并基于所述案件事实从各个所述数据集合中筛选出不同的要素信息,所述不同的要素信息组合为所述完整要素信息。
8.一种要素融合系统,其特征在于,所述系统包括:
融合配置文件读取单元,用于获取待融合的案件数据,并根据所述案件数据所属的文书种类,读取所述案件数据的融合配置文件;
数据集合确定单元,用于针对单个要素值,甄别所述单个要素值在所述案件数据中相匹配的数据,并将甄别得到的数据写入所述单个要素值的数据集合中;
融合单元,用于根据读取的所述融合配置文件,在所述数据集合中融合出与当前的案件事实相匹配的完整要素信息,所述完整要素信息用于生成判决文书。
9.根据权利要求8所述的系统,其特征在于,所述融合配置文件读取单元还用于读取所述案件数据的通用融合配置文件,并判断所述案件数据的归属区域或者案件类型是否存在特殊配置,若存在,读取所述案件数据的特殊融合配置文件。
10.根据权利要求8所述的系统,其特征在于,所述数据集合确定单元包括:
权重值甄别模块,用于以所述单个要素值为最小实体,在所述案件数据中查找所述单个要素值具备最大权重值的目标文书,并将所述目标文书中包含的与所述单个要素值相关的内容作为甄别出的相匹配的数据。
CN201910556623.XA 2019-06-25 2019-06-25 一种要素融合方法及系统 Pending CN110245210A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910556623.XA CN110245210A (zh) 2019-06-25 2019-06-25 一种要素融合方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910556623.XA CN110245210A (zh) 2019-06-25 2019-06-25 一种要素融合方法及系统

Publications (1)

Publication Number Publication Date
CN110245210A true CN110245210A (zh) 2019-09-17

Family

ID=67889388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910556623.XA Pending CN110245210A (zh) 2019-06-25 2019-06-25 一种要素融合方法及系统

Country Status (1)

Country Link
CN (1) CN110245210A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040158552A1 (en) * 2002-12-31 2004-08-12 Chung-I Lee System and method for visually mining information
CN103412868A (zh) * 2013-07-02 2013-11-27 福建榕基软件股份有限公司 文书生成方法及装置
CN106919547A (zh) * 2017-03-03 2017-07-04 纪永辉 基于要素表和标准模板批量生成格式文书的方法
CN107622042A (zh) * 2017-08-29 2018-01-23 科大讯飞股份有限公司 一种文书生成方法、装置、存储介质和电子设备
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置
CN108009137A (zh) * 2017-12-22 2018-05-08 中科鼎富(北京)科技发展有限公司 一种基于配置文件的规范文书处理方法、装置及系统
CN108255926A (zh) * 2017-11-14 2018-07-06 宫辉 一种基于甘特图的法律事务管理方法和系统
CN108519968A (zh) * 2018-04-09 2018-09-11 北京智慧正安科技有限公司 刑事案件裁判文书生成方法、装置及计算机可读存储介质
CN109272293A (zh) * 2018-09-12 2019-01-25 宫辉 一种基于程序轴法律事务管理系统的事务提醒方法
CN109815467A (zh) * 2018-12-20 2019-05-28 广州恒巨信息科技有限公司 一种司法调解文书智能生成方法、系统及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040158552A1 (en) * 2002-12-31 2004-08-12 Chung-I Lee System and method for visually mining information
CN103412868A (zh) * 2013-07-02 2013-11-27 福建榕基软件股份有限公司 文书生成方法及装置
CN106919547A (zh) * 2017-03-03 2017-07-04 纪永辉 基于要素表和标准模板批量生成格式文书的方法
CN107622042A (zh) * 2017-08-29 2018-01-23 科大讯飞股份有限公司 一种文书生成方法、装置、存储介质和电子设备
CN108255926A (zh) * 2017-11-14 2018-07-06 宫辉 一种基于甘特图的法律事务管理方法和系统
CN108009137A (zh) * 2017-12-22 2018-05-08 中科鼎富(北京)科技发展有限公司 一种基于配置文件的规范文书处理方法、装置及系统
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置
CN108519968A (zh) * 2018-04-09 2018-09-11 北京智慧正安科技有限公司 刑事案件裁判文书生成方法、装置及计算机可读存储介质
CN109272293A (zh) * 2018-09-12 2019-01-25 宫辉 一种基于程序轴法律事务管理系统的事务提醒方法
CN109815467A (zh) * 2018-12-20 2019-05-28 广州恒巨信息科技有限公司 一种司法调解文书智能生成方法、系统及装置

Similar Documents

Publication Publication Date Title
RU2427896C2 (ru) Аннотирование документов в совместно работающих приложениях данными в разрозненных информационных системах
US9251130B1 (en) Tagging annotations of electronic books
US9928242B2 (en) Managing the content of shared slide presentations
US7693918B2 (en) Rapid prototyping, generating and dynamically modifying a schema representing a database
Heaney An analytical model of collections and their catalogues
US10853564B2 (en) Operation for copied content
CN106055528A (zh) 文书自动生成方法及装置
JP5841102B2 (ja) 技術動向分析報告書作成システム
CN104239382A (zh) 用于内容检索的上下文智能标记
AU2015331030A1 (en) System generator module for electronic document and electronic file
CN104424271B (zh) 出版物数字资源的自动采集方法及系统
CN104765849A (zh) 一种获取拷贝数据来源信息的方法和系统
CN106055546A (zh) 基于Lucene的光盘库全文检索系统
CN102902768B (zh) 文件内容搜索显示方法及系统
CN103914487A (zh) 文档的采集、标识及关联的系统
CN111666383A (zh) 信息处理方法、装置、电子设备及计算机可读存储介质
CN105912540A (zh) 文件系统同步的方法及装置
CN103914486A (zh) 文档的搜索及展现的系统
KR100912288B1 (ko) 문서 내 목차정보를 이용한 검색 시스템
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
CN103458007A (zh) Im数据导出的方法、客户端及系统
US20080294632A1 (en) Method and System for Sorting/Searching File and Record Media Therefor
CN117194322A (zh) 文件分类管理方法、系统及计算设备
CN110245210A (zh) 一种要素融合方法及系统
US11023418B2 (en) Keyword-based data management system and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190917