CN115203439A - 用于合规监管的知识图谱的构建方法、相关方法和系统 - Google Patents

用于合规监管的知识图谱的构建方法、相关方法和系统 Download PDF

Info

Publication number
CN115203439A
CN115203439A CN202211121643.2A CN202211121643A CN115203439A CN 115203439 A CN115203439 A CN 115203439A CN 202211121643 A CN202211121643 A CN 202211121643A CN 115203439 A CN115203439 A CN 115203439A
Authority
CN
China
Prior art keywords
compliance
legal
obligation
item
supervision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211121643.2A
Other languages
English (en)
Other versions
CN115203439B (zh
Inventor
王智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Daorigin Technology Co ltd
Original Assignee
Tianjin Daorigin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Daorigin Technology Co ltd filed Critical Tianjin Daorigin Technology Co ltd
Priority to CN202211121643.2A priority Critical patent/CN115203439B/zh
Publication of CN115203439A publication Critical patent/CN115203439A/zh
Application granted granted Critical
Publication of CN115203439B publication Critical patent/CN115203439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Technology Law (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了用于合规监管的知识图谱的构建方法、相关方法和系统。该构建方法包括:根据用于合规监管的预定义数据元素,构建合规监管数据单元;基于合规监管数据单元构建用于合规事项监管的本体三元组;分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果;基于抽取结果再次抽取,并依据本体三元组生成三元组数据,构建用于合规事项监管的知识图谱,以便后续能够利用该知识图谱进行合规监管。如此,通过知识图谱数据的表示,可以组成合规事项、法律条款、案例相互关联的合规监管知识图谱,后续可快速查询合规监管数据,根据合规主体高效生成合规监管义务报告,依据知识图谱进行知识推理,进而提升合规监管数据的获取效率和效果。

Description

用于合规监管的知识图谱的构建方法、相关方法和系统
技术领域
本申请涉及大数据技术领域,尤其涉及用于合规监管的知识图谱的构建方法、相关方法和系统。
背景技术
随着社会与经济的快速发展,立法工作逐步推进,执法环境日趋严格,合规已成为各个法律主体的日常行为准则,合规监管也逐渐成为经济领域的各类经营主体的战略管理要求。具体来说,合规监管是指各个法律主体依据法律法规文本对日常行为进行监管的法定要求,以避免实施法律法规中明确禁止、限制的行为。
目前,传统的合规监管方案一般需要依靠人工分析大量的法律法规文本来进行管理。而法律体系非常复杂、庞大,具体涉及法律、行政法规、地方性法规等多个层次,由宪法、民法商法、行政法等多个法律部门组成,因此,人工分析法律法规文本进行合规监管数据获取,难以直接获得精准、全面的合规监管数据,合规监管数据获取的效率较低,效果较差。
发明内容
本申请实施例提供了用于合规监管的知识图谱的构建方法、相关方法和系统,可以对法律法规文本和裁决文书进行数据化表示以构建知识图谱,从而提升合规监管数据获取的效率和效果。
第一方面,本申请实施例提供了一种用于合规监管的知识图谱的构建方法,包括:
根据用于合规监管的预定义数据元素,构建合规监管数据单元;所述合规监管数据单元包括合规事项、管辖区域、合规行业类型、合规主体、合规主体类型、合规义务、违规责任、合规路径,以及违规案例;所述合规事项用于表示受法律法规文本条款所约束的事项;所述管辖区域用于表示所述合规事项涉及的法律管辖区域;所述合规行业类型用于表示所述合规事项的适用行业的类型;所述合规主体用于表示实施所述合规事项的法律主体;所述合规主体类型用于表示所述法律主体的类型;所述合规义务用于表示所述法律主体实施所述合规事项的法律义务;所述违规责任用于表示所述法律主体违反所述法律义务时需要承担的法律责任;所述合规路径用于表示所述法律主体实施所述合规事项时的免责条件和/或免责程序;所述违规案例用于表示依据所述法律责任和/或所述合规义务进行处罚的案例;
基于所述合规监管数据单元构建用于合规事项监管的本体三元组;所述本体三元组包括实体、所述实体的关系以及所述实体的属性信息;
分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果;
基于所述抽取结果再次抽取,并依据所述本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。
可选地,对法律法规文本进行知识抽取,得到抽取结果,包括:
建立法律法规文本库;所述法律法规文本库中保存有所述法律法规文本;
从所述法律法规文本库中,抽取所述法律法规文本对应的多个法律特征数据;所述多个法律特征数据包括所述法律法规文本的法规名称、效力状态、颁布机构、颁布文号、颁布日期、实施日期、法律法规类型、效力范围、条款序号及文本内容;
基于抽取出的所述多个法律特征数据,建立法律法规数据库,作为第一抽取结果。
可选地,所述从所述法律法规文本库中,抽取所述法律法规文本对应的多个法律特征数据,包括:
构建所述多个法律特征数据分别对应的第一参数配置库;所述多个法律特征数据分别对应的第一参数配置库中保存有所述多个法律特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及所述多个法律特征数据间的逻辑;
利用所述多个法律特征数据分别对应的第一参数配置库,配置确定所述多个法律特征数据分别对应的第一抽取规则;
根据所述多个法律特征数据分别对应的第一抽取规则,并结合相似性算法,从所述法律法规文本库中分别抽取所述多个法律特征数据。
可选地,对裁决文书进行知识抽取,得到抽取结果,包括:
建立裁决文书库;所述裁决文书库中保存有所述裁决文书;
从所述裁决文书库中,抽取所述裁决文书对应的多个裁决特征数据;所述多个裁决特征数据包括案件名称、裁决机构、涉案单位、裁决时间、裁决依据及裁决结果;
基于抽取出的所述多个裁决特征数据,建立裁决案例数据库,作为第二抽取结果。
可选地,所述从所述裁决文书库中,抽取所述裁决文书对应的多个裁决特征数据,包括:
确定所述多个裁决特征数据分别对应的第二参数配置库;所述第二参数配置库中保存有所述多个裁决特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及所述多个裁决特征数据间的逻辑;
利用所述多个裁决特征数据分别对应的第二参数配置库,配置所述多个裁决特征数据分别对应的第二抽取规则;
根据所述多个裁决特征数据分别对应的第二抽取规则,并结合相似性算法,从所述裁决文书库中抽取所述裁决特征数据。
可选地,所述基于所述抽取结果再次抽取,并依据所述本体三元组生成三元组数据,包括:
根据所述法律法规文本的条款顺序、合规事项命名规则、合规事项关联词典,并结合短文本主题抽取算法,从所述第一抽取结果中抽取所述合规事项;
根据所述合规事项,从所述第一抽取结果中抽取所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径;
根据所述合规义务和所述违规责任,从所第二抽取结果中抽取所述违规案例;
根据所述合规事项,从行业信息库中抽取所述合规行业类型,并根据所述合规事项和所述合规主体,从合规主体信息库中抽取所述合规主体类型;
依据所述本体三元组,以所述合规事项、所述管辖区域、所述合规主体、所述合规义务、所述违规责任、所述合规路径、所述违规案例、所述合规行业类型以及所述合规主体类型生成所述三元组数据。
可选地,所述根据所述合规事项,从所述第一抽取结果中抽取所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径,包括:
构建所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径分别对应的第三参数配置库;
利用所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径分别对应的第三参数配置库,从所述第一抽取结果中抽取所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径。
第二方面,本申请实施例提供了一种合规监管方法,包括:
获取用于合规事项监管的知识图谱;所述知识图谱由上述任一用于合规监管的知识图谱的构建方法构建得到;
利用所述知识图谱进行合规事项监管。
可选地,所述利用所述知识图谱进行合规事项监管,包括:
获取目标终端提交的目标查询信息;所述目标查询信息包括合规主体类型和/或所述合规行业类型;所述合规主体类型用于表示实施合规事项的法律主体的类型;所述合规行业类型用于表示所述合规事项的适用行业的类型;
基于所述知识图谱,并根据所述目标查询信息,生成合规监管义务报告;所述合规监管义务报告包括所述合规事项、管辖区域、合规义务、违规责任、合规路径,以及违规案例中的一个或多个;所述合规事项用于表示受法律法规文本条款所约束的事项;所述管辖区域用于表示所述合规事项涉及的法律管辖区域;所述合规义务用于表示所述法律主体实施所述合规事项的法律义务;所述违规责任用于表示所述法律主体违反所述法律义务时需要承担的法律责任;所述合规路径用于表示所述法律主体实施所述合规事项时的免责条件和/或免责程序;所述违规案例用于表示依据所述法律责任和/或所述合规义务进行处罚的案例。
可选地,所述方法还包括:
在法律法规文本和/或裁决文书发生变更时,基于变更后的法律法规文本和/或裁决文书更新所述知识图谱;
基于更新后的知识图谱更新所述合规监管义务报告。
可选地,所述利用所述知识图谱进行合规事项监管,包括:
响应于目标终端提交的待查询合规事项,确定所述知识图谱关联的多个合规事项与所述待查询合规事项之间的第一语义相似度;
按照所述第一语义相似度从高到低的顺序,对所述多个合规事项进行排序,得到排序结果并发送至所述目标终端,以便所述目标终端从所述多个合规事项中择一作为目标合规事项;
显示所述目标合规事项关联的图谱信息和/或所述目标合规事项关联的三元组数据。
可选地,所述利用所述知识图谱进行合规事项监管,包括:
响应于目标终端提交的所述知识图谱中的任一实体的名称、关系和/或属性信息图谱数据,对所述任一图谱数据进行知识推理,得到所述任一实体的名称、关系和/或属性信息关联的图谱节点。
第三方面,本申请实施例提供了一种用于合规监管的知识图谱的构建系统,包括:
合规监管数据单元构建模块,用于根据用于合规监管的预定义数据元素,构建合规监管数据单元;所述合规监管数据单元包括合规事项、管辖区域、合规行业类型、合规主体、合规主体类型、合规义务、违规责任、合规路径,以及违规案例;所述合规事项用于表示受法律法规文本条款所约束的事项;所述管辖区域用于表示所述合规事项涉及的法律管辖区域;所述合规行业类型用于表示所述合规事项的适用行业的类型;所述合规主体用于表示实施所述合规事项的法律主体;所述合规主体类型用于表示所述法律主体的类型;所述合规义务用于表示所述法律主体实施所述合规事项的法律义务;所述违规责任用于表示所述法律主体违反所述法律义务时需要承担的法律责任;所述合规路径用于表示所述法律主体实施所述合规事项时的免责条件和/或免责程序;所述违规案例用于表示依据所述法律责任和/或所述合规义务进行处罚的案例;
本体三元组构建模块,用于基于所述合规监管数据单元构建用于合规事项监管的本体三元组;所述本体三元组包括实体、所述实体的关系以及所述实体的属性信息;
知识抽取模块,用于分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果;
知识图谱构建模块,用于基于所述抽取结果进行再次抽取,并依据所述本体三元组组成三元组数据,构建用于合规事项监管的知识图谱。
可选地,所述系统还包括:数据库模块;
所述数据库模块,用于构建文件数据库、关系数据库和图数据库;
其中,所述文件数据库用于存储所述法律法规文本和所述裁决文书;所述关系数据库用于存储所述抽取结果对应的结构化数据;所述图数据库用于存储所述知识图谱的实例数据。
可选地,所述系统还包括:
主体分类管理模块,用于对所述合规主体类型进行配置和管理。
可选地,所述系统还包括:
行业分类管理模块,用于对所述合规行业类型进行配置和管理。
可选地,所述系统还包括:
数据统计展示模块,用于对所述实体、所述实体的关系以及所述实体的属性信息的统计数量进行展示。
第四方面,本申请实施例提供了一种合规监管系统,包括:
知识图谱获取模块,用于获取用于合规事项监管的知识图谱;所述知识图谱由上述任一用于合规监管的知识图谱的构建方法构建得到;
合规监管模块,用于利用所述知识图谱进行合规事项监管。
可选地,所述合规监管模块包括:
合规事项查询模块,用于响应于目标终端提交的待查询合规事项,确定所述知识图谱关联的多个合规事项与所述待查询合规事项之间的第一语义相似度;按照所述第一语义相似度从高到低的顺序,对所述多个合规事项进行排序,得到第一排序结果并发送至所述目标终端,以便所述目标终端从所述多个合规事项中择一作为目标合规事项;显示所述目标合规事项关联的图谱信息和/或所述目标合规事项关联的三元组数据。
可选地,所述合规事项查询模块,还用于:
响应于目标终端提交的所述知识图谱中的任一实体的名称、关系和/或属性信息,按照所述知识图谱进行知识推理,得到所述任一实体的名称、关系和/或属性信息关联的图谱节点。
可选地,所述合规监管模块包括:
法律法规文本查询模块,用于响应于目标终端提交的待查询法律法规文本的名称,确定所述知识图谱关联的多个法律法规文本的名称与所述待查询法律法规文本的名称之间的第二语义相似度;按照所述第二语义相似度从高到低的顺序,对所述多个法律法规文本的名称进行排序,得到第二排序结果并发送至所述目标终端,以便所述目标终端从所述多个法律法规文本中择一作为目标法律法规文本;显示所述目标法律法规文本,以及所述目标法律法规文本对应的至少一个合规事项。
可选地,所述合规监管模块包括:
合规监管义务报告模块,用于获取目标终端提交的第一查询信息;基于所述知识图谱,并根据所述第一查询信息,生成合规监管义务报告;所述第一查询信息包括第一合规主体类型和/或第一合规行业类型;所述第一合规主体类型用于表示实施第一合规事项的第一法律主体的类型;所述第一合规行业类型用于表示所述第一合规事项的适用行业的类型;所述合规监管义务报告包括所述第一合规事项、第一管辖区域、第一合规义务、第一违规责任、第一合规路径,以及第一违规案例中的一个或多个;所述第一合规事项用于表示受第一法律法规文本条款所约束的事项;所述第一管辖区域用于表示所述第一合规事项涉及的法律管辖区域;所述第一合规义务用于表示所述第一法律主体实施所述第一合规事项的第一法律义务;所述第一违规责任用于表示所述第一法律主体违反所述第一法律义务时需要承担的第一法律责任;所述第一合规路径用于表示所述第一法律主体实施所述第一合规事项时的第一免责条件和/或第一免责程序;所述第一违规案例用于表示依据所述第一法律责任和/或所述第一合规义务进行处罚的案例。
可选地,所述合规监管报告模块还包括:
合规监管义务报告更新模块,用于在所述第一法律法规文本和/或裁决文书发生变更时,基于变更后的法律法规文本和/或裁决文书更新所述知识图谱;基于更新后的知识图谱更新所述合规监管义务报告。
可选地,所述合规监管模块包括:
执法检查报告模块,用于获取目标终端提交的第二查询信息;基于所述知识图谱,并根据所述第二查询信息,生成执法检查报告;所述第二查询信息包括第二法律法规文本的名称;所述执法检查报告包括所述第二法律法规文本对应的第二合规事项、第二合规义务、第二违规责任和第二合规路径中的一个或多个;所述第二合规事项用于表示受所述第二法律法规文本条款所约束的事项;所述第二合规义务用于表示第二法律主体实施所述第二合规事项的第二法律义务;所述第二违规责任用于表示所述第二法律主体违反所述第二法律义务时需要承担的第二法律责任;所述第二合规路径用于表示所述第二法律主体实施所述第二合规事项时的第二免责条件和/或第二免责程序。
可选地,所述系统还包括:
信息管理模块,用于对目标终端关联的用户信息、合规主体类型、合规行业类型、合规监管义务报告和/或执法检查报告的下载记录进行管理。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,根据用于合规监管的预定义数据元素,构建合规监管数据单元之后,可以基于合规监管数据单元构建用于合规事项监管的本体三元组,并分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果,进而基于抽取结果再次抽取,并依据本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。如此,通过知识图谱数据的表示,可以组成合规事项、法律条款、案例相互关联的合规监管知识图谱,后续可快速查询合规监管数据,根据合规主体高效生成合规监管义务报告,依据知识图谱进行知识推理,从而将合规监管过程从传统的法律法规文本级转变为法律法规条款数据级,提升合规监管数据的获取效率和效果。
附图说明
图1为本申请实施例提供的一种用于合规监管的知识图谱的构建方法的流程图;
图2为本申请实施例提供的一种用于合规监管的知识图谱的示意图;
图3为本申请实施例提供的一种合规监管方法的流程图;
图4为本申请实施例提供的一种用于合规监管的知识图谱的构建系统的结构示意图;
图5为本申请实施例提供的一种合规监管系统的结构示意图。
具体实施方式
正如前文所述,发明人在针对合规监管方案的研究中发现:目前,传统的合规监管方案一般需要依靠人工分析大量的法律法规文本来进行管理。而法律体系非常复杂、庞大,具体涉及法律、行政法规、地方性法规等多个层次,由宪法、民法商法、行政法等多个法律部门组成,因此,人工分析法律法规文本进行合规监管数据获取,难以直接获得精准、全面的合规监管数据,合规监管数据获取的效率较低,效果较差。
为了解决上述问题,本申请实施例提供了一种用于合规监管的知识图谱的构建方法,该方法可以包括:根据用于合规监管的预定义数据元素,构建合规监管数据单元之后,可以基于合规监管数据单元构建用于合规事项监管的本体三元组,并分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果,进而基于抽取结果再次抽取,并依据本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。
如此,通过知识图谱数据的表示,可以组成合规事项、法律条款、案例相互关联的合规监管知识图谱,后续可快速查询合规监管数据,根据合规主体高效生成合规监管义务报告,依据知识图谱进行知识推理,从而将合规监管过程从传统的法律法规文本级转变为条款数据级,提升合规监管数据的获取效率和效果。具体实现方式请参见下文所做的介绍。
为了使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种用于合规监管的知识图谱的构建方法的流程图。结合图1所示,本申请实施例提供的用于合规监管的知识图谱的构建方法,可以包括:
S11:根据用于合规监管的预定义数据元素,构建合规监管数据单元。
在本申请实施例中,发明人创造性地发现,为了得到全面、完整的知识图谱,有助于进行合规监管,可以从多个维度,也就是预先定义多个数据元素来构造合规监管数据单元。具体来说,合规监管数据单元可以包括合规事项、管辖区域、合规行业类型、合规主体、合规主体类型、合规义务、违规责任、合规路径,以及违规案例。
其中,合规事项,用于表示受法律法规文本条款所约束的事项。也就是,法律法规文本条款中明确禁止、限制或规范的行为事项。例如,专利侵权事项是受《中华人民共和国专利法》条文约束的事项;商标侵权事项是受《中华人民共和国商标法》条文约束的事项。
管辖区域,用于表示合规事项涉及的法律管辖区域。也就是,合规事项的监管权利所涉及的行政区域。例如,管辖区域可以体现为国际、中国境内、中国境外、省、市、自治区和区县中的一个或多个。
合规行业类型,用于表示合规事项的适用行业的类型。也就是,合规事项高频发生的行业的类型。例如,出版行业是著作权侵权事项对应的合规行业类型。
合规主体,用于表示实施合规事项的法律主体。例如,专利侵权人是实施专利侵权事项的主体;专利权人是实施专利权保护事项的主体。
合规主体类型,用于表示法律主体的类型。例如,专利权人对应的类型可以是法人、自然人或非法人组织等。
合规义务,用于表示法律主体实施合规事项的法律义务。以上述专利侵权事项为例,实施专利侵权事项的法律主体的法律义务,可以体现为“发明和实用新型专利权被授予后,除本法另有规定的以外,任何单位或者个人未经专利权人许可,都不得实施其专利,即不得为生产经营目的制造、使用、许诺销售、销售、进口其专利产品,或者使用其专利方法以及使用、许诺销售、销售、进口依照该专利方法直接获得的产品”。
违规责任,用于表示法律主体违反法律义务时需要承担的法律责任。仍以上述专利侵权事项为例,当实施专利侵权事项的法律主体在违反上述法律义务时需要承担的法律责任,可以体现为“侵犯专利权的赔偿数额按照权利人因被侵权所受到的实际损失或者侵权人因侵权所获得的利益确定;权利人的损失或者侵权人获得的利益难以确定的,参照该专利许可使用费的倍数合理确定”。
合规路径,用于表示法律主体实施合规事项时的免责条件和/或免责程序。以上述专利侵权事项为例,专利侵权人在实施专利侵权事项时的免责事项和/或免责程序,可以体现为“专利产品或者依照专利方法直接获得的产品,由专利权人或者经其许可的单位、个人售出后,使用、许诺销售、销售、进口该产品的情形”。
违规案例,用于表示依据法律责任进行处罚的案例。也就是,司法机关或行政执法机构依据法律责任和/或合规义务进行裁决的案例。
另外,本申请实施例对于合规监管数据单元的表示形式可不具体限定。例如,结合上述多个维度的预定义数据元素,合规监管数据单元可以以合规事项为中心,具体可以表示为:合规事项=[合规事项的名称,管辖区域,合规主体,合规主体类型、合规行业类型、合规义务、合规路径、违规责任、违规案例]。
S12:基于合规监管数据单元构建用于合规事项监管的本体三元组。
本体三元组具体可以包括实体、实体的关系以及实体的属性信息。在本申请实施例中,对于本体三元组的表示形式,可不做具体限定,为了便于理解,下面以表1的形式进行说明。
表1
Figure 430905DEST_PATH_IMAGE001
结合表1所示,本体三元组中至少可以包括四类实体,分别是法律法规名称、法条及内容、合规事项名称以及裁决文书原文。并且,本体三元组中实体的属性信息可以作为另外一个实体,相应地,实体的关系,则是指二者之间的关系。如此,在后续分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果后,便可依据表1所体现的本体三元组定义,生成用于合规事项监管的知识图谱。另外,表1中作为合规事项名称的来源法条,用于表示定义该合规事项名称的法律依据;作为合规主体名称的关系的主体类型来源法条,用于表示定义该合规主题类型的法律依据。
S13:分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果。
在本申请实施例中,对于法律法规文本和裁决文书的知识抽取过程可不做具体限定。为了便于理解,下面可以分别提供一种可能的实施方式。
针对法律法规文本进行知识抽取的过程,在一种可能的实施方式中,其具体可以包括:建立法律法规文本库;法律法规文本库中保存有法律法规文本;从法律法规文本库中,抽取法律法规文本对应的多个法律特征数据;多个法律特征数据包括法律法规文本的法规名称、效力状态、颁布机构、颁布文号、颁布日期、实施日期、法律法规类型、效力范围、条款序号及文本内容;基于抽取出的多个法律特征数据,建立法律法规数据库,作为第一抽取结果。如此,通过对法律法规文本的法律特征数据进行抽取,首先可以得到法律法规文本的基础信息,也就是法律法规文本的法规名称、效力状态、颁布机构、颁布文号、颁布日期、实施日期、法律法规类型、效力范围、条款序号及文本内容,而作为知识图谱的一部分,从而便于得到完整、有效的知识图谱用以合规事项监管。
进一步地,从法律法规文本库中,抽取多个法律特征数据,具体可以包括:构建多个法律特征数据分别对应的第一参数配置库;多个法律特征数据分别对应的第一参数配置库中保存有多个法律特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及多个法律特征数据间的逻辑;利用多个法律特征数据分别对应的第一参数配置库,配置多个法律特征数据分别对应的第一抽取规则;根据多个法律特征数据分别对应的第一抽取规则,并结合相似性算法,从法律法规文本库中分别抽取多个法律特征数据。由于每一项法律特征数据的抽取规则均不相同,因此,在本申请实施例中,可以先为多个法律特征数据分别构建第一参数配置库,再利用第一参数配置库确定多个法律特征数据分别对应的第一抽取规则,进而进行法律特征数据的抽取,以准确完成知识抽取过程。
针对裁决文书进行知识抽取的过程,在一种可能的实施方式中,其具体可以包括:建立裁决文书库;裁决文书库中保存有裁决文书;从裁决文书库中,抽取裁决文书对应的多个裁决特征数据;多个裁决特征数据包括案件名称、裁决机构、涉案单位、裁决时间、裁决依据及裁决结果;基于抽取出的多个裁决特征数据,建立裁决案例数据库,作为第二抽取结果。如此,通过对裁决文书的裁决特征数据进行抽取,首先可以得到裁决文书的基础信息,也就是裁决文书的案件名称、裁决机构、涉案单位、裁决时间、裁决依据及裁决结果,而作为知识图谱的一部分,从而便于得到完整、有效的知识图谱用以合规事项监管。
进一步地,从裁决文书库中,抽取裁决文书对应的多个裁决特征数据,包括:确定多个裁决特征数据分别对应的第二参数配置库;第二参数配置库中保存有多个裁决特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及多个裁决特征数据间的逻辑;利用多个裁决特征数据分别对应的第二参数配置库,配置多个裁决特征数据分别对应的第二抽取规则;根据多个裁决特征数据分别对应的第二抽取规则,并结合相似性算法,从裁决文书库中抽取裁决特征数据。由于每一项裁决特征数据的抽取规则均不相同,因此,在本申请实施例中,可以先为多个裁决特征数据分别构建第二参数配置库,再利用第二参数配置库确定多个裁决特征数据分别对应的第二抽取规则,进而进行裁决特征数据的抽取,以准确完成知识抽取过程。
S14:基于抽取结果再次抽取,并依据本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。
在本申请实施例中,可以基于上述第一抽取结果和第二抽取结果进一步进行知识抽取,而得到用于构建知识图谱的三元组数据。具体来说,基于抽取结果再次抽取的过程,也就是S13,其具体可以包括:根据法律法规文本的条款顺序、合规事项命名规则、合规事项关联词典,并结合短文本主题抽取算法,从第一抽取结果中抽取合规事项;根据合规事项,从第一抽取结果中抽取管辖区域、合规主体、合规义务、违规责任以及合规路径;根据合规义务和违规责任,从裁决文书库中抽取违规案例;根据合规事项,从行业信息库中抽取合规行业类型,并根据合规事项和合规主体,从合规主体信息库中抽取合规主体类型;依据本体三元组,以合规事项、管辖区域、合规主体、合规义务、违规责任、合规路径、违规案例、合规行业类型以及合规主体类型生成三元组数据。如此,可以准确地抽取出合规事项、管辖区域、合规行业类型、合规主体、合规主体类型、合规义务、违规责任、合规路径,以及违规案例,便于后续结合本体三元组得到用于构建知识图谱的三元组数据,进而实现合规事项监管。
进一步地,根据合规事项,从第一抽取结果中抽取管辖区域、合规主体、合规义务、违规责任以及合规路径,具体可以包括:构建管辖区域、合规主体、合规义务、违规责任以及合规路径分别对应的第三参数配置库;利用管辖区域、合规主体、合规义务、违规责任以及合规路径分别对应的第三参数配置库,从第一抽取结果中抽取管辖区域、合规主体、合规义务、违规责任以及合规路径。由于管辖区域、合规主体、合规义务、违规责任以及合规路径的抽取规则均不相同,因此,在本申请实施例中,可以先为管辖区域、合规主体、合规义务、违规责任以及合规路径分别构建第三参数配置库,再利用第三参数配置库分别进行知识抽取,得到管辖区域、合规主体、合规义务、违规责任以及合规路径,以准确完成知识抽取过程。
在本申请实施例中,基于抽取结果再次抽取,并依据本体三元组生成三元组数据而构建出的知识图谱,可参见图2所示。图2为本申请实施例提供的一种用于合规监管的知识图谱的示意图。为了便于理解,作为示例性说明,图2仅示出一个法律法规文本中的一个合规事项。另外,在图2中,还可以将法律法规文本名称,分别与合规主体类型来源法条、合规义务的法条及内容、合规路径的法条及内容、违规责任的法条及内容、违规案例的裁决依据进行关联,以形成更为全面、完整的知识图谱。
结合上述S11-S14的相关内容可知,本申请实施例中,根据用于合规监管的预定义数据元素,构建合规监管数据单元之后,可以基于合规监管数据单元构建用于合规事项监管的本体三元组,并分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果,进而基于抽取结果再次抽取,并依据本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。如此,通过知识图谱数据的表示,可以组成合规事项、法律条款、案例相互关联的合规监管知识图谱,后续可快速查询合规监管数据,根据合规主体高效生成合规监管义务报告,依据知识图谱进行知识推理,从而将合规监管过程从传统的法律法规文本级转变为法律法规条款数据级,提升合规监管数据的获取效率和效果。
基于上述用于合规监管的知识图谱的构建方法的相关内容,本申请实施例还可以提供一种合规监管方法,下面分别结合实施例和附图,对该合规监管方法进行说明。
图3为本申请实施例提供的一种合规监管方法的流程图。结合图3所示,本申请实施例提供的合规监管方法,可以包括:
S31:获取用于合规事项监管的知识图谱。
该知识图谱由上述实施例中的任一用于合规监管的知识图谱的构建方法构建得到。其中,知识图谱的构建方式请参见上文S11-S14的相关内容。
S32:利用知识图谱进行合规事项监管。
在本申请实施例中,对于利用知识图谱进行合规事项监管的过程,本申请实施例可以提供多种可能的实施方式,下面举例说明。
在一种可能的实施方式中,可以利用知识图谱,为不同的合规主体提供不同的合规监管义务报告,以便于提升不同合规主体的合规监管效率和效果。具体来说,利用知识图谱进行合规事项监管的过程,也就是S32,其具体可以包括:获取目标终端提交的目标查询信息;基于知识图谱,并根据目标查询信息,生成合规监管义务报告。其中,目标查询信息包括合规主体类型和/或合规行业类型;合规主体类型用于表示实施合规事项的法律主体的类型;合规行业类型用于表示合规事项的适用行业的类型。合规监管义务报告包括合规事项、管辖区域、合规义务、违规责任、合规路径,以及违规案例中的一个或多个;合规事项用于表示受法律法规文本条款所约束的事项;管辖区域用于表示合规事项涉及的法律管辖区域;合规义务用于表示法律主体实施合规事项的法律义务;违规责任用于表示法律主体违反法律义务时需要承担的法律责任;合规路径用于表示法律主体实施合规事项时的免责条件和/或免责程序;违规案例用于表示依据法律责任和/或合规义务进行处罚的案例。
进一步地,随着立法工作不断推进,法律法规文本和/或裁决文书可能会随之发生变更。因此,在本申请实施例中,在法律法规文本和/或裁决文书发生变更时,可以基于变更后的法律法规文本和/或裁决文书更新知识图谱;基于更新后的知识图谱更新合规监管义务报告。如此,可以提供给合规主体更为有效、更合适的合规监管义务报告。
在另一种可能的实施方式中,可以利用知识图谱,提供合规事项查询服务,以便于不同对象,也就是不同合规主体获知不同合规事项的相关内容,提升合规监管效率和效果。具体来说,利用知识图谱进行合规事项监管的过程,也就是S32,其具体可以包括:响应于目标终端提交的待查询合规事项,确定知识图谱关联的多个合规事项与待查询合规事项之间的第一语义相似度;按照第一语义相似度从高到低的顺序,对多个合规事项进行排序,得到排序结果并发送至目标终端,以便目标终端从多个合规事项中择一作为目标合规事项;显示目标合规事项关联的图谱信息和/或目标合规事项关联的三元组数据。
在又一种可能的实施方式中,可以利用知识图谱,进行合规知识推理。具体来说,利用知识图谱进行合规事项监管的过程,也就是S32,其具体可以包括:响应于目标终端提交的知识图谱中的任一实体的名称、关系和/或属性信息,按照知识图谱进行知识推理,得到任一实体的名称、关系和/或属性信息关联的图谱节点。其中,图谱节点可以是宏观意义上的法律法规文本、裁决文书,也可以是微观意义上的法律法规条款、用于构建知识图谱的本体三元组。
需要说明的是,在本申请实施例中,目标终端具体例如为移动设备、电脑等,或其任意组合。在一些实施例中,移动设备例如可以包括手机、智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备等,或其任意组合。
结合上述S31-S32的相关内容可知,本申请实施例中,获取用于合规事项监管的知识图谱后,可快速查询合规监管数据,根据合规主体高效生成合规监管义务报告,依据知识图谱进行知识推理,从而提升合规监管数据的获取效率和效果。
基于上述实施例提供的用于合规监管的知识图谱的构建方法,本申请实施例还提供了一种用于合规监管的知识图谱的构建系统。下面分别结合实施例和附图,对该用于合规监管的知识图谱的构建系统进行描述。
图4为本申请实施例提供的一种用于合规监管的知识图谱的构建系统的结构示意图。结合图4所示,本申请实施例提供的用于合规监管的知识图谱的构建系统400,可以包括:
合规监管数据单元构建模块401,用于根据用于合规监管的预定义数据元素,构建合规监管数据单元;合规监管数据单元包括合规事项、管辖区域、合规行业类型、合规主体、合规主体类型、合规义务、违规责任、合规路径,以及违规案例;合规事项用于表示受法律法规文本条款所约束的事项;管辖区域用于表示合规事项涉及的法律管辖区域;合规行业类型用于表示合规事项的适用行业的类型;合规主体用于表示实施合规事项的法律主体;合规主体类型用于表示法律主体的类型;合规义务用于表示法律主体实施合规事项的法律义务;违规责任用于表示法律主体违反法律义务时需要承担的法律责任;合规路径用于表示法律主体实施合规事项时的免责条件和/或免责程序;违规案例用于表示依据法律责任和/或合规义务进行处罚的案例;
本体三元组构建模块402,用于基于合规监管数据单元构建用于合规事项监管的本体三元组;本体三元组包括实体、实体的关系以及实体的属性信息;
知识抽取模块403,用于分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果;
知识图谱构建模块404,用于基于抽取结果再次抽取,并依据本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。
作为一种实施方式,知识抽取模块403,具体可以包括:
法律法规文本库构建模块,用于建立法律法规文本库;法律法规文本库中保存有法律法规文本;
法律特征数据抽取模块,用于从法律法规文本库中,抽取法律法规文本对应的多个法律特征数据;多个法律特征数据包括法律法规文本的法规名称、效力状态、颁布机构、颁布文号、颁布日期、实施日期、法律法规类型、效力范围、条款序号及文本内容;
法律法规数据库构建模块,用于基于抽取出的多个法律特征数据,建立法律法规数据库,作为第一抽取结果。
作为一种实施方式,法律特征数据抽取模块,具体可以包括:
第一参数配置库构建模块,用于构建多个法律特征数据分别对应的第一参数配置库;多个法律特征数据分别对应的第一参数配置库中保存有多个法律特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及多个法律特征数据间的逻辑;
第一抽取规则确定模块,用于利用多个法律特征数据分别对应的第一参数配置库,配置多个法律特征数据分别对应的第一抽取规则;
法律特征数据抽取子模块,用于根据多个法律特征数据分别对应的第一抽取规则,并结合相似性算法,从法律法规文本库中分别抽取多个法律特征数据。
作为一种实施方式,知识抽取模块403,具体可以包括:
裁决文书库构建模块,用于建立裁决文书库;裁决文书库中保存有裁决文书;
裁决特征数据抽取模块,用于从裁决文书库中,抽取裁决文书对应的多个裁决特征数据;多个裁决特征数据包括案件名称、裁决机构、涉案单位、裁决时间、裁决依据及裁决结果;
裁决案例数据库模块,用于基于抽取出的多个裁决特征数据,建立裁决案例数据库,作为第二抽取结果。
作为一种实施方式,裁决特征数据抽取模块,具体可以包括:
第二参数配置库构建模块,用于确定多个裁决特征数据分别对应的第二参数配置库;第二参数配置库中保存有多个裁决特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及多个裁决特征数据间的逻辑;
第二抽取规则确定模块,用于利用多个裁决特征数据分别对应的第二参数配置库,配置多个裁决特征数据分别对应的第二抽取规则;
裁决特征数据抽取子模块,用于根据多个裁决特征数据分别对应的第二抽取规则,并结合相似性算法,从裁决文书库中抽取裁决特征数据。
作为一种实施方式,知识图谱构建404,具体可以包括:
第一抽取模块,用于根据法律法规文本的条款顺序、合规事项命名规则、合规事项关联词典,并结合短文本主题抽取算法,从第一抽取结果中抽取合规事项;
第二抽取模块,用于根据合规事项,从第一抽取结果中抽取管辖区域、合规主体、合规义务、违规责任以及合规路径;
第三抽取模块,用于根据合规义务和违规责任,从第二抽取结果中抽取违规案例;
第四抽取模块,用于根据合规事项,从行业信息库中抽取合规行业类型,并根据合规事项和合规主体,从合规主体信息库中抽取合规主体类型;
第五抽取模块,用于依据本体三元组,以合规事项、管辖区域、合规主体、合规义务、违规责任、合规路径、违规案例、合规行业类型以及合规主体类型生成三元组数据。
作为一种实施方式,第二抽取模块,具体可以包括:
第三参数配置库,用于构建管辖区域、合规主体、合规义务、违规责任以及合规路径分别对应的第三参数配置库;
第二抽取子模块,用于利用管辖区域、合规主体、合规义务、违规责任以及合规路径分别对应的第三参数配置库,从第一抽取结果中抽取管辖区域、合规主体、合规义务、违规责任以及合规路径。
作为一种实施方式,在合规监管过程中,为了存储不同阶段的不同数据,该用于合规监管的知识图谱的构建系统400,还可以包括:数据库模块。其中,数据库模块,用于构建文件数据库、关系数据库和图数据库。文件数据库用于存储法律法规文本和裁决文书;关系数据库用于存储抽取结果对应的结构化数据;图数据库用于存储知识图谱的实例数据。
作为一种实施方式,该用于合规监管的知识图谱的构建系统400,还可以包括:主体分类管理模块。该主体分类管理模块,用于对合规主体类型进行配置和管理。
作为一种实施方式,该用于合规监管的知识图谱的构建系统400,还可以包括:行业分类管理模块。该行业分类管理模块,用于对述合规行业类型进行配置和管理。
作为一种实施方式,该用于合规监管的知识图谱的构建系统400,还可以包括:数据统计展示模块。该数据统计展示模块,用于对实体、实体的关系以及实体的属性信息的统计数量进行展示。
基于上述实施例提供的合规监管方法,本申请实施例还提供了一种合规监管系统。下面分别结合实施例和附图,对该合规监管系统进行描述。
图5为本申请实施例提供的一种合规监管系统的结构示意图。结合图5所示,本申请实施例提供的合规监管系统500,可以包括:
知识图谱获取模块501,用于获取用于合规事项监管的知识图谱;知识图谱由上述任一用于合规监管的知识图谱的构建方法构建得到;
合规监管模块502,用于利用知识图谱进行合规事项监管。
作为一种实施方式,合规监管模块502,具体包括:
合规事项查询模块5021,用于响应于目标终端提交的待查询合规事项,确定知识图谱关联的多个合规事项与待查询合规事项之间的第一语义相似度;按照第一语义相似度从高到低的顺序,对多个合规事项进行排序,得到第一排序结果并发送至目标终端,以便目标终端从多个合规事项中择一作为目标合规事项;显示目标合规事项关联的图谱信息和/或目标合规事项关联的三元组数据。
作为一种实施方式,合规事项查询模块,具体还用于:响应于目标终端提交的知识图谱中的任一实体的名称、关系和/或属性信息,按照知识图谱进行知识推理,得到任一实体的名称、关系和/或属性信息关联的图谱节点。
作为一种实施方式,合规监管模块包括:
法律法规文本查询模块5022,用于响应于目标终端提交的待查询法律法规文本的名称,确定知识图谱关联的多个法律法规文本的名称与待查询法律法规文本的名称之间的第二语义相似度;按照第二语义相似度从高到低的顺序,对多个法律法规文本进行排序,得到第二排序结果并发送至目标终端,以便目标终端从多个法律法规文本中择一作为目标法律法规文本;显示目标法律法规文本,以及目标法律法规文本对应的至少一个合规事项。
在本申请实施例中,当目标终端选择目标法律法规文本之后,可以相应地展示出该目标法律法规文本全文,以及目标法律法规文本对应的至少一个合规事项。其中,合规事项可以采用列表、卡片等形式进行展示,这里不做具体限定。进一步地,目标终端还可以通过对目标法律法规文本所对应的合规事项进行选择,并在目标法律法规文本中采用特殊标记来显示选中的合规事项所对应的法条及内容。特殊标记,例如是高亮、与目标法律法规文本不同的颜色和/或与目标法律法规文本不同的字体等。
作为一种实施方式,合规监管模块502,具体可以包括:
合规监管义务报告模块5023,用于获取目标终端提交的第一查询信息;基于知识图谱,并根据第一查询信息,生成合规监管义务报告;第一查询信息包括第一合规主体类型和/或第一合规行业类型;第一合规主体类型用于表示实施第一合规事项的第一法律主体的类型;第一合规行业类型用于表示第一合规事项的适用行业的类型;合规监管义务报告包括第一合规事项、第一管辖区域、第一合规义务、第一违规责任、第一合规路径,以及第一违规案例中的一个或多个;第一合规事项用于表示受第一法律法规文本条款所约束的事项;第一管辖区域用于表示第一合规事项涉及的法律管辖区域;第一合规义务用于表示第一法律主体实施第一合规事项的第一法律义务;第一违规责任用于表示第一法律主体违反第一法律义务时需要承担的第一法律责任;第一合规路径用于表示第一法律主体实施第一合规事项时的第一免责条件和/或第一免责程序;第一违规案例用于表示依据第一法律责任和/或第一合规义务进行处罚的案例。
作为一种实施方式,合规监管模块502还可以包括:
合规监管义务报告更新模块5024,用于在第一法律法规文本和/或裁决文书发生变更时,基于变更后的第一法律法规文本和/或裁决文书更新知识图谱;基于更新后的知识图谱更新合规监管义务报告。
在本申请实施例中,更新后的合规监管义务报告的报告维度与更新前的保持一致。
作为一种实施方式,合规监管模块502具体可以包括:
执法检查报告模块5025,用于获取目标终端提交的第二查询信息;基于知识图谱,并根据第二查询信息,生成执法检查报告;第二查询信息包括第二法律法规文本的名称;执法检查报告包括第二法律法规文本对应的第二合规事项、第二合规义务、第二违规责任和第二合规路径中的一个或多个;第二合规事项用于表示受第二法律法规文本条款所约束的事项;第二合规义务用于表示第二法律主体实施第二合规事项的第二法律义务;第二违规责任用于表示第二法律主体违反第二法律义务时需要承担的第二法律责任;第二合规路径用于表示第二法律主体实施第二合规事项时的第二免责条件和/或第二免责程序。
作为一种实施方式,该合规监管系统500还可以包括:
信息管理模块503,用于对目标终端关联的用户信息、合规主体类型、合规行业类型、合规监管义务报告和/或执法检查报告的下载记录进行管理。
在本申请实施例中,目标终端关联的用户信息,例如是目标终端关联的用户的标识信息、密码信息、权限信息等。另外,对上述信息进行管理的方式包括对信息进行记录和编辑。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (25)

1.一种用于合规监管的知识图谱的构建方法,其特征在于,包括:
根据用于合规监管的预定义数据元素,构建合规监管数据单元;所述合规监管数据单元包括合规事项、管辖区域、合规行业类型、合规主体、合规主体类型、合规义务、违规责任、合规路径,以及违规案例;所述合规事项用于表示受法律法规文本条款所约束的事项;所述管辖区域用于表示所述合规事项涉及的法律管辖区域;所述合规行业类型用于表示所述合规事项的适用行业的类型;所述合规主体用于表示实施所述合规事项的法律主体;所述合规主体类型用于表示所述法律主体的类型;所述合规义务用于表示所述法律主体实施所述合规事项的法律义务;所述违规责任用于表示所述法律主体违反所述法律义务时需要承担的法律责任;所述合规路径用于表示所述法律主体实施所述合规事项时的免责条件和/或免责程序;所述违规案例用于表示依据所述法律责任和/或所述合规义务进行处罚的案例;
基于所述合规监管数据单元构建用于合规事项监管的本体三元组;所述本体三元组包括实体、所述实体的关系以及所述实体的属性信息;
分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果;
基于所述抽取结果再次抽取,并依据所述本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。
2.根据权利要求1所述的方法,其特征在于,对法律法规文本进行知识抽取,得到抽取结果,包括:
建立法律法规文本库;所述法律法规文本库中保存有所述法律法规文本;
从所述法律法规文本库中,抽取所述法律法规文本对应的多个法律特征数据;所述多个法律特征数据包括所述法律法规文本的法规名称、效力状态、颁布机构、颁布文号、颁布日期、实施日期、法律法规类型、效力范围、条款序号及文本内容;
基于抽取出的所述多个法律特征数据,建立法律法规数据库,作为第一抽取结果。
3.根据权利要求2所述的方法,其特征在于,所述从所述法律法规文本库中,抽取所述法律法规文本对应的多个法律特征数据,包括:
构建所述多个法律特征数据分别对应的第一参数配置库;所述多个法律特征数据分别对应的第一参数配置库中保存有所述多个法律特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及所述多个法律特征数据间的逻辑;
利用所述多个法律特征数据分别对应的第一参数配置库,配置所述多个法律特征数据分别对应的第一抽取规则;
根据所述多个法律特征数据分别对应的第一抽取规则,并结合相似性算法,从所述法律法规文本库中分别抽取所述多个法律特征数据。
4.根据权利要求2所述的方法,其特征在于,对裁决文书进行知识抽取,得到抽取结果,包括:
建立裁决文书库;所述裁决文书库中保存有所述裁决文书;
从所述裁决文书库中,抽取所述裁决文书对应的多个裁决特征数据;所述多个裁决特征数据包括案件名称、裁决机构、涉案单位、裁决时间、裁决依据及裁决结果;
基于抽取出的所述多个裁决特征数据,建立裁决案例数据库,作为第二抽取结果。
5.根据权利要求4所述的方法,其特征在于,所述从所述裁决文书库中,抽取所述裁决文书对应的多个裁决特征数据,包括:
确定所述多个裁决特征数据分别对应的第二参数配置库;所述第二参数配置库中保存有所述多个裁决特征数据分别关联的位置特征、格式特征、前后词缀特征、标点符号特征、关联词典以及所述多个裁决特征数据间的逻辑;
利用所述多个裁决特征数据分别对应的第二参数配置库,配置所述多个裁决特征数据分别对应的第二抽取规则;
根据所述多个裁决特征数据分别对应的第二抽取规则,并结合相似性算法,从所述裁决文书库中抽取所述裁决特征数据。
6.根据权利要求4所述的方法,其特征在于,所述基于所述抽取结果再次抽取,并依据所述本体三元组生成三元组数据,包括:
根据所述法律法规文本的条款顺序、合规事项命名规则、合规事项关联词典,并结合短文本主题抽取算法,从所述第一抽取结果中抽取所述合规事项;
根据所述合规事项,从所述第一抽取结果中抽取所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径;
根据所述合规义务和所述违规责任,从所述第二抽取结果中抽取所述违规案例;
根据所述合规事项,从行业信息库中抽取所述合规行业类型,并根据所述合规事项和所述合规主体,从合规主体信息库中抽取所述合规主体类型;
依据所述本体三元组,以所述合规事项、所述管辖区域、所述合规主体、所述合规义务、所述违规责任、所述合规路径、所述违规案例、所述合规行业类型以及所述合规主体类型生成所述三元组数据。
7.根据权利要求6所述的方法,其特征在于,所述根据所述合规事项,从所述第一抽取结果中抽取所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径,包括:
构建所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径分别对应的第三参数配置库;
利用所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径分别对应的第三参数配置库,从所述第一抽取结果中抽取所述管辖区域、所述合规主体、所述合规义务、所述违规责任以及所述合规路径。
8.一种合规监管方法,其特征在于,包括:
获取用于合规事项监管的知识图谱;所述知识图谱由权利要求1至7任一项所述的方法构建得到;
利用所述知识图谱进行合规事项监管。
9.根据权利要求8所述的方法,其特征在于,所述利用所述知识图谱进行合规事项监管,包括:
获取目标终端提交的目标查询信息;所述目标查询信息包括合规主体类型和/或所述合规行业类型;所述合规主体类型用于表示实施合规事项的法律主体的类型;所述合规行业类型用于表示所述合规事项的适用行业的类型;
基于所述知识图谱,并根据所述目标查询信息,生成合规监管义务报告;所述合规监管义务报告包括所述合规事项、管辖区域、合规义务、违规责任、合规路径,以及违规案例中的一个或多个;所述合规事项用于表示受法律法规文本条款所约束的事项;所述管辖区域用于表示所述合规事项涉及的法律管辖区域;所述合规义务用于表示所述法律主体实施所述合规事项的法律义务;所述违规责任用于表示所述法律主体违反所述法律义务时需要承担的法律责任;所述合规路径用于表示所述法律主体实施所述合规事项时的免责条件和/或免责程序;所述违规案例用于表示依据所述法律责任和/或所述合规义务进行处罚的案例。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在法律法规文本和/或裁决文书发生变更时,基于变更后的法律法规文本和/或裁决文书更新所述知识图谱;
基于更新后的知识图谱更新所述合规监管义务报告。
11.根据权利要求8所述的方法,其特征在于,所述利用所述知识图谱进行合规事项监管,包括:
响应于目标终端提交的待查询合规事项,确定所述知识图谱关联的多个合规事项与所述待查询合规事项之间的第一语义相似度;
按照所述第一语义相似度从高到低的顺序,对所述多个合规事项进行排序,得到排序结果并发送至所述目标终端,以便所述目标终端从所述多个合规事项中择一作为目标合规事项;
显示所述目标合规事项关联的图谱信息和/或所述目标合规事项关联的三元组数据。
12.根据权利要求8所述的方法,其特征在于,所述利用所述知识图谱进行合规事项监管,包括:
响应于目标终端提交的所述知识图谱中的任一实体的名称、关系和/或属性信息,按照所述知识图谱进行知识推理,得到所述任一实体的名称、关系和/或属性信息关联的图谱节点。
13.一种用于合规监管的知识图谱的构建系统,其特征在于,包括:
合规监管数据单元构建模块,用于根据用于合规监管的预定义数据元素,构建合规监管数据单元;所述合规监管数据单元包括合规事项、管辖区域、合规行业类型、合规主体、合规主体类型、合规义务、违规责任、合规路径,以及违规案例;所述合规事项用于表示受法律法规文本条款所约束的事项;所述管辖区域用于表示所述合规事项涉及的法律管辖区域;所述合规行业类型用于表示所述合规事项的适用行业的类型;所述合规主体用于表示实施所述合规事项的法律主体;所述合规主体类型用于表示所述法律主体的类型;所述合规义务用于表示所述法律主体实施所述合规事项的法律义务;所述违规责任用于表示所述法律主体违反所述法律义务时需要承担的法律责任;所述合规路径用于表示所述法律主体实施所述合规事项时的免责条件和/或免责程序;所述违规案例用于表示依据所述法律责任和/或所述合规义务进行处罚的案例;
本体三元组构建模块,用于基于所述合规监管数据单元构建用于合规事项监管的本体三元组;所述本体三元组包括实体、所述实体的关系以及所述实体的属性信息;
知识抽取模块,用于分别对法律法规文本和裁决文书进行知识抽取,得到抽取结果;
知识图谱构建模块,用于基于所述抽取结果再次抽取,并依据所述本体三元组生成三元组数据,构建用于合规事项监管的知识图谱。
14.根据权利要求13所述的系统,其特征在于,所述系统还包括:数据库模块;
所述数据库模块,用于构建文件数据库、关系数据库和图数据库;
其中,所述文件数据库用于存储所述法律法规文本和所述裁决文书;所述关系数据库用于存储所述抽取结果对应的结构化数据;所述图数据库用于存储所述知识图谱的实例数据。
15.根据权利要求13所述的系统,其特征在于,所述系统还包括:
主体分类管理模块,用于对所述合规主体类型进行配置和管理。
16.根据权利要求13所述的系统,其特征在于,所述系统还包括:
行业分类管理模块,用于对所述合规行业类型进行配置和管理。
17.根据权利要求13所述的系统,其特征在于,所述系统还包括:
数据统计展示模块,用于对所述实体、所述实体的关系以及所述实体的属性信息的统计数量进行展示。
18.一种合规监管系统,其特征在于,包括:
知识图谱获取模块,用于获取用于合规事项监管的知识图谱;所述知识图谱由权利要求1至7任一项所述的方法构建得到;
合规监管模块,用于利用所述知识图谱进行合规事项监管。
19.根据权利要求18所述的系统,其特征在于,所述合规监管模块包括:
合规事项查询模块,用于响应于目标终端提交的待查询合规事项,确定所述知识图谱关联的多个合规事项与所述待查询合规事项之间的第一语义相似度;按照所述第一语义相似度从高到低的顺序,对所述多个合规事项进行排序,得到第一排序结果并发送至所述目标终端,以便所述目标终端从所述多个合规事项中择一作为目标合规事项;显示所述目标合规事项关联的图谱信息和/或所述目标合规事项关联的三元组数据。
20.根据权利要求19所述的系统,其特征在于,所述合规事项查询模块,还用于:
响应于目标终端提交的所述知识图谱中的任一实体的名称、关系和/或属性信息,按照所述知识图谱进行知识推理,得到所述任一实体的名称、关系和/或属性信息关联的图谱节点。
21.根据权利要求18所述的系统,其特征在于,所述合规监管模块包括:
法律法规文本查询模块,用于响应于目标终端提交的待查询法律法规文本的名称,确定所述知识图谱关联的多个法律法规文本的名称与所述待查询法律法规文本的名称之间的第二语义相似度;按照所述第二语义相似度从高到低的顺序,对所述多个法律法规文本的名称进行排序,得到第二排序结果并发送至所述目标终端,以便所述目标终端从所述多个法律法规文本中择一作为目标法律法规文本;显示所述目标法律法规文本,以及所述目标法律法规文本对应的至少一个合规事项。
22.根据权利要求18所述的系统,其特征在于,所述合规监管模块包括:
合规监管义务报告模块,用于获取目标终端提交的第一查询信息;基于所述知识图谱,并根据所述第一查询信息,生成合规监管义务报告;所述第一查询信息包括第一合规主体类型和/或第一合规行业类型;所述第一合规主体类型用于表示实施第一合规事项的第一法律主体的类型;所述第一合规行业类型用于表示所述第一合规事项的适用行业的类型;所述合规监管义务报告包括所述第一合规事项、第一管辖区域、第一合规义务、第一违规责任、第一合规路径,以及第一违规案例中的一个或多个;所述第一合规事项用于表示受第一法律法规文本条款所约束的事项;所述第一管辖区域用于表示所述第一合规事项涉及的法律管辖区域;所述第一合规义务用于表示所述第一法律主体实施所述第一合规事项的第一法律义务;所述第一违规责任用于表示所述第一法律主体违反所述第一法律义务时需要承担的第一法律责任;所述第一合规路径用于表示所述第一法律主体实施所述第一合规事项时的第一免责条件和/或第一免责程序;所述第一违规案例用于表示依据所述第一法律责任和/或所述第一合规义务进行处罚的案例。
23.根据权利要求22所述的系统,其特征在于,所述合规监管模块还包括:
合规监管义务报告更新模块,用于在所述第一法律法规文本和/或裁决文书发生变更时,基于变更后的第一法律法规文本和/或裁决文书更新所述知识图谱;基于更新后的知识图谱更新所述合规监管义务报告。
24.根据权利要求22所述的系统,其特征在于,所述合规监管模块包括:
执法检查报告模块,用于获取目标终端提交的第二查询信息;基于所述知识图谱,并根据所述第二查询信息,生成执法检查报告;所述第二查询信息包括第二法律法规文本的名称;所述执法检查报告包括所述第二法律法规文本对应的第二合规事项、第二合规义务、第二违规责任和第二合规路径中的一个或多个;所述第二合规事项用于表示受所述第二法律法规文本条款所约束的事项;所述第二合规义务用于表示第二法律主体实施所述第二合规事项的第二法律义务;所述第二违规责任用于表示所述第二法律主体违反所述第二法律义务时需要承担的第二法律责任;所述第二合规路径用于表示所述第二法律主体实施所述第二合规事项时的第二免责条件和/或第二免责程序。
25.根据权利要求18所述的系统,其特征在于,还包括:
信息管理模块,用于对目标终端关联的用户信息、合规主体类型、合规行业类型、合规监管义务报告和/或执法检查报告的下载记录进行管理。
CN202211121643.2A 2022-09-15 2022-09-15 用于合规监管的知识图谱的构建方法、相关方法和系统 Active CN115203439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211121643.2A CN115203439B (zh) 2022-09-15 2022-09-15 用于合规监管的知识图谱的构建方法、相关方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211121643.2A CN115203439B (zh) 2022-09-15 2022-09-15 用于合规监管的知识图谱的构建方法、相关方法和系统

Publications (2)

Publication Number Publication Date
CN115203439A true CN115203439A (zh) 2022-10-18
CN115203439B CN115203439B (zh) 2022-11-29

Family

ID=83573513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211121643.2A Active CN115203439B (zh) 2022-09-15 2022-09-15 用于合规监管的知识图谱的构建方法、相关方法和系统

Country Status (1)

Country Link
CN (1) CN115203439B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908671B (zh) * 2017-10-25 2022-02-01 南京擎盾信息科技有限公司 基于法律数据的知识图谱构建方法及系统
EP3862960A1 (en) * 2020-02-04 2021-08-11 1nteger, LLC Systems and methods for investigating and evaluating financial crime and sanctions-related risks
CN111782773B (zh) * 2020-08-20 2024-03-22 支付宝(杭州)信息技术有限公司 基于级连模式的文本匹配方法及装置
CN113239130A (zh) * 2021-06-18 2021-08-10 广东博维创远科技有限公司 一种基于刑事司法文书的知识图谱的构建方法、装置和电子设备、存储介质
CN113554172A (zh) * 2021-07-28 2021-10-26 北京法意科技有限公司 基于案例文本的裁判规则知识抽取方法及系统

Also Published As

Publication number Publication date
CN115203439B (zh) 2022-11-29

Similar Documents

Publication Publication Date Title
Batini et al. Data and information quality
Karr et al. Data quality: A statistical perspective
CN112699175A (zh) 一种数据治理系统及其方法
CN105868373B (zh) 电力业务信息系统关键数据处理方法及装置
CN110597870A (zh) 一种企业关系挖掘方法
Furner Definitions of “metadata”: A brief survey of international standards
CN110162754B (zh) 一种岗位描述文档的生成方法及设备
CN112182246A (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
CN110727852A (zh) 一种推送招聘推荐服务的方法、装置及终端
CN106528828A (zh) 一种基于多维度校验规则的数据质量检测方法
CN113592680A (zh) 基于区域级教育大数据的服务平台
Seah et al. Design and implementation of data warehouse with data model using survey-based services data
CN108108477B (zh) 一种联动的kpi系统及权限管理系统
Kim et al. p‐Functional Clusters Location Problem for Detecting Spatial Clusters with Covering Approach
Shan et al. Identifying city shrinkage in population and city activity in the middle reaches of the Yangtze River, China
Tao et al. Towards a politics of disaster response: Presidential disaster instructions in China, 1998–2012
Shi et al. Can big data improve public policy analysis?
CN110222180A (zh) 一种文本数据分类与信息挖掘方法
Sostero et al. The professional lens: What online job advertisements can say about occupational task profiles
CN115203439B (zh) 用于合规监管的知识图谱的构建方法、相关方法和系统
US20050071259A1 (en) System and apparatus for managing information on chemical substances used in product
Rother et al. Taking Care of History: Toward a Politics of Provenance Linked Open Data in Museums
Carrillo-Brenes et al. A proposal for semantic integration of crime data in Mexico City
Presser et al. A scope classification of data quality requirements for food composition data
Yu et al. Construction of hierarchical cognitive academic map

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 401-1, Gate 6, Building F, Haitai Green Industry Base, No. 6 Haitai Development Sixth Road, Huayuan Industrial Zone, Tianjin Binhai High tech Zone, 300384

Patentee after: TIANJIN DAORIGIN TECHNOLOGY Co.,Ltd.

Address before: Room 401, Gate 6, Block K1, Haitai Green Industry Base, No. 6, Haitai Development Road 6, Huayuan Industrial Zone, Binhai New Area, Tianjin, 300384

Patentee before: TIANJIN DAORIGIN TECHNOLOGY Co.,Ltd.