CN115269879B - 知识结构数据的生成方法、数据搜索方法和风险告警方法 - Google Patents

知识结构数据的生成方法、数据搜索方法和风险告警方法 Download PDF

Info

Publication number
CN115269879B
CN115269879B CN202211081413.8A CN202211081413A CN115269879B CN 115269879 B CN115269879 B CN 115269879B CN 202211081413 A CN202211081413 A CN 202211081413A CN 115269879 B CN115269879 B CN 115269879B
Authority
CN
China
Prior art keywords
data
behavior evaluation
behavior
target
basis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211081413.8A
Other languages
English (en)
Other versions
CN115269879A (zh
Inventor
魏承东
王金兰
孙赞美
付波
王妤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202211081413.8A priority Critical patent/CN115269879B/zh
Publication of CN115269879A publication Critical patent/CN115269879A/zh
Application granted granted Critical
Publication of CN115269879B publication Critical patent/CN115269879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种知识结构数据的生成方法、数据搜索方法和风险告警方法,涉及人工智能领域,具体为知识图谱、自然语言处理、深度学习、智能推荐等技术领域,可应用于金融监管场景。知识结构数据的生成方法包括:获取行为评价依据数据和行为评价案例数据;处理行为评价依据数据和行为评价案例数据,得到目标数据,其中,目标数据包括行为数据、与行为数据相关联的对象数据以及行为评价结果;基于目标数据,生成知识结构数据,其中,知识结构数据表征了行为评价依据数据、行为评价案例数据和对象数据之间的关联关系,关联关系与行为数据和行为评价结果相关联。

Description

知识结构数据的生成方法、数据搜索方法和风险告警方法
技术领域
本公开涉及人工智能领域,具体为知识图谱、自然语言处理、深度学习、智能推荐等技术领域,可应用于金融监管场景。
背景技术
企业内部的生产经营过程中执行的行为必须合法合规,因此企业需要依据最新的规定进行生产经营活动。但是,企业在获取相关的规定时,成本较高、效率较低,从而影响企业的生产经营活动。
发明内容
本公开提供了一种知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法、装置、电子设备、存储介质以及程序产品。
根据本公开的一方面,提供了一种知识结构数据的生成方法,包括:获取行为评价依据数据和行为评价案例数据;处理所述行为评价依据数据和所述行为评价案例数据,得到目标数据,其中,所述目标数据包括行为数据、与所述行为数据相关联的对象数据以及行为评价结果;基于所述目标数据,生成知识结构数据,其中,所述知识结构数据表征了所述行为评价依据数据、所述行为评价案例数据和所述对象数据之间的关联关系,所述关联关系与所述行为数据和所述行为评价结果相关联。
根据本公开的另一方面,提供了一种数据搜索方法,包括:基于搜索条件,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个确定搜索结果;输出所述搜索结果,其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是根据如上所述的知识结构数据的生成方法生成的。
根据本公开的另一方面,提供了一种风险告警方法,包括:基于风险评价指标,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个,确定与所述风险评价指标相关联的风险评价值;基于所述风险评价值,进行风险告警,其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是如上所述的知识结构数据的生成方法生成的。
根据本公开的另一方面,提供了一种基于金融数据的知识图谱构建方法,包括:利用如上所述的知识结构数据的生成方法构建与金融数据相关联的知识结构数据;基于所述知识结构数据,得到知识图谱。
根据本公开的另一方面,提供了一种知识结构数据的生成装置,包括:获取模块、处理模块以及生成模块。获取模块,用于获取行为评价依据数据和行为评价案例数据;处理模块,用于处理所述行为评价依据数据和所述行为评价案例数据,得到目标数据,其中,所述目标数据包括行为数据、与所述行为数据相关联的对象数据以及行为评价结果;生成模块,用于基于所述目标数据,生成知识结构数据,其中,所述知识结构数据表征了所述行为评价依据数据、所述行为评价案例数据和所述对象数据之间的关联关系,所述关联关系与所述行为数据和所述行为评价结果相关联。
根据本公开的另一方面,提供了一种数据搜索装置,包括:确定模块和输出模块。确定模块,用于基于搜索条件,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个确定搜索结果;输出模块,用于输出所述搜索结果,其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是根据如上所述的知识结构数据的生成装置生成的。
根据本公开的另一方面,提供了一种风险告警装置,包括:确定模块和告警模块。确定模块,用于基于风险评价指标,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个,确定与所述风险评价指标相关联的风险评价值;告警模块,用于基于所述风险评价值,进行风险告警,其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是根据如上所述的知识结构数据的生成装置生成的。
根据本公开的另一方面,提供了一种基于金融数据的知识图谱构建装置,包括:构建模块和获得模块。构建模块,用于利用如上所述的知识结构数据的生成装置构建与金融数据相关联的知识结构数据;获得模块,用于基于所述知识结构数据,得到知识图谱。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的知识结构数据的生成方法、数据搜索方法、风险告警方法和基于金融数据的知识图谱构建方法中的任意一个或多个。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述的知识结构数据的生成方法、数据搜索方法、风险告警方法和基于金融数据的知识图谱构建方法中的任意一个或多个。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述的知识结构数据的生成方法的步骤、数据搜索方法的步骤、风险告警方法的步骤和基于金融数据的知识图谱构建方法的步骤中的任意一个或多个。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开一实施例的知识结构数据的生成方法的流程图;
图2示意性示出了根据本公开一实施例的知识图谱的示意图;
图3A示意性示出了根据本公开一实施例的系统原理图;
图3B示意性示出了根据本公开一实施例的结构化抽取方法的示意图;
图3C示意性示出了根据本公开另一实施例的结构化抽取方法的示意图;
图3D示意性示出了根据本公开另一实施例的知识图谱的示意图;
图4示意性示出了根据本公开一实施例的数据搜索方法的流程图;
图5示意性示出了根据本公开一实施例的数据搜索方法的示意图;
图6示意性示出了根据本公开一实施例的风险告警方法的流程图;
图7示意性示出了根据本公开一实施例的风险方法的示意图;
图8示意性示出了根据本公开一实施例的基于金融数据的知识图谱构建方法的流程图;
图9示意性示出了根据本公开一实施例的知识结构数据的生成装置的框图;
图10示意性示出了根据本公开一实施例的数据搜索装置的框图;
图11示意性示出了根据本公开一实施例的风险告警装置的框图;
图12示意性示出了根据本公开一实施例的基于金融数据的知识图谱构建装置的框图;以及
图13是用来实现本公开实施例的用于执行知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
金融监管是指金融监管机构依据相关的金融规定对金融企业和金融业务实施的监督管理,使得金融机构的经营活动与金融规定相一致。因此,对于金融企业内部已经发生或者将要发生的生产经营活动,需要根据相关的金融规定来评价生产经营活动是否合法合规以便及时调整生产经营活动,使得生产经营活动符合金融规定。
在评价生产经营活动是否符合金融规定时,需要采集相关的金融法律法规、内外制度、处罚案例等文件作为参考依据,需要采集的文件规模庞大,采集成本很高。
在得到文件格式多样的法律、法规、内外制度、处罚案例文件后,需要梳理清楚文件之间的引用关系,不仅需要耗费大量的人力成本并且容易出错。
在一些场景下,可以通过公开的网站查询相应的文件,例如查询法律法规、处罚案例等文件。公开的网站通常以saas服务方式提供查询服务,但是公开的网站没有做到将金融场景和监管业务场景适配,也不能进行私有化场景部署,导致无法整合企业的内部法规制度文件,使用局限性较大。
另外,金融企业在生产经营过程中可以产生大量合规经验知识,但是合规经验知识难以有效积累,使得金融企业的合规管理的智能化程度低。
通常情况下,金融监管机构发布的法律、法规、制度、处罚案例等文件需要监管业务合规人员进行解读分类,并落实到企业不同业务部门中,细化到不同业务场景中。由此可见,企业的生产经营过程中合规判定需要依赖大量人工经验,难以形成统一的规范和经验知识。
有鉴于此,本公开的实施例提供了一种智能化的知识结构数据的生成方法,生成的知识结构数据能够为企业的生产经营活动提供合规性参考。
可以理解,本公开的实施例不仅可以应用于金融监管场景,还可以应用于其他领域的监管场景。本公开以金融监管场景为例进行说明。
图1示意性示出了根据本公开一实施例的知识结构数据的生成方法的流程图。
如图1所示,本公开实施例的知识结构数据的生成方法100例如可以包括操作S110~操作S130。
在操作S110,获取行为评价依据数据和行为评价案例数据。
在操作S120,处理行为评价依据数据和行为评价案例数据,得到目标数据,目标数据包括行为数据、与行为数据相关联的对象数据以及行为评价结果。
在操作S130,基于目标数据,生成知识结构数据。
示例性地,行为评价依据数据和行为评价案例数据例如为金融数据。行为评价依据数据和行为评价案例数据例如为金融监管机构发布的数据。
例如,行为评价依据数据(以下简称为行为评价依据)包括法律、法规、制度等等,法律、法规、制度用于评价金融企业生产经营活动中的行为是否合法合规。
例如,行为评价案例数据(以下简称为行为评价案例)例如包括处罚案例,处罚案例例如是金融监管机构对某些金融企业生产经营过程中违规行为进行处罚的案例。
在获得行为评价依据和行为评价案例之后,可以处理行为评价依据和行为评价案例,得到目标数据。目标数据包括行为数据、作出行为的对象的对象数据以及行为评价结果,对象数据例如包括对象的标识、对象所属的地区等等。
接下来,可以基于目标数据生成知识结构数据,该知识结构数据表征了行为评价依据、行为评价案例和对象数据之间的关联关系,关联关系与行为数据和行为评价结果相关联。
根据本公开的实施例,通过获取行为评价依据和行为评价案例,并对行为评价依据和行为评价案例进行处理得到目标数据,基于目标数据生成知识结构数据,提高了生成知识结构数据的智能化、自动化,降低了知识结构数据的生成成本,提高了生成效率。另外,知识结构数据能够为金融企业的行为提供参考,从而提高金融企业的监管智能化和降低监管成本。
在本公开的另一示例中,可以通过爬虫技术获取行为评价依据和行为评价案例。
例如,利用爬虫技术采集网页数据,并基于网页数据得到行为评价依据和行为评价案例。爬虫技术例如通过爬虫开源调度平台来实现。例如,可以设置采集时刻,并在采集时刻自动触发爬虫技术采集网页数据,并自动处理网页数据得到行为评价依据和行为评价案例进行存储,实现自动化数据采集。
例如,网页数据包括网页内容和网页附件,网页内容例如包括html格式内容,网页附件的格式例如包括pdf、doc、docx、excel、wps等等。将爬取的网页内容存储到MongoDB数据库中,将网页附件存储到MinIO中。MongoDB是一个开源的跨平台开源NoSQL数据库,MinIO是一种开源的对象存储服务器,兼容S3协议。
爬虫开源调度平台例如包括分布式爬虫调度平台Crawlab,分布式爬虫调度平台支持爬虫管理、日志管理、任务调度、对用于爬取数据的计算机节点进行监控等等功能。
由于网页内容包括html格式内容,因此可以利用第一解析方式对网页内容进行标准化处理,得到第一目标格式数据,第一目标格式数据例如为表格数据或文本数据。第一解析方式例如包括BeautifulSoup方式,BeautifulSoup方式可以从html格式内容中提取所需的数据。
由于网页附件的格式为pdf、doc、docx、excel、wps等等,因此可以利用第二解析方式对网页附件进行标准化处理,得到第二目标格式数据,第二目标格式数据例如为表格数据或文本数据。第二解析方式例如用于解析网页附件中的内容并生成表格数据或文本数据,第二解析方式例如包括pandas数据分析工具。
第一解析方式和第二解析方式例如均是数据格式的统一方式。
在得到第一目标格式数据和第二目标格式数据之后,可以将第一目标格式数据和第二目标格式数据确定为行为评价依据和行为评价案例。
根据本公开的实施例,通过爬虫技术自动化采集网页数据,并通过不同的解析方式对网页数据进行解析和格式统一,使得得到的行为评价依据和行为评价案例具有统一格式,便于后续进对行为评价依据和行为评价案例进行结构化解析。
根据本公开的实施例,可以通过结构化解析技术对行为评价依据和行为评价案例进行抽取,得到目标数据。
在一示例中,可以从行为评价依据和行为评价案例中抽取目标字段,将目标字段作为目标数据。该目标字段本身例如属于行为评价依据或行为评价案例中的内容。
在另一示例中,可以利用自然语言处理模型、深度学习模型中的至少一个,对行为评价依据和行为评价案例进行语义理解,得到目标数据。例如,行为评价依据或行为评价案例本身的内容不存在一些字段,因此可以通过自然语言处理模型、深度学习模型进行语义理解,从而总结得到一些字段作为目标数据。
示例性地,目标字段例如包括标题和标题对应的结果。以行为评价案例为例,标题例如包括处罚依据、条文依据、被处罚对象等等。处罚依据对应的结果例如为具体的法律,条文依据对应的结果例如为具体的条文,被处罚对象对应的结果例如为具体的企业或个人。
在本公开的另一示例中,知识结构数据例如包括知识图谱,可以基于目标数据构建知识图谱。
例如,目标数据包括对象数据、行为数据、行为评价结果。
对象数据例如包括以下至少一项:被评价对象数据、发布行为评价依据和行为评价案例的机构数据。被评价对象数据例如包括对象名称,机构数据例如包括机构名称,机构包括金融监管机构。
行为数据例如包括以下至少一项:与被评价对象数据相关联的被评价行为数据、对行为评价依据和行为评价案例的发布行为、与行为评价依据相关联的变更行为。与被评价对象数据相关联的被评价行为数据例如包括违反法律法规的行为;发布行为例如为金融监管机构发布法律法规的发布行为;与行为评价依据相关联的变更行为例如包括以某一法律法规作为依据对另一法律法规的版本进行变更的行为。
行为评价结果例如包括:基于行为评价依据对被评价行为数据进行评价得到的结果,评价结果表征了被评价行为违法了某一具体的法律法规。
示例性地,知识图谱包括节点数据和节点数据之间的边数据。节点之间通过边进行连接。
节点数据例如包括:行为评价依据、行为评价案例和对象数据。
边数据包括例如包括:行为数据、行为评价结果。边数据还可以包括:机构数据对应的机构的隶属关系数据、被评价对象数据与行为评价案例之间关系数据、行为评价依据和行为评价案例之间的关系数据。其中,隶属关系数据表征了任意两个金融监管机构之间的隶属关系;被评价对象数据与行为评价案例之间关系数据例如表征该行为评价案例是针对该被评价对象数据做出的,例如某个处罚案例是对某个对象做出的处罚;行为评价依据和行为评价案例之间的关系数据例如表征根据某个行为评价依据(法律法规)做出某个行为评价案例。
图2示意性示出了根据本公开一实施例的知识图谱的示意图。
如图2所示,知识图谱的节点例如包括当前行为评价案例节点、与当前行为评价案例相关的相关行为评价案例节点、行为评价依据节点、被评价对象节点。被评价对象例如包括企业或个人。
行为评价依据节点和当前行为评价案例节点之间的边数据例如表征了当前行为评价案例是基于行为评价依据做出的。当前行为评价案例节点和相关行为评价案例节点之间的边数据表征了两者存在联系,例如两者的被评价对象一致,或者两者的行为评价依据一致。当前行为评价案例节点(或相关行为评价案例节点)和对象节点之间的边数据表征了该评价案例是针对该对象做出的。企业对象节点和个人对象节点之间的边数据例如表征了个人是否为企业的法人。
根据本公开的实施例,基于行为数据、与行为数据相关联的对象数据以及行为评价结果生成知识图谱,使得金融企业能够根据知识图谱得知法律法规、评价案例、被评价对象之间的联系,金融企业能够以知识图谱作为依据来监管生产经营过程中的行为,使得行为合法合规,从而提高金融企业的监管效果。
下面结合图3A~3D对本公开一个实施例的结构化解析、知识图谱的构建以及知识图谱的应用的整体架构进行说明。
图3A示意性示出了根据本公开一实施例的系统原理图。
如图3A所示,本公开实施例的系统例如包括组件层、数据层和服务层。
组件层中主要提供了各种技术,例如包括爬虫技术、数据库技术、数据解析技术、结构化抽取技术等等。
数据层中主要用于执行数据采集、数据处理和知识图谱生成。例如,通过爬虫技术爬取网页数据,得到网页内容和网页附件。利用数据解析技术对网页内容和网页附件进行解析,得到统一格式的行为评价依据文件和行为评价案例文件,行为评价依据文件例如包括法规文本、制度文本,行为评价案例文件例如包括处罚案例文本。
然后,利用结构化抽取技术(包括自然语言、深度学习等技术)对统一格式的法规文本、制度文本和处罚案例文本进行结构化抽取,得到目标数据,目标数据例如包括行为数据、与行为数据相关联的对象数据以及行为评价结果等。将目标数据存储于数据库中,数据库例如包括法规库、制度库、处罚案例库等等。
接下来,基于法规库、制度库、处罚案例库中的目标数据进行图谱构建,得到知识图谱。
服务层例如可以提供各式各样的服务,例如提供知识图谱的查询服务、数据搜索服务、风险告警服务等等。数据搜索服务和风险告警服务例如参考下文。
图3B示意性示出了根据本公开一实施例的结构化抽取方法的示意图。
如图3B所示,是对行为评价案例301进行结构化抽取的一个示例。行为评价案例301为一行政处罚案例,该行政处罚案例的公开信息例如包括被处罚对象、案由、行政处罚依据、行政处罚结果、做出处罚决定的机构和日期等。
对上述行为评价案例301进行结构化抽取,可以得到目标数据302。例如目标数据包括与该行政处罚案例关联的行为评价依据、对象数据、业务类型、评价结果和机构数据等等。
图3C示意性示出了根据本公开另一实施例的结构化抽取方法的示意图。
如图3C所示,是对行为评价依据进行结构化抽取的一个示例。行为评价依据可以包括行内制度文件311,行内制度文件311可以作为直接依据。对行内制度文件311进行抽取,可以得到间接依据《制度X》、《制度Y》312、《制度Z》。对《制度Y》312进行抽取,可以得到间接依据《法律A》、《法律B》313。上述直接依据和间接依据均可以作为目标数据。
图3D示意性示出了根据本公开另一实施例的知识图谱的示意图。
如图3D所示,知识图谱320包括多个节点。其中灰色节点可以表示处罚案例(例如处罚案例X)、机构、企业(例如企业C)、制度(例如制度X、制度Y、法律A)等。白色节点可以表示通过该白色节点相连接的灰色节点之间的关系,关系例如可以包括处罚决定机构、被处罚对象、处罚依据、处罚监管机构、颁发、政策相关、版本变迁以及版本变更依据等。
例如,白色节点321连接灰色节点制度X、灰色节点处罚案例X以及企业C。白色节点321可以表示制度X是处罚案例X的处罚依据,企业C是处罚案例X的被处罚对象。
图4示意性示出了根据本公开一实施例的数据搜索方法的流程图。
如图4所示,本公开实施例的数据搜索方法400例如可以包括操作S410~操作S420。
在操作S410,基于搜索条件,从行为评价依据、行为评价案例、目标数据和知识结构数据中的至少一个确定搜索结果。
在操作S420,输出搜索结果。
示例性地,搜索条件例如包括行为评价依据或行为评价案例的具体内容,具体内容包括行为评价依据或行为评价案例的具体类别、发布行为评价依据或行为评价案例的时间、发布行为评价依据或行为评价案例的金融监管机构、行为评价案例涉及的业务类型等等。
然后,基于搜索条件,从行为评价依据、行为评价案例、目标数据和知识结构数据(知识图谱)中确定搜索结果。
示例性地,目标数据是通过处理行为评价依据和行为评价案例得到的,知识结构数据是根据上文的方法得到的。
图5示意性示出了根据本公开一实施例的数据搜索方法的示意图。
如图5所示,当接收到搜索条件之后,可以从行为评价依据、行为评价案例、目标数据和知识结构数据确定搜索结果,搜索结果例如包括搜索结果A、搜索结果B、搜索结果C等多个结果。搜索结果例如显示在列表页,用户可以从列表页中选择所需查看的搜索结果。
搜索结果的具体内容可以显示于详情页中。以搜索结果A为例,搜索结果A的具体内容包括正文、图谱数据、智能推荐内容、标签等。
正文例如包括:与搜索条件相关联的目标行为评价依据、与搜索条件相关联的目标行为评价案例。目标行为评价依据是行为评价依据中的至少部分,目标行为评价案例是行为评价案例中的至少部分。
图谱数据例如包括:与目标行为评价依据和目标行为评价案例中的至少一个相关联的目标知识结构数据,目标知识结构数据例如是知识结构数据(知识图谱)中的至少部分。
智能推荐内容例如包括:与目标行为评价依据相关联的参考行为评价依据、与目标行为评价案例相关联的参考行为评价案例,参考行为评价依据和参考行为评价案例是基于目标知识结构数据确定的。以目标行为评价案例为例,如上文图5所示,目标行为评价案例例如为当前评价案例,从知识图谱中可以确定出与目标行为评价案例相关联的相关行为评价案例(也即参考行为评价案例)。
标签例如包括与目标行为评价依据和目标行为评价案例中的至少一个相关联的参考目标数据,参考目标数据可以是目标数据中的至少部分。例如,当目标数据中包括标题和与标题对应的结果时,标签可以是标题。
根据本公开的实施例,在构建得到知识图谱之后,可以将知识图谱应用于搜索场景,提高数据搜索的效率和效果,降低数据搜索的人工成本。
图6示意性示出了根据本公开一实施例的风险告警方法的流程图。
如图6所示,本公开实施例的风险告警方法600例如可以包括操作S610~操作S620。
在操作S610,基于风险评价指标,从行为评价依据、行为评价案例、目标数据和知识结构数据中的至少一个,确定与风险评价指标相关联的风险评价值。
在操作S620,基于风险评价值,进行风险告警。
示例性地,目标数据是通过处理行为评价依据和行为评价案例得到的,知识结构数据是根据上文的方法得到的。风险指标值指示了风险发生的概率,当风险指标值大于预设阈值时,可以进行风险告警。
图7示意性示出了根据本公开一实施例的风险方法的示意图。
如图7所示,构建多维度的风险评价指标,并从行为评价依据、行为评价案例、目标数据和知识结构数据中的至少一个,确定与风险评价指标相关联的风险评价值。风险评价指标例如包括法律法规发布的时间、发布的机构、被处罚的原因等等。
然后,基于风险评价值进行风险趋势统计,得到统计结果。统计结果例如与地区关联,统计结果例如是包括某个地区的处罚案例情况、某个企业的处罚案例情况、某个金融监管机构发布的处罚案例情况等等。企业用户可以根据需求查询相应地区的统计结果。
另外,可以根据告警规则确定风险评价值是否满足告警规则,如果是,可以进行风险告警。例如,当某类型的处罚案例超过预设数量时满足告警条件,此时可以进行告警。在告警之后,可以向企业各部门发送提示,便于企业各部门基于提示进行生产经营调整。
图8示意性示出了根据本公开一实施例的基于金融数据的知识图谱构建方法的流程图。
如图8所示,本公开实施例的基于金融数据的知识图谱构建方法800例如可以包括操作S810~操作S820。
在操作S810,构建与金融数据相关联的知识结构数据。
在操作S820,基于知识结构数据,得到知识图谱。
示例性地,获取金融数据,金融数据例如包括行为评价依据和行为评价案例。处理行为评价依据和行为评价案例得到目标数据,目标数据包括行为数据、与行为数据相关联的对象数据以及行为评价结果。基于目标数据构建知识结构数据,将知识结构数据作为知识图谱。
通过本公开的实施例,将大量的人工经验以结构化数据、图谱、搜索和推荐形式形成知识库进行存储和呈现,基于多维指标进行统计分析并可视化展示的方式,以及以风险告警的方式自动化告警,解决了企业监管过程中需要大量依靠经验判断的问题,进而实现了企业的经验知识能够长久积累,提高企业监管效果。
图9示意性示出了根据本公开一实施例的知识结构数据的生成装置的框图。
如图9所示,本公开实施例的知识结构数据的生成装置900例如包括获取模块910、处理模块920和生成模块930。
获取模块910可以用于获取行为评价依据数据和行为评价案例数据。根据本公开实施例,获取模块910例如可以执行上文参考图1描述的操作S110,在此不再赘述。
处理模块920可以用于处理行为评价依据数据和行为评价案例数据,得到目标数据,其中,目标数据包括行为数据、与行为数据相关联的对象数据以及行为评价结果。根据本公开实施例,处理模块920例如可以执行上文参考图1描述的操作S120,在此不再赘述。
生成模块930可以用于基于目标数据,生成知识结构数据。根据本公开实施例,生成模块930例如可以执行上文参考图1描述的操作S130,在此不再赘述。
根据本公开的实施例,对象数据包括以下至少一项:被评价对象数据、发布行为评价依据数据和行为评价案例数据的机构数据;行为数据包括以下至少一项:与被评价对象数据相关联的被评价行为数据、对行为评价依据数据和行为评价案例数据的发布行为、与行为评价依据数据相关联的变更行为;行为评价结果包括:基于行为评价依据数据对被评价行为数据进行评价得到的结果。
根据本公开的实施例,知识结构数据包括知识图谱,知识图谱包括节点数据和节点数据之间的边数据;节点数据包括以下至少一项:行为评价依据数据、行为评价案例数据和对象数据;边数据包括以下至少一项:行为数据、行为评价结果、机构数据对应的机构的隶属关系数据、被评价对象数据与行为评价案例数据之间关系数据、行为评价依据数据和行为评价案例数据之间的关系数据。
根据本公开的实施例,处理模块920包括以下至少一项:字段抽取子模块和语义理解子模块。字段抽取子模块,用于从行为评价依据数据和行为评价案例数据中抽取目标字段,作为目标数据;语义理解子模块,用于利用自然语言处理模型、深度学习模型中的至少一个,对行为评价依据数据和行为评价案例数据进行语义理解,得到目标数据。
根据本公开的实施例,获取模块910包括:采集子模块和获得子模块。采集子模块,用于利用爬虫技术采集网页数据;获得子模块,用于基于网页数据,得到行为评价依据数据和行为评价案例数据。
根据本公开的实施例,网页数据包括网页内容和网页附件;获得子模块包括:第一处理单元、第二处理单元和确定单元。第一处理单元,用于利用第一解析方式对网页内容进行标准化处理,得到第一目标格式数据;第二处理单元,用于利用第二解析方式对网页附件进行标准化处理,得到第二目标格式数据;确定单元,用于将第一目标格式数据和第二目标格式数据,确定为行为评价依据数据和行为评价案例数据。
图10示意性示出了根据本公开一实施例的数据搜索装置的框图。
如图10所示,本公开实施例的数据搜索装置1000例如包括确定模块1010以及输出模块1020。
确定模块1010可以用于基于搜索条件,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个确定搜索结果。根据本公开实施例,确定模块1010例如可以执行上文参考图4描述的操作S410,在此不再赘述。
输出模块1020可以用于输出搜索结果。根据本公开实施例,输出模块1020例如可以执行上文参考图4描述的操作S420,在此不再赘述。
图11示意性示出了根据本公开一实施例的风险告警装置的框图。
如图11所示,本公开实施例的风险告警装置1100例如包括确定模块1110以及告警模块1120。
确定模块1110可以用于基于风险评价指标,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个,确定与风险评价指标相关联的风险评价值。根据本公开实施例,确定模块1110例如可以执行上文参考图6描述的操作S610,在此不再赘述。
告警模块1120可以用于基于风险评价值,进行风险告警。根据本公开实施例,告警模块1120例如可以执行上文参考图6描述的操作S620,在此不再赘述。
图12示意性示出了根据本公开一实施例的基于金融数据的知识图谱构建装置的框图。
如图12所示,本公开实施例的基于金融数据的知识图谱构建装置1200例如包括构建模块1210和获得模块1220。
构建模块1210可以用于构建与金融数据相关联的知识结构数据。根据本公开实施例,构建模块1210例如可以执行上文参考图8描述的操作S810,在此不再赘述。
获得模块1220可以用于基于知识结构数据,得到知识图谱。根据本公开实施例,获得模块1220例如可以执行上文参考图8描述的操作S820,在此不再赘述。
在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开实施例,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行上文所描述的知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个。
根据本公开实施例,提供了一种计算机程序产品,包括计算机程序/指令,计算机程序/指令存储于可读存储介质和电子设备其中至少之一上,计算机程序/指令被处理器执行时实现上文所描述的知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个。
图13是用来实现本公开实施例的用于执行知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个的电子设备的框图。
图13示出了可以用来实施本公开实施例的示例电子设备1300的示意性框图。电子设备1300旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图13所示,设备1300包括计算单元1301,其可以根据存储在只读存储器(ROM)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(RAM)1303中的计算机程序,来执行各种适当的动作和处理。在RAM 1303中,还可存储设备1300操作所需的各种程序和数据。计算单元1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。
设备1300中的多个部件连接至I/O接口1305,包括:输入单元1306,例如键盘、鼠标等;输出单元1307,例如各种类型的显示器、扬声器等;存储单元1308,例如磁盘、光盘等;以及通信单元1309,例如网卡、调制解调器、无线通信收发机等。通信单元1309允许设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理,例如知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个。例如,在一些实施例中,知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1308。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1302和/或通信单元1309而被载入和/或安装到设备1300上。当计算机程序加载到RAM 1303并由计算单元1301执行时,可以执行上文描述的知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个方法的一个或多个步骤。备选地,在其他实施例中,计算单元1301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行知识结构数据的生成方法、数据搜索方法、风险告警方法、基于金融数据的知识图谱构建方法中的至少一个。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程知识结构数据的生成装置、数据搜索装置、风险告警装置、基于金融数据的知识图谱构建装置中的至少一个的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (22)

1.一种知识结构数据的生成方法,包括:
获取行为评价依据数据和行为评价案例数据,所述行为评价依据包括法律、法规和制度中的至少之一,所述行为评价案例包括对违反所述法律、法规和制度中的至少之一的行为进行处罚的案例;
处理所述行为评价依据数据和所述行为评价案例数据,得到目标数据,其中,所述目标数据包括行为数据、与所述行为数据相关联的对象数据以及行为评价结果,所述行为评价结果表征了所述行为数据违反了所述法律、法规和制度中的至少之一;以及
基于所述目标数据,生成知识结构数据,
其中,所述知识结构数据表征了所述行为评价依据数据、所述行为评价案例数据和所述对象数据之间的关联关系,所述关联关系与所述行为数据和所述行为评价结果相关联。
2.根据权利要求1所述的方法,其中:
所述对象数据包括以下至少一项:被评价对象数据、发布所述行为评价依据数据和所述行为评价案例数据的机构数据;
所述行为数据包括以下至少一项:与所述被评价对象数据相关联的被评价行为数据、对所述行为评价依据数据和所述行为评价案例数据的发布行为、与所述行为评价依据数据相关联的变更行为;
所述行为评价结果包括:基于所述行为评价依据数据对所述被评价行为数据进行评价得到的结果。
3.根据权利要求2所述的方法,其中,
所述知识结构数据包括知识图谱,所述知识图谱包括节点数据和所述节点数据之间的边数据;
所述节点数据包括以下至少一项:所述行为评价依据数据、所述行为评价案例数据和所述对象数据;
所述边数据包括以下至少一项:所述行为数据、所述行为评价结果、所述机构数据对应的机构的隶属关系数据、所述被评价对象数据与所述行为评价案例数据之间关系数据、所述行为评价依据数据和所述行为评价案例数据之间的关系数据。
4.根据权利要求1-3中任意一项所述的方法,其中,所述处理所述行为评价依据数据和所述行为评价案例数据,得到目标数据包括以下至少一项:
从所述行为评价依据数据和所述行为评价案例数据中抽取目标字段,作为所述目标数据;
利用自然语言处理模型、深度学习模型中的至少一个,对所述行为评价依据数据和所述行为评价案例数据进行语义理解,得到所述目标数据。
5. 根据权利要求1-3中任意一项所述的方法,其中,所述获取行为评价依据数据和行为评价案例数据包括:
利用爬虫技术采集网页数据;以及
基于所述网页数据,得到所述行为评价依据数据和所述行为评价案例数据。
6.根据权利要求5所述的方法,其中,所述网页数据包括网页内容和网页附件;所述基于所述网页数据,得到所述行为评价依据数据和所述行为评价案例数据包括:
利用第一解析方式对所述网页内容进行标准化处理,得到第一目标格式数据;
利用第二解析方式对所述网页附件进行标准化处理,得到第二目标格式数据;以及
将所述第一目标格式数据和所述第二目标格式数据,确定为所述行为评价依据数据和所述行为评价案例数据。
7. 一种数据搜索方法,包括:
基于搜索条件,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个确定搜索结果;以及
输出所述搜索结果,
其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是根据权利要求1-6中任意一项所述的方法生成的。
8.根据权利要求7所述的方法,其中,所述搜索结果包括以下至少一个:
与所述搜索条件相关联的目标行为评价依据数据;
与所述搜索条件相关联的目标行为评价案例数据;
与所述目标行为评价依据数据和所述目标行为评价案例数据中的至少一个相关联的目标知识结构数据;
与所述目标行为评价依据数据相关联的参考行为评价依据数据、与所述目标行为评价案例数据相关联的参考行为评价案例数据,其中,所述参考行为评价依据数据和参考行为评价案例数据是基于所述目标知识结构数据确定的;以及
与所述目标行为评价依据数据和所述目标行为评价案例数据中的至少一个相关联的参考目标数据。
9. 一种风险告警方法,包括:
基于风险评价指标,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个,确定与所述风险评价指标相关联的风险评价值;以及
基于所述风险评价值,进行风险告警,
其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是根据权利要求1-6中任意一项所述的方法生成的。
10. 一种基于金融数据的知识图谱构建方法,包括:
利用根据权利要求1-6中任意一项所述的方法构建与金融数据相关联的知识结构数据;以及
基于所述知识结构数据,得到知识图谱。
11.一种知识结构数据的生成装置,包括:
获取模块,用于获取行为评价依据数据和行为评价案例数据,所述行为评价依据包括法律、法规和制度中的至少之一,所述行为评价案例包括对违反所述法律、法规和制度中的至少之一的行为进行处罚的案例;
处理模块,用于处理所述行为评价依据数据和所述行为评价案例数据,得到目标数据,其中,所述目标数据包括行为数据、与所述行为数据相关联的对象数据以及行为评价结果,所述行为评价结果表征了所述行为数据违反了所述法律、法规和制度中的至少之一;以及
生成模块,用于基于所述目标数据,生成知识结构数据,
其中,所述知识结构数据表征了所述行为评价依据数据、所述行为评价案例数据和所述对象数据之间的关联关系,所述关联关系与所述行为数据和所述行为评价结果相关联。
12.根据权利要求11所述的装置,其中:
所述对象数据包括以下至少一项:被评价对象数据、发布所述行为评价依据数据和所述行为评价案例数据的机构数据;
所述行为数据包括以下至少一项:与所述被评价对象数据相关联的被评价行为数据、对所述行为评价依据数据和所述行为评价案例数据的发布行为、与所述行为评价依据数据相关联的变更行为;
所述行为评价结果包括:基于所述行为评价依据数据对所述被评价行为数据进行评价得到的结果。
13.根据权利要求12所述的装置,其中,
所述知识结构数据包括知识图谱,所述知识图谱包括节点数据和所述节点数据之间的边数据;
所述节点数据包括以下至少一项:所述行为评价依据数据、所述行为评价案例数据和所述对象数据;
所述边数据包括以下至少一项:所述行为数据、所述行为评价结果、所述机构数据对应的机构的隶属关系数据、所述被评价对象数据与所述行为评价案例数据之间关系数据、所述行为评价依据数据和所述行为评价案例数据之间的关系数据。
14.根据权利要求11-13中任意一项所述的装置,其中,所述处理模块包括以下至少一项:
字段抽取子模块,用于从所述行为评价依据数据和所述行为评价案例数据中抽取目标字段,作为所述目标数据;
语义理解子模块,用于利用自然语言处理模型、深度学习模型中的至少一个,对所述行为评价依据数据和所述行为评价案例数据进行语义理解,得到所述目标数据。
15. 根据权利要求11-13中任意一项所述的装置,其中,所述获取模块包括:
采集子模块,用于利用爬虫技术采集网页数据;以及
获得子模块,用于基于所述网页数据,得到所述行为评价依据数据和所述行为评价案例数据。
16.根据权利要求15所述的装置,其中,所述网页数据包括网页内容和网页附件;所述获得子模块包括:
第一处理单元,用于利用第一解析方式对所述网页内容进行标准化处理,得到第一目标格式数据;
第二处理单元,用于利用第二解析方式对所述网页附件进行标准化处理,得到第二目标格式数据;以及
确定单元,用于将所述第一目标格式数据和所述第二目标格式数据,确定为所述行为评价依据数据和所述行为评价案例数据。
17. 一种数据搜索装置,包括:
确定模块,用于基于搜索条件,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个确定搜索结果;以及
输出模块,用于输出所述搜索结果,
其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是根据权利要求11-16中任意一项所述的装置生成的。
18.根据权利要求17所述的装置,其中,所述搜索结果包括以下至少一个:
与所述搜索条件相关联的目标行为评价依据数据;
与所述搜索条件相关联的目标行为评价案例数据;
与所述目标行为评价依据数据和所述目标行为评价案例数据中的至少一个相关联的目标知识结构数据;
与所述目标行为评价依据数据相关联的参考行为评价依据数据、与所述目标行为评价案例数据相关联的参考行为评价案例数据,其中,所述参考行为评价依据数据和参考行为评价案例数据是基于所述目标知识结构数据确定的;以及
与所述目标行为评价依据数据和所述目标行为评价案例数据中的至少一个相关联的参考目标数据。
19. 一种风险告警装置,包括:
确定模块,用于基于风险评价指标,从行为评价依据数据、行为评价案例数据、目标数据和知识结构数据中的至少一个,确定与所述风险评价指标相关联的风险评价值;以及
告警模块,用于基于所述风险评价值,进行风险告警,
其中,所述目标数据是通过处理所述行为评价依据数据和所述行为评价案例数据得到的,所述知识结构数据是根据权利要求11-16中任意一项所述的装置生成的。
20. 一种基于金融数据的知识图谱构建装置,包括:
构建模块,用于利用根据权利要求11-16中任意一项所述的装置构建与金融数据相关联的知识结构数据;以及
获得模块,用于基于所述知识结构数据,得到知识图谱。
21. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。
CN202211081413.8A 2022-09-05 2022-09-05 知识结构数据的生成方法、数据搜索方法和风险告警方法 Active CN115269879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211081413.8A CN115269879B (zh) 2022-09-05 2022-09-05 知识结构数据的生成方法、数据搜索方法和风险告警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211081413.8A CN115269879B (zh) 2022-09-05 2022-09-05 知识结构数据的生成方法、数据搜索方法和风险告警方法

Publications (2)

Publication Number Publication Date
CN115269879A CN115269879A (zh) 2022-11-01
CN115269879B true CN115269879B (zh) 2023-05-05

Family

ID=83756262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211081413.8A Active CN115269879B (zh) 2022-09-05 2022-09-05 知识结构数据的生成方法、数据搜索方法和风险告警方法

Country Status (1)

Country Link
CN (1) CN115269879B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503295A (zh) * 2019-07-05 2019-11-26 深圳壹账通智能科技有限公司 供应链金融的风险分析方法、装置、计算终端及存储介质
CN110889556A (zh) * 2019-11-28 2020-03-17 福建亿榕信息技术有限公司 一种企业经营风险预测方法和系统
CN111291161A (zh) * 2020-02-20 2020-06-16 平安科技(深圳)有限公司 法律案件知识图谱查询方法、装置、设备及存储介质
WO2020251866A1 (en) * 2019-06-08 2020-12-17 Trustarc Inc Risk management of processes utilizing personal data

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373091B2 (en) * 2017-09-22 2019-08-06 1Nteger, Llc Systems and methods for investigating and evaluating financial crime and sanctions-related risks
US10915577B2 (en) * 2018-03-22 2021-02-09 Adobe Inc. Constructing enterprise-specific knowledge graphs
CN109522416A (zh) * 2018-10-19 2019-03-26 广东工业大学 一种金融风险控制知识图谱的构建方法
CN111259160B (zh) * 2018-11-30 2023-08-29 百度在线网络技术(北京)有限公司 知识图谱构建方法、装置、设备及存储介质
CN109491995A (zh) * 2018-12-25 2019-03-19 苏宁易购集团股份有限公司 基于知识图谱查询金融异常数据的方法及系统
CN110110093A (zh) * 2019-04-08 2019-08-09 深圳众赢维融科技有限公司 一种基于知识图谱的识别方法、装置、电子设备及存储介质
CN110503236A (zh) * 2019-07-08 2019-11-26 中国平安人寿保险股份有限公司 基于知识图谱的风险预测方法、装置、设备以及存储介质
CN110717816A (zh) * 2019-07-15 2020-01-21 上海氪信信息技术有限公司 一种基于人工智能技术的全域金融风险知识图谱构建方法
CN110458697A (zh) * 2019-08-19 2019-11-15 北京百度网讯科技有限公司 用于评估风险的方法和装置
CN110674970A (zh) * 2019-08-19 2020-01-10 广州荔支网络技术有限公司 企业法务风险预警方法、装置、设备及可读存储介质
CN110619568A (zh) * 2019-09-17 2019-12-27 王文斌 风险评估报告的生成方法、装置、设备及存储介质
CN110929038B (zh) * 2019-10-18 2023-07-21 平安科技(深圳)有限公司 基于知识图谱的实体链接方法、装置、设备和存储介质
CN110837538A (zh) * 2019-10-24 2020-02-25 北京中科捷信信息技术有限公司 金融知识图谱可视化查询与多维分析系统
CN111383102B (zh) * 2020-03-27 2023-10-24 北京明略软件系统有限公司 金融信贷风险识别方法、模型构建方法和装置
CN111899089A (zh) * 2020-07-01 2020-11-06 苏宁金融科技(南京)有限公司 基于知识图谱的企业风险预警方法及系统
CN114066242A (zh) * 2021-11-11 2022-02-18 北京道口金科科技有限公司 一种企业风险的预警方法及装置
CN114357187A (zh) * 2021-12-28 2022-04-15 远光软件股份有限公司 法规制度的搜索方法、装置、存储介质及计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020251866A1 (en) * 2019-06-08 2020-12-17 Trustarc Inc Risk management of processes utilizing personal data
CN110503295A (zh) * 2019-07-05 2019-11-26 深圳壹账通智能科技有限公司 供应链金融的风险分析方法、装置、计算终端及存储介质
CN110889556A (zh) * 2019-11-28 2020-03-17 福建亿榕信息技术有限公司 一种企业经营风险预测方法和系统
CN111291161A (zh) * 2020-02-20 2020-06-16 平安科技(深圳)有限公司 法律案件知识图谱查询方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115269879A (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN107809331B (zh) 识别异常流量的方法和装置
US9141662B2 (en) Intelligent evidence classification and notification in a deep question answering system
US9158772B2 (en) Partial and parallel pipeline processing in a deep question answering system
US9754215B2 (en) Question classification and feature mapping in a deep question answering system
CN111813960B (zh) 基于知识图谱的数据安全审计模型装置、方法及终端设备
CN111708938A (zh) 用于信息处理的方法、装置、电子设备和存储介质
CN114461644A (zh) 一种数据采集方法、装置、电子设备及存储介质
CN110955801B (zh) 一种cognos报表指标的知识图谱分析方法及系统
CN115221337A (zh) 数据编织处理方法、装置、电子设备及可读存储介质
CN113704058B (zh) 一种业务模型的监控方法、装置及电子设备
CN110677271B (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN116955856A (zh) 信息展示方法、装置、电子设备以及存储介质
CN115048352B (zh) 一种日志字段提取方法、装置、设备和存储介质
CN115269879B (zh) 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN108768742B (zh) 网络构建方法及装置、电子设备、存储介质
CN115408236A (zh) 一种日志数据审计系统、方法、设备及介质
CN115495587A (zh) 一种基于知识图谱的告警分析方法及装置
CN115238292A (zh) 数据安全管控方法、装置、电子设备及存储介质
CN112085566B (zh) 基于智能决策的产品推荐方法、装置及计算机设备
CN114492364A (zh) 相同漏洞的判断方法、装置、设备和存储介质
CN113869904A (zh) 可疑数据识别方法、装置、电子设备、介质和计算机程序
CN112632990B (zh) 一种标签的获取方法、装置、设备及可读存储介质
US11960927B2 (en) Task correlation framework
CN113726814B (zh) 用户异常行为识别方法、装置、设备及存储介质
CN115689271A (zh) 业务架构的优化方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant