CN110569369A - 银行金融系统知识图谱的生成方法及装置、应用方法及装置 - Google Patents

银行金融系统知识图谱的生成方法及装置、应用方法及装置 Download PDF

Info

Publication number
CN110569369A
CN110569369A CN201910870558.8A CN201910870558A CN110569369A CN 110569369 A CN110569369 A CN 110569369A CN 201910870558 A CN201910870558 A CN 201910870558A CN 110569369 A CN110569369 A CN 110569369A
Authority
CN
China
Prior art keywords
entity
entities
knowledge
financial system
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910870558.8A
Other languages
English (en)
Inventor
陈宏鸿
范兴泽
耿超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHOU DIGITAL RONGXIN SOFTWARE Co Ltd
Original Assignee
SHENZHOU DIGITAL RONGXIN SOFTWARE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHOU DIGITAL RONGXIN SOFTWARE Co Ltd filed Critical SHENZHOU DIGITAL RONGXIN SOFTWARE Co Ltd
Priority to CN201910870558.8A priority Critical patent/CN110569369A/zh
Publication of CN110569369A publication Critical patent/CN110569369A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种银行金融系统知识图谱的生成方法及装置、应用方法及装置。该方法包括:采用自上向下的过程,基于领域建模识别银行金融系统中本体层的核心实体及核心实体之间的关系;采用自下向上的过程,综合各类系统需求与设计文档分析识别银行金融系统中的实体及实体之间的关系;将通过自上向下过程识别到的核心实体与核心实体之间的关系,与通过自下向上过程识别得到的实体与实体之间的关系进行融合,得到银行系统的知识图谱。本发明提供了一种银行金融系统知识图谱的生成方法及装置、应用方法及装置将自上而下与自下而上的构建方式作为互为补充的方案,这种设计可以通过对自然实体与数据实体之间的关系匹配以回归验证模型的可靠性。

Description

银行金融系统知识图谱的生成方法及装置、应用方法及装置
技术领域
本发明涉及知识图谱技术领域,特别是涉及一种银行金融系统知识图谱的生成方法及装置、应用方法及装置。
背景技术
知识图谱(Knowledge Graph)的概念由Google公司于2012年提出,是指其用于提升搜索引擎性能的知识库。知识图谱的出现是人工智能对知识需求所导致的必然结果,但是,其发展又得益于其他的研究领域,涉及到专家系统、语言学、语义网、数据库以及信息抽取等众多领域,是交叉融合的产物而非一脉传承,为多领域共同促进知识图谱的发展
知识图谱其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域。尤其是在智能搜索中,用户的搜索请求不再局限于简单的关键词匹配搜索,而是将根据用户查询的情境与意图进行推理,实现概念检索。与此同时,用户的搜索结果将具有层次化、结构化等重要特征。知识图谱能够使计算机理解人类的语言交流模式,从而更加智能地反馈用户需要的答案。与此同时,通过知识图谱能够将Web上的信息、数据以及链接关系聚集为知识,使信息资源更易于计算、理解以及评价,并且形成一套Web语义知识库。
随着信息积累及信息抽取技术的日益完善和成熟,具有海量实体数据的系统或者企业越来越多,如何有效的应用这些信息也成为了一个很大的挑战,如今,知识图谱概念的产生以及逐渐成熟的技术给上述挑战带来发展的契机,基于知识图谱的应用不仅仅局限于最开始的情报分析搜索引擎领域,同时知识图谱也越来越多的应用到其他领域。目前,知识图谱已在智能搜索、深度问答、社交网络以及一些垂直行业如金融、公安、电信等领域中都有所应用中有所应用,成为支撑这些应用发展的动力源泉。
知识图谱是知识表示与推理,是数据库、信息检索、自然语言处理等多种技术发展的融合。由于垂直知识图谱强调知识的深度和整体的层次结构,在构建时常采用自顶向下和自底向上相结合的方式。其中,自顶向下的方式是指通过本体编辑器或手工构建的方法预先构建垂直知识图谱的模式图,进而构建数据图。而自底向上的方式指在构建数据图时,利用多种抽取技术获得知识源中的实体、属性和关系,并将这些置信度高的抽取结果合并到知识图谱中。
金融知识图谱是金融数据分析从简单的量化模型走向更为复杂的价值判断和风险评估必经的一环,是把人的经验和人脉逐步变成可重用、可演化、可验证、可传播的知识模型的方法。在系统的构造中,知识图谱弥补原有数据库的不足,把机器学习、自然语言处理、深度学习这些知识提取方法,领域词表、分类树、词向量、本体这些知识表现方法,RDF数据库和图数据库这些知识存储方法,和语义搜索、问答系统、分面浏览器这些知识检索方法粘合在一起,提供金融智能化的工具集。
在银行业的应用中,借助这项技术可以有效整合工商、涉诉、招投标等外部数据,结合银行内部数据,形成客户多维度视图,并基于此形成链状、圈状的客户群视图,生成企业投资关系、担保关系、资金往来关系等关系图谱,从而形成营销和风控的依据。
目前现有应用的完全基于实用的结构化数据或非结构化数据的金融知识图谱普遍缺乏模型的回归检验,没有模型引导,导致生成的知识图谱缺乏普适性、应用场景狭窄。
发明内容
本发明要解决的技术问题是提供一种银行金融系统知识图谱的生成方法及装置、应用方法及装置,将自上而下与自下而上的构建方式作为互为补充的方案,这种设计可以通过对自然实体与数据实体之间的关系匹配以回归验证模型的可靠性。
为解决上述技术问题,本发明提供了一种银行金融系统知识图谱的生成方法,所述方法包括:采用自上向下的过程,基于领域建模识别银行金融系统本体层中的核心实体及核心实体之间的关系;采用自下向上的过程,综合各类系统需求与设计文档分析识别银行金融系统中的实体及实体之间的关系;将通过自上向下过程识别到的核心实体与核心实体之间的关系,与通过自下向上过程识别得到的实体与实体之间的关系进行融合,得到银行金融系统的知识图谱。
作为本发明技术方案的一种改进,采用自上向下的过程,基于领域建模识别银行金融系统本体层中的核心实体及核心实体之间的关系,包括:选取核心实体并建立核心实体派生关系;构建核心实体间的关系;回归验证框架可用性。
作为本发明技术方案的一种改进,所述文档包括:数据设计文档、需求文档、接口设计文档、业务流程分析文档,或者其他外源性知识文档。
作为本发明技术方案的一种改进,采用自下向上的过程,基于银行系统数据库设计或表结构关系文档识别银行金融系统中的实体及实体之间的关系,包括:根据数据库表结构,基于表和表字段识别实体和实体属性,并建立实体派生关系;根据数据库表结构,基于数据库表的外键关系,识别定义实体间关系。
作为本发明技术方案的一种改进,采用自下向上的过程,基于需求文档识别银行金融系统中的实体及实体之间的关系,包括:以系统清单为索引识别系统类实体并建立派生关系;以服务接口分析文档为接口清单抽取识别服务实体,并构建服务接口派生关系和服务的消费提供关系;建立服务派生关系,系统调用与提供服务关系,服务化接口关系。
作为本发明技术方案的一种改进,采用自下向上的过程,基于接口设计文档识别银行金融系统中的实体及实体之间的关系,包括:由接口设计文档中识别和抽取接口实体;参照接口字段映射建立服务内请求与响应实体的属性抽取和建立关系。
作为本发明技术方案的一种改进,采用自下向上的过程,基于业务流程分析文档识别银行金融系统中的实体及实体之间的关系,包括:参照功能域分解和功能分解,对业务域实体、功能域实体和业务功能实体进行抽取和识别;以业务域、功能域和业务功能作为实体名称进行抽取,并建立实体之间的分解关系及派生关系;抽取其中候选服务的流程节点,并对照候选服务匹配中的接口需求在已有的接口实体中查找接口,并建立接口对应的服务场景与功能之间的依赖关系。
作为本发明技术方案的一种改进,采用自下向上的过程,基于外源性文档识别银行金融系统中的实体及实体之间的关系,包括:由外源性知识文档中筛选出识别抽取三元组的的语句或段落;利用语言分词模型将文本进行分词处理;利用语义相似度识别技术将筛选出来语句或段落进行语义判断,识别句式的核心,并以此建立其中的主从与修饰关系,淘汰掉时间状语、定语和语气助词,并识别出其中核心词的主谓、谓宾关系;识别出实体之间的三元组关系。
作为本发明技术方案的一种改进,将通过自上向下过程识别到的核心实体与核心实体之间的关系,与通过自下向上过程识别得到的实体与实体之间的关系进行融合,得到银行系统的知识图谱,包括:建立接口输入输出信息实体与业务自然实体之间的涵盖关系;根据关系匹配,以及语义相似度比较,对实体冲突进行消除;在图谱融合过程中,进行融合纠偏标注,对纠偏进行全图谱检查,并在后续融合中持续历史标注检查。
作为本发明技术方案的一种改进,根据关系匹配,以及语义相似度比较,对实体冲突进行消除,包括:根据实体“派生”关系推理与对实体间的关系匹配,对通过自上向下识别得到的实体,以及通过自下向上识别得到的实体进行对比,实现冲突消除;根据语义相似度的比较对通过自上向下识别得到的实体,以及通过自下向上识别得到的实体进行对比,实现冲突消除。
作为本发明技术方案的一种改进,所述银行金融系统设计思想基于SOA架构分析。
此外,本发明还提供了一种银行金融系统知识图谱的生成装置,所述装置包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如前文所述的银行金融系统知识图谱的生成方法。
此外,本发明还提供了一种银行金融系统知识图谱的应用方法,所述方法包括:根据前文所述银行金融系统知识图谱的生成方法而构建的知识图谱获取关于银行金融系统的知识。
此外,本发明还提供了一种银行金融系统知识图谱的应用装置,所述装置包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如前文所述的银行金融系统知识图谱的应用方法。
采用这样的设计后,本发明至少具有以下优点:
(1)自上而下与自下而上的构建方式实际上一个互为补充的方案,同时结合自然实体与数据实体的分离,这种设计可以通过对自然实体与数据实体之间的关系匹配以回归验证模型的可靠性。
(2)由于其知识图谱的构建是参考了实际银行应用系统的接口设计文档和数据设计文档,所以当需要将该金融图谱模型进行落地实施时更加的贴近于系统实际数据情况、实际业务流程以及实际业务场景。使得模型结果更可信,使其在银行业拥有更广泛的适用性。
(3)得益于实体间的“派生”关系,明确了实体间层次关系,一个实体的属性或者关系会被其子实体继承。这样一方面可以让构建者清楚的了解实体的顶层设计关系,同时也节约了实体属性的识别的工作量。
(4)基于SOA服务治理论设计与构建的模型,可以将该图谱更广泛的应用于银行系统的开发、业务需求分析和实现。实现银行系统的需求分析人员、开发设计人员、测试验收人员和运营维护人员对业务领域、业务流程、参数指标和监管政策达成认识上的共识。尤其是在微服务架构、中台架构领域的需求、开发、测试和运维工作可以通过该图谱实现快速更新、快速迭代、快速落地的敏捷开发目标。
附图说明
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
图1是本发明实施例提供的三元组关系模型;
图2是本发明实施例提供的金融服务图谱构建框架的结构图;
图3是本发明实施例提供的知识图谱的总体构架模式的流程图;
图4是本发明实施例提供的从客户实体出发实现的主要实体与关系图;
图5是本发明实施例提供的客户实体与证件实体之间派生关系和继承关系的示意图;
图6是本发明实施例提供的句式核心识别的结果示意图;
图7是本发明实施例提供的银行金融系统知识图谱的生成方法的流程图;
图8是本发明实施例提供的银行金融系统知识图谱的生成装置的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明的银行金融图谱是以SOA设计思想为基础,综合商业银行服务治理方法论、关联业务知识与银行IT系统设计经验,将各方面知识领域通过知识图谱的形式呈现出来。
与广泛的知识图谱实践一样,实体是金融服务治理知识图谱模型的基础要素,是整个模型的“砖瓦”,而实体间的关系则为这个模型的构建框架,使模型变得立体化与具象化,同时实体属性和关系属性则描述了每个实体和关系的个性特征,使整个模型成为现实世界中金融行业的映射,其关系如图1描述。
参见图1,其中实体指的是具有可区别性且独立存在的某种事物。如某一个人、某一个城市、某一种植物、某一种商品等。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。进一步通过一系列的属性来描述这个实体,用以描述实体间的差别。但是,对于服务治理知识图谱模型而言,则会聚焦于银行IT系统与业务相关的事物主体上,从银行与金融服务的角度推动实体识别和模型构建。
实体属性指用来描述实体特征的指向,每一个实体都具有多个特性,每一个特性称为属性。一个实体的实例是由属性指向它的属性值而形成,例如“客户姓名”是“客户”的一个属性,而这个属性指向“张三”这个明确的属性值,其数据类型可以是整数型、日期型、字符串型等等。其中以“个人客户”实体为例,如表1所示:
表1
在构建过程中必须明确的是实体的属性,对于同一个实体只能包含一个同名的属性,并要对该属性的含义予以说明,如是需要枚举方式表示值的需要明确枚举范围。同时为了保证实体间关系的可溯源性,需要明确实体属性的来源,该来源一般包括两类:父类继承和关系产生。父类继承表示,该属性来源自其父类实体,是由父类实体的某个属性直接引用或演化而来的,如“客户名称”是“客户”实体的一个属性,但是站在“个人客户”角度来说,往往是用“姓名”来形容一个人的称谓,所以“客户姓名”是一个从“客户名称”继承演化而来的属性。对于属性“社会保险号”是由客户缴纳社会保险而持有的“社保卡”而来的,所以从客户角度而言,“个人客户”的“社会保险号”就是实体“社保卡”的“社会保险号”属性。
数据对象彼此之间相互连接的方式称为关系,也称为联系。实体关系是为展现孤立的实体节点之间复杂而多样的拓扑结构而构建的网络,在金融图谱的构建过程里,将着重于展现银行或金融机构的业务与IT系统中实体间的关系。
实体识别完成后,则可以进一步建立实体间关系,关系的内容包括:关系名称、方向、条件、关系属性等。通过对不同实体的识别和划分,从而明确实体间的关系类型,建立对应的实体间关系。其中“派生”关系是参考面向对象设计理论中“继承”机制而设计,即新的子实体从已有的父实体中“派生”而来,进一步明确了实体的范围,展现的是实体间纯粹的层次关系。而其他实体类之间的关系则是在表现现实世界中实体间建立的网络联系,如“客户”“持有”“凭证”办理业务,其中“客户”和“凭证”则是这条关系中两端的节点,而“持有”则是这条关系的类型。
关系属性指用来描述实体间关系的特征。不同的关系之间存在一定程度上共性特征和个性特征,然而对于建立在不同实体之间相同的关系也存在着个性特征。如果说当实体拥有了明确存在着的实例时,实体属性才存在明确的值;那么对于关系而言,实体间关系一旦建立就是建立了这个关系的一个实例,那么相应的,这个关系实例的属性也有了明确的值。
本发明中关系属性的标注包括“接口”实体对数据类实体属性的引用情况以及同名关系中类型的特征性区分。由于不同接口的请求和响应字段不同,因此使用“请求”和“响应”关系属性用来描述不同接口对实体属性的具体使用情况。同时,本发明中的关系属性也用于标注实体间关系的特性,如“派生”关系的不同类型,“持有”关系的表现形式等。
本发明设计的金融知识模型是以银行业金融数据模型为基础,参照银行接口分析中对接口服务识别、接口服务定义与接口服务管理的要求,辅以银行业与金融业各类IT系统实施与解决方案的经验作为支撑,总结与凝练出具有合理性、可靠性和可行性的金融服务模型方案与构建规划。其框架内部主体包含了实体、关系、实体属性、关系属性、系统与服务,逻辑上存在着如图2所示的关系。
而以上都是基于传统知识图谱所铺设的基础,在此基础上,基于金融行业IT建设管理与服务治理理念,拓展引入了服务与系统两个重要概念。当然不可否认的是,服务与系统本身也是实体,但是从IT体系建设的角度反观,实体与关系以数据模型的形式落地在每一个渠道、业务或管理系统之中,当然也集中于数据仓库等数据集成层系统之中。相应的,对于服务来说,任何一个系统所提供的任何一个服务是无法脱离数据实体而存在的,一方面因为服务的识别、设计与规划无法只依赖业务流程、脱离数据模型而进行;另一方面,服务接口消息的请求与响应数据均来源于数据模型,同时服务接口的功能也是通过对实体的关注与处理以达成目标。
所以,对于本发明所论述的金融图谱模型的目标是对系统需求分析人员、系统开发人员、测试人员和业务人员在进行系统、接口和数据模型设计工作时的设计思路、治理角度与参考依据进行完整还原,是综合了银行与金融业IT系统的数据模型分析、业务流程分析、系统处理流程分析、系统间交互分析的全面汇总。
该知识图谱的知识抽取的过程主要来源于两个方向,一方面是在银行业业务领域与科技领域工作多年,具备丰富业务经验与开发经验的专家,包括银行业各业务线的业务专家、银行IT架构咨询专家以及银行IT治理专家等,将他们的经验通过报告、文档、头脑风暴会议等诸多形式进行汇总收集,作为知识来源的重要基础;另一方面关于银行业行业知识、SOA架构设计思想与完整的金融服务模型等相关内容在多年的积累中所沉淀的文档、知识库、数据库表结构等非结构化或半结构化数据同样是金融服务知识图谱构建的重要知识来源。
为了验证金融服务知识图谱设计与构建的可靠性和可行性,需要将银行业完整的系统架构、各线条业务模型与IT服务接口作为知识融合的内容加入,不断验证,反复演进模型,以这样的方式对模型不断推敲,力求模型的准确与完整。
而银行金融图谱模型构建是建立实体与实体间关系的过程,是通过实体识别、实体属性识别、实体关系识别、关系属性识别等一系列处理过程实现的。
对于实体的识别主要包括“自上而下”与“自下而上”两种方式,如图3所示。
“自上而下”的方式指先参照既有的数据模型、整理的金融行业知识为图谱定义数据实体完成基础建模,而后进行实体属性、实体关系的建模,再将实体融合到图谱中,该构建方式需要利用一些现有的结构化知识库作为其基础知识库,层级延伸出相关实体内容;“自下而上”的方式指从已有数据中提取实体信息,如银行业系统数据库设计、系统接口与功能设计,增加至知识库,再补充构建顶层的本体模式。
本发明中服务治理图谱的构建,通过上述两种方式协作完成,“自上而下”的通过行业知识建立数据模型框架,“自下而上”的从已有资产信息中提取有效内容。
1、本体设计与构建
本体是对概念进行建模的规范,是描述客观世界的抽象模型,以形式化方式对概念及其之间的联系给出明确定义。本体层是一种由核心实体和代表关系组成的树状结构,这种拓展的关系有助于知识推理和延展,后续不断补充的实体都是本体层的拓展,而实体关系的补充则是本体层关系的特征化。在知识图谱中,本体是建设的基础,用于描述实体层次关系体系,是知识图谱中知识的概念模板。
在知识图谱构建之初,应优先健全知识图谱的本体架构,即采用自上向下的构建方式为图谱搭建骨架,所依赖的是基于领域驱动建模的方法,划定银行金融知识图谱的研究领域和研究范围,明确相关领域之间的领域上下文关系。不是纯粹地以某个系统、某个业务流程、某个业务操作对象对数据模型进行切割和划分,也不是以数据的转移和落地存储进行实体构建和还原,而是要跨领域地、集合地汇总银行业业务在IT建设中全部核心实体。比如,“证件”实体在不同的业务领域可能是不同的含义,比如可能是客户的“开户登记证件”,可能是监管机关的“核查证件”,但是在领域驱动建模的思想中,在本体层构建的过程里,认为“证件”是一个跨领域的核心实体,其核心关系是由于“客户”“持有”“证件”而产生的。
由于银行业的知识领域浩如烟海,在前期的本体层构建工作中需要对一些基础的本体类的核心实体进行识别和关系的确定,该过程是一个重要的框架设计,是后期知识图谱建设范围和方向的指导,所以需要专家组对核心实体进行人工识别和定义。其主要工作包括以下几个步骤:
第一步,选取核心实体并建立核心实体派生关系。
根据目前金融图谱的建设目标,基于领域建模技术从金融数据模型中选定核心实体并建立该实体的<派生>关系(建议不超过三层),通过这种方式确定研究领域,明确知识图谱的范围和层次关系,如表2所示。
表2
第二步,构建核心实体间的关系。
基于金融数据模型中的朴素关系构建核心实体之主要联系,结合头脑风暴会议分批次对核心实体的关系进行整理,如表3所示。
表3
第三步,回归验证框架可用性。
将全部三元组落入图数据库,基于主体业务流程在图数据库上进行核对验证,检查是否有遗漏。如图4以客户角度出发对客户通过渠道发起行内交易IT系统、服务与接口的全景展示,针对目前已有的实体,核对是否有所遗漏。
最终,将完整图谱录入图数据库中,以供后续分析和优化。
2、模型填充与融合
在完成了知识图谱的框架建设之后,需要持续性的完善图谱,包括从结构化文档和非结构化文档中抽取和识别三元组补充到图谱中,同时验证检查当前图谱并迭代更新。本发明对不同来源的模型不同分析方式进行分别阐释,最后对不同模型来源的实体进行融合和版本迭代。
2.1、基于数据库设计和数据模型的三元组分析
从收集到各类业务系统(以核心业务系统、支付业务系统和客户关系系统为主)的数据库存储表结构作为基础进行实体和实体属性抽取识别来源,同时参考金融数据模型中的设计方案进行三元组识别和图谱构建。此类来源的数据信息具备以下三个特征:
(1)具有明确的信息化特征,即实体和实体属性均具备明确的数据化表示方式;
(2)高度结构化的数据,通过开发对相关数据库文件或模型文件的解析工具就可以实现自动化抽取实体和实体属性;
(3)具备基本实体间关系的基础,无论是在数据模型中还是以关系型数据库中的表结构都具备表与表之间的连接关系,但是该类关系是不明确和不统一的。
2.1.1、数据模型的实体抽取
以下选取银行核心业务系统中个人客户数据库表及对公客户数据库表为例作为分析对象阐述基于数据模型的实体与实体属性抽取的分析过程。表4及表5分别示出了个人客户数据库表,以及对公客户数据库表。
表4
表5
将上述表结构中的“描述”列作为实体属性,“属性名称”列作为实体属性英文名称,对各字段进行实体分析标注。如,对于字段“客户编号”,【个人客户】与【对公客户】均包含此字段,因此作为【客户】实体属性,此处识别得出属性【客户编号】。同时确定,“客户编号”的继承关系。除此之外,在其它表结构中识别出【个人客户】与【对公客户】的共有属性还包括“客户名称”、“客户类型”等;而“学历”、“最高学位”等字段,仅存在于“个人客户信息表”,因此作为【个人客户】所包含的实体【个人学历信息】的属性;对于“注册资本”、“实收资本”仅存在于“对公客户信息表”,所以作为实体【对公客户】所包含的属性。依照以上方法,对所有数据库表中字段所属实体进行分析,最终分别得到实体【客户】、【个人客户】和【企业客户】实体的属性信息。
2.1.2、数据模型的关系抽取
目前市场上应用最广泛的数据库产品的理论模型大多是基于关系型数据库。关系型数据库的关系基础是“一对一、一对多、多对多”等关系,关系模型就是指二维表格模型,因而一个关系型数据库就是由二维表及其之间的联系组成的一个数据组织。往往在一个系统或组织进行数据建模的过程中往往也需要实体关系的建立,并维护E-R关系图,但是在过去的数据库设计经验中,往往关注的是关系的量和存在的事实,用以维护数据库表之间的主、外键关系,所以不会关注于关系归类和关系本身的属性。
当从横向上完成了从数据库表结构的数据模型实体抽取和识别后,当发现一对实体间存在外键关系就需要对实体的框架级父类实体进行还原,并根据其父类实体间的关系向下推断。例如,当发现【个人客户】与【身份证】、【户口本】之间存在一对一关系,【企业客户】和【组织机构代码证】之间也存在一对一关系,如图5所示。
基于【个人客户】和【企业客户】都是继承于【客户实体】,而【身份证】、【户口本】和【组织机构代码证】均继承于【证件】,所以基于此推断出以下三个三元组:
{【个人客户】<持有>【身份证】};
{【个人客户】<持有>【户口本】};
{【企业客户】<持有>【组织机构代码证】}。
以这种方式可以快速地对金融数据模型和系统表结构中的实体关系进行抽取和识别。
2.2、基于需求设计文档的三元组分析
系统需求设计文档内容众多,是结构化文本、半结构化文本和非结构化文本相结合的复杂文档体系,对于需求设计文档的分析工作以文档的类型区分分析方式。
2.2.1、需求文档的三元组分析
需求文档中接口服务分析文档的图谱分析主要包括如下几个方面:
(1)以系统清单为索引识别系统类实体并建立派生关系。
表6示出了上述的系统清单。
表6
从表6中抽取实体,以“系统名称”为实体名,“系统简称”、“系统描述”和“系统分层”为实体属性,且以内容作为属性的值,如实体【客户管理系统】,其实体属性如表7所示。
表7
同时建立系统的派生关系:
{【系统】<派生>(类型=实例化)【客户管理系统】}
以此类推构建系统相关模型。
(2)以服务接口分析全量文档为服务清单抽取识别服务,并构建服务派生关系和服务的消费提供关系。以ECIF系统部分服务接口为例,如表8所示:
表8
以上表中的服务场景名称作为实体名称抽取识别【服务】,其中“服务编码”、“场景编码”、“服务描述”等属性的值已经确定,以实体【个人客户基本信息创建与维护(含地址)】为例,抽取实体和实体属性,抽取到的实体与实体属性如表9所示。
表9
并建立服务派生关系,系统调用与提供服务关系,服务化接口关系如下三元组关系,如表10所示。
表10
2.2.2、接口设计文档的三元组分析
基于完成的接口识别和抽取,参照服务接口字段设计建立服务接口内请求与响应实体的属性抽取和关系建立。还以服务【个人客户基本信息创建与维护(含地址)】为例,如表11所示:
表11
其中抽取接口实体【储蓄客户基本信息创建与维护接口】,并拆分输入输出实体分别为【储蓄客户基本信息创建与维护接口输入信息】【储蓄客户基本信息创建与维护接口输出信息】,并将映射文档中的字段为接口实体的属性,对于数组字段,则新增对应数组字段,并建立输入输出实体对数组的<包括>关系,如实体【储蓄客户基本信息创建与维护接口输入信息】识别如下属性,如表12所示。
表12
并创建实体【储蓄客户基本信息创建与维护接口输入地址信息数组】和实体【储蓄客户基本信息创建与维护接口输入客户关系人数组】等,以【储蓄客户基本信息创建与维护接口输入地址信息数组】为例识别如下属性,如表13所示。
表13
识别得到的实体关系如表14所示。
表14
2.2.3、业务流程分解的分析
参照功能域分解和功能分解抽取识别,业务域实体,功能域实体和业务功能实体,以ECIF系统的业务分解为例,如表15所示:
表15
以业务域、功能域和业务功能作为实体名称进行抽取,并建立<分解>和<派生>关系得到三元组,如表16所示。
表16
参照业务分解和候选服务匹配进行业务流程的实体关系分析,并以此建立业务流程相关实体关系,同时参考候选服务匹配建立业务流程与接口和服务间的关系。
如【个人客户新增功能】流程,如表17所示。
表17
抽取其中候选服务的流程节点,并对照候选服务匹配中的“接口需求”在已有的接口实体中查找接口,并建立接口对应的服务场景与功能之间的<依赖>关系。这里需要明确的是在识别关系时必须将服务在流程中的序号作为依赖关系的属性记录下来,以便建立,如表18所示。
表18
2.3、外源性知识分析
当图谱体系足够强大和完善的时候,就可以逐步实现对外源性的知识文档的图谱分析。所谓外源性知识就是指收集到的没有经过统一处理的系统需求文档、设计文档、或者相关业务知识的相关文献书籍,这类知识数据可能是结构化的也可能是非结构化或半结构化,并且文档当中的词语也是相对离散的,所以基于以上的特征,对此类文档的分析步骤如下:
(1)筛选出识别抽取三元组的的语句或段落,比如句子“目前天津银行发行了101款理财产品。”
(2)利用语言分词模型将文本进行分词处理,拆分后得到“目前|天津银行|发行|了|101款|理财产品”;
(3)利用语义相似度识别技术将筛选出来语句或段落进行语义判断,识别句式的核心,并以此建立其中的主从与修饰关系,淘汰掉时间状语、定语和语气助词,并识别出其中核心词的主谓、谓宾关系。
(4)识别出三元组关系{【天津银行】<发行>【理财产品】},通过语义相似度识别比对,该三元组在现有图谱中是否存在相同或相似的实体与关系,同时基于累积标注信息得到{【银行】<派生>【天津银行】},进而推理得到{【银行】<发行>【理财产品】};
(5)最后将该三元组融合到图谱数据库中。
2.4、模型融合与纠偏
在模型填充与完善的过程中,需要不断地对已经生成的实体和关系进行融合,保证IT相关的实体不会脱离业务相关的自然实体而存在,致使整个图谱脱离业务实际,主要包括两方面:一方面是建立已有实体尚未发现的潜在关系;另一方面是在现有实体中查找遗漏和避重,避免因为实体缺失无法形成实体关系链。
2.4.1、接口实体与自然实体的关联
建立接口输入输出信息实体与业务自然实体的<涵盖>关系,以前文中2.2.2的实体【储蓄客户基本信息创建与维护接口输入信息】,如表19所示。
表19
属性 属性值 属性来源
客户号
客户名称
证件类型
证件号码
核实结果
...
从现有自然实体中的属性列表查找接口输入信息属性的来源,该过程需要基于对该接口和服务的功能足够的认识能够判断该接口的功能方向,同时判断该接口中属性的来源是否合理,如需要判断“客户号”和“客户名称”在“储蓄客户基本信息创建与维护”接口中自然是代指的【个人客户】的“客户编号”和“客户姓名”而不是【企业客户】实体或者其他【客户】相关实体,最终得到表20:
表20
并抽取关系,涵盖关系所涉及自然实体属性在作为关系属性标注,如表21所示。
表21
该过程前期依赖于大量繁复人工标注,当后期模型日趋完善,模型对于SOA服务的“了解”日趋完善,可以通过结合句法分析与语义相似度比对技术以机器学习的方式,对服务和接口分析,迭代的完成接口输入输出属性来源标注工作。
2.4.2、实体冲突消除
在图谱融合的过程中会出现大量的实体冲突的现象,主要的问题包括以下两类:一类是同名实体冲突和同义实体重叠,这就有赖于实体消歧和供指消解两项技术。
(1)实体消歧
实体消歧是专门用于解决同名实体产生歧义问题的技术。在实际语言环境中,经常会遇到某个实体指称项对应于多个命名实体对象的问题,例如【机构】这个名词(指称项)可以对应于银行的行内组织机构,也可能是指行外的管理机关,通过实体消歧,就可以根据当前的语境,准确建立实体链接。具体的方式是同名冲突排查,对排查发现的同名实体进行比对,包括实体的属性比对和实体的关系比对。比如,发现两个实体均为【个人客户】,其所包含的实体80%以上相同或相似(基于语义相似比对技术)。另外,这两个实体具有很多相同的关系(除派生关系),同时这些关系所关联的实体为同类型或同派生于同一个核心实体,如两个【个人客户】实体指称项,一个<持有>【身份证】,一个<持有>【军官证】,【身份证】和【军官证】均派生于【证件】,推理得到【个人客户】<持有>【证件】所以认为这两个实体指称项为一个实体。
(2)共指消解
共指消解技术主要用于解决多个指称项对应于同一实体对象的问题,也称对象对齐、实体匹配或实体同义。常见的例如,对于实体【个人客户】和【对私客户】,【VTM系统】和【虚拟柜员机系统】等等,对于该类实体的发现主要依赖于语义相似度识别技术和关系向量比对。从语义相似度的角度来说,就是直接比较两个实体的名称和其拥有的属性名称的相似度,设定阈值,当超过这个阈值时,就认为共指实体。从关系角度上,基于关系向量技术,构建两个比对实体全部关系链,将关系链上的实体溯源到核心实体,将关系链还原至本体层,形成关系向量,通过比对关系向量来对比两个实体的相似度。
但是无论是同义还是共指,最终的融合处理是相同的。对于确认为一个实体的,则将这两个实体相同或相近的属性和关系进行合并,取其并集,而经过确认确定为同名不同义的实体则通过明确区分派生关系进行分辨。
2.4.3、融合纠偏
在进行图谱模型的构建不是一蹴而就的,而是一个循环演进逐步优化的过程。在构建构成中需要面对实体冲突、关系重叠、实体缺失或关系缺失等问题,这个过程中需要人工标注和机器学习交替进行以保证最大地研发效率。其中人工在进行图谱回归验证的过程中,如果发现不合理的三元组关系或不合理的实体关系属性,需要进行人工纠偏和错误标注,例如发现三元组{【客户】<建设>【行内系统】},标注此项三元组有误,并将其其从图谱中抽离出来,并在添加到错误三元组清单中。在图谱中检查该三元组中前后实体的上下继承关系,对同样存在类似错误的三元组进行筛选,一同从图谱中剔除,如{【个人客户】<建设>【行内系统】}或{【企业客户】<建设>【核心业务系统】}。类似的,对于实体中的某些属性有错误,则需要进行属性错误标注,同样的对于该实体继承实体进行同样的错误检查。另外,在后续的图谱融合的过程中同样需要这样的技术进行错误标注,检查,以保证新录入的三元组不会再出现相似的错误。完整的图谱模型识别与融合流程如图7。
另外,本发明还提供一种银行金融系统知识图谱的应用方法。在此种方法中,人们根据前文描述的方式所获得的知识图谱,来获取关于银行金融系统的相关知识。
图8是本发明银行金融系统知识图谱的生成装置的结构图。参见图8,银行金融系统知识图谱的生成装置包括:中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统操作所需的各种程序和数据。CPU 801、ROM 802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
需要说明的是,本发明所提供的银行金融系统知识图谱的应用装置可同样可以具有如图8所示出的结构。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰,均落在本发明的保护范围内。

Claims (14)

1.一种银行金融系统知识图谱的生成方法,其特征在于,包括:
采用自上向下的过程,基于领域建模识别银行金融系统中本体层的核心实体及核心实体之间的关系;
采用自下向上的过程,综合各类系统需求与设计文档分析识别银行金融系统中的实体及实体之间的关系;
将通过自上向下过程识别到的核心实体与核心实体之间的关系,与通过自下向上过程识别得到的实体与实体之间的关系进行融合,得到银行金融系统的知识图谱。
2.根据权利要求1所述的银行金融系统知识图谱的生成方法,其特征在于,采用自上向下的过程,基于领域模型识别银行金融系统中本体层的核心实体及核心实体之间的关系,包括:
选取核心实体并建立核心实体派生关系;
构建核心实体间的关系;
回归验证框架可用性。
3.根据权利要求1所述的银行金融系统知识图谱的生成方法,其特征在于,所述文档包括:数据库设计文档、需求文档、接口设计文档、业务流程分析文档,或者其他外源性知识文档。
4.根据权利要求3所述的银行金融系统知识图谱的生成方法,其特征在于,采用自下向上的过程,基于银行系统数据库设计或表结构关系文档识别银行金融系统中的实体及实体之间的关系,包括:
根据数据库表结构,基于表和表字段识别实体和实体属性,并建立实体派生关系;
根据数据库表结构,基于数据库表的外键关系,识别定义实体间关系。
5.根据权利要求3所述的银行金融系统知识图谱的生成方法,其特征在于,采用自下向上的过程,基于需求文档识别银行金融系统中的实体及实体之间的关系,包括:
以系统清单为索引识别系统类实体并建立派生关系;
以服务接口分析文档为接口清单抽取识别服务实体,并构建服务接口派生关系和服务的消费提供关系;
建立服务接口派生关系,系统调用与提供服务关系,服务化接口关系。
6.根据权利要求3所述的银行金融系统知识图谱的生成方法,其特征在于,采用自下向上的过程,基于接口设计文档识别银行金融系统中的实体及实体之间的关系,包括:
由接口设计文档中识别和抽取接口实体;
参照接口字段映射建立服务内请求与响应实体的属性抽取和建立关系。
7.根据权利要求3所述的银行金融系统知识图谱的生成方法,其特征在于,采用自下向上的过程,基于业务流程分析文档识别银行金融系统中的实体及实体之间的关系,包括:
参照功能域分解和功能分解,对业务域实体、功能域实体和业务功能实体进行抽取和识别;
以业务域、功能域和业务功能作为实体名称进行抽取,并建立实体之间的分解关系及派生关系;
抽取其中候选服务的流程节点,并对照候选服务匹配中的接口需求在已有的接口实体中查找接口,并建立接口对应的服务场景与功能之间的依赖关系。
8.根据权利要求3所述的银行金融系统知识图谱的生成方法,其特征在于,采用自下向上的过程,基于外源性知识文档识别银行金融系统中的实体及实体之间的关系,包括:
由外源性文档中筛选出识别抽取三元组的的语句或段落;
利用语言分词模型将文本进行分词处理;
利用语义相似度识别技术将筛选出来语句或段落进行语义判断,识别句式的核心,并以此建立其中的主从与修饰关系,淘汰掉时间状语、定语和语气助词,并识别出其中核心词的主谓、谓宾关系;
识别出实体之间的三元组关系。
9.根据权利要求1所述的银行金融系统知识图谱的生成方法,其特征在于,将通过自上向下过程识别到的核心实体与核心实体之间的关系,与通过自下向上过程识别得到的实体与实体之间的关系进行融合,得到银行系统的知识图谱,包括:
建立接口输入输出信息实体与业务自然实体之间的涵盖关系;
根据关系匹配,以及语义相似度比较,对实体冲突进行消除;
在图谱融合过程中,进行融合纠偏标注;
对标注纠偏进行全图谱检查,并在后续融合中持续进行历史标注检查。
10.根据权利要求9所述的银行金融系统知识图谱的生成方法,其特征在于,根据关系匹配,以及语义相似度比较,对实体冲突进行消除,包括:
根据实体“派生”关系推理与对实体间的关系匹配,对通过自上向下识别得到的实体,以及通过自下向上识别得到的实体进行对比,实现冲突消除;
根据语义相似度的比较对通过自上向下识别得到的实体,以及通过自下向上识别得到的实体进行对比,实现冲突消除。
11.根据权利要求1至10任意一项所述的银行金融系统知识图谱的生成方法,其特征在于,所述银行金融系统设计思想基于SOA架构分析。
12.一种银行金融系统知识图谱的生成装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求1至11任意一项所述的银行金融系统知识图谱的生成方法。
13.一种银行金融系统知识图谱的应用方法,其特征在于,包括:
根据权利要求1至11任意一项所述的银行金融系统知识图谱的生成方法而构建的知识图谱获取关于银行金融系统的知识。
14.一种银行金融系统知识图谱的应用装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求13所述的银行金融系统知识图谱的应用方法。
CN201910870558.8A 2019-09-16 2019-09-16 银行金融系统知识图谱的生成方法及装置、应用方法及装置 Pending CN110569369A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910870558.8A CN110569369A (zh) 2019-09-16 2019-09-16 银行金融系统知识图谱的生成方法及装置、应用方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910870558.8A CN110569369A (zh) 2019-09-16 2019-09-16 银行金融系统知识图谱的生成方法及装置、应用方法及装置

Publications (1)

Publication Number Publication Date
CN110569369A true CN110569369A (zh) 2019-12-13

Family

ID=68780240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910870558.8A Pending CN110569369A (zh) 2019-09-16 2019-09-16 银行金融系统知识图谱的生成方法及装置、应用方法及装置

Country Status (1)

Country Link
CN (1) CN110569369A (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126073A (zh) * 2019-12-23 2020-05-08 中国建设银行股份有限公司 语义检索方法和装置
CN111191043A (zh) * 2019-12-25 2020-05-22 北京航天云路有限公司 一种基于企业数据的知识图谱Schema设计方法
CN111242774A (zh) * 2020-01-23 2020-06-05 中国建设银行股份有限公司 银行客户资产图谱构建方法和装置
CN111428099A (zh) * 2020-03-23 2020-07-17 中国建设银行股份有限公司 基于物联网的金融服务能力查询方法及网点管理中心系统
CN111522963A (zh) * 2020-04-14 2020-08-11 南京烽火星空通信发展有限公司 一种基于公安知识图谱引擎的智能助理应用交互方法
CN111625655A (zh) * 2020-05-12 2020-09-04 埃睿迪信息技术(北京)有限公司 基于知识图谱的归并以及分类方法、装置以及存储介质
CN111754340A (zh) * 2020-07-03 2020-10-09 交通银行股份有限公司 一种基于图数据库的担保网络风险排查系统
CN111859969A (zh) * 2020-07-20 2020-10-30 航天科工智慧产业发展有限公司 数据分析方法及装置、电子设备、存储介质
CN112148735A (zh) * 2020-09-23 2020-12-29 上海爱数信息技术股份有限公司 一种用于结构化表格数据知识图谱的构建方法
CN112231285A (zh) * 2020-10-20 2021-01-15 北京恒华龙信数据科技有限公司 基于数据资源的知识图谱生成方法及装置
CN112417175A (zh) * 2020-12-07 2021-02-26 北京明略软件系统有限公司 面向维修工单的文档检索方法、系统、计算机及存储介质
CN112463890A (zh) * 2020-12-10 2021-03-09 电子科技大学 基于区块链和机器学习的跨系统数据共享方法
CN112579887A (zh) * 2020-12-01 2021-03-30 重庆邮电大学 一种基于用户评分预测用户对项目属性偏好的系统及方法
CN112860677A (zh) * 2021-02-25 2021-05-28 深圳证券交易所 实体判重方法、终端设备及存储介质
CN112860913A (zh) * 2021-02-24 2021-05-28 广州汇通国信科技有限公司 一种知识图谱的本体创建方法
CN112883202A (zh) * 2021-03-26 2021-06-01 江苏省未来网络创新研究院 一种基于知识图谱的多组件建模方法和系统
CN112966057A (zh) * 2021-04-22 2021-06-15 上海深杳智能科技有限公司 知识图谱构建方法、系统、信息处理系统、终端及介质
CN113010676A (zh) * 2021-03-15 2021-06-22 北京语言大学 一种文本知识提取方法、装置及自然语言推断系统
CN113140134A (zh) * 2021-03-12 2021-07-20 北京航空航天大学 一种智慧空管系统的体系架构
CN113139036A (zh) * 2020-01-20 2021-07-20 海信视像科技股份有限公司 一种信息交互方法及设备
CN113360678A (zh) * 2021-07-08 2021-09-07 电子科技大学 一种基于Neo4j和大数据的初等数学知识图谱构建方法
CN113487416A (zh) * 2021-07-26 2021-10-08 中国科学院大学 一种基于知识图谱的金融风险评估方法
CN113609257A (zh) * 2021-08-09 2021-11-05 神州数码融信软件有限公司 一种金融知识图谱弹性框架构建方法
WO2022001924A1 (zh) * 2020-06-30 2022-01-06 华为技术有限公司 构建知识图谱的方法、装置及系统、计算机存储介质
CN115203576A (zh) * 2022-09-09 2022-10-18 中信建投证券股份有限公司 一种金融知识协同管理系统、方法、设备及存储介质
CN117235200A (zh) * 2023-09-12 2023-12-15 杭州湘云信息技术有限公司 基于ai技术的数据集成方法、装置、计算机设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090164387A1 (en) * 2007-04-17 2009-06-25 Semandex Networks Inc. Systems and methods for providing semantically enhanced financial information
CN108196880A (zh) * 2017-12-11 2018-06-22 北京大学 软件项目知识图谱自动构造方法与系统
CN108932340A (zh) * 2018-07-13 2018-12-04 华融融通(北京)科技有限公司 一种不良资产经营领域下金融知识图谱的构建方法
CN109241199A (zh) * 2018-08-08 2019-01-18 广州初星科技有限公司 一种面向金融知识图谱发现的方法
CN109284394A (zh) * 2018-09-12 2019-01-29 青岛大学 一种从多源数据集成视角构建企业知识图谱的方法
CN109446343A (zh) * 2018-11-05 2019-03-08 上海德拓信息技术股份有限公司 一种公共安全知识图谱构建的方法
CN110209826A (zh) * 2018-02-06 2019-09-06 武汉观图信息科技有限公司 一种面向银行风险控制的金融图谱构建与分析方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090164387A1 (en) * 2007-04-17 2009-06-25 Semandex Networks Inc. Systems and methods for providing semantically enhanced financial information
CN108196880A (zh) * 2017-12-11 2018-06-22 北京大学 软件项目知识图谱自动构造方法与系统
CN110209826A (zh) * 2018-02-06 2019-09-06 武汉观图信息科技有限公司 一种面向银行风险控制的金融图谱构建与分析方法
CN108932340A (zh) * 2018-07-13 2018-12-04 华融融通(北京)科技有限公司 一种不良资产经营领域下金融知识图谱的构建方法
CN109241199A (zh) * 2018-08-08 2019-01-18 广州初星科技有限公司 一种面向金融知识图谱发现的方法
CN109284394A (zh) * 2018-09-12 2019-01-29 青岛大学 一种从多源数据集成视角构建企业知识图谱的方法
CN109446343A (zh) * 2018-11-05 2019-03-08 上海德拓信息技术股份有限公司 一种公共安全知识图谱构建的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王仁武等: "基于深度学习与图数据库构建中文商业知识图谱的探索研究", 《图书与情报》 *

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126073A (zh) * 2019-12-23 2020-05-08 中国建设银行股份有限公司 语义检索方法和装置
CN111126073B (zh) * 2019-12-23 2023-07-04 中国建设银行股份有限公司 语义检索方法和装置
CN111191043A (zh) * 2019-12-25 2020-05-22 北京航天云路有限公司 一种基于企业数据的知识图谱Schema设计方法
CN113139036A (zh) * 2020-01-20 2021-07-20 海信视像科技股份有限公司 一种信息交互方法及设备
CN113139036B (zh) * 2020-01-20 2022-07-01 海信视像科技股份有限公司 一种信息交互方法及设备
CN111242774A (zh) * 2020-01-23 2020-06-05 中国建设银行股份有限公司 银行客户资产图谱构建方法和装置
CN111428099A (zh) * 2020-03-23 2020-07-17 中国建设银行股份有限公司 基于物联网的金融服务能力查询方法及网点管理中心系统
CN111428099B (zh) * 2020-03-23 2023-12-26 中国建设银行股份有限公司 基于物联网的金融服务能力查询方法及网点管理中心系统
CN111522963A (zh) * 2020-04-14 2020-08-11 南京烽火星空通信发展有限公司 一种基于公安知识图谱引擎的智能助理应用交互方法
CN111625655A (zh) * 2020-05-12 2020-09-04 埃睿迪信息技术(北京)有限公司 基于知识图谱的归并以及分类方法、装置以及存储介质
WO2022001924A1 (zh) * 2020-06-30 2022-01-06 华为技术有限公司 构建知识图谱的方法、装置及系统、计算机存储介质
CN111754340B (zh) * 2020-07-03 2022-06-21 交通银行股份有限公司 一种基于图数据库的担保网络风险排查系统
CN111754340A (zh) * 2020-07-03 2020-10-09 交通银行股份有限公司 一种基于图数据库的担保网络风险排查系统
CN111859969B (zh) * 2020-07-20 2024-05-03 航天科工智慧产业发展有限公司 数据分析方法及装置、电子设备、存储介质
CN111859969A (zh) * 2020-07-20 2020-10-30 航天科工智慧产业发展有限公司 数据分析方法及装置、电子设备、存储介质
CN112148735A (zh) * 2020-09-23 2020-12-29 上海爱数信息技术股份有限公司 一种用于结构化表格数据知识图谱的构建方法
CN112148735B (zh) * 2020-09-23 2023-05-26 上海爱数信息技术股份有限公司 一种用于结构化表格数据知识图谱的构建方法
CN112231285A (zh) * 2020-10-20 2021-01-15 北京恒华龙信数据科技有限公司 基于数据资源的知识图谱生成方法及装置
CN112579887B (zh) * 2020-12-01 2023-05-30 重庆邮电大学 一种基于用户评分预测用户对项目属性偏好的系统及方法
CN112579887A (zh) * 2020-12-01 2021-03-30 重庆邮电大学 一种基于用户评分预测用户对项目属性偏好的系统及方法
CN112417175A (zh) * 2020-12-07 2021-02-26 北京明略软件系统有限公司 面向维修工单的文档检索方法、系统、计算机及存储介质
CN112463890B (zh) * 2020-12-10 2023-05-26 电子科技大学 基于区块链和机器学习的跨系统数据共享方法
CN112463890A (zh) * 2020-12-10 2021-03-09 电子科技大学 基于区块链和机器学习的跨系统数据共享方法
CN112860913A (zh) * 2021-02-24 2021-05-28 广州汇通国信科技有限公司 一种知识图谱的本体创建方法
CN112860913B (zh) * 2021-02-24 2024-03-08 广州汇通国信科技有限公司 一种知识图谱的本体创建方法
CN112860677A (zh) * 2021-02-25 2021-05-28 深圳证券交易所 实体判重方法、终端设备及存储介质
CN112860677B (zh) * 2021-02-25 2023-10-03 深圳证券交易所 实体判重方法、终端设备及存储介质
CN113140134A (zh) * 2021-03-12 2021-07-20 北京航空航天大学 一种智慧空管系统的体系架构
CN113010676A (zh) * 2021-03-15 2021-06-22 北京语言大学 一种文本知识提取方法、装置及自然语言推断系统
CN113010676B (zh) * 2021-03-15 2023-12-08 北京语言大学 一种文本知识提取方法、装置及自然语言推断系统
CN112883202A (zh) * 2021-03-26 2021-06-01 江苏省未来网络创新研究院 一种基于知识图谱的多组件建模方法和系统
CN112966057A (zh) * 2021-04-22 2021-06-15 上海深杳智能科技有限公司 知识图谱构建方法、系统、信息处理系统、终端及介质
CN113360678A (zh) * 2021-07-08 2021-09-07 电子科技大学 一种基于Neo4j和大数据的初等数学知识图谱构建方法
CN113487416A (zh) * 2021-07-26 2021-10-08 中国科学院大学 一种基于知识图谱的金融风险评估方法
CN113609257A (zh) * 2021-08-09 2021-11-05 神州数码融信软件有限公司 一种金融知识图谱弹性框架构建方法
CN113609257B (zh) * 2021-08-09 2024-03-22 神州数码融信软件有限公司 一种金融知识图谱弹性框架构建方法
CN115203576A (zh) * 2022-09-09 2022-10-18 中信建投证券股份有限公司 一种金融知识协同管理系统、方法、设备及存储介质
CN117235200A (zh) * 2023-09-12 2023-12-15 杭州湘云信息技术有限公司 基于ai技术的数据集成方法、装置、计算机设备及存储介质
CN117235200B (zh) * 2023-09-12 2024-05-10 杭州湘云信息技术有限公司 基于ai技术的数据集成方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN110569369A (zh) 银行金融系统知识图谱的生成方法及装置、应用方法及装置
WO2021103492A1 (zh) 一种企业经营风险预测方法和系统
WO2021196520A1 (zh) 一种面向税务领域知识图谱的构建方法及系统
CN112612902A (zh) 一种电网主设备的知识图谱构建方法及设备
Hao et al. Integrating and navigating engineering design decision-related knowledge using decision knowledge graph
CN111581990A (zh) 跨境交易撮合匹配方法及装置
CN113934868A (zh) 政务大数据治理方法及系统
CN111177322A (zh) 一种领域知识图谱的本体模型构建方法
US12008047B2 (en) Providing an object-based response to a natural language query
Tao et al. Research on marketing management system based on independent ERP and business BI using fuzzy TOPSIS
CN114004581A (zh) 一种基于多维政务事项知识库的意图交互系统
Ramar et al. Technical review on ontology mapping techniques
CN114238655A (zh) 企业关联关系识别方法、装置、设备及介质
Zhang Evaluation and analysis of human resource management mode and its talent screening factors based on decision tree algorithm
Morrison et al. Business process integration: Method and analysis
CN113610626A (zh) 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质
CN114153983A (zh) 一种行业知识图谱的多源构建方法
Antopol’skii et al. The development of a semantic network of keywords based on definitive relationships
US20230072607A1 (en) Data augmentation and enrichment
CN111177653A (zh) 一种信用评估方法和装置
US20230281212A1 (en) Generating smart automated data movement workflows
Edris Abadi et al. A clustering approach for data quality results of research information systems
Croce et al. On the experimental usage of ontology-based data management for the italian integrated system of statistical registers: quality issues
Vargas-Vera et al. A framework for detecting and removing knowledge overlaps in a collaborative environment: case of study a computer configuration problem
Van Laere et al. A method for detecting behavior-based user profiles in collaborative ontology engineering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination