CN114238662A - 一种面向银行业的全栈式金融知识图谱平台 - Google Patents

一种面向银行业的全栈式金融知识图谱平台 Download PDF

Info

Publication number
CN114238662A
CN114238662A CN202111595423.9A CN202111595423A CN114238662A CN 114238662 A CN114238662 A CN 114238662A CN 202111595423 A CN202111595423 A CN 202111595423A CN 114238662 A CN114238662 A CN 114238662A
Authority
CN
China
Prior art keywords
map
data
graph
task
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111595423.9A
Other languages
English (en)
Inventor
汪娜
沈稚源
仇钧
付韶兴
涂文斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of Communications Co Ltd
Original Assignee
Bank of Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Communications Co Ltd filed Critical Bank of Communications Co Ltd
Priority to CN202111595423.9A priority Critical patent/CN114238662A/zh
Publication of CN114238662A publication Critical patent/CN114238662A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种面向银行业的全栈式金融知识图谱平台,包括:图谱构建层,被配置为,进行源数据管理、创建逻辑图本体、生产图谱、进行图谱治理和进行任务调度;图仓管理层,被配置为,针对具体业务场景存储不同领域的图谱;服务应用层,被配置为,进行图谱可视化搜索、图谱数据挖掘、图谱查询和图谱模型应用;应用接口层,被配置为,为平台提供金融知识图谱服务访问能力。与现有技术相比,本发明实现了知识获取、知识表示、知识存储、知识融合、知识建模、知识计算、知识应用的图谱管理关键环节,支持知识原料到智慧数据转化的全过程,提供了全栈式图谱生产与应用服务能力,提高了图谱构建与生产效率。

Description

一种面向银行业的全栈式金融知识图谱平台
技术领域
本发明涉及银行业的知识图谱领域,尤其是涉及一种面向银行业的全栈式金融知识图谱平台。
背景技术
随着银行业务快速增长和客户服务水平的不断提高,数据以一种新的经济资产类别形式呈现出来,银行业迈入一个崭新的大数据信息时代,传统的数据库技术已难以支撑大数据处理需求,需要建立新型的创新机制,为基于大数据的业务模式创新提供条件与保障。近年来,国内各大银行业机构纷纷搭建大数据平台、数据仓库这类系统,但是海量数据内部的深层次关联关系仍然没有被构建出来,无法为风险管控、客户营销和全行级知识管理等领域提供全方位数据支持。
数据是基础,关系是关键,知识图谱作为一种实现数据和关系有效整合的新技术应运而生。知识图谱是用图的形式去存储和表示知识,是数据和关系最直观有效的表示方式。基于银行业务知识构建金融知识图谱,提供关联关系查询探索,支持业务规则挖掘分析。知识图谱作为一项新技术,其技术发展尚不够成熟,配套基础设施尚不够完善,难以满足不断增长的银行业图谱应用需求。因此,如何构建面向银行业的企业级知识图谱平台,是金融知识图谱技术应用推广的首要任务。
近年来,国内各大银行陆续对知识图谱技术展开探索与研究,并在获客营销、风险管控等业务场景进行实践应用,银行业内知识图谱技术的应用发展大致分为三个阶段。第一阶段是针对具体业务场景,构建业务领域图谱,提供关联关系查询和分析,并通过接口形式向应用系统提供服务。第二阶段是将知识图谱与机器学习技术相结合,构建基于知识图谱的机器学习模型,通过图算法抽取图特征,输入机器学习模型训练,提升模型预测的准确率,对金融图谱的可解释性规则进行挖掘,实现机器对信息的认知与感知。第三阶段是构建全域知识体系,快速实现生态内图智能应用,推动银行业务图谱服务向主动化、智慧化、个性化发展。目前国内银行机构对金融知识图谱技术的应用主要处于前两个阶段,伴随应用规模的拓展,其管理弊端逐渐凸显,存在以下三大痛点:
1、图谱应用以特定业务领域知识需求为导向,各自构建的图谱异质且分散,难以集成与复用。目前交行已构建对公、零售、风险、人资等领域图谱,分别运用于风险监测、授信管理、零售反欺诈、营销拓客、员工画像等业务场景,不同的领域图谱存储介质和本体结构均有所差异,难以实现图谱融合并对应用提供统一的图谱服务。
2、构建适配自身业务且落地支持应用的知识图谱,技术门槛较高,对非专业技术人员不友好。知识图谱的构建包括本体设计、schema建立、数据导入、图查询算法编写等步骤,其中涉及不同的本体设计工具、数据处理语言和图数据库产品,操作方法与编程语法呈现多样化特征,大多数银行业务人员难以全面掌握。
3、图谱构建与生产的不同环节交互复杂、协同效应差,图谱应用总体效率难以突破。从图谱数据导入到图谱构建,从图谱生产到图谱可视化展现,从图谱挖掘到图谱分析,图谱构建与生产的不同环节存在数据与服务的交互需求,目前主要通过批量文件传输与联机接口实现交互,没有统一的规范与标准,导致图谱应用技术复杂、效率低下。
现有技术中有如下技术方案:
现有技术一:全线下手工处理图谱生产各环节是现有技术方案之一。结合业务知识手动创建实体关系三元组集合,采用Visio或者PPT绘制图谱模式。从业务系统获取源数据,手动完成图谱点边关系数据加工处理,生成点边关系文件导入图数据库,结合图数据库语言手动编写查询,为各类应用场景提供图谱查询服务。
现有技术一的缺点为:该技术方案中图谱生产工作主要依赖人工进行,包括数据收集、数据清洗、数据处理到图谱构建、图谱应用等整个流程,自动化程度低,导致图谱生产效率低下,无法快速响应银行日益增长的图谱应用需求。此外,图谱模式的构建工作高度依赖于业务专家的知识输入,具备较强的行业属性,通用性差,阻碍了图谱技术的规模化应用。
现有技术二:借助工具实现半自动化图谱生产是现有技术方案之二。依赖已有工具实现图谱生产的部分环节,包括源数据加工、图谱建模、图谱构建及图谱应用等环节,一定程度上提升了图谱生产效率。例如,常见的本体设计工具Protege提供处理图数据模型的创建、读取、更新和导出操作;商业化图数据库产品TigerGraph和Neo4j支持以节点、边和属性的原生图格式存储和查询数据,并提供类SQL语言用于图查询;Hadoop大数据生态下Spark组件内置高性能分布式图计算引擎GraphX,支持各类图指标计算与分析;前端页面可视化工具Cytoscape支持对节点与关系网络的可视化展示与探索。
现有技术二的缺点为:
第一,未涉及图谱治理。不同业务场景构建的领域图谱异质且分散,图谱治理难度大,无法形成银行业全域图谱,难以满足企业级图谱应用需求。该技术方案亟需一套统一的图谱治理框架,指导用户进行规范化的图谱生产,实现与外部数据源的高效融合,为开放银行的建设打造坚实的数据底座。
第二,缺少弹性的图数据共享架构。针对不同业务场景的图谱运营需求,该技术方案需由业务人员与技术人员分别提供领域模型与设计模式,共同协作完成图谱生产,实际应用中存在团队沟通成本高、图谱研发周期长、数据安全不可控、复用率低等问题。亟待提出一套平台化实现架构,由平台层提供图谱生产流水线、数据权限管理、图谱模式共享等公共服务,面向业务域提供自服务的图谱生产组件,快速适配不同业务场景需求,获得灵活可扩展的图数据共享能力。
发明内容
本发明的目的就是为了克服上述现有技术存在图谱构建和生产效率低、图谱异质分散难以复用、技术门槛高的缺陷而提供一种面向银行业的全栈式金融知识图谱平台。
本发明的目的可以通过以下技术方案来实现:
一种面向银行业的全栈式金融知识图谱平台,包括:
图谱构建层,被配置为,进行源数据管理、创建逻辑图本体、生产图谱、进行图谱治理和进行任务调度;
图仓管理层,被配置为,针对具体业务场景存储不同领域的图谱;
服务应用层,被配置为,进行图谱可视化搜索、图谱数据挖掘、图谱查询和图谱模型应用;
应用接口层,被配置为,为平台提供金融知识图谱服务访问能力。
进一步地,所述全栈式金融知识图谱平台还包括:
基础设施层,被配置为,为图谱构建层提供平台源数据。
进一步地,所述基础设施层包括Paas云平台、大数据平台和AI能力平台中的一个或多个。
进一步地,所述图谱构建层包括源数据管理模块、建模中心、图谱生产中心、图谱治理中心和调度中心。
进一步地,所述源数据管理模块包括:
数据源同步子模块,被配置为,通过文件系统、实时接入数据和/或关系型数据库接入数据源;同步展示数据源内数据表名及中文描述信息;提供数据源同步过滤器,支持按增量、时间窗口、字段数值大小和/或表达式过滤;支持定时、按任务依赖关系调度;
逻辑表映射子模块,被配置为,提供表格和图形化两类逻辑表数据映射方式,逐层实现实体/关系对象与数据表、实体/关系属性与表字段之间的映射关系,支持交互式数据查询、搜索与筛选。
进一步地,所述建模中心包括:
本体创建子模块,被配置为,支持图形化和列表两种可视化创建本体,内置系统本体与系统属性可供继承设计,创建的本体提供一键引入作为项目逻辑图的本体的功能;
本体管理子模块,被配置为,按本体类型区分为私有本体和共享本体,私有本体仅对创建该本体的用户可见,共享本体可分享给其他用户;提供本体版本管理功能,支持本体历史版本的查看与回溯。
进一步地,所述图谱生产中心包括:
图谱构建子模块,被配置为,支持用户配置数据生产任务并将生产的点边数据发布至图数据库,提供覆盖数据读取、数据清洗、数据映射、图数据库导入的算子,用于不同的图谱生产任务;
图谱存储子模块,被配置为,支持图数据库管理员对图谱平台拥有的图数据库资源进行维护,该维护包括资源的创建、修改、删除和查看,创建后的图数据库资源在用户创建逻辑图时分配使用,提供各项目占用硬件资源的统一视图;
血缘分析子模块,被配置为,提供任务级别、数据级别和字段级别三种级别的血缘分析功能,支持用户可视化查看源数据和图谱数据的血缘关系图及数据流转路径。
进一步地,所述图谱治理中心包括:
图谱注册子模块,被配置为,对于图谱项目的创建者,提供图谱本体及图谱对外服务的登记、注册、变更功能;对于用户,提供对创建的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置进行发布申请;支持图谱生产者利用图谱发布申请功能查看项目下图谱的版本修改情况;
图谱发布子模块,被配置为,支持对平台上所有图谱项目的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置进行审批。
进一步地,所述调度中心包括:
任务维护子模块,被配置为,查询图谱生产类任务及图谱挖掘类任务,终止或修改任务配置进行任务维护;
任务运行子模块,被配置为,选择任务运行的时间范围,指定以月、周、日为单位的任务执行周期;
任务监控子模块,被配置为,对于创建执行的任务,实时展示任务运行状态,统计任务执行时长与资源占用情况。
进一步地,所述服务应用层包括:
图谱探索模块,被配置为,支持用户对图谱数据进行可视化探索,该可视化探索包括图谱可视化、图内过滤搜索、路径查询和时间轴查询;
图谱挖掘模块,被配置为,支持用户对生产后的图谱数据进行各种图指标计算和分析,图指标计算采用的图算法包括社区检测、中心性度量和路径查找;
图谱查询模块,被配置为,提供实时联机图查询服务、离线图查询功能,离线图查询功能处理的任务类型包括单实体多实体路径、多实体多实体路径、批量实体间路径和批量实体展开;
图谱智能模型应用模块,被配置为,支持用户根据需要的业务场景,完成图特征构建、特征工程、算法建模、模型发布的模型构建全流程;基于图计算技术,计算反映业务情况和图拓扑结构情况的各种图指标和图模式指标;基于图特征,提供多种机器学习模型及模型自适应调优工具进行一站式配置建模。
与现有技术相比,本发明构建的知识图谱平台提供全流程图谱服务能力,降低知识图谱构建门槛,提高图谱构建与生产效率,帮助用户沉淀行业知识与经验。
具有以下优点:
(1)提供一站式图谱服务生态平台,缩短图谱生产周期,迅速响应业务需求。平台提供从知识获取、知识表示、知识存储、知识融合、知识建模到知识计算、知识应用和图谱治理的一站式全流程图谱服务,形成“图谱构建-图谱治理-图谱应用”的完整生态闭环,实现知识图谱从简单使用到生态打造的跃迁。平台用户无需关注底层细节,通过专门的设计的知识图谱构建流水线,有效缩短图谱构建周期,提高业务处理效率。
(2)实现包含图谱注册、图谱变更、图谱审批、图谱发布的图谱治理框架,指导用户进行规范化的图谱治理,并基于治理框架对行内数据、第三方合作数据、互联网数据等多源异构数据进行统一整合,以图谱为载体构建商业银行全域知识管理体系,为全行级知识管理平台的建设奠定基础。平台打破传统数据资产的生态位屏蔽以及数据孤岛,把散落的知识关联起来,产生高维认知重构数据价值,实现金融知识向业务智慧的转化,助力商业银行数字化转型。
(3)平台涵盖源数据管理、建模中心、图谱生产中心、应用中心、图谱治理中心及调度中心的图谱全生命周期管理组件,提供全栈式图谱生产与应用服务能力,支撑用户调用自定义组件式服务快速响应银行各类业务场景需求。平台实现知识抽取及知识建模等应用,支持非结构化、半结构化、结构化数据的接入与处理,快速完成亿级以上的实体和关系导入,基于预定义图算法对数据进行深度关联分析,也支持用户根据业务特性就应用场景自定义图查询,实现毫秒级查询响应,广泛运用于各类银行业务场景。
附图说明
图1为本发明实施例中提供的一种基于全栈式金融知识图谱平台的图谱应用网格化开发模式示意图;
图2为本发明实施例中提供的一种面向银行业的全栈式金融知识图谱平台逻辑架构图;
图3为本发明实施例中提供的一种面向银行业的全栈式金融知识图谱平台业务流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
实施例1
本实施例提供一种面向银行业的全栈式金融知识图谱平台,包括:
图谱构建层,被配置为,进行源数据管理、创建逻辑图本体、生产图谱、进行图谱治理和进行任务调度;
图仓管理层,被配置为,针对具体业务场景存储不同领域的图谱;
服务应用层,被配置为,进行图谱可视化搜索、图谱数据挖掘、图谱查询和图谱模型应用;
应用接口层,被配置为,为平台提供金融知识图谱服务访问能力;
基础设施层,被配置为,为图谱构建层提供平台源数据,该基础设施层包括Paas云平台、大数据平台和AI能力平台中的一个或多个。
所述图谱构建层包括源数据管理模块、建模中心、图谱生产中心、图谱治理中心和调度中心。
具体地:
源数据管理模块包括:
数据源同步子模块,被配置为,通过文件系统、实时接入数据和/或关系型数据库接入数据源;同步展示数据源内数据表名及中文描述信息;提供数据源同步过滤器,支持按增量、时间窗口、字段数值大小和/或表达式过滤;支持定时、按任务依赖关系调度;
逻辑表映射子模块,被配置为,提供表格和图形化两类逻辑表数据映射方式,逐层实现实体/关系对象与数据表、实体/关系属性与表字段之间的映射关系,支持交互式数据查询、搜索与筛选。
建模中心包括:
本体创建子模块,被配置为,支持图形化和列表两种可视化创建本体,内置系统本体与系统属性可供继承设计,创建的本体提供一键引入作为项目逻辑图的本体的功能;
本体管理子模块,被配置为,按本体类型区分为私有本体和共享本体,私有本体仅对创建该本体的用户可见,共享本体可分享给其他用户;提供本体版本管理功能,支持本体历史版本的查看与回溯。
图谱生产中心包括:
图谱构建子模块,被配置为,支持用户配置数据生产任务并将生产的点边数据发布至图数据库,提供覆盖数据读取、数据清洗、数据映射、图数据库导入的算子,用于不同的图谱生产任务;
图谱存储子模块,被配置为,支持图数据库管理员对图谱平台拥有的图数据库资源进行维护,该维护包括资源的创建、修改、删除和查看,创建后的图数据库资源在用户创建逻辑图时分配使用,提供各项目占用硬件资源的统一视图;
血缘分析子模块,被配置为,提供任务级别、数据级别和字段级别三种级别的血缘分析功能,支持用户可视化查看源数据和图谱数据的血缘关系图及数据流转路径。
图谱治理中心包括:
图谱注册子模块,被配置为,对于图谱项目的创建者,提供图谱本体及图谱对外服务的登记、注册、变更功能;对于用户,提供对创建的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置进行发布申请;支持图谱生产者利用图谱发布申请功能查看项目下图谱的版本修改情况;
图谱发布子模块,被配置为,支持对平台上所有图谱项目的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置进行审批。
调度中心包括:
任务维护子模块,被配置为,查询图谱生产类任务及图谱挖掘类任务,终止或修改任务配置进行任务维护;
任务运行子模块,被配置为,选择任务运行的时间范围,指定以月、周、日为单位的任务执行周期;
任务监控子模块,被配置为,对于创建执行的任务,实时展示任务运行状态,统计任务执行时长与资源占用情况。
服务应用层包括:
图谱探索模块,被配置为,支持用户对图谱数据进行可视化探索,该可视化探索包括图谱可视化、图内过滤搜索、路径查询和时间轴查询;
图谱挖掘模块,被配置为,支持用户对生产后的图谱数据进行各种图指标计算和分析,图指标计算采用的图算法包括社区检测、中心性度量和路径查找;
图谱查询模块,被配置为,提供实时联机图查询服务、离线图查询功能,离线图查询功能处理的任务类型包括单实体多实体路径、多实体多实体路径、批量实体间路径和批量实体展开;
图谱智能模型应用模块,被配置为,支持用户根据需要的业务场景,完成图特征构建、特征工程、算法建模、模型发布的模型构建全流程;基于图计算技术,计算反映业务情况和图拓扑结构情况的各种图指标和图模式指标;基于图特征,提供多种机器学习模型及模型自适应调优工具进行一站式配置建模。
下面对本实施例面向银行业的全栈式金融知识图谱平台进行具体描述:
平台实现知识获取、知识表示、知识存储、知识融合、知识建模、知识计算、知识应用的图谱管理关键环节,支持知识原料到智慧数据转化的全过程,提供全栈式图谱生产与应用服务能力,提高图谱构建与生产效率。
平台实现包含图谱注册、图谱变更、图谱审批、图谱发布的图谱治理框架,指导用户进行规范化的图谱治理,并基于治理框架对行内数据、第三方合作数据、互联网数据等多源异构数据进行统一整合,以图谱为载体构建全域智能知识管理体系,为商业银行全行级知识管理平台和智慧大脑的建设奠定基石。平台提供可视化组件,展示图谱全景视图,支持分析挖掘与模型应用,满足多业务场景下用户可视化生产和查询图谱的需求,快速实现生态内图谱智能应用。
在架构设计上,采用了云化部署微服务架构,实现不同业务场景下自定义组件式服务集合;在图谱存储上,采用了分布式多元原生图存储访问引擎,实现字段级数据权限模型,支持按图节点、关系及节点属性字段多种粒度对不同用户角色实现数据权限控制;在图谱生产上,提供基于可视化界面的图谱生产工作流服务,支持在DAG画布中通过托拉拽方式组合不同的图谱生产算子。基于全栈式金融知识图谱平台的图谱应用网格化开发模式示意图如图1所示。
如图2所示,全栈式金融知识图谱平台由图谱构建层、图仓管理层、服务应用层、应用接口层四部分组成:
(1)图谱构建层提供图谱生产和治理的核心功能组件以及任务调度能力。
(2)图仓管理层针对具体业务场景沉淀多项领域图谱资产。
(3)服务应用层提供基于图谱平台开发的图查询挖掘、图智能模型应用功能。
(4)应用接口层为应用系统提供金融知识图谱服务访问能力,接口包含H5页面嵌入、HTTP联机接口和批量文件交互三种方式。
平台图谱构建层核心组件提供的能力如下:
1、源数据管理
数据源同步:支持以文件系统、实时接入数据、关系型数据库等多种形式接入数据源,用户可选择不同数据源类型,按照系统提示填写数据源相关信息。用户选定数据源后,平台同步展示数据源内数据表名及中文描述信息,支持进一步钻取查看表内详细数据。平台提供数据源同步过滤器,用户可设置过滤条件,支持按增量、时间窗口、字段数值大小、表达式等多种方式过滤,减少数据处理工作量。数据源同步任务支持定时、按任务依赖关系调度。
逻辑表映射:平台提供表格和图形化两类逻辑表数据映射方式,逐层实现实体/关系对象与数据表、实体/关系属性与表字段之间的映射关系。数据映射过程中支持交互式数据查询、搜索与筛选,降低用户操作风险。
2、建模中心
本体创建:支持图形化和列表两种可视化创建本体,且内置系统本体与系统属性可供继承设计,提高复用程度;待本体创建完成后,图谱项目可一键引入本体,作为项目逻辑图的本体schema。
本体管理:本体类型区分私有本体和共享本体,私有本体仅对创建该本体的用户可见,共享本体可分享给其他用户,便于其他用户进行继承和修改;提供本体版本管理功能,支持本体历史版本的查看与回溯;实现本体模型导入和本体模型导出,可根据集团业务需求进行客制化改造。
3、图谱生产中心
图谱构建:支持用户配置数据生产任务并将生产的点边数据发布至图数据库,提供覆盖数据读取、数据清洗、数据映射、图数据库导入等图谱生产任务的不同算子,用户通过托拉拽这些算子组合,可视化地完成生产工作流的配置。
图谱存储:支持图数据库管理员对图谱平台拥有的图数据库资源进行维护,包括资源的创建、修改、删除和查看,创建后的图数据库资源在用户创建逻辑图时分配使用。平台提供各项目占用硬件资源的统一视图,实现资源灵活分配避免资源浪费,保障系统平稳高效运行。
血缘分析:平台提供任务级别、数据级别和字段级别三种级别的血缘分析功能,支持用户可视化查看源数据和图谱数据的血缘关系图及数据流转路径,协助用户快速追踪数据来源和数据处理过程。
4、图谱治理中心
图谱注册:对于图谱项目的创建者,平台提供图谱本体及图谱对外服务的登记、注册、变更功能。用户可对创建的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置等图谱创建或图谱变更进行发布申请。支持图谱生产者利用图谱发布申请功能查看项目下图谱的版本修改情况。
图谱发布:支持对平台上所有图谱项目的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置等图谱发布或变更申请进行审批。
5、调度中心
任务维护,包含图谱生产类任务及图谱挖掘类查询,用户可随时终止,或修改任务配置进行任务维护。
任务运行,支持选择任务运行的时间范围,指定以月、周、日为单位的任务执行周期等。
任务监控,对于创建执行的任务,平台实时展示任务运行状态,统计任务执行时长与资源占用情况。
服务应用层功能组件提供的能力如下:
1、图谱探索:支持用户对图谱数据进行可视化的探索分析,包括图谱可视化、图内过滤搜索、路径查询、时间轴在内的功能,实现用户对图谱进行可视化预览、实体属性模糊搜索、实体间路径查询及时序图谱特有的节点按时间轴展开等应用图谱的场景。
2、图谱挖掘:支持用户对生产后的图谱数据进行各种图指标计算、分析,实现从源数据读取,图算法使用,结果数据写入的全流程,提供类似生产工作流的算子托拉拽界面。其中图算法支持社区检测、中心性度量、路径查找在内的内置常用图挖掘算法和用户上传的算法包。
3、图谱查询:针对时效性要求高的业务图谱,提供实时联机图查询服务;针对时效性要求一般并且规模较大的图谱,提供离线图查询功能。用户可以创建离线图查询任务用于复杂、耗时较长的查询,支持单实体多实体路径、多实体多实体路径、批量实体间路径和批量实体展开等4种任务类型,并且可以保存任务根据需要多次运行。
4、图谱智能模型应用:支持用户根据需要的业务场景,完成图特征构建、特征工程、算法建模、模型发布的模型构建全流程。用户可结合图计算技术,计算反映业务情况和图拓扑结构情况的各种图指标和图模式指标;基于图特征,平台提供多种常用的机器学习模型及模型自适应调优工具可进行一站式配置建模。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种面向银行业的全栈式金融知识图谱平台,其特征在于,包括:
图谱构建层,被配置为,进行源数据管理、创建逻辑图本体、生产图谱、进行图谱治理和进行任务调度;
图仓管理层,被配置为,针对具体业务场景存储不同领域的图谱;
服务应用层,被配置为,进行图谱可视化搜索、图谱数据挖掘、图谱查询和图谱模型应用;
应用接口层,被配置为,为平台提供金融知识图谱服务访问能力。
2.根据权利要求1所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述全栈式金融知识图谱平台还包括:
基础设施层,被配置为,为图谱构建层提供平台源数据。
3.根据权利要求2所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述基础设施层包括Paas云平台、大数据平台和AI能力平台中的一个或多个。
4.根据权利要求1所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述图谱构建层包括源数据管理模块、建模中心、图谱生产中心、图谱治理中心和调度中心。
5.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述源数据管理模块包括:
数据源同步子模块,被配置为,通过文件系统、实时接入数据和/或关系型数据库接入数据源;同步展示数据源内数据表名及中文描述信息;提供数据源同步过滤器,支持按增量、时间窗口、字段数值大小和/或表达式过滤;支持定时、按任务依赖关系调度;
逻辑表映射子模块,被配置为,提供表格和图形化两类逻辑表数据映射方式,逐层实现实体/关系对象与数据表、实体/关系属性与表字段之间的映射关系,支持交互式数据查询、搜索与筛选。
6.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述建模中心包括:
本体创建子模块,被配置为,支持图形化和列表两种可视化创建本体,内置系统本体与系统属性可供继承设计,创建的本体提供一键引入作为项目逻辑图的本体的功能;
本体管理子模块,被配置为,按本体类型区分为私有本体和共享本体,私有本体仅对创建该本体的用户可见,共享本体可分享给其他用户;提供本体版本管理功能,支持本体历史版本的查看与回溯。
7.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述图谱生产中心包括:
图谱构建子模块,被配置为,支持用户配置数据生产任务并将生产的点边数据发布至图数据库,提供覆盖数据读取、数据清洗、数据映射、图数据库导入的算子,用于不同的图谱生产任务;
图谱存储子模块,被配置为,支持图数据库管理员对图谱平台拥有的图数据库资源进行维护,该维护包括资源的创建、修改、删除和查看,创建后的图数据库资源在用户创建逻辑图时分配使用,提供各项目占用硬件资源的统一视图;
血缘分析子模块,被配置为,提供任务级别、数据级别和字段级别三种级别的血缘分析功能,支持用户可视化查看源数据和图谱数据的血缘关系图及数据流转路径。
8.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述图谱治理中心包括:
图谱注册子模块,被配置为,对于图谱项目的创建者,提供图谱本体及图谱对外服务的登记、注册、变更功能;对于用户,提供对创建的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置进行发布申请;支持图谱生产者利用图谱发布申请功能查看项目下图谱的版本修改情况;
图谱发布子模块,被配置为,支持对平台上所有图谱项目的逻辑图、本体、图谱生产工作流、离线图查询、自定义图查询、图挖掘工作流、调度任务配置进行审批。
9.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述调度中心包括:
任务维护子模块,被配置为,查询图谱生产类任务及图谱挖掘类任务,终止或修改任务配置进行任务维护;
任务运行子模块,被配置为,选择任务运行的时间范围,指定以月、周、日为单位的任务执行周期;
任务监控子模块,被配置为,对于创建执行的任务,实时展示任务运行状态,统计任务执行时长与资源占用情况。
10.根据权利要求1所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述服务应用层包括:
图谱探索模块,被配置为,支持用户对图谱数据进行可视化探索,该可视化探索包括图谱可视化、图内过滤搜索、路径查询和时间轴查询;
图谱挖掘模块,被配置为,支持用户对生产后的图谱数据进行各种图指标计算和分析,图指标计算采用的图算法包括社区检测、中心性度量和路径查找;
图谱查询模块,被配置为,提供实时联机图查询服务、离线图查询功能,离线图查询功能处理的任务类型包括单实体多实体路径、多实体多实体路径、批量实体间路径和批量实体展开;
图谱智能模型应用模块,被配置为,支持用户根据需要的业务场景,完成图特征构建、特征工程、算法建模、模型发布的模型构建全流程;基于图计算技术,计算反映业务情况和图拓扑结构情况的各种图指标和图模式指标;基于图特征,提供多种机器学习模型及模型自适应调优工具进行一站式配置建模。
CN202111595423.9A 2021-12-24 2021-12-24 一种面向银行业的全栈式金融知识图谱平台 Pending CN114238662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111595423.9A CN114238662A (zh) 2021-12-24 2021-12-24 一种面向银行业的全栈式金融知识图谱平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111595423.9A CN114238662A (zh) 2021-12-24 2021-12-24 一种面向银行业的全栈式金融知识图谱平台

Publications (1)

Publication Number Publication Date
CN114238662A true CN114238662A (zh) 2022-03-25

Family

ID=80762485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111595423.9A Pending CN114238662A (zh) 2021-12-24 2021-12-24 一种面向银行业的全栈式金融知识图谱平台

Country Status (1)

Country Link
CN (1) CN114238662A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115203576A (zh) * 2022-09-09 2022-10-18 中信建投证券股份有限公司 一种金融知识协同管理系统、方法、设备及存储介质
CN115964507A (zh) * 2022-11-28 2023-04-14 北京海致星图科技有限公司 一种基于知识平台的图谱管理系统及计算机可读存储介质
CN117273131A (zh) * 2023-11-22 2023-12-22 四川三合力通科技发展集团有限公司 一种跨节点数据关系发现系统及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115203576A (zh) * 2022-09-09 2022-10-18 中信建投证券股份有限公司 一种金融知识协同管理系统、方法、设备及存储介质
CN115964507A (zh) * 2022-11-28 2023-04-14 北京海致星图科技有限公司 一种基于知识平台的图谱管理系统及计算机可读存储介质
CN115964507B (zh) * 2022-11-28 2023-10-27 北京海致星图科技有限公司 一种基于知识平台的图谱管理系统及计算机可读存储介质
CN117273131A (zh) * 2023-11-22 2023-12-22 四川三合力通科技发展集团有限公司 一种跨节点数据关系发现系统及方法
CN117273131B (zh) * 2023-11-22 2024-02-13 四川三合力通科技发展集团有限公司 一种跨节点数据关系发现系统及方法

Similar Documents

Publication Publication Date Title
CN111614775B (zh) 工业互联网云平台
CN114238662A (zh) 一种面向银行业的全栈式金融知识图谱平台
CN104767813B (zh) 基于openstack的公众行大数据服务平台
CN107193967A (zh) 一种多源异构行业领域大数据处理全链路解决方案
Zhu et al. A framework-based approach to utility big data analytics
CN106294439A (zh) 一种数据推荐系统及其数据推荐方法
CN110990479A (zh) 一种城市大数据可视化系统
Shen et al. Dynamic knowledge modeling and fusion method for custom apparel production process based on knowledge graph
CN111985716B (zh) 一种客运信息可视化的客运量预测系统
CN108536718A (zh) 一种基于输入输出语义化实现的管理信息化的方法和系统
Liu et al. Power data mining in smart grid environment
Lee et al. A systematic idea generation approach for developing a new technology: Application of a socio-technical transition system
CN102073666B (zh) 具有动态性的空间信息处理服务组合方法
Si Construction and application of enterprise internal audit data analysis model based on decision tree algorithm
CN110598074A (zh) 关于科技咨询大数据的统一资源组织管理的方法与系统
CN117009441A (zh) 基于关系型数据库的知识图谱构建系统及方法
Ghita et al. Geospatial business intelligence and cloud services for context aware digital twins development
CN110069668B (zh) 一种基于农业大数据知识库管理系统及其功能设计方法
CN104616151B (zh) 基于bpmn的语言的商业模式描述及分析方法
Gao Construction of knowledge service model of guizhou supply chain enterprises based on big data
Ma et al. A smart meteorological service model based on big Data: A value creation perspective
Wang et al. [Retracted] Attribute Reduction Algorithm on Concept Lattice and Application in Smart City Energy Consumption Analysis
Tutunea Digital Transformation in Romanian Online Travel Agencies
Su et al. Study on data based tourism management decision support system
Moawad et al. Knowledge elicitation and representation in a normative approach-a case study in diagnosis of plant diseases in Egypt

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination