CN117992415A - 跨业务系统的数据融合共享平台、方法、设备及介质 - Google Patents
跨业务系统的数据融合共享平台、方法、设备及介质 Download PDFInfo
- Publication number
- CN117992415A CN117992415A CN202410170109.3A CN202410170109A CN117992415A CN 117992415 A CN117992415 A CN 117992415A CN 202410170109 A CN202410170109 A CN 202410170109A CN 117992415 A CN117992415 A CN 117992415A
- Authority
- CN
- China
- Prior art keywords
- data
- service
- model
- module
- management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004458 analytical method Methods 0.000 claims abstract description 45
- 238000012795 verification Methods 0.000 claims abstract description 22
- 238000004806 packaging method and process Methods 0.000 claims abstract description 6
- 238000007726 management method Methods 0.000 claims description 204
- 238000013499 data model Methods 0.000 claims description 60
- 230000000007 visual effect Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 50
- 238000004140 cleaning Methods 0.000 claims description 48
- 238000006243 chemical reaction Methods 0.000 claims description 47
- 238000010276 construction Methods 0.000 claims description 46
- 238000003860 storage Methods 0.000 claims description 29
- 238000013523 data management Methods 0.000 claims description 26
- 238000005516 engineering process Methods 0.000 claims description 22
- 238000012544 monitoring process Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 15
- 238000009430 construction management Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 13
- 238000007499 fusion processing Methods 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 238000011161 development Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 244000035744 Hura crepitans Species 0.000 claims description 6
- 238000000586 desensitisation Methods 0.000 claims description 6
- 238000005206 flow analysis Methods 0.000 claims description 6
- 230000004931 aggregating effect Effects 0.000 claims description 5
- 238000013475 authorization Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 5
- 230000001360 synchronised effect Effects 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/176—Support for shared access to files; File sharing support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/44—Program or device authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/604—Tools and structures for managing or administering access control systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种跨业务系统的数据融合共享平台、方法、设备及介质,包括:获取原业务系统前端页面登录验证信息,并采用登录验证信息登录原业务系统前端页面;在登录成功后,对原业务系统前端页面进行分析,构建原业务系统的需求模型;采用网络爬虫对原业务系统前端页面进行遍历查询操作,得到查询数据;从查询数据中提取关键特征数据,并将关键特征数据和登录验证信息打包成建模分析数据包,保存至数据库中;基于数据库存储的建模分析数据包和所述需求模型进行模型重构;在接收到数据共享请求时,生成数据采集任务和采集策略,并基于重构的模型启动数据采集工作。本申请提高了跨业务系统之间的数据共享和数据交换的效率。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种跨业务系统的数据融合共享平台、方法、设备及介质。
背景技术
随着人工智能技术的发展,数字化成为推动社会经济发展的重要手段之一,越来越多的机关单位和企业开始进行数字化转型,但大部分单位在信息化建设初期缺乏顶层设计和整体规划,未制定统一的底层框架和统一的标准,各业务系统存在重复建设、数据格式不一、数据标准不一、数据内容不一、接口规范不一等问题,造成各业务系统之间业务不能互通、数据不能共享,数据孤岛现象严重。各业务系统的数据无法有效共享和交换,极大的影响了工作效率,无法发挥出大数据应有的价值。因此,如何打通数据孤岛实现各业务系统的数据融合以及跨业务系统的数据共享交换是数字化转型要解决的首要问题。
现有实现数据融合的技术主要有2种方式:找原系统开发商定制化开发和采用ETL技术对接原系统的数据源和日志文件。
找原系统开发商定制化开发方式最简单。通过搭建统一的大数据中心,制定统一的接口标准和数据标准,各业务系统开发商按照统一的标准进行定制化开发,调用接口按照规定的数据格式将各业务系统的数据统一汇总到大数据中心进行数据融合,调用接口从大数据中心下载数据实现数据共享交换。
ETL技术是目前市面上主流的数据中台技术,是数据中台的数据采集入口。采用ETL技术的优点是可以不需要原系统开发商配合。
发明人在实现本发明的过程中,意识到现有技术至少存在如下技术问题:找原系统开发商定制化开发方式虽然简单,但存在定制化开发成本费用高、出现问题定位时间长、原有系统技术框架老旧维护难等问题;采用ETL技术对接原系统的数据源和日志文件需要读取原业务系统的数据源和日志文件,需要入侵原业务系统,对于敏感机关单位和企业来说,涉及到数据安全和信息泄露的问题,且对原有业务系统的正常工作可能会造成影响,当原有业务系统出现问题时,难以解释是否受到ETL技术入侵数据库的影响,同时,不同的系统开发商采用的技术架构不同,ETL技术要适应所有技术架构和数据库类型,还需要在原有数据源中过滤哪些是有效数据、哪些是无效数据、哪些是临时数据,前期需求调研、系统适配及数据清洗工作量非常巨大。由此可见,现有技术进行跨业务系统的数据融合共享时,存在安全性低和效率低的问题。
发明内容
本发明实施例提供一种跨业务系统的数据融合共享平台、方法、计算机设备和存储介质,以提高跨业务系统的数据融合共享的效率。
为了解决上述技术问题,本申请实施例提供一种跨业务系统的数据融合共享平台,所述跨业务系统的数据融合共享平台包括前端数据采集系统、数据融合处理系统、可视化系统模型构建管理系统、业务调度管理系统、大数据资源中心管理系统和数据共享系统;其中,
所述前端数据采集系统用于按照跨业务系统的数据融合共享平台设定的采集任务计划和采集策略自动采集经原业务系统授权访问的数据;
所述数据融合处理系统用于对数据清洗标注和标准化处理,将转换后的标准化数据进行连接、过滤、合并、拆分、聚合、转化、赋值操作,并将加工后的数据保存到基础数据库中;
所述可视化系统模型构建管理系统用于对原业务系统进行分析处理并重构系统模型;
所述业务调度管理系统用于创建的各系统的业务流程,以及各个功能的自动化执行的全过程管理、跨系统之间的任务调度和信息交互;
所述大数据资源中心管理系统用于对平台数据资源的物理空间划分、数据资源的安全存储和访问控制等管理。
所述数据共享系统用于参照原业务系统的业务模型,按照所述跨业务系统的数据融合共享平台生成的数据交换任务和数据交换策略,将共享交换数据从原业务系统前端页面自动写入原业务系统数据库。
可选地,所述前端数据采集系统包括前端数据采集模块、数据采集系统模型管理模块、数据采集参数配置管理模块、数据采集策略配置管理模块和数据采集任务调度管理模块;其中,
所述前端数据采集模块根据原业务系统前端的类别不同而采用不同的数据采集技术,如果原业务系统是B/S架构,则使用网络爬虫技术;如果原业务系统是C/S架构,则使用网络抓包分析工具;
所述数据采集系统模型管理模块用于保存重构的原业务系统的数据模型、接口模型和业务模型;
所述数据采集参数配置管理模块用于对前端数据采集模块分布式部署的管理,以及对每个前端数据采集模块的前端账户权限信息和参数进行配置管理;
所述数据采集策略配置管理模块用于对每个前端数据采集模块的采集频率、采集周期、触发条件、结束条件参数进行配置;
所述数据采集任务调度管理模块对每个前端数据采集模块执行数据采集的内容,以及数据采集操作的开始、暂停、定时、重启中的至少一个任务进行管理。
可选地,所述前端数据采集系统还包括数据采集状态监控和告警模块、数据采集日志管理模块;
所述数据采集状态监控和告警模块用于对每个前端数据采集模块的在线工作状态、数据采集状态和数据采集进度等进行实时监控和异常告警;
所述数据采集日志管理模块用于对每个前端数据采集模块的数据采集行为的日志进行保存和提供查询操作。
可选地,所述数据融合处理系统包括数据清洗管理系统、数据转换管理系统、数据加工管理系统、数据标注管理系统、数据治理管理系统、数据服务管理系统和数据应用管理系统;其中,
所述数据清洗管理系统负责根据数据清洗的数据模型和清洗规则对重复的、错误的、缺失的、无效的原始数据进行数据清洗操作;
所述数据转换管理系统负责根据数据转换的数据模型和转换规则,将清洗后的原始数据转换成统一的标准数据格式;
所述数据加工管理系统负责根据数据加工的数据模型和加工规则,对数据转换后的标准化数据进行连接、过滤、合并、拆分、聚合、转化、赋值操作,并将加工后的数据保存到基础数据库中;
所述数据标注管理系统用于根据数据标注的数据模型和标注规则,对基础数据库中的标准化数据进行数据分类、数据标记、数据注释系列操作;
所述数据治理管理系统用于根据数据治理的数据模型和治理规则,对数据目录、数据质量、数据安全、数据生命周期进行管理操作,并将治理后的数据保存到汇总数据库中;
所述数据服务管理系统用于对服务申请、服务订阅、服务列表、服务审批、服务授权、服务接口、服务监控等全方位数据服务管理,并根据数据服务的数据模型和业务规则,对服务订阅方提供相应的数据服务。
可选地,所述大数据资源中心管理系统由数据访问控制模块、数据安全存储模块、数据资源管理模块组成;其中,
数据访问控制模块用于对平台各系统对数据资源的可读写操作内容的权限管理、对平台各系统访问数据资源的身份鉴权和业务鉴权,对平台各系统访问数据资源的行为记录查询;
数据安全存储模块用于对平台内数据资源的安全管理和存储管理,包含数据加密和解密、数据签名和验签、数据脱敏、数据水印、安全沙箱、数据备份与恢复中的至少一项;
所述数据资源管理模块将平台数据资源分为大数据资源区、对内共享交换区、对外开放区3个物理区域,其中,所述大数据资源区用于存储系统内的核心数据,包括关系型数据库和非关系型数据库、结构化和非结构化数据,对内共享交换区用于存储业务系统内部交换数据,对外开放区用于存储通过API接口对外开放的数据资源,包含安全沙箱数据和对外开放脱敏数据。
可选地,所述可视化系统模型构建管理系统由低代码平台、数据模型构建模块、接口模型构建模块、业务模型构建模块组成,用于通过可视化托拉拽的方式快速构建各业务系统的数据模型、接口模型和业务模型,由业务智能调度管理系统根据业务模型制定的流程、任务和策略,调用接口模型,按照数据模型生成数据及同步数据;其中,
所述低代码平台通过可视化托拉拽的方式对各业务系统数据库表单、数据库报表、业务接口和规则引擎、工作流引擎进行可视化编辑,并通过二次开发接口实现外部条件和功能的接入;
所述数据模型构建模块用于对各业务系统进行可视化数据建模,包括关系型和非关系型数据库建模;
所述接口模型构建模块用于对各业务系统进行可视化的接口建模以及各接口的事件响应;
所述业务模型构建模块用于对各业务系统的业务流程、业务规则、执行任务、执行策略、触发条件、结束条件进行可视化编辑和建模。
可选地,所述接口模型构建模块由原业务系统接口模型重构、数据清洗接口模型构建、数据转换接口模型构建、数据加工接口模型构建、数据标注接口模型构建、数据治理接口模型构建、数据服务接口模型构建和数据应用接口模型构建中的至少一个部分组成。
为了解决上述技术问题,本申请实施例提供一种跨业务系统的数据融合共享方法,包括:
获取原业务系统前端页面的至少一个登录验证信息,并采用所述登录验证信息登录所述原业务系统前端页面;
在登录成功后,对所述原业务系统前端页面进行系统功能分析、数据内容分析和业务流程分析,构建原业务系统的需求模型;
采用网络爬虫对所述原业务系统前端页面进行遍历查询操作,得到查询数据;
从所述查询数据中提取关键特征数据,并将所述关键特征数据和所述登录验证信息打包成建模分析数据包,保存至数据库中;
基于所述数据库存储的建模分析数据包和所述需求模型进行模型重构,得到原业务系统的数据模型、接口模型和业务模型;
在接收到数据共享请求时,生成数据采集任务和采集策略,并基于得到的所述原业务系统的数据模型、接口模型和业务模型启动数据采集工作。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述跨业务系统的数据融合共享平台的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述跨业务系统的数据融合共享平台的步骤。
本发明实施例提供的跨业务系统的数据融合共享平台、装置、计算机设备及存储介质,通过获取原业务系统前端页面的至少一个登录验证信息,并采用所述登录验证信息登录所述原业务系统前端页面;在登录成功后,对所述原业务系统前端页面进行系统功能分析、数据内容分析和业务流程分析,构建原业务系统的需求模型;采用网络爬虫对所述原业务系统前端页面进行遍历查询操作,得到查询数据;从所述查询数据中提取关键特征数据,并将所述关键特征数据和所述登录验证信息打包成建模分析数据包,保存至数据库中;基于所述数据库存储的建模分析数据包和所述需求模型进行模型重构,得到原业务系统的数据模型、接口模型和业务模型;在接收到数据共享请求时,生成数据采集任务和采集策略,并基于得到的所述原业务系统的数据模型、接口模型和业务模型启动数据采集工作。通过分析和重构原业务系统的系统模型,根据原业务系统的功能特性制定相应的数据采集任务和数据采集策略,实现各业务系统的数据自动同步和汇总,汇总数据经过数据清洗、数据转换、数据加工、数据标注、数据治理后实现各业务系统数据的标准化融合,融合的标准化数据既可通过原业务系统重构的系统模型从前端写入原业务系统,也可通过API接口授权提供给各业务系统调用,从而实现跨业务系统之间的数据共享和数据交换,提高了跨业务系统之间的数据共享和数据交换的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的跨业务系统的数据融合共享平台的一个实施例的结构示意图;
图3是根据本申请的跨业务系统的数据融合共享平台中前端数据采集系统的一个实施例的结构示意图;
图4是本申请的跨业务系统的数据融合共享平台的一个实施例的流程图;
图5是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
关于本实施例中的一些名词解释:
前端数据采集,是指通过PC客户端、手机APP端、网页端等人机交互界面进行数据查询,利用网络爬虫技术或网络抓包工具进行前端数据抓取,经过对抓取数据的分析、过滤、转换后封装成统一格式的原始数据包,从而实现从前端的无感数据采集;
ETL技术,是英文Extract-Transform-Load的缩写,是指从各一个或者多个系统数据源中提取数据,经过清洗、转换和加载到目标系统中的过程。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的跨业务系统的数据融合共享平台由服务器执行,相应地,跨业务系统的数据融合共享方法设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种跨业务系统的数据融合共享平台,跨业务系统的数据融合共享平台包括前端数据采集系统、数据融合处理系统、可视化系统模型构建管理系统、业务调度管理系统、大数据资源中心管理系统和数据共享系统;其中,
前端数据采集系统用于按照跨业务系统的数据融合共享平台设定的采集任务计划和采集策略自动采集经原业务系统授权访问的数据;
数据融合处理系统用于对数据清洗标注和标准化处理,将转换后的标准化数据进行连接、过滤、合并、拆分、聚合、转化、赋值操作,并将加工后的数据保存到基础数据库中;
可视化系统模型构建管理系统用于对原业务系统进行分析处理并重构系统模型;
业务调度管理系统用于创建的各系统的业务流程,以及各个功能的自动化执行的全过程管理、跨系统之间的任务调度和信息交互;
大数据资源中心管理系统用于对平台数据资源的物理空间划分、数据资源的安全存储和访问控制等管理。
数据共享系统用于参照原业务系统的业务模型,按照跨业务系统的数据融合共享平台生成的数据交换任务和数据交换策略,将共享交换数据从原业务系统前端页面自动写入原业务系统数据库。
可选地,前端数据采集系统包括前端数据采集模块、数据采集系统模型管理模块、数据采集参数配置管理模块、数据采集策略配置管理模块和数据采集任务调度管理模块;其中,
前端数据采集模块根据原业务系统前端的类别不同而采用不同的数据采集技术,如果原业务系统是B/S架构,则使用网络爬虫技术;如果原业务系统是C/S架构,则使用网络抓包分析工具;
数据采集系统模型管理模块用于保存重构的原业务系统的数据模型、接口模型和业务模型;
数据采集参数配置管理模块用于对前端数据采集模块分布式部署的管理,以及对每个前端数据采集模块的前端账户权限信息和参数进行配置管理;
数据采集策略配置管理模块用于对每个前端数据采集模块的采集频率、采集周期、触发条件、结束条件参数进行配置;
数据采集任务调度管理模块对每个前端数据采集模块执行数据采集的内容,以及数据采集操作的开始、暂停、定时、重启中的至少一个任务进行管理。
具体地,前端数据采集系统通过使用前端数据采集模块,用原业务系统管理员分配的账号和密码自动登录原业务系统前端。前端数据采集模块采用网络爬虫技术或网络抓包工具在原业务系统管理员授权的前端页面上,根据数据共享交换平台制定的数据采集任务和数据采集策略,模拟人工操作的方式进行数据查询和数据抓取。前端数据采集模块根据重构的原业务系统模型对抓取的查询数据进行分析、过滤、转换后封装成统一格式的原始数据。
前端数据采集系统可根据原业务系统的数据量和业务量的大小,以及平台对实时性和并发性的要求,对前端数据采集模块进行分布式多点部署,不同的前端数据采集模块执行不同的采集任务采集不同内容的业务数据,从而实现数据采集的负载均衡,在不影响原业务系统正常使用的前提下,保障数据采集的实时性和并发性。
前端数据采集系统由前端数据采集模块、数据采集系统模型管理模块、数据采集参数配置管理模块、数据采集策略配置管理模块、数据采集任务调度管理模块、数据采集状态监控和告警模块、数据采集日志管理模块等组成,具体如图3所示。
其中,前端数据采集模块根据原业务系统前端的类别不同而采用不同的数据采集技术,如果原业务系统是B/S架构,则使用网络爬虫技术;如果原业务系统是C/S架构,则使用网络抓包分析工具;
数据采集系统模型管理模块负责保存重构的原业务系统的数据模型、接口模型和业务模型。前端数据采集模块执行数据采集任务时,根据采集的数据内容匹配相应的数据模型和接口模型,进行数据分析、过滤、转换后封装成统一格式的原始数据包;
数据采集参数配置管理模块负责对前端数据采集模块分布式部署的管理,以及对每个前端数据采集模块的前端登录账号、密码、URL地址、代理点信息等参数进行配置和管理;
数据采集策略配置管理模块对每个前端数据采集模块的采集频率、采集周期、触发条件、结束条件等参数进行配置;对不同的数据内容采用全量采集还是增量采集的策略配置;根据原业务系统的忙闲时段,对禁止采集时间段、低频采集时间段、高频采集时间段的配置等;
数据采集任务调度管理模块对每个前端数据采集模块执行数据采集的内容,以及数据采集操作的开始、暂停、定时、重启等任务进行管理;
数据采集状态监控和告警模块对每个前端数据采集模块的在线工作状态、数据采集状态和数据采集进度等进行实时监控和异常告警;
数据采集日志管理模块对每个前端数据采集模块的数据采集行为的日志进行保存和提供查询操作。
可选地,前端数据采集系统还包括数据采集状态监控和告警模块、数据采集日志管理模块;
数据采集状态监控和告警模块用于对每个前端数据采集模块的在线工作状态、数据采集状态和数据采集进度等进行实时监控和异常告警;
数据采集日志管理模块用于对每个前端数据采集模块的数据采集行为的日志进行保存和提供查询操作。
可选地,数据融合处理系统包括数据清洗管理系统、数据转换管理系统、数据加工管理系统、数据标注管理系统、数据治理管理系统、数据服务管理系统和数据应用管理系统;其中,
数据清洗管理系统负责根据数据清洗的数据模型和清洗规则对重复的、错误的、缺失的、无效的原始数据进行数据清洗操作;
数据转换管理系统负责根据数据转换的数据模型和转换规则,将清洗后的原始数据转换成统一的标准数据格式;
数据加工管理系统负责根据数据加工的数据模型和加工规则,对数据转换后的标准化数据进行连接、过滤、合并、拆分、聚合、转化、赋值操作,并将加工后的数据保存到基础数据库中;
数据标注管理系统用于根据数据标注的数据模型和标注规则,对基础数据库中的标准化数据进行数据分类、数据标记、数据注释系列操作;
数据治理管理系统用于根据数据治理的数据模型和治理规则,对数据目录、数据质量、数据安全、数据生命周期进行管理操作,并将治理后的数据保存到汇总数据库中;
数据服务管理系统用于对服务申请、服务订阅、服务列表、服务审批、服务授权、服务接口、服务监控等全方位数据服务管理,并根据数据服务的数据模型和业务规则,对服务订阅方提供相应的数据服务。
可选地,大数据资源中心管理系统由数据访问控制模块、数据安全存储模块、数据资源管理模块组成;其中,
数据访问控制模块用于对平台各系统对数据资源的可读写操作内容的权限管理、对平台各系统访问数据资源的身份鉴权和业务鉴权,对平台各系统访问数据资源的行为记录查询;
数据安全存储模块用于对平台内数据资源的安全管理和存储管理,包含数据加密和解密、数据签名和验签、数据脱敏、数据水印、安全沙箱、数据备份与恢复中的至少一项;
数据资源管理模块将平台数据资源分为大数据资源区、对内共享交换区、对外开放区3个物理区域,其中,大数据资源区用于存储系统内的核心数据,包括关系型数据库和非关系型数据库、结构化和非结构化数据,对内共享交换区用于存储业务系统内部交换数据,对外开放区用于存储通过API接口对外开放的数据资源,包含安全沙箱数据和对外开放脱敏数据。
可选地,可视化系统模型构建管理系统由低代码平台、数据模型构建模块、接口模型构建模块、业务模型构建模块组成,用于通过可视化托拉拽的方式快速构建各业务系统的数据模型、接口模型和业务模型,由业务智能调度管理系统根据业务模型制定的流程、任务和策略,调用接口模型,按照数据模型生成数据及同步数据;其中,
低代码平台通过可视化托拉拽的方式对各业务系统数据库表单、数据库报表、业务接口和规则引擎、工作流引擎进行可视化编辑,并通过二次开发接口实现外部条件和功能的接入;
数据模型构建模块用于对各业务系统进行可视化数据建模,包括关系型和非关系型数据库建模;
接口模型构建模块用于对各业务系统进行可视化的接口建模以及各接口的事件响应;
业务模型构建模块用于对各业务系统的业务流程、业务规则、执行任务、执行策略、触发条件、结束条件进行可视化编辑和建模。
可选地,接口模型构建模块由原业务系统接口模型重构、数据清洗接口模型构建、数据转换接口模型构建、数据加工接口模型构建、数据标注接口模型构建、数据治理接口模型构建、数据服务接口模型构建和数据应用接口模型构建中的至少一个部分组成。
其中,接口模型构建模块负责对各业务系统进行可视化的接口建模以及各接口的事件响应。接口模型构建模块包括:原业务系统接口模型重构、数据清洗接口模型构建、数据转换接口模型构建、数据加工接口模型构建、数据标注接口模型构建、数据治理接口模型构建、数据服务接口模型构建和数据应用接口模型构建等8个部分组成。
原业务系统接口模型重构,前端数据采集模块将采集到的原业务系统接口模型提供给原业务系统接口模型重构模块,通过人工可视化编辑对原业务系统的接口协议、接口指令、接口参数进行分析和建模,并且根据不同的接口指令和接口参数,由前端数据采集及共享数据交换系统执行相应的事件响应。
数据清洗接口模型构建,数据清洗接口模型构建通过可视化编辑定义数据清洗的接口模型,包括:接口协议、接口指令、接口参数等,并且根据不同的接口指令和接口参数,由数据清洗管理系统执行相应的事件响应。
数据转换接口模型构建,数据转换接口模型构建通过可视化编辑定义数据转换的接口模型,包括:接口协议、接口指令、接口参数等,并且根据不同的接口指令和接口参数,由数据转换管理系统执行相应的事件响应。
数据加工接口模型构建,数据加工接口模型构建通过可视化编辑定义数据加工的接口模型,包括:接口协议、接口指令、接口参数等,并且根据不同的接口指令和接口参数,由数据加工管理系统执行相应的事件响应。
数据标注接口模型构建,数据加工接口模型构建通过可视化编辑定义数据标注的接口模型,包括:接口协议、接口指令、接口参数等,并且根据不同的接口指令和接口参数,由数据标注管理系统执行相应的事件响应。
数据治理接口模型构建,数据治理接口模型构建通过可视化编辑定义数据治理的接口模型,包括:接口协议、接口指令、接口参数等,并且根据不同的接口指令和接口参数,由数据治理管理系统执行相应的事件响应。
数据服务接口模型构建,数据服务接口模型构建通过可视化编辑定义数据服务的接口模型,包括:接口协议、接口指令、接口参数等,并且根据不同的接口指令和接口参数,由数据服务管理系统执行相应的事件响应。
数据应用接口模型构建,数据应用接口模型构建通过可视化编辑定义数据应用的接口模型,包括:接口协议、接口指令、接口参数等,并且根据不同的接口指令和接口参数,由数据应用管理系统执行相应的事件响应。
进一步地,业务模型构建模块负责对各业务系统的业务流程、业务规则、执行任务、执行策略、触发条件、结束条件等进行可视化编辑和建模。业务模型构建模块包括:原业务系统业务模型重构、数据清洗业务模型构建、数据转换业务模型构建、数据加工业务模型构建、数据标注业务模型构建、数据治理业务模型构建、数据服务业务模型构建和数据应用业务模型构建等8个部分组成。具体包括:
原业务系统业务模型重构,原业务系统接口模型重构是针对原业务系统前端页面的操作流程,以及针对原业务系统数据模型之间的关联关系进行分析,通过人工可视化编辑重构原业务系统的业务流程,并制定相应的业务规则、执行任务、执行策略和触发条件等等,实现对原业务系统业务模型重构。
数据清洗业务模型构建,数据清洗业务模型构建通过可视化编辑定义数据清洗的业务流程,制定数据清洗的业务规则、执行任务、执行策略、触发条件和结束条件等等,实现数据清洗业务模型构建。
数据转换业务模型构建,数据转换业务模型构建通过可视化编辑定义数据转换的业务流程,制定数据转换的业务规则、执行任务、执行策略、触发条件和结束条件等等,实现数据转换业务模型构建。
数据加工业务模型构建,数据加工业务模型构建通过可视化编辑定义数据加工的业务流程,制定数据加工的业务规则、执行任务、执行策略、触发条件和结束条件等等,实现数据加工业务模型构建。
数据标注业务模型构建,数据标注业务模型构建通过可视化编辑定义数据标注的业务流程,制定数据标注的业务规则、执行任务、执行策略、触发条件和结束条件等等,实现数据标注业务模型构建。
数据治理业务模型构建,数据治理业务模型构建通过可视化编辑定义数据治理的业务流程,制定数据治理的业务规则、执行任务、执行策略、触发条件和结束条件等等,实现数据治理业务模型构建。
数据服务业务模型构建,数据服务业务模型构建通过可视化编辑定义数据服务的业务流程,制定数据服务的业务规则、执行任务、执行策略、触发条件和结束条件等等,实现数据服务业务模型构建。
数据应用业务模型构建,数据应用业务模型构建通过可视化编辑定义数据应用的业务流程,制定数据应用的业务规则、执行任务、执行策略、触发条件和结束条件等等,实现数据应用业务模型构建。
在一具体可选实施方式中,前端数据交换系统通过使用前端数据交换模块,用原业务系统管理员分配的账号和密码自动登录原业务系统前端。前端数据交换模块打开原系统管理员授权的写数据页面,根据原业务系统的数据模型、接口模型和业务模型,将原业务系统向数据共享交换平台订阅的共享交换数据转换成原业务系统的数据格式,参照原业务系统的业务模型,按照数据共享交换平台生成的数据交换任务和数据交换策略,模拟鼠标点击和键盘输入的人工操作方式,依次将共享交换数据从原业务系统前端页面自动写入原业务系统数据库。
前端数据交换系统可根据共享交换数据的数据量大小,以及原业务系统对数据实时性和并发性的要求,对前端数据交换工具进行分布式多点部署,不同的前端数据交换工具执行不同的数据交换任务写入不同内容的共享交换数据,从而实现数据写入操作的负载均衡,在不影响原业务系统正常使用的前提下,保障数据写入的实时性和并发性。
前端数据交换系统由前端数据交换模块、数据交换系统模型管理模块、数据交换参数配置管理模块、数据交换策略配置管理模块、数据交换任务调度管理模块、数据交换状态监控和告警模块、数据交换日志管理模块等7个部分组成。
其中,前端数据交换模块通过原业务系统管理员分配的用户账号和密码登录原业务系统前端,采用模拟鼠标点击和键盘输入的人工操作方式从原业务系统前端页面自动录入并提交共享交换数据,无需知道原业务系统的数据签名密钥和数据加密密钥,不破坏原业务系统对数据安全的保护。
数据交换系统模型管理模块负责保存重构的原业务系统的数据模型、接口模型和业务模型。前端数据交换模块执行写数据任务时,需要将融合交换数据按照原业务系统的数据模型转换成原业务系统的数据格式;需要按照原业务系统的业务模型,依次写入原业务系统不同的数据库表;
数据交换参数配置管理模块负责对前端数据交换模块分布式部署的管理,以及对每个前端数据交换模块的前端登录账号、密码、URL地址、代理点信息等参数进行配置和管理;
数据交换策略配置管理模块对每个前端数据交换模块的写数据频率、采写数据周期、触发条件、结束条件等参数进行配置;对不同的数据内容是实时写入还是定时写入的策略配置;根据原业务系统的忙闲时段,对禁止写数据时间段、低频写数据时间段、高频写数据时间段的配置等;
数据交换任务调度管理模块对每个前端数据交换模块执行数据写入的内容,以及数据写入操作的开始、暂停、定时、重启等任务进行管理;
数据交换状态监控和告警模块对每个前端数据交换模块的在线工作状态、写数据操作状态和写数据进度等进行实时监控和异常告警;
数据交换日志管理模块对每个前端数据交换模块的写数据行为的日志进行保存和提供查询操作。
请参阅图4,图4示出本发明实施例提供的一种跨业务系统的数据融合共享方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
S201:获取原业务系统前端页面的至少一个登录验证信息,并采用所述登录验证信息登录所述原业务系统前端页面。
S202:在登录成功后,对所述原业务系统前端页面进行系统功能分析、数据内容分析和业务流程分析,构建原业务系统的需求模型。
S203:采用网络爬虫对所述原业务系统前端页面进行遍历查询操作,得到查询数据。
S204:从查询数据中提取关键特征数据,并将所述关键特征数据和所述登录验证信息打包成建模分析数据包,保存至数据库中。
S205:基于所述数据库存储的建模分析数据包和所述需求模型进行模型重构,得到原业务系统的数据模型、接口模型和业务模型。
S206:在接收到数据共享请求时,生成数据采集任务和采集策略,并基于得到的所述原业务系统的数据模型、接口模型和业务模型启动数据采集工作。
具体地,通过对原业务系统的功能和性能分析,结合前端数据采集的方式,实现对原业务系统的系统模型重构。主要包括如下步骤:
(1)原业务系统的系统管理员为数据交换平台的前端数据采集模块分配前端页面登录的账号和密码,并设置该账号的数据访问权限;如采用多前端数据采集模块分布式部署的方案,则为每个前端数据采集模块分配不同的前端页面登录账号和密码,设置不同的数据访问权限;
(2)平台运营人员使用分配的账号密码登录原业务系统前端,对授权前端页面进行系统功能分析、数据内容分析、业务流程分析,根据数据融合的业务需求,在可视化系统模型构建管理系统上创建原业务系统的档案,配置原业务系统的相关参数,构建原业务系统的需求模型;
(3)可视化系统模型构建管理系统向前端数据采集模块发送前端数据采集建模分析指令,同步原业务系统的登录账号、登录密码、登录URL地址、代理点地址等工作参数;
(4)前端数据采集模块保存原业务系统的登录账号、登录密码、登录URL地址、代理点地址等工作参数到本地;
(5)前端数据采集模块使用分配的账号和密码登录原业务系统前端;
(6)前端数据采集模块使用网络爬虫技术对所有授权访问的前端页面进行遍历查询操作;
(7)原业务系统返回查询数据到前端页面;
(8)前端数据采集模块使用网络爬虫技术抓取原业务系统返回的查询数据,并提取所抓取数据包中的关键特征数据,按指定格式打包成建模分析数据包,保存到数据库中;
(9)所有数据抓取完成后,前端数据采集模块向可视化系统模型构建管理系统发送前端数据采集建模分析应答,告知建模分析数据包的存放路径;
(10)可视化系统模型构建管理系统根据指定路径读取并解析建模分析数据包,可视化呈现数据包中的接口协议、接口参数、数据字段、数据内容等等。系统运营管理人员根据原业务系统的需求模型过滤和筛选原始数据包的有效字段,建立前端操作页面与前端抓取数据包之间的数据库表、数据字段、数据接口、操作流程等等的映射关系,构建并重组原始数据包中的有效字段生成原业务系统数据采集模型,从而重构出原业务系统的数据模型、接口模型和业务模型。
(11)可视化系统模型构建管理系统同步原业务系统的数据模型、接口模型和业务模型到前端数据采集模块;
(12)前端数据采集模块保存原业务系统的数据模型、接口模型和业务模型到本地;
(13)可视化系统模型构建管理系统根据对原业务系统的数据量大小、忙闲时段分析统计后,制定相应的数据采集任务和数据采集策略;
(14)可视化系统模型构建管理系统同步数据采集任务和数据采集策略到前端数据采集模块;
(15)前端数据采集模块保存数据采集任务和数据采集策略到本地,并根据数据采集任务启动数据采集工作。
进一步地,标准化数据融合及共享交换业务流程具体包括:
(1)前端数据采集模块通过分配的账号和密码登录原业务系统前端;
(2)前端数据采集模块启动前端数据采集任务,由数据采集任务定时触发数据采集操作;
(3)前端数据采集模块按照平台制定的数据采集策略,模拟人工的方式进行数据查询操作;
(4)前端数据采集模块自动从前端页面抓取原业务系统返回的查询数据;
(5)前端数据采集模块按重构的接口模型和数据模型进行分析、过滤、转换后封装成原始数据包,保存到原始数据库;
(6)前端数据采集模块发送数据采集完成通知给业务智能调度管理系统,并告知原始数据存放路径;
(7)业务智能调度管理系统发送数据清洗通知给数据清洗管理系统;
(8)业务智能调度管理系统发送数据转换通知给数据转换管理系统:
(9)业务智能调度管理系统发送数据加工通知给数据加工管理系统;
(10)业务智能调度管理系统发送数据标注通知给数据标注管理系统;
(11)业务智能调度管理系统发送数据治理通知给数据治理管理系统;
(12)业务智能调度管理系统发送内部业务系统或数据应用系统的数据订阅服务申请给数据服务管理系统。数据服务管理系统根据数据订阅的需求对基础数据库中的数据进行数据分析、统计、汇总,建立汇总数据库、专题数据库和主题数据库,并对数据服务从申请、订阅、审批、授权、接口到状态监控的全生命周期管理;
(13)业务智能调度管理系统发送内部业务系统或者外部业务系统的应用接入申请给数据应用管理系统。数据应用管理系统对应用申请进行审核,以及账号密码分配、业务权限设置和API接口授权管理。业务智能调度管理系统通过建立安全隔离的共享交换数据库,以API接口的方式向授权的内部应用或外部应用提供共享数据交换服务。
进一步地,业务智能调度管理系统发送数据清洗通知给数据清洗管理系统包括:
数据清洗管理系统收到业务智能调度管理系统的数据清洗通知后,到指定的存放路径中读取数据;
数据清洗管理系统启动数据清洗任务,根据清洗数据模型、清洗策略、清洗规则,进行数据清洗操作;
数据清洗管理系统完成数据清洗操作后,发送数据清洗完成通知给业务智能调度管理系统,告知清洗数据存放路径。
进一步地,业务智能调度管理系统发送数据转换通知给数据转换管理系统包括:
数据转换管理系统收到业务智能调度管理系统的数据转换通知后,到指定的存放路径中读取数据;
数据转换管理系统启动数据转换任务,根据转换数据模型、转换策略、转换规则,进行数据转换操作;
数据转换管理系统完成数据转换操作后,发送数据转换完成通知给业务智能调度管理系统,告知转换数据存放路径
进一步地,业务智能调度管理系统发送数据加工通知给数据加工管理系统包括:
数据加工管理系统收到业务智能调度管理系统的数据加工通知后,到指定的存放路径中读取数据;
数据加工管理系统启动数据加工任务,根据加工数据模型、加工策略、加工规则,进行数据加工操作;
数据加工管理系统完成数据加工操作后,发送数据加工完成通知给业务智能调度管理系统,告知加工数据存放路径。
进一步地,业务智能调度管理系统发送数据标注通知给数据标注管理系统包括:
数据标注管理系统收到业务智能调度管理系统的数据标注通知后,到指定的存放路径中读取数据;
数据标注管理系统启动数据标注任务,根据标注数据模型、标注策略、标注规则,进行数据标注操作;
数据标注管理系统完成数据标注操作后,发送数据标注完成通知给业务智能调度管理系统,告知标注数据存放路径。
进一步地,业务智能调度管理系统发送数据治理通知给数据治理管理系统包括:
数据治理管理系统收到业务智能调度管理系统的数据治理通知后,到指定的存放路径中读取数据;
数据治理管理系统启动数据治理任务,根据治理数据模型、治理策略、治理规则,进行数据治理操作;
数据治理管理系统完成数据治理操作后,发送数据治理完成通知给业务智能调度管理系统,保存标准化融合数据到基础数据库中。
在一具体可选实施方式中,前端数据采集实现标准化数据融合业务流程包括如下步骤:
1)原业务系统的系统管理员为数据交换平台的前端数据交换模块分配前端写数据操作的登录账号和密码,并设置该账号的写数据权限;如采用多前端数据交换模块分布式部署的方案,则为每个前端数据交换模块分配不同的前端页面登录账号和密码,设置不同的写数据权限;
2)原业务系统的系统管理员登录数据交换平台门户,申请订阅前端数据共享交换服务,选择需要订阅的数据内容,设置数据同步机制(如:增量同步或全量同步、实时同步/每天同步/每月同步、数据同步时间段等等)。
3)数据服务管理系统收到订阅申请后,由系统运营人员审核原业务系统的前端页面是否满足前端数据交换的条件,同时审核原业务系统申请订阅的数据内容是否符合权限;
4)审核通过后,数据服务管理系统同步数据交换订阅服务申请到可视化系统模型构建管理系统;
5)可视化系统模型构建管理系统对授权前端页面进行系统功能分析、数据内容分析、业务流程分析,根据订阅的数据内容,配置原业务系统的相关参数,构建原业务系统的前端数据交换模型(包括:数据模型、接口模型和业务模型);
6)可视化系统模型构建管理系统同步原业务系统的前端数据交换模型和工作参数到前端数据交换模块;
7)前端数据交换模块保存原业务系统的前端数据交换模型和工作参数(包括:登录账号、登录密码、登录URL地址、代理点地址等等);
8)可视化系统模型构建管理系统根据对原业务系统要求写入的数据量大小、忙闲时段等分析后,制定相应的前端数据交换任务和数据交换策略;
9)可视化系统模型构建管理系统同步前端数据交换任务和数据交换策略到前端数据交换模块;
10)前端数据交换模块保存前端数据交换任务和数据交换策略到本地;
11)前端数据交换模块通过分配的账号、密码登录原业务系统前端;
12)前端数据采集模块启动前端数据交换任务,按任务设置的时间点触发前端写数据操作;
13)前端数据采集模块发送前端数据交换任务启动通知到可视化系统模型构建管理系统;
14)可视化系统模型构建管理系统收到前端数据交换任务启动通知后确认订阅服务配置同步成功;可视化系统模型构建管理系统发送前端数据交换任务启动通知到数据服务管理系统。
15)数据服务管理系统收到前端交换任务启动通知后开始启动对原业务系统订阅数据的状态监控;
16)当满足数据订阅要求时,数据服务管理系统发送订阅数据同步通知到前端数据交换模块,并告知订阅数据的存放路径;
17)前端数据交换模块按照指定的路径读取订阅数据,根据前端数据交换模型转换成原业务系统的数据格式;
18)当数据交换任务到达设置的时间后触发写数据操作(如果是实时任务则立即触发写数据操作)。前端数据交换模块根据原业务系统的业务流程,按照平台设置的数据交换策略,跳转到相应的写数据页面,模拟人工操作从前端写订阅数据到原业务系统。
19)原业务系统保存前端提交的订阅数据到数据库;
20)当所有订阅数据写完后,前端数据交换模块发送订阅数据同步完成通知给数据服务管理系统;
21)数据服务管理系统收到订阅数据同步完成通知后保存订阅服务记录,并在订阅数据过了有效期后自动销毁订阅数据。
本实施例中,获取原业务系统前端页面的至少一个登录验证信息,并采用所述登录验证信息登录所述原业务系统前端页面;在登录成功后,对所述原业务系统前端页面进行系统功能分析、数据内容分析和业务流程分析,构建原业务系统的需求模型;采用网络爬虫对所述原业务系统前端页面进行遍历查询操作,得到查询数据;从所述查询数据中提取关键特征数据,并将所述关键特征数据和所述登录验证信息打包成建模分析数据包,保存至数据库中;基于所述数据库存储的建模分析数据包和所述需求模型进行模型重构,得到原业务系统的数据模型、接口模型和业务模型;在接收到数据共享请求时,生成数据采集任务和采集策略,并基于得到的所述原业务系统的数据模型、接口模型和业务模型启动数据采集工作。本实施例通过分析和重构原业务系统的系统模型,根据原业务系统的功能特性制定相应的数据采集任务和数据采集策略,实现各业务系统的数据自动同步和汇总,汇总数据经过数据清洗、数据转换、数据加工、数据标注、数据治理后实现各业务系统数据的标准化融合,融合的标准化数据既可通过原业务系统重构的系统模型从前端写入原业务系统,也可通过API接口授权提供给各业务系统调用,从而实现跨业务系统之间的数据共享和数据交换,提高了跨业务系统之间的数据共享和数据交换的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如跨业务系统的数据融合共享平台的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行跨业务系统的数据融合共享平台的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的跨业务系统的数据融合共享平台的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种跨业务系统的数据融合共享平台,其特征在于,所述跨业务系统的数据融合共享平台包括前端数据采集系统、数据融合处理系统、可视化系统模型构建管理系统、业务调度管理系统、大数据资源中心管理系统和数据共享系统;其中,
所述前端数据采集系统用于按照跨业务系统的数据融合共享平台设定的采集任务计划和采集策略自动采集经原业务系统授权访问的数据;
所述数据融合处理系统用于对数据清洗标注和标准化处理,将转换后的标准化数据进行连接、过滤、合并、拆分、聚合、转化、赋值操作,并将加工后的数据保存到基础数据库中;
所述可视化系统模型构建管理系统用于对原业务系统进行分析处理并重构系统模型;
所述业务调度管理系统用于创建的各系统的业务流程,以及各个功能的自动化执行的全过程管理、跨系统之间的任务调度和信息交互;
所述大数据资源中心管理系统用于对平台数据资源的物理空间划分、数据资源的安全存储和访问控制等管理;
所述数据共享系统用于参照原业务系统的业务模型,按照所述跨业务系统的数据融合共享平台生成的数据交换任务和数据交换策略,将共享交换数据从原业务系统前端页面自动写入原业务系统数据库。
2.如权利要求1所述的跨业务系统的数据融合共享平台,其特征在于,所述前端数据采集系统包括前端数据采集模块、数据采集系统模型管理模块、数据采集参数配置管理模块、数据采集策略配置管理模块和数据采集任务调度管理模块;其中,
所述前端数据采集模块根据原业务系统前端的类别不同而采用不同的数据采集技术,如果原业务系统是B/S架构,则使用网络爬虫技术;如果原业务系统是C/S架构,则使用网络抓包分析工具;
所述数据采集系统模型管理模块用于保存重构的原业务系统的数据模型、接口模型和业务模型;
所述数据采集参数配置管理模块用于对前端数据采集模块分布式部署的管理,以及对每个前端数据采集模块的前端账户权限信息和参数进行配置管理;
所述数据采集策略配置管理模块用于对每个前端数据采集模块的采集频率、采集周期、触发条件、结束条件参数进行配置;
所述数据采集任务调度管理模块对每个前端数据采集模块执行数据采集的内容,以及数据采集操作的开始、暂停、定时、重启中的至少一个任务进行管理。
3.如权利要求2所述的跨业务系统的数据融合共享平台,其特征在于,所述前端数据采集系统还包括数据采集状态监控和告警模块、数据采集日志管理模块;
所述数据采集状态监控和告警模块用于对每个前端数据采集模块的在线工作状态、数据采集状态和数据采集进度等进行实时监控和异常告警;
所述数据采集日志管理模块用于对每个前端数据采集模块的数据采集行为的日志进行保存和提供查询操作。
4.如权利要求1所述的跨业务系统的数据融合共享平台,其特征在于,所述数据融合处理系统包括数据清洗管理系统、数据转换管理系统、数据加工管理系统、数据标注管理系统、数据治理管理系统、数据服务管理系统和数据应用管理系统;其中,
所述数据清洗管理系统负责根据数据清洗的数据模型和清洗规则对重复的、错误的、缺失的、无效的原始数据进行数据清洗操作;
所述数据转换管理系统负责根据数据转换的数据模型和转换规则,将清洗后的原始数据转换成统一的标准数据格式;
所述数据加工管理系统负责根据数据加工的数据模型和加工规则,对数据转换后的标准化数据进行连接、过滤、合并、拆分、聚合、转化、赋值操作,并将加工后的数据保存到基础数据库中;
所述数据标注管理系统用于根据数据标注的数据模型和标注规则,对基础数据库中的标准化数据进行数据分类、数据标记、数据注释系列操作;
所述数据治理管理系统用于根据数据治理的数据模型和治理规则,对数据目录、数据质量、数据安全、数据生命周期进行管理操作,并将治理后的数据保存到汇总数据库中;
所述数据服务管理系统用于对服务申请、服务订阅、服务列表、服务审批、服务授权、服务接口、服务监控等全方位数据服务管理,并根据数据服务的数据模型和业务规则,对服务订阅方提供相应的数据服务。
5.如权利要求1所述的跨业务系统的数据融合共享平台,其特征在于,所述大数据资源中心管理系统由数据访问控制模块、数据安全存储模块、数据资源管理模块组成;其中,
数据访问控制模块用于对平台各系统对数据资源的可读写操作内容的权限管理、对平台各系统访问数据资源的身份鉴权和业务鉴权,对平台各系统访问数据资源的行为记录查询;
数据安全存储模块用于对平台内数据资源的安全管理和存储管理,包含数据加密和解密、数据签名和验签、数据脱敏、数据水印、安全沙箱、数据备份与恢复中的至少一项;
所述数据资源管理模块将平台数据资源分为大数据资源区、对内共享交换区、对外开放区3个物理区域,其中,所述大数据资源区用于存储系统内的核心数据,包括关系型数据库和非关系型数据库、结构化和非结构化数据,对内共享交换区用于存储业务系统内部交换数据,对外开放区用于存储通过API接口对外开放的数据资源,包含安全沙箱数据和对外开放脱敏数据。
6.如权利要求1所述的跨业务系统的数据融合共享平台,其特征在于,所述可视化系统模型构建管理系统由低代码平台、数据模型构建模块、接口模型构建模块、业务模型构建模块组成,用于通过可视化托拉拽的方式快速构建各业务系统的数据模型、接口模型和业务模型,由业务智能调度管理系统根据业务模型制定的流程、任务和策略,调用接口模型,按照数据模型生成数据及同步数据;其中,
所述低代码平台通过可视化托拉拽的方式对各业务系统数据库表单、数据库报表、业务接口和规则引擎、工作流引擎进行可视化编辑,并通过二次开发接口实现外部条件和功能的接入;
所述数据模型构建模块用于对各业务系统进行可视化数据建模,包括关系型和非关系型数据库建模;
所述接口模型构建模块用于对各业务系统进行可视化的接口建模以及各接口的事件响应;
所述业务模型构建模块用于对各业务系统的业务流程、业务规则、执行任务、执行策略、触发条件、结束条件进行可视化编辑和建模。
7.如权利要求6所述的跨业务系统的数据融合共享平台,其特征在于,所述接口模型构建模块由原业务系统接口模型重构、数据清洗接口模型构建、数据转换接口模型构建、数据加工接口模型构建、数据标注接口模型构建、数据治理接口模型构建、数据服务接口模型构建和数据应用接口模型构建中的至少一个部分组成。
8.一种跨业务系统的数据融合共享方法,其特征在于,所述跨业务系统的数据融合共享方法包括:
获取原业务系统前端页面的至少一个登录验证信息,并采用所述登录验证信息登录所述原业务系统前端页面;
在登录成功后,对所述原业务系统前端页面进行系统功能分析、数据内容分析和业务流程分析,构建原业务系统的需求模型;
采用网络爬虫对所述原业务系统前端页面进行遍历查询操作,得到查询数据;
从所述查询数据中提取关键特征数据,并将所述关键特征数据和所述登录验证信息打包成建模分析数据包,保存至数据库中;
基于所述数据库存储的建模分析数据包和所述需求模型进行模型重构,得到原业务系统的数据模型、接口模型和业务模型;
在接收到数据共享请求时,生成数据采集任务和采集策略,并基于得到的所述原业务系统的数据模型、接口模型和业务模型启动数据采集工作。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求8所述的跨业务系统的数据融合共享方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求8所述的跨业务系统的数据融合共享方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410170109.3A CN117992415A (zh) | 2024-02-06 | 2024-02-06 | 跨业务系统的数据融合共享平台、方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410170109.3A CN117992415A (zh) | 2024-02-06 | 2024-02-06 | 跨业务系统的数据融合共享平台、方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117992415A true CN117992415A (zh) | 2024-05-07 |
Family
ID=90887162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410170109.3A Pending CN117992415A (zh) | 2024-02-06 | 2024-02-06 | 跨业务系统的数据融合共享平台、方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117992415A (zh) |
-
2024
- 2024-02-06 CN CN202410170109.3A patent/CN117992415A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8510720B2 (en) | System landscape trace | |
US9047269B2 (en) | Modeling interactions with a computer system | |
CN107273748B (zh) | 一种基于漏洞poc实现安卓系统漏洞检测的方法 | |
CN103559118A (zh) | 一种基于aop与注解信息系统的安全审计方法 | |
CN113553269B (zh) | 页面埋点上报方法及相关装置 | |
CN107577748A (zh) | 基于大数据的建筑行业信息采集系统及其方法 | |
US9558092B2 (en) | Runtime-agnostic management of applications | |
CN113836237A (zh) | 对数据库的数据操作进行审计的方法及装置 | |
CN109583192A (zh) | 一种基于仿真的移动终端应用固定保全系统及方法 | |
CN111048164A (zh) | 一种医学大数据长期保存系统 | |
WO2019000895A1 (zh) | 一种Flash播放器异常日志管理方法及系统 | |
CN113849561A (zh) | 一种基于区块链技术的赋能平台 | |
CN109446441A (zh) | 一种通用的网络社区可信分布式采集存储系统 | |
CN106778136B (zh) | 一种甄别绕行登录事件的审计方法 | |
US12009997B2 (en) | Cell-based architecture for an extensibility platform | |
CN117992415A (zh) | 跨业务系统的数据融合共享平台、方法、设备及介质 | |
CN116257404A (zh) | 一种日志解析方法及计算设备 | |
CN107294766B (zh) | 一种集中管控的方法及系统 | |
CN115168297A (zh) | 绕行日志审计方法及装置 | |
CN106993032A (zh) | 基于移动互联网应用的嵌入式精准沟通云服务平台 | |
CN115221125A (zh) | 文件处理方法、装置、电子设备及可读存储介质 | |
CN109684158A (zh) | 分布式协调系统的状态监控方法、装置、设备及存储介质 | |
CN109684159A (zh) | 分布式消息系统的状态监控方法、装置、设备及存储介质 | |
KR102656871B1 (ko) | 데이터 관리 장치, 데이터 관리 방법 및 데이터 관리 프로그램을 저장하는 컴퓨터로 판독 가능한 저장 매체 | |
KR102657160B1 (ko) | 데이터 관리 장치, 데이터 관리 방법 및 데이터 관리 프로그램을 저장하는 컴퓨터로 판독 가능한 저장 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |