CN116821428A - 基于数据中台的业务数据智能存储方法及系统 - Google Patents

基于数据中台的业务数据智能存储方法及系统 Download PDF

Info

Publication number
CN116821428A
CN116821428A CN202311090784.7A CN202311090784A CN116821428A CN 116821428 A CN116821428 A CN 116821428A CN 202311090784 A CN202311090784 A CN 202311090784A CN 116821428 A CN116821428 A CN 116821428A
Authority
CN
China
Prior art keywords
data
service
information
business
asset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311090784.7A
Other languages
English (en)
Other versions
CN116821428B (zh
Inventor
胡树
谢进
郑亚飞
周黎
周洋旭
刘彭闵
耿莉萍
刘勇
丁鹏
魏渊
梁凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Smart Jincheng Big Data Co ltd
Original Assignee
Chengdu Smart Jincheng Big Data Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Smart Jincheng Big Data Co ltd filed Critical Chengdu Smart Jincheng Big Data Co ltd
Priority to CN202311090784.7A priority Critical patent/CN116821428B/zh
Publication of CN116821428A publication Critical patent/CN116821428A/zh
Application granted granted Critical
Publication of CN116821428B publication Critical patent/CN116821428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于数据中台的业务数据智能存储方法及系统,涉及数据存储处理技术领域,所述方法包括:基于数据标识规则对业务异构数据信息进行标识,获得业务数据标识信息;按照业务数据标识信息对所述业务异构数据信息进行整合、分流,获得业务数据处理流向信息;基于业务数据处理流向信息对业务异构数据信息进行分支预处理,生成标准业务数据信息;将标准业务数据信息进行数据编码压缩,得到业务资产压缩数据信息;将业务资产压缩数据信息进行标签化存储,并基于数据服务层对所述业务资产压缩数据信息进行调用服务。达到利用业务数据标识实现数据分流处理,保证数据存储处理准确性和存储处理标准化,进而提高数据存储效率的技术效果。

Description

基于数据中台的业务数据智能存储方法及系统
技术领域
本发明涉及数据存储处理技术领域,尤其涉及基于数据中台的业务数据智能存储方法及系统。
背景技术
随着数字化时代的到来,企业面临着日益增长的业务数据量和复杂的数据需求,为了更好地管理和利用企业的数据资产,数据业务中台应运而生。数据业务中台是一个统一的数据管理和服务平台,旨在集中管理企业内各类数据资源,提供数据共享、数据治理和数据服务等功能,以支持企业的决策和业务创新,从而实现对业务的赋能加速。然而,现有技术业务数据存储量较大,数据存储处理缺乏标准化,导致存储效率较低。
发明内容
本申请通过提供基于数据中台的业务数据智能存储方法及系统,解决了现有技术业务数据存储量较大,数据存储处理缺乏标准化,导致存储效率较低的技术问题,达到利用业务数据标识实现数据分流处理,保证数据存储处理准确性和存储处理标准化,进而提高数据存储效率的技术效果。
鉴于上述问题,本发明提供了基于数据中台的业务数据智能存储方法及系统。
第一方面,本申请提供了基于数据中台的业务数据智能存储方法,所述方法包括:搭建业务数据中台,所述业务数据中台的功能架构包括数据感知层、数据资产层和数据服务层;通过所述数据感知层对业务流程数据进行记录,采集获取业务异构数据信息;获取数据标识规则,基于所述数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息;按照所述业务数据标识信息对所述业务异构数据信息进行整合、分流,获得业务数据处理流向信息;基于所述业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息;将所述标准业务数据信息传输至所述数据资产层进行数据编码压缩,得到业务资产压缩数据信息;将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,并基于所述数据服务层对所述业务资产压缩数据信息进行调用服务。
另一方面,本申请还提供了基于数据中台的业务数据智能存储系统,所述系统包括:数据中台搭建模块,用于搭建业务数据中台,所述业务数据中台的功能架构包括数据感知层、数据资产层和数据服务层;数据记录采集模块,用于通过所述数据感知层对业务流程数据进行记录,采集获取业务异构数据信息;业务数据标识模块,用于获取数据标识规则,基于所述数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息;数据整合分流模块,用于按照所述业务数据标识信息对所述业务异构数据信息进行整合、分流,获得业务数据处理流向信息;分支预处理模块,用于基于所述业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息;数据编码压缩模块,用于将所述标准业务数据信息传输至所述数据资产层进行数据编码压缩,得到业务资产压缩数据信息;数据调用服务模块,用于将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,并基于所述数据服务层对所述业务资产压缩数据信息进行调用服务。
第三方面,本申请提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现上述任意一项所述方法中的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述方法中的步骤。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了搭建业务数据中台,通过其数据感知层对业务流程数据进行记录,采集获取业务异构数据信息,再基于数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息。按照业务数据标识信息对业务异构数据信息进行整合、分流,并基于所分流的业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息。将标准业务数据信息传输至数据资产层进行数据编码压缩,得到业务资产压缩数据信息,进而将其在数据资产层进行标签化存储,并基于数据服务层对所述业务资产压缩数据信息进行调用服务的技术方案。进而达到利用业务数据标识实现数据分流处理,保证数据存储处理准确性和存储处理标准化,进而提高数据存储效率的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请基于数据中台的业务数据智能存储方法的流程示意图;
图2为本申请基于数据中台的业务数据智能存储方法中获得业务数据标识信息的流程示意图;
图3为本申请基于数据中台的业务数据智能存储系统的结构示意图;
图4为本申请示例性电子设备的结构示意图。
附图标记说明:数据中台搭建模块11,数据记录采集模块12,业务数据标识模块13,数据整合分流模块14,分支预处理模块15,数据编码压缩模块16,数据调用服务模块17,总线1110,处理器1120,收发器1130,总线接口1140,存储器1150,操作系统1151,应用程序1152和用户接口1160。
具体实施方式
在本申请的描述中,所属技术领域的技术人员应当知道,本申请可以实现为方法、装置、电子设备及计算机可读存储介质。因此,本申请可以具体实现为以下形式:完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、硬件和软件结合的形式。此外,在一些实施例中,本申请还可以实现为在一个或多个计算机可读存储介质中的计算机程序产品的形式,该计算机可读存储介质中包含计算机程序代码。
上述计算机可读存储介质可以采用一个或多个计算机可读存储介质的任意组合。计算机可读存储介质包括:电、磁、光、电磁、红外或半导体的系统、装置或器件,或者以上任意的组合。计算机可读存储介质更具体的例子包括:便携式计算机磁盘、硬盘、随机存取存储器、只读存储器、可擦除可编程只读存储器、闪存、光纤、光盘只读存储器、光存储器件、磁存储器件或以上任意组合。在本申请中,计算机可读存储介质可以是任意包含或存储程序的有形介质,该程序可以被指令执行系统、装置、器件使用或与其结合使用。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律的相关规定。
本申请通过流程图和/或方框图描述所提供的方法、装置、电子设备。
应当理解,流程图和/或方框图的每个方框以及流程图和/或方框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机可读程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或方框图中的方框规定的功能/操作的装置。
也可以将这些计算机可读程序指令存储在能使得计算机或其他可编程数据处理装置以特定方式工作的计算机可读存储介质中。这样,存储在计算机可读存储介质中的指令就产生出一个包括实现流程图和/或方框图中的方框规定的功能/操作的指令装置产品。
也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程数据处理装置上执行的指令能够提供实现流程图和/或方框图中的方框规定的功能/操作的过程。
下面结合本申请中的附图对本申请进行描述。
实施例一:
如图1所示,本申请提供了基于数据中台的业务数据智能存储方法,所述方法包括:
步骤S1:搭建业务数据中台,所述业务数据中台的功能架构包括数据感知层、数据资产层和数据服务层;
步骤S2:通过所述数据感知层对业务流程数据进行记录,采集获取业务异构数据信息;
具体的,随着数字化时代的到来,企业面临着日益增长的业务数据量和复杂的数据需求,为了更好地管理和利用企业的数据资产,数据业务中台应运而生。数据业务中台是一个统一的数据管理和服务平台,旨在集中管理企业内各类数据资源,提供数据共享、数据治理和数据服务等功能,以支持企业的决策和业务创新,从而实现对业务的赋能加速。
为实现业务数据智能化存储,搭建业务数据中台,所述业务数据中台用于对业务数据进行高效存储处理管理,其功能架构包括数据感知层、数据资产层和数据服务层。各功能架构层具有不同数据处理功能,通过各架构层数据交互实现业务数据标准化处理。首先通过所述数据感知层对业务流程数据进行记录,其中,数据感知层用于对业务流程数据监测采集,集成获取业务异构数据信息,所述业务异构数据信息是未经处理的不同格式类型业务元数据,例如财务类数据、销售类数据等,以用于后续业务数据高效存储处理。
步骤S3:获取数据标识规则,基于所述数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息;
如图2所示,进一步而言,所述获得业务数据标识信息,本申请步骤还包括:
具体的,为实现数据标准化存储,制定获取数据标识规则,所述数据标识规则为对业务数据进行分类标识的依据。首先根据所述数据标识规则,确定属性标识规则和敏感度标识规则,其中,所述属性标识规则为业务数据属性分类依据。通过所述属性标识规则构建属性分类器,所述属性分类器由数据属性分类指标构成,主要包括产生时间,即数据生成时间远近;数据层级,即数据重要等级;数据类型,即数据所属业务类型;生成格式,即数据结构格式。按照所述属性分类器对所述业务异构数据信息分别进行分类,再依据分类后的数据属性类型对业务异构数据信息进行标记,获得相应的数据属性标识信息。
再基于敏感度标识规则对所述业务异构数据信息进行敏感度评估,敏感数据是指泄漏后可能会给企业带来严重危害的数据,例如财务数据、经营数据等。其中,敏感度标识规则是用于对数据敏感程度进行评估的依据,可根据企业业务情况自行设定,依次对业务数据进行敏感度评估,获得相应的数据敏感度标识信息,敏感度越高,数据隐私程度越高。基于所述数据属性标识信息和所述数据敏感度标识信息,组合生成业务数据标识信息。通过属性标识和敏感度标识实现数据标识全面性,进而提高后续数据处理效率和处理准确性。
步骤S4:按照所述业务数据标识信息对所述业务异构数据信息进行整合、分流,获得业务数据处理流向信息;
进一步而言,所述获得业务数据处理流向信息,本申请步骤还包括:
基于所述业务数据标识信息对所述业务异构数据信息进行分类整合,得到业务异构同属数据信息;
根据所述业务数据标识信息,设置数据处理双通道,所述数据处理双通道包括结构化数据处理通道和非结构化数据处理通道;
对所述业务异构同属数据信息进行结构化分类,获得业务同属数据结构化格式;
基于所述数据处理双通道对所述业务同属数据结构化格式进行分流,确定所述业务数据处理流向信息。
具体的,按照所述业务数据标识信息对所述业务异构数据信息进行整合、分流,首先基于所述业务数据标识信息对所述业务异构数据信息进行分类整合,即将相同标识类型的业务数据整合为一类,得到业务异构同属数据信息。根据所述业务数据标识信息,设置数据处理双通道,所述数据处理双通道用于对不同格式的业务数据进行预处理,包括结构化数据处理通道和非结构化数据处理通道。对所述业务异构同属数据信息进行结构化分类,获得按照数据结构格式分类后的业务同属数据结构化格式,即将各属性业务数据分为结构化数据,包括订单数据、产品数据等,和非结构化数据,包括图像、视频等业务数据。基于所述数据处理双通道对所述业务同属数据结构化格式进行分流,将业务数据按照格式类型分流至对应的数据处理通道,确定业务数据处理流向信息,以作为后续数据处理方式依据。通过业务数据标识实现数据分流处理,提高数据处理效率和处理准确性。
步骤S5:基于所述业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息;
进一步而言,所述生成标准业务数据信息,本申请步骤还包括:
基于所述结构化数据处理通道对所述业务异构数据信息进行异常数据识别,获取异常业务数据信息;
对所述异常业务数据信息进行数据清洗处理,得到标准结构化业务数据信息;
依据所述非结构化数据处理通道对所述业务异构数据信息进行去噪预处理、特征提取,得到标准业务特征数据信息;
基于所述标准结构化业务数据信息和所述标准业务特征数据信息,生成所述标准业务数据信息。
具体的,基于所述业务数据处理流向信息对所述业务异构数据信息进行分支预处理,不同流向业务数据预处理方式不同。对于结构化业务数据处理,基于所述结构化数据处理通道对所述业务异构数据信息进行异常数据识别,可设置数据分类规则对其中重复值、缺失值、超出界限值等不可用数据识别提取,以此获取异常业务数据信息。再对所述异常业务数据信息进行数据清洗处理,将异常数据进行清除处理,得到标准结构化业务数据信息。对于非结构化业务数据处理,依据所述非结构化数据处理通道对所述业务异构数据信息进行去噪预处理,可采用滤波算法实现数据噪音去除,再对去噪后的数据进行特征提取,示例性的,可采用卷积提取方式获取图像数据中的业务应用特征信息,以此得到标准业务特征数据信息。基于所述标准结构化业务数据信息和所述标准业务特征数据信息,组成标准业务数据信息。实现数据分流预处理,提高数据处理效率和数据存储处理标准化。
步骤S6:将所述标准业务数据信息传输至所述数据资产层进行数据编码压缩,得到业务资产压缩数据信息;
进一步而言,所述得到业务资产压缩数据信息,本申请步骤还包括:
遍历提取所述标准业务数据信息中的数据标签信息;
根据所述数据标签信息,生成标签编码规则,所述标签编码规则包括编码位数和编码符号;
基于所述标签编码规则对所述数据标签信息进行编码,构建标签数据字典;
基于所述标签数据字典对所述标准业务数据信息进行标签压缩,得到所述业务资产压缩数据信息。
具体的,将所述标准业务数据信息传输至所述数据资产层进行数据编码压缩,其中,数据资产层由于对业务数据进行存储管理。由于业务数据量大,为减小数据存储空间,对业务数据进行编码压缩。首先遍历提取所述标准业务数据信息中的数据标签信息,数据标签是用来描述业务数据内容和属性的标签,通过将数据附加到描述性标签的方式,为业务数据提供更详细的描述性信息,例如日期、时间、地点、产品类型等标签。数据标签占用存储空间大,因此可编码压缩,根据所述数据标签信息,生成标签编码规则,所述标签编码规则为数据标签编码依据,包括编码位数,即数据标签编码位数,和编码符号,即数据标签表示符号,如数字、字母等。
基于所述标签编码规则对所述数据标签信息分别进行编码,将数据标签以及对应的标签编码结果映射构建标签数据字典,以作为标签编码查找依据。基于所述标签数据字典对所述标准业务数据信息进行标签压缩,将业务数据中的各数据标签进行编码压缩,得到编码后空间占比减少的业务资产压缩数据信息。通过构建标签数据字典实现数据标签压缩,提高数据压缩效率,减少数据存储空间,进而提高数据存储效率和数据资产规范化管理。
步骤S7:将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,并基于所述数据服务层对所述业务资产压缩数据信息进行调用服务。
进一步而言,所述对所述业务资产压缩数据信息进行调用服务,本申请步骤还包括:
将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,生成标签化业务数据资产库;
基于业务职能权限数据库进行访问权限分配,构建细粒度分级访问机制;
获取访问用户属性信息,基于所述细粒度分级访问机制对所述访问用户属性信息进行匹配,获得用户访问权限信息;
基于所述用户访问权限信息与所述标签化业务数据资产库进行标签映射,并根据访问数据映射结果进行动态存储数据访问。
具体的,将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,即将压缩后的业务数据按照业务数据标识信息进行标签打标存储,利于访问查询。并基于所述数据服务层对所述业务资产压缩数据信息进行调用服务,其中,数据服务层用于向访问用户提供数据调用服务。首先将所述业务资产压缩数据信息在所述数据资产层进行按照业务数据标识信息的标签化存储,生成标签化业务数据资产库,实现数据资产存储标准化。
通过企业职能规章构建业务职能权限数据库,所述业务职能权限数据库用于规定企业各职能角色的权限范围。基于业务职能权限数据库作为依据进行访问权限分配,构建细粒度分级访问机制,所述细粒度分级访问机制为用于精准控制各职能角色的存储数据访问范围,提高数据存储访问安全性。获取访问用户属性信息,所述访问用户属性信息为访问用户的职能角色属性,包括姓名、职能等信息,基于所述细粒度分级访问机制对所述访问用户属性信息进行匹配,获得该用户的存储数据可访问范围权限即用户访问权限信息。基于所述用户访问权限信息与所述标签化业务数据资产库进行标签映射,调用与访问权限相匹配的数据资产,并根据访问数据映射结果进行动态存储数据访问,提供存储数据访问服务。通过标签映射调取访问数据内容,提高数据调用效率和服务精确性,实现个性化细粒度访问,保证存储数据访问安全性和访问服务质量。
进一步而言,本申请步骤还包括:
基于所述业务数据标识信息对所述业务异构数据信息进行敏感度评级,获得业务数据敏感度等级信息;
根据所述业务数据敏感度等级信息,确定业务数据脱敏系数;
基于所述业务数据脱敏系数,映射配置数据脱敏算法;
基于所述数据脱敏算法对所述业务异构数据信息进行数据脱敏,确定所述标准业务数据信息。
具体的,在对业务数据实现结构格式预处理之外,还需对业务敏感数据进行处理。首先基于所述业务数据标识信息中的所述数据敏感度标识信息对所述业务异构数据信息进行敏感度评级,具体敏感等级划分可根据业务设置自行设定,示例性的,敏感度等级可划分为极敏感级、敏感级、较敏感级和低敏感级等,以此获得业务数据敏感度等级信息,敏感度越大,对应的敏感度等级越高。为实现业务敏感数据的可靠保护,需对其进行数据脱敏,是将业务敏感数据通过脱敏规则进行数据变形的处理方式。首先根据所述业务数据敏感度等级信息,确定业务数据脱敏系数,即数据的敏感等级越大,对应的数据脱敏系数越大,脱敏处理程度也相应越大。
基于所述业务数据脱敏系数,映射配置数据脱敏算法,数据脱敏算法包括字符串替换、掩码算法、加密算法、哈希算法、数据库脱敏等,不同脱敏算法的数据脱敏程度不同,可自行配置将数据脱敏算法和数据脱敏系数进行映射匹配。再基于所述数据脱敏算法对所述业务异构数据信息分别进行数据脱敏,将真实业务数据替换成脱敏后的模拟数据或加密数据,以此脱敏处理得到标准业务数据信息。通过对敏感数据进行数据脱敏,实现业务敏感的可靠保护,进而提高业务数据存储安全性。
综上所述,本申请所提供的基于数据中台的业务数据智能存储方法及系统具有如下技术效果:
由于采用了搭建业务数据中台,通过其数据感知层对业务流程数据进行记录,采集获取业务异构数据信息,再基于数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息。按照业务数据标识信息对业务异构数据信息进行整合、分流,并基于所分流的业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息。将标准业务数据信息传输至数据资产层进行数据编码压缩,得到业务资产压缩数据信息,进而将其在数据资产层进行标签化存储,并基于数据服务层对所述业务资产压缩数据信息进行调用服务的技术方案。进而达到利用业务数据标识实现数据分流处理,保证数据存储处理准确性和存储处理标准化,进而提高数据存储效率的技术效果。
实施例二:
基于与前述实施例中基于数据中台的业务数据智能存储方法同样发明构思,本发明还提供了基于数据中台的业务数据智能存储系统,如图3所示,所述系统包括:
数据中台搭建模块11,用于搭建业务数据中台,所述业务数据中台的功能架构包括数据感知层、数据资产层和数据服务层;
数据记录采集模块12,用于通过所述数据感知层对业务流程数据进行记录,采集获取业务异构数据信息;
业务数据标识模块13,用于获取数据标识规则,基于所述数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息;
数据整合分流模块14,用于按照所述业务数据标识信息对所述业务异构数据信息进行整合、分流,获得业务数据处理流向信息;
分支预处理模块15,用于基于所述业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息;
数据编码压缩模块16,用于将所述标准业务数据信息传输至所述数据资产层进行数据编码压缩,得到业务资产压缩数据信息;
数据调用服务模块17,用于将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,并基于所述数据服务层对所述业务资产压缩数据信息进行调用服务。
进一步的,所述系统还包括:
标识规则确定单元,用于根据所述数据标识规则,确定属性标识规则和敏感度标识规则;
属性分类器构建单元,用于通过所述属性标识规则构建属性分类器,所述属性分类器包括产生时间、数据层级、数据类型、生成格式;
数据分类标识单元,用于按照所述属性分类器对所述业务异构数据信息进行分类标识,获得数据属性标识信息;
敏感度评估单元,用于基于所述敏感度标识规则对所述业务异构数据信息进行敏感度评估,确定数据敏感度标识信息;
业务数据标识生成单元,用于基于所述数据属性标识信息和所述数据敏感度标识信息,组合生成所述业务数据标识信息。
进一步的,所述系统还包括:
数据分类整合单元,用于基于所述业务数据标识信息对所述业务异构数据信息进行分类整合,得到业务异构同属数据信息;
处理双通道设置单元,用于根据所述业务数据标识信息,设置数据处理双通道,所述数据处理双通道包括结构化数据处理通道和非结构化数据处理通道;
结构化分类单元,用于对所述业务异构同属数据信息进行结构化分类,获得业务同属数据结构化格式;
数据处理流向确定单元,用于基于所述数据处理双通道对所述业务同属数据结构化格式进行分流,确定所述业务数据处理流向信息。
进一步的,所述系统还包括:
异常数据识别单元,用于基于所述结构化数据处理通道对所述业务异构数据信息进行异常数据识别,获取异常业务数据信息;
数据清洗处理单元,用于对所述异常业务数据信息进行数据清洗处理,得到标准结构化业务数据信息;
数据特征提取单元,用于依据所述非结构化数据处理通道对所述业务异构数据信息进行去噪预处理、特征提取,得到标准业务特征数据信息;
标准数据生成单元,用于基于所述标准结构化业务数据信息和所述标准业务特征数据信息,生成所述标准业务数据信息。
进一步的,所述系统还包括:
敏感度评级单元,用于基于所述业务数据标识信息对所述业务异构数据信息进行敏感度评级,获得业务数据敏感度等级信息;
数据脱敏系数确定单元,用于根据所述业务数据敏感度等级信息,确定业务数据脱敏系数;
脱敏算法配置单元,用于基于所述业务数据脱敏系数,映射配置数据脱敏算法;
数据脱敏单元,用于基于所述数据脱敏算法对所述业务异构数据信息进行数据脱敏,确定所述标准业务数据信息。
进一步的,所述系统还包括:
标签遍历提取单元,用于遍历提取所述标准业务数据信息中的数据标签信息;
编码规则生成单元,用于根据所述数据标签信息,生成标签编码规则,所述标签编码规则包括编码位数和编码符号;
数据字典构建单元,用于基于所述标签编码规则对所述数据标签信息进行编码,构建标签数据字典;
标签压缩单元,用于基于所述标签数据字典对所述标准业务数据信息进行标签压缩,得到所述业务资产压缩数据信息。
进一步的,所述系统还包括:
标签化存储单元,用于将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,生成标签化业务数据资产库;
访问权限分配单元,用于基于业务职能权限数据库进行访问权限分配,构建细粒度分级访问机制;
访问权限获得单元,用于获取访问用户属性信息,基于所述细粒度分级访问机制对所述访问用户属性信息进行匹配,获得用户访问权限信息;
存储数据访问单元,用于基于所述用户访问权限信息与所述标签化业务数据资产库进行标签映射,并根据访问数据映射结果进行动态存储数据访问。
前述图1实施例一中的基于数据中台的业务数据智能存储方法的各种变化方式和具体实例同样适用于本实施例的基于数据中台的业务数据智能存储系统,通过前述对基于数据中台的业务数据智能存储方法的详细描述,本领域技术人员可以清楚的知道本实施例中基于数据中台的业务数据智能存储系统的实施方法,所以为了说明书的简洁,在此不再详述。
此外,本申请还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该收发器、该存储器和处理器分别通过总线相连,计算机程序被处理器执行时实现上述控制输出数据的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
示例性电子设备:
具体的,参见图4所示,本申请还提供了一种电子设备,该电子设备包括总线1110、处理器1120、收发器1130、总线接口1140、存储器1150和用户接口1160。
在本申请中,该电子设备还包括:存储在存储器1150上并可在处理器1120上运行的计算机程序,计算机程序被处理器1120执行时实现上述控制输出数据的方法实施例的各个过程。
收发器1130,用于在处理器1120的控制下接收和发送数据。
本申请中,总线架构(用总线1110来代表),总线1110可以包括任意数量互联的总线和桥,总线1110将包括由处理器1120代表的一个或多个处理器与存储器1150代表的存储器的各种电路连接在一起。
总线1110表示若干类型的总线结构中的任何一种总线结构中的一个或多个,包括存储器总线和存储器控制器、外围总线、加速图形端口、处理器或使用各种总线体系结构中的任意总线结构的局域总线。作为示例而非限制,这样的体系结构包括:工业标准体系结构总线、微通道体系结构总线、扩展总线、视频电子标准协会、外围部件互连总线。
处理器1120可以是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中硬件的集成逻辑电路或软件形式的指令完成。上述的处理器包括:通用处理器、中央处理器、网络处理器、数字信号处理器、专用集成电路、现场可编程门阵列、复杂可编程逻辑器件、可编程逻辑阵列、微控制单元或其他可编程逻辑器件、分立门、晶体管逻辑器件、分立硬件组件。可以实现或执行本申请中公开的各方法、步骤和逻辑框图。例如,处理器可以是单核处理器或多核处理器,处理器可以集成于单颗芯片或位于多颗不同的芯片。
处理器1120可以是微处理器或任何常规的处理器。结合本申请所公开的方法步骤可以直接由硬件译码处理器执行完成,或者由译码处理器中的硬件和软件模块组合执行完成。软件模块可以位于随机存取存储器、闪存、只读存储器、可编程只读存储器、可擦除可编程只读存储器、寄存器等本领域公知的可读存储介质中。所述可读存储介质位于存储器中,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
总线1110还可以将,例如外围设备、稳压器或功率管理电路等各种其他电路连接在一起,总线接口1140在总线1110和收发器1130之间提供接口,这些都是本领域所公知的。因此,本申请不再对其进行进一步描述。
收发器1130可以是一个元件,也可以是多个元件,例如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发器1130从其他设备接收外部数据,收发器1130用于将处理器1120处理后的数据发送给其他设备。取决于计算机装置的性质,还可以提供用户接口1160,例如:触摸屏、物理键盘、显示器、鼠标、扬声器、麦克风、轨迹球、操纵杆、触控笔。
应理解,在本申请中,存储器1150可进一步包括相对于处理器1120远程设置的存储器,这些远程设置的存储器可以通过网络连接至服务器。上述网络的一个或多个部分可以是自组织网络、内联网、外联网、虚拟专用网、局域网、无线局域网、广域网、无线广域网、城域网、互联网、公共交换电话网、普通老式电话业务网、蜂窝电话网、无线网络、无线保真网络以和两个或更多个上述网络的组合。例如,蜂窝电话网和无线网络可以是全球移动通信装置、码分多址装置、全球微波互联接入装置、通用分组无线业务装置、宽带码分多址装置、长期演进装置、LTE频分双工装置、LTE时分双工装置、先进长期演进装置、通用移动通信装置、增强移动宽带装置、海量机器类通信装置、超可靠低时延通信装置等。
应理解,本申请中的存储器1150可以是易失性存储器或非易失性存储器,或可包括易失性存储器和非易失性存储器两者。其中,非易失性存储器包括:只读存储器、可编程只读存储器、可擦除可编程只读存储器、电可擦除可编程只读存储器,或闪存。
易失性存储器包括:随机存取存储器,其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如:静态随机存取存储器、动态随机存取存储器、同步动态随机存取存储器、双倍数据速率同步动态随机存取存储器、增强型同步动态随机存取存储器、同步连接动态随机存取存储器和直接内存总线随机存取存储器。本申请描述的电子设备的存储器1150包括但不限于上述和任意其他适合类型的存储器。
在本申请中,存储器1150存储了操作系统1151和应用程序1152的如下元素:可执行模块、数据结构,或者其子集,或者其扩展集。
具体而言,操作系统1151包含各种装置程序,例如:框架层、核心库层、驱动层等,用于实现各种基础业务和处理基于硬件的任务。应用程序1152包含各种应用程序,例如:媒体播放器、浏览器,用于实现各种应用业务。实现本申请方法的程序可以包含在应用程序1152中。应用程序1152包括:小程序、对象、组件、逻辑、数据结构和其他执行特定任务或实现特定抽象数据类型的计算机装置可执行指令。
此外,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述控制输出数据的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请披露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (8)

1.基于数据中台的业务数据智能存储方法,其特征在于,所述方法包括:
搭建业务数据中台,所述业务数据中台的功能架构包括数据感知层、数据资产层和数据服务层;
通过所述数据感知层对业务流程数据进行记录,采集获取业务异构数据信息;
获取数据标识规则,基于所述数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息;
按照所述业务数据标识信息对所述业务异构数据信息进行整合、分流,获得业务数据处理流向信息;
基于所述业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息;
将所述标准业务数据信息传输至所述数据资产层进行数据编码压缩,得到业务资产压缩数据信息;
将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,并基于所述数据服务层对所述业务资产压缩数据信息进行调用服务。
2.如权利要求1所述的方法,其特征在于,所述获得业务数据标识信息,包括:
根据所述数据标识规则,确定属性标识规则和敏感度标识规则;
通过所述属性标识规则构建属性分类器,所述属性分类器包括产生时间、数据层级、数据类型、生成格式;
按照所述属性分类器对所述业务异构数据信息进行分类标识,获得数据属性标识信息;
基于所述敏感度标识规则对所述业务异构数据信息进行敏感度评估,确定数据敏感度标识信息;
基于所述数据属性标识信息和所述数据敏感度标识信息,组合生成所述业务数据标识信息。
3.如权利要求1所述的方法,其特征在于,所述获得业务数据处理流向信息,包括:
基于所述业务数据标识信息对所述业务异构数据信息进行分类整合,得到业务异构同属数据信息;
根据所述业务数据标识信息,设置数据处理双通道,所述数据处理双通道包括结构化数据处理通道和非结构化数据处理通道;
对所述业务异构同属数据信息进行结构化分类,获得业务同属数据结构化格式;
基于所述数据处理双通道对所述业务同属数据结构化格式进行分流,确定所述业务数据处理流向信息。
4.如权利要求3所述的方法,其特征在于,所述生成标准业务数据信息,包括:
基于所述结构化数据处理通道对所述业务异构数据信息进行异常数据识别,获取异常业务数据信息;
对所述异常业务数据信息进行数据清洗处理,得到标准结构化业务数据信息;
依据所述非结构化数据处理通道对所述业务异构数据信息进行去噪预处理、特征提取,得到标准业务特征数据信息;
基于所述标准结构化业务数据信息和所述标准业务特征数据信息,生成所述标准业务数据信息。
5.如权利要求4所述的方法,其特征在于,所述方法包括:
基于所述业务数据标识信息对所述业务异构数据信息进行敏感度评级,获得业务数据敏感度等级信息;
根据所述业务数据敏感度等级信息,确定业务数据脱敏系数;
基于所述业务数据脱敏系数,映射配置数据脱敏算法;
基于所述数据脱敏算法对所述业务异构数据信息进行数据脱敏,确定所述标准业务数据信息。
6.如权利要求1所述的方法,其特征在于,所述得到业务资产压缩数据信息,包括:
遍历提取所述标准业务数据信息中的数据标签信息;
根据所述数据标签信息,生成标签编码规则,所述标签编码规则包括编码位数和编码符号;
基于所述标签编码规则对所述数据标签信息进行编码,构建标签数据字典;
基于所述标签数据字典对所述标准业务数据信息进行标签压缩,得到所述业务资产压缩数据信息。
7.如权利要求1所述的方法,其特征在于,所述对所述业务资产压缩数据信息进行调用服务,包括:
将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,生成标签化业务数据资产库;
基于业务职能权限数据库进行访问权限分配,构建细粒度分级访问机制;
获取访问用户属性信息,基于所述细粒度分级访问机制对所述访问用户属性信息进行匹配,获得用户访问权限信息;
基于所述用户访问权限信息与所述标签化业务数据资产库进行标签映射,并根据访问数据映射结果进行动态存储数据访问。
8.基于数据中台的业务数据智能存储系统,其特征在于,所述系统包括:
数据中台搭建模块,用于搭建业务数据中台,所述业务数据中台的功能架构包括数据感知层、数据资产层和数据服务层;
数据记录采集模块,用于通过所述数据感知层对业务流程数据进行记录,采集获取业务异构数据信息;
业务数据标识模块,用于获取数据标识规则,基于所述数据标识规则对所述业务异构数据信息进行标识,获得业务数据标识信息;
数据整合分流模块,用于按照所述业务数据标识信息对所述业务异构数据信息进行整合、分流,获得业务数据处理流向信息;
分支预处理模块,用于基于所述业务数据处理流向信息对所述业务异构数据信息进行分支预处理,生成标准业务数据信息;
数据编码压缩模块,用于将所述标准业务数据信息传输至所述数据资产层进行数据编码压缩,得到业务资产压缩数据信息;
数据调用服务模块,用于将所述业务资产压缩数据信息在所述数据资产层进行标签化存储,并基于所述数据服务层对所述业务资产压缩数据信息进行调用服务。
CN202311090784.7A 2023-08-29 2023-08-29 基于数据中台的业务数据智能存储方法及系统 Active CN116821428B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311090784.7A CN116821428B (zh) 2023-08-29 2023-08-29 基于数据中台的业务数据智能存储方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311090784.7A CN116821428B (zh) 2023-08-29 2023-08-29 基于数据中台的业务数据智能存储方法及系统

Publications (2)

Publication Number Publication Date
CN116821428A true CN116821428A (zh) 2023-09-29
CN116821428B CN116821428B (zh) 2023-11-07

Family

ID=88124335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311090784.7A Active CN116821428B (zh) 2023-08-29 2023-08-29 基于数据中台的业务数据智能存储方法及系统

Country Status (1)

Country Link
CN (1) CN116821428B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7587404B1 (en) * 2005-01-11 2009-09-08 Lockheed Martin Corporation Enhanced dynamic decision support processing using fused multiple disparate data sources
US20140046709A1 (en) * 2012-08-08 2014-02-13 Mark Clement Kwapiszeski Methods and systems for evaluating technology assets
US20190050595A1 (en) * 2016-06-10 2019-02-14 OneTrust, LLC Data processing systems for use in automatically generating, populating, and submitting data subject access requests
CN110197331A (zh) * 2019-05-24 2019-09-03 深圳前海微众银行股份有限公司 业务数据处理方法、装置、设备及计算机可读存储介质
CN110851431A (zh) * 2019-10-30 2020-02-28 中盈优创资讯科技有限公司 用于数据中台的数据处理方法及装置
CN111818154A (zh) * 2020-07-06 2020-10-23 桦蓥(上海)信息科技有限责任公司 一种基于网络层报文解析的业务推送系统及方法
CN112463843A (zh) * 2020-11-27 2021-03-09 国家电网有限公司大数据中心 基于区块链和数据资源目录的电网数据共享方法及系统
CN112651039A (zh) * 2020-11-18 2021-04-13 国网江苏省电力有限公司营销服务中心 一种融合业务场景的电力数据差异化脱敏方法及装置
CN112699175A (zh) * 2021-01-15 2021-04-23 广州汇智通信技术有限公司 一种数据治理系统及其方法
CN113344348A (zh) * 2021-05-25 2021-09-03 中国平安人寿保险股份有限公司 多类别素材审批文档的生成方法、装置、设备及存储介质
CN114116793A (zh) * 2021-10-26 2022-03-01 大数据安全工程研究中心(贵州)有限公司 一种数据资产发现平台
CN114764508A (zh) * 2022-04-18 2022-07-19 张煜琦 一种基于人工智能的企业数据安全管理系统
CN116228106A (zh) * 2023-03-13 2023-06-06 联通雄安产业互联网有限公司 一种基于元宇宙平台的钢铁物料智能化管理系统及方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7587404B1 (en) * 2005-01-11 2009-09-08 Lockheed Martin Corporation Enhanced dynamic decision support processing using fused multiple disparate data sources
US20140046709A1 (en) * 2012-08-08 2014-02-13 Mark Clement Kwapiszeski Methods and systems for evaluating technology assets
US20190050595A1 (en) * 2016-06-10 2019-02-14 OneTrust, LLC Data processing systems for use in automatically generating, populating, and submitting data subject access requests
CN110197331A (zh) * 2019-05-24 2019-09-03 深圳前海微众银行股份有限公司 业务数据处理方法、装置、设备及计算机可读存储介质
CN110851431A (zh) * 2019-10-30 2020-02-28 中盈优创资讯科技有限公司 用于数据中台的数据处理方法及装置
CN111818154A (zh) * 2020-07-06 2020-10-23 桦蓥(上海)信息科技有限责任公司 一种基于网络层报文解析的业务推送系统及方法
CN112651039A (zh) * 2020-11-18 2021-04-13 国网江苏省电力有限公司营销服务中心 一种融合业务场景的电力数据差异化脱敏方法及装置
CN112463843A (zh) * 2020-11-27 2021-03-09 国家电网有限公司大数据中心 基于区块链和数据资源目录的电网数据共享方法及系统
CN112699175A (zh) * 2021-01-15 2021-04-23 广州汇智通信技术有限公司 一种数据治理系统及其方法
CN113344348A (zh) * 2021-05-25 2021-09-03 中国平安人寿保险股份有限公司 多类别素材审批文档的生成方法、装置、设备及存储介质
CN114116793A (zh) * 2021-10-26 2022-03-01 大数据安全工程研究中心(贵州)有限公司 一种数据资产发现平台
CN114764508A (zh) * 2022-04-18 2022-07-19 张煜琦 一种基于人工智能的企业数据安全管理系统
CN116228106A (zh) * 2023-03-13 2023-06-06 联通雄安产业互联网有限公司 一种基于元宇宙平台的钢铁物料智能化管理系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王廷银;林明贵;陈达;吴允平;: "基于北斗RDSS的核辐射监测应急通讯方法", 计算机系统应用, no. 12, pages 252 - 256 *
谢重阳;艾迪;: "基于异构混搭架构的大数据平台", 广播电视信息, no. 10, pages 71 - 76 *

Also Published As

Publication number Publication date
CN116821428B (zh) 2023-11-07

Similar Documents

Publication Publication Date Title
US10560465B2 (en) Real time anomaly detection for data streams
CN109034993B (zh) 对账方法、设备、系统及计算机可读存储介质
KR20220041704A (ko) 특징 추출에 기반한 다중 모델 훈련 방법 및 시스템, 전자 장치 및 매체
Raghavendra et al. RETRACTED ARTICLE: Improved image compression using effective lossless compression technique
CN112818398B (zh) 针对大数据隐私保护的数据处理方法及大数据处理设备
CN109241223B (zh) 行为行踪识别方法及系统
CN112118010A (zh) 一种字符串的压缩处理方法、装置和存储介质
CN112241458B (zh) 文本的知识结构化处理方法、装置、设备和可读存储介质
CN111708673A (zh) 一种日志数据压缩方法、装置、设备和存储介质
US8396877B2 (en) Method and apparatus for generating a fused view of one or more people
CN112163019B (zh) 基于区块链的可信电子批记录处理方法及区块链服务平台
CN110019193B (zh) 相似帐号识别方法、装置、设备、系统及可读介质
CN116821428B (zh) 基于数据中台的业务数据智能存储方法及系统
CN112508720A (zh) 保险客户身份属性的筛选方法、筛选装置及电子设备
CN111381768B (zh) 一种数据监控的方法和装置
CN116189109A (zh) 模型训练方法、道路事件检测方法、装置及相关设备
CN115495606A (zh) 一种图像聚档方法和系统
CN110032432A (zh) 实例的压缩方法和装置、实例的解压方法和装置
CN114265870B (zh) 一种基于代码扫描的问题识别方法及系统
CN117033889B (zh) 一种智慧园区生产数据统计方法及相关装置
CN114116870B (zh) 一种跨业务主题的数据交换方法及系统
Barannik et al. Method of Coding Video Images Based on Meta-Determination of Segments
CN113408668B (zh) 基于联邦学习系统的决策树构建方法、装置及电子设备
CN115757049B (zh) 多业务模块日志记录方法、系统、电子设备及存储介质
CN117725192B (zh) 基于langchain的专有工业品信息交互调用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant