CN111597267A - 一种基于多层服务引擎的数据中台及构建方法 - Google Patents

一种基于多层服务引擎的数据中台及构建方法 Download PDF

Info

Publication number
CN111597267A
CN111597267A CN202010435019.4A CN202010435019A CN111597267A CN 111597267 A CN111597267 A CN 111597267A CN 202010435019 A CN202010435019 A CN 202010435019A CN 111597267 A CN111597267 A CN 111597267A
Authority
CN
China
Prior art keywords
data
label
unit
resources
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010435019.4A
Other languages
English (en)
Inventor
王思鲲
冀晓镭
朱浩
辛鑫
姚祖昆
孙矗磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Building Materials Xinyun Zhilian Technology Co ltd
Cnbm Technology Corp ltd
Original Assignee
China Building Materials Xinyun Zhilian Technology Co ltd
Cnbm Technology Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Building Materials Xinyun Zhilian Technology Co ltd, Cnbm Technology Corp ltd filed Critical China Building Materials Xinyun Zhilian Technology Co ltd
Priority to CN202010435019.4A priority Critical patent/CN111597267A/zh
Publication of CN111597267A publication Critical patent/CN111597267A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及企业管理系统技术领域,具体地说,涉及一种基于多层服务引擎的数据中台及构建方法,包括数据获取单元、数据处理单元、数据存储单元、数据资产管理和数据应用规划及实现,利用多层服务引擎同步获取数据信息,提高数据获取的速度,提高效率,可以为企业提供强大的数据资产的获取和存储的能力,用更高效、更协同的方式加快从数据到业务的价值,能够给业务提供更高的响应力;构建的标签体系可以对用户、产品、客商、营销各主题域进行标签提取,将其特征数字化,为后续进行精准营销和用户画像提供必要条件,还可以着重分析当前需要但是无法获取到的指标,描述使用不便的指标,分析问题原因,绘制数据供应链条。

Description

一种基于多层服务引擎的数据中台及构建方法
技术领域
本发明涉及企业管理系统技术领域,具体地说,涉及一种基于多层服务引擎的数据中台及构建方法。
背景技术
数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径,数据中台是数据应用开发门户,具有闭环涵盖数据应用开发全流程,完整覆盖离线计算、实时计算应用等功能。能够满足开发人员从数据采集、数据分析、数据挖掘、数据质量、数据地图、数据模型、数据 API 的各层次应用。可以理解,使用数据中台可以解放开发人员的生产力,极大的缩短数据价值的萃取过程,提高企业提炼数据价值的能力。现如今的数据中台大多数是通过单层服务引擎进行数据平台的构建,处理速度慢,效率低。
发明内容
本发明的目的在于提供一种基于多层服务引擎的数据中台及构建方法,以解决上述背景技术中提出的数据中台大多数是通过单层服务引擎进行数据平台的构建,处理速度慢,效率低问题。
为实现上述目的,本发明提供一种基于多层服务引擎的数据中台,包括数据获取单元、数据处理单元、数据存储单元、数据资产管理和数据应用规划及实现,所述数据获取单元用于收集多层服务引擎的数据信息,所述数据处理单元用于将收集的数据信息根据主题域进行标签提取,将其特征数字化,所述数据存储单元用于将处理后的数据存储入数据库中,所述数据资产管理用于将数据库中的数据进行数据分析,所述数据应用规划及实现用于将所有的数据汇聚到数据中台形成大数据资产层,每个数据应用均从数据中台获取数据并将数据进行读取和使用。
作为优选,所述数据资产管理的数据分析包括盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现。
作为优选,所述数据处理单元包括特征提取单元、特征数字化单元、标签建立单元和数据标签对应单元。
作为优选,所述特征提取单元用于将收集的数据信息进行特征提取,所述标签建立单元用于将收集的数据信息根据用户、产品、客商、营销各主题领域进行标签提取。
作为优选,所述特征数字化单元用于将提取的特征数据进行编号。
作为优选,所述数据标签对应单元将数据信息与标签信息进行对应。
作为优选,所述数据标签对应单元的具体操作为:先将数据特征、数据标签以及数据信息一一对应,再建立标签目录库,将标签目录的各个标签与对应的数据建立索引链接。
另一方面,本发明提供一种基于多层服务引擎的数据中台的构建方法,包括上述的基于多层服务引擎的数据中台,具体包括如下步骤:
S1、数据中台的数据获取单元收集多层服务引擎的数据信息;
S2、数据处理单元将收集数据信息根据用户、产品、客商、营销各主题域进行标签提取,将其特征数字化;
S3、将数据特征与数据信息一一对应,建立标签目录库,将标签目录的各个标签与对应的数据建立索引链接;
S4、将标签目录库和数据存入数据库中进行数据资产管理,盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现;
S5、将所有的数据汇聚到数据中台,每个数据应用均从数据中台获取数据并将数据进行读取和使用。
与现有技术相比,本发明的有益效果:本基于多层服务引擎的数据中利用多层服务引擎同步获取数据信息,提高数据获取的速度,提高效率,可以为企业提供强大的数据资产的获取和存储的能力,用更高效、更协同的方式加快从数据到业务的价值,能够给业务提供更高的响应力;数据资产管理可以盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现;通过元数据信息收集、数据血缘探查、数据权限申请授权等手段,解决有哪些数据可用、到哪里可以找到数据的难题,并且提升数据资源的利用率;构建的标签体系可以对用户、产品、客商、营销各主题域进行标签提取,将其特征数字化,为后续进行精准营销和用户画像提供必要条件,还可以着重分析当前需要但是无法获取到的指标,描述使用不便的指标,分析问题原因,绘制数据供应链条;数据应用规划及实现将所有的数据汇聚到数据中台,以后的每个数据应用统统从数据中台获取数据,无论是指标和分析类的,还是画像类和大数据类的,若数据中台没有,则数据中台就负责把数据找来,若数据中台找不来,就说明当前真没有这个数据,数据应用也就无从展开。
附图说明
图1为本发明的组成的模块示意图;
图2为本发明多服务引擎同步处理数据的流程示意图;
图3为本发明建立数据标签目录的库的流程示意图;
图4为本发明的数据中台构建方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图4所示,本发明提供一种技术方案:
本发明提供一种基于多层服务引擎的数据中台,如图1和图2所示,包括数据获取单元、数据处理单元、数据存储单元、数据资产管理和数据应用规划及实现,所述数据获取单元用于收集多层服务引擎的数据信息,所述数据处理单元用于将收集的数据信息根据主题域进行标签提取,将其特征数字化,所述数据存储单元用于将处理后的数据存储入数据库中,所述数据资产管理用于将数据库中的数据进行数据分析,所述数据应用规划及实现用于将所有的数据汇聚到数据中台形成大数据资产层,每个数据应用均从数据中台获取数据并将数据进行读取和使用,将所有的数据汇聚到数据中台,以后的每个数据应用统统从数据中台获取数据,无论是指标和分析类的,还是画像类和大数据类的,若数据中台没有,则数据中台就负责把数据找来,若数据中台找不来,就说明当前真没有这个数据,数据应用也就无从展开。
进一步的,数据资产管理的数据分析包括盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现,通过元数据信息收集、数据血缘探查、数据权限申请授权等手段,解决有哪些数据可用、到哪里可以找到数据的难题,并且提升数据资源的利用率;资产数据指的是明确价值、使用场景、生命周期、特征标签的数据。数据中台持久化存储的都是资产,非资产相关数据在清洗过程中直接丢弃。
具体的,数据处理单元包括特征提取单元、特征数字化单元、标签建立单元和数据标签对应单元,数据特征信息指的是唯一标记出一项资产的ID,可以是数字、字符串等。例如,针对政务数据有自然人身份证号、地区编号、行政机关编号等,数据标签信息用于标记资产特征,且与数据服务和应用强相关的一系列标签。例如,针对政务数据有高收入人群、少数民族、事故多发路段等,构建的标签体系可以对用户、产品、客商、营销各主题域进行标签提取,将其特征数字化,为后续进行精准营销和用户画像提供必要条件,还可以着重分析当前需要但是无法获取到的指标,描述使用不便的指标,分析问题原因,绘制数据供应链条。
值得说明的是,特征提取单元用于将收集的数据信息进行特征提取,标签建立单元用于将收集的数据信息根据用户、产品、客商、营销各主题领域进行标签提取。
进一步的,如图3所示,特征数字化单元用于将提取的特征数据进行编号,数据标签对应单元将数据信息与标签信息进行对应,数据标签对应单元的具体操作为:先将数据特征、数据标签以及数据信息一一对应,再建立标签目录库,将标签目录的各个标签与对应的数据建立索引链接。
另一方面,如图4所示,本发明提供一种基于多层服务引擎的数据中台的构建方法,包括上述的基于多层服务引擎的数据中台,具体包括如下步骤:
S1、数据中台的数据获取单元收集多层服务引擎的数据信息;
S2、数据处理单元将收集数据信息根据用户、产品、客商、营销各主题域进行标签提取,将其特征数字化;
S3、将数据特征与数据信息一一对应,建立标签目录库,将标签目录的各个标签与对应的数据建立索引链接;
S4、将标签目录库和数据存入数据库中进行数据资产管理,盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现;
S5、将所有的数据汇聚到数据中台,每个数据应用均从数据中台获取数据并将数据进行读取和使用。
本发明的基于多层服务引擎的数据中台中利用多层服务引擎同步获取数据信息,提高数据获取的速度,提高效率,可以为企业提供强大的数据资产的获取和存储的能力,用更高效、更协同的方式加快从数据到业务的价值,能够给业务提供更高的响应力;数据资产管理可以盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现;通过元数据信息收集、数据血缘探查、数据权限申请授权等手段,解决有哪些数据可用、到哪里可以找到数据的难题,并且提升数据资源的利用率;构建的标签体系可以对用户、产品、客商、营销各主题域进行标签提取,将其特征数字化,为后续进行精准营销和用户画像提供必要条件,还可以着重分析当前需要但是无法获取到的指标,描述使用不便的指标,分析问题原因,绘制数据供应链条;数据应用规划及实现将所有的数据汇聚到数据中台,以后的每个数据应用统统从数据中台获取数据,无论是指标和分析类的,还是画像类和大数据类的,若数据中台没有,则数据中台就负责把数据找来,若数据中台找不来,就说明当前真没有这个数据,数据应用也就无从展开。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,该些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种基于多层服务引擎的数据中台,其特征在于:包括数据获取单元、数据处理单元、数据存储单元、数据资产管理和数据应用规划及实现,所述数据获取单元用于收集多层服务引擎的数据信息,所述数据处理单元用于将收集的数据信息根据主题域进行标签提取,将其特征数字化,所述数据存储单元用于将处理后的数据存储入数据库中,所述数据资产管理用于将数据库中的数据进行数据分析,所述数据应用规划及实现用于将所有的数据汇聚到数据中台形成大数据资产层,每个数据应用均从数据中台获取数据并将数据进行读取和使用。
2.根据权利要求1所述的基于多层服务引擎的数据中台,其特征在于:所述数据资产管理的数据分析包括盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现。
3.根据权利要求1所述的基于多层服务引擎的数据中台,其特征在于:所述数据处理单元包括特征提取单元、特征数字化单元、标签建立单元和数据标签对应单元。
4.根据权利要求3所述的基于多层服务引擎的数据中台,其特征在于:所述特征提取单元用于将收集的数据信息进行特征提取,所述标签建立单元用于将收集的数据信息根据用户、产品、客商、营销各主题领域进行标签提取。
5.根据权利要求3所述的基于多层服务引擎的数据中台,其特征在于:所述特征数字化单元用于将提取的特征数据进行编号。
6.根据权利要求3所述的基于多层服务引擎的数据中台,其特征在于:所述数据标签对应单元将数据信息与标签信息进行对应。
7.根据权利要求6所述的基于多层服务引擎的数据中台,其特征在于:所述数据标签对应单元的具体操作为:先将数据特征、数据标签以及数据信息一一对应,再建立标签目录库,将标签目录的各个标签与对应的数据建立索引链接。
8.一种基于多层服务引擎的数据中台的构建方法,包括权利要求1-7任意一项所述的基于多层服务引擎的数据中台,其特征在于:具体包括如下步骤:
S1、数据中台的数据获取单元收集多层服务引擎的数据信息;
S2、数据处理单元将收集数据信息根据用户、产品、客商、营销各主题域进行标签提取,将其特征数字化;
S3、将数据特征与数据信息一一对应,建立标签目录库,将标签目录的各个标签与对应的数据建立索引链接;
S4、将标签目录库和数据存入数据库中进行数据资产管理,盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现;
S5、将所有的数据汇聚到数据中台,每个数据应用均从数据中台获取数据并将数据进行读取和使用。
CN202010435019.4A 2020-05-21 2020-05-21 一种基于多层服务引擎的数据中台及构建方法 Pending CN111597267A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010435019.4A CN111597267A (zh) 2020-05-21 2020-05-21 一种基于多层服务引擎的数据中台及构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010435019.4A CN111597267A (zh) 2020-05-21 2020-05-21 一种基于多层服务引擎的数据中台及构建方法

Publications (1)

Publication Number Publication Date
CN111597267A true CN111597267A (zh) 2020-08-28

Family

ID=72192185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010435019.4A Pending CN111597267A (zh) 2020-05-21 2020-05-21 一种基于多层服务引擎的数据中台及构建方法

Country Status (1)

Country Link
CN (1) CN111597267A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434932A (zh) * 2020-11-20 2021-03-02 广东电网有限责任公司佛山供电局 基于电力行业数据中台的智能分析系统的构建方法及该智能分析系统
CN113254507A (zh) * 2021-06-23 2021-08-13 四川国路安数据技术有限公司 一种数据资产目录智能构建盘点方法
CN113344546A (zh) * 2021-06-26 2021-09-03 周明升 一种基于数据中台的房产经营综合监管平台
CN113395313A (zh) * 2020-09-08 2021-09-14 重庆高新技术产业研究院有限责任公司 基于多技术融合的数据中台与业务中台的集成模型
CN114531267A (zh) * 2021-12-31 2022-05-24 华能信息技术有限公司 一种数据资产管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2573996A1 (en) * 2010-05-20 2013-03-27 ZTE Corporation System for merging services and service implementing method thereof
CN110109987A (zh) * 2018-04-03 2019-08-09 中建材信息技术股份有限公司 一种敏捷数据仓库架构及其构建方法和应用
CN110929109A (zh) * 2019-10-30 2020-03-27 中盈优创资讯科技有限公司 用于数据中台的数据查询方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2573996A1 (en) * 2010-05-20 2013-03-27 ZTE Corporation System for merging services and service implementing method thereof
CN110109987A (zh) * 2018-04-03 2019-08-09 中建材信息技术股份有限公司 一种敏捷数据仓库架构及其构建方法和应用
CN110929109A (zh) * 2019-10-30 2020-03-27 中盈优创资讯科技有限公司 用于数据中台的数据查询方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
凯哥: "#凯哥讲数据中台#数据中台的使命、愿景、本质和六大核心能力", pages 1 - 11, Retrieved from the Internet <URL:https://cloud.tencent.com/developer/article/1576579> *
陈玉哲等: "基于移动agent和数据挖掘标准的分布式数据挖掘系统", 郑州大学学报, vol. 43, no. 1, pages 90 - 94 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113395313A (zh) * 2020-09-08 2021-09-14 重庆高新技术产业研究院有限责任公司 基于多技术融合的数据中台与业务中台的集成模型
CN112434932A (zh) * 2020-11-20 2021-03-02 广东电网有限责任公司佛山供电局 基于电力行业数据中台的智能分析系统的构建方法及该智能分析系统
CN113254507A (zh) * 2021-06-23 2021-08-13 四川国路安数据技术有限公司 一种数据资产目录智能构建盘点方法
CN113344546A (zh) * 2021-06-26 2021-09-03 周明升 一种基于数据中台的房产经营综合监管平台
CN114531267A (zh) * 2021-12-31 2022-05-24 华能信息技术有限公司 一种数据资产管理方法及系统
CN114531267B (zh) * 2021-12-31 2024-01-23 华能信息技术有限公司 一种数据资产管理方法及系统

Similar Documents

Publication Publication Date Title
CN111597267A (zh) 一种基于多层服务引擎的数据中台及构建方法
CN103164416B (zh) 一种用户关系的识别方法及设备
CN104933112A (zh) 分布式互联网交易信息存储处理方法
CN105653668A (zh) 云环境中基于DOMTree的网页内容分析提取优化方法
CN112560468B (zh) 气象预警文本处理方法、相关装置及计算机程序产品
CN109739820A (zh) 一种基于大数据分析的电子政务信息服务系统
CN112528639B (zh) 对象识别方法和装置、存储介质及电子设备
CN105550375A (zh) 一种异构数据的整合方法及系统
CN102253939A (zh) 一种基于云计算技术的搜索方法及系统
CN110457259A (zh) 一种档案数字化管理分析系统
CN114429364A (zh) 业务数据管理方法和装置、存储介质及电子设备
CN102508901A (zh) 基于内容的海量图像检索方法和系统
CN105721519B (zh) 一种网页数据采集方法、装置及系统
CN108595421A (zh) 一种中文实体关联关系的抽取方法、装置及系统
CN106022640B (zh) 电量指数核对系统及方法
CN112363996B (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
CN111143468A (zh) 基于mpp分布式技术的多数据库数据管理方法
CN111092764B (zh) 一种实时动态亲密度关系分析方法及系统
CN111061793B (zh) 一种数据处理系统和方法
CN113158902B (zh) 一种基于知识蒸馏的自动化训练识别模型的方法
CN103455483B (zh) 站内搜索数据的搜集处理方法和系统
CN109803022A (zh) 一种数字化资源共享系统及其服务方法
CN111813555B (zh) 基于互联网技术的超融合基础架构分层资源管理系统
CN107391695A (zh) 一种基于大数据的信息提取方法
CN110750651B (zh) 一种基于科技成果的知识图谱构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination