CN115470217A - 一种实时解决数仓模型变化响应问题的方法 - Google Patents
一种实时解决数仓模型变化响应问题的方法 Download PDFInfo
- Publication number
- CN115470217A CN115470217A CN202211417468.1A CN202211417468A CN115470217A CN 115470217 A CN115470217 A CN 115470217A CN 202211417468 A CN202211417468 A CN 202211417468A CN 115470217 A CN115470217 A CN 115470217A
- Authority
- CN
- China
- Prior art keywords
- hive
- data
- model
- information
- models
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种实时解决数仓模型变化响应问题的方法,属于大数据技术领域,包括获取数仓模型的所有元数据表信息,创建与每个元数据表信息对应的Hive数据表;监听元数据表的二进制日志,生成监听数据并发送至Kafka,通过流处理引擎实时消费Kafka的数据并写入至对应的Hive数据表中;查询任务定义表获取Hive模型的SQL语句并解析;基于其它Hive模型更新Hive模型的SQL语句;由步骤2中写入Kafka数据的Hive数据表创建拉链表,并基于监听数据更新拉链表;对所述其它Hive模型,提供所述其它Hive模型的变更通知信息。本发明解决数仓模型历史变更无法追溯问题。
Description
技术领域
本发明属于大数据技术领域,具体涉及一种实时解决数仓模型变化响应问题的方法。
背景技术
现在很多企业都在进行数字化转型,进行数据仓库或者数据中台建设,其中最主要的就是etl过程。通俗讲etl就是通过大数据技术,从业务系统获取数据然后存储到分布式存储系统中,再在此基础上建设数仓。
大数据数仓领域常用建模方式是基于Hive的维度分层建模,整个数仓依次会分成原始数据层(ODS,Operation Data Store)、明细数据层(DWD,Data Warehouse Detail)、数据汇总层(DWS,Data Warehouse Summary)和数据应用层(ADS,Application Data Store)。后一层的模型会依赖前面层的模型,所以每当前面业务数据库发生变更或者某一层Hive表的优化变更时,对于该表后续依赖的表同时发生变更。随着时间的推移和业务的发展,整个数仓模型会持续增加并且模型之间的依赖也会很复杂,所以每次Hive表的变更都需要人工去调整,不仅耗时费力,并且人为还可能出现漏改的情况,严重情况下就会导致整个数仓模型不可用。除此之外,数仓的最后一层数据应用层一般提供下游使用系统(如:OLAP、推荐、搜索系统等)使用,所以数据应用层的变更还可能会对其他使用系统造成影响,成为所属技术领域技术人员亟待解决的技术问题。
因此,本发明提供了一种实时解决数仓模型变化响应问题的方法,以至少解决上述部分技术问题。
发明内容
本发明要解决的技术问题是:提供一种实时解决数仓模型变化响应问题的方法,以至少解决上述部分技术问题。
为实现上述目的,本发明采用的技术方案如下:
一种实时解决数仓模型变化响应问题的方法,包括以下步骤:
步骤1、获取数仓模型的所有元数据表信息,创建与每个元数据表信息对应的Hive数据表;
步骤2、监听元数据表的二进制日志,生成监听数据并发送至Kafka,通过流处理引擎实时消费Kafka的数据并写入至对应的Hive数据表中;
步骤3、通过任务调度平台获取系统后台数据库,查询任务定义表获取Hive模型的SQL语句,然后解析出Hive模型的SQL语句中包含的该Hive模型以外的其它Hive模型;当所述其它Hive模型发生变更时,更新Hive模型的SQL语句;
步骤4、基于步骤2中写入Kafka数据的Hive数据表创建拉链表,并基于监听数据更新拉链表;
步骤5、对所述其它Hive模型,提供所述其它Hive模型的变更通知信息。
进一步地,所述元数据表信息包括但不限于存储元数据表的数据库信息、存储元数据表的名称信息、存储元数据表的格式信息、存储元数据表的字段信息、存储元数据表的分区信息、存储元数据表的批注信息。
进一步地,所述Hive数据表的创建方法为:获取对应元数据表信息的所有字段,并获取每一个字段对应的说明和实例数据;在元数据表信息的所有字段中添加变更时间字段和变更类型字段,获取对应的变更时间数据和变更类型数据并写入,得到Hive数据表。
进一步地,所述步骤3中,任务调度平台在设计调度任务时,每个Hive模型设置一个加工节点任务,将加工节点任务中Hive模型的SQL语句保存于任务定义表的字段中。
进一步地,所述步骤3中,解析采用python库中的程序。
进一步地,所述步骤3中,在python库中输入SQL语言,python库输出与Hive模型以及Hive模型中包含的该Hive模型以外的其它Hive模型。
进一步地,所述步骤4包括:将写入Kafka数据的Hive数据表增加生效时间字段和失效时间字段并创建拉链表,然后将Hive数据表对应的元数据表信息写入对应的拉链表中并初始化,最后基于监听数据每日更新拉链表。
与现有技术相比,本发明具有以下有益效果:
本发明利用大数据实时处理技术,监控数仓模型的变更信息,在开源的SQL解析基础上,自动调整数仓模型加工的能力,并创建拉链表以获取数仓模型数据的变更信息,解决数仓模型历史变更无法追溯问题。
附图说明
图1为本发明方法流程图。
具体实施方式
技术名词:
Maxwell :实时读取 MySQL二进制日志binlog,并生成 JSON 格式的消息,作为生产者发送给Kafka、Kinesis、RabbitMQ、Redis、Google CloudPub/Sub、文件或其它平台的应用程序。
Binlog:二进制日志;
Kafka:分布式发布订阅消息系统;
Struct Streaming:流处理引擎;
DolphinScheduler:分布式去中心化、易扩展的可视化DAG工作流任务调度系统。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进一步详细说明。
如图1所示,本发明提供的一种实时解决数仓模型变化响应问题的方法,包括以下步骤:
步骤1、获取数仓模型的所有元数据表信息,创建与每个元数据表信息对应的Hive数据表;
步骤2、监听元数据表的二进制日志,生成监听数据并发送至Kafka,通过流处理引擎实时消费Kafka的数据并写入至对应的Hive数据表中;
步骤3、通过任务调度平台获取系统后台数据库,查询任务定义表获取Hive模型的SQL语句,然后解析出Hive模型的SQL语句中包含的该Hive模型以外的其它Hive模型;当所述其它Hive模型发生变更时,更新Hive模型的SQL语句;
步骤4、基于步骤2中写入Kafka数据的Hive数据表创建拉链表,并基于监听数据更新拉链表;
步骤5、对所述其它Hive模型,提供所述其它Hive模型的变更通知信息。
本发明利用大数据实时处理技术,监控数仓模型的变更信息,在开源的SQL解析基础上,自动调整数仓模型加工的能力,并创建拉链表以获取数仓模型数据的变更信息,解决数仓模型历史变更无法追溯问题。
所述步骤1中,元数据表信息包括但不限于存储元数据表的数据库信息(DBS)、存储元数据表的名称信息(TBLS)、存储元数据表的格式信息(SDS)、存储元数据表的字段信息(COLUMNS_V2)、存储元数据表的分区信息(PARTITION_KEYS)、存储元数据表的批注信息(TABLE_PARAMS)。表1为存储元数据表的数据库信息(DBS)。
表1
所述步骤1中,Hive数据表的创建方法为:获取对应元数据表信息的所有字段,并获取每一个字段对应的说明和实例数据;在元数据表信息的所有字段中添加变更时间字段和变更类型字段,获取对应的变更时间数据和变更类型数据并写入,得到Hive数据表。表2为存储元数据表的数据库信息(DBS)对应的Hive数据表。
表2
所述步骤2,作为优选,采用Maxwell监听元数据表的二进制日志(binlog),生成监听数据并发送至Kafka,所述二进制日志实时记录了元数据表的变化信息;然后通过流处理引擎(Struct Streaming)将监听数据发送至Kafka并写入至对应的Hive数据表中。
所述步骤3,通过链接任务调度平台(dolphinscheduler)调度系统后台数据库,查询任务定义表(t_ds_process_definition)获取Hive模型的SQL语句,所述SQL语句包含了对应Hive模型的加工逻辑,Hive模型是指数仓业务上的Hive模型,Hive模型的获取是现有方法。任务调度平台在设计调度任务时,每个Hive模型设置一个加工节点任务,将加工节点任务中Hive模型的SQL语句保存于任务定义表的字段中。然后采用python库中的程序解析Hive模型的SQL语句:在python库中输入SQL语言,python库输出与Hive模型以及Hive模型中包含的该Hive模型以外的其它Hive模型。并且,当所述其它Hive模型发生变更时,更新Hive模型的SQL语句,由此实现数仓模型加工的自动调整。采用所述自动调整,当一层Hive模型发生变化时,后续相关联的Hive模型即可自动更新,无需人工调整。例如:test_a 的Hive模型的SQL语句为:
Insert overwrite table test_a
Select a.id,b.name
from test_b as a
left join test_c as b
on a.id=b.id
解析结果为:test_a 模型,依赖test_b 模型的id字段,依赖test_c 模型的id和name字段。
当test_b 模型字段id的字段名称变更为idt时,test_a 的Hive模型的SQL语句更新为:
Insert overwrite table test_a
Select a.idt,b.name
from test_b as a
left join test_c as b
on a.idt=b.id
所述步骤4包括:将写入Kafka数据的Hive数据表增加生效时间字段和失效时间字段并创建拉链表,然后将Hive数据表对应的元数据表信息写入对应的拉链表中并初始化,最后基于监听数据每日更新拉链表。所述拉链表可保留每次变化的记录,解决数仓本身无法保留模型变化信息问题。拉链表每日更新时间优选每日凌晨零时。表3为存储元数据表的数据库信息(DBS)对应的拉链表。
表3
所述步骤5中,对所述其它Hive模型,提供所述其它Hive模型的变更通知信息。为此对下游业务中使用的其它Hive模型,可与Hive模型一样,记录模型的变化信息。
最后应说明的是:以上各实施例仅仅为本发明的较优实施例用以说明本发明的技术方案,而非对其限制,当然更不是限制本发明的专利范围;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围;也就是说,但凡在本发明的主体设计思想和精神上作出的毫无实质意义的改动或润色,其所解决的技术问题仍然与本发明一致的,均应当包含在本发明的保护范围之内;另外,将本发明的技术方案直接或间接的运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种实时解决数仓模型变化响应问题的方法,其特征在于,包括以下步骤:
步骤1、获取数仓模型的所有元数据表信息,创建与每个元数据表信息对应的Hive数据表;
步骤2、监听元数据表的二进制日志,生成监听数据并发送至Kafka,通过流处理引擎实时消费Kafka的数据并写入至对应的Hive数据表中;
步骤3、通过任务调度平台获取系统后台数据库,查询任务定义表获取Hive模型的SQL语句,然后解析出Hive模型的SQL语句中包含的该Hive模型以外的其它Hive模型;当所述其它Hive模型发生变更时,更新Hive模型的SQL语句;
步骤4、基于步骤2中写入Kafka数据的Hive数据表创建拉链表,并基于监听数据更新拉链表;
步骤5、对所述其它Hive模型,提供所述其它Hive模型的变更通知信息。
2.根据权利要求1所述的一种实时解决数仓模型变化响应问题的方法,其特征在于,所述元数据表信息包括但不限于存储元数据表的数据库信息、存储元数据表的名称信息、存储元数据表的格式信息、存储元数据表的字段信息、存储元数据表的分区信息、存储元数据表的批注信息。
3.根据权利要求1所述的一种实时解决数仓模型变化响应问题的方法,其特征在于,所述Hive数据表的创建方法为:获取对应元数据表信息的所有字段,并获取每一个字段对应的说明和实例数据;在元数据表信息的所有字段中添加变更时间字段和变更类型字段,获取对应的变更时间数据和变更类型数据并写入,得到Hive数据表。
4.根据权利要求1所述的一种实时解决数仓模型变化响应问题的方法,其特征在于,所述步骤3中,任务调度平台在设计调度任务时,每个Hive模型设置一个加工节点任务,将加工节点任务中Hive模型的SQL语句保存于任务定义表的字段中。
5.根据权利要求1所述的一种实时解决数仓模型变化响应问题的方法,其特征在于,所述步骤3中,解析采用python库中的程序。
6.根据权利要求5所述的一种实时解决数仓模型变化响应问题的方法,其特征在于,所述步骤3中,在python库中输入SQL语言,python库输出与Hive模型以及Hive模型中包含的该Hive模型以外的其它Hive模型。
7.根据权利要求1所述的一种实时解决数仓模型变化响应问题的方法,其特征在于,所述步骤4包括:将写入Kafka数据的Hive数据表增加生效时间字段和失效时间字段并创建拉链表,然后将Hive数据表对应的元数据表信息写入对应的拉链表中并初始化,最后基于监听数据每日更新拉链表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211417468.1A CN115470217B (zh) | 2022-11-14 | 2022-11-14 | 一种实时解决数仓模型变化响应问题的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211417468.1A CN115470217B (zh) | 2022-11-14 | 2022-11-14 | 一种实时解决数仓模型变化响应问题的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115470217A true CN115470217A (zh) | 2022-12-13 |
CN115470217B CN115470217B (zh) | 2023-04-07 |
Family
ID=84338042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211417468.1A Active CN115470217B (zh) | 2022-11-14 | 2022-11-14 | 一种实时解决数仓模型变化响应问题的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115470217B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115599870A (zh) * | 2022-12-15 | 2023-01-13 | 云筑信息科技(成都)有限公司(Cn) | 基于消息队列的存量数据与增量数据融合的数据同步方法 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040025171A1 (en) * | 2002-07-31 | 2004-02-05 | Barinov Vitaly Y. | Method for improving temporal consistency and snapshot recency in a monitored real-time software-reporting-application architecture |
CN107590158A (zh) * | 2016-07-08 | 2018-01-16 | 北京京东尚科信息技术有限公司 | 一种获取数据源变更信息的方法和装置 |
CN109325077A (zh) * | 2018-08-03 | 2019-02-12 | 北京马上慧科技术有限公司 | 一种基于canal和kafka实现实时数仓的系统 |
CN109997125A (zh) * | 2016-09-15 | 2019-07-09 | 英国天然气控股有限公司 | 用于将数据导入数据储存库的系统 |
CN110019267A (zh) * | 2017-11-21 | 2019-07-16 | 中国移动通信有限公司研究院 | 一种元数据更新方法、装置、系统、电子设备及存储介质 |
CN112445863A (zh) * | 2020-11-30 | 2021-03-05 | 永辉云金科技有限公司 | 一种数据实时同步方法及系统 |
CN112507027A (zh) * | 2020-12-16 | 2021-03-16 | 平安科技(深圳)有限公司 | 基于Kafka的增量数据同步方法、装置、设备及介质 |
CN113032495A (zh) * | 2021-03-23 | 2021-06-25 | 深圳市酷开网络科技股份有限公司 | 基于数据仓库的多层数据存储系统、处理方法、及服务器 |
CN113392415A (zh) * | 2021-06-18 | 2021-09-14 | 作业帮教育科技(北京)有限公司 | 数据仓库的访问控制方法、系统和电子设备 |
CN113590593A (zh) * | 2021-08-04 | 2021-11-02 | 浙江大华技术股份有限公司 | 数据表信息的生成方法和装置、存储介质及电子装置 |
CN113742325A (zh) * | 2021-08-09 | 2021-12-03 | 广州市易工品科技有限公司 | 数据仓库建设方法、装置、系统、电子设备及存储介质 |
CN113742420A (zh) * | 2021-08-09 | 2021-12-03 | 广州市易工品科技有限公司 | 数据同步方法和装置 |
CN114579614A (zh) * | 2022-02-11 | 2022-06-03 | 武汉物易云通网络科技有限公司 | 一种实时数据全量获取方法、装置及计算机设备 |
CN114780563A (zh) * | 2022-04-19 | 2022-07-22 | 上海聚音信息科技有限公司 | 一种基于数据湖的拉链表处理方法及设备 |
CN115136128A (zh) * | 2020-12-25 | 2022-09-30 | 京东方科技集团股份有限公司 | 数据处理方法、平台、计算机可读存储介质及电子设备 |
CN115225719A (zh) * | 2022-08-31 | 2022-10-21 | 中建电子商务有限责任公司 | 一种分布式定向网络数据采集解析方法 |
CN115292414A (zh) * | 2022-08-09 | 2022-11-04 | 苏银凯基消费金融有限公司 | 一种业务数据同步到数仓的方法 |
-
2022
- 2022-11-14 CN CN202211417468.1A patent/CN115470217B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040025171A1 (en) * | 2002-07-31 | 2004-02-05 | Barinov Vitaly Y. | Method for improving temporal consistency and snapshot recency in a monitored real-time software-reporting-application architecture |
CN107590158A (zh) * | 2016-07-08 | 2018-01-16 | 北京京东尚科信息技术有限公司 | 一种获取数据源变更信息的方法和装置 |
CN109997125A (zh) * | 2016-09-15 | 2019-07-09 | 英国天然气控股有限公司 | 用于将数据导入数据储存库的系统 |
CN110019267A (zh) * | 2017-11-21 | 2019-07-16 | 中国移动通信有限公司研究院 | 一种元数据更新方法、装置、系统、电子设备及存储介质 |
CN109325077A (zh) * | 2018-08-03 | 2019-02-12 | 北京马上慧科技术有限公司 | 一种基于canal和kafka实现实时数仓的系统 |
CN112445863A (zh) * | 2020-11-30 | 2021-03-05 | 永辉云金科技有限公司 | 一种数据实时同步方法及系统 |
CN112507027A (zh) * | 2020-12-16 | 2021-03-16 | 平安科技(深圳)有限公司 | 基于Kafka的增量数据同步方法、装置、设备及介质 |
CN115136128A (zh) * | 2020-12-25 | 2022-09-30 | 京东方科技集团股份有限公司 | 数据处理方法、平台、计算机可读存储介质及电子设备 |
CN113032495A (zh) * | 2021-03-23 | 2021-06-25 | 深圳市酷开网络科技股份有限公司 | 基于数据仓库的多层数据存储系统、处理方法、及服务器 |
CN113392415A (zh) * | 2021-06-18 | 2021-09-14 | 作业帮教育科技(北京)有限公司 | 数据仓库的访问控制方法、系统和电子设备 |
CN113590593A (zh) * | 2021-08-04 | 2021-11-02 | 浙江大华技术股份有限公司 | 数据表信息的生成方法和装置、存储介质及电子装置 |
CN113742325A (zh) * | 2021-08-09 | 2021-12-03 | 广州市易工品科技有限公司 | 数据仓库建设方法、装置、系统、电子设备及存储介质 |
CN113742420A (zh) * | 2021-08-09 | 2021-12-03 | 广州市易工品科技有限公司 | 数据同步方法和装置 |
CN114579614A (zh) * | 2022-02-11 | 2022-06-03 | 武汉物易云通网络科技有限公司 | 一种实时数据全量获取方法、装置及计算机设备 |
CN114780563A (zh) * | 2022-04-19 | 2022-07-22 | 上海聚音信息科技有限公司 | 一种基于数据湖的拉链表处理方法及设备 |
CN115292414A (zh) * | 2022-08-09 | 2022-11-04 | 苏银凯基消费金融有限公司 | 一种业务数据同步到数仓的方法 |
CN115225719A (zh) * | 2022-08-31 | 2022-10-21 | 中建电子商务有限责任公司 | 一种分布式定向网络数据采集解析方法 |
Non-Patent Citations (1)
Title |
---|
贾骐玮: "基于Hive的数据仓库变更数据更新算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115599870A (zh) * | 2022-12-15 | 2023-01-13 | 云筑信息科技(成都)有限公司(Cn) | 基于消息队列的存量数据与增量数据融合的数据同步方法 |
CN115599870B (zh) * | 2022-12-15 | 2023-04-07 | 云筑信息科技(成都)有限公司 | 基于消息队列的存量数据与增量数据融合的数据同步方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115470217B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Souza et al. | Provenance data in the machine learning lifecycle in computational science and engineering | |
US7844570B2 (en) | Database generation systems and methods | |
CN112181960B (zh) | 一种基于AIOps的智能运维框架系统 | |
CN112825069B (zh) | 数据库数据的分析方法、设备、系统及存储介质 | |
CN115470217B (zh) | 一种实时解决数仓模型变化响应问题的方法 | |
CN116842055A (zh) | 用于物联网数据批流一体处理的系统及方法 | |
CN110297820B (zh) | 一种数据处理方法、装置、设备和存储介质 | |
CN116911671A (zh) | 一种数据资产运营效能评估方法及系统 | |
CN115599524A (zh) | 一种基于流数据和批数据协同调度处理的数据湖系统 | |
Azeroual et al. | Combining data lake and data wrangling for ensuring data quality in CRIS | |
Tao et al. | Facilitating Twitter data analytics: Platform, language and functionality | |
CN116823464A (zh) | 数据资产管理平台、电子设备及计算机可读存储介质 | |
CN116010380A (zh) | 一种基于可视化建模的数据仓库自动化管理方法 | |
CN112925835A (zh) | 数据同步方法、装置和服务器 | |
US20230281212A1 (en) | Generating smart automated data movement workflows | |
Grambau et al. | Reference Architecture framework for enhanced social media data analytics for Predictive Maintenance models | |
US20140067874A1 (en) | Performing predictive analysis | |
CN114020814A (zh) | 一种流程工业制造全链条数据集成与分析方法和系统 | |
CN109032578B (zh) | 基于数据库sql代码生成方法及系统 | |
CN113051254A (zh) | 一种基于数据库和互联网的体系文件数据结构化方法 | |
CN108710645B (zh) | 基于混合型事件日志的过程挖掘方法 | |
Jomier et al. | National Scientific Validation for Data in the Information System on Nature and Landscapes (Système d'Information sur la Nature et les Paysages-SINP) | |
CN113901004B (zh) | 一种数据中台化的大数据复杂实时计算的方法 | |
KR102605930B1 (ko) | 데이터베이스 상에서 정형 데이터와 비정형 데이터를 처리하는 방법 및 이러한 방법을 제공하는 데이터 처리 플랫폼 | |
CN117171203B (zh) | 一种基于零代码推理引擎的sql自动生成方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |