CN113961546B - 一种支持在线分析统计的实时查询库设计方法 - Google Patents
一种支持在线分析统计的实时查询库设计方法 Download PDFInfo
- Publication number
- CN113961546B CN113961546B CN202111253832.0A CN202111253832A CN113961546B CN 113961546 B CN113961546 B CN 113961546B CN 202111253832 A CN202111253832 A CN 202111253832A CN 113961546 B CN113961546 B CN 113961546B
- Authority
- CN
- China
- Prior art keywords
- data
- library
- real
- target
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000004458 analytical method Methods 0.000 title claims abstract description 40
- 238000002898 library design Methods 0.000 title claims abstract description 9
- 230000010076 replication Effects 0.000 claims abstract description 12
- 230000001360 synchronised effect Effects 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 15
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 238000007619 statistical method Methods 0.000 claims description 7
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000007792 addition Methods 0.000 claims description 3
- 239000000872 buffer Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005111 flow chemistry technique Methods 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2372—Updates performed during offline database operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种支持在线分析统计的实时查询库设计方法,包括:步骤1,在源端Oracle业务库中部署数据复制软件进行日志收集;步骤2,使用插件对收集到的日志进行解析,得到增量日志数据;步骤3,对增量日志数据进行离线归档;步骤4,增量日志数据实时写入目标端查询库中;步骤5,历史数据从离线数据库中离线同步到目标端查询库中。将Oracle业务库中的数据通过OGG+datahub+Blink的传输链路同步至查询库,正常通讯延迟在30s到1分钟左右,查询库数据与业务库既能保证实时同步,也具有数据一致性,实现了查询库具有在线分析的能力,解决了查询库只能是同构数据库的限制,为系统后续提供在线数据服务奠定了基础。
Description
技术领域
本发明涉及数据查询技术领域,更具体地,涉及一种支持在线分析统计的实时查询库设计方法。
背景技术
现今大型企业都有多个部门和多种应用系统,很多数据都分布在不同业务部门不同业务库下的,这些应用系统并不是建立在统一平台之上,数据库系统也是相互独立,甚至是异构系统,每个系统之间的数据不能相互连通,构成了信息孤岛,由于电力营销业务的划分更加细致,随着数据规模的不断扩大,传统的关系数据库管理系统RDBMS(RelationalDatabase Management System)难以满足联机分析处理OLAP(Online AnalyticalProcessing)的需求,要让数据发挥辅助决策的作用,具备实时查询和在线统计分析的需求越来越突出,例如电力销售情况简表的需求,涉及复杂统计和实时响应的要求,传统建立数据仓库的解决方案偏向于离线批处理,虽然满足复杂查询的需求,但实时性很大程度上受制于组件和硬件制约,查询开销大。
因此,需要提出一种支持在线分析统计的实时查询库设计方法,满足营销业务系统的在线统计分析,同时具有外提供实时查询服务的能力,形成常态化的数据监测和数据分析体系,提升企业经营和数据服务能力。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种支持在线分析统计的实时查询库设计方法,将Oracle的数据实时同步到查询库当中,达到低延时、高性能,满足查询库数据与业务库数据一致性要求。
本发明采用如下的技术方案。
一种支持在线分析统计的实时查询库设计方法,包括:
步骤1,在源端Oracle业务库中部署数据复制软件进行日志收集;
步骤2,使用插件对收集到的日志进行解析,得到增量日志数据;
步骤3,对增量日志数据进行离线归档;
步骤4,增量日志数据实时写入目标端查询库中;
步骤5,历史数据从离线数据库中离线同步到目标端查询库中。
优选地,步骤1包括:
步骤1.1,对源端Oracle业务库进行参数设置,使得Oracle业务库处于归档模式;
步骤1.2,在Oracle业务库中,部署基于日志的结构化数据复制软件OGG,并建立OGG用户;
步骤1.3,将OGG划分为源端和目标端,其中,在源端部署Manager进程、Extract进程和Pump进程,在目标端部署Collector进程和Replicat进程;
步骤1.4,利用OGG将源端Oracle业务库的日志同步到目标端,实现日志收集。
进一步,步骤1.1中,当设置复制使能参数Enable_Goldengate_replication为True时,Oracle业务库开启强制写日志,即Oracle业务库开启全列日志;
当设置复制使能参数Enable_Goldengate_replication不为True时,Oracle业务库不开启强制写日志,即Oracle业务库不开启全列日志,则在发生修改或删除操作时,OGG将只会同步更新字段,其他未变更字段除主键外全部为Null。
进一步,步骤1.2中,建立OGG用户包括:创建OGG用户表空间、授权OGG用户、创建OGG相关的子目录。
进一步,步骤1.3中,Manager进程,负责管理其他进程的启停和监控;
Extract进程,负责从源端业务库表或者事务日志中抽取数据;其中,Extract进程采用增量同步配置模式;
Pump进程,负责将源端Trail文件的数据投递到目标端;
Collector进程,负责接收来自源端的数据,在目标端生成Trail文件。
进一步,步骤1.4包括:
步骤1.4.1,由Extract进程分析源端业务库日志,从源端抽取变动的数据;
步骤1.4.2,将变动的数据记录在源端Trail文件中;
步骤1.4.3,Pump进程将源端Trail文件中的数据投递到目标端;
步骤1.4.4,Collector进程在目标端接收来自源端Trail文件中的数据,生成目标端Trail文件用于存储来自源端Trail文件中的数据;
步骤1.4.5,Replicat进程读取目标端Trail文件后,转化为数据定义语言和数据操作语言后在目标端数据库中使用,实现数据同步;
其中,在目标端数据库中,数据定义语言用在定义或改变表的结构、数据类型、表之间的链接和约束的初始化工作上;数据操作语言用在对数据库中的数据进行操作,包括新增、修改和删除。
优选地,步骤2中,使用云流数据处理平台Datahub对目标端Trail文件进行解析,将得到的增量日志数据实时订阅到Datahub中;
其中,Oracle业务库中的每一张表Table均对应Datahub中一个独立主题Topic。
优选地,步骤3中,通过配置Datahub的目标数据归档源,将Datahub中的增量日志数据归档到大数据计算服务Maxcompute中进行全量存储和批量分析计算。
进一步,数据从Datahub到Maxcompute的归档采用非准实时归档,配置为每5分钟,数据从Datahub到Maxcompute归档一次,同时Datahub缓存最近7天的数据。
优选地,步骤4包括:
步骤4.1,使用实时计算平台Blink实时订阅Datahub中的Topic,将Datahub中的增量日志数据实时订阅到Blink缓存;其中,设置Blink任务并发度与Topic的碎片数一致;
步骤4.2,通过Blink将订阅到的增量日志数据转换成目标端查询库的结构化查询语言后,按照设定的顺序写入目标端查询库。
进一步,步骤4.2中,设定的顺序是根据Topic中每条数据的业务主键id进行分组排序获得的,排序的依据是数据产生的先后顺序,先产生的数据先消费,后产生的数据后消费。
优选地,步骤5中,离线同步的方式包括:对于基于云原生数据库ADB的目标端查询库,使用数据工场Dataworks的数据集成DI工具进行离线同步;对于基于交互式分析Hologres的目标端查询库,使用外表的方式直接访问离线数据库中的数据表,使用SQL语句将历史数据复制到目标端查询库的内部表中。
优选地,步骤1还包括在所述云外数据中心部署Oracle业务库;Oracle业务库,用于提供事务处理,事务处理包括增删改查、流程处理、缴费记账。
优选地,步骤4还包括,查询库部署在云平台;采用云原生数据库和交互式分析分别作为在线服务分析层的查询库;查询库,用于提供实时查询、在线分析统计。
优选地,步骤5还包括,离线数据库均署在云平台;离线数据库,是全部数据的历史存储中心,用于离线的数据批处理、统计分析,数据分析计算,T+1的报表统计。
本发明的有益效果在于,与现有技术相比,本发明使用的数据传输链路是Oracle通过OGG+datahub+Blink的方式同步至查询库,正常通讯延迟在30s到1分钟左右,查询库数据与业务库既能保证实时同步,也具有数据一致性,实现了查询库具有在线分析的能力,解决了查询库只能是同构数据库的限制,为系统后续提供在线数据服务奠定了基础。
根据业务需求,查询库数据与业务库进行实时同步,查询库中提供指标统计分析能力和实时查询能力,业务库会实时同步到查询库中,并满足查询库数据与业务库数据一致性要求。
附图说明
图1是本发明一种支持在线分析统计的实时查询库设计方法的步骤框图;
图2为本发明一实施例中,支持在线分析统计的实时查询库的传输链路示意图;
其中,附图标记说明如下:
1-Oracle业务库;2-OGG;3-Datahub;4-Blink;5-Maxcompute;6-ADB/Hologres。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
如图1,一种支持在线分析统计的实时查询库设计方法,包括:
步骤1,在源端Oracle业务库中部署数据复制软件进行日志收集。
具体地,步骤1包括:
步骤1.1,对源端Oracle业务库进行参数设置,使得Oracle业务库处于归档模式。
进一步,步骤1.1中,当设置复制使能参数Enable_Goldengate_replication为True时,Oracle业务库开启强制写日志,即Oracle业务库开启全列日志;其中,Enable_Goldengate_replication为面向OGG的复制使能参数;
当设置复制使能参数Enable_Goldengate_replication不为True时,Oracle业务库不开启强制写日志,即Oracle业务库不开启全列日志,则在发生修改或删除操作时,OGG将只会同步更新字段,其他未变更字段除主键外全部为Null。
步骤1.2,在Oracle业务库中,部署基于日志的结构化数据复制软件OGG(OracleGolden Gate),并建立OGG用户;
进一步,步骤1.2中,建立OGG用户包括:创建OGG用户表空间、授权OGG用户、创建OGG相关的子目录。
步骤1.3,将OGG划分为源端和目标端,其中,在源端部署Manager进程、Extract进程和Pump进程,在目标端部署Collector进程和Replicat进程;
进一步,步骤1.3中,Manager进程,负责管理其他进程的启停和监控;
Extract进程,负责从源端业务库表或者事务日志中抽取数据;Extract进程的配置有两种:初始加载和增量同步两种模式,初始加载模式是直接将源表数据同步到目标端,如需要同步全量数据时,可采取此模式;增量同步是分析源端数据库日志,将变动记录传到目标端,本发明优选实施例中,Extract进程采用增量同步配置模式;
Pump进程,负责将源端Trail文件的数据投递到目标端;
Collector进程,负责接收来自源端的数据,在目标端生成Trail文件。
步骤1.4,利用OGG将源端Oracle业务库的日志同步到目标端,实现日志收集。
进一步,步骤1.4包括:
步骤1.4.1,由Extract进程分析源端业务库日志,从源端抽取变动的数据;
步骤1.4.2,将变动的数据记录在源端Trail文件中;
步骤1.4.3,Pump进程将源端Trail文件中的数据投递到目标端;
步骤1.4.4,Collector进程在目标端接收来自源端Trail文件中的数据,生成目标端Trail文件用于存储来自源端Trail文件中的数据;
步骤1.4.5,Replicat进程读取目标端Trail文件后,转化为数据定义语言DDL(data definition language)和数据操作语言DML(data manipulation language)后在目标端数据库中使用,实现数据同步;
其中,在目标端数据库中,数据定义语言用在定义或改变表的结构、数据类型、表之间的链接和约束的初始化工作上;数据操作语言用在对数据库中的数据进行操作,包括新增、修改和删除。
优选地,如图2,步骤1还包括,在云外数据中心部署Oracle业务库,以Oracle RAC(Real Application Clusters)集群作为业务事务处理中心,用于提供事务处理,事务处理包括增删改查、流程处理、缴费记账。
步骤2,使用插件对收集到的日志进行解析,得到增量日志数据。
具体地,步骤2中,使用云流数据处理平台Datahub对目标端Trail文件进行解析,将得到的增量日志数据实时订阅到Datahub中;
其中,Oracle业务库中的每一张表Table均对应Datahub中一个独立主题Topic。表Table是Oracle数据库中最基本的逻辑结构,一切数据都存放在表中,主题Topic,是Datahub订阅和发布的最小单元。
步骤3,对增量日志数据进行离线归档。
具体地,步骤3中,通过配置Datahub的目标数据归档源,将Datahub中的增量日志数据归档到大数据计算服务Maxcompute中进行全量存储和批量分析计算。
进一步,数据从Datahub到Maxcompute的归档采用非准实时归档,配置为每5分钟,数据从Datahub到Maxcompute归档一次,同时Datahub缓存最近7天的数据。
步骤4,增量日志数据实时写入目标端查询库中;
具体地,步骤4包括:
步骤4.1,使用实时计算平台Blink实时订阅Datahub中的Topic,将Datahub中的增量日志数据实时订阅到Blink缓存;其中,设置Blink任务并发度与Topic的碎片数一致;
步骤4.2,通过Blink将订阅到的增量日志数据转换成目标端查询库的结构化查询语言后,按照设定的顺序写入目标端查询库。
进一步,步骤4.2中,设定的顺序是根据Topic中每条数据的业务主键id进行分组排序获得的,排序的依据是数据产生的先后顺序,先产生的数据先消费,后产生的数据后消费。
优选地,如图2,步骤4还包括,查询库部署在云平台;采用云原生数据库和交互式分析分别作为在线服务分析层的查询库;查询库,用于提供实时查询、在线分析统计。
步骤5,历史数据从离线数据库中离线同步到目标端查询库中。
具体地,步骤5中,离线同步的方式包括:对于基于云原生数据库ADB(AnalyticDB)的目标端查询库,使用数据工场Dataworks的数据集成DI(Data Integration)工具进行离线同步;对于基于交互式分析Hologres的目标端查询库,使用外表的方式直接访问离线数据库中的数据表,使用SQL语句将历史数据复制到目标端查询库的内部表中。
优选地,如图2,步骤5还包括,离线数据库均署在云平台;离线数据库,是全部数据的历史存储中心,用于离线的数据批处理、统计分析,数据分析计算,T+1的报表统计。
本发明的有益效果在于,与现有技术相比,本发明使用的数据传输链路是Oracle通过OGG+datahub+Blink的方式同步至查询库,正常通讯延迟在30s到1分钟左右,查询库数据与业务库既能保证实时同步,也具有数据一致性,实现了查询库具有在线分析的能力,解决了查询库只能是同构数据库的限制,为系统后续提供在线数据服务奠定了基础。
根据业务需求,查询库数据与业务库进行实时同步,查询库中提供指标统计分析能力和实时查询能力,业务库会实时同步到查询库中,并满足查询库数据与业务库数据一致性要求。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (11)
1.一种支持在线分析统计的实时查询库设计方法,其特征在于,
所述方法包括:
步骤1,在源端Oracle业务库中部署数据复制软件进行日志收集;其中,在Oracle业务库中,部署基于日志的结构化数据复制软件OGG,并建立OGG用户;建立OGG用户包括:创建OGG用户表空间、授权OGG用户、创建OGG相关的子目录;
步骤2,使用插件对收集到的日志进行解析,得到增量日志数据;使用云流数据处理平台Datahub对目标端Trail文件进行解析,将得到的增量日志数据实时订阅到Datahub中;其中,Oracle业务库中的每一张表Table均对应Datahub中一个独立主题Topic;
步骤3,对增量日志数据进行离线归档;
步骤4,增量日志数据实时写入目标端查询库中;包括:步骤4.1,使用实时计算平台Blink实时订阅Datahub中的Topic,将Datahub中的增量日志数据实时订阅到Blink缓存;其中,设置Blink任务并发度与Topic的碎片数一致;步骤4.2,通过Blink将订阅到的增量日志数据转换成目标端查询库的结构化查询语言后,按照设定的顺序写入目标端查询库;
其中,查询库部署在云平台;采用云原生数据库和交互式分析数据库分别作为在线服务分析层的查询库;查询库,用于提供实时查询、在线分析统计;
步骤5,历史数据从离线数据库中离线同步到目标端查询库中。
2.根据权利要求1所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤1包括:
步骤1.1,对源端Oracle业务库进行参数设置,使得Oracle业务库处于归档模式;
步骤1.2,在Oracle业务库中,部署基于日志的结构化数据复制软件OGG,并建立OGG用户;
步骤1.3,将OGG划分为源端和目标端,其中,在源端部署Manager进程、Extract进程和Pump进程,在目标端部署Collector进程和Replicat进程;
步骤1.4,利用OGG将源端Oracle业务库的日志同步到目标端,实现日志收集。
3.根据权利要求2所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤1.1中,当设置复制使能参数Enable_Goldengate_replication为True时,Oracle业务库开启强制写日志,即Oracle业务库开启全列日志;
当设置复制使能参数Enable_Goldengate_replication不为True时,Oracle业务库不开启强制写日志,即Oracle业务库不开启全列日志,则在发生修改或删除操作时,OGG将只会同步更新字段,其他未变更字段除主键外全部为Null。
4.根据权利要求2所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤1.3中,所述Manager进程,负责管理其他进程的启停和监控;
所述Extract进程,负责从源端业务库表或者事务日志中抽取数据;其中,Extract进程采用增量同步配置模式;
所述Pump进程,负责将源端Trail文件的数据投递到目标端;
所述Collector进程,负责接收来自源端的数据,在目标端生成Trail文件。
5.根据权利要求4所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤1.4包括:
步骤1.4.1,由Extract进程分析源端业务库日志,从源端抽取变动的数据;
步骤1.4.2,将变动的数据记录在源端Trail文件中;
步骤1.4.3,Pump进程将源端Trail文件中的数据投递到目标端;
步骤1.4.4,Collector进程在目标端接收来自源端Trail文件中的数据,生成目标端Trail文件用于存储来自源端Trail文件中的数据;
步骤1.4.5,Replicat进程读取目标端Trail文件后,转化为数据定义语言和数据操作语言后在目标端数据库中使用,实现数据同步;
其中,在目标端数据库中,数据定义语言用在定义或改变表的结构、数据类型、表之间的链接和约束的初始化工作上;数据操作语言用在对数据库中的数据进行操作,包括新增、修改和删除。
6.根据权利要求5所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤3中,通过配置Datahub的目标数据归档源,将Datahub中的增量日志数据归档到大数据计算服务Maxcompute中进行全量存储和批量分析计算。
7.根据权利要求6所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
所述数据从Datahub到Maxcompute的归档采用非准实时归档,配置为每5分钟,数据从Datahub到Maxcompute归档一次,同时Datahub缓存最近7天的数据。
8.根据权利要求7所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤4.2中,所述设定的顺序是根据Topic中每条数据的业务主键id进行分组排序获得的,所述排序的依据是数据产生的先后顺序,先产生的数据先消费,后产生的数据后消费。
9.根据权利要求7所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤5中,所述离线同步的方式包括:对于基于云原生数据库ADB的目标端查询库,使用数据工场Dataworks的数据集成DI工具进行离线同步;对于基于交互式分析Hologres的目标端查询库,使用外表的方式直接访问离线数据库中的数据表,使用SQL语句将历史数据复制到目标端查询库的内部表中。
10.根据权利要求1所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤1还包括在云外数据中心部署Oracle业务库;所述Oracle业务库,用于提供事务处理,所述事务处理包括增删改查、流程处理、缴费记账。
11.根据权利要求1所述的一种支持在线分析统计的实时查询库设计方法,其特征在于,
步骤5还包括,所述离线数据库均署在云平台;所述离线数据库,是全部数据的历史存储中心,用于离线的数据批处理、统计分析,数据分析计算,T+1的报表统计。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111253832.0A CN113961546B (zh) | 2021-10-27 | 2021-10-27 | 一种支持在线分析统计的实时查询库设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111253832.0A CN113961546B (zh) | 2021-10-27 | 2021-10-27 | 一种支持在线分析统计的实时查询库设计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113961546A CN113961546A (zh) | 2022-01-21 |
CN113961546B true CN113961546B (zh) | 2024-03-22 |
Family
ID=79467411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111253832.0A Active CN113961546B (zh) | 2021-10-27 | 2021-10-27 | 一种支持在线分析统计的实时查询库设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113961546B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115577050B (zh) * | 2022-12-12 | 2023-05-12 | 国网江苏省电力有限公司营销服务中心 | 一种电费数字化应用平台构建方法 |
CN116414902B (zh) * | 2023-03-31 | 2024-06-04 | 华能信息技术有限公司 | 一种快速数据源接入方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109254982A (zh) * | 2018-08-31 | 2019-01-22 | 杭州安恒信息技术股份有限公司 | 一种流数据处理方法、系统、装置及计算机可读存储介质 |
CN111597257A (zh) * | 2020-05-09 | 2020-08-28 | 远光软件股份有限公司 | 数据库的同步方法、装置、存储介质及终端 |
CN111723160A (zh) * | 2020-08-24 | 2020-09-29 | 国网浙江省电力有限公司 | 一种多源异构增量数据同步方法及系统 |
WO2020192064A1 (zh) * | 2019-03-28 | 2020-10-01 | 苏宁云计算有限公司 | 一种增量数据一致性实现方法及装置 |
CN111930817A (zh) * | 2020-07-28 | 2020-11-13 | 银盛支付服务股份有限公司 | 一种基于大数据的分布式非结构化数据库关联查询方法 |
CN111930764A (zh) * | 2020-07-31 | 2020-11-13 | 银盛支付服务股份有限公司 | 基于实时数据处理的风险交易管控方法及装置 |
CN112181992A (zh) * | 2020-10-27 | 2021-01-05 | 浪潮云信息技术股份公司 | 一种oracle数据库增量数据采集实现方法 |
CN112328546A (zh) * | 2020-11-06 | 2021-02-05 | 安徽明生恒卓科技有限公司 | 一种基于数据中台的增量数据核查方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005579A1 (en) * | 2005-07-01 | 2007-01-04 | Microsoft Corporation | Query based synchronization |
US10997180B2 (en) * | 2018-01-31 | 2021-05-04 | Splunk Inc. | Dynamic query processor for streaming and batch queries |
CN112559280B (zh) * | 2020-12-04 | 2023-08-22 | 国网安徽省电力有限公司信息通信分公司 | 基于数据中台的数据全链路监控方法 |
CN112883001A (zh) * | 2021-01-28 | 2021-06-01 | 国网冀北电力有限公司智能配电网中心 | 一种基于营配贯通数据可视化平台的数据处理方法、装置及介质 |
CN113392113A (zh) * | 2021-06-20 | 2021-09-14 | 杭州登虹科技有限公司 | 一种云视频开放平台精细化用户画像实时推荐方法 |
CN113450004A (zh) * | 2021-07-02 | 2021-09-28 | 国网北京市电力公司 | 电力信用报告生成方法、装置、电子设备及可读存储介质 |
-
2021
- 2021-10-27 CN CN202111253832.0A patent/CN113961546B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109254982A (zh) * | 2018-08-31 | 2019-01-22 | 杭州安恒信息技术股份有限公司 | 一种流数据处理方法、系统、装置及计算机可读存储介质 |
WO2020192064A1 (zh) * | 2019-03-28 | 2020-10-01 | 苏宁云计算有限公司 | 一种增量数据一致性实现方法及装置 |
CN111597257A (zh) * | 2020-05-09 | 2020-08-28 | 远光软件股份有限公司 | 数据库的同步方法、装置、存储介质及终端 |
CN111930817A (zh) * | 2020-07-28 | 2020-11-13 | 银盛支付服务股份有限公司 | 一种基于大数据的分布式非结构化数据库关联查询方法 |
CN111930764A (zh) * | 2020-07-31 | 2020-11-13 | 银盛支付服务股份有限公司 | 基于实时数据处理的风险交易管控方法及装置 |
CN111723160A (zh) * | 2020-08-24 | 2020-09-29 | 国网浙江省电力有限公司 | 一种多源异构增量数据同步方法及系统 |
CN112181992A (zh) * | 2020-10-27 | 2021-01-05 | 浪潮云信息技术股份公司 | 一种oracle数据库增量数据采集实现方法 |
CN112328546A (zh) * | 2020-11-06 | 2021-02-05 | 安徽明生恒卓科技有限公司 | 一种基于数据中台的增量数据核查方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113961546A (zh) | 2022-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101828182B (zh) | 报告oltp数据的无etl零冗余系统和方法 | |
CN113961546B (zh) | 一种支持在线分析统计的实时查询库设计方法 | |
CN112445863B (zh) | 一种数据实时同步方法及系统 | |
CN103455557B (zh) | 一种基于日志的结构化数据同步方法 | |
CN111651519B (zh) | 数据同步方法、数据同步装置、电子设备及存储介质 | |
Yang et al. | OceanBase: a 707 million tpmC distributed relational database system | |
Yang et al. | F1 Lightning: HTAP as a Service | |
US20220335049A1 (en) | Powering Scalable Data Warehousing with Robust Query Performance | |
Wang et al. | Apache IoTDB: A time series database for IoT applications | |
CN114328688A (zh) | 一种针对电力能源大数据的管控平台 | |
CN103473260A (zh) | 一种面向并发olap的测试数据分层聚簇查询处理系统及方法 | |
CN113129063A (zh) | 一种基于云平台和数据中台的电费计算发行方法及系统 | |
CN111930817A (zh) | 一种基于大数据的分布式非结构化数据库关联查询方法 | |
CN110597891A (zh) | MySQL聚合为PostgreSQL数据库的设备、系统、方法、存储介质 | |
CN114153809A (zh) | 基于数据库日志并行实时增量统计的方法 | |
CN115544314A (zh) | 一种非结构化数据库的系统 | |
CN118069712A (zh) | 数据生命周期管理方法、装置、电子设备及存储介质 | |
Zhou et al. | An ETL strategy for real-time data warehouse | |
CN115098486A (zh) | 基于海关业务大数据的实时数据采集方法 | |
CN111258977A (zh) | 一种税务大数据存储及分析平台 | |
CN116756247B (zh) | 数据修复方法、装置、计算机设备和存储介质 | |
Wang et al. | High-performance Database Integrating Transaction and Analysis | |
Iwazume et al. | Big data in memory: Benchmarking in memory database using the distributed key-value store for constructing a large scale information infrastructure | |
Liu et al. | A research on unified storage management and access technology applied in power network dispatch and control big data | |
Yang | Research on application of digital literature archives management based on xml database system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |