CN112235332B - 一种集群的读写切换方法和装置 - Google Patents
一种集群的读写切换方法和装置 Download PDFInfo
- Publication number
- CN112235332B CN112235332B CN201910635499.6A CN201910635499A CN112235332B CN 112235332 B CN112235332 B CN 112235332B CN 201910635499 A CN201910635499 A CN 201910635499A CN 112235332 B CN112235332 B CN 112235332B
- Authority
- CN
- China
- Prior art keywords
- cluster
- segments
- database
- time period
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000005457 optimization Methods 0.000 claims abstract description 44
- 238000012544 monitoring process Methods 0.000 claims abstract description 33
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000926 separation method Methods 0.000 abstract description 17
- 239000012634 fragment Substances 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000003203 everyday effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000009530 blood pressure measurement Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3034—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种集群的读写切换方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:监测数据库中是否有推送成功标识;其中,所述推送成功标识由数据平台推送;若有,则对第一集群中的段进行强制合并;若否,则基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并;将优化成功标识写入所述数据库。该实施方式能够解决读写分离集群在写数据还没完成时就进行切换,造成在同一个集群同时进行大量读写,导致切换失败,且随时间推移数据碎片增多,从而严重影响查询效率的技术问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种集群的读写切换方法和装置。
背景技术
为了实现个性化首页,将几亿活跃用户的画像数据存储在集群(比如ElasticSearch集群、Hbase集群等)中,当每个用户进入店铺首页时,都会进行数据查询,因此每秒查询率(QPS)较高。而且,每天至少有几亿用户的画像数据需要从数据平台集中写入集群中,即使在凌晨4点开始推送数据,每天也至少需要几个小时才能将数据推送完成。
为了不影响数据查询效率,通常采用集群读写分离的方式进行数据存储。例如,部署两个同样规模的集群,一个集群用于读数据,另一个用于写数据,第二天进行读写切换,将前一天写好的集群提供读,另一个集群提供写。切换逻辑为通过定时任务每天定时对这两个集群进行读写自动切换。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
1)由于每天都有几亿用户的画像数据需要从数据平台推送到集群进行更新,且由于数据平台每天的集市性能可能会存在波动,平时需要推送几个小时能完成的任务,有时甚至需要一天,甚至会失败,这样会造成集群数据还在推送过程中,就已经开始把客户端的查询引用切换到该集群,由此造成在同一个集群上同时进行大量读和写任务,导致数据查询性能严重下降、读写分离切换失败。
2)由于集群的数据更新不是直接删除老数据、添加新数据,而是将新数据推送至集群后,将老数据标识为旧数据,因此新旧数据同时存在,只有等下一次执行段合并时才将老数据删除。所以,每天的数据更新会使数据的存储容量不断上升(每天会增加至少几十GB的容量),导致产生大量老数据的数据碎片,影响集群的查询效率。
发明内容
有鉴于此,本发明实施例提供一种集群的读写切换方法和装置,以解决读写分离集群在写数据还没完成时就进行切换,造成在同一个集群同时进行大量读写,导致切换失败,且随时间推移数据碎片增多,从而严重影响查询效率的技术问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种集群的读写切换方法,包括:
监测数据库中是否有推送成功标识;其中,所述推送成功标识由数据平台推送;
若有,则对第一集群中的段进行强制合并;
若否,则基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并;
将优化成功标识写入所述数据库。
可选地,对第一集群中的段进行强制合并,包括:
对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。
可选地,基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并,包括:
监测所述第一集群中的段数量在预设时间段内是否发生变化;
若是,则将所述段数量写入所述数据库;
若否,则对所述第一集群中的段进行强制合并。
可选地,监测所述第一集群中的段数量在预设时间段内是否发生变化,包括:
每隔预设子时间段,将所述第一集群的段数量快照存储在数据库中;
监测距离当前时间最近的N个段数量快照是否相同,从而判断所述第一集群中的段数量在预设时间段内是否发生变化;
其中,所述预设时间段包括N个预设子时间段,N为正整数。
可选地,将优化成功标识写入所述数据库之后,还包括:
从所述数据库中读取优化成功标识,根据所述优化成功标识确定所述第一集群和第二集群的读写状态,以对所述第一集群和第二集群进行读写切换。
另外,根据本发明实施例的另一个方面,提供了一种集群的读写切换装置,包括:
段合并模块,用于监测数据库中是否有推送成功标识;若有,则对第一集群中的段进行强制合并;若否,则基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并;其中,所述推送成功标识由数据平台推送;
标识写入模块,用于将优化成功标识写入所述数据库。
可选地,对第一集群中的段进行强制合并,包括:
对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。
可选地,基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并,包括:
监测所述第一集群中的段数量在预设时间段内是否发生变化;
若是,则将所述段数量写入所述数据库;
若否,则对所述第一集群中的段进行强制合并。
可选地,监测所述第一集群中的段数量在预设时间段内是否发生变化,包括:
每隔预设子时间段,将所述第一集群的段数量快照存储在数据库中;
监测距离当前时间最近的N个段数量快照是否相同,从而判断所述第一集群中的段数量在预设时间段内是否发生变化;
其中,所述预设时间段包括N个预设子时间段,N为正整数。
可选地,还包括:
切换模块,用于将优化成功标识写入所述数据库之后,从所述数据库中读取优化成功标识,根据所述优化成功标识确定所述第一集群和第二集群的读写状态,以对所述第一集群和第二集群进行读写切换。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用基于推送成功标识或者段数量检查来强制段合并为最优数量,并将优化成功标识写入数据库的技术手段,所以克服了现有技术中读写分离集群在写数据还没完成时就进行切换,造成在同一个集群同时进行大量读写,导致切换失败,且随时间推移数据碎片增多,从而严重影响查询效率的技术问题。本发明实施例基于推送成功标识或者段数量检查来强制段合并为最优数量,能够优化查询效率,降低存储容量,并提升读写分离的成功率。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的集群的读写切换方法的主要流程的示意图;
图2是根据本发明一个可参考实施例的集群的读写切换方法的主要流程的示意图;
图3为实现本发明实施例的集群的读写切换方法的框架图;
图4是根据本发明实施例的集群的读写切换装置的主要模块的示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的集群的读写切换方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述集群的读写切换方法可以包括:
步骤101,监测数据库中是否有推送成功标识,其中,所述推送成功标识由数据平台推送。
数据平台完成数据推送后,会推送推送成功标识(success)到数据库,说明数据推送完成。但是由于数据平台的不稳定性,推送任务有可能失败,如果推送失败,数据平台则不会推送所述推送成功标识到数据库。可以通过定时任务(worker)每隔一段时间监测数据库中是否有推送成功标识。
在本发明的实施例中,数据库可以是关系型数据库(例如MySQL、Oracle等),也可以是非关系型数据库(例如Memcached、redis等)。
为了便于理解,本发明实施例以两个同样规模的集群为例进行说明,第一集群用于写数据,第二集群用于读数据。其中,所述集群可以是ElasticSearch集群、Hbase集群等。因此,大数据平台会推送用户画像数据到第一集群,以更新第一集群中的用户画像数据。在数据推送完成后,大数据平台还会将第一集群的推送成功标识推送到数据库,用于表示第一集群的数据推送已完成。具体地,大数据平台里创建有两个任务,一个是数据推送任务,另一个是推送success标识任务。数据推送任务完成后会触发推送success标识任务,失败则不会触发推送success标识任务。
需要说明的是,数据平台可以是大数据平台,也可以是其他提供数据查询和/或数据处理等功能的平台。
步骤102,对第一集群中的段进行强制合并。
如果监测到数据库中有推送成功标识,说明数据平台对第一集群的数据推送已经完成,则对第一集群中的段(segment)进行强制合并。对集群中的段进行强制合并的优点是:由于集群的查询会遍历每一个段,因此段数量增多会耗费系统的文件句柄资源,还会影响查询性能;并且在合并的过程中,会把标识为过期的数据进行物理删除,由此减少了存储容量,一举两得。
可选地,步骤102可以具体包括:对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。本发明实施例将每个分片下的段进行强制合并,直到每个分片下的段数量均为1。也就是说,在强制合并后,每个分片只有一个段,如果第一集群有32个分片,那么就只有32个段,这样可以显著提高集群的数据查询效率。集群的每个分片数据分散在很多个段里,每次查询都会把该分片下的所有段文件都查询一遍,造成查询效率低下且耗费更多内存,强制合并段数量为1能够显著提高查询效率。
由于第一集群和第二集群均是分布式的搜索引擎,所以索引通常都会被分解成不同部分,而这些分布在不同节点的数据就是分片,分片是集群分发数据的单元。避免使用非常大的分片,因为这会对群集从故障中恢复的能力产生负面影响,对分片的大小没有固定的限制,但是通常情况下很多场景限制在50GB的分片大小以内。
步骤103,基于第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并。
由于数据平台的不稳定性,推送任务有可能失败,如果推送失败,数据平台则不会推送所述推送成功标识到数据库,那么也就无法在数据库中监测到推送成功标识。如果在数据库中没有监测到推送成功标识,说明平台对第一集群的数据推送失败,则基于第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并。
需要指出的是,基于集群的存储策略,在数据平台向第一集群推送数据(比如每秒3万条数据推送)的过程中,第一集群的段会不断新建,并且进行段合并(小的段合并为大的段),因此第一集群的段数量也会不断变化,如果数据推送失败了,就不会有数据写入第一集群,此后段数量将不会发生变化(说明推送停止了)。基于此,本发明实施例通过段数量检查来判断是否停止推送,并在停止推送后也对段进行强制合并,以保证集群的数据查询效率。当天推送失败的数据,将由第二天的推送任务进行补偿,将这部分数据添加到第二天的推送任务中,整个过程不影响读写分离切换。
可选地,步骤103可以具体包括:监测第一集群中的段数量在预设时间段内是否发生变化;若是,则将所述段数量写入所述数据库;若否,则对所述第一集群中的段进行强制合并。可以预先设定时间段为1小时、2小时、3小时等,本发明实施例对此不作限制。举例来说,后台的定时任务(worker)每分钟检查第一集群的段数量,如果检查到在1小时内段数量都没有发生变化,则认为推送任务已停止了数据写入,就会启动一个后台线程对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。如果检查到1小时内段数量还在发生变化,说明推送任务还在进行,则将当前的段数量写入数据库中,用于下一次段数量检查。
可选地,监测所述第一集群中的段数量在预设时间段内是否发生变化,包括:每隔预设子时间段,将所述第一集群的段数量快照存储在数据库中;监测距离当前时间最近的N个段数量快照是否相同,从而判断所述第一集群中的段数量在预设时间段内是否发生变化;其中,所述预设时间段包括N个预设子时间段,N为正整数。具体地,可以每隔10分钟将段数量快照存储到数据库中,监测任务就会监测过去1小时内的段数量(前6个段数量快照)是否相同,如果相同,就说明段数量已经没有变化,认为停止了数据写入。
在大数量的读写分离场景中,现有读写分离是每天固定时间切换(如早上8点),但不能保证每天早上8点就能完成数据推送,如果没有完成数据推送就把查询切换到该集群,就会造成读写都集中到了一个集群,导致读写分离失败,显得很被动。而本发明实施例通过监测集群的段数量在一段时间内不变化,进行强制段合并为最优数量,提升读写分离的成功率以及查询效率。
步骤104,将优化成功标识写入数据库。
在段合并优化完成后,也就是每个分片下的段数量为1时,完成了集群的写入和优化过程,则在数据库中写入第一集群的优化成功标识。在本发明的实施例中,优化成功标识表示第一集群完成数据推送和段合并后,该集群处于可查询状态。
在步骤104之后,所述方法还可以包括:从所述数据库中读取优化成功标识,根据所述优化成功标识确定所述第一集群和第二集群的读写状态,以对所述第一集群和第二集群进行读写切换。具体地,在读写服务重启后,可以根据数据库中的优化成功标识来确定哪个集群是可以查询状态;也可以定时读取数据库中的优化成功标识,从而根据该标识来确定哪个集群是可以查询状态。如果从数据库中读取到第一集群的优化成功标识,说明第一集群已经完成了的数据推送和段合并,该集群处于可查询状态,则对第一集群和第二集群进行读写切换(第一集群用于写数据,第二集群用于读数据),即将客户端的查询引用切换到第一集群。
根据上面所述的各种实施例,可以看出本发明通过基于推送成功标识或者段数量检查来强制段合并为最优数量,并将优化成功标识写入数据库的技术手段,从而解决了现有技术中读写分离集群在写数据还没完成时就进行切换,造成在同一个集群同时进行大量读写,导致切换失败,且随时间推移数据碎片增多,从而严重影响查询效率的技术问题。本发明实施例基于推送成功标识或者段数量检查来强制段合并为最优数量,能够优化查询效率,降低存储容量,并提升读写分离的成功率。
图2是根据本发明一个可参考实施例的集群的读写切换方法的主要流程的示意图。图3为实现本发明实施例的集群的读写切换方法的框架图。如图3所示,该框架包括第一集群、第二集群、数据平台、数据库、标识监测模块、段数量监测模块、段数量优化模块和查询引用模块。如图2所示,所述集群的读写切换方法可以具体包括:
步骤201,数据平台向第一集群推送用户画像数据,如果完成数据推送,则推送第一集群的推送成功标识到数据库。但是由于数据平台的不稳定性,推送任务有可能失败,如果数据推送失败,则不推送所述推送成功标识。
步骤202,标识监测模块监测数据库中是否有推送成功标识;若是,则执行步骤203,若否,则执行步骤204。
步骤203,段数量优化模块对第一集群中的段进行强制合并。
如果监测到数据库中有推送成功标识,说明数据平台对第一集群的数据推送已经完成,则对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。
步骤204,段数量监测模块监测第一集群中的段数量在预设时间段内是否发生变化;若是,则执行步骤205;若否,则执行步骤203。
如果在数据库中没有监测到推送成功标识,说明数据平台对第一集群的数据推送失败,则基于第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并。
可选地,监测第一集群中的段数量在预设时间段内是否发生变化,包括:每隔预设子时间段,将所述第一集群的段数量快照存储在数据库中;监测距离当前时间最近的N个段数量快照是否相同,从而判断所述第一集群中的段数量在预设时间段内是否发生变化;其中,所述预设时间段包括N个预设子时间段,N为正整数。具体地,可以每隔5分钟将段数量快照存储到数据库中,监测任务就会监测过去1小时内的段数量(前12个段数量快照)是否相同,如果相同,就说明段数量已经没有变化,认为停止了数据写入,则执行强制段合并。
步骤205,段数量监测模块将段数量写入数据库。
如果检查到段数量在预设时间段内还在发生变化,说明推送任务还在进行,则将当前的段数量写入数据库中,用于下一次段数量检查。
步骤206,段数量优化模块将优化成功标识写入数据库。
在段合并优化完成后,也就是每个分片下的段数量为1时,完成了集群的写入和优化过程,则在数据库中写入第一集群的优化成功标识。在本发明的实施例中,优化成功标识表示第一集群完成数据推送和段合并后,该集群处于可查询状态。
步骤207,查询引用切换模块从数据库中读取优化成功标识,根据所述优化成功标识确定所述第一集群和第二集群的读写状态,以对所述第一集群和第二集群进行读写切换。
在读写服务重启后,可以根据数据库中的优化成功标识来确定哪个集群是可以查询状态;也可以定时读取数据库中的优化成功标识,从而根据该标识来确定哪个集群是可以查询状态。如果从数据库中读取到第一集群的优化成功标识,说明第一集群已经完成了的数据推送和段合并,该集群处于可查询状态,则对第一集群和第二集群进行读写切换(第一集群用于写数据,第二集群用于读数据),即将客户端的查询引用切换到第一集群。
经过性能测试,采用本发明实施例提供的方法进行读写切换,读写分离切换成功率100%,查询性能提升200%,4亿活跃用户的画像数据经过段合并优化后,数据的存储容量至少减少了200GB,存储容量至少减少了40%。
对第一集群和第二集群进行压测,得到如下结果:
通过上述压测结果,可以看出:两个集群的稳定都较高。
另外,在本发明一个可参考实施例中集群的读写切换方法的具体实施内容,在上面所述集群的读写切换方法中已经详细说明了,故在此重复内容不再说明。
图4是根据本发明实施例的集群的读写切换装置的主要模块的示意图,如图4所示,所述集群的读写切换装置400包括段合并模块401和标识写入模块402。其中,段合并模块401用于监测数据库中是否有推送成功标识;若有,则对第一集群中的段进行强制合并;若否,则基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并;其中,所述推送成功标识由数据平台推送;标识写入模块402用于将优化成功标识写入所述数据库。
可选地,对第一集群中的段进行强制合并,包括:
对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。
可选地,基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并,包括:
监测所述第一集群中的段数量在预设时间段内是否发生变化;
若是,则将所述段数量写入所述数据库;
若否,则对所述第一集群中的段进行强制合并。
可选地,监测所述第一集群中的段数量在预设时间段内是否发生变化,包括:
每隔预设子时间段,将所述第一集群的段数量快照存储在数据库中;
监测距离当前时间最近的N个段数量快照是否相同,从而判断所述第一集群中的段数量在预设时间段内是否发生变化;
其中,所述预设时间段包括N个预设子时间段,N为正整数。
可选地,还包括:
切换模块,用于将优化成功标识写入所述数据库之后,从所述数据库中读取优化成功标识,根据所述优化成功标识确定所述第一集群和第二集群的读写状态,以对所述第一集群和第二集群进行读写切换。
根据上面所述的各种实施例,可以看出本发明通过基于推送成功标识或者段数量检查来强制段合并为最优数量,并将优化成功标识写入数据库的技术手段,从而解决了现有技术中读写分离集群在写数据还没完成时就进行切换,造成在同一个集群同时进行大量读写,导致切换失败,且随时间推移数据碎片增多,从而严重影响查询效率的技术问题。本发明实施例基于推送成功标识或者段数量检查来强制段合并为最优数量,能够优化查询效率,降低存储容量,并提升读写分离的成功率。
需要说明的是,在本发明所述集群的读写切换装置的具体实施内容,在上面所述集群的读写切换方法中已经详细说明了,故在此重复内容不再说明。
图5示出了可以应用本发明实施例的集群的读写切换方法或集群的读写切换装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器504交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息——仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的集群的读写切换方法一般由服务器505执行,相应地,所述集群的读写切换装置一般设置在服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括段合并模块和标识写入模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:监测数据库中是否有推送成功标识;其中,所述推送成功标识由数据平台推送;若有,则对第一集群中的段进行强制合并;若否,则基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并;将优化成功标识写入所述数据库。
根据本发明实施例的技术方案,因为采用基于推送成功标识或者段数量检查来强制段合并为最优数量,并将优化成功标识写入数据库的技术手段,所以克服了现有技术中读写分离集群在写数据还没完成时就进行切换,造成在同一个集群同时进行大量读写,导致切换失败,且随时间推移数据碎片增多,从而严重影响查询效率的技术问题。本发明实施例基于推送成功标识或者段数量检查来强制段合并为最优数量,能够优化查询效率,降低存储容量,并提升读写分离的成功率。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (8)
1.一种集群的读写切换方法,其特征在于,包括:
通过定时任务每隔一段时间监测数据库中是否有推送成功标识;其中,所述推送成功标识由大数据平台推送,所述推送成功标识表示大数据平台完成数据推送;
若有,则对第一集群中的段进行强制合并;其中,所述第一集群用于写数据;
若否,则基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并;
将优化成功标识写入所述数据库;
从所述数据库中读取优化成功标识,根据所述优化成功标识确定所述第一集群和第二集群的读写状态,以对所述第一集群和第二集群进行读写切换;
其中,基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并,包括:
监测所述第一集群中的段数量在预设时间段内是否发生变化;
若是,则将所述段数量写入所述数据库;
若否,则对所述第一集群中的段进行强制合并。
2.根据权利要求1所述的方法,其特征在于,对第一集群中的段进行强制合并,包括:
对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。
3.根据权利要求1所述的方法,其特征在于,监测所述第一集群中的段数量在预设时间段内是否发生变化,包括:
每隔预设子时间段,将所述第一集群的段数量快照存储在数据库中;
监测距离当前时间最近的N个段数量快照是否相同,从而判断所述第一集群中的段数量在预设时间段内是否发生变化;
其中,所述预设时间段包括N个预设子时间段,N为正整数。
4.一种集群的读写切换装置,其特征在于,包括:
段合并模块,用于通过定时任务每隔一段时间监测数据库中是否有推送成功标识;若有,则对第一集群中的段进行强制合并;若否,则基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并;其中,所述推送成功标识由数据平台推送,所述推送成功标识表示大数据平台完成数据推送,所述第一集群用于写数据;
标识写入模块,用于将优化成功标识写入所述数据库;从所述数据库中读取优化成功标识,根据所述优化成功标识确定所述第一集群和第二集群的读写状态,以对所述第一集群和第二集群进行读写切换;
其中,基于所述第一集群中的段数量在预设时间段内是否发生变化,对所述第一集群中的段进行强制合并,包括:
监测所述第一集群中的段数量在预设时间段内是否发生变化;
若是,则将所述段数量写入所述数据库;
若否,则对所述第一集群中的段进行强制合并。
5.根据权利要求4所述的装置,其特征在于,对第一集群中的段进行强制合并,包括:
对第一集群中每个分片下的段进行强制合并,直到每个分片下的段数量均为1。
6.根据权利要求4所述的装置,其特征在于,监测所述第一集群中的段数量在预设时间段内是否发生变化,包括:
每隔预设子时间段,将所述第一集群的段数量快照存储在数据库中;
监测距离当前时间最近的N个段数量快照是否相同,从而判断所述第一集群中的段数量在预设时间段内是否发生变化;
其中,所述预设时间段包括N个预设子时间段,N为正整数。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的方法。
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-3中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910635499.6A CN112235332B (zh) | 2019-07-15 | 2019-07-15 | 一种集群的读写切换方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910635499.6A CN112235332B (zh) | 2019-07-15 | 2019-07-15 | 一种集群的读写切换方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112235332A CN112235332A (zh) | 2021-01-15 |
CN112235332B true CN112235332B (zh) | 2024-01-16 |
Family
ID=74111066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910635499.6A Active CN112235332B (zh) | 2019-07-15 | 2019-07-15 | 一种集群的读写切换方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112235332B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113590040B (zh) * | 2021-07-29 | 2024-03-19 | 郑州阿帕斯数云信息科技有限公司 | 数据处理方法、装置、设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105446653A (zh) * | 2014-08-27 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种数据合并方法和设备 |
CN105677761A (zh) * | 2015-12-30 | 2016-06-15 | 国网信息通信产业集团有限公司 | 一种数据切分的方法及系统 |
WO2016118176A1 (en) * | 2015-01-20 | 2016-07-28 | Hewlett Packard Enterprise Development Lp | Database management |
CN108052664A (zh) * | 2017-12-29 | 2018-05-18 | 北京小度信息科技有限公司 | 数据库存储集群的数据迁移方法和装置 |
CN108241656A (zh) * | 2016-12-23 | 2018-07-03 | 深圳市优朋普乐传媒发展有限公司 | 一种数据读写方法及装置 |
CN108763572A (zh) * | 2018-06-06 | 2018-11-06 | 湖南蚁坊软件股份有限公司 | 一种实现Apache Solr读写分离的方法和装置 |
CN109344157A (zh) * | 2018-09-20 | 2019-02-15 | 深圳市牛鼎丰科技有限公司 | 读写分离方法、装置、计算机设备及存储介质 |
CN109614390A (zh) * | 2018-12-06 | 2019-04-12 | 无锡华云数据技术服务有限公司 | 数据库读写分离方法、装置、服务系统、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6862593B2 (en) * | 2002-05-17 | 2005-03-01 | Sun Microsystems, Inc. | Separation of database transactions |
US10324942B2 (en) * | 2013-07-26 | 2019-06-18 | Snap Inc. | Segment data visibility and management in a distributed database of time stamped records |
CN106682148A (zh) * | 2016-12-22 | 2017-05-17 | 北京锐安科技有限公司 | 一种基于Solr数据搜索的方法及装置 |
-
2019
- 2019-07-15 CN CN201910635499.6A patent/CN112235332B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105446653A (zh) * | 2014-08-27 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种数据合并方法和设备 |
WO2016118176A1 (en) * | 2015-01-20 | 2016-07-28 | Hewlett Packard Enterprise Development Lp | Database management |
CN105677761A (zh) * | 2015-12-30 | 2016-06-15 | 国网信息通信产业集团有限公司 | 一种数据切分的方法及系统 |
CN108241656A (zh) * | 2016-12-23 | 2018-07-03 | 深圳市优朋普乐传媒发展有限公司 | 一种数据读写方法及装置 |
CN108052664A (zh) * | 2017-12-29 | 2018-05-18 | 北京小度信息科技有限公司 | 数据库存储集群的数据迁移方法和装置 |
CN108763572A (zh) * | 2018-06-06 | 2018-11-06 | 湖南蚁坊软件股份有限公司 | 一种实现Apache Solr读写分离的方法和装置 |
CN109344157A (zh) * | 2018-09-20 | 2019-02-15 | 深圳市牛鼎丰科技有限公司 | 读写分离方法、装置、计算机设备及存储介质 |
CN109614390A (zh) * | 2018-12-06 | 2019-04-12 | 无锡华云数据技术服务有限公司 | 数据库读写分离方法、装置、服务系统、设备及介质 |
Non-Patent Citations (2)
Title |
---|
ORACLE数据库空闲碎片;段隆振,林伟伟,黄水源;南昌大学学报(理科版)(第02期);全文 * |
云环境MMM数据库集群双主多从架构模型构建;刘波;胡景光;黄天天;;计算机与数字工程(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112235332A (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107506451B (zh) | 用于数据交互的异常信息监控方法及装置 | |
AU2017202873B2 (en) | Efficient query processing using histograms in a columnar database | |
CN109947668B (zh) | 存储数据的方法和装置 | |
US9612936B2 (en) | Correlation of source code with system dump information | |
US10606806B2 (en) | Method and apparatus for storing time series data | |
US9043327B1 (en) | Performing flexible pivot querying of monitoring data using a multi-tenant monitoring system | |
AU2014209697A1 (en) | Method and system for using a recursive event listener on a node in hierarchical data structure | |
CN105900093A (zh) | 一种KeyValue数据库的数据表的更新方法与表数据更新装置 | |
US20180253357A1 (en) | Reducing granularity of backup data over time | |
CN111338834B (zh) | 数据存储方法和装置 | |
US9158805B1 (en) | Statistical data quality determination for storage systems | |
CN113254267B (zh) | 分布式数据库的数据备份方法和装置 | |
CN107203437B (zh) | 防止内存数据丢失的方法、装置和系统 | |
CN112235332B (zh) | 一种集群的读写切换方法和装置 | |
CN112148705A (zh) | 数据迁移的方法和装置 | |
CN111984723A (zh) | 数据同步方法、装置及终端设备 | |
US9104392B1 (en) | Multitenant monitoring system storing monitoring data supporting flexible pivot querying | |
CN111723063A (zh) | 一种离线日志数据处理的方法和装置 | |
CN110688355A (zh) | 变更容器状态的方法和装置 | |
CN114969206A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN114996057A (zh) | 数据备份方法及装置、电子设备和计算机可读存储介质 | |
CN113760600B (zh) | 一种数据库备份方法、数据库还原方法和相关装置 | |
CN110493326B (zh) | 基于zookeeper管理集群配置文件的系统和方法 | |
CN108196979B (zh) | 数据备份方法和装置 | |
CN111290927A (zh) | 一种数据监控方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |