CN114547108A - 数据处理方法、装置、设备及介质 - Google Patents

数据处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN114547108A
CN114547108A CN202210172904.7A CN202210172904A CN114547108A CN 114547108 A CN114547108 A CN 114547108A CN 202210172904 A CN202210172904 A CN 202210172904A CN 114547108 A CN114547108 A CN 114547108A
Authority
CN
China
Prior art keywords
data
user
retrieval
database
distributed cache
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210172904.7A
Other languages
English (en)
Inventor
邓强
李保昌
高建华
骆更
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210172904.7A priority Critical patent/CN114547108A/zh
Publication of CN114547108A publication Critical patent/CN114547108A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种数据处理方法,可以应用于金融领域或其他领域。该数据处理方法包括:接收来自客户端的用户检索请求;基于用户检索请求,确定检索逻辑,检索逻辑为根据分布式缓存集群修改的交易逻辑;基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片;基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理。本公开还提供了一种数据处理装置、设备、存储介质和程序产品。

Description

数据处理方法、装置、设备及介质
技术领域
本公开涉及金融领域,具体涉及计算机应用领域,特别涉及一种数据处理方法、装置、计算设备、计算机可读存储介质和计算机程序产品。
背景技术
互联网金融行业需要处理的业务请求量大、数据量大,在集中的时间段又会出现高于日常流量数倍的业务高峰。在集中式架构下,为了提升性能处理要求,处理庞大的数据量请求,只能向上升级到更高配置的机器,如升级更强的CPU、升级内存、升级存储等,但是单机的性能具有瓶颈,单个服务器造价昂贵,而且这种垂直扩容方案无法做到按需扩容。分布式架构在价格成本、灵活扩容、伸缩扩展方面较比集中式架构有明显优势。
Oracle数据库使用方便、功能强大,适用于各类软硬件环境,是一种高效率、高可靠性、高适应性的数据库方案。在银行、电信等行业领域,Oracle数据库的集中式架构中被广泛使用。
现有技术中,业界分布式架构主流采用MySQL数据库,但是,对于使用Oracle数据库的存量应用,分布式架构系统重构成本高,需要修改所有代码,增加数据库的改造工作量,同时也扩大数据库的改造风险。
发明内容
鉴于上述问题,本公开提供了一种数据处理方法、装置、计算设备、介质和程序产品,用于减小改造数据库的工作量,增加数据库的水平扩展能力,满足用户高并发的访问需求。
根据本公开的第一个方面,提供了一种数据处理方法,包括:接收来自客户端的用户检索请求;响应于用户检索请求,确定检索逻辑,检索逻辑为根据分布式缓存集群修改的交易逻辑;基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片;基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理。
根据本公开的实施例,其中,基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片包括:根据分布式缓存集群,检索用户检索请求涉及的数据库分片;在检索到数据库分片的情况下,在数据库分片中指定的数据节点存储查询记录,并将数据库分片确定为目标数据库分片;在未检索到数据库分片的情况下,在全部数据库分片中全部的数据节点存储查询记录;以及在存储查询记录的过程中,确定用户检索请求涉及的数据库分片,并将数据库分片确定为目标数据库分片。
根据本公开的实施例,其中,基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片包括:根据检索逻辑,确定路由规则,路由规则用于确定存储查询记录的数据库分片;以及基于路由规则,确定用户检索请求涉及的目标数据库分片。
根据本公开的实施例,其中,用户检索请求包括用户检索数据;检索逻辑包括查询交易逻辑、插入交易逻辑、更新交易逻辑和删除交易逻辑中的至少一个。
根据本公开的实施例,其中,基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理包括:在确定检索逻辑为插入交易逻辑的情况下,在分布式缓存集群中查询用户检索数据,并申请第一预留位置;在查询到用户检索数据的情况下,删除第一预留位置;在未查询到用户检索数据的情况下,将用户检索数据插入至第一预留位置;在未成功插入用户检索数据的情况下,删除第一预留位置;在成功插入用户检索数据的情况下,向目标数据库分片发送日志信息;以及基于日志信息,对存储于目标数据库分片的用户数据进行数据处理。
根据本公开的实施例,其中,基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理包括:在确定检索逻辑为更新交易逻辑的情况下,在分布式缓存集群中查询用户检索数据,并申请第二预留位置;在查询到用户检索数据的情况下,删除第二预留位置;在未查询到用户检索数据的情况下,将用户检索数据更新至第二预留位置;在未成功更新用户检索数据的情况下,删除第二预留位置;在成功更新用户检索数据的情况下,向目标数据库分片发送日志信息;以及基于日志信息,对存储于目标数据库分片的用户数据进行数据处理。
根据本公开的实施例,还包括:在未查询到用户检索数据的情况下,冻结备用表,并向分布式缓存集群发送冻结标志,其中,备用表存储于备用数据库,用于记录备用数据库涉及的数据库分片的操作记录;在发送冻结标志失败的情况下,删除第二预留位置;以及在发送冻结标志成功的情况下,将用户检索数据更新至第二预留位置。
根据本公开的实施例,其中,分布式缓存集群还包括补数处理:在分布式缓存集群存在故障节点的情况下,确定故障节点的目标副节点;在确定目标副节点的情况下,向客户端返回报错信息并停止对外服务;在停止对外服务期间,分布式缓存集群向补数服务器发送补数信息,补数信息包括故障节点出现故障的时间段和出现故障的数据库分片;以及基于补数信息,完成补数操作并恢复故障节点的服务。
根据本公开的实施例,还包括:在未完成补数操作的情况下,向访问故障节点的服务器返回报错信息;以及在完成补数操作的情况下,向访问故障节点的服务器返回对应信息。
根据本公开的实施例,分布式缓存集群还包括:基于分布式缓存集群,确定预设时段内的增量数据;基于数据库日志,确定预设时段内的删除数据;基于数据表,确定增量数据与数据表的记录状态以及删除数据与数据表的记录状态,数据表存储于核对数据库;以及在增量数据与数据表的记录状态以及删除数据与数据表的记录状态均不一致的情况下,根据数据表更新分布式缓存集群。
本公开的第二方面提供了一种数据处理装置,包括:接收模块,用于接收来自客户端的用户检索请求;第一确定模块,用于基于用户检索请求,确定检索逻辑,检索逻辑为根据分布式缓存集群修改的交易逻辑;第二确定模块,用于基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片;以及数据处理模块,用于基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理。
本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述数据处理方法。
本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述数据处理方法。
本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述数据处理方法。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的数据处理方法和数据装置的系统架构;
图2示意性示出了根据本公开实施例的数据处理方法的流程图;
图3示意性示出了根据本公开实施例的确定目标数据库分片方法的流程图;
图4示意性示出了根据本公开另一实施例的确定目标数据库分片方法的流程图;
图5示意性示出了根据本公开实施例的插入交易逻辑数据处理的方法流程图;
图6示意性示出了根据本公开实施例的更新交易逻辑数据处理的方法流程图;
图7示意性示出了根据本公开实施例的更新交易逻辑中发送冻结标志的方法流程图;
图8示意性示出了根据本公开实施例的补数处理的方法流程图;
图9示意性示出了根据本公开实施例的补数处理过程中向访问服务器返回信息的方法流程图;
图10示意性示出了根据本公开实施例的核对分布式缓存集群的数据的方法流程图;
图11示意性示出了根据本公开实施例的数据处理装置的结构框图;以及
图12示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种数据处理方法,包括:接收来自客户端的用户检索请求;响应于用户检索请求,确定检索逻辑,检索逻辑为根据分布式缓存集群修改的交易逻辑;基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片;基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理。
图1示意性示出了根据本公开实施例的数据处理方法和数据装置的系统架构。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的数据处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的数据处理装置一般可以设置于服务器105中。本公开实施例所提供的数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的系统架构,通过图2~图10对公开实施例的申请审核方法进行详细描述。
图2示意性示出了根据本公开实施例的数据处理方法的流程图。
如图2所示,该方法包括操作S201~S204。
在操作S201,接收来自客户端的用户检索请求。
根据本公开的实施例,用户在客户端进行操作期间产生用户检索请求,用户检索请求包括用户检索数据以及用户请求。用户请求可以表示当前用户在客户端的需求,具体的用户请求用户包括查询历史使用信息、创建新的交易订单等。用户检索数据为用户在客户端检索所需的检索数据,具体的包括手机号、卡号、邮箱、用户ID等。分布式缓存集群接收来自客户端的用户检索请求后,以key-value的形式将该用户检索请求缓存到分布式缓存集群中,key为某一条件列一个值,value为数据所在数据库分片。例如,分布式缓存集群采用rediscluster,通过key快速查询到value。
在操作S202,响应于用户检索请求,确定检索逻辑,检索逻辑为根据分布式缓存集群修改的交易逻辑。
根据本公开的实施例,响应于接收到的用户检索请求,分布式缓存集群确定与用户检索逻辑对应的检索逻辑。具体的,根据用户在客户端的操作得到用户检索请求,用户检索请求包含的是创建新的账户操作,分布式缓存集群对应的检索逻辑就是能够实现创建新的账户的逻辑,例如插入交易逻辑。
根据本公开的实施例,分布式缓存集群采用rediscluster,对Oracle数据库按需进行分片。Oracle数据库采用分布式架构,采用rediscluster分布式缓存集群,形成了客户端-分布式缓存集群-数据库的链路。根据分布式缓存集群对交易逻辑进行修改后,形成新的检索逻辑,该检索逻辑能够支持数据在客户端、分布式缓存集群和数据库分片的操作。rediscluster分布式缓存集群能够存储用户检索数据和数据库分片的映射关系,在客户端和数据库分片之间形成一个基于分布式缓存集群的检索平台,实现数据的索引功能。Rediscluster响应于接收到的用户检索请求,例如创建新的账户,确定与该检索请求对应的检索逻辑,例如确定检索逻辑为插入交易逻辑。
在操作S203,基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片。
根据本公开的实施例,在确定用户在客户端进行操作对应的检索逻辑之后,分布式缓存集群确定用户检索数据涉及的目标数据库分片。目标数据库分片包括至少一个数据库分片。具体的,根据用户检索数据确定用户执行的是查询操作,响应于用户检索数据确定查询交易数据之后,分布式缓存集群确定关于涉及该用户检索请求查询操作的目标数据库分片。
例如,以客户端为某手机银行app为例,在该手机银行app内,资产构成包括余额、理财、贷款等,数据库分片A用于存储余额数据、数据库分片B用于存储理财数据、数据库分片C用于存储贷款数据。用户在该手机银行app进行查询账户的资产构成操作,此时分布式缓存集群响应于接收到的用户检索数据,确定查询交易逻辑后,在分布式缓存集群中确定出涉及到查询操作的数据库分片A、数据库分片B和数据库分片C。数据库分片A、数据库分片B和数据库分片C均为目标数据库分片。
在操作S204,基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理。
根据本公开的实施例,数据库分片用于存储用户数据,不同类型的是用户数据可以根据实际需要存储于不同的数据库分片,数据库分片的数量可以根据实际需要来确定。对用户数据进行按需分片的方法包括:对分片数取模、哈希算法。
根据本公开的实施例,在确定出目标数据库分片之后,根据该用户检索数据对应的检索逻辑,对存储于目标数据库分片的用户数据进行数据处理。本公开的处理链路是客户端-分布式缓存集群-数据库分片,由于在客户端和数据库分片之间添加了分布式缓存集群,将数据库改造为分布式架构。分布式缓存集群不仅需要缓存用户检索数据,还需要保证用户检索数据和存储于目标数据库分片的用户数据的一致。当接收到用户检索数据之后,分布式缓存集群通过缓存的其他数据对该用户检索数据进行查重,缓存数据缺失会导致用户插入重复记录,发生业务逻辑错误。所以,通过对检索逻辑的修改,保证分布式缓存集群的缓存数据与用户数据的一致性,并根据修改的检索逻辑对用户数据进行处理。
考虑到现有技术中Oracle数据库采用的集中式架构往往只能向上升级到更高配置的机器,这种垂直扩容方案对于单个服务器的要求较高,无法做到按需扩容。而基于MySQL数据库的分布式架构对于使用Oracle数据库的存量应用来讲,系统重构成本极高,几乎所有代码都要重写,改造风险和工作量都特别大。如何使Oracle数据库适配分布式架构应用需求,是亟待解决的技术难题。
本公开通过利用rediscluster分布式缓存集群打造Oracle数据访问索引平台,对Oracle数据库进行分布式改造,兼顾系统改造开发成本,不需要对系统代码进行大规模重构,只需要修改该分布式缓存集群的部分检索逻辑,能够实现基于Oracle数据库系统的水平扩容能力。
本公开通过加入分布式缓存集群并修改检索逻辑,形成客户端-分布式缓存集群-数据库分片的链路,将用户请求路由到对应Oracle数据库分片上进行处理。本公开提供的分布式改造方案无需对Oracle数据库进行转型,节省应用系统代码重构成本,同时能够提升系统吞吐能力和水平扩容能力。通过将数据存储于不同数据库分片,能够按需完成对数据库节点的扩容工作,满足用户高并发的访问需求。此外,在原来集中式架构中,核心数据库宕机将导致系统不可用,本公开提供的分布式架构方案能够随着数据库分片数量增加,降低单个分片的业务影响,提升系统的容灾能力,降低系统的运行风险。
图3示意性示出了根据本公开实施例的确定目标数据库分片方法的流程图。
如图3所示,该方法包括操作S301~S304。
在操作S301,根据分布式缓存集群,检索用户检索请求涉及的数据库分片。
根据本公开的实施例,基于用户在客户端进行操作产生的用户检索请求,确定对应的检索逻辑后,根据确定的检索逻辑类型确定涉及用户检索请求的目标数据库分片。由于分布式缓存集群能够存储用户检索数据和数据库分片的映射关系,在确定的检索逻辑中没有指定目标数据库分片的情况下,根据分布式缓存集群,能够检索该用户检索请求涉及到的所有数据库分片。
在操作S302,在检索到数据库分片的情况下,在数据库分片中指定的数据节点存储查询记录,并将数据库分片确定为目标数据库分片。
根据本公开的实施例,在分布式缓存集群检索到用户检索请求包含的用户检索数据与数据库分片的映射关系,能够根据该用户检索请求确定存储用户数据的数据库分片。在检索到对应的数据库分片后,在数据库分片中指定的数据节点存储本次查询记录,以便记录当前分布式缓存集群的操作。此外,在存储当前查询记录的同时,将对应的数据分片确定为进行下一步处理的目标数据库分片。
根据本公开的实施例,在指定数据节点存储的查询记录包括用户检索请求涉及的检索数据、分布式缓存集群进行检索的记录、以及其他操作日志文件。
在操作S303,在未检索到数据库分片的情况下,在全部数据库分片中全部的数据节点存储查询记录。
根据本公开的实施例,未检索到数据库分片的情况下,表明分布式缓存集群的索引功能失效,分布式缓存集群需要检索所有的数据库分片以及对应的数据节点,保证在检索功能失效的情况下,也能够实现确定用户检索请求涉及到的数据库分片。分布式缓存集群也需要存储对全部数据库分片进行检索的操作数据,具体的,在检索全部数据库分片的全部数据节点的同时,在对应数据节点存储检索对应节点的检索记录。
在操作S304,在存储查询记录的过程中,确定用户检索请求涉及的数据库分片,并将数据库分片确定为目标数据库分片。
根据本公开的实施例,分布式缓存集群检索所有数据库分片,将对应的查询记录存储在对应的数据库分片中,并该检索过程中确定当前检索的数据库分片与用户检索请求是否相关。在确认当前数据库分片与用户检索请求存在映射关系的情况下,将相关的数据库分片确定为目标数据库分片。
根据本公开的实施例,用户检索请求包括用户检索数据,用户检索数据为用户在客户端检索所需的检索数据,具体的包括手机号、卡号、邮箱、用户ID等。检索逻辑包括查询交易逻辑、插入交易逻辑、更新交易逻辑和删除交易逻辑中的至少一个。需要注意的是,根据分布式缓存集群修改的检索逻辑并不是对该数据库进行全部代码重构,而是在原有的交易逻辑上进行预设修改,保证客户端、分布式缓存集群和数据库分片的一致性,这种修改不需要大量修改交易逻辑,能够降低修改造成的逻辑不自洽危险。
根据本公开的实施例,以检索逻辑为查询交易逻辑为例,采用rediscluster分布式缓存集群,根据需要设定16个数据库分片。根据rediscluster检索用户检索请求涉及的数据库分片,在检索到用户检索请求涉及的数据库分片A之后,在16个数据库分片中指定的数据库分片B存储查询过程;在rediscluster没有检索到用户检索请求涉及的数据库分片的情况下,rediscluster并行查询16个数据库分片,在16个数据库分片并行存储查询记录。经过对16个数据库分片的并行查询后,确定数据库分片A为目标数据库分片。在确定数据库分片A为目标数据库分片的情况下,访问数据库分片A,数据库分片A进行对应的查询操作后向分布式缓存集群返回查询结果,分布式缓存集群再将查询结果返回客户端。例如,数据库分片返回的查询结果可以是赋值形式,查询成功的查询结果为1,查询失败的查询结果为0。
图4示意性示出了根据本公开另一实施例的确定目标数据库分片方法的流程图。
如图4所示,该方法包括操作S401~S402。
在操作S401,根据检索逻辑,确定路由规则。
根据本公开的实施例,在用户检索请求中包含指定的数据库分片信息的情况下,根据确定的检索逻辑类型确定该指定的数据库分片信息符合的路由规则。数据库分片能够记录在分布式缓存集群中进行查询操作的查询记录,路由规则用于确定存储查询记录的数据库分片。
在操作S402,基于路由规则,确定用户检索请求涉及的目标数据库分片。
根据本公开的实施例,在确定与用户检索请求有关的路由规则之后,进一步确定用户检索请求涉及的目标数据库分片。路由规则不仅能够确定存储查询记录的数据库分片,还能够确定用户检索请求涉及的目标数据库分片。
根据本公开的实施例,在检索逻辑为插入交易逻辑的情况下,采用rediscluster分布式缓存集群。由于用户在客户端进行的操作是有关于插入交易逻辑的,分布式缓存集群根据接收到的用户检索请求确定与该插入交易逻辑有关的路由规则。在确定路由规则的情况下,根据该路由规则确定存储查询记录的数据库分片,同时根据路由规则确定用户检索请求涉及的目标数据库。
图5示意性示出了根据本公开实施例的插入交易逻辑数据处理的方法流程图。
如图5所示,该方法包括操作S501~S506。
在操作S501,在确定检索逻辑为插入交易逻辑的情况下,在分布式缓存集群中查询用户检索数据,并申请第一预留位置。
根据本公开的实施例,分布式缓存集群具有缓存用户检索数据的功能,根据预设规则存储一定时间段的历史用户检索数据。用户检索请求包括用户检索数据,在响应于用户检索请求确定检索逻辑为插入交易逻辑的情况下,分布式缓存集群能够查询与插入交易逻辑有关的用户检索数据;在查询该用户检索数据的同时,在分布式缓存集群中申请第一预留位置,用于在分布式缓存集群中存储用户检索数据。
根据本公开的实施例,存储用户检索数据是一个双写过程,分布式缓存集群和数据库分片都能存储用户检索数据,分布式缓存集群缓存用户检索数据,数据库分片用于长时间存储用户检索数据。分布式缓存集群需要先存储用户检索数据,在分布式缓存集群存储成功的情况下,数据库分片才能执行存储用户检索数据的操作。
在操作S502,在查询到用户检索数据的情况下,删除第一预留位置。
根据本公开的实施例,在分布式缓存集群中查询到用户检索数据,表明当前需要进行插入操作的用户检索数据已经存在,该用户检索数据并非新创建的数据,不符合插入交易逻辑的数据设定。在查询到用户检索数据的情况下,在分布式缓存集群中判定插入失败,结束当前的插入任务,退出当前的检索逻辑。
在操作S503,在未查询到用户检索数据的情况下,将用户检索数据插入至第一预留位置。
根据本公开的实施例,在分布式缓存集群未查询到用户检索数据,表明在客户端执行操作的产生的用户检索数据符合插入交易逻辑的要求,不存在与该用户检索数据重复的数据。在未查询到用户检索数据的情况下,将用户检索数据插入到在分布式缓存集群中预先申请的第一预留位置。由于将用户检索数据插入第一预留位置会出现插入异常的情况,对应的插入操作的结果包括成功插入和未成功插入。
在操作S504,在未成功插入用户检索数据的情况下,删除第一预留位置。
根据本公开的实施例,在未成功插入用户检索数据的情况下,删除预先在分布式缓存集群中申请的第一预留位置,保证在插入失败的情况下,分布式缓存集群中存储的数据与数据库分片存储的数据一致。
在操作S505,在成功插入用户检索数据的情况下,向目标数据库分片发送日志信息。
根据本公开的实施例,在成功插入用户检索数据的情况下,向目标数据库分片发送日志信息,用于通知目标数据库分片在分布式缓存集群中的存储操作已经完成。
根据本公开的实施例,在向目标数据库分片发送日志信息的同时,分布式缓存集群还向其他的数据库发送日志信息,该数据库用于备用存储用户存储数据,包括核对服务器或补数服务器。该数据库能够在目标数据库分片数据出现异常的情况下,提供出现异常的数据。
在操作S506,基于日志信息,对存储于目标数据库分片的用户数据进行数据处理。
根据本公开的实施例,针对于插入交易逻辑,目标数据库分片接收到来自分布式缓存集群的日志信息后,根据日志信息在数据库中执行用户数据的插入操作。
例如,客户端为手机银行app,用户在该手机银行app进行的操作为创建新的账户,用户在客户端进行创建账户的操作会产生用户检索请求,该用户检索数据包括用户ID、申请信息,用户检索请求包括上述用户检索数据和请求创建账户的请求。rediscluster分布式缓存集群在接收到该用户检索请求的情况下,确定检索逻辑为插入交易逻辑。在分布式缓存集群中查询用户ID,并申请第一预留位置。在分布式缓存集群中查询到与当前用户ID重复的数据后,确定该用户已经创建过账户,删除第一预留位置,保证分布式缓存集群与数据库分片的数据一致性;在分布式缓存集群中未查询到与当前用户ID重复的数据,将该用户ID插入第一预留位置。在插入未成功的情况下,同样删除第一预留位置,保证数据一致性;在将用户ID插入第一预留位置之后,向目标数据库分片和补数服务器发送日志文件,目标数据库分片执行插入用户ID和申请信息的操作,补数服务器也存储用户ID和申请数据。
图6示意性示出了根据本公开实施例的更新交易逻辑数据处理的方法流程图。
如图6所示,该方法包括操作S601~S606。
在操作S601,在确定检索逻辑为更新交易逻辑的情况下,在分布式缓存集群中查询用户检索数据,并申请第二预留位置。
根据本公开的实施例,检索逻辑为更新交易逻辑表明用户在客户端进行的操作为更新数据,在更新交易逻辑的情况下,仍然需要在分布式缓存集群中查询当前的用户检索数据是否重复。需要注意的是,虽然更新交易逻辑是用于更新原有数据,但是此时在分布式缓存集群中进行查询的是当前数据是否存在重复,并非是历史数据中被更新的用户检索数据。
根据本公开的实施例,客户端为手机银行app,用户在客户端的操作为更新用户ID对应的手机号。分布式缓存集群响应于更新手机号的请求之后,确定检索逻辑为更新交易逻辑,然后在分布式缓存集群中查询用户申请更新的手机号信息是否重复,同时在分布式缓存集群中申请第二预留位置,用于存储用户检索数据。具体的,申请的第二预留位置用于存储本公开实施例中的更新手机号。
在操作S602,在查询到用户检索数据的情况下,删除第二预留位置。
根据本公开的实施例,在分布式缓存集群中查询到用户待更新的数据,表明当前的用户检索数据不符合更新交易逻辑要求的数据。删除预先申请的第二预留位置,保证分布式缓存集群和数据库分片中数据一致。
在操作S603,在未查询到用户检索数据的情况下,将用户检索数据更新至第二预留位置。
根据本公开的实施例,在未查询到用户检索数据的情况下,将待更新的用户检索数据更新存储到第二预留位置。由于将用户检索数据更新存储第二预留位置会出现异常的情况,对应的更新操作的结果包括成功更新和未成功更新。
在操作S604,在未成功更新用户检索数据的情况下,删除第二预留位置。
根据本公开的实施例,在未成功更新用户检索数据的情况下,删除预先在分布式缓存集群中申请的第二预留位置,保证在更新失败的情况下,分布式缓存集群中存储的数据与数据库分片存储的数据一致。
在操作S605,在成功更新用户检索数据的情况下,向目标数据库分片发送日志信息。
根据本公开的实施例,在成功更新用户检索数据的情况下,向目标数据库分片发送日志信息,用于通知目标数据库分片在分布式缓存集群中的更新存储操作已经完成。
在操作S606,基于日志信息,对存储于目标数据库分片的用户数据进行数据处理。
根据本公开的实施例,分布式缓存集群存储待更新的用户检索数据后,向目标数据库分片发送日志信息;目标数据库分片接收到日志信息后,将存储的原始用户数据更新为新的用户数据。例如,用户在客户端的操作为更新手机号,在分布式缓存集群成功更新存储新的用户手机号后,目标数据库分片将原始的手机号更新替换为新的用户手机号。
图7示意性示出了根据本公开实施例的更新交易逻辑中发送冻结标志的方法流程图。
如图7所示,该方法包括操作S701~S703。
在操作S701,在未查询到用户检索数据的情况下,冻结备用表,并向分布式缓存集群发送冻结标志。
根据本公开的实施例,备用表存储于备用数据库,用于记录有关备用数据库的数据库分片的操作记录。具体的,更新数据的操作需要在更新过程出现异常的情况下,原始数据也不会丢失,所以需要冻结备用数据库存储的备用表,在更新出现异常的情况下,采用备用数据库包含的数据进行恢复。针对于更新交易逻辑,在分布式缓存集群中申请第二预留位置,以及在分布式缓存集群未查询到用户检索数据的情况下,根据用户检索数据冻结备用表,并在执行冻结操作之后,向分布式缓存集群发送冻结标志。需要注意的是,只有备用表冻结成功的情况下,分布式缓存集群才能进行下一步操作,避免数据丢失的风险。
根据本公开的实施例,冻结标志的形式包括冻结报文、冻结日志等。
在操作S702,在发送冻结标志失败的情况下,删除第二预留位置。
根据本公开的实施例,在发送冻结标志失败的情况下,删除在分布式缓存集群中预先申请的第二预留位置,认定当前的更新操作失败,结束当前的更新交易逻辑,保证用户检索数据和数据库分片存储数据的一致性。
在操作S703,在发送冻结标志成功的情况下,将用户检索数据更新至第二预留位置。
根据本公开的实施例,在发送冻结标志成功的情况下,分布式缓存集群才能进行下一步操作,将新的用户检索数据更新到第二预留位置,用于缓存新的用户检索数据。
根据本公开的实施例,检索逻辑还包括删除交易逻辑。分布式缓存集群能够缓存用户检索数据,数据库分片能够存储用户检索数据。用户在客户端执行删除操作的时候,分布式缓存集群接收到用户检索请求确定检索逻辑;根据确定的删除交易逻辑执行查询过程,确定目标数据库分片,并向目标数据库分片发送日志信息;目标数据库分片基于日志信息删除用户检索请求中包含的数据之后,向分布式缓存集群返回结果;分布式缓存集群在接收到目标数据库分片成功删除对应数据的返回结果之后,再删除分布式缓存集群中存储的对应数据。先在目标数据库分片中执行删除操作,待数据库分片操作成功后再在分布式缓存集群中执行删除操作,保证在删除过程出现异常的情况下,用户数据不会丢失。
图8示意性示出了根据本公开实施例的补数处理的方法流程图。
如图8所示,该方法包括操作S801~S804。
在操作S801,在分布式缓存集群存在故障节点的情况下,确定故障节点的目标副节点。
根据本公开的实施例,分布式缓存集群包含多个节点,每个节点都包括一个主节点和多个副节点。客户端的读写操作都能够访问主节点,并且主节点和副节点之间的数据同步是异步同步。在分布式缓存集群中包含故障节点的情况下,确定出故障节点对应的主节点,根据分布式缓存集群自身的选举机制确定出该主节点对应的一个副节点,将该副节点作为新的主节点,该副节点就是目标副节点。
在操作S802,在确定目标副节点的情况下,向客户端返回报错信息并停止对外服务。
根据本公开的实施例,在确定用作新的主节点的目标副节点的情况下,分布式缓存集群主动向客户端返回报错信息,该故障节点停止对外服务,避免存在数据丢失异常。
在操作S803,在停止对外服务期间,分布式缓存集群向补数服务器发送补数信息。
根据本公开的实施例,在分布式缓存集群的故障节点停止对外服务期间,故障节点对应的数据库分片也停止对外服务,不提供读写功能。在停止对外服务期间,分布式缓存集群会向该故障节点对应的补数服务器发送补数信息,以便补数服务器提供出现缺失的数据。补数信息包括故障节点出现故障的时间段和出现故障的数据库分片。
在操作S804,基于补数信息,完成补数操作并恢复故障节点的服务。
根据本公开的实施例,补数服务器接收到来自分布式缓存集群的补数信息后,根据出现故障的时间段和出现故障的数据库分片从补数数据库中查回需要补数的数据,向分布式缓存集群中执行补数操作。在完成补数操作之后,将目标副节点作为主节点恢复故障节点的服务。
根据本公开的实施例,主节点和副节点的数据同步为异步同步,在主节点切换到副节点的情况下会存在数据丢失的情况。本公开通过修改补数处理,解决主节点和副节点进行异步同步产生的数据丢失问题,保证分布式架构的强一致性。
图9示意性示出了根据本公开实施例的补数处理过程中向访问服务器返回信息的方法流程图。
如图9所示,该方法包括操作S901~S902。
在操作S901,在未完成补数操作的情况下,向访问故障节点的服务器返回报错信息。
根据本公开的实施例,在分布式缓存集群的故障节点未完成部署操作的情况下,故障节点不提供读写服务。在有服务器访问该故障节点的情况下,分布式缓存集群会响应于该服务器的访问请求,向该服务器返回报错信息。响应于访问服务器的访问操作返回的报错信息与分布式缓存集群主动提供的报错信息相同。
根据本公开的实施例,访问故障节点的服务器在收到来自分布式缓存集群的报错信息的情况下,该服务器会重试三次访问该故障节点。在服务器重试访问故障节点三次都未成功的情况下,服务器会直接访问所有的数据库分片,调用涉及服务器请求的信息,并且在服务器从数据库分片中获取信息的时间内,数据库分片仅提供读服务,不提供写入服务。
在操作S902,在完成补数操作的情况下,向访问故障节点的服务器返回对应信息。
根据本公开的实施例,在完成补数操作的情况下,分布式缓存集群会根据服务器的访问请求返回对应的信息。服务器在收到报错信息的情况下会重试三次访问,重试访问期间,在分布式缓存集群完成补数操作的情况下,分布式缓存集群会响应与服务器的访问请求,返回对应的信息。
根据本公开的实施例,服务器在分布式缓存集群rediscluster进行补数操作期间访问rediscluster,rediscluster会向服务器返回报错信息,服务器进行了两次重试,rediscluster仍然返回报错信息。在服务器进行两次重试之后、第三次重试之前,rediscluster完成了补数操作,在服务器进行第三次重试的情况下,rediscluster返回服务器请求的信息;在服务器三次重试都返回报错信息的情况下,服务器会放弃访问rediscluster,前往全部数据库进行查询,调用对应数据。
图10示意性示出了根据本公开实施例的核对分布式缓存集群的数据的方法流程图。
如图10所示,该方法包括操作S1001~S1004。
在操作S1001,基于分布式缓存集群,确定预设时段内的增量数据。
根据本公开的实施例,分布式缓存集群和数据库分片都能够存储数据,但是数据库分片的存储过程和分布式缓存集群的读写操作不在同一事务中。在分布式缓存中存储的数据与数据库分片中存储的数据不一致的情况下,需要对分布式缓存集群中的数据进行核对,更新分布式缓存集群。
根据本公开的实施例,在预设时段内新增的数据改动记录存储在分布式缓存集群中,基于分布式缓存集群能够确定在该预设时段内的增量数据。例如,预设时段为一天,采用核对服务器扫描分布式缓存集群每日新增的增量数据,确定在当天内的增量数据。
在操作S1002,基于数据库日志,确定预设时段内的删除数据。
根据本公开的实施例,数据处理过程还包括删除数据的操作,删除数据的操作记录存储在数据库分片的数据库日志中,具体的,数据库日志的形式包括日志表。根据数据库日志信息,确定数据库分片中与存储增量数据相同预设时段内的删除数据。
在操作S1003,基于数据表,确定增量数据与数据表的记录状态以及删除数据与数据表的记录状态。
根据本公开的实施例,分布式缓存集群用于存储增量数据,数据库用于存储删除数据,指定的核对服务器对分布式缓存集群执行数据核对操作,核对服务器的数据存储于核对数据库。核对数据库能够存储所有的操作记录,包括增量数据和删除数据,其中,核对数据库以数据表的形式记录增量数据和删除数据。根据核对数据库中数据表存储的增量数据和分布式缓存集群存储的增量数据,确定增量数据与数据表的记录状态是否一致;根据核对数据库中数据表存储的删除数据和数据库分片存储的删除数据,确定删除数据与数据表的记录状态是否一致。在增量数据和删除数据的记录状态都与数据表记录一致的情况下,分布式缓存集群存储的数据与数据库分片存储的数据一致,不需要更新分布式缓存集群。
在操作S1004,在增量数据与数据表的记录状态以及删除数据与数据表的记录状态均不一致的情况下,根据数据表更新分布式缓存集群。
根据本公开的实施例,增量数据与数据表的记录状态以及删除数据与数据表的记录状态均不一致,表明当前分布式缓存集群中存在多于数据库分片的数据,该多出的部分为分布式缓存集群在执行操作中产生的脏数据,需要被清除。在记录状态均不一致的情况下,根据核对数据库中数据表记录的操作记录更新分布式缓存集群,删除分布式缓存集群中存在的多余脏数据。
本公开通过修改检索逻辑,在分布式缓存集群无法检索数据的情况下,保证分布式缓存集群存储的数据与数据库分片数据的强一致性;通过设置核对操作,在预设时段内进一步保障分布式缓存集群存储数据与数据库分片存储数据的强一致性。本公开通过采用分布式缓存集群构建关于Oracle数据库的分布式架构,在继承Oracle数据库高性能的优点的同时,增加系统水平扩展能力,满足用户高并发的访问需求;并且,针对Oracle数据库的分布式改造不需要对Oracle数据库进行转型,节省应用系统代码重构成本,减小由于核心数据库宕机造成的影响。
此外,本公开还对分布式缓存集群进行丰富和完善,修改rediscluster补数处理机制和核对处理机制,保证分布式缓存集群数据的强一致性,支持Oracle数据库的分布式架构。
基于上述数据处理方法,本公开还提供了一种数据处理装置。以下将结合图11对该装置进行详细描述。
图11示意性示出了根据本公开实施例的数据处理装置的结构框图。
如图11所示,该实施例的数据处理装置1100包括接收模块1101、第一确定模块1102、第二确定模块1103和数据处理模块1104。
接收模块1101用于接收来自客户端的用户检索请求。在一实施例中,接收模块1101可以用于执行前文描述的操作S201,在此不再赘述。
第一确定模块1102用于基于用户检索请求,确定检索逻辑,检索逻辑为根据分布式缓存集群修改的交易逻辑。在一实施例中,第一确定模块1102可以用于执行前文描述的操作S1102,在此不再赘述。
第二确定模块1103用于基于检索逻辑,在分布式缓存集群中确定用户检索请求涉及的目标数据库分片。在一实施例中,第二确定模块1103可以用于执行前文描述的操作S203,在此不再赘述。
数据处理模块1104用于基于检索逻辑,对存储于目标数据库分片的用户数据进行数据处理。在一实施例中,数据处理模块1104可以用于执行前文描述的操作S204,在此不再赘述。
根据本公开的实施例,第二确定模块1103包括检索单元、第一确定单元、第一存储单元和第二确定单元。
检索单元用于根据分布式缓存集群,检索用户检索请求涉及的数据库分片。在一实施例中,检索单元可以用于执行前文描述的操作S301,在此不再赘述。
第一确定单元用于在检索到数据库分片的情况下,在数据库分片中指定的数据节点存储查询记录,并将数据库分片确定为目标数据库分片。在一实施例中,第一确定单元可以用于执行前文描述的操作S302,在此不再赘述。
第一存储单元用于在未检索到数据库分片的情况下,在全部数据库分片中全部的数据节点存储查询记录。在一实施例中,第一存储单元可以用于执行前文描述的操作S303,在此不再赘述。
第二确定单元用于在存储查询记录的过程中,确定用户检索请求涉及的数据库分片,并将数据库分片确定为目标数据库分片。在一实施例中,第二确定单元可以用于执行前文描述的操作S304,在此不再赘述。
根据本公开的实施例,第二确定模块1103包括第三确定单元和第四确定单元。
第三确定单元用于根据检索逻辑,确定路由规则,路由规则用于确定存储查询记录的数据库分片。在一实施例中,第三确定单元可以用于执行前文描述的操作S401,在此不再赘述。
第四确定单元用于基于路由规则,确定用户检索请求涉及的目标数据库分片。在一实施例中,第四确定单元可以用于执行前文描述的操作S402,在此不再赘述。
根据本公开的实施例,数据处理模块1104包括第一查询单元、第一删除单元、插入单元、第二删除单元、第一发送单元和第一数据处理单元。
第一查询单元用于在确定检索逻辑为插入交易逻辑的情况下,在分布式缓存集群中查询用户检索数据,并申请第一预留位置。在一实施例中,第一查询单元可以用于执行前文描述的操作S501,在此不再赘述。
第一删除单元用于在查询到用户检索数据的情况下,删除第一预留位置。在一实施例中,第一删除单元可以用于执行前文描述的操作S502,在此不再赘述。
插入单元用于在未查询到用户检索数据的情况下,将用户检索数据插入至第一预留位置。在一实施例中,插入单元可以用于执行前文描述的操作S503,在此不再赘述。
第二删除单元用于在未成功插入用户检索数据的情况下,删除第一预留位置。在一实施例中,第二删除单元可以用于执行前文描述的操作S504,在此不再赘述。
第一发送单元用于在成功插入用户检索数据的情况下,向目标数据库分片发送日志信息。在一实施例中,第一发送单元可以用于执行前文描述的操作S505,在此不再赘述。
第一数据处理单元用于基于日志信息,对存储于目标数据库分片的用户数据进行数据处理。在一实施例中,第一数据处理单元可以用于执行前文描述的操作S506,在此不再赘述。
根据本公开的实施例,数据处理模块1104还包括第二查询单元、第三删除单元、第一更新单元、第四删除单元、第二发送单元和第二数据处理单元。
第二查询单元用于在确定检索逻辑为更新交易逻辑的情况下,在分布式缓存集群中查询用户检索数据,并申请第二预留位置。在一实施例中,第二查询单元可以用于执行前文描述的操作S601,在此不再赘述。
第三删除单元用于在查询到用户检索数据的情况下,删除第二预留位置。在一实施例中,第三删除单元可以用于执行前文描述的操作S602,在此不再赘述。
第一更新单元用于在未查询到用户检索数据的情况下,将用户检索数据更新至第二预留位置。在一实施例中,第一更新单元可以用于执行前文描述的操作S603,在此不再赘述。
第四删除单元用于在未成功更新用户检索数据的情况下,删除第二预留位置。在一实施例中,第四删除单元可以用于执行前文描述的操作S604,在此不再赘述。
第二发送单元用于在成功更新用户检索数据的情况下,向目标数据库分片发送日志信息。在一实施例中,第二发送单元可以用于执行前文描述的操作S605,在此不再赘述。
第二数据处理单元用于基于日志信息,对存储于目标数据库分片的用户数据进行数据处理。在一实施例中,第二数据处理单元可以用于执行前文描述的操作S606,在此不再赘述。
根据本公开的实施例,数据处理模块1104还包括冻结单元、第五删除单元和第二更新单元。
冻结单元用于在未查询到用户检索数据的情况下,冻结备用表,并向分布式缓存集群发送冻结标志,其中,备用表存储于备用数据库,用于记录备用数据库涉及的数据库分片的操作记录。在一实施例中,冻结单元可以用于执行前文描述的操作S701,在此不再赘述。
第五删除单元用于在发送冻结标志失败的情况下,删除第二预留位置。在一实施例中,第五删除单元可以用于执行前文描述的操作S702,在此不再赘述。
第二更新单元用于在发送冻结标志成功的情况下,将用户检索数据更新至第二预留位置。在一实施例中,第二更新单元可以用于执行前文描述的操作S703,在此不再赘述。
根据本公开的实施例,数据处理模块1104还包括第一故障确定单元、报错单元、补数信息发送单元和恢复单元。
第一故障确定单元用于在分布式缓存集群存在故障节点的情况下,确定故障节点的目标副节点。在一实施例中,第一故障确定单元可以用于执行前文描述的操作S801,在此不再赘述。
报错单元用于在确定目标副节点的情况下,向客户端返回报错信息并停止对外服务。在一实施例中,报错单元可以用于执行前文描述的操作S802,在此不再赘述。
补数信息发送单元用于在停止对外服务期间,分布式缓存集群向补数服务器发送补数信息,补数信息包括故障节点出现故障的时间段和出现故障的数据库分片。在一实施例中,补数信息发送单元可以用于执行前文描述的操作S803,在此不再赘述。
恢复单元用于基于补数信息,完成补数操作并恢复故障节点的服务。在一实施例中,恢复单元可以用于执行前文描述的操作S804,在此不再赘述。
根据本公开的实施例,数据处理模块1104还包括第二故障确定单元和信息确定单元。
第二故障确定单元用于在未完成补数操作的情况下,向访问故障节点的服务器返回报错信息。在一实施例中,第二故障确定单元可以用于执行前文描述的操作S901,在此不再赘述。
信息确定单元用于在完成补数操作的情况下,向访问故障节点的服务器返回对应信息。在一实施例中,信息确定单元可以用于执行前文描述的操作S902,在此不再赘述。
根据本公开的实施例,数据处理模块1104还包括增量数据确定单元、删除数据确定单元、记录状态确定单元和核对更新单元。
增量数据确定单元用于基于分布式缓存集群,确定预设时段内的增量数据。在一实施例中,增量数据确定单元可以用于执行前文描述的操作S1001,在此不再赘述。
删除数据确定单元用于基于数据库日志,确定预设时段内的删除数据。在一实施例中,删除数据确定单元可以用于执行前文描述的操作S1002,在此不再赘述。
记录状态确定单元用于基于数据表,确定增量数据与数据表的记录状态以及删除数据与数据表的记录状态,数据表存储于核对数据库。在一实施例中,记录状态确定单元可以用于执行前文描述的操作S1003,在此不再赘述。
核对更新单元用于在增量数据与数据表的记录状态以及删除数据与数据表的记录状态均不一致的情况下,根据数据表更新分布式缓存集群。在一实施例中,核对更新单元可以用于执行前文描述的操作S1004,在此不再赘述。
根据本公开的实施例,接收模块1101、第一确定模块1102、第二确定模块1103、数据处理模块1104、检索单元、第一确定单元、第一存储单元和第二确定单元、第三确定单元、第四确定单元、第一查询单元、第一删除单元、插入单元、第二删除单元、第一发送单元、第一数据处理单元、第二查询单元、第三删除单元、第一更新单元、第四删除单元、第二发送单元、第二数据处理单元、冻结单元、第五删除单元、第二更新单元、第一故障确定单元、报错单元、补数信息发送单元、恢复单元、第二故障确定单元、信息确定单元、增量数据确定单元、删除数据确定单元、记录状态确定单元和核对更新单元中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,接收模块1101、第一确定模块1102、第二确定模块1103、数据处理模块1104、检索单元、第一确定单元、第一存储单元和第二确定单元、第三确定单元、第四确定单元、第一查询单元、第一删除单元、插入单元、第二删除单元、第一发送单元、第一数据处理单元、第二查询单元、第三删除单元、第一更新单元、第四删除单元、第二发送单元、第二数据处理单元、冻结单元、第五删除单元、第二更新单元、第一故障确定单元、报错单元、补数信息发送单元、恢复单元、第二故障确定单元、信息确定单元、增量数据确定单元、删除数据确定单元、记录状态确定单元和核对更新单元中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,接收模块1101、第一确定模块1102、第二确定模块1103、数据处理模块1104、检索单元、第一确定单元、第一存储单元和第二确定单元、第三确定单元、第四确定单元、第一查询单元、第一删除单元、插入单元、第二删除单元、第一发送单元、第一数据处理单元、第二查询单元、第三删除单元、第一更新单元、第四删除单元、第二发送单元、第二数据处理单元、冻结单元、第五删除单元、第二更新单元、第一故障确定单元、报错单元、补数信息发送单元、恢复单元、第二故障确定单元、信息确定单元、增量数据确定单元、删除数据确定单元、记录状态确定单元和核对更新单元中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图12示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的方框图。
如图12所示,根据本公开实施例的电子设备1200包括处理器1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行各种适当的动作和处理。处理器1201例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1201还可以包括用于缓存用途的板载存储器。处理器1201可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1203中,存储有电子设备1200操作所需的各种程序和数据。处理器1201、ROM 1202以及RAM 1203通过总线1204彼此相连。处理器1201通过执行ROM 1202和/或RAM1203中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1202和RAM 1203以外的一个或多个存储器中。处理器1201也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备1200还可以包括输入/输出(I/O)接口1205,输入/输出(I/O)接口1205也连接至总线1204。电子设备1200还可以包括连接至I/O接口1205的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1202和/或RAM 1203和/或ROM 1202和RAM 1203以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的数据处理方法。
在该计算机程序被处理器1201执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1209被下载和安装,和/或从可拆卸介质1211被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被处理器1201执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (14)

1.一种数据处理方法,包括:
接收来自客户端的用户检索请求;
响应于所述用户检索请求,确定检索逻辑,所述检索逻辑为根据分布式缓存集群修改的交易逻辑;
基于所述检索逻辑,在所述分布式缓存集群中确定所述用户检索请求涉及的目标数据库分片;
基于所述检索逻辑,对存储于所述目标数据库分片的用户数据进行数据处理。
2.根据权利要求1所述的方法,其中,基于所述检索逻辑,在所述分布式缓存集群中确定所述用户检索请求涉及的目标数据库分片包括:
根据所述分布式缓存集群,检索所述用户检索请求涉及的数据库分片;
在检索到所述数据库分片的情况下,在所述数据库分片中指定的数据节点存储查询记录,并将所述数据库分片确定为目标数据库分片;
在未检索到所述数据库分片的情况下,在全部数据库分片中全部的数据节点存储查询记录;以及
在所述存储查询记录的过程中,确定所述用户检索请求涉及的数据库分片,并将所述数据库分片确定为目标数据库分片。
3.根据权利要求1所述的方法,其中,基于所述检索逻辑,在所述分布式缓存集群中确定所述用户检索请求涉及的目标数据库分片包括:
根据所述检索逻辑,确定路由规则,所述路由规则用于确定存储查询记录的数据库分片;以及
基于所述路由规则,确定所述用户检索请求涉及的目标数据库分片。
4.根据权利要求1所述的方法,其中,所述用户检索请求包括用户检索数据;所述检索逻辑包括查询交易逻辑、插入交易逻辑、更新交易逻辑和删除交易逻辑中的至少一个。
5.根据权利要求4所述的方法,其中,基于所述检索逻辑,对存储于所述目标数据库分片的用户数据进行数据处理包括:
在确定所述检索逻辑为插入交易逻辑的情况下,在所述分布式缓存集群中查询所述用户检索数据,并申请第一预留位置;
在查询到所述用户检索数据的情况下,删除所述第一预留位置;
在未查询到所述用户检索数据的情况下,将所述用户检索数据插入至所述第一预留位置;
在未成功插入所述用户检索数据的情况下,删除所述第一预留位置;
在成功插入所述用户检索数据的情况下,向所述目标数据库分片发送日志信息;以及
基于所述日志信息,对存储于所述目标数据库分片的用户数据进行数据处理。
6.根据权利要求4所述的方法,其中,基于所述检索逻辑,对存储于所述目标数据库分片的用户数据进行数据处理包括:
在确定检索逻辑为更新交易逻辑的情况下,在所述分布式缓存集群中查询所述用户检索数据,并申请第二预留位置;
在查询到所述用户检索数据的情况下,删除所述第二预留位置;
在未查询到所述用户检索数据的情况下,将所述用户检索数据更新至所述第二预留位置;
在未成功更新所述用户检索数据的情况下,删除所述第二预留位置;
在成功更新所述用户检索数据的情况下,向所述目标数据库分片发送日志信息;以及
基于所述日志信息,对存储于所述目标数据库分片的用户数据进行数据处理。
7.根据权利要求6所述的方法,还包括:
在未查询到所述用户检索数据的情况下,冻结备用表,并向所述分布式缓存集群发送冻结标志,其中,所述备用表存储于备用数据库,用于记录所述备用数据库涉及的数据库分片的操作记录;
在发送冻结标志失败的情况下,删除所述第二预留位置;以及
在发送冻结标志成功的情况下,将所述用户检索数据更新至所述第二预留位置。
8.根据权利要求1所述的方法,其中,所述分布式缓存集群还包括补数处理:
在所述分布式缓存集群存在故障节点的情况下,确定所述故障节点的目标副节点;
在确定所述目标副节点的情况下,向所述客户端返回报错信息并停止对外服务;
在停止对外服务期间,所述分布式缓存集群向补数服务器发送补数信息,所述补数信息包括所述故障节点出现故障的时间段和出现故障的数据库分片;以及
基于所述补数信息,完成补数操作并恢复故障节点的服务。
9.根据权利要求8所述的方法,还包括:
在未完成补数操作的情况下,向访问所述故障节点的服务器返回所述报错信息;以及
在完成补数操作的情况下,向访问所述故障节点的服务器返回对应信息。
10.根据权利要求1所述的方法,所述分布式缓存集群还包括:
基于所述分布式缓存集群,确定预设时段内的增量数据;
基于数据库日志,确定所述预设时段内的删除数据;
基于数据表,确定所述增量数据与所述数据表的记录状态以及所述删除数据与所述数据表的记录状态,所述数据表存储于核对数据库;以及
在所述增量数据与所述数据表的记录状态以及所述删除数据与所述数据表的记录状态均不一致的情况下,根据所述数据表更新所述分布式缓存集群。
11.一种数据处理装置,包括:
接收模块,用于接收来自客户端的用户检索请求;
第一确定模块,用于基于所述用户检索请求,确定检索逻辑,所述检索逻辑为根据分布式缓存集群修改的交易逻辑;
第二确定模块,用于基于所述检索逻辑,在所述分布式缓存集群中确定所述用户检索请求涉及的目标数据库分片;以及
数据处理模块,用于基于所述检索逻辑,对存储于所述目标数据库分片的用户数据进行数据处理。
12.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~10中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~10中任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~10中任一项所述的方法。
CN202210172904.7A 2022-02-24 2022-02-24 数据处理方法、装置、设备及介质 Pending CN114547108A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210172904.7A CN114547108A (zh) 2022-02-24 2022-02-24 数据处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210172904.7A CN114547108A (zh) 2022-02-24 2022-02-24 数据处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114547108A true CN114547108A (zh) 2022-05-27

Family

ID=81678129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210172904.7A Pending CN114547108A (zh) 2022-02-24 2022-02-24 数据处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114547108A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023241676A1 (zh) * 2022-06-16 2023-12-21 华为云计算技术有限公司 一种内存池的操作方法以及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023241676A1 (zh) * 2022-06-16 2023-12-21 华为云计算技术有限公司 一种内存池的操作方法以及装置

Similar Documents

Publication Publication Date Title
US11327799B2 (en) Dynamic allocation of worker nodes for distributed replication
US11010240B2 (en) Tracking status and restarting distributed replication
US20200348852A1 (en) Distributed object replication architecture
US11349915B2 (en) Distributed replication and deduplication of an object from a source site to a destination site
CN101090401B (zh) 一种群集环境下的数据缓存方法及系统
US7640276B2 (en) Backup system, program and backup method
JP2019519025A (ja) 分散システムにおける範囲の分割および移動
CN104813276A (zh) 从备份系统流式恢复数据库
CN104252466A (zh) 流计算处理方法、设备和系统
CN108762668B (zh) 一种处理写入冲突的方法及装置
CN103037004A (zh) 云存储系统操作的实现方法和装置
US10650013B2 (en) Access operation request management
US11263080B2 (en) Method, apparatus and computer program product for managing cache
CN104750757B (zh) 一种基于HBase的数据存储方法和设备
RU2711348C1 (ru) Способ и система для обработки запросов в распределенной базе данных
CN115599747A (zh) 一种分布式存储系统的元数据同步方法、系统及设备
CN111400350A (zh) 配置数据读取方法、系统、电子设备和存储介质
CN114547108A (zh) 数据处理方法、装置、设备及介质
US11962686B2 (en) Encrypting intermediate data under group-level encryption
US7949632B2 (en) Database-rearranging program, database-rearranging method, and database-rearranging apparatus
US11880495B2 (en) Processing log entries under group-level encryption
US11416468B2 (en) Active-active system index management
US11475159B2 (en) System and method for efficient user-level based deletions of backup data
US11899811B2 (en) Processing data pages under group-level encryption
US20230188324A1 (en) Initialization vector handling under group-level encryption

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination