CN115454958A - 基于人工智能的数据处理方法、装置、设备、系统及介质 - Google Patents
基于人工智能的数据处理方法、装置、设备、系统及介质 Download PDFInfo
- Publication number
- CN115454958A CN115454958A CN202211122985.6A CN202211122985A CN115454958A CN 115454958 A CN115454958 A CN 115454958A CN 202211122985 A CN202211122985 A CN 202211122985A CN 115454958 A CN115454958 A CN 115454958A
- Authority
- CN
- China
- Prior art keywords
- node
- copy
- replica
- abnormal
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 36
- 238000003672 processing method Methods 0.000 title abstract description 16
- 230000002159 abnormal effect Effects 0.000 claims abstract description 106
- 238000000034 method Methods 0.000 claims abstract description 70
- 238000012545 processing Methods 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims description 23
- 230000002547 anomalous effect Effects 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims 1
- 230000010076 replication Effects 0.000 description 25
- 238000005516 engineering process Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 238000012797 qualification Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003924 mental process Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/184—Distributed file systems implemented as replicated file system
- G06F16/1844—Management specifically adapted to replicated file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1805—Append-only file systems, e.g. using logs or journals to store data
- G06F16/1815—Journaling file systems
Abstract
本公开提供了基于人工智能的数据处理方法、装置、设备、系统及介质,涉及人工智能技术领域,尤其涉及云计算、云存储和分布式存储技术领域,可应用在智能云场景下。具体实现方案为:通过复制组中的主副本节点接收写请求,针对复制组中的各副本节点,尝试写入写请求对应的日志数据,其中,复制组中包含异常副本节点,异常副本节点中包含携带预设错误标记的数据块,预设错误标记用于表示所属数据块已发生过数据读取错误,在确定复制组中的预设数量的副本节点完成日志数据的写入后,返回写请求对应的写入成功信息。通过采用上述技术方案,有效保证分布式存储系统的写可用性,进而使得分布式存储系统为人工智能场景的相关应用提供可靠支持。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及云计算、云存储和分布式存储技术领域,可应用在智能云场景下。
背景技术
读写高可用性是分布式存储系统的重要内容,分布式存储系统的数据通常采用多个副本(Replica)构建一个复制组来达到高可靠,每个复制组包含一个主副本和至少两个从副本。在进行写操作时,多数副本(一般为大于总副本数的一半)写成功即认为写成功,也就是说其中少数副本发生故障一般不影响写操作。
然而,复制组的多数副本所在节点(又称副本节点)的磁盘因发生静默错误而读取失败时,造成复制组进入不可用状态;或者,副本节点发生故障,在补充副本过程中,读取磁盘时发生静默错误,故障副本和静默错误副本总和达到复制组的多数副本时,造成复制组进入不可用(quorum dead)状态。复制组进入不可用状态后,导致写无法继续进行,影响写可用性。
发明内容
本公开提供了一种基于人工智能的数据处理方法、装置、设备、系统以及存储介质。
根据本公开的一方面,提供了一种基于人工智能的数据处理方法,包括:
通过复制组中的主副本节点接收写请求,针对所述复制组中的各副本节点,尝试写入所述写请求对应的日志数据,其中,所述复制组中的各副本节点中包含异常副本节点,所述异常副本节点中包含携带预设错误标记的数据块,所述预设错误标记用于表示所属数据块已发生过数据读取错误;
通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,返回所述写请求对应的写入成功信息,其中,所述预设数量大于或等于所述复制组中的副本节点总数的一半。
根据本公开的另一方面,提供了一种基于人工智能的数据处理装置,包括:
日志数据写入模块,用于通过复制组中的主副本节点接收写请求,针对所述复制组中的各副本节点,尝试写入所述写请求对应的日志数据,其中,所述复制组中的各副本节点中包含异常副本节点,所述异常副本节点中包含携带预设错误标记的数据块,所述预设错误标记用于表示所属数据块已发生过数据读取错误;
写入成功返回模块,用于通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,返回所述写请求对应的写入成功信息,其中,所述预设数量大于或等于所述复制组中的副本节点总数的一半。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例所述的方法中的相应步骤。
根据本公开的另一方面,提供了一种分布式存储系统,包括主机和至少一个复制组,每个所述复制组中包括用于存储主副本的主副本节点和用于存储从副本的从副本节点;所述分布式存储系统用于执行本公开实施例所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开实施例所述的方法中的相应步骤。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任意实施例所述的方法中的相应步骤。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例提供的一种基于人工智能的数据处理方法的流程图;
图2是根据本公开实施例提供的另一种基于人工智能的数据处理方法的流程图;
图3是根据本公开实施例提供的又一种基于人工智能的数据处理方法的流程图;
图4是根据本公开实施例提供的一种基于人工智能的数据处理装置的结构示意图;
图5是用来实现本公开实施例的基于人工智能的数据处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本公开实施例提供的一种基于人工智能的数据处理方法的流程图,本公开实施例可适用于基于人工智能的分布式存储系统中进行数据处理的情况,具体可应用于智能云场景。该方法可由一种数据处理装置来执行,该装置可采用硬件和/或软件的方式来实现,可配置于分布式存储系统中,具体可以配置于一个或多个电子设备中。参考图1,该方法具体包括如下:
S101、通过复制组中的主副本节点接收写请求,针对所述复制组中的各副本节点,尝试写入所述写请求对应的日志数据,其中,所述复制组中的各副本节点中包含异常副本节点,所述异常副本节点中包含携带预设错误标记的数据块,所述预设错误标记用于表示所属数据块已发生过数据读取错误;
S102、通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,返回所述写请求对应的写入成功信息,其中,所述预设数量大于或等于所述复制组中的副本节点总数的一半。
本公开实施例中,分布式存储系统可以是基于分布式一致性协议(如Raft)协议的分布式存储系统,具体可应用于智能云场景下。分布式存储系统中可以包括主机(Mater)和至少一个复制组(如Raft Replica Rroup),每个所述复制组中包括多个副本节点,具体包含不同类型的副本节点,如包括用于存储主副本的主副本节点(Leader,可理解为主进程)和用于存储从副本的从副本节点(Follwer,可理解为从进程),主副本节点一般在同一时刻的数量为一个,从副本节点的数量为至少一个,一般为至少两个,常见的部署方式为1个主副本和2个从副本,共3个副本,也即,一个复制组中可以包括1个主副本节点和2个从副本节点,共3个副本。其中,一个副本(Replica)中可以包括多个数据块(block),也即一个副本节点可以用于存储同一个副本中的多个数据块。一个副本节点可以对应一个电子设备,该电子设备具体可以是计算机设备或服务器等,也即,一个电子设备可以被配置为复制组中的一个副本节点,具体可以是主副本节点或从副本节点,且在分布式存储系统的运行过程中,同一电子设备所被配置的同一复制组中的副本节点的类型可能发生变化。
其中,写请求具体可以是数据写请求,一般由用户设备(可理解为客户端)发起,用户设备可以直接向主副本节点发送写请求,也可以发送至从副本节点,并由从副本节点转发至主副本节点。通过复制组中的主副本节点接收写请求,可包括,由主副本节点接收用户设备发送的写请求,和/或,由主副本节点接收从副本节点转发的来自用户设备的写请求。在人工智能相关场景中,写请求可以包括针对如样本数据、样本标签数据、模型结构数据、模型权重参数数据或损失函数数据等相关数据的写请求。
示例性的,在主副本节点接收到写请求后,针对该写请求进行相应处理,处理过程可包括写日志(如Raft日志)和应用(apply)日志等。写日志可以理解为向副本节点中写入日志数据,具体可以写入副本节点中的日志空间,当复制组中的多数的副本节点完成日志数据的写入后,可认为满足写入成功条件,也即日志数据已安全复制,可以返回写入成功信息,以对写请求进行响应。其中,上述多数可记为预设数量,预设数量大于或等于复制组中的副本节点总数的一半,以复制组中包含3个副本节点为例,预设数量通常为2。
相关技术中,若某个副本节点中的任一数据块已发生过数据读取错误,如发生磁盘读取数据错误(input/ouput error),该副本节点会被标记为不可用副本节点。主副本节点在进行日志数据写入操作时,会将不可用副本节点排除,也即,不会尝试向不可用副本节点中写入日志数据。这样,具备进行日志数据写入资格的副本节点数量会减少,能够满足写入成功条件的概率会降低,当不可用副本节点数量达到上述预设数量时,则无法实现成功写入,导致写请求失败,严重影响分布式存储系统的写可用性,进而影响人工智能场景下的相关应用,如数据预处理或模型训练等。
本公开实施例中,若某个副本节点中的数据块已发生过数据读取错误,如发生磁盘读取数据错误,但此时该副本节点中的其他数据块可能是正常的,因此该副本节点不会被标记为不可用副本节点,而是成为本公开实施例中的异常副本节点(可以是从副本节点,也可以是主副本节点),异常副本节点中已发生过数据读取错误的数据块携带有预设错误标记,该预设错误标记可以由该异常副本节点在确定数据块发生读取错误时自行添加,也可由主副本节点添加,预设错误标记的具体表现形式不做限定。在主副本节点接收到写请求后,针对所处的复制组中的各副本节点尝试写入写请求对应的日志数据,此处的各副本节点包括异常副本节点,也即,即使副本节点中的某个数据块已发生过数据读取错误,也不会使得该副本节点失去日志数据写入资格,主副本节点依然会尝试将日志数据写入该副本节点。本公开实施例中,具备进行日志数据写入资格的副本节点数量不会因为某个副本节点中的数据块发生数据读取错误而减少,避免降低满足写入成功条件的概率,当异常副本节点数量达到上述预设数量时,也存在较大概率能够满足写入成功条件,实现成功写入,以对写请求正常响应,有效保证分布式存储系统的写可用性,进而保证人工智能场景下的相关应用(如数据预处理或模型训练等)的正常进行。
示例性的,在确定复制组中的预设数量的副本节点完成日志数据的写入后,也即多数副本节点中已成功写入日志数据,则可返回写请求对应的写入成功信息,以对写请求正常响应。
本公开实施例提供的技术方案,通过复制组中的主副本节点接收写请求,针对复制组中的各副本节点,尝试写入写请求对应的日志数据,其中,复制组中包含异常副本节点,异常副本节点中包含携带预设错误标记的数据块,预设错误标记用于表示所属数据块已发生过数据读取错误,在确定复制组中的预设数量的副本节点完成日志数据的写入后,返回写请求对应的写入成功信息,其中,预设数量大于或等于复制组中的副本节点总数的一半。通过采用上述技术方案,在复制组中某个副本节点中存在已发生过数据读取错误的数据块的情况下,该副本节点不会丧失主副本节点处理写请求过程中的日志数据写入资格,可提高对写请求正常响应的概率,有效保证分布式存储系统的写可用性,进而使得分布式存储系统为人工智能场景的相关应用提供可靠支持。
本公开实施例中,在复制组中存在异常副本节点的情况下,可以针对复制组进行修复处理,具体修复方式不做限定,分布式存储系统的读写频率通常较高,在修复完成之前,若主副本节点接收到写请求,可以基于上述技术方案保证写可用性。
在复制组的工作过程中,通常需要保持主副本节点和从副本节点之间的心跳,具体可以是由主副本节点以预设频率向从副本节点发送心跳信息(如心跳包),从副本节点接收到心跳信息后,确认主副本节点正常,并向主副本节点返回心跳响应,主副本节点收到心跳响应后确定从副本节点正常,未成为不可用副本节点,已成为不可用副本节点的副本节点,则不会向主副本节点返回心跳响应,当不可用副本节点达到预设数量时,因心跳无法维持而使得复制组进入不可用状态。
在一种可选实施方式中,还包括:在所述异常副本节点为从副本节点的情况下,通过所述异常副本节点维持与主副本节点之间的心跳;在所述异常副本节点为主副本节点的情况下,通过所述异常副本节点维持与从副本节点之间的心跳。这样设置的好处在于,在某副本节点成为异常副本节点后,依然能够保持主副本节点和从副本节点之间的心跳,避免复制组进入不可用状态,进一步保证写可用性。
需要说明的是,由于上述修复处理需要消耗的时长不确定,心跳信息发送的预设频率也可自由设定,可能在发送下一次心跳信息之前,异常副本节点已被修复或剔除,上述心跳保持的步骤也可能未执行。
在处理写请求的过程中,通常还包括应用日志的相关步骤,具体可以在返回写请求对应的写入成功信息之后或同步进行。应用日志可以理解为将已成功写入的日志数据应用到副本节点本地的状态机中,实现数据的持久化存储。
在一种可选实施方式中,通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,还包括:在对已完成写入的所述日志数据进行应用的过程中,确定当前的待应用副本节点中的待应用数据块携带所述预设错误标记的数据块的情况下,停止在当前的待应用副本节点中应用所述日志数据。这样设置的好处在于,若主副本节点通过预设错误标记确定某个数据块已发生过读取错误后,可以停止在该数据块上应用日志数据,减少不必要的操作,节约系统资源。
示例性的,待应用副本节点可以理解为当前需要进行应用日志的副本节点,复制组中的各副本节点均可以成为待应用副本节点,待应用数据块可以理解为当前需要进行应用日志的数据块,也即需要根据日志数据进行数据持久化存储的数据块。主副本节点确定复制组中的预设数量的副本节点完成日志数据的写入后,若当前不存在异常副本节点的情况下,可以向复制组内的所有从副本节点发送携带有日志数据已安全复制信息的心跳包,如包含该日志数据的日志索引的心跳包,从副本节点接收到该心跳包后,将已写入的日志数据应用到本地。而本申请中,若主副本节点确定当前的待应用副本节点中当前的待应用数据块携带有预设错误标记,则可以不向其发送上述心跳包,这样待应用数据块就不会应用日志。需要说明的是,若主副本节点确定当前的待应用副本节点中的待应用数据块未携带预设错误标记,可认为该待应用数据块可能是正常的,依然可以向待应用副本节点发送上述心跳包,以实现在当前的待应用数据块上应用日志数据。其中,若待应用副本节点为主副本节点,待应用数据块携带有预设错误标记的情况下,主副本节点可直接停止将日志数据应用到本地。
图2是根据本公开实施例提供的另一种基于人工智能的数据处理方法的流程图,本实施例在上述各可选实施例的基础上,提出一种可选方案,增加了预设错误标记的添加过程。参见图2,该方法包括:
S201、通过复制组中的第一副本节点接收针对目标数据块的第一读请求,尝试读取第一副本节点中的目标数据块,若发生数据读取错误,则为第一副本节点中的目标数据块添加预设错误标记,以使第一副本节点成为异常副本节点。
示例性的,第一副本节点可以是复制组中的任意一个副本节点,可以是从副本节点,也可以是主副本节点。目标数据块可以是副本中的任意一个数据块。第一读取请求可以由用户设备发起,也可以由分布式存储系统中的节点或主机等发起,还可以由分布式存储系统之外的其他相关设备发起等,具体不做限定。接收针对目标数据块的第一读请求,可以理解为需要读取目标数据块的数据内容的请求。
示例性的,第一副本节点在接收到第一读请求后,需要针对该读请求进行处理,例如在本地磁盘中查找目标数据块,并尝试读取其中的数据内容,若磁盘发生静默错误,则会读取失败,也即发生数据读取错误,为目标数据块添加预设错误标记,如将该目标数据块标记为bad,但不会将第一副本节点标记为不可用副本节点,使得第一副本节点可以成为异常副本节点,以便后续可以正常进行日志数据的写入。
S202、保持主副本节点和从副本节点之间的心跳。
示例性的,在异常副本节点为从副本节点的情况下,通过异常副本节点维持与主副本节点之间的心跳。在异常副本节点为主副本节点的情况下,通过异常副本节点维持与从副本节点之间的心跳。此外,正常的从副本节点和主副本节点之间也保持心跳。
可选的,复制组中除上述第一副本节点外,还可能存在其他副本节点中也发生数据块读取识别的情况,也即,复制组中可能同时存在两个或更多的异常副本节点,这些副本节点成为异常副本节点的过程与上述第一副本节点类似,此处不再赘述。
S203、通过主副本节点接收写请求,针对复制组中的各副本节点,尝试写入写请求对应的日志数据。
示例性的,主副本节点接收写请求后,无需区分复制组中当前的各副本节点是否为异常副本节点,各副本节点均可尝试写入日志数据,也即,上述第一副本节点也可以被写入日志数据。
S204、通过主副本节点确定复制组中的预设数量的副本节点完成日志数据的写入后,返回写请求对应的写入成功信息。
S205、通过主副本节点对已完成写入的日志数据进行应用的过程中,确定当前的待应用副本节点中的待应用数据块携带预设错误标记的情况下,停止在当前的待应用副本节点中应用日志数据。
示例性的,主副本节点在应用日志时对各副本节点中的预设错误标记进行检查,由于第一副本节点中的目标数据块被添加了预设错误标记,因此,若当前应用日志针对目标数据块,主副本节点将跳过第一副本节点,也即不对第一副本节点进行应用日志处理。若某副本节点中需要应用日志的数据块未携带预设错误标记,则主副本节点可认为该数据库为正常的数据块,可以针对正常的数据块进行应用日志处理。在遍历复制组中的各副本节点之后,完成应用日志操作,可进行后续操作。
本公开实施例提供的技术方案,复制组中的副本节点接收针对目标数据块的读请求后,尝试读取该副本节点中的目标数据块,若发生数据读取错误,则为该目标数据块添加预设错误标记,以使该副本节点成为异常副本节点,主副本节点接收写请求后,针对复制组中的包括异常副本节点在内的各副本节点尝试写日志,在确定复制组中的预设数量的副本节点完成日志数据的写入后,返回写请求对应的写入成功信息,在应用日志阶段,跳过异常副本节点中的携带预设错误标记的数据块的应用日志处理。通过采用上述技术方案,可以在保证发生数据块读取错误的副本节点能够正常参与日志写入的基础上,及时准确地标记出发生异常的副本节点,以便分布式存储系统能够及时处理该异常。此外,还能够便于主副本节点在进行后续的日志应用时,能够准确识别出异常数据块,以减少不必要的应用日志操作。
在一种可选实施方式中,通过所述第一副本节点尝试读取所述第一副本节点中的所述目标数据块之后,还包括:若发生数据读取错误,且所述第一读请求由用户设备发起,则通过所述第一副本节点向所述用户设备返回第一读取错误信息,其中,所述第一读取错误信息用于指示所述用户设备向第二副本节点发起针对所述目标数据块的第二读请求,所述第二副本节点包括所述复制组中除所述第一副本节点之外的副本节点。这样设置的好处在于,及时通知用户设备从剩余副本节点读取目标数据块,保证读请求响应速度。
示例性的,若发生数据读取错误,虽然未将第一副本节点直接标记为不可用副本节点,也即第一副本节点对于用户设备来说还是可以继续发送读请求的副本节点,但由于发生读取错误,第一副本节点已不能正常返回准确的数据内容,所以及时通知用户设备向第一副本节点之外的副本节点重新发送读取请求。
在一种可选实施方式中,所述尝试读取所述第一副本节点中的所述目标数据块,包括:判断所述第一副本节点中的所述目标数据块是否携带所述预设错误标记,若未携带,则尝试读取所述第一副本节点中的所述目标数据块。这样设置的好处在于,在尝试读取数据块之前,先判断数据块是否携带预设错误标记,若未携带,说明未发生过读取错误,则可以正常尝试读取,避免在已出现读写错误的情况下进行读取,提高读取成功率。
在一种可选实施方式中,还包括:通过所述第一副本节点接收针对所述目标数据块的第三读请求,在确定所述第一副本节点中的所述目标数据块携带所述预设错误标记的情况下,返回第二错误信息,其中,所述第二错误信息用于指示所述第一副本节点中的所述目标数据块无法进行读取。这样设置的好处在于,第一副本节点中的目标数据块已携带预设错误标记,则可快速返回错误信息,避免不必要的读取操作,提高读请求的响应效率。
图3是根据本公开实施例提供的又一种基于人工智能的数据处理方法的流程图,本实施例在上述各可选实施例的基础上,提出一种可选方案,增加了通过异常副本节点向主机汇报错误信息,该错误信息用于指示主机在复制组中添加新副本节点,这样设置的好处在于,可以及时通知主机对复制组进行修复,有利于在保证写可用性的基础上,保证分布式存储系统的正常运行。
可选的,还可包括:通过所述主机基于所述错误信息在所述复制组中添加新副本节点,并移除异常副本节点。这样设置的好处在于,通过主机先及时根据错误信息在复制组中添加新副本节点,再移除异常副本节点,以降低出现异常副本节点对复制组的影响,进而可以在保证写可用性的基础上,保证复制组的可用性,进而保证分布式存储系统的正常运行。
参见图3,该方法包括:
S301、通过复制组中的第一副本节点接收针对目标数据块的第一读请求,尝试读取第一副本节点中的目标数据块,若发生数据读取错误,则为第一副本节点中的目标数据块添加预设错误标记,以使第一副本节点成为异常副本节点,并通过第一副本节点向主机汇报错误信息。
其中,所述错误信息用于指示所述主机在所述复制组中添加新副本节点。
示例性的,在第一副本节点中发生数据读取错误后,在为目标数据块添加预设错误标记之后或同时,可以向主机汇报错误信息,使得主机可以快速得知第一副本节点中存在异常数据块,以便进行有针对性地处理,包括添加新副本节点。可选的,若第一读取请求由用户设备发起,可先向用户设备返回第一读取错误信息,再向主机汇报错误信息。
S302、保持主副本节点和从副本节点之间的心跳。
S303、通过主副本节点接收写请求,针对复制组中的各副本节点,尝试写入写请求对应的日志数据。
S304、通过主副本节点确定复制组中的预设数量的副本节点完成日志数据的写入后,返回写请求对应的写入成功信息。
S305、通过主副本节点对已完成写入的日志数据进行应用的过程中,确定当前的待应用副本节点中的待应用数据块携带预设错误标记的情况下,停止在当前的待应用副本节点中应用日志数据。
S306、通过主机基于错误信息在复制组中添加新副本节点,并移除异常副本节点。
需要说明的是,分布式存储系统中可以存在并发操作,在主机接收到错误信息后,或添加新副本节点过程中,主副本节点都有可能接收到写请求,也即上述各步骤之间的执行顺序并不固定。
可选的,本步骤可具体包括:通过所述主机基于所述错误信息为所述异常副本节点添加预设损坏标记,以使所述异常副本节点成为损坏副本节点;通过所述主机在所述复制组中添加新副本节点,并移除所述损坏副本节点。这样设置的好处在于,先将异常副本节点标记为损坏副本节点,以记录该副本节点后续需要删除,待添加完新副本节点后,再移除损坏副本节点,保证复制组的可用性。
可选的,所述通过所述主机基于所述错误信息在所述复制组中添加新副本节点,包括:通过所述主机基于所述错误信息确定所述异常副本节点为主副本节点的情况下,将所述异常副本节点切换为从副本节点,并重新选举所述复制组中的主副本节点;通过所述主机在所述复制组中添加新副本节点。这样设置的好处在于,若主副本节点为异常副本节点,则先切从并选举新主,而不是先添加新副本节点再选举新主,可保证复制组的读写效率。
本公开实施例提供的技术方案,复制组中的副本节点接收针对目标数据块的读请求后,若发生数据读取错误,则为该目标数据块添加预设错误标记,并向主机汇报错误信息,主机在接收到错误信息后,及时补充新副本节点,保证系统可用性,在主机删除补副本成功之前,主副本节点可以正常处理写请求,保证复制组的写可用性,通过采用本公开实施例的技术方案,复制组的多数副本所在节点的磁盘因发生静默错误而读取失败时,或者,副本节点发生故障,在补充副本过程中,读取磁盘时发生静默错误,故障副本和静默错误副本总和达到复制组的多数副本时,依然可以高效可靠地写入数据。
在一种可选实施方式中,在移除所述异常副本节点之前,还包括:在已完成所述日志数据写入的副本节点和所述新副本节点之间进行所述日志数据的同步。这样设置的好处在于,保证写请求的操作结果的准确性。
示例性的,异常副本节点依然具备进行日志数据同步的能力,以3个副本节点为例,若其中出现2个异常副本节点,且在这2个异常副本节点先被成功写入日志数据,而正常的副本节点还未成功写入日志数据的情况下,在应用日志时,可能2个异常副本节点均被跳过,导致日志数据未成功应用到本地磁盘,而补充新副本节点后,可进行日志数据的同步,使得新副本节点在同步后能够将日志数据应用到本地磁盘中,以实现写请求对应的数据的成功持久化存储。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等,均符合相关法律法规的规定,且不违背公序良俗。
图4是根据本公开实施例提供的一种基于人工智能的数据处理装置的结构示意图,本公开实施例可适用于基于人工智能的分布式存储系统中进行数据处理的情况,具体可应用于智能云场景。该装置可采用硬件和/或软件的方式来实现,可配置于分布式存储系统中,具体可以配置于一个或多个电子设备中。参考图4,该基于人工智能的数据处理装置400包括:
日志数据写入模块401,用于通过复制组中的主副本节点接收写请求,针对所述复制组中的各副本节点,尝试写入所述写请求对应的日志数据,其中,所述复制组中的各副本节点中包含异常副本节点,所述异常副本节点中包含携带预设错误标记的数据块,所述预设错误标记用于表示所属数据块已发生过数据读取错误;
写入成功返回模块402,用于通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,返回所述写请求对应的写入成功信息,其中,所述预设数量大于或等于所述复制组中的副本节点总数的一半。
本公开实施例提供的技术方案,在复制组中某个副本节点中存在已发生过数据读取错误的数据块的情况下,该副本节点不会丧失主副本节点处理写请求过程中的日志数据写入资格,可提高对写请求正常响应的概率,有效保证分布式存储系统的写可用性,进而使得分布式存储系统为人工智能场景的相关应用提供可靠支持。
在一种可选实施方式中,该装置还包括:
第一心跳维持模块,用于在所述异常副本节点为从副本节点的情况下,通过所述异常副本节点维持与主副本节点之间的心跳;
第二心跳维持模块,用于在所述异常副本节点为主副本节点的情况下,通过所述异常副本节点维持与从副本节点之间的心跳。
在一种可选实施方式中,该装置还包括:
应用停止模块,用于通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,在对已完成写入的所述日志数据进行应用的过程中,确定当前的待应用副本节点中的待应用数据块携带所述预设错误标记的情况下,停止在当前的待应用副本节点中应用所述日志数据。
在一种可选实施方式中,该装置还包括:
第一读请求接收模块,用于通过所述复制组中的第一副本节点接收针对目标数据块的第一读请求;
读取模块,用于通过所述第一副本节点尝试读取所述第一副本节点中的所述目标数据块;
错误标记添加模块,用于若发生数据读取错误,则为所述第一副本节点中的所述目标数据块添加所述预设错误标记,以使所述第一副本节点成为所述异常副本节点。
在一种可选实施方式中,该装置还包括:
错误信息汇报模块,用于通过所述异常副本节点向主机汇报错误信息,其中,所述错误信息用于指示所述主机在所述复制组中添加新副本节点。
在一种可选实施方式中,该装置还包括:
副本节点添加模块,用于通过所述主机基于所述错误信息在所述复制组中添加新副本节点,并移除所述异常副本节点。
在一种可选实施方式中,其中,所述副本节点添加模块包括:
损坏标记添加单元,用于通过所述主机基于所述错误信息为所述异常副本节点添加预设损坏标记,以使所述异常副本节点成为损坏副本节点;
副本节点添加单元,用于通过所述主机在所述复制组中添加新副本节点;
副本节点移除单元,用于通过所述主机移除所述损坏副本节点。
在一种可选实施方式中,其中,所述副本节点添加模块,包括:
主从切换单元,用于通过所述主机基于所述错误信息确定所述异常副本节点为主副本节点的情况下,将所述异常副本节点切换为从副本节点,并重新选举所述复制组中的主副本节点;
节点添加单元,用于通过所述主机在所述复制组中添加新副本节点;
节点移除单元,用于通过所述主机移除所述异常副本节点。
在一种可选实施方式中,该装置还包括:
日志数据同步模块,用于在移除所述异常副本节点之前,在已完成所述日志数据写入的副本节点和所述新副本节点之间进行所述日志数据的同步。
在一种可选实施方式中,该装置还包括:
第一错误信息返回模块,用于在通过第一副本节点尝试读取所述第一副本节点中的所述目标数据块之后,若发生数据读取错误,且所述第一读请求由用户设备发起,则通过所述第一副本节点向所述用户设备返回第一读取错误信息,其中,所述第一读取错误信息用于指示所述用户设备向第二副本节点发起针对所述目标数据块的第二读请求,所述第二副本节点包括所述复制组中除所述第一副本节点之外的副本节点。
在一种可选实施方式中,其中,所述读取模块具体用于:
判断所述第一副本节点中的所述目标数据块是否携带所述预设错误标记,若未携带,则尝试读取所述第一副本节点中的所述目标数据块。
在一种可选实施方式中,该装置还包括:
第二错误信息返回模块,用于通过所述第一副本节点接收针对所述目标数据块的第三读请求,在确定所述第一副本节点中的所述目标数据块携带所述预设错误标记的情况下,返回第二错误信息,其中,所述第二错误信息用于指示所述第一副本节点中的所述目标数据块无法进行读取。
根据本公开的实施例,本公开还提供了一种电子设备、一种分布式存储系统、一种可读存储介质和一种计算机程序产品。
本公开的实施例提供的分布式存储系统,包括主机和至少一个复制组,每个所述复制组中包括用于存储主副本的主副本节点和用于存储从副本的从副本节点;所述分布式存储系统用于本公开实施例所述的基于人工智能的数据处理方法。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如基于人工智能的数据处理方法。例如,在一些实施例中,基于人工智能的数据处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的基于人工智能的数据处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于人工智能的数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)区块链网络和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
云计算(cloud computing),指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、操作系统、网络、软件、应用和存储设备等,并可以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (27)
1.一种基于人工智能的数据处理方法,包括:
通过复制组中的主副本节点接收写请求,针对所述复制组中的各副本节点,尝试写入所述写请求对应的日志数据,其中,所述复制组中的各副本节点中包含异常副本节点,所述异常副本节点中包含携带预设错误标记的数据块,所述预设错误标记用于表示所属数据块已发生过数据读取错误;
通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,返回所述写请求对应的写入成功信息,其中,所述预设数量大于或等于所述复制组中的副本节点总数的一半。
2.根据权利要求1所述的方法,还包括:
在所述异常副本节点为从副本节点的情况下,通过所述异常副本节点维持与主副本节点之间的心跳;
在所述异常副本节点为主副本节点的情况下,通过所述异常副本节点维持与从副本节点之间的心跳。
3.根据权利要求1所述的方法,通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,还包括:
通过所述主副本节点对已完成写入的所述日志数据进行应用的过程中,确定当前的待应用副本节点中的待应用数据块携带所述预设错误标记的情况下,停止在当前的待应用副本节点中应用所述日志数据。
4.根据权利要求1所述的方法,还包括:
通过所述复制组中的第一副本节点接收针对目标数据块的第一读请求,尝试读取所述第一副本节点中的所述目标数据块,若发生数据读取错误,则为所述第一副本节点中的所述目标数据块添加所述预设错误标记,以使所述第一副本节点成为所述异常副本节点。
5.根据权利要求1所述的方法,还包括:
通过所述异常副本节点向主机汇报错误信息,其中,所述错误信息用于指示所述主机在所述复制组中添加新副本节点。
6.根据权利要求5所述的方法,还包括:
通过所述主机基于所述错误信息在所述复制组中添加新副本节点,并移除所述异常副本节点。
7.根据权利要求6所述的方法,其中,所述通过所述主机基于所述错误信息在所述复制组中添加新副本节点,并移除所述异常副本节点,包括:
通过所述主机基于所述错误信息为所述异常副本节点添加预设损坏标记,以使所述异常副本节点成为损坏副本节点;
通过所述主机在所述复制组中添加新副本节点,并移除所述损坏副本节点。
8.根据权利要求6所述的方法,其中,所述通过所述主机基于所述错误信息在所述复制组中添加新副本节点,包括:
通过所述主机基于所述错误信息确定所述异常副本节点为主副本节点的情况下,将所述异常副本节点切换为从副本节点,并重新选举所述复制组中的主副本节点;
通过所述主机在所述复制组中添加新副本节点。
9.根据权利要求6所述的方法,在移除所述异常副本节点之前,还包括:
在已完成所述日志数据写入的副本节点和所述新副本节点之间进行所述日志数据的同步。
10.根据权利要求4所述的方法,在通过所述第一副本节点尝试读取所述第一副本节点中的所述目标数据块之后,还包括:
若发生数据读取错误,且所述第一读请求由用户设备发起,则通过所述第一副本节点向所述用户设备返回第一读取错误信息,其中,所述第一读取错误信息用于指示所述用户设备向第二副本节点发起针对所述目标数据块的第二读请求,所述第二副本节点包括所述复制组中除所述第一副本节点之外的副本节点。
11.根据权利要求4所述的方法,其中,所述尝试读取所述第一副本节点中的所述目标数据块,包括:
判断所述第一副本节点中的所述目标数据块是否携带所述预设错误标记,若未携带,则尝试读取所述第一副本节点中的所述目标数据块。
12.根据权利要求4所述的方法,还包括:
通过所述第一副本节点接收针对所述目标数据块的第三读请求,在确定所述第一副本节点中的所述目标数据块携带所述预设错误标记的情况下,返回第二错误信息,其中,所述第二错误信息用于指示所述第一副本节点中的所述目标数据块无法进行读取。
13.一种基于人工智能的数据处理装置,包括:
日志数据写入模块,用于通过复制组中的主副本节点接收写请求,针对所述复制组中的各副本节点,尝试写入所述写请求对应的日志数据,其中,所述复制组中的各副本节点中包含异常副本节点,所述异常副本节点中包含携带预设错误标记的数据块,所述预设错误标记用于表示所属数据块已发生过数据读取错误;
写入成功返回模块,用于通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,返回所述写请求对应的写入成功信息,其中,所述预设数量大于或等于所述复制组中的副本节点总数的一半。
14.根据权利要求13所述的装置,还包括:
第一心跳维持模块,用于在所述异常副本节点为从副本节点的情况下,通过所述异常副本节点维持与主副本节点之间的心跳;
第二心跳维持模块,用于在所述异常副本节点为主副本节点的情况下,通过所述异常副本节点维持与从副本节点之间的心跳。
15.根据权利要求13所述的装置,还包括:
应用停止模块,用于通过所述主副本节点确定所述复制组中的预设数量的副本节点完成所述日志数据的写入后,在对已完成写入的所述日志数据进行应用的过程中,确定当前的待应用副本节点中的待应用数据块携带所述预设错误标记的情况下,停止在当前的待应用副本节点中应用所述日志数据。
16.根据权利要求13所述的装置,还包括:
第一读请求接收模块,用于通过所述复制组中的第一副本节点接收针对目标数据块的第一读请求;
读取模块,用于通过所述第一副本节点尝试读取所述第一副本节点中的所述目标数据块;
错误标记添加模块,用于若发生数据读取错误,则为所述第一副本节点中的所述目标数据块添加所述预设错误标记,以使所述第一副本节点成为所述异常副本节点。
17.根据权利要求13所述的装置,还包括:
错误信息汇报模块,用于通过所述异常副本节点向主机汇报错误信息,其中,所述错误信息用于指示所述主机在所述复制组中添加新副本节点。
18.根据权利要求17所述的装置,还包括:
副本节点添加模块,用于通过所述主机基于所述错误信息在所述复制组中添加新副本节点,并移除所述异常副本节点。
19.根据权利要求18所述的装置,其中,所述副本节点添加模块包括:
损坏标记添加单元,用于通过所述主机基于所述错误信息为所述异常副本节点添加预设损坏标记,以使所述异常副本节点成为损坏副本节点;
副本节点添加单元,用于通过所述主机在所述复制组中添加新副本节点;
副本节点移除单元,用于通过所述主机移除所述损坏副本节点。
20.根据权利要求18所述的装置,其中,所述副本节点添加模块,包括:
主从切换单元,用于通过所述主机基于所述错误信息确定所述异常副本节点为主副本节点的情况下,将所述异常副本节点切换为从副本节点,并重新选举所述复制组中的主副本节点;
节点添加单元,用于通过所述主机在所述复制组中添加新副本节点;
节点移除单元,用于通过所述主机移除所述异常副本节点。
21.根据权利要求18所述的装置,还包括:
日志数据同步模块,用于在移除所述异常副本节点之前,在已完成所述日志数据写入的副本节点和所述新副本节点之间进行所述日志数据的同步。
22.根据权利要求16所述的装置,还包括:
第一错误信息返回模块,用于在通过第一副本节点尝试读取所述第一副本节点中的所述目标数据块之后,若发生数据读取错误,且所述第一读请求由用户设备发起,则通过所述第一副本节点向所述用户设备返回第一读取错误信息,其中,所述第一读取错误信息用于指示所述用户设备向第二副本节点发起针对所述目标数据块的第二读请求,所述第二副本节点包括所述复制组中除所述第一副本节点之外的副本节点。
23.根据权利要求16所述的装置,其中,所述读取模块具体用于:
判断所述第一副本节点中的所述目标数据块是否携带所述预设错误标记,若未携带,则尝试读取所述第一副本节点中的所述目标数据块。
24.根据权利要求16所述的装置,还包括:
第二错误信息返回模块,用于通过所述第一副本节点接收针对所述目标数据块的第三读请求,在确定所述第一副本节点中的所述目标数据块携带所述预设错误标记的情况下,返回第二错误信息,其中,所述第二错误信息用于指示所述第一副本节点中的所述目标数据块无法进行读取。
25.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-12中任一项所述的方法中的相应步骤。
26.一种分布式存储系统,包括主机和至少一个复制组,每个所述复制组中包括用于存储主副本的主副本节点和用于存储从副本的从副本节点;所述分布式存储系统用于执行权利要求1-12中任一项所述的方法。
27.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-12中任一项所述的方法中的相应步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211122985.6A CN115454958B (zh) | 2022-09-15 | 2022-09-15 | 基于人工智能的数据处理方法、装置、设备、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211122985.6A CN115454958B (zh) | 2022-09-15 | 2022-09-15 | 基于人工智能的数据处理方法、装置、设备、系统及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115454958A true CN115454958A (zh) | 2022-12-09 |
CN115454958B CN115454958B (zh) | 2024-03-05 |
Family
ID=84305366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211122985.6A Active CN115454958B (zh) | 2022-09-15 | 2022-09-15 | 基于人工智能的数据处理方法、装置、设备、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115454958B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600172A (zh) * | 2022-12-15 | 2023-01-13 | 南京鹏云网络科技有限公司(Cn) | 分布式存储系统的身份状态处理方法、设备、介质和计算机程序产品 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6725392B1 (en) * | 1999-03-03 | 2004-04-20 | Adaptec, Inc. | Controller fault recovery system for a distributed file system |
US8417987B1 (en) * | 2009-12-01 | 2013-04-09 | Netapp, Inc. | Mechanism for correcting errors beyond the fault tolerant level of a raid array in a storage system |
CN104978336A (zh) * | 2014-04-08 | 2015-10-14 | 云南电力试验研究院(集团)有限公司电力研究院 | 基于Hadoop分布式计算平台的非结构化数据存储系统 |
CN107092598A (zh) * | 2016-02-17 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 数据存储位置信息的管理方法和装置 |
CN108073656A (zh) * | 2016-11-17 | 2018-05-25 | 杭州华为数字技术有限公司 | 一种数据同步方法及相关设备 |
CN111274205A (zh) * | 2020-01-07 | 2020-06-12 | 北京松果电子有限公司 | 数据块访问方法及装置、存储介质 |
CN111368002A (zh) * | 2020-03-05 | 2020-07-03 | 广东小天才科技有限公司 | 一种数据处理方法、系统、计算机设备和存储介质 |
CN111400267A (zh) * | 2019-11-19 | 2020-07-10 | 杭州海康威视系统技术有限公司 | 记录日志的方法和装置 |
-
2022
- 2022-09-15 CN CN202211122985.6A patent/CN115454958B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6725392B1 (en) * | 1999-03-03 | 2004-04-20 | Adaptec, Inc. | Controller fault recovery system for a distributed file system |
US8417987B1 (en) * | 2009-12-01 | 2013-04-09 | Netapp, Inc. | Mechanism for correcting errors beyond the fault tolerant level of a raid array in a storage system |
CN104978336A (zh) * | 2014-04-08 | 2015-10-14 | 云南电力试验研究院(集团)有限公司电力研究院 | 基于Hadoop分布式计算平台的非结构化数据存储系统 |
CN107092598A (zh) * | 2016-02-17 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 数据存储位置信息的管理方法和装置 |
CN108073656A (zh) * | 2016-11-17 | 2018-05-25 | 杭州华为数字技术有限公司 | 一种数据同步方法及相关设备 |
CN111400267A (zh) * | 2019-11-19 | 2020-07-10 | 杭州海康威视系统技术有限公司 | 记录日志的方法和装置 |
CN111274205A (zh) * | 2020-01-07 | 2020-06-12 | 北京松果电子有限公司 | 数据块访问方法及装置、存储介质 |
CN111368002A (zh) * | 2020-03-05 | 2020-07-03 | 广东小天才科技有限公司 | 一种数据处理方法、系统、计算机设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600172A (zh) * | 2022-12-15 | 2023-01-13 | 南京鹏云网络科技有限公司(Cn) | 分布式存储系统的身份状态处理方法、设备、介质和计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN115454958B (zh) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106933843B (zh) | 数据库心跳检测方法以及装置 | |
RU2653254C1 (ru) | Способ, узел и система управления данными для кластера базы данных | |
CN112506710B (zh) | 分布式文件系统数据修复方法、装置、设备及存储介质 | |
US9330153B2 (en) | System, method, and computer readable medium that coordinates between devices using exchange of log files | |
CN112558875A (zh) | 数据校验方法、装置、电子设备及存储介质 | |
CN115454958B (zh) | 基于人工智能的数据处理方法、装置、设备、系统及介质 | |
TWI774060B (zh) | 用於階層式系統之故障排除之裝置、方法及電腦程式產品 | |
CN111367934B (zh) | 数据一致性的检验方法、装置、服务器和介质 | |
CN110515757B (zh) | 分布式存储系统的信息处理方法、装置、服务器、介质 | |
CN116540938A (zh) | 数据读取方法、装置、分布式存储系统、设备和存储介质 | |
CN115934742A (zh) | 一种故障处理方法、装置、设备及存储介质 | |
CN106648985A (zh) | 一种文本数据库的容灾修复方法及装置 | |
CN113553216A (zh) | 数据恢复方法、装置、电子设备及存储介质 | |
CN108459925A (zh) | 私有云设备及其数据库的修复方法、具有存储功能的装置 | |
CN114691781A (zh) | 一种数据同步方法、系统、装置、设备及介质 | |
CN104239182A (zh) | 一种集群文件系统脑裂处理方法和装置 | |
US20230273856A1 (en) | Method, electronic device, and computer program product for accessing storage device | |
US11947827B2 (en) | Synchronizing a stale component of a distributed object using a delta component during maintenance | |
CN115563028B (zh) | 一种数据缓存方法、装置、设备和存储介质 | |
CN114301927B (zh) | 一种分布式系统中主节点选取方法、装置及介质 | |
US9218256B1 (en) | Systems and methods for shipping I/O operations to prevent replication failure | |
CN117667242A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
US20230086852A1 (en) | Method, electronic device, and program product for failure handling | |
CN114138538A (zh) | 异常实例的处理方法、装置和电子设备 | |
CN114253947A (zh) | 自动清理MySQL归档日志的方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |