CN107864209A - 数据写入的方法、装置及服务器 - Google Patents

数据写入的方法、装置及服务器 Download PDF

Info

Publication number
CN107864209A
CN107864209A CN201711144536.0A CN201711144536A CN107864209A CN 107864209 A CN107864209 A CN 107864209A CN 201711144536 A CN201711144536 A CN 201711144536A CN 107864209 A CN107864209 A CN 107864209A
Authority
CN
China
Prior art keywords
write
node
failure
data
essential information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711144536.0A
Other languages
English (en)
Other versions
CN107864209B (zh
Inventor
余涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Lenovo Super Fusion Technology Co Ltd
Original Assignee
Beijing Lenovo Super Fusion Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Lenovo Super Fusion Technology Co Ltd filed Critical Beijing Lenovo Super Fusion Technology Co Ltd
Priority to CN201711144536.0A priority Critical patent/CN107864209B/zh
Publication of CN107864209A publication Critical patent/CN107864209A/zh
Application granted granted Critical
Publication of CN107864209B publication Critical patent/CN107864209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开一种数据写入的方法、装置及服务器,涉及数据处理技术领域,能够解决现有的分布式存储系统可靠性较低的问题。本发明的方法主要包括:检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。本发明主要适用于基于分布式存储系统存储数据的场景中。

Description

数据写入的方法、装置及服务器
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据写入的方法、装置及服务器。
背景技术
随着互联网技术的发展,数据的存储方法也变得多样化。在当今大数据时代,为了防止数据存储发生瓶颈,出现了一种分布式存储系统,即将数据分散存储在多个独立的设备上。
在实际应用中,为了保证数据的可靠性,在将数据写入分布式存储系统中时,除了将数据写入指定的节点外,还会将数据写入至少一个备用节点,从而当该指定的节点发生宕机时,客户端也可以从备用节点处读取需要的数据。然而,在将数据写入备用节点的过程中,常常会因为网络抖动、备用节点短时间过载等原因导致数据写入失败。在这种情况下,现有技术的做法为:对写入失败的节点进行修复,待修复成功后,继续根据客户端新的写入请求写入数据,或者直接将写入失败的节点更换为新的节点,并由新的节点继续根据客户端后续的写入请求写入数据。
发明人在实现上述发明的过程中发现,由于现有的两种做法都导致写入失败的节点或者新的节点存在数据缺失的现象,即没有存储当时写入失败的数据,所以当后续其他节点都发生故障而无法提供数据时,客户端无法从该写入失败的节点或者新的节点中读取当时写入失败的数据,由此导致整个分布式存储系统的可靠性降低。
发明内容
有鉴于此,本发明提供一种数据写入的方法、装置及服务器,能够解决现有的分布式存储系统可靠性较低的问题。
第一方面,本发明提供了一种数据写入的方法,所述方法包括:
检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
第二方面,本发明提供了一种数据写入的装置,所述装置包括:
检测单元,用于检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
发送单元,用于当所述检测单元确定有写入失败记录时,根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
第三方面,本发明提供了一种服务器,所述服务器为分布式存储系统中的一个节点;
其中,所述服务器包括存储介质和处理器;
所述存储介质,用于存储所述处理器执行的指令以及所述处理器执行指令过程中所需的数据;
所述处理器,用于执行以下指令:
检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
借由上述技术方案,本发明提供的数据写入的方法、装置及服务器,与现有技术中在备用节点写入数据时不对写入失败的数据进行任何操作而导致数据缺失相比,本发明在确定备用节点写入数据失败时,通过将写入失败节点的节点标识与被写入失败的数据的基本信息进行记录,并将该基本信息发送给节点标识对应的备用节点,使得备用节点能够将缺失的这部分写入失败的数据重新进行写入,从而使得每个备用节点都不存在缺失数据的现象,进而当部分节点宕机的情况下,可以从其他节点处读取所需的任何数据,由此提高了整个分布式存储系统的可靠性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种数据写入的方法的流程图;
图2示出了本发明实施例提供的另一种数据写入的方法的流程图;
图3示出了本发明实施例提供的一种数据写入的装置的组成框图;
图4示出了本发明实施例提供的另一种数据写入的装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了提高分布式存储系统的可靠性,本发明实施例提供了一种数据写入的方法,该方法主要应用于向备用节点分发读/写请求的节点侧,如图1所示,该方法主要包括:
101、检测当前节点是否含有写入失败记录。
其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录是在确定备用节点首次写入数据失败时生成的记录,用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系。其中,所述写入失败节点属于所述被写入失败的数据所对应的备用节点,所述被写入失败的数据的基本信息包括:待写入对象的对象标识、被写入失败的数据在所述待写入对象中的偏移量以及被写入失败的数据内容。其中,节点标识用于唯一标识一个节点,具体可以为节点的IP(Internet Protocol,网间协议)地址,也可以为节点在分布式存储系统中的编号。
当客户端需要向服务器写入数据时,会向分布式存储系统中的一个节点发送数据写入请求。当接收数据写入请求的节点(以下简称客户端对接节点)不是目标节点(客户端请求写入的节点)时,该客户端对接节点会将接收到的数据写入请求转发给目标节点以及目标节点对应的备用节点;当客户端对接节点是目标节点时,该客户端对接节点会将接收到的数据写入请求转发给对应的备用节点。当目标节点写入成功后,该客户端对接节点会向客户端反馈写入成功响应。此外,客户端对接节点还会监控备用节点的写入情况,并在备用节点写入失败时,会记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,从而生成一条写入失败记录。
需要补充的是,写入失败记录可以以日志形式存储,也可以以其他形式存储,在此不做限定。不同写入失败节点对应的写入失败记录可以位于同一个文件中,也可以分别位于不同的文件中。另外,对于同一个写入失败节点而言,写入失败记录的存储顺序是与客户端需要写入数据的先后顺序相对应的,即在先需要写入的数据对应的写入失败记录位于在后需要写入的数据对应的写入失败记录之后。
示例性的,写入失败记录的具体表现形式可以如表1所示。
表1
另外,客户端对接节点检测本地是否含有写入失败记录的具体实现方式可以为:实时或者周期性检测本地是否含有写入失败记录。
102、若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
当确定含有写入失败记录时,可以从写入失败记录中获取写入失败节点的节点标识,然后确定该节点标识对应的IP地址,最后根据该IP地址将对应的基本信息发送给该写入失败节点,以便该写入失败节点接收到该基本信息后,能够根据该基本信息中记录的待写入对象的对象标识查找到待写入对象,然后从被写入失败的数据在待写入对象中的偏移量起,将被写入失败的数据写入待写入对象中,从而完成重新写入操作。
另外,当同一个写入失败节点含有多条写入失败记录时,可以按照时间先后顺序,一条一条向写入失败节点发送对应的基本信息,也可以一次性将所有的基本信息发送给该写入失败节点,以便该写入失败节点根据基本信息的记录顺序进行重新写入操作。
需要补充的是,旧数据的重新写入涉及的操作与新数据的首次写入涉及的操作是并行的,两者互不干扰,从而既能完成新数据的首次写入,也能保证旧数据的重新写入。
另外,本发明实施例可以应用于传统的分布式存储系统中,也可以应用于超融合存储系统中。
本发明实施例提供的数据写入的方法,与现有技术中在备用节点写入数据时不对写入失败的数据进行任何操作而导致数据缺失相比,本发明在确定备用节点写入数据失败时,通过将写入失败节点的节点标识与被写入失败的数据的基本信息进行记录,并将该基本信息发送给节点标识对应的备用节点,使得备用节点能够将缺失的这部分写入失败的数据重新进行写入,从而使得每个备用节点都不存在缺失数据的现象,进而当部分节点宕机的情况下,可以从其他节点处读取所需的任何数据,由此提高了整个分布式存储系统的可靠性。
进一步的,依据图1所示的方法,本发明的另一个实施例还提供了一种数据写入的方法,如图2所示,该方法主要包括:
201、检测当前节点是否含有写入失败记录。
本步骤的具体实现方式与图1中步骤101的具体实现方式相同,在此不再赘述。
202、若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
在实际应用中,由于网络或者写入失败节点本身的原因,可能会导致无法接收到客户端对接节点发送的基本信息,或者即使能够成功接受到该基本信息,也可能会因为负载过量等原因导致重新写入失败。为了保证被写入失败的数据能够成功写入写入失败节点,本发明实施例提供了以下两种方法:
方法一:根据所述节点标识,周期性地将所述基本信息发送给所述写入失败节点,直至确定所述写入失败节点根据所述基本信息将所述被写入失败的数据进行成功写入时,停止向所述写入失败节点发送所述基本信息。
具体的,当确定本地含有写入失败记录时,立即根据写入失败记录中的节点标识,将对应的基本信息发送给写入失败节点;若本次重新写入成功,则不再向该写入失败节点发送该基本信息;若本次重新写入失败,则继续向该写入失败节点发送该基本信息,直至确定重新写入成功为止。
方法二:根据所述节点标识,周期性地将所述基本信息发送给所述写入失败节点,直至确定所述写入失败节点成功接收到所述基本信息时,停止向所述写入失败节点发送所述基本信息,以便所述写入失败节点基于接收到的所述基本信息周期性地将所述被写入失败的数据进行写入,直至写入成功。
当写入失败节点能够接收到该基本信息,但是因为负载过量等原因无法使数据重新成功写入时,若继续向写入失败节点发送基本信息,则会浪费客户端对接节点的资源,因此为了节省客户端对接节点的资源,可以在客户端对接节点确定写入失败节点成功接收到基本信息时,就停止向该写入失败节点发送基本信息;而对于写入失败节点而言,在接收到基本信息后,可以将该基本信息进行缓存,以便后续写入失败节点直接根据本地缓存的基本信息周期性地进行重新写入操作,直至写入成功为止,而无需再让客户端对接节点重新发送该基本信息。
由于一备用节点在写入失败后,可能需要一段时间进行修复才能再次写入成功,而写入失败记录是在写入失败时生成的记录,所以在检测到当前节点含有写入失败记录时,若立即将被写入失败的数据的基本信息发送给写入失败节点,则很有可能因为该写入失败节点还未恢复正常而导致在一段时间内都重新写入失败,从而造成浪费资源的现象。为了保证重新写入的成功率,从而防止资源浪费,可以采用如下方法三。
方法三:先判断所述写入失败节点的当前状态是否满足预设写入条件;若满足所述预设写入条件,则根据所述节点标识,将所述基本信息发送给所述写入失败节点;若不满足所述预设写入条件,则继续判断所述写入失败节点的当前状态是否满足预设写入条件。
其中,所述预设写入条件是用于评估数据能够成功写入节点的条件;所述预设写入条件包括所述写入失败节点的剩余负载大于等于待写入数据的大小和/或当前节点与所述写入失败节点之间通信链路连通。
另外,由于不同写入失败节点写入失败的原因可能不同,并且在一段时间内同一个写入失败节点也不会发生其他故障,所以为了防止因针对每个写入失败节点都判断所有预设写入条件而造成时间浪费,可以根据写入失败节点的写入失败原因设置预设写入条件,在后续判断写入失败节点的当前状态时,只需判断当前状态是否满足失败原因对应的预设写入条件即可。
203、在确定所述写入失败节点重新写入数据成功时,将对应的写入失败记录删除。
当接收到写入失败节点发送的写入成功提示信息时,可以确定该写入失败节点重新写入数据成功,此时客户端对接节点本地存储的、对应的写入失败记录已没有意义,为了节省存储空间以及防止将其再次发送给写入失败节点,可以将对应的写入失败记录从本地删除。
另外,若不将这些重新写入成功的数据对应的写入失败记录删除,则为了防止当前节点再次将这些写入失败记录发送给写入失败节点,而导致写入失败节点浪费资源再次进行重新写入操作,可以为这些写入失败记录添加重新写入成功标识。并且在这种情况下,步骤201或者步骤101变为检测本地是否含有未携带重新写入成功标识的写入失败记录。
示例性的,客户端通过A节点将数据写入B节点,并备份到C、D节点,但C节点因短时间过载导致本次写入失败。当A节点获知C节点写入失败时,将C节点的节点标识与本次需要写入的数据的基本信息之间的对应关系进行记录,从而生成写入失败记录。后续A节点进行实时或者周期性检测写入失败记录时,能够检测关于C节点的写入失败记录,并先判断C节点是否满足预设写入条件(例如剩余负载大于等于待写入数据的大小),当确定C节点满足该预设写入条件时,将对应的数据的基本信息发送给C节点。C节点接收到该基本信息后,能够根据基本信息将被写入失败的数据重新写入指定的对象中。
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种数据写入的装置,如图3所示,所述装置主要包括:检测单元31和发送单元32。其中,
检测单元31,用于检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
发送单元32,用于当所述检测单元31确定有写入失败记录时,根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
可选的,如图4所示,所述装置还包括:
判断单元33,用于在根据所述节点标识,将所述基本信息发送给所述写入失败节点之前,判断所述写入失败节点的当前状态是否满足预设写入条件,所述预设写入条件是用于评估数据能够成功写入节点的条件;
所述发送单元32还用于当所述判断单元33的判断结果为满足所述预设写入条件时,根据所述节点标识,将所述基本信息发送给所述写入失败节点。
可选的,所述预设写入条件包括所述写入失败节点的剩余负载大于等于待写入数据的大小和/或当前节点与所述写入失败节点之间通信链路连通。
可选的,所述发送单元32用于根据所述节点标识,周期性地将所述基本信息发送给所述写入失败节点,直至确定所述写入失败节点根据所述基本信息将所述被写入失败的数据进行成功写入时,停止向所述写入失败节点发送所述基本信息。
可选的,所述发送单元32用于根据所述节点标识,周期性地将所述基本信息发送给所述写入失败节点,直至确定所述写入失败节点成功接收到所述基本信息时,停止向所述写入失败节点发送所述基本信息,以便所述写入失败节点基于接收到的所述基本信息周期性地将所述被写入失败的数据进行写入,直至写入成功。
可选的,如图4所示,所述装置还包括:
删除单元34,用于在确定所述写入失败节点重新写入数据成功时,将对应的写入失败记录删除。
可选的,所述基本信息包括:待写入对象的对象标识、被写入失败的数据在所述待写入对象中的偏移量以及被写入失败的数据内容;
和/或,所述写入失败记录是在确定备用节点首次写入数据失败时生成的记录。
本发明实施例提供的数据写入的装置,与现有技术中在备用节点写入数据时不对写入失败的数据进行任何操作而导致数据缺失相比,本发明在确定备用节点写入数据失败时,通过将写入失败节点的节点标识与被写入失败的数据的基本信息进行记录,并将该基本信息发送给节点标识对应的备用节点,使得备用节点能够将缺失的这部分写入失败的数据重新进行写入,从而使得每个备用节点都不存在缺失数据的现象,进而当部分节点宕机的情况下,可以从其他节点处读取所需的任何数据,由此提高了整个分布式存储系统的可靠性。
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种储介质,所述存储介质存储有多条指令,所述指令适用于由处理器加载并执行如上所述的数据写入的方法。
本发明实施例提供的数据写入的存储介质中记载的多条指令,与现有技术中在备用节点写入数据时不对写入失败的数据进行任何操作而导致数据缺失相比,本发明在确定备用节点写入数据失败时,通过将写入失败节点的节点标识与被写入失败的数据的基本信息进行记录,并将该基本信息发送给节点标识对应的备用节点,使得备用节点能够将缺失的这部分写入失败的数据重新进行写入,从而使得每个备用节点都不存在缺失数据的现象,进而当部分节点宕机的情况下,可以从其他节点处读取所需的任何数据,由此提高了整个分布式存储系统的可靠性。
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种服务器,所述服务器为分布式存储系统中的一个节点;
其中,所述服务器包括存储介质和处理器;
所述存储介质,用于存储所述处理器执行的指令以及所述处理器执行指令过程中所需的数据;
所述处理器,用于执行以下指令:
检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
需要说明的是,所述处理器,还用于执行图2或者图3中涉及的指令,在此不再赘述。
本发明实施例提供的数据写入的服务器,与现有技术中在备用节点写入数据时不对写入失败的数据进行任何操作而导致数据缺失相比,本发明在确定备用节点写入数据失败时,通过将写入失败节点的节点标识与被写入失败的数据的基本信息进行记录,并将该基本信息发送给节点标识对应的备用节点,使得备用节点能够将缺失的这部分写入失败的数据重新进行写入,从而使得每个备用节点都不存在缺失数据的现象,进而当部分节点宕机的情况下,可以从其他节点处读取所需的任何数据,由此提高了整个分布式存储系统的可靠性。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法、装置及系统中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的数据写入的方法、装置及服务器中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种数据写入的方法,其特征在于,所述方法包括:
检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
2.根据权利要求1所述的方法,其特征在于,在根据所述节点标识,将所述基本信息发送给所述写入失败节点之前,所述方法还包括:
判断所述写入失败节点的当前状态是否满足预设写入条件,所述预设写入条件是用于评估数据能够成功写入节点的条件;
所述根据所述节点标识,将所述基本信息发送给所述写入失败节点包括:
若满足所述预设写入条件,则根据所述节点标识,将所述基本信息发送给所述写入失败节点。
3.根据权利要求2所述的方法,其特征在于,所述预设写入条件包括所述写入失败节点的剩余负载大于等于待写入数据的大小和/或当前节点与所述写入失败节点之间通信链路连通。
4.根据权利要求1所述的方法,其特征在于,所述根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入包括:
根据所述节点标识,周期性地将所述基本信息发送给所述写入失败节点,直至确定所述写入失败节点根据所述基本信息将所述被写入失败的数据进行成功写入时,停止向所述写入失败节点发送所述基本信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入包括:
根据所述节点标识,周期性地将所述基本信息发送给所述写入失败节点,直至确定所述写入失败节点成功接收到所述基本信息时,停止向所述写入失败节点发送所述基本信息,以便所述写入失败节点基于接收到的所述基本信息周期性地将所述被写入失败的数据进行写入,直至写入成功。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在确定所述写入失败节点重新写入数据成功时,将对应的写入失败记录删除。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述基本信息包括:待写入对象的对象标识和/或被写入失败的数据在所述待写入对象中的偏移量和/或被写入失败的数据内容;
和/或,所述写入失败记录是在确定备用节点首次写入数据失败时生成的记录。
8.一种数据写入的装置,其特征在于,所述装置包括:
检测单元,用于检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
发送单元,用于当所述检测单元确定有写入失败记录时,根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
9.一种服务器,其特征在于,所述服务器为分布式存储系统中的一个节点;
其中,所述服务器包括存储介质和处理器;
所述存储介质,用于存储所述处理器执行的指令以及所述处理器执行指令过程中所需的数据;
所述处理器,用于执行以下指令:
检测当前节点是否含有写入失败记录,其中,写入操作需要将数据写入至少一个备用节点中,所述写入失败记录用于记录写入失败节点的节点标识与被写入失败的数据的基本信息之间的对应关系,所述写入失败节点属于所述被写入失败的数据所对应的备用节点;
若有写入失败记录,则根据所述节点标识,将所述基本信息发送给所述写入失败节点,以便所述写入失败节点根据所述基本信息将所述被写入失败的数据进行重新写入。
10.根据权利要求9所述的服务器,其特征在于,所述处理器还用于执行以下指令:
在根据所述节点标识,将所述基本信息发送给所述写入失败节点之前,判断所述写入失败节点的当前状态是否满足预设写入条件,所述预设写入条件是用于评估数据能够成功写入节点的条件;
若满足所述预设写入条件,则根据所述节点标识,将所述基本信息发送给所述写入失败节点。
CN201711144536.0A 2017-11-17 2017-11-17 数据写入的方法、装置及服务器 Active CN107864209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711144536.0A CN107864209B (zh) 2017-11-17 2017-11-17 数据写入的方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711144536.0A CN107864209B (zh) 2017-11-17 2017-11-17 数据写入的方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN107864209A true CN107864209A (zh) 2018-03-30
CN107864209B CN107864209B (zh) 2021-05-18

Family

ID=61702078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711144536.0A Active CN107864209B (zh) 2017-11-17 2017-11-17 数据写入的方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN107864209B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241074A (zh) * 2018-09-28 2019-01-18 中国平安财产保险股份有限公司 稽核数据自动加工方法、装置、计算机设备及存储介质
CN109407976A (zh) * 2018-09-21 2019-03-01 联想(北京)有限公司 一种分布式存储方法及分布式存储装置
CN109508251A (zh) * 2018-11-21 2019-03-22 北京锐安科技有限公司 数据存储方法、系统、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102368222A (zh) * 2011-10-25 2012-03-07 曙光信息产业(北京)有限公司 一种多副本存储系统在线修复的方法
CN102981977A (zh) * 2011-09-05 2013-03-20 上海华魏光纤传感技术有限公司 一种可延长flash使用寿命的数据存储方法
CN103744745A (zh) * 2013-12-13 2014-04-23 北京奇虎科技有限公司 一种数据存储的检测方法、设备及分布式存储系统
US9489226B2 (en) * 2014-06-06 2016-11-08 PernixData, Inc. Systems and methods to manage write commands in a cache
CN106302806A (zh) * 2016-09-13 2017-01-04 腾讯科技(深圳)有限公司 一种数据同步方法、系统、同步获取方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102981977A (zh) * 2011-09-05 2013-03-20 上海华魏光纤传感技术有限公司 一种可延长flash使用寿命的数据存储方法
CN102368222A (zh) * 2011-10-25 2012-03-07 曙光信息产业(北京)有限公司 一种多副本存储系统在线修复的方法
CN103744745A (zh) * 2013-12-13 2014-04-23 北京奇虎科技有限公司 一种数据存储的检测方法、设备及分布式存储系统
US9489226B2 (en) * 2014-06-06 2016-11-08 PernixData, Inc. Systems and methods to manage write commands in a cache
CN106302806A (zh) * 2016-09-13 2017-01-04 腾讯科技(深圳)有限公司 一种数据同步方法、系统、同步获取方法及相关装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109407976A (zh) * 2018-09-21 2019-03-01 联想(北京)有限公司 一种分布式存储方法及分布式存储装置
CN109407976B (zh) * 2018-09-21 2021-09-14 联想(北京)有限公司 一种分布式存储方法及分布式存储装置
CN109241074A (zh) * 2018-09-28 2019-01-18 中国平安财产保险股份有限公司 稽核数据自动加工方法、装置、计算机设备及存储介质
CN109241074B (zh) * 2018-09-28 2023-09-26 中国平安财产保险股份有限公司 稽核数据自动加工方法、装置、计算机设备及存储介质
CN109508251A (zh) * 2018-11-21 2019-03-22 北京锐安科技有限公司 数据存储方法、系统、设备和介质

Also Published As

Publication number Publication date
CN107864209B (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN109787830A (zh) 灰度发布控制方法、装置、系统、电子设备及存储介质
CN109814910A (zh) 自动化灰度发布方法、装置、计算机系统及存储介质
US8495635B2 (en) Mechanism to enable and ensure failover integrity and high availability of batch processing
CN110807064B (zh) Rac分布式数据库集群系统中的数据恢复装置
CN109302498A (zh) 一种网络资源访问方法及装置
CN108234630A (zh) 基于分布式一致性协议实现的数据读取方法及装置
CN105550229A (zh) 分布式存储系统数据修复的方法和装置
CN103744745B (zh) 一种数据存储的检测方法、设备及分布式存储系统
CN106357449A (zh) 一种zedis分布式缓存方法
CN107864209A (zh) 数据写入的方法、装置及服务器
CN108123851A (zh) 分布式系统中主从节点同步链路的存活检测方法及装置
CN110673941A (zh) 多机房中微服务的迁移方法、电子设备及存储介质
CN108769242A (zh) 一种报文调度方法及装置
CN109558260A (zh) Kubernetes故障排除系统、方法、设备及介质
CN106406980B (zh) 一种虚拟机的部署方法和装置
CN107612950A (zh) 一种提供服务的方法、装置、系统、电子设备
CN108932249A (zh) 一种管理文件系统的方法及装置
CN108595514A (zh) 电子订单处理方法及装置
CN116263694A (zh) 仓库集群的部署方法、装置以及计算设备
CN106126419A (zh) 一种应用程序的调试方法及装置
CN110012111B (zh) 一种数据服务集群系统及数据处理方法
CN108205588B (zh) 基于主从结构的数据同步方法及装置
CN104699566A (zh) 基于云存储的数据冗余备份方法、系统及存储节点服务器
CN113885797A (zh) 一种数据存储方法、装置、设备及存储介质
CN105550230A (zh) 分布式存储系统节点故障的侦测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant