CN109347899A - 在分布式存储系统中写入日志数据的方法 - Google Patents

在分布式存储系统中写入日志数据的方法 Download PDF

Info

Publication number
CN109347899A
CN109347899A CN201810958830.3A CN201810958830A CN109347899A CN 109347899 A CN109347899 A CN 109347899A CN 201810958830 A CN201810958830 A CN 201810958830A CN 109347899 A CN109347899 A CN 109347899A
Authority
CN
China
Prior art keywords
written
daily record
record data
memory system
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810958830.3A
Other languages
English (en)
Other versions
CN109347899B (zh
Inventor
马井玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810958830.3A priority Critical patent/CN109347899B/zh
Publication of CN109347899A publication Critical patent/CN109347899A/zh
Application granted granted Critical
Publication of CN109347899B publication Critical patent/CN109347899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

本发明涉及一种用于在分布式存储系统中写入日志数据的方法。分布式系统中创建有用于在同一非暂态存储介质上存取数据的多个进程。该方法包括:将所述多个进程的日志数据分别写入同一共享日志文件,该共享日志文件存储在所述同一非暂态存储介质上。因此,不同的进程的日志数据可以被写入同一共享日志文件中,从而消除了日志数据的随机写入问题,提高了非暂态存储介质的性能。

Description

在分布式存储系统中写入日志数据的方法
【技术领域】
本发明涉及分布式存储系统。特别地,本发明涉及在分布式存储系统中写入日志数据的方法。
【背景技术】
在分布式存储系统中,通常采用多个进程保存数据的多个副本,以便提供系统的可靠性。为了实现多个副本的数据的同步,本领域中通常是通过进程的日志文件而实现的。例如,raft协议是一种复制组通讯协议,它基于日志形式在复制组内的进程当中通讯以实现数据的一致性。
因此,在分布式存储系统中,存在用于不同的应用的多个复制组。每个复制组包括用于存取数据的主进程(mater)。每个复制组还可以包括一个或多个用于存取数据的从进程(slave),以便备份数据。在raft协议中,主进程被称为leader而从进程被称为follower。每个进程(主进程或从进程)都需要维护一个日志文件,用于记录进程对数据的各种操作,而数据文件用于存储写入的数据。例如,当一个复制组将数据存储在分布式存储系统中时,该复制组中的主进程和从进程都要分别向其日志文件和数据文件写入数据。
在分布式存储系统中,每个非暂态存储介质(例如磁盘)实际上服务于多个复制组。也就是说,一个磁盘上往往存储对应于多个复制组的进程的日志文件。当这些进程向各自的日志文件写入数据时,由于各个进程的日志文件在磁盘中的位置是不连续的,这些进程会产生多个随机写入操作。这会导致磁盘写入性能的下降。
因此,需要提供一种可以解决日志数据在存储介质中的随机写入问题的方法。
【发明内容】
有鉴于此,本发明提供了一种用于在分布式存储系统中写入日志数据的方法,分布式系统中创建有用于在同一非暂态存储介质上存取数据的多个进程,其特征在于,所述方法包括:
将所述多个进程的日志数据分别写入同一共享日志文件,该共享日志文件存储在所述同一非暂态存储介质上。
根据本发明的方法的一优选实施方式,将所述多个进程的日志数据分别写入同一共享日志文件包括:
获取要写入日志数据的进程的标识;
将要写入日志数据的进程的标识和对应的日志数据采用顺序写的方式写入所述共享日志文件。
根据本发明的方法的一优选实施方式,所述多个进程属于不同的复制组。
根据本发明的方法的一优选实施方式,所述多个进程包括主进程和/或从进程。
根据本发明的方法的一优选实施方式,所述非暂态存储介质为磁盘。
根据本发明的方法的一优选实施方式,所述要写入日志数据的进程的标识为该进程对应的复制组的标识。
根据本发明的方法的一优选实施方式,所述分布式存储系统是基于分布式一致性协议raft的分布式存储系统。
本发明还提供了一种用于在分布式存储系统中写入日志数据的装置,该分布式系统中创建有用于在同一非暂态存储介质上存取数据的多个进程,其特征在于,所述装置包括:
写入模块,用于将所述多个进程的日志数据分别写入同一共享日志文件,该共享日志文件存储在所述同一非暂态存储介质上。
根据本发明的分布式存储系统的一优选实施方式,所述写入模块包括:
获取模块,用于获取要写入日志数据的进程的标识;
顺序写入模块,用于将要写入日志数据的进程的标识和对应的日志数据采用顺序写的方式写入所述共享日志文件。
根据本发明的分布式存储系统的一优选实施方式,所述多个进程属于不同的复制组。
根据本发明的分布式存储系统的一优选实施方式,所述多个进程包括主进程和/或从进程。
根据本发明的分布式存储系统的一优选实施方式,所述非暂态存储介质为磁盘。
根据本发明的分布式存储系统的一优选实施方式,所述要写入日志数据的进程的标识为该进程对应的复制组的标识。
根据本发明的分布式存储系统的一优选实施方式,所述分布式存储系统是基于分布式一致性协议raft的分布式存储系统。
本发明还提供了一种设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述方法。
本发明还提供了一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机处理器执行时用于执行上述方法。
由以上技术方案可以看出,根据本发明的写入日志数据的方法以及分布式存储系统,使得不同进程的日志数据可以被写入同一共享日志文件。从而消除了日志数据的随机写入的问题,提高了非暂态存储介质的性能。
【附图说明】
图1为本发明实施例提供的用于在分布式存储系统中写入数据的方法的流程图;
图2为本发明的实施例提供的分布式存储系统中的共享日志文件的结构的示意图;
图3为本发明的实施例提供的用于在分布式存储系统中写入数据的装置的结构图;
图4为本发明的实施例提供的分布式存储系统的结构的示意图;
图5示出了适于用来实现本发明的实施方式的示例性计算机系统/服务器的框图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
在分布式存储系统中,同一非暂态存储介质一般服务于多个用于存取数据的进程。这些进程需要维护它们各自的日志文件。由于各日志文件在同一非暂态存储介质中的位置是不连续的,这些进程向日志文件写入日志数据时会引起随机写入的问题。特别是,当进程数量较大时,需要对向大量离散的日志文件中写入日志数据,这严重降低了存储介质的性能。事实上,分布式存储系统一般包括多个非暂态存储介质,而每个非暂态存储介质一般服务于多个进程。所以分布式存储系统中的每个非暂态存储介质都会存在随机写入的问题。以下仅以分布式存储系统中的一个非暂态存储介质作为对象进行讨论。
本发明的核心思想在于,使分布式存储系统中的多个存取数据的进程(主进程和/或从进程)共享同一日志文件。具体地,本发明提供了一种用于在分布式存储系统中写入日志数据的方法。分布式存储系统中创建有用于在同一非暂态存储介质上存取数据的多个进程。该方法包括将所述多个进程的日志数据分别写入同一共享日志文件,该共享日志文件存储在同一非暂态存储介质上。由于各个进程的日志数据被写入同一日志文件,所以不必向各个进程专有的日志文件写入日志数据。因此根据本发明的方法可以消除向多个日志文件写入日志数据时产生的随机写入的问题。
由于磁盘需要由磁头机械地在盘片上寻址,所以随机写入的问题对于磁盘的影响尤其明显。本发明特别适用于采用磁盘作为非暂态存储介质的分布式存储系统。
图1为本发明实施例提供的用于在分布式存储系统中写入日志数据的方法的流程图。分布式存储系统中创建有用于在同一非暂态存储介质上存取数据的多个进程。该方法包括:将所述多个进程的日志数据分别写入同一共享日志文件。该共享日志文件存储在所述同一非暂态存储介质上。
如图1所示,根据本实施例,将所述多个进程的日志数据分别写入同一共享日志文件可以包括以下步骤:
在步骤10中,获取要写入日志数据的进程的标识。事实上,要写入日志数据的进程可以是多个进程中的任何一个进程。步骤10旨在获取所涉及的进程的标识。标识可以是分布式存储系统为每个进程分配的唯一标识。
在步骤11中,将要写入日志数据的进程的标识和对应的日志数据采用顺序写的方式写入所述共享日志文件。也就是说,接着上次写入的标识和日志数据顺序而写入到共享日志文件。由此,当上述多个进程中的任何进程需要写入日志数据时,都将其标识和日志数据顺序写入到同一共享日志文件中。
可见,根据图1中提供的方法,各个进程不再随机地将日志数据写入其各自的日志文件中,而是顺序地写入到同一共享日志文件中。因此,根据本实施例的方法可以有效地消除对存储介质的随机写入问题,从而提高了存储介质的性能。另外,将进程的标识和日志数据同时写入日志文件,使得可以将标识作为索引,用于从日志文件中提取该标识所对应的进程的日志数据。
上述实施例中的多个进程可以包括主进程和/或从进程。在分布式存储系统中,主进程被称为master或leader,从进程被称为slave或follower。主进程主要用于在分布式系统中存取数据并且响应外部请求而向外部设备提供数据。从进程主要用于备份主进程存储的数据。当主进程出现故障时,从进程可以转换为主进程。
根据本发明一优选实施例,上述多个进程(主进程和/或从进程)可以属于不同的复制组。在分布式存储系统中,一个复制组例如可以服务于一个应用。一个复制组可以包括一个主进程并且可选地包括一个或多个从进程。从进程可以将与主进程所存储的数据备份到分布式存储系统中,以便增强数据存储的可靠性。如果上述多个进程中存在属于同一复制组的若干个进程,那么当上述同一非暂态存储介质出现故障时,同一复制组中的若干个进程存储的数据将同时失效。为了解决这个问题,根据优选的实施例,上述多个进程属于不同的复制组,从而确保同一复制组的不同进程将数据存储在不同的非暂态存储介质上。这进一步提高了分布式存储系统的可靠性。在该优选的实施例中,进程的标识可以是进程对应的复制组的标识。复制组的标识是分布式存储系统分配给每个复制组的唯一标识,以便可以在系统中识别复制组。由于上述多个进程属于不同的复制组,因此可以使用复制组的标识来识别上述多个进程,而不会引起任何混淆。
在以上讨论的方法中,分布式存储系统可以是基于raft协议的分布式存储系统。Raft是一种复制组通讯协议,它基于日志文件而使复制组中各进程存储的数据的同步。因此,本发明各实施例中的方法特别适用于分布式一致性协议raft的分布式存储系统,用于消除对非暂态存储介质的随机写入问题。
图2为本发明的实施例提供的分布式存储系统中的共享日志文件的结构的示意图。图2中,共享日志文件存储在分布式存储系统的磁盘上。应当理解的是,图2中的磁盘仅是非暂态存储介质的一个实例,本发明的各实施例同样适用于其它非暂态存储介质。在图2中示出了分布式存储系统创建的三个进程:主进程1、主进程2和从进程3。这三个进程可以分别属于未在图中示出的不同的三个复制组(例如复制组1、复制组2、复制组3)。这三个进程共用同一磁盘并且分享该同一磁盘上存储的共享日志文件。图2中的箭头指明了三个进程写入到共享日志文件中的日志数据A、B、C、D、E、F。每次写入的内容都包括进程ID(或复制组ID)和日志数据。
具体地,图2中的日志数据的写入可以包括以下步骤:
-获取主进程1的标识1,将标识1和日志数据A顺序地写入共享日志文件。也就是说紧接着先前写入的内容(未示出)写入标识1和日志数据A。先前写入的内容可能是由某个进程写入的标识和日志数据,也可能是创建共享日志文件时写入的头部数据(这种情况涉及空的日志文件)。
-获取从进程3的标识3,将标识3和日志数据B顺序地写入共享日志文件。也就是说紧接着先前写入的内容(标识1和日志数据A)写入标识3和日志数据B。
-获取主进程2的标识2,将标识2和日志数据C顺序地写入到共享日志文件。也就是说紧接着先前写入的内容(标识3和日志数据B)写入标识2和日志数据C。
-获取主进程1的标识1,将标识1和日志数据D顺序地写入到共享日志文件。也就是说紧接着先前写入的内容(标识2和日志数据C)写入标识1和日志数据D。
-获取从进程3的标识3,将标识3和日志数据E顺序地写入到共享日志文件。也就是说紧接着先前写入的内容(标识1和日志数据D)写入标识3和日志数据E。
-获取主进程2的标识2,将标识2和日志数据F顺序地写入到共享日志文件。也就是说紧接着先前写入的内容(标识3和日志数据E)写入标识2和日志数据F。
通过以上步骤,形成了如图2中所示出的共享日志文件结构。应当理解的是,以上描述的各进程的时间上的写入次序可以是随机的。也就是说,各进程可以按照任何时间上的先后顺序写入共享日志文件。然而,无论时间上的写入顺序如何,在共享日志文件中写入的内容在磁盘上的位置都是连续的,也就是说在位置上被顺序地写入到日志文件中。因此,以上写入过程不存在随机写入的问题。在提取日志数据时,只需要根据进程的标识(或者进程对应的复制组的标识)提取出对应的进程的日志数据。
图3为本发明的实施例提供的用于在分布式存储系统中写入数据的装置的结构图。该分布式系统中创建有用于在同一非暂态存储介质上存取数据的多个进程。该装置30包括写入模块300,用于获取要写入日志数据的进程的标识。写入模块300可以包括:
获取模块301,用于获取要写入日志数据的进程的标识;
顺序写入模块302,用于将要写入日志数据的进程的标识和对应的日志数据采用顺序写的方式写入所述共享日志文件。
上述多个进程(主进程和/或从进程)可以属于不同的复制组。在分布式存储系统中,一个复制组例如可以服务于一个应用。一个复制组可以包括一个主进程并且可选地包括一个或多个从进程。从进程可以将与主进程所存储的数据备份到分布式存储系统中,以便增强数据存储的可靠性。如果上述多个进程中存在属于同一复制组的若干个进程,那么当上述同一非暂态存储介质出现故障时,同一复制组中的若干个进程存储的数据将同时失效。为了解决这个问题,根据优选的实施例,上述多个进程属于不同的复制组,从而确保同一复制组的不同进程将数据存储在不同的非暂态存储介质上。这进一步提高了分布式存储系统的可靠性。在该优选的实施例中,进程的标识可以是进程对应的复制组的标识。复制组的标识是分布式存储系统分配给每个复制组的唯一标识,以便可以在系统中识别复制组。由于上述多个进程属于不同的复制组,因此可以使用复制组的标识来识别上述多个进程,而不会引起任何混淆。
在以上讨论的方法中,分布式存储系统可以是基于raft协议的分布式存储系统。Raft是一种复制组通讯协议,它基于日志文件而使复制组中各进程存储的数据的同步。因此,本发明各实施例中的方法特别适用于分布式一致性协议raft的分布式存储系统,用于消除对非暂态存储介质的随机写入问题。
图4为本发明的实施例提供的分布式存储系统40的结构的示意图。该分布式存储系统40中创建有在同一非暂态存储介质400上存取数据的多个进程411、412、413。非暂态存储介质400例如可以是磁盘。分布式存储系统40可以包括图3中示出的装置30,用于将多个进程411、412、413的日志数据分别写入同一共享日志文件401。该共享日志文件401存储在非暂态存储介质400上。在分布式存储系统40中,装置30特别地可以采用软件模块实现。
图5示出了适于用来实现本发明实施方式的示例性计算机系统/服务器的框图。图5显示的计算机系统/服务器012仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于:一个或者多个处理器或者处理单元016,系统存储器028,连接不同系统组件(包括系统存储器028和处理单元016)的总线018。
总线018表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器028可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统034可以用于读写不可移动的、非易失性磁介质(图中未显示,通常称为“硬盘驱动器”)。尽管图中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块042的程序/实用工具040,可以存储在例如存储器028中,这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信,在本发明中,计算机系统/服务器012与外部雷达设备进行通信,还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信,和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且,计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器012使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元016通过运行存储在系统存储器028中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的方法流程。
上述的计算机程序可以设置于计算机存储介质中,即该计算机存储介质被编码有计算机程序,该程序在被一个或多个计算机执行时,使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如,被上述一个或多个处理器执行本发明实施例所提供的方法流程。
随着时间、技术的发展,介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (17)

1.一种用于在分布式存储系统中写入日志数据的方法,分布式系统中创建有用于在同一非暂态存储介质上存取数据的多个进程,其特征在于,所述方法包括:
将所述多个进程的日志数据分别写入同一共享日志文件,该共享日志文件存储在所述同一非暂态存储介质上。
2.根据权利要求1所述的方法,其特征在于,将所述多个进程的日志数据分别写入同一共享日志文件包括:
获取要写入日志数据的进程的标识;
将要写入日志数据的进程的标识和对应的日志数据采用顺序写的方式写入所述共享日志文件。
3.根据权利要求1所述的方法,其特征在于,所述多个进程属于不同的复制组。
4.根据权利要求1所述的方法,其特征在于,所述多个进程包括主进程和/或从进程。
5.根据权利要求1所述的方法,其特征在于,所述非暂态存储介质为磁盘。
6.根据权利要求3所属的方法,其特征在于,所述要写入日志数据的进程的标识为该进程对应的复制组的标识。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述分布式存储系统是基于分布式一致性协议raft的分布式存储系统。
8.一种用于在分布式存储系统中写入日志数据的装置,该分布式系统中创建有用于在同一非暂态存储介质上存取数据的多个进程,其特征在于,所述装置包括:
写入模块,用于将所述多个进程的日志数据分别写入同一共享日志文件,该共享日志文件存储在所述同一非暂态存储介质上。
9.根据权利要求8所述的装置,其特征在于,所述写入模块包括:
获取模块,用于获取要写入日志数据的进程的标识;
顺序写入模块,用于将要写入日志数据的进程的标识和对应的日志数据采用顺序写的方式写入所述共享日志文件。
10.根据权利8所述的装置,其特征在于,所述多个进程属于不同的复制组。
11.根据权利8所述的装置,其特征在于,所述多个进程包括主进程和/或从进程。
12.根根据权利8所述的装置,其特征在于,所述非暂态存储介质为磁盘。
13.根据权利要求10所属的装置,其特征在于,所述要写入日志数据的进程的标识为该进程对应的复制组的标识。
14.根据权利要求8至13中任一项所述的装置,其特征在于,所述分布式存储系统是基于分布式一致性协议raft的分布式存储系统。
15.一种分布式数据存储系统,该分布式系统中创建有用于在同一非暂态存储介质上存取数据的多个复制组,其特征在于,所述分布式存储系统包括如权利要求8至14中任一项所述的装置。
16.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至7中任一权利要求所述的方法。
17.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1至7中任一权利要求所述的方法。
CN201810958830.3A 2018-08-22 2018-08-22 在分布式存储系统中写入日志数据的方法 Active CN109347899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810958830.3A CN109347899B (zh) 2018-08-22 2018-08-22 在分布式存储系统中写入日志数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810958830.3A CN109347899B (zh) 2018-08-22 2018-08-22 在分布式存储系统中写入日志数据的方法

Publications (2)

Publication Number Publication Date
CN109347899A true CN109347899A (zh) 2019-02-15
CN109347899B CN109347899B (zh) 2022-03-25

Family

ID=65291997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810958830.3A Active CN109347899B (zh) 2018-08-22 2018-08-22 在分布式存储系统中写入日志数据的方法

Country Status (1)

Country Link
CN (1) CN109347899B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008103A (zh) * 2019-04-10 2019-07-12 苏州浪潮智能科技有限公司 第三方应用程序的日志收集方法、系统、装置及存储介质
CN111563017A (zh) * 2020-04-28 2020-08-21 北京字节跳动网络技术有限公司 数据处理方法及装置
CN112363675A (zh) * 2020-11-18 2021-02-12 苏州元核云技术有限公司 基于分布式存储系统的控制方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183323A (zh) * 2007-12-10 2008-05-21 华中科技大学 一种基于指纹的数据备份系统
CN103838624A (zh) * 2013-12-16 2014-06-04 浪潮电子信息产业股份有限公司 一种基于Linux消息队列的日志处理方法
CN104252405A (zh) * 2013-06-26 2014-12-31 腾讯科技(深圳)有限公司 日志信息的输出方法及装置
CN104657366A (zh) * 2013-11-18 2015-05-27 深圳市腾讯计算机系统有限公司 海量日志写入数据库的方法、装置和日志容灾系统
US20160301753A1 (en) * 2015-04-10 2016-10-13 Nathan Auch Distributed Shared Log For Modern Storage Servers
CN108255674A (zh) * 2017-12-31 2018-07-06 广东欧珀移动通信有限公司 多进程浏览器进程日志收集方法、装置以及移动终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183323A (zh) * 2007-12-10 2008-05-21 华中科技大学 一种基于指纹的数据备份系统
CN104252405A (zh) * 2013-06-26 2014-12-31 腾讯科技(深圳)有限公司 日志信息的输出方法及装置
CN104657366A (zh) * 2013-11-18 2015-05-27 深圳市腾讯计算机系统有限公司 海量日志写入数据库的方法、装置和日志容灾系统
CN103838624A (zh) * 2013-12-16 2014-06-04 浪潮电子信息产业股份有限公司 一种基于Linux消息队列的日志处理方法
US20160301753A1 (en) * 2015-04-10 2016-10-13 Nathan Auch Distributed Shared Log For Modern Storage Servers
CN108255674A (zh) * 2017-12-31 2018-07-06 广东欧珀移动通信有限公司 多进程浏览器进程日志收集方法、装置以及移动终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李纪松等译: "《Oracle8i数据库管理员手册》", 31 July 2000 *
辛阳等编著: "《大数据技术原理与实践》", 31 January 2018 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008103A (zh) * 2019-04-10 2019-07-12 苏州浪潮智能科技有限公司 第三方应用程序的日志收集方法、系统、装置及存储介质
CN111563017A (zh) * 2020-04-28 2020-08-21 北京字节跳动网络技术有限公司 数据处理方法及装置
CN112363675A (zh) * 2020-11-18 2021-02-12 苏州元核云技术有限公司 基于分布式存储系统的控制方法及系统

Also Published As

Publication number Publication date
CN109347899B (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
US9292214B2 (en) Systems and methods for migrating data
CN110008045A (zh) 微服务的聚合方法、装置、设备及存储介质
CN109597640B (zh) 一种应用程序的账号管理方法、装置、设备和介质
CN108874506A (zh) 虚拟机直通设备的热迁移方法和装置
CN110417575A (zh) 运维监控平台的告警方法、装置和计算机设备
CN109241015A (zh) 用于在分布式存储系统中写入数据的方法
CN109271358A (zh) 数据汇总方法、查询方法、装置、设备及存储介质
CN109347899A (zh) 在分布式存储系统中写入日志数据的方法
CN110287146A (zh) 应用下载的方法、设备和计算机存储介质
CN110413413A (zh) 一种数据写入方法、装置、设备及存储介质
CN109495549A (zh) 一种应用拉活的方法、设备和计算机存储介质
CN109218393A (zh) 一种推送的实现方法、装置、设备和计算机存储介质
CN107817962B (zh) 一种远程控制方法、装置、控制服务器及存储介质
CN109145164A (zh) 数据处理方法、装置、设备和介质
CN107451271A (zh) 一种哈希表处理方法、装置、设备及存储介质
CN110471740A (zh) 执行机器学习任务的方法、装置、设备和计算机存储介质
CN109284108A (zh) 数据存储方法、装置、电子设备及存储介质
CN110232969A (zh) 医学影像上传至云服务器的方法、装置、终端和存储介质
CN108399128A (zh) 一种用户数据的生成方法、装置、服务器及存储介质
CN109933254A (zh) 展示阅读内容的方法、设备和计算机存储介质
US10884888B2 (en) Facilitating communication among storage controllers
CN109246082B (zh) 数据传输方法、装置、电子设备及存储介质
CN110489210A (zh) 创建虚拟机的方法、装置、设备和计算机存储介质
CN106161501A (zh) 虚拟桌面的数据共享方法和装置
CN109241059A (zh) 一种点云数据的构造方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20190215

Assignee: Beijing Intellectual Property Management Co.,Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: X2023110000096

Denomination of invention: Method of Writing Log Data in Distributed Storage Systems

Granted publication date: 20220325

License type: Common License

Record date: 20230821

EE01 Entry into force of recordation of patent licensing contract