WO2023143039A1

WO2023143039A1 - 一种数据处理方法及装置

Info

Publication number: WO2023143039A1
Application number: PCT/CN2023/071510
Authority: WO
Inventors: 屈欢; 高军; 高超
Original assignee: 华为技术有限公司
Priority date: 2022-01-28
Filing date: 2023-01-10
Publication date: 2023-08-03
Also published as: CN116560827A

Abstract

一种数据处理方法及装置，在该方法中，第一计算设备至少运行有主操作系统和第一从操作系统；主操作系统在第一从操作系统发生故障时，将该请求发送给第二从操作系统；其中，第二从操作系统可以是第一计算设备上除该第一从操作系统之外运行的一个从操作系统，也可以是第二计算设备上运行的一个从操作系统；第二从操作系统对该请求进行处理。在本申请中，主操作系统用于为外部设备提供服务，如接收请求，第二从操作系统、第二从操作系统均用于处理请求，当第一从操作系统出现故障时，主操作系统可以将请求发送给第二从操作系统处理，不会因为第一从操作系统出现内存错误，导致业务中断，从而提高系统可靠性。

Description

一种数据处理方法及装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种数据处理方法及装置。

背景技术

内存是服务器主板较容易出错的器件之一，随着内存容量以及内存速度的翻倍，内存出错的概率也将倍增。而内存出错可能会导致系统故障，系统恢复通常需要较长的时间，对业务的影响较大。

发明内容

本申请提供一种数据处理方法及装置，在不改变设备原有内存的情况下，也可以提高系统可靠性，降低内存错误对业务的影响。

第一方面，本申请实施例提供了一种数据处理方法，该方法可以应用于第一计算设备，所述第一计算设备至少运行有主操作系统和第一从操作系统；在该方法中，第一计算设备的主操作系统，在第一从操作系统故障无法处理请求时，将请求发送给第二从操作系统，其中，第二从操作系统可以是第一计算设备上除第一从操作系统之前运行的一个的从操作系统，也可以是第二计算设备上运行的一个从操作系统；第二从操作系统对该请求进行处理。

通过上述设计，主操作系统用于为外部设备提供服务，如接收请求，第二从操作系统、第二从操作系统均用于处理请求，当第一从操作系统出现故障时，主操作系统可以将请求发送给第二从操作系统处理，不会因为第一从操作系统出现内存错误，导致业务中断，从而提高系统可靠性。

在一种实现方式中，主操作系统的内存可靠性高于任意一个从操作系统的内存可靠性。

通过上述设计，主操作系统用于与客户端通信，当主操作系统的内存可靠性高时，主操作系统出现内存错误的概率便低，只要主操作系统不故障，就可以为客户端提供服务，业务便不会中断，从而提高系统的可靠性，降低内存故障对业务的影响。

在一种实现方式中，第一计算设备包括第一硬件资源组和第二硬件资源组；每一个硬件资源组包含处理器资源和内存资源；第一硬件资源组为主操作系统提供资源；第二硬件资源组为第一从操作系统提供资源。

通过上述设计，主操作系统的硬件资源组和第一从操作系统的硬件资源组不同，以提供配置主操作系统内存类型、内存容量的方式，同时能够保证主操作系统和第一从操作系统之间的硬件隔离，主操作系统不会访问第一从操作系统的内存，主操作系统的内存容量相比于第一计算设备运行单独操作系统时的内存容量要低，出现内存错误的概率也低，提高了主操作系统为客户端提供服务的可靠性。

在一种实现方式中，所述主操作系统的内存使用镜像技术进行配置。

通过上述设计，主操作系统使用镜像等技术配置主操作系统的内存，从而提高主操作系统的内存可靠性，降低因主操作系统访问到内存错误而导致业务中断的概率，提高系统整体的可靠性。

在一种实现方式中，若第一从操作系统未故障，主操作系统将该请求发送给第一从操作系统；第一从操作系统对所述请求进行处理。

在一种实现方式中，前述的请求可以是来自客户端的请求，如写请求或读请求，第二从操作系统处理请求，包括：若所述请求为写请求，则第二从操作系统将请求中携带的待写入数据写入存储设备；或若所述请求为读请求，则第二从操作系统从存储设备获取该请求所请求读取的数据，并将该数据发送至主操作系统。

第二方面，本申请实施例还提供了一种数据处理装置，该数据处理装置具有实现上述第一方面的方法实施例中第一计算设备的功能，有益效果可以参见第一方面的描述此处不再赘述。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中，所述数据处理装置的结构中包括主操作系统实例，第一从操作系统实例，可选的，还可以包括第二操作系统实例，这些实例可以执行上述第一方面方法示例中的相应功能，具体参见方法示例中的详细描述，此处不做赘述，有益效果可以参见第一方面的描述此处不再赘述。

第三方面，本申请实施例还提供了一种数据处理装置，该数据处理装置具有实现上述第一方面的方法实例中第一计算设备的功能，有益效果可以参见第一方面的描述此处不再赘述。所述装置的结构中包括第一处理器、第二处理器、第一存储器和第二存储器，可选的，还可以包括通信接口。所述第一处理器、第二处理器被配置为支持所述数据处理装置执行上述第一方面方法中相应的功能。所述第一存储器与所述第一处理器耦合，所述第二存储器与所述第二处理器耦合，其保存所述通信装置必要的计算机程序指令和数据。所述数据处理器装置的结构中还包括通信接口，用于与其他设备进行通信，如可以将来自客户端的请求发送给第二计算设备，或接收第二计算设备发送的客户端所请求的数据，有益效果可以参见第一方面的描述此处不再赘述。

第四方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面以及第一方面的各个可能的实施方式中第一计算设备的方法，有益效果可以参见第一方面的描述此处不再赘述。

第五方面，本申请还提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面以及第一方面的各个可能的实施方式中第一计算设备的方法，有益效果可以参见第一方面的描述此处不再赘述。

第六方面，本申请还提供一种计算机芯片，所述芯片与存储器相连，所述芯片用于读取并执行所述存储器中存储的软件程序，执行上述第一方面以及第一方面的各个可能的实施方式中第一计算设备的方法，有益效果可以参见第一方面的描述此处不再赘述。

第七方面，本申请实施例还提供了一种数据处理系统，该系统至少包括第一计算设备和第二计算设备，第一计算设备至少运行有第一主操作系统和第一从操作系统，第二计算设备至少运行有第二主操作系统和第二从操作系统；第一计算设备具有实现上述第一方面的方法实例中第一计算设备的功能，第二从操作系统，用于在第一从操作系统故障无法处理请求时，接收第一主操作系统发送的请求，并处理该请求，有益效果可以参见第一方面的描述此处不再赘述。

第八方面，本申请实施例还提供了一种系统，该系统包括客户端和第一计算设备，第一计算设备至少运行有主操作系统和第一从操作系统；客户端，用于向所述第一计算设备发送请求，所述请求用于请求访问数据；第一计算设备具有实现上述第一方面的方法实例中第一计算设备的功能，有益效果可以参见第一方面的描述此处不再赘述。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

附图说明

图1为本申请实施例提供的一种系统的硬件架构示意图；

图2为本申请实施例提供的一种控制器的软件架构示意图；

图3为本申请实施例提供的另一种系统架构示意图；

图4为本申请实施例提供的一种数据处理方法所对应的流程示意图；

图5为本申请实施例提供的一种数据处理方法的场景示意图；

图6为本申请实施例提供的另一种数据处理方法的场景示意图；

图7为本申请实施例提供的一种数据处理装置的结构示意图。

具体实施方式

为了使本申请更容易被理解，下面首先对本申请实施例涉及的一些基本概念进行解释。需要说明的是，这些解释是为了便于本领域技术人员理解，并不是对本申请所要求的保护范围构成限定。

1，用户态/内核态，所谓的用户态和内核态是指操作系统的运行状态。目前，计算机系统中一般实行分级保护，即根据计算机系统中受影响的严重程度而区分某些操作必须由某些具有相应权限的角色来执行，例如直接访问硬件和修改硬件工作模式等操作需要最高权限来执行。

计算机的这种保护需要CPU和操作系统共同配合完成，现代CPU一般会提供多种运行权限级别，操作系统一般也分为多个运行状态以与CPU配合，操作系统常见的状态是用户态和内核态，其中内核态一般拥有最高权限，所有指令和操作都被CPU允许执行；而用户态一般都是较低权限，在此状态下软件程序只能执行有限的指令和操作，高危操作不被CPU硬件允许，例如配置CPU内部控制寄存器、访问内核部分的内存地址等。操作系统需要执行处于不同权限下的程序时，通常会先将CPU的权限状态切换到对应状态，再执行对应的程序。

2，进程，可以是指具有一定独立功能的程序的一次运行活动，或是应用程序运行的载体，也可以理解为，进程为应用程序的运行实例，是应用程序的一次动态执行。例如，当用户运行记事本程序(Notepad)时，该用户就创建了一个用来容纳组成Notepad.exe的代码及其所需调用动态链接库的进程。

3，内存错误，包括可纠正错误(corrected error，CE)和不可纠正错误(uncorrected error，UCE)，其中，可纠正错误是指通过内存错误检查和纠正功能可纠正的错误，反之，不可纠正错误指通过内存错误检查和纠正功能不能纠正的错误。

图1为本申请实施例提供的一种可能适用的系统架构示意图。该系统架构中包括应用服务器100、交换机101、存储系统120。

用户通过应用程序来存取数据。运行这些应用程序的计算机被称为“应用服务器”。应用服务器100可以是物理机，也可以是虚拟机。物理应用服务器包括但不限于桌面电脑、服务器、笔记本电脑以及移动设备。应用服务器通过光纤交换机101访问存储系统120以存取数据。然而，交换机101只是一个可选设备，应用服务器100也可以直接通过网络与存储系统120通信。

图1所示的存储系统120是一个集中式存储系统。集中式存储系统的特点是有一个统一的入口，所有从外部设备来的数据都要经过这个入口，这个入口就是集中式存储系统的引擎121。引擎121是集中式存储系统中最为核心的部件，许多存储系统的高级功能都在其中实现。

如图1所示，引擎121中有一个或多个控制器。图1以引擎包含两个控制器为例予以说明，控制器0与控制器1之间具有镜像通道，使得两个控制器可以互为备份。引擎121还包含前端接口125和后端接口126，其中前端接口125用于与应用服务器100通信，为应用服务器100提供存储服务。而后端接口126用于与硬盘134通信，以扩充存储系统的容量。通过后端接口126，引擎121连接更多的硬盘134，从而形成一个非常大的存储资源池。

控制器1(以及其他图1中未示出的控制器)的硬件组件和软件结构与控制器0类似，这里以控制器0为例进行说明。

在硬件上，如图1所示，控制器0至少包括处理器123、内存124。处理器123是一个中央处理器(central processingunit，CPU)，用于处理来自存储系统外部(服务器或者其他存储系统)的数据访问请求，也用于处理存储系统内部生成的请求，如读请求、写请求，示例性的，处理器123通过前端端口125接收应用服务器100发送的写请求时，处理器123可以优先将数据存储在内存中，如存储在内存124中。当内存124中的数据量达到一定阈值时，处理器123通过后端端口126将内存124中存储的数据发送给硬盘134进行持久化存储。应注意，图1中仅示出了一个处理器123，在实际应用中，CPU 123的数量往往有多个，其中，一个处理器123又具有一个或多个CPU核。本实施例不对CPU的数量，以及CPU核的数量进行限定。

内存124是指与处理器直接交换数据的内部存储器，它可以随时读写数据，而且速度很快。内存124包含多种类型的存储器，例如随机存取存储器(random access memory，RAM)、只读存储器(Read Only Memory,ROM)。举例来说，随机存取存储器包括但不限于：动态随机存取存储器(Dynamic Random Access Memory,DRAM)、双倍数据速率同步动态随机存储器(double data rate，DDR)、静态随机存取存储器(Static Random Access Memory，SRAM)等。只读存储器包括但不限于：可编程只读存储器(Programmable Read Only Memory,PROM)、可抹除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)等。实际应用中，控制器0中可配置多个内存124，以及不同类型的内存124。本实施例不对内存124的数量和类型进行限定。

内存124作为操作系统(operating system，OS)或其他正在运行中的程序的临时数据存储器，其中存储有程序代码，处理器123执行内存124中存储的程序代码，以实现程序代码所设计的功能。若在处理器123的运行过程中出现内存错误，则会引起进程故障，需要重新启动进程，导致业务中断，更严重的情况，需要重启操作系统，增加业务恢复的时长。可以看出，内存124对系统的正常运行起着至关重要的作用。然而，随着内存容量和频率的增大，出现内存错误的概率在逐步提升，导致系统的可靠性难以保障，对业务的影响不可估量。

为此，本申请实施例提供了一种数据处理方法，用于提高系统可靠性，降低内存错误对业务的影响。

在介绍本申请实施例提供的数据处理方法之前，首先对该数据处理方法所适用的软件结构进行介绍。如下结合图2，以图1中所示系统中的控制器0为例，对本申请实施例提供的控制器0的软件结构进行介绍。

在软件层面，如图2所示，控制器0安装并运行有至少两个操作系统(图2仅示出两个操作系统，但本申请实施例对此不做限定)，该至少两个操作系统包括一个主操作系统(master OS)和一个或多个从操作系统(slave OS)(图2仅示出一个从操作系统，但本申请实施例对此不做限定)。

在本申请中，主操作系统和从操作系统的功能不同、内存可靠性等级不同，如下分别进行介绍：

一，主操作系统：

主操作系统，用于为用户设备(如应用服务器100)提供服务，如提供前述的存储服务时，主操作系统(或者说运行主操作系统的处理器)通过前端接口125接收应用服务器100发送的请求，如读请求、写请求等。

具体的，主操作系统上用于为外部设备提供服务，如图2中，主操作系统用于提供前端协议收发服务，这里的前端协议可以是前端接口125与应用服务器100交互所使用的通信协议，该服务用于通过前端接口125与应用服务器100通信。通常，为用户提供服务的进程或软件运行在操作系统的用户态，下文相似之处不再赘述，与运行在用户态的进程对应的，主操作系统还可以运行有前端外设驱动，前端外设驱动运行在内核态，用于驱动前端接口125与应用服务器100通信。

主操作系统还可以用于管理从操作系统，如系统上电首先拉起主操作系统，主操作系统为从操作系统分配硬件资源、检测从操作系统运行是否正常，如通过监听从操作系统的心跳检查从操作系统是否出现故障，在检测到从操作系统出现故障时，可以以重新启动从操作系统等方式使其恢复正常运行。示例性地，如图2中，主操作系统上运行的Mgmt OS进程，用于提供管理从操作系统的功能。

主操作系统还具有与其他控制器(如控制器1)通信的功能，示例性地，如图2中，主操作系统还提供转发服务，用于与控制器1交互，如将从应用服务器100接收到的请求，转发给控制器1，由控制器1对该请求进行处理。

主操作系统还包括内存管理驱动，用于对主操作系统的内存进行管理，内存管理策略如内存镜像、内存检验，如在内存中做分布式奇偶校验的独立磁盘结构(raid)等，其中，内存镜像与硬盘的热备份类似，内存镜像是将内存数据做两个拷贝，分别放在主内存和镜像内存中，这样，主内存中的内存数据出现错误时，还可以从镜像内存获取该数据，从而提高主操作系统的内存可靠性。其中，内存raid是指将数据以块为单位分布到主操作系统的内存中，具体的，将数据和与其相对应的奇偶校验信息存储到组成主操作系统内存的各个内存单元上，并且奇偶校验信息和相对应的数据分别存储于不同的内存单元上。当其中一个内存单元损坏后，利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据，提高内存可靠性。示例性地，内存raid可以是raid4、raid5、raid6、raid10、raid0、raid1，其中，raid5允许一个内存单元损坏，即当一个内存单元损坏时，可以使用其他内存单元中的数据恢复被损坏的数据；raid6允许两个内存单元损坏，具体实施方式或内存raid类型可以参考相关技术的说明，这里不再一一介绍。

除此之外，内存管理还可以提供对内存的基础管理，如内存申请、释放等，本申请对此功能不做具体限定。

二、从操作系统；

从操作系统，用于对数据进行计算或处理，在本申请中，可以用于来自应用服务器100的读请求、写请求等进行处理。示例性地，从操作系统提供的服务包括但不限于：数据面服务进、元数据服务、后端下盘处理服务进。运行在从操作系统内核态的驱动包括但不限于：后端外设驱动、内存管理等。

其中，数据面服务，可以用于对来自应用服务器100的读请求和写请求进行处理，如对于读请求，可以从内存124，或通过后端接口126从硬盘134中获取该读请求所请求读取的数据。又如，对于写请求，可以将该写请求中携带的待写入的数据写入内存124，或通过后端接口126将该数据写入硬盘134，可选的，在将数据写入硬盘134之前，还可以对待写入的数据进行计算或处理，例如重复数据删除、数据压缩及数据校验等。示例性地，数据面服务可以运行在从操作系统的用户态，与此对应的，从操作系统可以通过运行在内核态的后端外设驱动通过后端接口126对硬盘134进行读或写。元数据服务，用于生成元数据。内存管理，用于对从操作系统的内存进行管理，如内存申请、释放等。

需要说明的是，上述仅为举例，主OS和从OS还可以具有比图2示出的更多或更少的功能，比如，主OS还可以包括管理从OS的服务、基础设施服务、调度管理，从OS还可以包括控制面服务、调度服务等。具体的，管理从OS的服务，如用于检测从OS是否故障，若故障则重启从OS，等。基础设施服务用于对基础组件如cpu、线程等进行管理，可以参见相关技术的介绍，此处不再一一枚举，本申请对主操作系统、从操作系统的功能不做具体限定。另外，上述各服务或驱动的名称仅为一种代称，在不同的应用场景中，可以具有不同的名称，本申请对此不做具体限定。

在硬件层面，主操作系统和从操作系统所使用的硬件均来自于控制器0，控制0的硬件结构可以参见图1的介绍，此处不做赘述。具体的，主操作系统和从操作系统分别对应一组硬件，或者说，不同操作系统的硬件之间相互隔离，换言之，主操作系统不会使用从操作系统的硬件，从操作系统也不会使用主操作系统的硬件。

示例性地，硬件分配的过程可以包括：将控制器0的硬件(包括但不限于处理器123、内存124、前端接口125、后端接口126)拆分(或者说隔离)为两部分，以得到两个硬件组(如图2中的硬件组1和硬件组2)，每个硬件组唯一分配给一个操作系统使用，举例来说，假设控制器0包括两个处理器123，则可以将其中一个处理器123分配给主操作系统，用于运行主操作系统。另一个处理器123分配给从操作系统，用于运行从操作系统。又比如，假设控制器0仅包括一个处理器123，该处理器123包括多个核，则可以将该多个核拆分为两部分，其中一部分核分配给主操作系统，剩余的部分核分配给从操作系统。同理，将内存124拆分为两部分，同理，一部分内存分配给主操作系统，其余部分内存分配给从操作系统。

在本申请中，由于主操作系统的功能是与应用服务器100交互，从操作系统用于处理请求，因此，将前端接口125分配给主操作系统，将后端接口126分配给从操作系统。示例性地，这里的硬件拆分可以通过多OS分区技术实现，也可以通过其他方式实现，本申请对此不做具体限定。

简言之，图2中，硬件组1分配给主操作系统使用，硬件组1包括控制器0的部分处理器资源，部分内存资源和前端接口125。硬件组2分配给从操作系统使用，硬件组2包括控制器0的其余部分处理器资源，其余部分内存资源和后端接口126。主操作系统使用硬件组1的硬件，不会使用硬件组2的硬件。同理，从操作系统使用硬件组2的硬件，不会使用硬件组1的硬件。

值得注意的是，上述两个硬件组所包括的硬件的数量或者说容量不一定是均等的，换言之，在拆分硬件时，不需要平均分配，例如，在本申请中，主操作系统的内存容量与从操作系统的内存容量是不同的，甚至，主OS的内存容量远低于从OS的内存容量，即硬件组1包括的内存容量低于硬件组2所包括内存容量，如假设控制器0所包括的内存124的总容量为4GB，分配给主操作系统的内存容量可以是512MB，其余内存(3GB+512MB)全部分配给从操作系统。当然，这只是一个示例，本申请对此不做具体限定。

上述分配方式，将较多的内存分配给从操作系统，可以保证从操作系统处理请求的性能，将相对较少的内存分配给主操作系统，这样，降低了主操作系统中访问到内存错误的概率，发生内存错误概率越低，内存可靠性便越高。这也可以体现出主操作系统与从操作系统的内存可靠性级别不同。在本申请中，主操作系统的内存可靠性高于操作系统。另外，分配给主操作系统的内存的类型与分配给从操作系统的内存的类型可以相同，也可以不同，比如，分配给主操作系统的内存包括SRAM，分配给从操作系统的内存包括SRAM和DRAM等。从而进一步提高主OS的内存可靠性和响应速度。

控制器1的软件结构与控制器0类似，控制器1至少包括一个主操作系统和一个从操作系统，控制器1和控制器0的软件结构可以相同也可以不同，如控制器0和控制器1的软件结构均为包括一个主OS和一个从OS，或者控制器0包括一个主OS和一个从OS，控制器1包括一个主OS和多个从OS，本申请对此不做限定。

上文以图1为例，介绍了本申请实施例所适用的一种系统的硬件结构和软件结构，应注意的是，图1所示的是一种盘控一体的集中式存储系统，引擎121具有硬盘槽位，硬盘134可直接部署在引擎121中，即硬盘134和引擎121部署于同一台设备。可选的，该存储系统120还可以是盘控分离的存储系统，在该系统中，引擎121还可以不具有硬盘槽位，硬盘134需要放置在硬盘框130中，后端接口126与硬盘框130通信。后端接口126以适配卡的形态存在于引擎121中，一个引擎121上可以同时使用两个或两个以上后端接口126来连接多个硬盘框。或者，适配卡也可以集成在主板上，此时适配卡可通过高速串行计算机扩展(peripheral component interconnect express，PCI-E)总线与处理器123通信。

除此之外，本申请实施例提供的数据处理方法除了适用于集中式存储系统，也同样适用于分布式存储系统，如图3所示，为本申请实施例提供的一种分布式存储系统的系统架构示意图，分布式存储系统包括服务器集群。服务器集群包括一个或多个服务器140(图3中示出了三个服务器110，但不限于三个服务器110)，各个服务器140之间可以相互通信。

在硬件上，如图3所示，服务器110至少包括处理器112、内存113、网卡114，可选的，还可以包括和硬盘105。处理器112、内存113、网卡114和硬盘105之间通过总线连接。关于处理器112、内存113、网卡114和硬盘105作用和具体类型可以参见图1中的相关说明，此处不再赘述。在软件层面，每个服务器110的软件结构可以参见对图2所示的控制器0的软件结构的介绍，此处不再赘述。

需要说明的是，图1所示的控制器0、图3所示的服务端110的结构仅为示例，在实际产品中，控制器0、服务端110可能具有更多或更少的组件，比如，控制器0、服务端110还可以包括键盘、鼠标、显示屏等输入/输出设备等。本申请对本申请实施例适用系统中设备的硬件结构不做具体限定，凡是可以安装至少两个操作系统的设备均适用于本申请实施例。

下面以图1至图3所示的系统构架中为例，对本申请实施例提供的数据处理方法应用于图1所示的系统为例，对该方法进行详细说明，该方法可以由图1中的控制器0或控制器1执行，其中，控制器0至少运行有一个主OS和一个从OS，控制器1也至少运行有一个主OS和一个从OS，如下以控制器0为例进行说明。

图4为本申请实施例提供的一种数据处理方法的流程示意图，如图4所示，该方法包括如下步骤：

步骤401，控制器0的主OS接收应用服务器100发送的请求。

在一种可选的实施方式中，主OS可以使用镜像技术对主OS的内存进行配置，示例性地，主OS将处理来自应用服务器100的请求的整个过程所产生的内存数据备份至镜像内存空间，这样，当主OS访问到内存错误时，也可以从镜像内存空间恢复内存数据，不会造成主OS故障，提高主OS的内存可靠性，减少系统故障的概率以及对业务的影响。

步骤402a，主OS在没有检测到控制器0的从OS(记为第一从OS)故障的情况下，将该请求发送至第一从OS。

步骤403a，第一从OS对该请求进行处理。第一从OS对请求的处理流程可以参见下文第二从OS的处理流程，这里不做重复说明。

步骤402b，主OS检测到第一从OS故障。

步骤403b，主OS将该请求发送至第二从OS。

步骤404b，第二从OS对该请求进行处理。

在一种实施方式中，除主OS外，控制器0仅运行有一个从OS，则第二从OS可以为控制器1中运行的一个从OS，请结合图5理解，图5为该控制器0与控制器1交互该请求的传输路径示意图，如图5所示，控制器0的主OS的前端协议服务通过前端接口125接收应用服务器100发送的请求，若第一从OS故障，则前端协议服务将该请求发送给转发服务，转发服务将该请求发送至控制器1的第二从OS。

若该请求为写请求，在一种实施方式中，第二从OS可以先将该写请求中携带的待写入的数据暂时缓存在第二从OS的内存中，当第二从OS的内存的数据量达到一定阈值，第二从OS通过后端接口126，将该内存中的数据发送给硬盘134进行存储，在一种可选的方式中，在将该数据写入硬盘134之前，第二从OS还可以对该数据进行数据处理，如重复数据删除、数据压缩或其他处理等，将处理后得到的数据写入硬盘134，以减少数据所占用的存储空间。元数据服务还可以生成该数据的元数据，并将元数据写入第二从OS的内存或硬盘134(图5未示出)。

若该请求为读请求，则第二从OS获取该读请求所请求读取的数据，示例性地，若第二从OS的内存中存储有该数据，即内存命中，则第二从OS从该内存读取该数据，若内存未命中，则从硬盘134读取该数据，并将读取到的数据返回第一主OS，并将读取到的数据发送给控制器0，由控制器0通过前端接口125将该数据发送给应用服务器100，参见图5中的虚线所示的传输路径。

在另一种可选的实施方式中，控制器0运行有多个从OS，则第二从OS还可以是控制器0上除第一从OS之外的一个从OS，如图6所示，控制器0在检测到第一从OS故障时，将业务切换至控制器0的其他一个从OS(如记为第三从OS)上，由第三从OS对该请求进行处理，其中，请求的传输流程和第三从OS对请求的处理流程可以参见前述的说明，此处不再赘述。

上述设计，将控制器0的硬件拆分，以构造至少两个内存可靠性等级不同的OS，其中，可靠性等级高的主OS用于部署上层业务相关的服务，当可靠性等级较低的从OS访问到内存错误从而产生故障时，主OS能以较快的速度感知从OS出现故障，并将请求切换至其他从OS来处理，如本控制器的其他从OS，或其他控制器的从OS，本领域技术人员通过实验确定，主OS将请求从第一从OS切换至第二从OS的时间可以达到秒级，参见表1，表1为本申请技术人员通过实验得到的一些实验数据。

表1

其中，单OS系统是指在图1所示的硬件架构中，控制器0仅运行一个OS(即单OS)，当该OS的用户态进程访问到UCE时，所需的恢复时长在5秒(second)至3分钟(minute)之间。当该OS的内核态驱动访问到UCE时，所需的恢复时长为2分钟至10分钟。当若控制器0和控制器1均为单OS时，当控制器0发生故障时，控制器1可以接管控制器0的业务，当控制器0发生故障时，控制器1可以接管控制器0的业务，所需的切换时间约30秒，在上述恢复期间或业务切换期间内，业务中断。

而本申请提供的技术方案，由于主OS不用于处理请求，分配给主OS的内存较少，因此可以使用镜像技术或内存raid等方式进行内存管理，进一步提高主OS的内存可靠性，这样，主OS出现内存错误的概率相当低，若主OS检测到从OS出现故障，可以将请求切换至其他从OS，不会因为从操作系统出现内存错误，导致业务中断，并且整个切换时长小于1秒，上层业务仅感知到轻微时延，能够很大程度减少内存故障对业务带来的影响，提高整个系统的可靠性。

基于与方法实施例同一发明构思，本申请实施例还提供了一种数据处理装置，该装置用于执行上述方法实施例中控制器0执行的方法。该装置可以是硬件结构、软件模块、或硬件结构加软件模块。装置700可以由芯片系统实现。本申请实施例中，芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。如图7所示，数据处理装置700包括主操作系统实例701、第一从操作系统实例702；可选的，还可以包括第二从操作系统实例703。

主操作系统实例701，用于在第一从操作系统实例702故障无法处理请求，将所述请求发送给目标从操作系统实例；具体实现方式请参见图4中的步骤402b至步骤403b的描述，其中，目标从操作系统实例为第二从操作系统实例703，或参见图5所示的流程描述此处不再赘述。或目标从操作系统实例为第二计算设备中的从操作系统实例；具体实现方式请参见图6所示的流程描述此处不再赘述。

目标从操作系统实例，用于对所述请求进行处理。具体实现方式请参见图4中的步骤403b的描述，此处不再赘述。

在一种可能的实施方式中，主操作系统实例701，还用于接收客户端设备(如应用服务器100)发送的请求；具体实现方式请参见图4中的步骤401的描述，此处不再赘述。

在一种可能的实施方式中，所述主操作系统实例701的内存可靠性高于第一从操作系统实例702、第二从操作系统实例703的内存可靠性。

在一种可能的实施方式中，所述主操作系统实例701的内存使用镜像技术进行配置。

在一种可能的实施方式中，所述装置700包括第一操作系统实例701和所述第二操作系统实例702时，所述装置700包含第一硬件资源组和第二硬件资源组；每一个硬件资源组包含处理器资源和内存资源；所述第一硬件资源组为所述主操作系统实例701提供资源；所述第二硬件资源组为所述第一从操作系统实例702提供资源。

在一种可能的实施方式中，所述主操作系统实例701还用于：若所述第一从操作系统未故障，将所述请求发送给所述第一从操作系统实例；所述第一从操作系统实例，用于对所述请求进行处理。具体实现方式请参见图4中的步骤402a至步骤403a的描述，此处不再赘述。

本发明实施例提供的数据处理装置可以应用于存储系统中，也可以应用于服务器中，本发明实施例对此不作限定。

本申请实施例还提供一种计算机存储介质，该计算机存储介质中存储有计算机指令，当该计算机指令在数据处理装置上运行时，使得数据处理装置执行上述相关方法步骤以实现上述实施例中的控制器0所执行的方法，参见图4各步骤的描述，此处不再赘述，此处不再赘述。

本申请实施例还提供了一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行上述相关步骤，以实现上述实施例中的控制器0所执行的方法，参见图4各步骤的描述，此处不再赘述，此处不再赘述。

另外，本申请的实施例还提供一种装置，这个装置具体可以是芯片，组件或模块，该装置可包括相连的处理器和存储器；其中，存储器用于存储计算机执行指令，当装置运行时，处理器可执行存储器存储的计算机执行指令，以使芯片执行上述各方法实施例中的控制器0所执行的方法，参见图4各步骤的描述，此处不再赘述，此处不再赘述。

其中，本申请实施例提供的存储设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的控制器0对应的方法，因此，其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果，此处不再赘述。

通过以上实施方式的描述，所属领域的技术人员可以了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其他的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其他的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是一个物理单元或多个物理单元，即可以位于一个地方，或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元(或模块)可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

可选的，本申请实施例中的计算机执行指令也可以称之为应用程序代码，本申请实施例对此不作具体限定。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

本申请实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器，数字信号处理器，专用集成电路(ASIC)，现场可编程门阵列(FPGA)或其它可编程逻辑装置，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器，可选地，该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现，例如数字信号处理器和微处理器，多个微处理器，一个或多个微处理器联合一个数字信号处理器核，或任何其它类似的配置来实现。

本申请实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理器连接，以使得处理器可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管结合具体特征及其实施例对本申请进行了描述，显而易见的，在不脱离本申请的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明，且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包括这些改动和变型在内。

Claims

一种数据处理方法，其特征在于，所述方法应用于第一计算设备，所述第一计算设备至少运行有主操作系统和第一从操作系统；

所述方法包括：

若所述第一从操作系统故障无法处理请求，则所述主操作系统将所述请求发送给第二从操作系统；其中，所述第二从操作系统为第二计算设备中的从操作系统，或所述第二从操作系统为所述第一计算设备中除所述第一从操作系统之外的一个从操作系统；

所述第二从操作系统对所述请求进行处理。
如权利要求1所述的方法，其特征在于，所述主操作系统的内存可靠性高于任意一个从操作系统的内存可靠性。
如权利要求2所述的方法，其特征在于，所述主操作系统的内存使用镜像技术进行配置。
如权利要求1或2所述的方法，其特征在于，所述第一计算设备包含第一硬件资源组和第二硬件资源组；每一个硬件资源组包含处理器资源和内存资源；所述第一硬件资源组为所述主操作系统提供资源；所述第二硬件资源组为所述第一从操作系统提供资源。
如权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：

若所述第一从操作系统未故障，所述主操作系统将所述请求发送给所述第一从操作系统；所述第一从操作系统对所述请求进行处理。
一种数据处理装置，其特征在于，所述装置包括；

所述主操作系统实例，用于在第一从操作系统实例故障无法处理请求，将所述请求发送给第二从操作系统实例；其中，所述第二从操作系统实例为所述第一计算设备中除所述第一从操作系统实例之外的一个从操作系统实例，或所述第二从操作系统实例为第二计算设备中的从操作系统实例；

所述第二从操作系统实例，用于对所述请求进行处理。
如权利要求6所述的装置，其特征在于，所述主操作系统实例的内存可靠性高于任意一个从操作系统实例的内存可靠性。
如权利要求7所述的装置，其特征在于，所述主操作系统实例的内存使用镜像技术进行配置。
如权利要求6或7所述的装置，其特征在于，所述装置至少包含第一硬件资源组和第二硬件资源组；每一个硬件资源组包含处理器资源和内存资源；所述第一硬件资源组为所述主操作系统实例提供资源；所述第二硬件资源组为所述第一从操作系统实例提供资源。
如权利要求6-9任一项所述的装置，其特征在于，所述主操作系统实例还用于：若所述第一从操作系统未故障，将所述请求发送给所述第一从操作系统实例；所述第一从操作系统实例，用于对所述请求进行处理。
一种计算设备，其特征在于，包括第一处理器、第二处理器、第一存储器和第二存储器；

所述第一存储器存储有主操作系统的计算机程序指令；所述第二存储器存储有第一从操作系统的计算机程序指令；

所述第一处理器执行所述第一存储器中的计算机程序指令，以实现如权利要求1至5中任一项所述主操作系统执行的方法；所述第二处理器执行所述第二存储器中的计算机程序指令，以实现如权利要求1至5中任一项所述第一从操作执行的方法。
一种计算机可读存储介质，其特征在于，包括程序代码，所述程序代码包括的指令用于实现如权利要求1至5中任一项所述的方法。
一种计算设备系统，其特征在于，所述系统至少包括第一计算设备和第二计算设备；

所述第一计算设备运行有第一主操作系统和第一从操作系统；所述第二计算设备运行有第二主操作系统和第二从操作系统；

所述第一主操作系统，用于在所述第一从操作系统故障无法处理请求，将所述请求发送给第二从操作系统；

所述第二从操作系统，用于对所述请求进行处理。