CN108351814B - 用于对支持包进行优先化的系统和方法 - Google Patents

用于对支持包进行优先化的系统和方法 Download PDF

Info

Publication number
CN108351814B
CN108351814B CN201680062151.7A CN201680062151A CN108351814B CN 108351814 B CN108351814 B CN 108351814B CN 201680062151 A CN201680062151 A CN 201680062151A CN 108351814 B CN108351814 B CN 108351814B
Authority
CN
China
Prior art keywords
subset
data
storage device
priority
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680062151.7A
Other languages
English (en)
Other versions
CN108351814A (zh
Inventor
M·维尔特
R·拉马萨米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle International Corp
Original Assignee
Oracle International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle International Corp filed Critical Oracle International Corp
Publication of CN108351814A publication Critical patent/CN108351814A/zh
Application granted granted Critical
Publication of CN108351814B publication Critical patent/CN108351814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本文所描述和要求保护的实施方案提供了用于对支持包进行优先化的系统和方法。在一种实施方案中,生成指定存储设备的至少一个故障的故障指示。在存储设备处接收对用于诊断故障原因的支持数据的请求。从支持数据中识别用于诊断故障的低优先级数据。生成优先化支持包,该优先化支持包具有包含低优先级数据的低优先级包子集和包含存储设备的支持数据中的剩余数据的高优先级包子集。高优先级包子集与低优先级包子集分离地通过网络被发送到诊断设备。

Description

用于对支持包进行优先化的系统和方法
技术领域
本公开的方面涉及利用存储装置的网络文件系统。更特别地,本公开的方面涉及用于通过网络从存储设备传递诊断数据的系统和方法。
背景技术
互联网的不断扩展、企业计算网络和系统的扩展和复杂化、存储的并可通过互联网访问的内容(例如电影)的增长、以及许多其它因素继续驱动对大型复杂数据存储系统的需求。因此,随着对数据存储需求的持续增长,正在设计和部署更大且更复杂的存储系统。许多大规模数据存储系统利用包括存储介质的阵列的存储装置。这些存储装置能够存储令人难以置信的数据量。例如,目前一些存储装置可以存储超过2拍字节(petabyte)的数据(超过千万亿字节的数据)。而且,可以将多个存储装置联网在一起以形成集群,这允许存储的数据量的增加。此外,布置在集群中的存储装置可以被配置为对数据进行镜像,使得如果其中存储装置中的一个存储装置变得不可操作,则该数据可在另一个存储位置处可用。
随着组件的数量、用户的数量和数据量的增加,存储系统的大小和复杂性也随之增加。有时,利用具有存储装置的存储系统的客户遇到性能问题。为了诊断性能问题的根本原因并确定补救措施,可以从存储装置中提取诊断数据并将该诊断数据提供给服务工程师以供分析。常规上,诊断数据包括一个大文件,该大文件包括存储装置的状态的庞大综合快照。
由于文件的大小,因此在问题被报告的时间与诊断数据被服务工程师接收到的时间之间的时间长度通常很长。例如,许多常规系统通过网络将来自存储设备的诊断数据传送给服务工程师。通过网络传送这些惊人量的数据需要相当长的时间。例如,在许多情况下,通过网络将诊断数据发送给服务工程师需要几天的时间。因此,在服务工程师能够开始分析数据以进行诊断和解决之前,客户等待相当长的时间。可替代地,为了加快这一过程,一些客户将把诊断数据保存到便携式存储设备中,以便手动交付给服务工程师,这对于客户来说效率低且不方便。
考虑到这些观察结果等,构想和开发了本公开的各个方面。
发明内容
本文所描述和要求保护的实施方案通过提供用于对支持包(support bundle)进行优先化的系统和方法来解决前述问题。在一种实施方案中,生成指定存储设备的至少一个故障的故障指示。在存储设备处接收对用于诊断故障原因的支持数据的请求。从该支持数据中识别用于诊断故障的低优先级数据。生成优先化支持包,该优先化支持包具有包含低优先级数据的低优先级包子集和包含存储设备的支持数据中的剩余数据的高优先级包子集。高优先级包子集通过网络与低优先级包子集分离地被发送到诊断设备。
本文还描述和陈述了其它实施方案。此外,虽然公开了多种实施方案,但是对于本领域技术人员来说,根据示出并描述本公开技术的说明性实施方案的以下具体实施方式,本公开技术另外其它的实施方案将是显而易见的。如将认识到的,本公开的技术能够在各个方面进行修改,所有这些修改不脱离本公开技术的精神和范围。因此,附图和具体描述本质上将被认为是说明性的而不是限制性的。
附图说明
图1是被配置为对用于通过网络传送以用于诊断和解决的支持包进行优先化的示例存储系统。
图2是示例优先化支持包的框图。
图3图示了用于通过网络发送诊断数据的示例操作。
图4是可以实现本公开技术的各种系统和方法的示例计算机系统。
具体实施方式
本公开的方面涉及用于对用于诊断和解决存储设备的一个或多个故障的支持包进行优先化的系统和方法。通常,与存储设备的故障有关的诊断数据在多个阶段中被传递到诊断设备,以便于快速诊断故障的原因,从而导致更快的解决和提高的客户满意度。在一个方面,响应于存储设备的故障指示,生成包含诊断数据的优先化支持包。优先化支持包包括一个或多个包子集,每个包子集包含存储在存储设备上的诊断数据的一部分。包子集被分离地发送到诊断设备,其中首先是包含对于早期诊断故障的原因最有价值的数据的包子集,接下来是具有较低优先级数据的包子集。存储设备自动地将诊断数据优先化到一个或多个包子集中。在一个方面,识别用于诊断故障的原因的低优先级数据并且该低优先级数据被包括在低优先级包子集中。剩余的诊断数据被包括在高优先级包子集中,该高优先级包子集被首先发送到诊断设备用于诊断和解决存储设备的故障。
本文公开的各种系统和方法通常提供生成和发送用于故障诊断和解决的优先化支持包。本文讨论的示例实施方案参考存储设备,诸如存储装置。但是,本领域技术人员将认识到的是,本公开技术在各种网络或计算环境中适用于这些环境的一个或多个组件。为了详细讨论生成用于通过网络传送以用于诊断和解决存储设备的一个或多个故障的优先化支持包,现在参考图1。
如可以从图1中理解的,示例存储系统100包括存储网络102、客户端网络104和诊断设备106。存储网络102可由客户端网络104使用网络108访问。但是,将认识到的是,各种网络可以包括集成网络,并且网络之间的连接仅仅表示一种可能的网络拓扑。所描绘的网络102、104和108本质上也可以是局域的或地理上分散的,诸如大型私有企业网络或互联网。
诊断设备106为存储系统100提供各种故障诊断和解决以及支持服务及其它功能。诊断设备106可以被包括在存储网络102、客户端网络104和/或经由网络108连接的另一个网络中。此外,诊断设备106可以直接连接到各种网络或网络内的设备。因此,存储系统100内有可能可以存在许多独特的终端或计算元件,并且可以通过这些终端或计算元件来执行诊断功能。
在一种实施方案中,客户端网络104包括将一个或多个客户端设备116连接到网络108的一个或多个服务器114。服务器114可以是单个服务器、多个服务器(其中每个这样的服务器是物理服务器或虚拟机)、或者物理服务器和虚拟机两者的集合。虚拟机是像物理机器一样执行程序的机器或组件(例如,计算设备)的软件实现。例如,虚拟机可以模拟操作系统。
客户端设备116和诊断设备106通常可以是能够与网络108进行交互的任何形式的计算设备,诸如终端、工作站、个人计算机、便携式计算机、移动设备、智能电话、平板电脑、多媒体控制台等。在一些实施方案中,客户端网络104、存储网络102和/或诊断设备106包括一个或多个用户界面,诸如:浏览器用户界面(BUI),其允许客户端与存储网络102交互以访问数据;命令行界面(CLI),其作为用于监视和管理存储网络102的控制台应用;代表性状态转移(REST)应用程序编程接口(API),其用于使用标准化接口和协议交换资源的表示;等等。
在一种实施方案中,存储网络102包括一个或多个存储装置110,每个存储装置110包括存储介质112。通常,存储装置110管理存储介质112上的数据的存储,存储介质112可以涉及旋转介质(例如,盘驱动器)以及各种形式的固态存储器。在一种实施方案中,存储装置110是ZFS存储装置,ZFS存储装置涉及由Sun
Figure GDA0001843002860000041
在2005年设计的组合文件系统和卷管理器,允许数据完整性验证和修复、高存储容量以及许多其它特征和优点。虽然本文在作为示例的ZFS存储装置的上下文中进行讨论,但是存储装置110可以是任何存储装置。
基于ZFS的系统利用具有一个或多个存储池的存储池层,该存储池层包括由块设备(诸如存储介质112)构造的虚拟设备。块设备是以块的形式移动数据的任何设备,该设备可以是但不限于,硬盘驱动器、固态驱动器、光驱动器、磁驱动器和其它可寻址的存储器区域。虚拟设备可以跨越多个块设备或卷,并且存储池可以包括一个或多个虚拟设备,每个虚拟设备包括存储介质的一个或多个分区或一个或多个存储介质。存储装置110包括作为文件系统允许客户端设备116与存储装置110进行交互的接口层。内核管理文件系统请求并将它们转换成用于控制存储装置110上的资源的数据处理指令。
去往和来自存储装置110的业务通常由位于存储装置110或存储网络102内的一个或多个专用存储服务器来管理。由存储装置110采用的用于访问内容(包括文件、目录及它们相关联的元数据)的公共协议是网络文件系统(NFS)。NFS是广泛使用的分布式文件系统协议,最初由Sun
Figure GDA0001843002860000051
在1984年开发,NFS允许客户端网络104通过提供允许客户端设备116进行以下操作的编程接口来无缝地访问所存储的数据:创建和删除文件;读取和写入文件;执行文件内的搜索;创建和删除目录;管理目录内容;以及执行其它文件、目录或内容操作。由客户端设备116使用的操作系统被配置为与NFS编程接口进行通信以管理文件系统以及在执行的应用与存储装置110中驻留的数据之间的交互。通常,NFS系统管理文件系统元数据并提供对文件和目录的访问。文件系统元数据描述存储介质112上的文件和目录的位置。存储装置110维护正在由客户端网络104执行的当前操作的日志,该日志被维护在日志文件中。
随着存储系统100的大小和复杂度增加,可能经历在具有存储系统100的复杂性的任何环境中发生的故障问题和/或性能问题。用于解决存储装置110的故障的常规诊断方法通常是劳动密集型的和耗时的,因为在支持数据在存储装置110上被收集并被发送到诊断设备106之前,对服务工程师所需的支持数据的诊断分析无法开始。当诊断分析被延迟而支持数据正在被收集和传送时,客户满意度降低。
因此,存储装置110对支持数据(包括存储装置110的系统状态)的重要性进行优先化,并且生成包括一个或多个包子集的优先化支持包118,每个包子集包含支持数据的一部分。存储装置110根据包子集内包含的支持数据的优先级将包子集发送到诊断设备106。因此,对诊断最有价值的支持数据被首先收集并传送到诊断设备106,从而使得诊断分析能够更早开始。
在一些情况下,可以在将剩余的支持数据传送到诊断设备106之前诊断和解决存储装置110的故障原因。这是因为优先化支持包118作为整体可以包括支持数据的几十个模块,并非需要这些模块的全部用来解决存储装置110的许多故障。因此,参考图1和图2,优先化支持包118将支持数据的低优先级数据200和支持数据中的其它剩余数据202分离到一个或多个单独的包子集中。
例如,通常仅需要文件系统元数据转储(dump)来诊断和解决存储装置110的少部分故障,但是文件系统元数据转储包括大部分支持数据。因此,在一种实施方案中,存储装置110从支持数据中识别文件系统元数据转储,并且生成优先化支持包118,其中文件系统元数据转储被识别为低优先级数据200并且被包括在与剩余支持数据202分离的低优先级包子集中。存储装置110以一个或多个包子集将剩余支持数据202发送到诊断设备106,其中低优先级包子集包含正在被单独发送的文件系统元数据转储。因此,传送和诊断的延时减少,从而增加了客户满意度。
在一种实施方案中,存储装置110识别故障并且通过到客户端设备116、诊断设备106和/或部署在存储系统100中的其它设备的遥测路径来自动报告故障。故障可以替代地或附加地通过监视处理器的其它硬件和/或软件(诸如集成无人职守管理器(IntegratedLights Out Manager,ILOM))来报告。因此,与针对存储系统100的组件的故障和其它服务相关问题有关的通知可以在这些故障和问题发生时提供。一旦接收到故障指示,就在存储装置110接收到对支持数据的请求。该请求可以自动或手动生成并从存储系统100的各种组件被发送,组件包括但不限于存储装置110、客户端设备116、诊断设备106等。在一种实施方案中,响应于故障指示而生成服务请求,并且服务工程师指示客户端从客户端设备116向存储装置110发送命令或直接收集和发送支持数据。
对支持数据的请求可以指定诊断故障所需的支持数据的类型。例如,请求可以指定存储装置110的内核核心文件、存储装置110的日志或跟踪文件、存储网络102的光纤通道端口的设备状态、和/或基于故障的性质的其它类型的支持数据。在一种实施方案中,响应于包含所请求的支持数据的请求而生成优先化支持包118。
为了减少收集和发送优先化支持包118的时间,存储装置110基于支持数据如何在存储装置110中被内核考虑和分区而将支持数据隔离到一个或多个包子集中。例如,当创建转储文件时,存储装置110的内核考虑多个区段的内容,包括,内核核心镜像数据、用户进程相关数据和文件系统元数据。
文件系统元数据通常是在诊断分析中最大且最不经常使用的。例如,通常可以使用关于存储装置110的系统配置的状态信息来诊断和解决涉及存储介质112的故障;通常可以使用软件的恐慌(panic)代码来诊断和解决系统恐慌的故障;可以使用与存储网络102的控制器相关的日志文件来诊断和解决涉及关于控制器的硬件故障的故障;并且需要文件系统元数据来诊断和解决故障的较不常见实例中的一个实例涉及文件系统中的数据损坏。
因此,在一种实施方案中,存储装置110将文件系统元数据识别为低优先级数据200,并将低优先级数据200与所有其它数据202隔离,所有其他数据202包括内核文件、进程文件、日志文件、跟踪文件等。存储装置110将其它数据202与包含低优先级数据200的低优先级包子集分离地、作为一个或多个高优先级包子集发送到诊断设备106,这些高优先级包子集可以基于内容被进一步优先化。在一种实施方案中,创建了两个文件,包含文件系统元数据的低优先级包子集和包含剩余支持数据的高优先级包子集,并且两个文件被分离地上传或以其它方式通过网络108发送到诊断设备106。
在一种实施方案中,优先化支持包118的每个包子集被独立地创建并上传到诊断设备106。包子集的传送可以并行运行并且以独立的速率完成。可以使用客户端设备116和/或诊断设备106来分离地重试、取消、下载和删除每个包子集的传送。在一种实施方案中,BUI和/或CLI报告优先化支持包118的每个包子集的上传路径,并跟踪每个上传的进度以向客户端提供状态。在每个包子集完成之后,BUI和/或CLI可以生成警报,其中结果指示上传是正确还是失败。在一种实施方案中,REST API为每个包子集创建命令返回句柄。
在一种实施方案中,低优先级数据200被识别并隔离到低优先级包子集中,并且剩余数据202被收集到高优先级包子集中并且被首先传送到诊断设备106。换句话说,存储装置110识别诊断分析不太可能需要的支持数据,而非识别诊断分析所需的支持数据。高优先级包子集通常明显小于低优先级包子集,因此与低优先级包子集的传送时间(例如,按天计)相比,高优先级包子集的传送时间是最小的(例如,按小时计)。因此,一旦在诊断设备106处接收到高优先级包子集,诊断分析就可以开始,并且在一些情况下,在诊断设备106处接收到低优先级包子集之前就可以得到解决。在这种情况下,低优先级包子集的上传可以被取消或以其他方式忽略。因此,在多个优先化文件中收集和上传优先化支持包118减少了诊断和解决之前的时间,从而提高了客户满意度。
转到图3,图示了用于通过网络发送诊断数据的示例操作300。在一种实施方案中,操作302生成指定可以是存储装置的存储设备的至少一个故障的故障指示。操作304在存储设备处接收对用于诊断故障原因的支持数据的请求。在一种实施方案中,操作304从客户端设备接收命令。
操作306从存储设备的支持数据中识别用于诊断故障原因的低优先级数据,并且操作308生成优先化支持包,优先化支持包具有包含低优先级数据的低优先级包子集和包含支持数据中的剩余数据的高优先级包子集。低优先级数据可以包括文件系统元数据,并且剩余数据可以包括内核核心文件或处理文件中的至少一个。操作310将高优先级包子集通过网络与低优先级包子集分离地发送到诊断设备。在一种实施方案中,低优先级包子集与高优先级包子集分离地且并行地通过网络被发送。在另一种实施方案中,高优先级包子集在低优先级包子集之前通过网络被发送。操作310可以生成发送每个包子集的进度的状态和/或报告每个包子集的上传路径。
参考图4,提供了具有可以实现本文讨论的各种系统和方法的一个或多个计算单元的示例计算机系统400的具体实施方式。计算机系统400可以适用于诊断设备106、存储装置110、服务器114、客户端设备116以及其它计算设备或网络设备。将认识到的是,这些设备的具体实现可以具有不同的可能的具体计算体系架构,并非所有这些架构都在本文中具体讨论,但是将被本领域普通技术人员理解。
计算机系统400可以是能够执行计算机程序产品以执行计算机过程的计算系统。数据和程序文件可以被输入到计算机系统400,计算机系统400读取文件并执行其中的程序。在图4中示出计算机系统400的一些元件,包括一个或多个硬件处理器402、一个或多个数据存储设备404、一个或多个存储器设备408和/或一个或多个端口408-410。此外,本领域技术人员将认识到的其它元件可以被包括在计算机系统400中,但是未在图4中明确描述或在本文中进一步讨论其他元件。计算机系统400的各种元件可以通过图4中未明确绘出的一个或多个通信总线、点到点通信路径或其它通信手段的方式彼此进行通信。
处理器402可以包括例如中央处理单元(CPU)、微处理器、微控制器、数字信号处理器(DSP)和/或一个或多个内部级别高速缓存。可以存在一个或多个处理器402,使得处理器402包括单个中央处理单元或能够彼此并行执行指令和执行操作的多个处理单元,这些被统称为并行处理环境。
计算机系统400可以是常规计算机、分布式计算机或任何其它类型的计算机,诸如经由云计算体系架构可用的一个或多个外部计算机。当前描述的技术可选地在存储在(一个或多个)数据存储设备404上、存储在(一个或多个)存储器设备406上和/或经由端口408-410中的一个或多个端口通信的软件中实现,从而将图4中的计算机系统400变换成用于实现本文所描述的操作的专用机器。计算机系统400的示例包括个人计算机、终端、工作站、移动电话、平板电脑、膝上型计算机、个人计算机、多媒体控制台、游戏控制台、机顶盒等。
一个或多个数据存储设备404可以包括能够存储在计算机系统400内生成或采用的数据的任何非易失性数据存储设备,诸如用于执行计算机处理的计算机可执行指令,该计算机可执行指令可以包括管理计算机系统400的各种组件的操作系统(OS)和应用程序两者的指令。数据存储设备404可以包括但不限于磁盘驱动器、光盘驱动器、固态驱动器(SSD)、闪存驱动器等。数据存储设备404可以包括具有这种计算机程序产品的可移除数据存储介质、不可移除数据存储介质和/或经由有线或无线网络体系架构可用的外部存储设备,其中计算机程序产品包括一个或多个数据库管理产品、web服务器产品、应用服务器产品和/或其它附加软件组件。可移除数据存储介质的示例包括光盘只读存储器(CD-ROM)、数字通用盘只读存储器(DVD-ROM)、磁-光盘、闪存驱动器等。不可移除数据存储介质的示例包括内部磁性硬盘、SSD等。一个或多个存储器设备406可以包括易失性存储器(例如,动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)等)和/或非易失性存储器(例如,只读存储器(ROM)、闪存等)。
包含实现根据目前描述的技术的系统和方法的机制的计算机程序产品可以驻留在可以被称为机器可读介质的数据存储设备404和/或存储器设备406中。将认识到的是,机器可读介质可以包括能够对供机器执行的、用于执行本公开的任何一个或多个操作的指令进行存储或编码或者能够对通过所述指令来利用的或者与所述指令相关联的数据结构和/或模块进行存储或编码的任何有形非瞬态介质。机器可读介质可以包括存储一个或多个可执行指令或数据结构的单个介质或多个介质(例如,集中式或分布式数据库和/或关联的高速缓存和服务器)。
在一些实施方案中,计算机系统400包括一个或多个端口,诸如输入/输出(I/O)端口408和用于与其它计算设备、网络设备或车辆设备进行通信的通信端口410。将认识到的是,端口408-410可以被组合或分离,并且更多或更少的端口可以被包括在计算机系统400中。
I/O端口408可以连接到I/O设备或其它设备,通过该I/O设备或其他设备,信息被输入到计算机系统400或从计算机系统400输出。这种I/O设备可以包括但不限于一个或多个输入设备、输出设备和/或环境换能器(transducer)设备。
在一种实施方案中,输入设备将人类生成的信号(诸如,人类语音、身体移动、身体触摸或压力等)转换成电信号作为经由I/O端口408到计算机系统400中的输入数据。类似地,输出设备可以将从计算机系统400经由I/O端口408接收到的电信号转换成可以作为输出被人类感测的信号,诸如声音、光和/或触摸。输入设备可以是字母数字输入设备,包括用于经由I/O端口408向处理器402传送信息和/或命令选择的字母数字键和其它键。输入设备可以是另一种类型的用户输入设备,包括但不限于:方向和选择控制设备,诸如鼠标、轨迹球、光标方向键、操纵杆和/或轮;一个或多个传感器,诸如相机、麦克风、位置传感器、朝向传感器、重力传感器、惯性传感器和/或加速度计;和/或触摸敏感显示屏(“触摸屏”)。输出设备可以包括但不限于显示器、触摸屏、扬声器、触感和/或触觉输出设备等。在一些实施方案中,输入设备和输出设备可以是相同的设备,例如,触摸屏的情况。
环境换能器设备将一种形式的能量或信号转换成另一种形式,用于经由I/O端口408输入到计算机系统400或从计算机系统400输出。例如,在计算机系统400内生成的电信号可以被转换成另一种类型的信号,和/或反之亦然。在一种实施方案中,环境换能器设备感测在计算设备400本地或位于远程的环境的特点或方面,诸如光、声音、温度、压力、磁场、电场、化学性质、物理移动、朝向、加速度、重力等。进一步地,环境换能器设备可以生成信号,以对在示例计算设备400本地或位于远程的环境施加某种影响,诸如某个物体(例如,机械致动器)的物理移动、物质的加热或冷却、添加化学物质等。
在一种实施方案中,通信端口410连接到网络,通过该网络,计算机系统400可以接收在执行本文阐述的方法和系统时有用的网络数据以及传送由此确定的信息和网络配置变化。换句话说,通信端口410将计算机系统400连接到一个或多个通信接口设备,这些通信接口设备被配置为通过一个或多个有线或无线通信网络或连接在计算机系统400和其它设备之间发送和/或接收信息。可以经由通信端口410利用一个或多个这种通信接口设备,以直接通过点对点通信路径、通过广域网(WAN)(例如,互联网)、通过局域网(LAN)、通过蜂窝网络或者通过另一种通信手段来与一个或多个其它机器进行通信。进一步地,通信端口410可以与用于电磁信号发送和/或接收的天线或其它链路进行通信。
在示例实施方案中,优先化支持包118以及支持和诊断分析软件以及其它模块和服务可以由存储在数据存储设备404和/或存储器设备406上并由处理器402执行的指令来体现。
图4中所阐述的系统仅仅是可以根据本公开的各方面采用或被配置的计算机系统的一个可能示例。将认识到的是,可以利用存储用于在计算系统上实现目前公开的技术的计算机可执行指令的其它非瞬态有形计算机可读存储介质。
在本公开中,所公开的方法可以被实现为设备可读的指令集或软件。进一步地,应当理解的是,所公开的方法中的步骤的具体顺序或层级是示例方法的实例。基于设计偏好,应当理解的是,方法中的步骤的具体顺序或层级可以被重新排列,同时保留在所公开的主题内。所附方法权利要求以示例顺序呈现各个步骤的元素,并且不一定意味着局限于所呈现的具体顺序或层级。
所描述的公开可以被提供为计算机程序产品或软件,计算机程序产品或软件可以包括其上存储有指令的非瞬态机器可读介质,该指令可以用于将计算机系统(或其它电子设备)编程来执行根据本公开的处理。机器可读介质包括用于以机器(例如,计算机)可读的形式(例如,软件、处理应用)来存储信息的任何机制。机器可读介质可以包括但不限于磁存储介质、光存储介质;磁-光存储介质、只读存储器(ROM);随机存取存储器(RAM);可擦可编程存储器(例如,EPROM和EEPROM);闪存;或适于存储电子指令的其它类型的介质。
虽然已经参考各种实施方案描述了本公开,但是应当理解的是,这些实施方案是示例性的,并且本公开的范围不限于此。许多变化、修改、添加和改进是可能的。更一般而言,已经在特定实施方案的上下文中描述了根据本公开的实施例。在本公开的各种实施例中,可以以不同的方式在块中分离或组合功能,或者用不同的术语来描述功能。这些和其它变化、修改、添加和改进可以落入如以下权利要求中限定的本公开的范围内。

Claims (19)

1.一种用于存储网络中的故障诊断分析的方法,所述方法包括:
生成指定存储设备的至少一个故障的故障指示,所述存储设备通过网络与诊断设备进行通信;
在所述存储设备处接收对用于诊断所述至少一个故障的原因的支持数据的请求,所述支持数据存储在所述存储设备上;
从所述支持数据中识别被分配第一优先级用于诊断所述故障的所述原因的数据;
生成具有第一优先级包子集和第二优先级包子集的优先化支持包,所述第一优先级包子集包含被分配所述第一优先级并且包括所述存储设备的文件系统元数据的数据,并且所述第二优先级包子集包含在被分配所述第一优先级的数据被识别之后所述支持数据的剩余数据,所述剩余数据具有比被分配所述第一优先级的数据更高的优先级并且包括内核核心文件或处理文件中的至少一个;以及
将所述第二优先级包子集与所述第一优先级包子集分离地通过网络发送到所述诊断设备。
2.如权利要求1所述的方法,其中所述第二优先级包子集在所述第一优先级包子集之前通过网络被发送到所述诊断设备。
3.如权利要求1所述的方法,其中所述第一优先级包子集与所述第二优先级包子集分离地且并行地通过网络被发送到所述诊断设备。
4.如权利要求1所述的方法,其中在所述存储设备处通过网络从客户端设备接收对所述支持数据的所述请求。
5.如权利要求1所述的方法,还包括:
生成将所述第二优先级包子集和所述第一优先级包子集中的每一个发送到所述诊断设备的进度的状态。
6.如权利要求1所述的方法,还包括:
生成用于将所述第二优先级包子集和所述第一优先级包子集中的每一个发送到所述诊断设备的网络路径的报告。
7.一种有形非瞬态计算机可读存储介质,其存储用于在计算系统上执行计算机处理的计算机可执行指令,所述计算机处理包括:
生成指定存储设备的至少一个故障的故障指示,所述存储设备通过网络与诊断设备进行通信;
在所述存储设备处接收对用于诊断所述至少一个故障的原因的支持数据的请求,所述支持数据存储在所述存储设备上;
从所述支持数据中识别用于诊断所述故障的所述原因的低优先级数据,其中所述低优先级数据包括所述存储设备的文件系统元数据;
生成具有低优先级包子集和高优先级包子集的优先化支持包,所述低优先级包子集包含所述低优先级数据并且所述高优先级包子集包含在所述低优先级数据被识别之后所述支持数据的剩余数据,其中所述剩余数据包括内核核心文件或处理文件中的至少一个;以及
将所述高优先级包子集与所述低优先级包子集分离地通过网络发送到所述诊断设备。
8.如权利要求7所述的有形非瞬态计算机可读存储介质,其中所述高优先级包子集在所述低优先级包子集之前通过网络被发送到所述诊断设备。
9.如权利要求7所述的有形非瞬态计算机可读存储介质,其中所述低优先级包子集与所述高优先级包子集分离地且并行地通过网络被发送到所述诊断设备。
10.如权利要求7所述的有形非瞬态计算机可读存储介质,其中在所述存储设备处通过网络从客户端设备接收对所述支持数据的所述请求。
11.一种用于存储网络中的故障诊断分析的系统,所述系统包括:
用于分析存储设备故障的原因的诊断设备;以及
通过网络与所述诊断设备进行通信的存储设备,所述存储设备生成具有低优先级包子集和高优先级包子集的优先化支持包,所述低优先级包子集包含从存储在所述存储设备上的支持数据中识别的低优先级数据,其中所述低优先级数据包括所述存储设备的文件系统元数据,并且所述高优先级包子集包含在所述低优先级数据被识别之后所述支持数据的剩余数据,其中所述剩余数据包括内核核心文件或处理文件中的至少一个,所述存储设备将所述高优先级包子集与所述低优先级包子集分离地通过网络发送到所述诊断设备。
12.如权利要求11所述的系统,其中所述高优先级包子集在所述低优先级包子集之前通过网络被发送到所述诊断设备。
13.如权利要求11所述的系统,其中所述低优先级包子集与所述高优先级包子集分离地且并行地通过网络被发送到所述诊断设备。
14.如权利要求11所述的系统,其中在所述存储设备处通过网络从客户端设备接收对所述支持数据的请求。
15.一种存储设备,与用于分析存储设备故障的原因的诊断设备进行通信,所述存储设备包括:
处理器,以及;
存储器,耦合到所述处理器并且所述存储器包括存储在其上的指令,所述指令在由所述处理器执行时,使得所述处理器执行包括以下的操作:
生成指定存储设备的至少一个故障的故障指示,所述存储设备通过网络与诊断设备进行通信;
生成具有低优先级包子集和高优先级包子集的优先化支持包,所述低优先级包子集包含从存储在所述存储设备上的支持数据中识别的低优先级数据,其中所述低优先级数据包括所述存储设备的文件系统元数据,并且所述高优先级包子集包含在所述低优先级数据被识别之后所述支持数据的剩余数据,其中所述剩余数据包括内核核心文件或处理文件中的至少一个;以及
将所述高优先级包子集与所述低优先级包子集分离地通过网络发送到所述诊断设备。
16.如权利要求15所述的存储设备,其中所述操作还包括:将所述高优先级包子集在所述低优先级包子集之前通过网络发送到所述诊断设备。
17.如权利要求15所述的存储设备,其中所述操作还包括:将所述低优先级包子集与所述高优先级包子集分离地且并行地通过网络发送到所述诊断设备。
18.如权利要求15所述的存储设备,其中所述操作还包括:通过网络从客户端设备接收对所述支持数据的请求。
19.一种包括用于执行如权利要求1-6中任一项所述的方法的步骤的部件的装置。
CN201680062151.7A 2015-10-27 2016-10-19 用于对支持包进行优先化的系统和方法 Active CN108351814B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/924,211 2015-10-27
US14/924,211 US10275300B2 (en) 2015-10-27 2015-10-27 Systems and methods for prioritizing a support bundle
PCT/US2016/057586 WO2017074753A1 (en) 2015-10-27 2016-10-19 Systems and methods for prioritizing a support bundle

Publications (2)

Publication Number Publication Date
CN108351814A CN108351814A (zh) 2018-07-31
CN108351814B true CN108351814B (zh) 2021-08-17

Family

ID=57223786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680062151.7A Active CN108351814B (zh) 2015-10-27 2016-10-19 用于对支持包进行优先化的系统和方法

Country Status (4)

Country Link
US (1) US10275300B2 (zh)
EP (1) EP3368982A1 (zh)
CN (1) CN108351814B (zh)
WO (1) WO2017074753A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10275300B2 (en) 2015-10-27 2019-04-30 Oracle International Corporation Systems and methods for prioritizing a support bundle

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1659561A (zh) * 2002-06-07 2005-08-24 爱科来株式会社 故障处理支持系统及与其连接的终端装置
US7047309B2 (en) * 2000-08-23 2006-05-16 International Business Machines Corporation Load balancing and dynamic control of multiple data streams in a network
US7542985B1 (en) * 2008-06-12 2009-06-02 International Business Machines Corporation System and method for log retrieval priority
CN104734871A (zh) * 2013-12-20 2015-06-24 中兴通讯股份有限公司 一种实现故障定位的方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005071196A (ja) * 2003-08-27 2005-03-17 Hitachi Ltd ディスクアレイ装置、及びその障害情報の制御方法
US7613949B1 (en) 2006-06-30 2009-11-03 Boone Lewis A Fault isolation system and method
US7962791B2 (en) 2008-09-03 2011-06-14 International Business Machines Corporation Apparatus, system, and method for automated error determination propagation
US9331962B2 (en) * 2010-06-27 2016-05-03 Valens Semiconductor Ltd. Methods and systems for time sensitive networks
US9083673B2 (en) * 2012-02-10 2015-07-14 The Travelers Indemnity Company Systems, methods, and apparatus for facilitating claims processing
US9619311B2 (en) * 2013-11-26 2017-04-11 International Business Machines Corporation Error identification and handling in storage area networks
CN104750605B (zh) * 2013-12-30 2018-08-14 伊姆西公司 将内核对象信息包括在用户转储中
GB2528485B (en) * 2014-07-23 2016-05-18 Ibm Reducing size of diagnostic data downloads
US9766969B2 (en) * 2015-06-18 2017-09-19 Xerox Corporation Assessing and improving quality of event logs including prioritizing and classifying errors into error-perspective and error-type classifications
US10275300B2 (en) 2015-10-27 2019-04-30 Oracle International Corporation Systems and methods for prioritizing a support bundle

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7047309B2 (en) * 2000-08-23 2006-05-16 International Business Machines Corporation Load balancing and dynamic control of multiple data streams in a network
CN1659561A (zh) * 2002-06-07 2005-08-24 爱科来株式会社 故障处理支持系统及与其连接的终端装置
US7542985B1 (en) * 2008-06-12 2009-06-02 International Business Machines Corporation System and method for log retrieval priority
CN104734871A (zh) * 2013-12-20 2015-06-24 中兴通讯股份有限公司 一种实现故障定位的方法及装置

Also Published As

Publication number Publication date
WO2017074753A1 (en) 2017-05-04
CN108351814A (zh) 2018-07-31
EP3368982A1 (en) 2018-09-05
US20170116098A1 (en) 2017-04-27
US10275300B2 (en) 2019-04-30

Similar Documents

Publication Publication Date Title
US10649988B1 (en) Artificial intelligence and machine learning infrastructure
US11112989B2 (en) Utilizing a decentralized storage network for data storage
US10613791B2 (en) Portable snapshot replication between storage systems
EP3862864B1 (en) Ensuring reproducibility in an artificial intelligence infrastructure
EP3602305A1 (en) Rule-based modifications in a data storage appliance monitor
US11455168B1 (en) Batch building for deep learning training workloads
US8171064B2 (en) Methods and systems for concurrently reading direct and indirect data blocks
JP2014517952A (ja) ストレージシステムにおける信頼性に基づいたデータ割り当てと復旧
JP2016512906A (ja) データを柔軟に配置するための多層記憶管理
JP2016512906A5 (zh)
US11675499B2 (en) Synchronous discovery logs in a fabric storage system
US20220269601A1 (en) Cost Effective Storage Management
US11914894B2 (en) Using scheduling tags in host compute commands to manage host compute task execution by a storage device in a storage system
US10140306B2 (en) System and method for adaptive data placement within a distributed file system
EP3274810B1 (en) Methods and systems for real-time activity tracing in a storage environment
CN108351814B (zh) 用于对支持包进行优先化的系统和方法
US11940954B2 (en) Methods for ensuring correctness of file system analytics and devices thereof
WO2014077451A1 (ko) Iscsi 스토리지 시스템을 이용한 네트워크 분산 파일 시스템 및 방법
US20200344315A1 (en) Methods for selectively compressing data and devices thereof
US20210406219A1 (en) Systems and method for electronic discovery management
US11915047B2 (en) Managing storage device compute operations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant