CN111989896A - 设备的网络中的依赖控制 - Google Patents

设备的网络中的依赖控制 Download PDF

Info

Publication number
CN111989896A
CN111989896A CN201980026927.3A CN201980026927A CN111989896A CN 111989896 A CN111989896 A CN 111989896A CN 201980026927 A CN201980026927 A CN 201980026927A CN 111989896 A CN111989896 A CN 111989896A
Authority
CN
China
Prior art keywords
connection
computer
feature vector
data
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980026927.3A
Other languages
English (en)
Inventor
D·J·奇温
K·O·吉伯特
L·O·皮克依维
T·M·卡斯马
R·G·泰勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ARM Ltd
Arm IP Ltd
Original Assignee
ARM Ltd
Arm IP Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ARM Ltd, Arm IP Ltd filed Critical ARM Ltd
Publication of CN111989896A publication Critical patent/CN111989896A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0883Semiautomatic configuration, e.g. proposals from system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0886Fully automatic configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/143Termination or inactivation of sessions, e.g. event-controlled end of session
    • H04L67/145Termination or inactivation of sessions, e.g. event-controlled end of session avoiding end of session, e.g. keep-alive, heartbeats, resumption message or wake-up for inactive or interrupted session
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/163In-band adaptation of TCP data exchange; In-band control procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Abstract

提供了一种用于针对网络中的电子计算设备节点和连接当中的至少一个提供量化的依赖数据的技术,该技术包括使用仪器检测设备和连接当中的至少一个以生成至少两个数据集,所述至少两个数据集包括设备特征向量和连接特征向量中的至少一个,每个特征向量以适于在网络中的连接上传输的形式被编码;在所述至少两个数据集上执行计算推断以生成量化的依赖数据,该量化的依赖数据包括与设备和连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;以及以能用于选择要执行的动作的形式供应量化的依赖数据,该动作是由所述至少一个电子计算设备节点和所述至少一个连接中的至少一个执行的和对其执行的中的至少一个。

Description

设备的网络中的依赖控制
技术领域
本技术涉及用于为电子数据装置和网络连接提供量化的依赖数据(reliancedata)并且将来自该依赖数据的推断应用于控制系统行为的方法和装置。
背景技术
在常规的计算环境中,有可能建立封闭式系统,其中可以对系统的每个元素置以相当的依赖——例如,在具有仅到组织内的设备的连接性的传统封闭式机房中,对软件和硬件的改变只能由组织的授权人员在进行大量测试和验证之后执行,系统组件的状况和性能通过不受容量限制的通道监视,并且所有入站数据都在输入到系统之前被检查。这样的计算环境不再是常态。在现代计算环境中,并不总是清楚可以对任何特定设备或连接置以多少依赖、如何在不对设备或网络造成不当影响的情况下搜集和传输支持依赖评估的数据、以及可以如何量化这种依赖并使其可用于帮助控制计算环境的组件。
随着计算技术的进步,而且随着处理能力、存储器等资源变得商品化并能够结合到日常生活中使用的对象中,出现了所谓的物联网(IoT)。现在,日常生活中用于运输、家庭生活、购物和锻炼等目的的许多设备现在都能够以在计算的早期、甚至最近无法想象的方式结合某种形式的数据收集、处理、存储和生产。消费者空间中的此类设备的众所周知的示例包括可穿戴健身跟踪设备、汽车监控系统、可以扫描食品产品的代码并存储日期和新鲜度信息以借助向移动(蜂窝)电话等的文本消息建议购买优先级的冰箱,等等。在工业和商业中,过程、场所和机械的仪器化也同样快速发展。在医疗保健、医学研究和生活方式改善方面,可植入设备、远程监视和诊断等技术的发展正在证明是变革性的,并且其潜力才刚刚开始被挖掘。
在IoT环境中,可以有许多可操作的设备和许多网络连接。期望在较高级别(诸如云系统级别)知道有关设备的状态信息,以使得能够做出与置于任何设备或连接上的依赖的级别相关的集中式确定,并因此允许采取适当的动作来控制它们。但是,许多IoT设备在某种程度上受到限制:例如在处理能力、网络访问或电池电量方面,并且在连接的连续性、服务质量等方面,网络连接也可能受到限制。因此,重要的是任何关于设备和连接的状态的状态数据(或元数据)以如下方式处理和传送:最大程度地减少其对受限资源的消耗,从而最大程度地减少对设备和连接的实际业务的干扰,当然,实际业务是要处理和传送用户或客户数据。为了安全起见,还必须使用户或客户数据与元数据保持隔离——可以理解,客户不希望其业务信息暴露在监视或控制流中。
在当前技术上下文中,“依赖”不仅指常规的可靠性-可用性-可服务性(RAS)特点,而且还指对设备或网络连接在可信度、系统健康和/或系统性能范围上的位置的更微妙估计。在设备被用作数据源的情况下,其依赖的量度可以受到其物理和逻辑组件(硬件和软件)的RAS特点的影响,但也可以受到诸如设备可以更新其数据的频率、它对环境噪声的敏感性、它承受软错误(诸如暂时的存储器空间不足)的可能性之类的因素以及许多其它因素的显著影响。同样,在网络连接的情况下,RAS是一个因素,但诸如恶意软件的潜在网络攻击面、连接的间歇性、分组丢失的可能性、信道噪声的存在等因素也是因素。
在针对现代计算环境中控制系统行为时遇到的许多困难的第一种方法中,提供了一种计算机实现的方法,用于为网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个提供量化的依赖数据,该方法包括使用仪器检测设备和连接当中的至少一个以生成至少两个数据集,每个所述数据集包括设备特征向量和连接特征向量中的至少一个,每个特征向量以适于在网络中的连接上传输的形式被编码;在至少两个数据集上执行计算推断以生成量化的依赖数据,该量化的依赖数据包括与设备和连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;并以可用于选择要执行的动作的形式供应量化的依赖数据,该动作是由至少一个电子计算设备节点和至少一个连接中的至少一个执行的和对其执行的中的至少一个。
从不同的角度来看,提供了一种计算机实现的方法,用于生成至少一个数据集以供推断引擎进行分析,该方法包括监视网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个;生成设备特征向量和连接特征向量中的至少一个;以适于在网络中的连接上传输的形式对该特征向量或每个特征向量进行编码;以及向包括推断引擎的系统传输该特征向量或每个特征向量,该特征向量或每个特征向量被格式化为数据集以允许计算推断生成量化的依赖数据,该量化的依赖数据包括与设备和连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个。
从另一个角度来看,提供了一种计算机实现的方法,用于为网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个提供量化的依赖数据,该方法包括从设备和连接当中的至少一个接收设备特征向量和连接特征向量中的至少一个,该特征向量或每个特征向量以适于在网络中的连接上传输的形式被编码;生成至少两个数据集,每个数据集包括设备特征向量和连接特征向量中的至少一个;在至少两个数据集上执行计算推断以生成量化的依赖数据,该量化的依赖数据包括与设备和连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;并以可用于选择要执行的动作的形式供应量化的依赖数据,该动作是由至少一个电子计算设备节点和至少一个连接中的至少一个执行的和对其执行的中的至少一个。
在本技术的硬件实现中,提供了一种电子装置,其包括可操作为实现本技术的方法的逻辑组件。在计算机程序产品实现中,提供了计算机代码,该计算机代码在被加载到计算机中并在其上执行时可操作为使计算机操作逻辑电路系统以执行本技术的方法。
附图说明
现在将参考附图仅以示例的方式描述所公开的技术的实现,其中:
图1示出了可借以实现本文描述的技术的逻辑、固件或软件组件的布置的框图;
图2示出了根据本文描述的技术的计算机实现的方法的示例。
具体实施方式
然后,广义上讲,本技术提供了使用仪器检测设备和网络连接以生成特征向量的能力,特征向量包括高效表示的状态数据,该状态数据可以传送给一个或多个分析引擎,这些分析引擎能够进行推断以得出量化的依赖数据,可以对量化的依赖数据采取动作以选择针对设备和网络连接要采取的动作,这种动作的示例是恢复或改善计算环境的组件的“健康状况”。因此,本技术将关于设备(诸如IoT设备)的实时操作状态的元数据与反映数据在其上流动的网络的状态的其它度量相结合。来自不同源的元数据的这种聚合使得系统(诸如可访问聚合数据的云服务)能够应用推断,从而可以针对解决信任、错误和性能状况所需的动作做出更明智的决策。
本领域技术人员将明白,本技术必须位于计算栈的系统控制级别。这可以在操作系统监督层处或之下,因为由于本技术的应用而要采取的控制动作通常是普通系统用户和应用无法获得的特权动作。
在针对经由云连接的IoT设备的实现中,本技术提供了将关于IoT设备的实时操作状态的元数据与反映通过其将数据提供给云服务的网络的状态的其它更广泛的度量相结合。然后,元数据可供决策引擎等使用,以就控制或管理系统应当采取的动作做出决策。对于元数据的这种组合的需求对于本领域普通技术人员将是清楚的。例如,只能从两个端点的角度正确理解设备和管理系统之间的连接状态——可以存在仅影响一个方向上行进的流量的问题,并且如果孤立地考虑单个端点数据,那么这可能不会立即显现。
在图1中,示出了示例性处理系统100的框图,处理系统100包括可借以实现本文描述的技术的逻辑组件、固件组件或软件组件以及相关联的存储装置。处理系统100可以包括例如具有通过局域网连接的若干设备的单站点安装,或者它可以包括整个物联网以及所有相关联的服务器、云网络以及网格或网状附接的系统。
处理系统100包括多个设备和连接,每个设备和连接具有控制实体。设备可以包括网络中的端点节点,并且当本身被视为设备时,还可以包括中间节点,诸如网关、路由器等。在本简化表示中,它们的控制实体被示为设备控件102和连接控件110。设备控件102和连接控件110连接到网络118并且设有仪器104、112(即,硬件、固件或软件逻辑,它们独立于设备或连接的主要处理任务而起作用,并且旨在监视设备或连接如何执行其工作)。仪器104、112包括特征向量生成器106、114,特征向量生成器106、114可操作为构造表示设备和连接的状态数据的特征向量。设备特征向量中的状态数据可以包括例如物理状态数据,诸如设备电源状态、设备过程状态、设备错误状态、设备连接性状态等。设备特征向量中的状态数据还可以包括状态逻辑数据,诸如软件映像状态、软件库状态、软件使用统计值、软件错误状态等。连接特征向量中的状态数据还可以包括网络尺寸、网络连接性状态、网络错误状态、网络分组运输状态、网络服务质量状态等。
如本领域技术人员将清楚的那样,此类状态数据的聚合可以相当广泛,并且鉴于许多设备(尤其是IoT设备)的存储器和功率限制以及许多连接的带宽和连接时间限制,这可能是有问题的。本技术通过向仪器102、112提供特征向量编码器108、116来解决这个问题,特征向量编码器108、116可操作为将特征向量变换成适于由受限的设备和连接处理的形式。变转后的特征向量以如方式被编码:它们明显不同于正常的用户或客户数据,从而它们对设备和连接进行的正常处理造成的干扰最小化。如果知道设备的状态,那么可以动态地调整搜集和传输的元数据的数量。例如,设备可以被用于在不忙于用户任务时搜集附加的特征向量数据,或者可以被调整为在系统正常运行时发送较少的元数据,然后在检测到任何异常行为时发送较多的元数据。
此外,设备本身常常受到其电源可用性的限制,并且众所周知,数据通信消耗大量能量。持续需要传输应用数据,这是任何IoT系统的主要焦点,而支持元数据是通信信道上的额外负担。设备中的元数据集合可以通过以下方式附加到应用协议:仅当存在要发送的应用数据时才发送元数据。这节省了设备中的能量,因为与分别激活诸如无线电信道之类的信道相比,单次发送数据更高效。为了使通信成本最小化,可以的对元数据进行选择。元数据在不同的网络和设备中可以具有不同的优先级和价值。例如,市电供电的以太网设备可以发送所有元数据,但是对于窄带网络中的电池供电的设备,仅设备的睡眠时间可以被认为是令人关注的。元数据服务可以为设备中的日志选择不同的数据、不同的详细级别。基于较早的结果,可以对收集的数据进行裁剪以使其具有不同的统计可靠性,或者仍然是业务风险可接受的。
设备控件102和连接控件110可操作为跨网络118向监督器120传输特征向量(可以以许多可能的形式中的任何一种来实现,这对于本领域技术人员来说将是清楚的,但是还将在下文中进一步描述)。监督器120可操作为构造、存储和处理数据集124、126,数据集124、126被如上所述由设备控件102和连接控件110供应的特征向量填充。以适于跨网络传输的形式编码的数据集124、126由解码器130解码。监督器120包括模型训练器组件128,该模型训练器组件128可操作为将机器学习技术应用于数据集124、126以从特征向量导出推断规则,并使得推断引擎122能够将规则应用于来自数据集124、126的其它特征向量以生成量化的依赖数据132。量化的依赖数据132可以包括以如下形式与设备和连接相关联的信任指示符、诊断指示符和性能指示符等:决策设备可以作用于其上以控制要由处理系统100内的设备和连接执行的或要对处理系统100内的设备和连接执行的操作。例如,一种可能的动作是关闭表现异常的设备,或限制设备或线程允许的网络或CPU时间。数据集124、126中的数据的布置可以典型地根据从其获得的信息的用途而变化。因此,设备和连接特征向量数据可以以促进对设备行为与其过去的行为进行历史比较的方式或者以允许对来自相似设备的特征向量数据进行比较的方式等布置在数据集124、126中。数据集124、126中的特征向量数据也可以被分组为子集,以促进分类和分析。
模型训练器组件128可以被配置为通过从推断引擎122接收“实时”反馈并作为响应而改变现有模型来与推断引擎122保持连续关系进行操作。因此,可以使模型训练器组件128与推断引擎122之间的关系可操作为在系统操作期间精炼量化的依赖数据132的生成。
能从设备(诸如IoT设备)捕获的可被用于推断设备的状况的元数据种类的示例包括:
·与CPU状况相关的数据,诸如:
οCPU负载;
οCPU重新启动;
ο堆栈指针;以及
ο叉形指令(fork)。
·与设备存储器状况相关的数据,诸如:
ο存储器使用情况数据;
ο存储器写入;
ο存储器调用;以及
ο存储器不足事件。
·与设备电源状况相关的数据,诸如:
ο电池使用情况;
ο电源周期统计;以及
ο在MCU上处于不同的活动和睡眠状态的时间。
·处理和线程数据
ο进程和线程的数量;
ο激活计数和活跃时间;
ο每个源的中断计数。
·与操作系统状况相关的数据,诸如:
ο操作系统和硬件版本;
ο操作系统崩溃;以及
ο引导数据。
·与连接性状况相关的数据,诸如:
ο连接性正常运行时间;以及
ο连接性使用情况;以及
ο连接事件(IP地址、端口和时间戳)。
在一个示例性用例中,通过使用本技术比较来自相似设备的数据并注意到异常的启动计数(低正常运行时间)或异常的线程活动,有可能识别出具有故障的硬件的设备,例如影响设备的操作的不良焊接。
本技术还使得有可能搜集和理解关于设备的逻辑状态的元数据,诸如例如生成提供给IoT设备并在其上运行的软件映像的编译过程。例如,编译元数据可以包括:
ο与地图文件和二进制文件相关的数据;
ο构建中使用的库和软件组件;以及
ο那些库占用的存储空间(这可以被解释为所使用的任何子特征和优化的指示)。
本技术使得有可能将设备行为映射到软件组件(例如,在已知的IP堆栈中,有可能确定软件组件在不同环境中的行为方式),并进行推断以改善设备的逻辑操作,或就如何更好地匹配特定环境的逻辑组件提供指导。例如,这提供了不同组件及其版本的匿名使用情况统计信息,以帮助优化软件和固件的部署。它还允许通过关联已部署的软件或固件群中的数据来检测特定组件及其版本中不常发生的错误,例如,一旦检测到某个组件或版本的问题,就可以通知可能受到影响的客户。可以在本技术中搜集和分析的元数据的细粒度性质允许错误的识别以及它们与具体编译器和版本信息的关联。
设备的诊断可以包括位于设备上的软件组件,该软件组件可以在硬件上运行不同的测试。远程服务器可以指示设备执行这些测试并收集结果。测试可以意味着设备无法执行其应用级别的实际功能。应用服务器可能会要求输入密码令牌,以便设备应用验证允许这种破坏性测试。设备的引导SW可以包括低级测试。结果可以保存在持久性RAM区域或NVM存储器中,诊断软件可以在这里找到结果并将其报告给服务器。利用刷新设备的功能,可以用诊断测试软件组件对设备进行刷新,然后在其中执行并向服务器报告。在测试之后,可以将业务应用重新加载到设备,以便可以恢复正常服务。
诸如云平台之类的管理系统可以基于CPU和存储器类型以及模型来关联来自不同客户设备的信息。然后,随着新客户加入系统,已经有了可以使用的硬件行为的预期简档,从而例如可以适当地管理与预期硬件可靠性的任何差异。系统可以例如导入测试时间设备元数据。该简档将包括预期的存储器使用情况、线程操作、可以与实际部署设备收集的数据进行比较的网络通信模式。可以用破坏性测试来生成设备简档,例如,运行存储器写入,直到存储器发生故障。该数据可以被用于监视实际设备。
本技术还可操作为捕获与来自设备的数据所通过的网络相关的元数据,以便于处理。例如,如果IoT设备形成网状网络的一部分,那么还可以捕获与网状网络的当前操作状况相关的元数据并将其传送到云服务处的系统管理实体。这个网络操作状态元数据可以包括以下一个或多个字段:
·通信超时元数据;
·通信链路质量元数据;
·网状网络尺寸;
·与分组相关的元数据,诸如:
ο分组尺寸;
ο发送的分组的数量;
ο接收的分组的数量;
ο丢弃的分组的数量;以及
ο重试的分组的数量。
因此,可以结合与网状网络的操作状态相关的元数据来分析与设备的操作状态相关的元数据,从而以给出对于控制设备或网络有用的信息的方式来帮助确定设备的行为是否与网状网络的操作状态相关。
在另一个示例中,IoT设备可以经由蜂窝网络连接。可以为蜂窝网络捕获的与网络相关的状态数据的示例是:
·与睡眠时间相关的元数据;
·与连接定时器相关的元数据;
·与分组相关的元数据,例如:
ο分组尺寸;
ο发送的分组的数量;
ο接收的分组的数量;
ο丢弃的分组的数量;以及
ο重试的分组的数量。
除了与整个网络的操作状况相关的广泛信息之外,还有可能获得关于网络中的具体实体的元数据。例如,当网络包括一个或多个网关时,可以有可能确定关于该网关的操作数据。类似地,关于云服务本身的元数据也可以被用于馈送到分析中。
现在转向图2,示出了根据本技术的方法200。方法200从“开始”202开始,并且在204处,使用仪器检测设备或连接以生成设备和连接特征向量的数据集。如前面简要讨论的,这些特征向量的生成需要在对设备或连接的正常运行具有最小的影响的情况下完成——例如,使用与产生有用数据相称的最小可能的存储器占用和最少可能的CPU周期。在206处,将设备或连接特征向量编码为适于在网络连接上传输的形式,并且同样如上所述,携带用户或客户数据的连接的正常运行必须具有优先权——因此编码必须使得以最小可能的包装来传送必要数量的可用设备或连接状态信息,无论该数量是大还是小。因此,有必要为这些特征向量中的每一个选择适当节约的编码。因此,已经生成的特征向量被编码并通过网络传递给数据集。
设备中生成的数据量通常基于外部环境而变化。因此,元数据可以有变化的空间量。关于如何在分配的空间中选择要发送的元数据,设备可以具有可配置的优先级。该系统还可以将设备配置为对元数据进行统计分析,以便例如仅发送值的平均值、最小值、最大值、中位数、标准差。设备还可以学习或被配置为检测所关注的异常统计信息或事件并报告它们。基于学习到的故障指示符或安全漏洞指示符,系统可以为设备配置所关注的数据的不同指纹。例如,可以在诊断日志中为设备配置某种消息模式以触发警报,因为该模式已在发生故障的设备中被看到。
在208处,特征向量从其传输格式被解码为推断引擎可用的形式。当系统处于学习模式时,从数据集导出210模型,以向推断引擎提供推断规则。学习模式可以在系统的“实时”操作之前被调用,或者可以在“实时”操作期间继续。在212处,数据集中的至少两个经历计算推断以生成量化的依赖数据的过程。推断可以采用几种形式中的任何一种。例如,通过导出特定设备类型的行为规范集合并与越来越频繁的离群值的最近时间序列进行比较,可以推理出设备正在出现故障的过程中。用于设备的量化的依赖数据可以受到影响,和/或,如果设备的行为对网络产生影响,那么连接的量化的依赖数据可以改变。这是个简单的示例——在人工智能系统的当前状态下,可以从设备和连接特征向量的数据集中的数据中导出更微妙和复杂的计算推断。
因此,可以将模型210和计算推断212的推导作为连续过程来执行,使得可以使用来自计算推断212的反馈来周期性地或连续地精炼模型210。
在214处,以例如可由决策支持系统用来选择要采取的动作的形式来供应量化的依赖数据——这可能是诸如触发附加的诊断监视的动作,或者它可能响应于由于特征向量数据中暴露的安全性问题所引起的差依赖值而涉及设备或网络的子网的隔离。其它示例包括故障根本原因分析、一个或多个错误校正过程、性能优化过程、数据源或连接选择过程等。该过程结束于“结束”216,但很可能是迭代的,如对于本领域普通技术人员将清楚的。给定过程的迭代性质,可能会进行附加的精炼,因为提供量化的依赖数据的整个过程本身可以使用仪器检测以提供可审核性(显示数据如何以及为什么支持所做出的决策的能力)以及所述监视和所述执行计算推断的过程内省,以允许基于实时系统执行期间提取的真实数据随时间改进监视和推理过程。
在本技术的典型用例中,以下一些因素是重要的:
·在系统或部署生命周期内的操作效率
ο可以提供实际的部署数据参数和操作数据,作为正在进行的系统和组件设计与开发的反馈。
ο可以通过基于部署统计信息配置设备设置来节省电池并提高可靠性(例如,了解网络运营商的TCP/UDP连接超时并以最优速率设置保持存活(keep-alive)的消息)。
ο可以通过使用部署网络和针对设备行为的测试网络统计信息来改进测试。
·诊断
ο可以帮助解决部署问题,尤其是更新、节省时间和更好的服务:
ο与相同或对应网络条件下的相似设备相比,可以基于行为分析来指示哪些设备需要更换/升级。
ο可以基于故障统计信息来帮助计划维护。
ο可以使开发人员能够在设备和连接平台上构建新服务。
·信任与安全性
ο可以检测并帮助缓解由受损的设备造成的威胁或故障。
ο可以通过提供训练数据质量指示符来帮助提高机器学习性能。
ο可以帮助检测和响应由被篡改的设备(例如,智能电表)提供的数据。
在更复杂的用例中,用户可以具有能部署到设备(诸如空气质量传感器)的应用,该应用使得设备能够使用不同的可用通信机制来报告数据。来自设备和网络的元数据使得能够基于个体设备在其中操作的联网环境分别针对不同的技术并且甚至针对不同的设备来对系统进行配置。
在另一个复杂的用例中,已知每个移动运营商都将其移动网络配置为最好地服务于其用户并管理某些区域的网络容量。但是,这可以意味着没有流量的TCP连接可以在运营商网络中存活不同的时间段——一些运营商可以使连接存活数秒,而其它运营商可以使连接存活数分钟或数小时。如果应用需要始终能够接收消息,那么它必须向网络发送保持存活的消息以保持TCP连接活跃。通过将设备的实时操作状况数据(诸如电池使用情况、CPU使用情况、TCP消息信息等)与网络操作状态信息(诸如TCP连接超时数据)进行组合,有可能了解针对特定运营商的特定TCP连接设置并修改设备保持存活消息的行为以匹配网络。在这方面,对设备数据进行详细分析是有帮助的。大量的保持存活消息使用大量的电池电力和CPU周期——例如,本技术可以帮助最大程度地减少资源使用以延长电池寿命,或者如果详细了解了设备元数据,那么它可以被调整为在电池用尽之前发送“最后一声(last gasp)”。
在一个实现中,本技术可以被用于云发起的固件更新。在测试云更新期间,可以观察到仅一些设备已更新。当设备具有相同的软件和硬件并且仅设备的子集可被更新时,可能难以诊断问题。例如,新版本是否存在故障或受到某种程度的破坏?它使用过多的存储器吗?它在消耗电池电量或者由于使用过多的CPU而阻止写入盘吗?本文描述的设备和连接元数据可以被用于提供推断的应用,以帮助确定根本原因并提供纠正问题的动作。
本领域的技术人员将认识到,本技术可以被实施为系统、方法或计算机程序产品。因而,本技术可以采取完全硬件实施例、完全软件实施例或组合软件和硬件的实施例的形式。当使用“组件”这个词时,本领域普通技术人员将理解它是指任何上述实施例的任何部分。
此外,本技术可以采取在计算机可读介质中实施的计算机程序产品的形式,在计算机可读介质上实施有计算机可读程序代码。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读介质可以是例如但不限于电子、磁性、光学、电磁、红外或半导体系统、装置或设备,或前述的任何适当组合。
可以以一种或多种编程语言(包括面向对象的编程语言和常规的过程编程语言)的任意组合来编写用于执行本技术的操作的计算机程序代码。
例如,用于执行本技术的操作的程序代码可以包括诸如C之类的常规编程语言(解释或编译)的源代码、目标代码或可执行代码,或汇编代码、用于设置或控制ASIC(专用集成电路)或FPGA(现场可编程门阵列)的代码,或用于硬件描述语言(诸如VerilogTM或VHDL(超高速集成电路硬件描述语言))的代码。
程序代码可以完全在用户计算机上、部分在用户计算机上且部分在远程计算机上或完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络连接到用户的计算机。代码组件可以被实施为过程、方法等,并且可以包括子组件,这些子组件可以采取任何抽象级别的指令或指令序列的形式,从本机指令集的直接机器指令到高级编译或解释语言结构。
本领域技术人员还将清楚的是,根据本技术的实施例的逻辑方法的全部或部分可以被适当地实施在包括执行该方法的步骤的逻辑元件的逻辑装置中,并且这样的逻辑元件可以包括例如可编程逻辑阵列或专用集成电路中的组件(诸如逻辑门)。这种逻辑布置还可以被实施在使能元件中,该使能元件用于使用例如可以使用固定或可传输的载体介质来存储和传输的虚拟硬件描述符语言在这种阵列或电路中临时或永久地建立逻辑结构。
在一个替代方案中,可以以计算机实现的部署服务的方法的形式来实现本技术的实施例,该方法包括部署计算机程序代码的步骤,该计算机程序代码可操作为在部署到计算机基础设施或网络中并在其上执行时使所述计算机系统或网络执行该方法的所有步骤。
在另一个替代方案中,可以以其上具有功能数据的数据载体的形式来实现本技术的实施例,所述功能数据包括功能计算机数据结构,以在被加载到计算机系统或网络中并由此对其进行操作时使得所述计算机系统能够执行该方法的所有步骤。
对于本领域技术人员将清楚的是,在不脱离本技术的范围的情况下,可以对前述示例性实施例进行许多改进和修改。

Claims (35)

1.一种计算机实现的方法,用于针对网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个提供量化的依赖数据,该方法包括:
使用仪器检测所述设备和所述连接中的至少一个以生成至少两个数据集,所述至少两个数据集包括设备特征向量和连接特征向量中的至少一个,每个所述特征向量以适于在所述网络中的连接上传输的形式被编码;
在所述至少两个数据集上执行计算推断以生成量化的依赖数据,所述依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;以及
以能用于选择要执行的动作的形式供应所述量化的依赖数据,所述动作是由所述至少一个电子计算设备节点和所述至少一个连接中的至少一个执行的和对其执行的中的至少一个。
2.如权利要求1所述的方法,所述生成至少两个数据集包括生成正常行为历史数据集和用于与所述正常行为历史数据集进行比较的当前数据集。
3.如权利要求1或权利要求2所述的方法,还包括为了所述在所述至少两个数据集上执行计算推断以生成量化的依赖数据而训练模型。
4.如权利要求3所述的方法,所述执行计算推断还包括向所述训练模型提供反馈。
5.如权利要求4所述的方法,所述训练模型还包括响应于所述执行计算推断提供所述反馈而改变现有的所述模型。
6.如前述权利要求中的任一项所述的方法,所述供应所述量化的依赖数据包括供应可信状态指示符、错误诊断指示符和性能指示符中的至少一个。
7.如前述权利要求中的任一项所述的方法,所述使用仪器检测包括生成表示选自以下的至少一个设备物理状态的设备特征向量:
设备电源状态;
设备过程状态;
设备错误状态;以及
设备连接性状态。
8.如前述权利要求中的任一项所述的方法,所述使用仪器检测包括生成表示选自以下的至少一个设备逻辑状态的设备特征向量:
软件映像状态;
软件库状态;
软件使用统计值;以及
软件错误状态。
9.如前述权利要求中的任一项所述的方法,所述使用仪器检测包括生成表示选自以下的至少一个连接状态的连接特征向量:
网络尺寸;
网络连接性状态;
网络错误状态;
网络分组运输状态;以及
网络服务质量状态。
10.如前述权利要求中的任一项所述的方法,所述使用仪器检测还包括通过编码以实现以下至少之一,来以适于通过所述网络中的连接进行传输的形式来编码每个所述特征向量:
减少所述特征向量的存储器占用;
减少传输所述特征向量所需的带宽;以及
减少处理所述特征向量所需的处理器周期。
11.如前述权利要求中的任一项所述的方法,所述供应所述量化的依赖数据包括向决策引擎发信号通知用于从以下中选择动作的数据:
故障根本原因分析过程;
进一步的诊断过程;
错误校正过程;
性能优化过程;
数据源选择过程;以及
连接选择过程。
12.如前述权利要求中的任一项所述的方法,还包括存储所述量化的依赖数据以用于所述选择的审核。
13.如前述权利要求中的任一项所述的方法,还包括存储所述量化的依赖数据以用于所述监视和所述执行计算推断的过程自省。
14.如权利要求10所述的方法,所述过程自省可操作为精炼所述监视和所述执行计算推断。
15.一种计算机实现的方法,用于生成至少一个数据集以供推断引擎进行分析,该方法包括:
监视网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个;
生成设备特征向量和连接特征向量中的至少一个;
以适于在所述网络中的连接上传输的形式对所述特征向量或每个所述特征向量进行编码;以及
向包括所述推断引擎的系统传输所述特征向量或每个所述特征向量,所述特征向量或每个所述特征向量被格式化为数据集,以允许计算推断生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个。
16.一种计算机实现的方法,用于针对网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个提供量化的依赖数据,该方法包括:
从所述设备和所述连接当中的至少一个接收设备特征向量和连接特征向量中的至少一个,所述特征向量或每个所述特征向量以适于在所述网络中的连接上传输的形式被编码;
生成至少两个数据集,每个数据集包括设备特征向量和连接特征向量中的至少一个;
在所述至少两个数据集上执行计算推断以生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;以及
以能用于选择要执行的动作的形式供应所述量化的依赖数据,所述动作是由所述至少一个电子计算设备节点和所述至少一个连接中的至少一个执行的和对其执行的中的至少一个。
17.一种电子装置,包括可操作为针对网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个提供量化的依赖数据的逻辑,该装置包括:
仪器检测逻辑,在所述设备和所述连接当中的至少一个中实现并且可操作为生成至少两个数据集,所述至少两个数据集包括设备特征向量和连接特征向量中的至少一个,每个所述特征向量以适于在所述网络中的连接上传输的形式被编码;
计算推断逻辑,可操作为在所述至少两个数据集上执行推断以生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;以及
通信逻辑,可操作为以能用于选择要执行的动作的形式供应所述量化的依赖数据,所述动作是由所述至少一个电子计算设备节点和所述至少一个连接中的至少一个执行的和对其执行的中的至少一个。
18.一种电子装置,包括可操作为生成至少一个数据集以供推断引擎进行分析的逻辑,该装置包括:
仪器检测逻辑,可操作为监视网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个;
仪器检测逻辑,可操作为生成设备特征向量和连接特征向量中的至少一个;
编码逻辑,可操作为以适于在所述网络中的连接上传输的形式对所述特征向量或每个所述特征向量进行编码;以及
通信逻辑,可操作为向包括所述推断引擎的系统传输所述特征向量或每个所述特征向量,所述特征向量被格式化为数据集以允许计算推断生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个。
19.一种电子装置,包括可操作为针对网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个提供量化的依赖数据的逻辑,该装置包括:
接收器逻辑,可操作为从所述设备和所述连接当中的至少一个接收设备特征向量和连接特征向量中的至少一个,每个所述特征向量以适于在所述网络中的连接上传输的形式被编码;
数据处理逻辑,可操作为生成至少两个数据集,每个数据集包括设备特征向量和连接特征向量中的至少一个;
计算推断逻辑,可操作为在所述至少两个数据集上执行推断以生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;以及
通信逻辑,可操作为以能用于选择要执行的动作的形式供应所述量化的依赖数据,所述动作是由所述至少一个电子计算设备节点和所述至少一个连接中的至少一个执行的和对其执行的中的至少一个。
20.一种包括计算机代码的计算机程序产品,所述计算机代码被存储在有形存储介质中并且在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以执行以下操作:
使用仪器检测所述设备和所述连接当中的至少一个以生成至少两个数据集,所述至少两个数据集包括设备特征向量和连接特征向量中的至少一个,每个所述特征向量以适于在所述网络中的连接上传输的形式被编码;
在所述至少两个数据集上执行计算推断以生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;以及
以能用于选择要执行的动作的形式供应所述量化的依赖数据,所述动作是由所述至少一个电子计算设备节点和所述至少一个连接中的至少一个执行的和对其执行的中的至少一个。
21.如权利要求20所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时还可操作为使所述计算机操作逻辑电路系统以生成至少两个数据集,包括生成正常行为历史数据集和用于与所述正常行为历史数据集进行比较的当前数据集。
22.如权利要求20或权利要求21所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时还可操作为使所述计算机操作逻辑电路系统以便为了所述在所述至少两个数据集上执行计算推断以生成量化的依赖数据而训练模型。
23.如权利要求22所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时还可操作为使所述计算机操作逻辑电路系统以向所述逻辑电路系统提供反馈以训练模型。
24.如权利要求23所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时还可操作为使所述计算机操作逻辑电路系统以响应于所述逻辑电路系统提供所述反馈而改变现有的所述模型。
25.如权利要求20至24中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时还可操作为使所述计算机操作逻辑电路系统以供应所述量化的依赖数据,其中所述供应包括供应可信状态指示符、错误诊断指示符和性能指示符中的至少一个。
26.如权利要求20至25中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以生成表示选自以下的至少一个设备物理状态的设备特征向量:
设备电源状态;
设备过程状态;
设备错误状态;以及
设备连接性状态。
27.如权利要求20至26中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以生成表示选自以下的至少一个设备逻辑状态的设备特征向量:
软件映像状态;
软件库状态;
软件使用统计值;以及
软件错误状态。
28.如权利要求20至27中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以生成表示选自以下的至少一个连接状态的连接特征向量:
网络尺寸;
网络连接性状态;
网络错误状态;
网络分组运输状态;以及
网络服务质量状态。
29.如权利要求20至28中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时还可操作为使所述计算机操作逻辑电路系统,其中通过编码以实现以下至少之一,每个所述特征向量以适于在所述网络中的连接上传输的形式被编码:
减少所述特征向量的存储器占用;
减少传输所述特征向量所需的带宽;以及
减少处理所述特征向量所需的处理器周期。
30.如权利要求20至29中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以供应所述量化的依赖数据,其中所述供应包括向决策引擎发信号通知用于从以下各项中选择动作的数据:
故障根本原因分析过程;
进一步的诊断过程;
错误校正过程;
性能优化过程;
数据源选择过程;以及
连接选择过程。
31.如权利要求20至30中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时还可操作为使所述计算机操作逻辑电路系统以存储所述量化的依赖数据以用于所述选择的审核。
32.如权利要求20至31中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以存储所述量化的依赖数据以用于所述监视和所述执行计算推断的过程自省。
33.如权利要求20至32中的任一项所述的计算机程序产品,所述计算机代码在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以存储所述量化的依赖数据以用于所述监视和所述执行计算推断的过程自省,其中所述过程自省可操作为精炼所述监视和所述执行计算推断。
34.一种包括计算机代码的计算机程序产品,所述计算机代码被存储在有形存储介质中并且在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以生成至少一个数据集以供推断引擎进行分析,该计算机代码包括用于执行以下操作的指令:
监视网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个;
生成设备特征向量和连接特征向量中的至少一个;
以适于在所述网络中的连接上传输的形式对所述特征向量或每个所述特征向量进行编码;以及
向包括所述推断引擎的系统传输所述特征向量或每个所述特征向量,所述特征向量被格式化为数据集以允许计算推断生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个。
35.一种包括计算机代码的计算机程序产品,所述计算机代码被存储在有形存储介质中并且在被加载到计算机中并在其上执行时可操作为使所述计算机操作逻辑电路系统以针对网络的多个电子计算设备节点中的设备和多个连接中的连接当中的至少一个提供量化的依赖数据,该计算机代码包括用于执行以下操作的指令:
从所述设备和所述连接当中的至少一个接收设备特征向量和连接特征向量中的至少一个,每个所述特征向量以适于在所述网络中的连接上传输的形式被编码;
生成至少两个数据集,每个数据集包括设备特征向量和连接特征向量中的至少一个;
在所述至少两个数据集上执行计算推断以生成量化的依赖数据,所述量化的依赖数据包括与所述设备和所述连接当中的至少一个相关联的信任指示符、诊断指示符和性能指示符中的至少一个;以及
以能用于选择要执行的动作的形式供应所述量化的依赖数据,所述动作是由所述至少一个电子计算设备节点和所述至少一个连接中的至少一个执行的和对其执行的中的至少一个。
CN201980026927.3A 2018-04-20 2019-03-22 设备的网络中的依赖控制 Pending CN111989896A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862660548P 2018-04-20 2018-04-20
US62/660,548 2018-04-20
GB1811374.6 2018-07-11
GB1811374.6A GB2573179B (en) 2018-04-20 2018-07-11 Reliance control in networks of devices
PCT/GB2019/050826 WO2019202290A1 (en) 2018-04-20 2019-03-22 Reliance control in networks of devices

Publications (1)

Publication Number Publication Date
CN111989896A true CN111989896A (zh) 2020-11-24

Family

ID=63273070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980026927.3A Pending CN111989896A (zh) 2018-04-20 2019-03-22 设备的网络中的依赖控制

Country Status (4)

Country Link
US (1) US20210103836A1 (zh)
CN (1) CN111989896A (zh)
GB (1) GB2573179B (zh)
WO (1) WO2019202290A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114697398A (zh) * 2022-03-23 2022-07-01 北京百度网讯科技有限公司 数据处理方法、装置、电子设备、存储介质及产品

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021158347A1 (en) * 2020-02-04 2021-08-12 Commscope Technologies Llc Data analysis and configuration of a distributed radio access network

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012075336A1 (en) * 2010-12-01 2012-06-07 Sourcefire, Inc. Detecting malicious software through contextual convictions, generic signatures and machine learning techniques
CN105247493A (zh) * 2013-05-06 2016-01-13 微软技术许可有限责任公司 从静态收集的数据中标识受影响的测试
US20160142266A1 (en) * 2014-11-19 2016-05-19 Battelle Memorial Institute Extracting dependencies between network assets using deep learning
US20170351241A1 (en) * 2016-06-01 2017-12-07 Incucomm, Inc. Predictive and prescriptive analytics for systems under variable operations

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3761238B2 (ja) * 1996-01-25 2006-03-29 株式会社東芝 判断規則修正装置と判断規則修正方法
US7103806B1 (en) * 1999-06-04 2006-09-05 Microsoft Corporation System for performing context-sensitive decisions about ideal communication modalities considering information about channel reliability
US7313613B1 (en) * 2002-01-03 2007-12-25 Microsoft Corporation System and method facilitating network diagnostics and self-healing
US7516049B2 (en) * 2007-02-19 2009-04-07 Microsoft Corporation Wireless performance analysis system
US8411577B2 (en) * 2010-03-19 2013-04-02 At&T Intellectual Property I, L.P. Methods, apparatus and articles of manufacture to perform root cause analysis for network events
US9385917B1 (en) * 2011-03-31 2016-07-05 Amazon Technologies, Inc. Monitoring and detecting causes of failures of network paths
US9699032B2 (en) * 2013-10-29 2017-07-04 Virtual Instruments Corporation Storage area network queue depth profiler
US10601688B2 (en) * 2013-12-19 2020-03-24 Bae Systems Plc Method and apparatus for detecting fault conditions in a network
US10277471B2 (en) * 2014-12-11 2019-04-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for network tomography
US11032149B2 (en) * 2018-02-05 2021-06-08 Crenacrans Consulting Services Classification and relationship correlation learning engine for the automated management of complex and distributed networks
US10846070B2 (en) * 2018-07-05 2020-11-24 At&T Intellectual Property I, L.P. Facilitating cloud native edge computing via behavioral intelligence

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012075336A1 (en) * 2010-12-01 2012-06-07 Sourcefire, Inc. Detecting malicious software through contextual convictions, generic signatures and machine learning techniques
CN105247493A (zh) * 2013-05-06 2016-01-13 微软技术许可有限责任公司 从静态收集的数据中标识受影响的测试
US20160142266A1 (en) * 2014-11-19 2016-05-19 Battelle Memorial Institute Extracting dependencies between network assets using deep learning
US20170351241A1 (en) * 2016-06-01 2017-12-07 Incucomm, Inc. Predictive and prescriptive analytics for systems under variable operations

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114697398A (zh) * 2022-03-23 2022-07-01 北京百度网讯科技有限公司 数据处理方法、装置、电子设备、存储介质及产品
CN114697398B (zh) * 2022-03-23 2023-10-17 北京百度网讯科技有限公司 数据处理方法、装置、电子设备、存储介质及产品

Also Published As

Publication number Publication date
GB2573179A (en) 2019-10-30
WO2019202290A1 (en) 2019-10-24
US20210103836A1 (en) 2021-04-08
GB2573179B (en) 2020-04-22
GB201811374D0 (en) 2018-08-29

Similar Documents

Publication Publication Date Title
Chen et al. Outage prediction and diagnosis for cloud service systems
US10805185B2 (en) Detecting bug patterns across evolving network software versions
US8634314B2 (en) Reporting statistics on the health of a sensor node in a sensor network
US9652316B2 (en) Preventing and servicing system errors with event pattern correlation
Ehlers et al. Self-adaptive software system monitoring for performance anomaly localization
US7181651B2 (en) Detecting and correcting a failure sequence in a computer system before a failure occurs
Cotroneo et al. A fault correlation approach to detect performance anomalies in virtual network function chains
Kavulya et al. Failure diagnosis of complex systems
US20120026938A1 (en) Applying Policies to a Sensor Network
US20200272923A1 (en) Identifying locations and causes of network faults
Huong et al. Federated learning-based explainable anomaly detection for industrial control systems
US20220321436A1 (en) Method and apparatus for managing prediction of network anomalies
US11669374B2 (en) Using machine-learning methods to facilitate experimental evaluation of modifications to a computational environment within a distributed system
CN111989896A (zh) 设备的网络中的依赖控制
EP3608784B1 (en) Control system and control apparatus
Effah et al. Survey: Faults, fault detection and fault tolerance techniques in wireless sensor networks
US10630561B1 (en) System monitoring with metrics correlation for data center
Jeswani et al. Adaptive monitoring: application of probing to adapt passive monitoring
US20150163124A1 (en) System and method for dynamically testing networked target systems
Mamoutova et al. Knowledge based diagnostic approach for enterprise storage systems
Yang et al. Power-based diagnosis of node silence in remote high-end sensing systems
US20200213203A1 (en) Dynamic network health monitoring using predictive functions
Tavolato et al. Analytical modelling of cyber-physical systems: Applying kinetic gas theory to anomaly detection in networks
Ceccarelli et al. A multi-layer anomaly detector for dynamic service-based systems
US20220292374A1 (en) Dynamic parameter collection tuning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201124