CN106464520B - 对网络中的有故障的节点的检测 - Google Patents

对网络中的有故障的节点的检测 Download PDF

Info

Publication number
CN106464520B
CN106464520B CN201580018121.1A CN201580018121A CN106464520B CN 106464520 B CN106464520 B CN 106464520B CN 201580018121 A CN201580018121 A CN 201580018121A CN 106464520 B CN106464520 B CN 106464520B
Authority
CN
China
Prior art keywords
data traffic
node
nodes
data
monitored node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580018121.1A
Other languages
English (en)
Other versions
CN106464520A (zh
Inventor
M.阿姆布鲁斯特
L.菲格
J.里德尔
T.施密德
A.齐尔克勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN106464520A publication Critical patent/CN106464520A/zh
Application granted granted Critical
Publication of CN106464520B publication Critical patent/CN106464520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0645Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis by additionally acting on or stimulating the network after receiving notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/091Measuring contribution of individual network components to actual service level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明涉及一种用于提高在具有节点的网络中的业务品质的方法和设备。在这种情况下经历如下步骤:a)选择所述节点中的至少一个节点作为被监控的节点;b)通过从多个节点中选择而产生至少两个观测节点,其中被监控的节点被排除在选择之外,使得不仅相应的数据包类别的从所述至少两个观测节点中的至少一个观测节点到被监控的节点的送达的数据流通量而且相应的数据包类别的从被监控的节点到所述至少两个观测节点中的至少一个观测节点的离开的数据流通量完全被确定;c)基于(i)通过相应的数据包类别的相应的送达的数据流通量而产生的离开的数据流通量和(ii)所述至少一个设备的数据源的期望的数据流通量来生成被监控的节点的所期望的离开的总数据流通量;d)根据离开的数据流通量与所期望的离开的总数据流通量之差来生成差值;e)如果该差值超过可预给定的阈值,则将所监控的节点检测为有故障的节点。本发明在安全攸关的应用的领域中、如在医疗应用、监控装置中和在车内通信系统中是可采用的。

Description

对网络中的有故障的节点的检测
技术领域
本发明涉及用于提高网络中的业务品质的方法和设备。
背景技术
除了传送语音数据和图像数据之外,网络目前经常被用于安全攸关的(sicherheitskritisch)应用。这样,自动化系统例如包括多个控制计算机、传感器和执行器,这些控制计算机、传感器和执行器表示网络中的节点。在这种情况下,在这些节点之间的数据通信不允许受单个节点的不当行为干扰,使得整个自动化系统的功能安全性受到威胁。这样的故障情况例如被称为“胡言傻瓜(babbling idiot)”。在此可以被理解为如下节点:该节点违背所规划的资源约定并且必要时甚至违背数据通信的规范来发送大量数据,并且由此占用网络和妨碍或者甚至损坏其他节点的通信。
德国专利申请DE 10 2012 000 185建议了,通过如下方式确保在网络中在传输和硬件故障时、尤其是在“胡言傻瓜”故障的情况下的改进的故障安全性和故障分析:在交换装置的接收端口处分配保险丝(Fuse)装置用以监控相应的数据传输率。当超过之前预给定的最大数据传输率时,保险丝装置阻止在相应的接收端口上的数据接收。该行为方式是有利的,因为该行为方式可以以简单的方式被实施和实现。然而不利的是,在数据传输率剧烈波动时,基于预给定的最大数据传输率可能会触发误报警,该误报警错误地阻止了数据接收。经此发生不希望的数据损失,由此降低了网络的业务品质。此外需要一开始就知道和设定期望的数据率。
发明内容
本发明的任务在于说明了一种方法和设备,利用所述方法和设备在存在有故障的节点时提高网络中的业务品质,识别和必要时隔离所述有故障的节点,所述有故障的节点可能导致在所述网络的至少一部分中的数据流通量(Datenverkehr)过载。
该任务通过独立权利要求来解决。本发明的扩展方案可在从属权利要求中得知。
本发明涉及一种用于在具有多个节点的网络中在存在有故障的节点时提高业务品质的方法,其中所述节点经由相应的连接而彼此连接用以交换数据包,有故障的节点与至少一个设备耦合,所述至少一个设备作为数据接收器和/或数据源工作,所述方法具有如下步骤:
a)选择所述节点中的至少一个节点作为被监控的节点;
b)通过从多个节点中选择而产生至少两个观测节点,其中被监控的节点被排除在选择之外,使得:
- 不仅相应的数据包类别的从所述至少两个观测节点中的至少一个观测节点到被监控的节点的送达的(zugehend)数据流通量完全被确定,
- 而且相应的数据包类别的从被监控的节点到所述至少两个观测节点中的至少一个观测节点的离开的(abgehend)数据流通量完全被确定;
c)测定相应的观测节点的送达的数据流通量和离开的数据流通量;
d)基于(i)通过相应的数据包类别的相应的送达的数据流通量而产生的离开的数据流通量和(ii)所述至少一个设备的数据源的期望的数据流通量来生成被监控的节点的所期望的离开的总数据流通量;
e)根据离开的数据流通量(DAB)与所期望的离开的总数据流通量(GDV)之差来生成差值(DIFF);
f)如果差值(DIFF)超过可预给定的阈值(SWLL),则将所监控的节点(WK)探测为有故障的节点(KF)。
该方法展现出如下优点:根据送达的数据流通量可以识别将被监控的节点识别为有故障的节点。换言之,被监控的节点被识别为有故障的节点的阈值动态地与送达的数据流通量适配。这能够实现在奇异的(singulaer)以太网环形结构中使用本发明用于故障操作(fail-operational)通信,在奇异的以太网环形结构中通过利用在环中的两个方向实现所需的冗余。
“完全”意味着:从一个节点到被监控的节点以及从被监控的节点到网络的节点中的一个节点的整个数据流通量通过观测节点来分析。节点K1和K3被挑选为观测节点KB1、KB2,因为它们可以完全地测定节点K2的整个的送达的数据流通量和整个的离开的数据流通量。特别是,送达的和离开的数据流通量完全通过这些观测节点。“完全”并不意味着:所有数据包类别必须纳入监控中。尤其是可以有利的是,只监控安全攸关的或者高优先级的数据包类别。
在本发明的一种扩展方案中,被监控的节点的所期望的离开的总数据流通量通过对如下量求和来形成:
(i)一个或者多个所期望的离开的数据流通量,和
(ii)至少一个设备的数据源的要期望的数据流通量,
其中相应的所期望的发出的(ausgehend)数据流通量通过
(a)对于相应的数据包类别的每个进入的数据包的离开的数据包的数目,和
(b)分别关联(dazugehoerig)的送达的数据流通量
相乘来形成。
经此,说明了用于确定所期望的离开的总数据流通量的计算规则,所述计算规则可以以简单且因此成本低廉的方式被实施和执行。
以有利的方式,数据包类别通过送达的数据流通量和离开的数据流通量的相应的数据包的如下特性中的至少一个来确定:
a)“单播(unicast)”转发类型
b)“多播(multi-cast)”转发类型
c)“广播(broadcast)”转发类型
d)优先级类别。
经此实现了:所期望的离开的总数据流通量可以以非常精确的方式来确定,因为确定考虑不同的数据包类别的特定特性。通过精确确定可以改善将被监控的节点有错误地识别为有故障的节点或没有故障的节点,使得进一步提高了网络中的业务品质。
这样,对于为“单播”转发类型的数据包类别,所期望的离开的数据流通量被设置为与送达的数据流通量相同。这样,对于为“多播”转发类型的数据包类别,所期望的离开的数据流通量通过由被监控的节点到被监控的节点的直接相邻的节点的连接输出端的可用的数目与送达的数据流通量构成的乘积(Multiplikationsergebnis)来确定,其中可用的数目被确定在零到被监控的节点的到直接相邻的节点的连接输出端的减了一的数目之间。这样,针对为“广播”转发类型的数据包类别,所期望的离开的数据流通量可通过由被监控的节点的到直接相邻的节点的连接输出端的减了一的数目与送达的数据流通量构成的乘积来确定。通过采用特定的计算规则可以以有利的方式确保,本发明的不同的实施方案以相同的方式和方法将被监控的节点识别为有故障的节点。这进一步提高了网络的可靠性。
以有利的方式,只有当离开的数据流通量超过单位时间的可预给定的数据量时,才执行所述方法的步骤。由此确保了,只有当接收到临界的数据量时,该方法才加重网络的系统资源负担。
在本发明的一个有利的扩展方案中,如果被监控的节点被探测为有故障的节点,则被监控的节点的连接中的至少一个连接(尤其是从被监控的节点离开的连接中的至少一个连接)被中断。由此,避免网络的误动作,因为该网络不再充满大数据量。这在存在有故障的节点时提高了网络的业务品质。
本发明也涉及一种用于在具有多个节点的网络中在存在有故障的节点时提高业务品质的设备,其中所述节点经由相应的连接而彼此连接用以交换数据包,有故障的节点与至少一个设备耦合,所述至少一个设备作为数据接收器和/或数据源工作,该设备具有如下单元:
a)用于选择所述节点中的至少一个节点作为被监控的节点的第一单元;
b)用于通过从多个节点中选择而产生至少两个观测节点的第二单元,其中被监控的节点被排除在选择之外,使得:
- 不仅相应的数据包类别的从所述至少两个观测节点中的至少一个观测节点到被监控的节点的送达的数据流通量完全被确定,
- 而且相应的数据包类别的从被监控的节点到所述至少两个观测节点中的至少一个观测节点的离开的数据流通量完全被确定,
c)用于测定相应的观测节点的送达的数据流通量和离开的数据流通量的第三单元;
d)第四单元,用于基于(i)通过相应的数据包类别的相应的送达的数据流通量而产生的离开的数据流通量和(ii)所述至少一个设备的数据源的期望的数据流通量来生成被监控的节点的所期望的离开的总数据流通量;
e)用于根据离开的数据流通量与所期望的离开的总数据流通量之差来生成差值的第五单元;
f)第六单元,用于:如果差值超过可预给定的阈值,则将被监控的节点检测为有故障的节点。
经此可以以有利的方式实施和执行本发明。该设备的优点类似于相对应的方法步骤。
在该设备的一个有利的扩展方案中,该设备具有第七单元,该第七单元被构建为使得借助该第七单元可实施和可执行前面所描述的方法步骤中的一个或者多个。该设备的优点类似于相对应的方法步骤。
附图说明
本发明及其优点依据所附的附图予以更详细地阐述:
图1根据第一实施例的具有有故障的节点的网络;
图2根据第二实施例的网络,其中多个可能有故障的节点共同被监控;
图3用于执行本发明的设备;
图4具有送达的数据流通量和离开的数据流通量的被监视(überachter)的节点。
具有相同功能和作用方式的要素在附图中配备有相同的附图标记。
具体实施方式
根据图1的第一实施例示出了六个节点K1、...、K6,所述节点K1、...、K6经由连接V1、...、V7彼此连接。相应的箭头对于每个连接指明了传输方向。这样,存在从节点K2到节点K1经由子连接V21的单向传输方向和从节点K1到节点K2的另一单向子连接V22。因此,箭头方向说明了单向传输方向。所述节点中的一些节点具有被耦合的设备G、G1、G2,其中不同于节点,所述设备没有将数据包转发给其他节点,而是自己被构造为数据接收器(也就是构造为数据包的接收方)和/或构造为数据源(也就是构造为数据包的产生方)。
在本实例中,网NET是制造设施中的自动化网络的部分,其中设备G1、G2分别表示位置传感器,所述位置传感器每隔一定时间将部件在输送带上的地理位置的测量值以相应的数据包的形式提供给分别耦合的节点用以转发。此外,这些设备可以利用借助数据包被所述设备接收到的参数来参数化,例如在哪些时间点要记录测量值。
随后,要检验:节点K2是否是有故障的节点KF,该有故障的节点KF如“胡言傻瓜”那样由于过大的包生成而妨碍从节点K3到节点K1的数据通信。节点K2因此是被监控的节点(WK)。
为此首先在网络中选择两个观测节点KB1、KB2,所述观测节点KB1、KB2不仅完全测定相应的数据包类别CLA的到被监控的节点的送达的数据流通量DZU而且完全测定相应的数据包类别CLA的从被监控的节点到所述节点的离开的数据流通量DAB。“完全”意味着:从一个节点到被监控的节点以及从被监控的节点到网络中的节点之一的整个数据流通量通过观测节点来分析。节点K1和K3被挑选为观测节点KB1、KB2,因为它们可以完全地测定节点K2的送达的整个数据流通量和离开的整个数据流通量。特别是,送达的和离开的数据流通量完全通过观测节点。
送达的数据流通量DZU根据图1通过子连接V22和V32来获得。为此,观测节点观测其相应的输出端,所述输出端属于子连接V22和V32、即关联的端口,并且在可预给定的为例如100ms(ms-微秒)的时间段上对于每个数据包类别确定在那里出现的数据量。在该实例中假设的是,仅仅存在单个的数据包类别。在本实例中,送达的数据流通量DZU的结果为20kByte(千字节)。与之类似地,观测节点在其相应的输入端、即端口上观测子连接V21和V31,所述子连接V21和V31总共对应于离开的数据流通量DAB。在本实例中,DAB=30000字节。
此外已知的是,设备G1可以在为100ms的时间段中产生为200字节的期望的数据流通量DVG。
在中间步骤中,通过
DVW1=A(CLA)x DZU
来计算所期望的离开的数据流通量DVW1。
在这种情况下,数目A确定针对可预给定的数据包类别对于每个进入的数据包产生多少离开的数据包。在当前的实例中,进入的数据包的长度与相对应的发出的数据包被假设为相同的。
在本实例中假设的是,相应的数据流通量的数据包唯一地具有为“单播”转发类型的数据包类别。转发类型例如通过数据包中的特定标记或者通过网络的配置来预给定。“单播”在此上下文中意味着:由节点接收到的数据包仅被转发给相邻的节点中的一个或者被转发给设备。因此,A(CLA)=1。在本实例中,所期望的离开的第一数据流通量DVW1被确定为
DVW1=1 x 20千字节 = 20000 字节。
由于仅仅为“单播”转发类型的数据包类别的数据包被寄送,所以所期望的离开的总数据流通量GDV通过所期望的离开的数据流通量和设备G2的数据源的要期望的数据流通量被确定为:
GDV = DVW1 + DVG = 20千字节 + 200字节 = 20200 字节。
这意味着:节点K2要产生为20.2千字节的离开的总数据流通量。
随后检验被监控的节点WK是否是有故障的节点KF。为此,由离开的数据流通量DAB和所期望的离开的总数量流通GDV之差形成为
DIFF = DAB - GDV = 30000 字节 - 20200 字节 = 9800 字节
的差值。
该差值随后与可预给定的阈值SWLL进行比较。如果该差值超过可预给定的阈值,也就是说DIFF > SWLL,则被监控的节点WK被探测为有故障的节点KF。在本情况下,阈值被置为1500字节,以便能够考虑在处理在被监控的节点WK上接收到的数据包和在被监控的节点WK上派出的(abgesandte)数据包时的延迟。由于(DIFF = 9800字节) > (SWLL = 1500字节),所以节点K2被标识为有故障地工作的节点。
在一种可替选的实施方案中,阈值SWLL被置到送达的数据流通量DZU的可预给定的百分比上,例如SWLL = 10% x DZU,以便能够将阈值与送达的数据流通量的不同的数据量适配。
由于节点K2被识别为有故障的节点KF,所以该节点K2被从网络拿走,使得该节点K2随后可以不再干扰整个网络。为此,节点K1和K3可以例如通过如下方式中断其连接V2、V3:所述节点K1和K3既不将数据发送给有故障的节点,也不接受来自有故障的节点的数据。因此防止了:充当“胡言傻瓜”的有故障的节点KF干扰整个网络,或者由于有许多数据包而使网络中的数据通信停顿。
在前面的实施例中,数据包的转发类型曾被选择为“单播”。此外,还有其他转发类型、如“广播”和“多播”是常见的。“广播”转发类型意味着:对于每个到达所述节点之一的数据包产生多个数据包,并且所述多个数据包在该节点的相应的输出端上被输出。因此,所期望的离开的第二数据流通量DVW2通过由到被监控的节点的直接相邻的节点的连接输出端的减了一的数目与送达的数据流通量构成的相乘来确定。具体地在图1中展示了,被监控的节点具有两个输出端,所述输出端被引至直接相邻的节点K1和K3。因此,确定所期望的离开的第二数据流通量DW2 = (2-1) x DZU。因此,在“广播”转发类型的情况下转发数据包。在另一场景中,节点具有至直接相邻的节点的五个输出端。在此情况下,所期望的离开的第二数据流通量DW2被确定为DW2 = (5-1) x DZU。在这种情况下,针对送达的数据包通过所述的节点产生四个数据包。
在本发明的一个扩展方案或者可替选的实施形式中,“多播”被选择为转发类型。该转发类型的特点在于,数据包在0、1至n个输出端上被发送,所述输出端从该节点直接引至相邻的节点。对于每个进入的数据包的要发送的数据包的特定数目与该节点的具体参数化有关,例如节点的五个输出端中的三个输出端被参数化,使得“多播”数据包仅被转发给五个输出端中的三个输出端。
代替或者除了转发类型作为数据包类型、如“单播”或“多播”,本发明还可以区分优先级类别。例如,存在三个优先级类别:基本、扩展1和扩展2。在这种情况下,对有故障的节点的定位可以特定地针对三个优先等级中的一个来执行。然而可替选地,也可能的是,一起考虑两个或者更多个类别,以便由此确定所期望的离开的总数据流通量GDV。例如,通过观测节点考虑如下数据包:所述数据包对应于“基本”优先级类别并且同时对应于“单播”或者“广播”作为转发类型。根据该预给定,观测节点对于每个数据包类别确定与该预给定匹配的送达的数据流通量和离开的数据流通量。
在对所期望的离开的总数据流通量的随后确定中,针对每个数据包类别单独地确定相应的期望的离开的数据流通量。如下的表格示出了在为2s的观测时间段内对于每个数据包类别的相应的送达的数据流通量、相应的离开的数据流通量和相应的所期望的离开的数据流通量的概览,其中相应的流通量值由在相应的观测节点上所确定的相应的值之和得到:
数据包类别 相应的数据包类别的送达的数据流通量DZU 相应的数据包类别的离开的数据流通量DAB 所期望的离开的数据流通量
1. 单播 5000 字节 4500 字节 DVWl=5000字节
2. 广播 7500 字节 20000 字节 DVW2=2x7500字节 = 15000 字节
在本实施例中,所期望的离开的总数据流通量可以通过对相应的数据包类别的相应的所期望的离开的数据流通量值与至少一个设备的数据源的要期望的数据流通量求和来确定。在这种情况下得到:
GDV = DVW1 + DW2 + DVG = 5000字节 + 15000字节 + 250字节
GDV = 20250 字节。
由于在接收和发送数据包之间的时间上的延迟,选择阈值被置为SWLL = 1000字节。差值
DIFF = (4500字节+20000字节) - 20250字节 = 4250 字节
由于SWLL > DIFF,所以被监控的节点是有故障的节点KF。
在本方法的一个替选方案中,不仅单个具有设备的节点被监控,而且也可以监控两个或者更多个节点,所述节点至少分别与设备耦合。在图2中,具有设备G1、G2的节点K1和K2要被监控。为此,首先由节点G1、G2形成汇集节点KS,该汇集节点具有所有如下连接:所述连接从K1和K2离去,然而并不到相应的设备并且不到K1和K2自己。汇集节点包括连接V1、V5和V3。观测节点随后被选择为K6、K5和K3,它们可以确定至汇集节点的送达的整个数据流通量以及从汇集节点离开的整个数据流通量。汇集节点是被监控的节点WK。
用于确定所期望的离开的总数据流通量、差值和对被监控的节点是否是有故障的节点的声明的行为方式类似于前面的实例。然而,对被监控的单元是否是有故障的节点的分析接着说明了,这两个节点K1、K2中的至少一个是有故障的节点。如果被监控的节点被标识为有故障的节点,则这两个节点K1、K2都可以从该网络拿走、也就是被隔离,使得没有数据包被寄给这些节点并且没有数据包被这些节点接受。
为了定位两个容纳在汇集节点中的节点K1、K2中的哪一个是有故障的节点,随后可以采取行动来使得节点K1和节点K2可以单独地被检查:相应的节点是否是有故障的节点。在根据图2的本实例中,接着仅仅节点K2关于有故障的行为被调查。如果由此表明节点K2有故障,则该节点可以被阻塞。如果由此表明节点K2无故障地工作,则有故障的节点必然是K1。在此情况下,节点K1被阻塞,使得该节点不能将数据寄到该网络中。
为了避免由于本发明的各个步骤的使用对相应的节点造成过重的负荷,只有当特定的节点的离开的数据流通量或者连接超过可设定的每单位时间的数据量时,才可采用用于提高业务品质的方法。例如,网络在相应的连接上能够实现100MBit/s的带宽。这样,数据阈值例如被置到70% x 100MBit/s = 70 MBit/s。这意味着,如果特定节点的连接和/或离开的数据流通量超过可预给定的每单位时间的数据量DS,则起动该方法并且检验被考虑的节点是否是有故障的节点。
本发明可以借助具有多个单元的设备VOR来实施和执行。图3示出了示例性的具有如下单元的设备:
a)用于选择所述节点K1、…、K6中的至少一个节点作为被监控的节点WK的第一单元M1;
b)用于通过从多个节点K1、K3中选择而产生至少两个观测节点KB1、KB2的第二单元M2,其中被监控的节点WK被排除在选择之外,使得:
- 不仅相应的数据包类别CLA的从所述至少两个观测节点KB1、KB2中的至少一个观测节点到被监控的节点WK的离开的数据流通量DZU、DZU1完全被确定,
- 而且相应的数据包类别CLA的从被监控的节点WK到所述至少两个观测节点K1、K3中的至少一个观测节点的离开的数据流通量DAB完全被确定;
c)用于测定相应的观测节点KB1、KB2的送达的数据流通量DZ)和离开的数据流通量DAB的第三单元(M3);
d)第四单元M3,用于基于(i)通过相应的数据包类别CLA的相应的送达的数据流通量DZU而产生的离开的数据流通量和(ii)所述至少一个设备G的数据源DQ的期望的数据流通量DVG来生成被监控的节点WK的所期望的离开的总数据流通量GDV;
e)用于根据离开的数据流通量DAB与所期望的离开的总数据流通量GDV之差来生成差值DIFF的第五单元M5;
f)第六单元M6,用于:如果差值DIFF超过可预给定的阈值SWLL,则将所监控的节点WK探测为有故障的节点KF。
此外,该设备VOR可以具有第七单元M7,利用该第七单元M7,本发明的扩展方案和/或替换方案是可实施的和可执行的。
这些单元Ml、...、M7可以被实施成网络的节点中的一个或者多个,例如被实施成观测节点KB1、KB2,其中所述节点经由网络彼此进行通信,以便通知或也交换值(如送达的数据流通量)。为了确保在所述节点之间的安全通信,所述节点必要时可以经由连接进行通信,其中这些连接并不经由被监控的节点引导。因此,这些单元中的一些可以在多个节点上被实施和执行,并且一些其他单元可以仅在这些节点中的一个上被实施和执行。这些单元及其功能可以如下地分布到观测节点上:
观测节点KB1 :
- 第一单元Ml
- 第二单元M2
- 第三单元M3
- 第四单元M4
- 第五单元M5
- 第六单元M6
- 第七单元M7
观测节点KB2 :
- 第三单元M3。
应注意的是,并不是所有单元或方法步骤都必须分布到观测节点上。更确切而言,这些单元或方法步骤可以分布于网络中的多个节点上地被实施和执行,其中被监控的节点本身并不实现这些单元或方法步骤中的任何单元或方法步骤。
单元 Ml、...、M7可以为软件、硬件或者为软件和硬件构成的组合。在此,各个方法步骤都可以以机器可读的代码被存放在存储器上。所述存储器可以与处理器连接,使得该处理器可从存储器读取机器可读的代码并且可执行机器可读的代码的相应的被编码的指令。此外,处理器可以与输入和/或输出单元连接,所述输入和/或输出单元可被用于与其他单元和节点交换信息。

Claims (11)

1.一种用于在具有多个节点(Kl,...,K6)的网络(NET)中在存在有故障的节点(KF)时提高业务品质的方法,其中所述节点(Kl,...,K6)经由相应的连接(V1,...,V7)而彼此连接,用以交换数据包,有故障的节点(KF)与至少一个设备(G)耦合,所述至少一个设备(G)作为数据源(DQ)工作,该方法具有如下步骤:
a)选择所述节点(Kl,...,K6)中的至少一个节点作为被监控的节点(WK);
b)通过从多个节点(K1、K3)中选择而产生至少两个观测节点(KB1、KB2),其中被监控的节点(WK)被排除在选择之外,使得
- 不仅相应的数据包类别(CLA)的从所述至少两个观测节点(KB1、KB2)中的至少一个观测节点到被监控的节点(WK)的送达的数据流通量(DZU)完全被确定,
- 而且相应的数据包类别(CLA)的从被监控的节点(WK)到所述至少两个观测节点(K1、K3)中的至少一个观测节点的离开的数据流通量(DAB)完全被确定;
c)测定相应的观测节点(KB1、KB2)的送达的数据流通量(DZU)和离开的数据流通量(DAB);
d)基于(i)通过相应的数据包类别(CLA)的相应的送达的数据流通量(DZU)而产生的离开的数据流通量(DAB)和(ii)所述至少一个设备(G)的数据源(DQ)的期望的数据流通量(DVG)来生成被监控的节点(WK)的所期望的离开的总数据流通量(GDV);
e)根据离开的数据流通量(DAB)与所期望的离开的总数据流通量(GDV)之差来生成差值(DIFF);
f) 如果差值(DIFF)超过可预给定的阈值(SWLL),则将所监控的节点(WK)探测为有故障的节点(KF)。
2.根据权利要求1所述的方法,
其特征在于,
所监控的节点(WK)的所期望的离开的总数据流通量(GDV)通过对如下量求和来形成:
-一个或者多个所期望的离开的数据流通量,和
-至少一个设备(G)的数据源(DQ)的要期望的数据流通量(DVG),
其中相应的所期望的发出的数据流通量通过将
-对于相应的数据包类别(CLA)的每个进入的数据包的离开的数据包的数目,和
-分别所属的送达的数据流通量(DZU)
相乘来形成。
3.根据上述权利要求之一所述的方法,
其特征在于,
数据包类别(CLA)通过送达的数据流通量和离开的数据流通量的相应的数据包的如下特性中的至少一个来确定:
-“单播”转发类型
-“多播”转发类型
-“广播”转发类型
-优先级类别。
4.根据权利要求3所述的方法,
其特征在于,
对于为“单播”转发类型的数据包类别(CLA),所期望的离开的数据流通量被设置为与送达的数据流通量(DZU)相同。
5.根据权利要求3所述的方法,
其特征在于,
对于为“多播”转发类型的数据包类别(CLA),所期望的离开的数据流通量通过由被监控的节点(WK)的到被监控的节点(WK)的直接相邻的节点(K1,K2)的连接输出端的可用的数目与送达的数据流通量(DZU)构成的乘积来确定,其中可用的数目被确定在零到被监控的节点(WK)的到直接相邻的节点(K1,K2)的连接输出端的减了一的数目之间。
6.根据权利要求3所述的方法,
其特征在于,
对于为“广播”转发类型的数据包类别(CLA),所期望的离开的数据流通量通过由被监控的节点(WK)的到直接相邻的节点(K1,K2)的连接输出端的减了一的数目与送达的数据流通量(DZU)构成的乘积来确定。
7.根据权利要求1或2所述的方法,
其特征在于,
只有当离开的数据流通量(DAB)超过可预给定的每单位时间的数据量时,才执行权利要求1的步骤。
8.根据权利要求1或2所述的方法,
其特征在于,
如果被监控的节点(WK)被探测为有故障的节点(KF),则中断被监控的节点(WK)的连接(V1,...,V7)中的至少一个。
9.根据权利要求8所述的方法,
其特征在于,
如果被监控的节点(WK)被探测为有故障的节点(KF),则中断从被监控的节点(WK)离开的连接(V1,...,V7)中的一个。
10.一种用于在具有多个节点(Kl,...,K6)的网络(NET)中在存在有故障的节点(KF)时提高业务品质的设备(VOR),其中所述节点(Kl,...,K6)经由相应的连接(V1,...,V7)而彼此连接,用以交换数据包,有故障的节点(KF)与至少一个设备(G)耦合,所述至少一个设备(G)作为数据源(DQ)工作,所述设备具有如下单元:
第一单元(M1),用于选择所述节点(Kl,...,K6)中的至少一个节点作为被监控的节点(WK);
第二单元(M2),用于通过从多个节点(K1、K3)中选择而产生至少两个观测节点(KB1、KB2),其中被监控的节点(WK)被排除在选择之外,使得:
- 不仅相应的数据包类别(CLA)的从所述至少两个观测节点(KB1、KB2)中的至少一个观测节点到被监控的节点(WK)的送达的数据流通量(DZU)完全被确定,
- 而且相应的数据包类别(CLA)的从被监控的节点(WK)到所述至少两个观测节点(K1、K3)中的至少一个观测节点的离开的数据流通量(DAB)完全被确定;
第三单元(M3),用于测定相应的观测节点(KB1、KB2)的送达的数据流通量(DZU)和离开的数据流通量(DAB);
第四单元(M4),用于基于(i)通过相应的数据包类别(CLA)的相应的送达的数据流通量(DZU)而产生的离开的数据流通量和(ii)所述至少一个设备(G)的数据源(DQ)的期望的数据流通量(DVG)来生成被监控的节点(WK)的所期望的离开的总数据流通量(GDV);
第五单元(M5),用于根据离开的数据流通量(DAB)与所期望的离开的总数据流通量(GDV)之差来生成差值(DIFF);
第六单元(M6),用于:如果差值(DIFF)超过可预给定的阈值(SWLL),则将所监控的节点(WK)探测为有故障的节点(KF)。
11.根据权利要求10所述的设备(VOR),
其特征在于第七单元(M7),所述第七单元(M7)被构建为使得借助第七单元(M7)能够实施和能够执行权利要求2至9中的至少一项的一个或多个方法步骤。
CN201580018121.1A 2014-03-31 2015-03-19 对网络中的有故障的节点的检测 Active CN106464520B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102014206053.2 2014-03-31
DE102014206053.2A DE102014206053A1 (de) 2014-03-31 2014-03-31 Erhöhen einer Dienstgüte in einem Netzwerk
PCT/EP2015/055755 WO2015150085A1 (de) 2014-03-31 2015-03-19 Detektieren eines fehlerhaften knotens in einem netzwerk

Publications (2)

Publication Number Publication Date
CN106464520A CN106464520A (zh) 2017-02-22
CN106464520B true CN106464520B (zh) 2020-01-07

Family

ID=52780516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580018121.1A Active CN106464520B (zh) 2014-03-31 2015-03-19 对网络中的有故障的节点的检测

Country Status (6)

Country Link
US (1) US10103933B2 (zh)
EP (1) EP3087699B1 (zh)
JP (1) JP6373403B2 (zh)
CN (1) CN106464520B (zh)
DE (1) DE102014206053A1 (zh)
WO (1) WO2015150085A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10116523B1 (en) * 2017-04-12 2018-10-30 Fisher-Rosemount Systems, Inc. Predictive connectivity diagnostics for a wireless mesh network in a process control system
CN110198228A (zh) * 2018-04-12 2019-09-03 腾讯科技(深圳)有限公司 一种故障监控方法、装置、服务器及存储介质
JP7017130B2 (ja) * 2018-08-13 2022-02-08 トヨタ自動車株式会社 ステアリングシステム
CN111404822B (zh) * 2020-02-28 2022-08-26 华为技术有限公司 数据传输方法、装置、设备以及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1633785A (zh) * 2002-02-18 2005-06-29 皇家飞利浦电子股份有限公司 时间触发协议(ttp)环境中的时钟同步
CN1799227A (zh) * 2003-02-14 2006-07-05 西门子公司 在考虑恢复要求的情况下用于面向分组的网络的接入控制
CN101248621A (zh) * 2005-03-23 2008-08-20 思科技术公司 用于在网络失效期间提供QoS的方法和系统
CN102692918A (zh) * 2012-06-26 2012-09-26 上海理工大学 一种容错实时转向控制系统设计方法
DE102012000185A1 (de) * 2012-01-09 2013-07-11 Siemens Aktiengesellschaft Verfahren zum Betreiben eines Kommunikationsnetzwerkes und Netzwerkanordnung
US8630172B2 (en) * 1998-05-29 2014-01-14 Tellabs Operations, Inc. Bi-directional ring network having minimum spare bandwidth allocation and corresponding connection admission controls

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000341272A (ja) 1999-05-25 2000-12-08 Fujitsu Ltd Atm通信システム及びatm通信システムにおける輻輳状態検出方法並びにatm通信装置
US6587432B1 (en) * 1999-08-31 2003-07-01 Intel Corporation Method and system for diagnosing network congestion using mobile agents
US6658586B1 (en) * 1999-10-07 2003-12-02 Andrew E. Levi Method and system for device status tracking
WO2002021188A1 (fr) * 2000-09-05 2002-03-14 Fujitsu Limited Systeme de reseau de commande de surveillance
JP3868939B2 (ja) * 2003-08-20 2007-01-17 富士通株式会社 通信ネットワークの障害を検出する装置
EP1917778A2 (en) * 2005-08-03 2008-05-07 Calyptix Security Systems and methods for dynamically learning network environments to achieve adaptive security
US8622837B2 (en) * 2006-03-20 2014-01-07 Sony Computer Entertainment America Llc Managing game metrics and authorizations
CN100574232C (zh) 2006-06-20 2009-12-23 华为技术有限公司 一种多媒体呼叫的并行呼叫功能的实现方法
DE602006015719D1 (de) * 2006-06-26 2010-09-02 Ericsson Telefon Ab L M Netzwerkknoten und Verfahren zur schnellen Verkehrsmessung und Überwachung
US20080297342A1 (en) * 2007-05-31 2008-12-04 Wu Tung-Ming Patrolling method and system
DE102007043652A1 (de) * 2007-09-13 2009-04-02 Siemens Ag Verfahren zum Betrieb eines dezentralen Kommunikationsnetzes
JP5176835B2 (ja) * 2008-09-29 2013-04-03 ブラザー工業株式会社 監視装置、情報処理装置、情報処理方法並びにプログラム
JP5115437B2 (ja) * 2008-09-30 2013-01-09 ブラザー工業株式会社 ネットワークシステム、情報処理装置、情報処理方法及び情報処理装置用プログラム
JP2011160374A (ja) * 2010-02-04 2011-08-18 Fujitsu Ltd 伝送装置及びネットワークの診断方法
US8885488B2 (en) * 2010-06-02 2014-11-11 Brocade Communication Systems, Inc. Reachability detection in trill networks
US10187353B2 (en) * 2010-06-02 2019-01-22 Symantec Corporation Behavioral classification of network data flows
US8422358B2 (en) * 2010-11-23 2013-04-16 International Business Machines Corporation Best-path evaluation based on reliability of network interface layers
JP5779522B2 (ja) * 2012-02-23 2015-09-16 エヌ・ティ・ティ・コミュニケーションズ株式会社 通信装置、故障判定方法、及びプログラム
JP2013255196A (ja) * 2012-06-08 2013-12-19 Nippon Telegr & Teleph Corp <Ntt> ネットワーク監視装置及びネットワーク監視方法
US9201720B2 (en) * 2012-08-13 2015-12-01 Nxp B.V. FlexRay network runtime error detection and containment
US20140092753A1 (en) 2012-09-28 2014-04-03 Cisco Technology, Inc. Traffic-based quality of service (qos) monitoring in highly constrained networks
US9270792B2 (en) * 2012-11-21 2016-02-23 Ubiquiti Networks, Inc. Method and system for improving wireless link efficiency
US9197655B2 (en) * 2013-07-16 2015-11-24 Bank Of America Corporation Steganography detection
US9372776B2 (en) * 2014-02-03 2016-06-21 Aternity Information Systems Ltd. Monitoring user activity and performance of computerized devices
US9774604B2 (en) * 2015-01-16 2017-09-26 Zingbox, Ltd. Private cloud control
US10721154B2 (en) * 2015-06-12 2020-07-21 At&T Intellectual Property I, L.P. Virtual probes
US20170093910A1 (en) * 2015-09-25 2017-03-30 Acalvio Technologies, Inc. Dynamic security mechanisms

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630172B2 (en) * 1998-05-29 2014-01-14 Tellabs Operations, Inc. Bi-directional ring network having minimum spare bandwidth allocation and corresponding connection admission controls
CN1633785A (zh) * 2002-02-18 2005-06-29 皇家飞利浦电子股份有限公司 时间触发协议(ttp)环境中的时钟同步
CN1799227A (zh) * 2003-02-14 2006-07-05 西门子公司 在考虑恢复要求的情况下用于面向分组的网络的接入控制
CN101248621A (zh) * 2005-03-23 2008-08-20 思科技术公司 用于在网络失效期间提供QoS的方法和系统
DE102012000185A1 (de) * 2012-01-09 2013-07-11 Siemens Aktiengesellschaft Verfahren zum Betreiben eines Kommunikationsnetzwerkes und Netzwerkanordnung
CN102692918A (zh) * 2012-06-26 2012-09-26 上海理工大学 一种容错实时转向控制系统设计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
On design and formal verification of SNSP: a novel real-time communication protocol for safety-critical applications;Rui Zhou等;《The Journal of Supercomputing》;20140318;全文 *
Overcoming babbling-idiot failures in the FlexCAN architecture: a simple bus-guardian;Buja, G等;《Emerging Technologies and Factory Automation》;20051231;全文 *
处理CAN总线Babbling Idiot失效的方法;杨福宇;《单片机与嵌入式系统应用》;20080731;全文 *

Also Published As

Publication number Publication date
US10103933B2 (en) 2018-10-16
JP6373403B2 (ja) 2018-08-15
EP3087699B1 (de) 2019-05-01
EP3087699A1 (de) 2016-11-02
JP2017514372A (ja) 2017-06-01
WO2015150085A1 (de) 2015-10-08
DE102014206053A1 (de) 2015-10-01
CN106464520A (zh) 2017-02-22
US20170019290A1 (en) 2017-01-19

Similar Documents

Publication Publication Date Title
CN111052668B (zh) 用于优化网络服务的驻留时间测量
CN106464520B (zh) 对网络中的有故障的节点的检测
US7545750B2 (en) Apparatus and method for detecting network failure
CN108123824B (zh) 一种网络故障检测方法及装置
KR101645598B1 (ko) 네트워크에서의 침입 탐지 방법
US8570862B1 (en) Mapping a port on a packet switch appliance
US9832039B2 (en) Network monitoring method, relay device, and network monitoring system
US11621906B2 (en) Method for test traffic generation and inspection, and associated switch input or output port and switch
US10356014B2 (en) Method of processing bus data
US9548928B2 (en) Network system, controller, and load distribution method
JP2015057931A (ja) ネットワーク装置、通信システム、異常トラヒックの検出方法およびプログラム
CN106302001B (zh) 数据通信网络中业务故障检测方法、相关装置及系统
JP2011124757A (ja) 障害リンク特定システムおよびその監視経路決定方法
US8116212B2 (en) Line status monitoring circuit, node, communication system, and failure occurrence determining method
US20190207864A1 (en) Communication apparatus and bandwidth control method
CN111355670A (zh) 一种流量识别方法、装置、电子设备及存储介质
CN110855685B (zh) 一种多Slice交换芯片实现CoPP的方法及装置
WO2016132402A1 (ja) 通信フレーム転送装置および通信システム
JP6248379B2 (ja) 入出力装置、メモリ監視方法および伝送装置
CN114172796A (zh) 通信网络的故障定位方法及相关装置
KR20190001402A (ko) 소프트웨어 정의 네트워크에서의 소프트웨어 정의 네트워크 제어기, 이를 이용한 장애 복구 그룹 생성 방법 및 장애 복구 방법
CN110611663B (zh) 一种检测方法、装置及系统
US11012347B2 (en) Communication apparatus, communication control method, and communication system for multilink communication simultaneously using a plurality of communication paths
CN111600798B (zh) 一种发送和获取断言报文的方法和设备
Leggett et al. Station device and network communications performance during system stress conditions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant