CN104468175B - 用于隔离控制器局域网络中的故障的方法和装置 - Google Patents

用于隔离控制器局域网络中的故障的方法和装置 Download PDF

Info

Publication number
CN104468175B
CN104468175B CN201410470400.9A CN201410470400A CN104468175B CN 104468175 B CN104468175 B CN 104468175B CN 201410470400 A CN201410470400 A CN 201410470400A CN 104468175 B CN104468175 B CN 104468175B
Authority
CN
China
Prior art keywords
controller
identified
fault
node
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410470400.9A
Other languages
English (en)
Other versions
CN104468175A (zh
Inventor
S.蒋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GM Global Technology Operations LLC
Original Assignee
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GM Global Technology Operations LLC filed Critical GM Global Technology Operations LLC
Publication of CN104468175A publication Critical patent/CN104468175A/zh
Application granted granted Critical
Publication of CN104468175B publication Critical patent/CN104468175B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • G06F11/0739Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function in a data processing system embedded in automotive or aircraft systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3048Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40169Flexible bus arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L2012/40208Bus networks characterized by the use of a particular bus standard
    • H04L2012/40215Controller Area Network CAN
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Environmental & Geological Engineering (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明提供一种用于隔离控制器局域网络中的故障的方法和装置。一种移动系统上的控制器局域网络(CAN)具有包括通信总线和节点的多个CAN元件。一种用于监测CAN的方法包括检测CAN的无效节点,并且基于CAN的无效节点和用于CAN的网络拓扑,采用车外控制器来识别CAN中的候选故障。基于候选故障隔离CAN中的故障。

Description

用于隔离控制器局域网络中的故障的方法和装置
技术领域
本发明涉及控制器局域网络中的通信以及与其相关联的故障隔离。
背景技术
在本部分中的叙述仅提供与本发明相关的背景信息。因而,这样的叙述不是意在构成承认是现有技术。
车辆系统包括多个子系统,举例说明包括发动机、变速器、车座/操纵部、制动器、HVAC以及乘员保护。可以使用多个控制器来监测和控制子系统的操作。控制器可以构造为经由控制器局域网络(CAN)进行通信,以响应于操作者指令、车辆操作状态以及外部条件协调车辆的操作。在其中一个控制器中可能发生故障,故障经由CAN总线影响通信。
网络例如CAN的拓扑是指网络元件之间的连接布置,并且优选地包括具有互连或分散的电源、接地或者在它们之间的通信链路的多个节点。物理拓扑描述包括链路和节点的物理元件的布置或布局,其中节点包括控制器和其他连接设备,并且链路包括电源线、接地线或通信线。逻辑拓扑描述数据消息或电力在采用链路的节点之间的网络内的流动。已知的CAN系统对所有控制器采用电源线和地线的分离的电源和接地拓扑。已知的控制器通过在不同周期在CAN总线上发送的消息互相通信。
已知的系统在消息接收控制器处检测故障,其中在控制器的交互作用层处使用信号监督和信号暂停监测来完成对消息的故障检测。故障可以报告为通信丢失,例如传送数据消息的丢失。这种检测系统一般不能识别故障的根源,并且不能区分瞬时故障和间歇性故障。一种已知的系统需要单独监测网络的物理拓扑的硬件和尺寸细节,以有效地监测和检测网络中的通信故障。
发明内容
一种在移动系统上的控制器局域网络(CAN)具有多个CAN元件,其包括通信总线和节点。一种用于监测CAN的方法包括检测CAN的无效节点,并且基于CAN的无效节点和CAN的网络拓扑采用车外控制器来识别在CAN中的故障。基于候选故障隔离在CAN中的故障。
本发明还提供如下方案:
1. 一种监测移动系统上的包括多个控制器局域网络(CAN)元件的CAN的方法,所述CAN元件包括通信总线和多个节点,所述方法包括:
检测CAN的无效节点;
基于所述CAN的无效节点和用于所述CAN的网络拓扑,采用车外控制器来识别所述CAN中的候选故障;以及
基于所述候选故障隔离所述CAN中的故障。
2.如方案1所述的方法,其中采用车外控制器来识别所述CAN中的候选故障包括:
将所述CAN的无效节点和与用于所述CAN的网络拓扑相关联的多个故障特征矢量进行比较;
识别与所述CAN的无效节点对应的所述故障特征矢量中的一个;
确定与所识别故障特征矢量相关联的故障症状;以及
基于所述故障症状识别所述CAN中的候选故障。
3.如方案2所述的方法,其中确定与所识别故障特征矢量相关联的故障症状包括采用CAN的网络拓扑的可达性分析,其中监测通信来确定哪个节点是对所述故障症状无效的。
4.如方案2所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电源与节点之间的断开链路。
5.如方案2所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电接地与节点之间的断开链路。
6.如方案2所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一节点与第二节点之间的断开通信链路。
7.如方案2所述的方法,其中与所识别故障特征矢量相关联的故障症状包括节点中的故障。
8.如方案2所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一节点与第二节点之间的通信链路中的短路。
9.如方案1所述的方法,其中检测CAN的无效节点包括采用车载控制器来监测来自所述CAN的节点的通信、以及将在预定时间周期内不能在所述CAN上生成消息的所述CAN的任何节点识别为无效。
10.如方案1所述的方法,还包括:
采用车载监测程序来检测所述CAN的无效节点并且捕捉对应的时间戳;以及
响应于询问,将所述CAN的无效节点和对应的时间戳传送至所述车外控制器。
11.一种监测移动系统上的包括多个控制器局域网络(CAN)元件的CAN的方法,所述CAN元件包括信号地连接到通信总线的多个控制器,所述方法包括:
采用车载监测程序来将所述CAN的控制器中的每个识别为有效或无效;
响应于询问,将所述CAN的已识别的有效和无效控制器传送至车外控制器;
采用所述车外控制器,基于所述CAN的无效控制器和用于所述CAN的网络拓扑,来识别所述CAN中的候选故障;以及
基于所述候选故障隔离所述CAN中的特定故障。
12.如方案11所述的方法,其中采用车外控制器来识别所述CAN中的候选故障包括:
将所述CAN的无效控制器和与用于所述CAN的网络拓扑相关联的多个故障特征矢量进行比较;
识别与所述CAN的无效控制器对应的所述故障特征矢量中的一个;
确定与所识别故障特征矢量相关联的故障症状;以及
基于所述故障症状识别所述CAN中的候选故障。
13. 如方案12所述的方法,其中确定与所识别故障特征矢量相关联的故障症状包括采用CAN的网络拓扑的可达性分析,其中监测通信来确定哪个控制器是对所述故障症状无效的。
14. 如方案12所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电源与控制器之间的断开链路。
15. 如方案12所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电接地与控制器之间的断开链路。
16. 如方案12所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一控制器与第二控制器之间的断开通信链路。
17. 如方案12所述的方法,其中与所识别故障特征矢量相关联的故障症状包括控制器中的故障。
18. 如方案12所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一控制器与第二控制器之间的通信链路中的短路。
19. 如方案11所述的方法,其中将所述CAN的控制器中的每个识别为有效或无效包括采用车载控制器来监测来自所述CAN的控制器的通信、以及将在预定时间周期内不能在所述CAN上生成消息的所述CAN的任何控制器识别为无效。
附图说明
现在将参考附图举例描述一个或多个实施例,其中:
图1示出了根据本发明的包括控制器局域网络(CAN)的移动车辆,CAN包括CAN总线和多个节点例如控制器以及车外设备;
图2示出了根据本发明的示例性CAN,其包括控制器、监测控制器、电源、电池星状体和地,每个如图所示经由链路连接;
图3示出了根据本发明的检测CAN中的无效控制器的车载CAN监测程序;以及
图4示出了根据本发明的确定候选故障的车外故障隔离程序,即,断开链路、线路短路或者采用故障特征矢量的故障控制器。
具体实施方式
现在参考附图,其中附图仅是为了示出某些示例性实施例,而不是为了限制本发明,图1示意地示出了包括控制器局域网络(CAN)的移动车辆8,控制器局域网络(CAN)包括CAN总线15和多个节点,即,控制器10、20、30和40。术语“节点”是指信号地连接到CAN总线15并且能够通过CAN总线15发送、接收和/或转发信息的任何有源电子设备。每个控制器10、20、30和40信号地连接到CAN总线15并且电连接到电力网60和接地网70。每个控制器10、20、30和40包括电子控制器或者其他车载设备,其构造为监测或控制车辆8的子系统的操作,并且经由CAN总线15进行通信。在一个实施例中,其中一个控制器例如控制器40构造为监测CAN 50和CAN总线15,并且在本文中可以称为CAN控制器。控制器40信号地连接到通信设备42,其构造为采用直接硬件线路连接43和/或无线远程通信连接44将数字消息传送至车外设备45。直接硬件线路连接43和无线远程通信连接44采用任何适当的通信协议。
CAN 50的图示实施例是CAN的非限制性示例,其可以以多种系统配置中的任意一种使用。每个CAN描述为采用包括电源、地和在包括控制器和其他电子设备的节点之间的通信链路的物理布置的网络拓扑。网络拓扑例如CAN是指网络元件之间的连接布置,并且优选地包括具有互连或分散的电源、地或者在它们之间的通信链路的多个节点。拓扑图发展为包括通信拓扑、电源拓扑和接地拓扑。网络拓扑涉及在节点和其他元件例如电源和地源之间的信号、电力和接地连接性,并且在节点之间的物理或直线距离、物理互连、传输速率、和/或信号类型是其次考虑的。因此,在不同车辆配置上可以发现提供通用功能的通用网络拓扑。
CAN总线15包括多个通信链路,包括在控制器10和20之间的第一通信链路51、在控制器20和30之间的第二通信链路53、以及在控制器30和40之间的第三链路通信55。电力网60包括电源62,例如电池,其电连接到第一电源总线64和第二电源总线66,以经由电源链路向控制器10、20、30和40提供电力。如图所示,电源62经由以串联配置布置的电源链路连接到第一电源总线64和第二电源总线66,其中电源链路69将第一电源总线64和第二电源总线66相连。第一电源总线64经由以星型配置布置的电源链路连接到控制器10和20,其中电源链路61将第一电源总线64和控制器10相连,并且电源链路63将第一电源总线64连接到控制器20。第二电源总线66经由以星型配置布置的电源链路连接到控制器30和40,其中电源链路65将第二电源总线66和控制器30相连,并且电源链路67将第二电源总线66连接到控制器40。接地网70包括车辆接地线72,其连接到第一接地总线74和第二接地总线76,以经由接地链路向控制器10、20、30和40提供电接地。如图所示,车辆接地线72经由以串联配置布置的接地链路连接到第一接地总线74和第二接地总线76,其中接地链路79将第一接地总线74和第二接地总线76相连。第一接地总线74经由以星型配置布置的接地链路连接到控制器10和20,其中接地链路71将第一接地总线74和控制器10相连,并且接地链路73将第一接地总线74连接到控制器20。第二接地总线76经由以星型配置布置的接地链路连接到控制器30和40,其中接地链路75将第二接地总线76和控制器30相连,并且接地链路77将第二接地总线76连接到控制器40。可以采用具有相似效果的用于控制器10、20、30和40和CAN总线15的通信、电源和接地的分布的其他拓扑。
车外设备45可以包括在车辆诊断和维修中心的服务区使用的手持式扫描工具。车外设备45也可以包括远程定位服务中心。车外设备45构造为与通信设备42通信,包括向控制器40交互询问消息。车外设备45优选地包括控制器元件、包括可以与CAN 50相关的网络拓扑的存储器元件、以及如本文描述地执行以远程识别CAN 50中的故障的分析元件。
控制模块、模块、控制、控制器、控制单元、处理器以及类似的术语表示以下部件中的一个或多个的任何一种或各种组合:专用集成电路(ASIC)、电子电路、执行一个或多个软件或固件程序或者例行程序的中央处理单元(优选微处理器)及相关联的内存和存储器(只读存储器、可编程只读存储器、随机存取存储器、硬盘驱动器等)、组合逻辑电路、输入/输出电路和设备、适当的信号调节缓冲电路、以及提供所述功能的其它部件。软件、固件、程序、指令、例行程序、代码、算法以及类似的术语表示包括校准和查找表在内的任何指令集。所述控制模块具有一组控制例行程序,通过执行这组例行程序来提供期望的功能。例行程序由例如中央处理单元执行,例行程序是可操作的以监测来自感测设备和其它联网控制模块的输入,并执行控制和诊断例行程序来控制致动器的操作。在正在进行的发动机工作和车辆运行期间,可以以定期间隔(例如每100微秒、3.125、6.25、12.5、25和100毫秒)执行例行程序。替代地,可以响应于事件的发生来执行例行程序。
控制器10、20、30和40每个经由CAN总线15跨过CAN 50发送和接收消息,对于不同的控制器,消息传输速率可以以相同或不同的周期发生。CAN消息具有已知的预定格式,在一个实施例中,其包括帧开始(SOF)、标识符(11位标识符)、单向远程发送请求(RTR)、主导单向标识符扩展(IDE)、保留位(r0)、4位的数据长度代码(DLC)、长达64位的数据(DATA)、16位的循环冗余校验(CDC)、2位的应答(ACK)、7位的帧结束(EOF)以及3位的帧间间隔(IFS)。CAN消息可能被破坏,其中已知的错误包括填充错误、格式错误、ACK错误、位1错误、位0错误以及CRC错误。使用错误来产生错误警报状态,包括主动错误状态、被动错误状态、以及总线掉线错误状态中的一个。主动错误状态、被动错误状态以及总线掉线错误状态是基于增加数量的已检测总线错误帧即增加的总线错误计数来分配的。已知的CAN总线协议包括提供整个网络数据一致性,这会导致本地错误的全局化。这样允许故障的非静止控制器在CAN总线15上破坏来源于另一个控制器的消息。
导致在CAN总线上的消息丢失的通信故障可以是其中一个控制器中的故障、CAN总线的其中一个通信链路中的故障、电力网的其中一个电源链路中的故障、和接地网的其中一个接地链路的故障的结果。拓扑图可以展开为包括通信拓扑、电力拓扑以及接地拓扑。通过去除断开链路,对每个拓扑图进行可达性分析。参考图2描述了拓扑图的可达性分析的一个实施例。
图2示出了示例性CAN 400的网络拓扑,示例性CAN 400包括控制器402、404和406、监测控制器408、电源410、电池星状体412以及地414,每个如图所示经由链路连接。监测控制器408观察指示各个故障集的症状,其中每个故障集具有包括一组无效控制器的对应故障特征。监测功能显示为由控制器408执行,但可以理解在通信总线上的控制器402、404、406和408中的任意一个或所有可以构造为执行故障诊断,因为CAN总线上的任何消息可以在所有控制器节点处观察。
为网络拓扑生成故障模型,并且故障模型包括由监测控制器对多个故障的每个观察的多个症状、以及对应的故障特征矢量Vf inactive,其包括与之相关联的一组被观察的无效控制器。与参考图2描绘的网络拓扑相关联的示例性故障模型包括如下,其中CAN 400的网络拓扑包括控制器402[1]、404[2]和406[3]、监测控制器408[0]、电源410[4]、电池星状物412[5]以及地414[6]。故障模型是采用网络拓扑的可达性分析来得出的,其中归纳症状并且监测通信来确定哪个控制器对于该症状是无效的。
第一故障集f1可以包括在控制器402与电池星状物412、控制器402与地414、控制器402与控制器404中的一个之间的断开链路的症状、以及控制器402的故障,其中对应的故障特征矢量Vf inactive包括作为无效的控制器402。第二故障集f2可以包括在控制器404与电池410、控制器404与地414中的一个之间的断开链路的症状、以及控制器404的故障,其中对应的故障特征矢量Vf inactive包括作为无效的控制器404。第三故障集f3可以包括在控制器406与电池星状物412、控制器406与地414中的一个之间的断开链路的症状、以及控制器406的故障,其中对应的故障特征矢量Vf inactive包括作为无效的控制器406。第四故障集f4可以包括在控制器404与控制器406之间的断开链路的症状,其中对应的故障特征矢量Vf inactive包括作为无效的控制器402和404。第五故障集f5可以包括在电池410与电池星状物412之间的断开链路的症状,其中对应的故障特征矢量Vf inactive包括作为无效的控制器402和406。第六故障集f6可以包括在监测控制器408与控制器406之间的断开链路的症状,其中对应的故障特征矢量Vf inactive包括作为无效的控制器402、404和406。其他故障特征矢量Vf inactive可以根据具体的CAN系统的特定架构采用CAN的拓扑图的可达性分析展开。因为包括故障诊断的监测功能可以在控制器402、404、406和408中或任意一个中或所有控制器中执行,所以可以开发适当的故障集和症状来实现故障特征矢量Vf inactive,其隔离到单个可作用故障。
图3示出了车载CAN监测程序300,其通过生成包括VECU的系统模型来执行车载故障检测和隔离,VECU表示在包括一个或多个监测节点的CAN中的一组控制器,监测节点可以包括一个或多个控制器和/或监测控制器。每个控制器发送一组可以具有不同周期和重复率的消息。
基于监测源于CAN中的控制器的通信,执行车载CAN监测程序300来获得有效控制器报告,从而检测连接到CAN总线的控制器是有效还是无效。表2提供为图3的车载CAN监测程序300的图例,其中标记数字的方框和对应功能如下所述。
在车辆运行期间,定期地例如每100 ms执行CAN监测程序300。在开始时(302),监测控制器执行来检测CAN总线上的哪个控制器是有效的,并且从而检测CAN总线上的哪个控制器是无效的(304)。该有效/无效检测可以呈现任意形式,并且优选地包括监测和检测源于每个控制器的通信是否已经在与相应控制器的运行相关联的预定时间周期内发生,并且将没有生成消息的那些控制器识别为无效的一些形式。有效/无效检测结果受到数据滤波来去除数据噪声(306),并且评估该结果来确定是否任何控制器是无效的(308)。如果没有控制器无效(308)(0),那么将变量Fault_Num设定为0(310),并且程序300的该迭代结束(320)。使用变量Fault_Num来指示发生的故障的数量并且最初变量Fault_Num为0。如果任意控制器无效(308)(1),那么增加变量Fault_Num(312)。对于由变量Fault_Num表示的每个故障,该组无效控制器在数据滤波之后用R_Inactive[Fault_Num]存储,并且将记录的无效控制器R_Inactive[Fault_Num]设定为等于无效控制器的组(314)。
捕捉到相关联的故障信息,包括时间戳、故障序号、以及针对每个故障序号的无效控制器的组R_Inactive[k],k=1,…, Fault_Num(316)。因此,每个故障记录包括:(Time_Stamp,Fault_Num,R_Inactive[k],k=1,…, Fault_Num),其中Fault_Num是在该记录中发生的故障的总数量,R_Inactive[k]是对于由k表示的每个故障的无效控制器的组。程序300的该迭代结束(320)。
图4示出了确定候选故障的车外故障隔离程序200,即,断开链路、线路短路、或者应用故障特征矢量Vf inactive的故障控制器,其示例参考图2来描述。拓扑图,例如参考图2所示,拓扑图分别包括通信总线的拓扑Gbus、电源总线的拓扑Gbat和接地总线的拓扑Ggnd。故障集F可以包括每个控制器节点故障、每个总线链路断开故障、每个电源链路断开故障、每个接地链路断开故障以及对于拓扑图的其他故障。预操作练习生成故障特征矢量Vf inactive,其对于故障集F中的每个故障f由一组无效控制器组成,例如上面参考图2和表1所述。由车外故障隔离程序200采用故障特征矢量Vf inactive来将故障隔离。
表3提供为图4的车外故障隔离程序200的图例,其中标记数字的方框和对应功能如下所述。
车外故障隔离程序200采用直接硬件线路连接和/或无线远程通信连接,响应于源于车外服务设备的询问消息而执行,参考图1描述其实施例。车外服务设备包括系统拓扑形式的数据,其包括指示与之相关联的无效控制器的组的针对每个故障f的故障特征矢量Vf inactive
在车外故障隔离程序200的每次执行期间,初始化条件(202),包括确保候选故障寄存器FC和来自之前迭代的候选故障寄存器Pre_FC为空。从车载控制器检索故障记录形式的故障信息(204)。每个故障记录包括:Time_Stamp,Fault_Num,R_Inactive[k],k=1,…,Fault_Num,其中Fault_Num是在该记录中发生的故障的总数量,R_Inactive[k]是针对由k表示的每个故障的无效控制器的组。将标志k初始化为值“1”(206)。程序针对每个故障标志k将候选故障FC确定为F的子集S,以便S是在满足以下关系的具有|S|≥k的组中最小的(由大小测量)。
R_Inactive[k] =(UUf∈SVf inactive),
并且如果k>1,那么R∈Pre_FC,RS。
来自之前迭代的候选故障寄存器Pre_FC包括在当前FC组中,以便任何之前候选故障变成当前候选故障集FC的一部分(210),并且如果标志k小于故障Fault_Num的数量(212)(1),那么增加标志k,并且评估下一组候选故障(208)。当已经评估了所有故障时(212)(0),将候选故障集FC输出为候选故障集(216)并且车外故障隔离程序200的执行结束(218)。
采用CAN系统来实现在系统例如车辆中的控制器之间实现信号通信。本文描述的故障隔离过程允许单个故障、多个故障以及CAN系统中的间歇性故障的定位和隔离,包括在采用系统拓扑的通信总线、电源以及电接地中的故障,系统拓扑包括针对每个故障f的指示与之相关联的无效控制器的组的故障特征矢量Vf inactive
在一个实施例中,可以使用若干个控制器作为监测控制器以执行车载CAN监测程序300的实施例,其中导致识别传送给车外故障隔离程序200的实施例的无效节点,用于通过采用对于选定监测控制器特定的并且对于不同监测控制器具有不同故障特征和症状的网络拓扑,来识别候选故障。这样的布置允许系统通过比较来自车外故障隔离程序200执行的结果,进一步地隔离CAN故障的位置。
本发明已经描述了某些优选实施例及其变更例。在阅读和理解说明书时,可以想到进一步的变更和替代。因此,旨在本发明不限于作为预期实施本发明的最佳模式公开的具体实施例,而是本发明将包括落入所附权利要求的范围内的所有实施例。

Claims (17)

1.一种监测移动系统上的包括多个控制器局域网络CAN元件的CAN的方法,所述CAN元件包括通信总线和多个节点,所述方法包括:
检测CAN的无效节点;
基于所述CAN的无效节点和用于所述CAN的网络拓扑,采用车外控制器来识别所述CAN中的候选故障;以及
基于所述候选故障隔离所述CAN中的故障;
其中采用车外控制器来识别所述CAN中的候选故障包括:
将所述CAN的无效节点和与用于所述CAN的网络拓扑相关联的多个故障特征矢量进行比较;
识别与所述CAN的无效节点对应的所述故障特征矢量中的一个;
确定与所识别故障特征矢量相关联的故障症状;以及
基于所述故障症状识别所述CAN中的候选故障。
2.如权利要求1所述的方法,其中确定与所识别故障特征矢量相关联的故障症状包括采用CAN的网络拓扑的可达性分析,其中监测通信来确定哪个节点是对所述故障症状无效的。
3.如权利要求1所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电源与节点之间的断开链路。
4.如权利要求1所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电接地与节点之间的断开链路。
5.如权利要求1所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一节点与第二节点之间的断开通信链路。
6.如权利要求1所述的方法,其中与所识别故障特征矢量相关联的故障症状包括节点中的故障。
7.如权利要求1所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一节点与第二节点之间的通信链路中的短路。
8.如权利要求1所述的方法,其中检测CAN的无效节点包括采用车载控制器来监测来自所述CAN的节点的通信、以及将在预定时间周期内不能在所述CAN上生成消息的所述CAN的任何节点识别为无效。
9.如权利要求1所述的方法,还包括:
采用车载监测程序来检测所述CAN的无效节点并且捕捉对应的时间戳;以及
响应于询问,将所述CAN的无效节点和对应的时间戳传送至所述车外控制器。
10.一种监测移动系统上的包括多个控制器局域网络CAN元件的CAN的方法,所述CAN元件包括信号地连接到通信总线的多个控制器,所述方法包括:
采用车载监测程序来将所述CAN的控制器中的每个识别为有效或无效;
响应于询问,将所述CAN的已识别的有效和无效控制器传送至车外控制器;
采用所述车外控制器,基于所述CAN的无效控制器和用于所述CAN的网络拓扑,来识别所述CAN中的候选故障;以及
基于所述候选故障隔离所述CAN中的特定故障;
其中采用车外控制器来识别所述CAN中的候选故障包括:
将所述CAN的无效控制器和与用于所述CAN的网络拓扑相关联的多个故障特征矢量进行比较;
识别与所述CAN的无效控制器对应的所述故障特征矢量中的一个;
确定与所识别故障特征矢量相关联的故障症状;以及
基于所述故障症状识别所述CAN中的候选故障。
11.如权利要求10所述的方法,其中确定与所识别故障特征矢量相关联的故障症状包括采用CAN的网络拓扑的可达性分析,其中监测通信来确定哪个控制器是对所述故障症状无效的。
12.如权利要求10所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电源与控制器之间的断开链路。
13.如权利要求10所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在电接地与控制器之间的断开链路。
14.如权利要求10所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一控制器与第二控制器之间的断开通信链路。
15.如权利要求10所述的方法,其中与所识别故障特征矢量相关联的故障症状包括控制器中的故障。
16.如权利要求10所述的方法,其中与所识别故障特征矢量相关联的故障症状包括在第一控制器与第二控制器之间的通信链路中的短路。
17.如权利要求10所述的方法,其中将所述CAN的控制器中的每个识别为有效或无效包括采用车载控制器来监测来自所述CAN的控制器的通信、以及将在预定时间周期内不能在所述CAN上生成消息的所述CAN的任何控制器识别为无效。
CN201410470400.9A 2013-09-16 2014-09-16 用于隔离控制器局域网络中的故障的方法和装置 Active CN104468175B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/027549 2013-09-16
US14/027,549 US9110951B2 (en) 2013-09-16 2013-09-16 Method and apparatus for isolating a fault in a controller area network

Publications (2)

Publication Number Publication Date
CN104468175A CN104468175A (zh) 2015-03-25
CN104468175B true CN104468175B (zh) 2019-01-22

Family

ID=52580078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410470400.9A Active CN104468175B (zh) 2013-09-16 2014-09-16 用于隔离控制器局域网络中的故障的方法和装置

Country Status (3)

Country Link
US (1) US9110951B2 (zh)
CN (1) CN104468175B (zh)
DE (1) DE102014112095B4 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9600372B2 (en) * 2012-09-05 2017-03-21 GM Global Technology Operations LLC Approach for controller area network bus off handling
US9110951B2 (en) * 2013-09-16 2015-08-18 GM Global Technology Operations LLC Method and apparatus for isolating a fault in a controller area network
US9524222B2 (en) * 2013-09-16 2016-12-20 GM Global Technology Operations LLC Method and apparatus for fault detection in a controller area network
US20150234767A1 (en) 2013-09-23 2015-08-20 Farmobile, Llc Farming data collection and exchange system
US9354965B2 (en) * 2013-10-18 2016-05-31 GM Global Technology Operations LLC Method and apparatus for isolating a fault in a controller area network
US9727431B2 (en) * 2013-12-30 2017-08-08 Sital Ltd. Communication monitoring system
US9678847B2 (en) * 2014-05-27 2017-06-13 GM Global Technology Operations LLC Method and apparatus for short fault detection in a controller area network
US10800363B2 (en) 2017-09-18 2020-10-13 GM Global Technology Operations LLC Analog-to-digital fault detection, isolation, and mitigation for a low-voltage communications network
CN108072806B (zh) * 2017-11-13 2020-12-15 北京全路通信信号研究设计院集团有限公司 一种轨道电路故障诊断系统及诊断方法
US11516046B2 (en) 2020-01-14 2022-11-29 GM Global Technology Operations LLC Controller area network fault detection and recovery
CN112193072B (zh) * 2020-09-29 2022-06-21 奇瑞新能源汽车股份有限公司 一种电动汽车can总线错误帧的排查方法
CN112463428B (zh) * 2020-11-30 2024-03-26 深圳市道通科技股份有限公司 汽车总线故障诊断方法、装置及计算设备
CN113114518B (zh) * 2021-05-28 2023-05-23 一汽奔腾轿车有限公司 一种基于总线物理拓扑的通信类线束故障排查方法
CN113942486B (zh) * 2021-10-22 2022-12-20 交控科技股份有限公司 一种制动故障处理方法及信号系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201281659Y (zh) * 2008-10-08 2009-07-29 湖北三江航天万山特种车辆有限公司 一种汽车底盘故障识别及诊断系统
CN101587018A (zh) * 2008-05-20 2009-11-25 丰田自动车株式会社 车辆失效分析系统、车辆失效分析设备及车辆失效分析方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040004951A1 (en) * 2002-07-05 2004-01-08 Interdigital Technology Corporation Method for performing wireless switching
US7812617B2 (en) 2006-07-07 2010-10-12 Sital Technology & Hw Design 1997 Ltd. System and method for detecting and locating faults in electronic communication bus systems
US8213321B2 (en) 2007-02-01 2012-07-03 Deere & Company Controller area network condition monitoring and bus health on in-vehicle communications networks
DE102008002738B4 (de) * 2008-06-27 2010-03-11 Airbus Deutschland Gmbh Verfahren zum Erkennen eines fehlerhaften Knotens
CN101764657A (zh) * 2008-12-26 2010-06-30 长春轨道客车股份有限公司 城市轨道客车上新闻实时传输方法
US8831821B2 (en) 2010-12-17 2014-09-09 GM Global Technology Operations LLC Controller area network message transmission disable testing systems and methods
US9110951B2 (en) * 2013-09-16 2015-08-18 GM Global Technology Operations LLC Method and apparatus for isolating a fault in a controller area network
US9524222B2 (en) * 2013-09-16 2016-12-20 GM Global Technology Operations LLC Method and apparatus for fault detection in a controller area network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101587018A (zh) * 2008-05-20 2009-11-25 丰田自动车株式会社 车辆失效分析系统、车辆失效分析设备及车辆失效分析方法
CN201281659Y (zh) * 2008-10-08 2009-07-29 湖北三江航天万山特种车辆有限公司 一种汽车底盘故障识别及诊断系统

Also Published As

Publication number Publication date
US20150082089A1 (en) 2015-03-19
CN104468175A (zh) 2015-03-25
US9110951B2 (en) 2015-08-18
DE102014112095B4 (de) 2021-06-02
DE102014112095A1 (de) 2015-03-19

Similar Documents

Publication Publication Date Title
CN104468175B (zh) 用于隔离控制器局域网络中的故障的方法和装置
CN104468256B (zh) 用于隔离控制器局域网络中的故障的方法和设备
CN104579877B (zh) 用于隔离控制器局域网络中的故障的方法和装置
CN105182151B (zh) 用于控制器局域网络中的断路线路故障检测和诊断的方法和装置
CN105745871B (zh) 具有以太网总线系统的车辆和用于运行这样的总线系统的方法
CN105319474B (zh) 用于控制器局域网络中的短路故障检测的方法和装置
KR101575547B1 (ko) 캔 통신 시스템의 에러 분산감지 방법 및 캔 통신 시스템
CN103139011B (zh) 用于车内通信的综合故障诊断和预测方法
US20150312123A1 (en) Method and apparatus for isolating a fault in a controller area network
US20140149801A1 (en) Method and apparatus for isolating a fault in a controller area network
CN105162651A (zh) 用于控制器局域网络中的短路故障隔离的方法和装置
CN110068766A (zh) 集成电路和包括其的电池管理系统
US8209594B2 (en) Sending device, receiving device, communication control device, communication system, and communication control method
WO2023065620A1 (zh) 基于EtherCAT总线的线束测试方法及装置
EP1680747A2 (en) Modular scanning system for cabling systems
JP2011050155A (ja) 蓄電装置
JP2006113668A (ja) 故障診断装置
EP3555871B1 (en) Fire-prevention control unit
JP2005269004A (ja) 多重ループ型ネットワークの故障箇所判定方法、多重ループ型ネットワーク、ノード装置
JP2020010334A (ja) 回路装置
JP2009005160A (ja) エラー発生装置
KR101603549B1 (ko) 차량 네트워크 시스템 및 그 진단 방법
CN116719302A (zh) 一种车载以太网环网运行状态信息的诊断方法及相关装置
CN116800651A (zh) 一种汽车总线测试系统、方法、电子设备及存储介质
JP2007265222A (ja) 故障診断方法および故障診断装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant