FR3082961A1 - DEVICE FOR DIAGNOSING A FAILURE OF A PROCESSING UNIT BASED ON QUESTIONS / ANSWERS - Google Patents
DEVICE FOR DIAGNOSING A FAILURE OF A PROCESSING UNIT BASED ON QUESTIONS / ANSWERS Download PDFInfo
- Publication number
- FR3082961A1 FR3082961A1 FR1855622A FR1855622A FR3082961A1 FR 3082961 A1 FR3082961 A1 FR 3082961A1 FR 1855622 A FR1855622 A FR 1855622A FR 1855622 A FR1855622 A FR 1855622A FR 3082961 A1 FR3082961 A1 FR 3082961A1
- Authority
- FR
- France
- Prior art keywords
- processing unit
- threshold
- anomaly
- failure
- counter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0736—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
- G06F11/0739—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function in a data processing system embedded in automotive or aircraft systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/076—Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3013—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is an embedded system, i.e. a combination of hardware and software dedicated to perform a certain function in mobile devices, printers, automotive or aircraft systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
L'invention concerne un dispositif (10) de diagnostic de défaillance d'une unité de traitement (MC) comprenant un module (MU) apte à vérifier le bon fonctionnement de l'unité de traitement (MC) en lui posant régulièrement des questions et en analysant les réponses, et un compteur d'anomalie (FC) apte à compter les réponses mauvaises ou absentes et à produire un diagnostic de défaillance lorsqu'il dépasse un premier seuil (FT), où le compteur d'anomalie (FC) est réinitialisé selon une période (DT).The invention relates to a device (10) for diagnosing the failure of a processing unit (MC) comprising a module (MU) capable of verifying the correct operation of the processing unit (MC) by regularly asking it questions and by analyzing the responses, and an anomaly counter (FC) capable of counting bad or absent responses and of producing a fault diagnosis when it exceeds a first threshold (FT), where the anomaly counter (FC) is reset according to a period (DT).
Description
La présente invention concerne de manière générale le domaine de l’électronique automobile et de la sécurité de fonctionnement des unités de traitement. Elle vise en particulier un dispositif de diagnostic de défaillance.The present invention relates generally to the field of automotive electronics and the operational safety of processing units. It relates in particular to a fault diagnosis device.
Il est connu, pour satisfaire aux normes de sécurité du contrôle moteur ISO 29292 de surveiller le bon fonctionnement d’une unité de traitement MC (de l’anglais « Main Contrôler » : contrôleur principal) au moyen d’un module MU (de l’anglais « Monitoring Unit » : unité de surveillance) séparé.To meet ISO 29292 engine control safety standards, it is known to monitor the proper functioning of a MC processing unit (from the main controller) by means of a MU module (of the 'English "Monitoring Unit": separate monitoring unit).
La figure 1 présente un système représenté organiquement selon la verticale et temporellement selon l’horizontale. Une unité de traitement MC, en partie haute, échange au moyen d’un moyen de communication, en partie médiane, avec un module MU, en partie basse. Le temps T est figuré de gauche à droite. A chaque cycle k se répètent régulièrement les étapes suivantes.Figure 1 shows a system organically represented vertically and temporally horizontally. A processing unit MC, in the upper part, exchanges by means of a communication means, in the middle part, with a MU module, in the lower part. The time T is shown from left to right. The following steps are regularly repeated at each cycle k.
A l’étape 1, le module MU choisit une question Q(k) à envoyer à l’unité de traitement MC, pour le kième cycle ou cycle courant.In step 1, the module MU chooses a question Q (k) to be sent to the processing unit MC, for the k th cycle or current cycle.
A l’étape 2, La question Q(k) est insérée dans une trame SPI et envoyée à l’unité de traitement MC. La transmission SPI (pour « Serial Peripheral Interface » en anglais, ou « Interface Périphérique Série » en français) est schématisée par la flèche bidirectionnelle sur la figure 1.In step 2, the question Q (k) is inserted into an SPI frame and sent to the processing unit MC. The SPI transmission (for “Serial Peripheral Interface” in English, or “Serial Peripheral Interface” in French) is shown diagrammatically by the bidirectional arrow in FIG. 1.
A l’étape 3, L’unité de traitement MC décode la trame SPI et extrait la question Q(k).In step 3, the processing unit MC decodes the SPI frame and extracts the question Q (k).
A l’étape 4, l’unité de traitement MC consomme la question Q(k) et calcule la réponse, la réception 4 de cette question Q(k) déclenchant la détermination par l’unité de traitement MC d’une réponse A(k).In step 4, the processing unit MC consumes the question Q (k) and calculates the response, the reception 4 of this question Q (k) triggering the determination by the processing unit MC of a response A ( k).
L’unité de traitement MC traite la question Q(k) en exécutant un algorithme lui permettant de déterminer la réponse A(k). Avantageusement, cet algorithme met à contribution un ou plusieurs des composants de l’unité de traitement MC, tels les coeurs multiples d’un micro-processeur, le ou les bus de communication et préférentiellement tous, ..., et met en oeuvre une ou plusieurs fonctions de l’unité de traitement MC. Avantageusement l’ensemble des questions est construit de manière à solliciter tous les composants et toutes les fonctions nécessaires à la réalisation des tâches de l’unité de traitement MC.The processing unit MC deals with the question Q (k) by executing an algorithm enabling it to determine the answer A (k). Advantageously, this algorithm involves one or more of the components of the processing unit MC, such as the multiple cores of a microprocessor, the communication bus or buses and preferably all, ..., and implements a or several functions of the processing unit MC. Advantageously, the set of questions is constructed so as to solicit all the components and all the functions necessary for carrying out the tasks of the processing unit MC.
A l’étape 5, l’unité de traitement MC fournit la réponse A(k) à la question Q(k).In step 5, the processing unit MC provides the answer A (k) to the question Q (k).
A l’étape 6, la réponse A(k) est insérée dans une trame SPI et envoyée au module MU.In step 6, the response A (k) is inserted into an SPI frame and sent to the module MU.
A l’étape 7, Le module MU décode la trame SPI et extrait la réponse A(k). Le module MU connaît les réponses attendues et peut ainsi vérifier, à l’étape 7, si l’unité de traitement MC a retourné la bonne réponse A(k). Si une bonne réponse est reçue il peut être supposé que l’unité de traitement MC, y compris le bus de communication, fonctionne correctement. Alternativement l’unité de traitement MC peut retourner une mauvaise réponse ou ne pas retourner de réponse. Pour ce deuxième cas, le module MU utilise typiquement un timer déclenché à l’envoi de la question Q. Si aucune réponse A n’est reçue à l’expiration du timer, encore nommée « time-out », il est considéré que la réponse est absente. Une réponse absente ou mauvaise est indicative d’une anomalie.In step 7, the MU module decodes the SPI frame and extracts the response A (k). The module MU knows the expected responses and can thus verify, in step 7, whether the processing unit MC has returned the correct response A (k). If a good response is received, it can be assumed that the MC processing unit, including the communication bus, is functioning properly. Alternatively, the MC processing unit may return a wrong answer or not return a response. For this second case, the MU module typically uses a timer triggered when the question Q is sent. If no response A is received at the expiration of the timer, also called "time-out", it is considered that the answer is missing. An absent or wrong answer is indicative of an anomaly.
Lorsqu’une défaillance de l’unité de traitement MC est diagnostiquée, des mesures conservatoires sont déclenchées. L’unité de traitement MC est typiquement réinitialisée, et par exemple redémarrée dans un mode dégradé, sûr pour le système commandé mais présentant le plus souvent des performances limitées, tel un mode, nommé en anglais « limp-home », autorise un fonctionnement du moteur/véhicule restreint dans ses fonctions et/ou limité dans le temps, mais sûr pour le véhicule et son conducteur, afin de leur permettre de rejoindre un lieu de destination ou un garage.When a failure of the MC treatment unit is diagnosed, protective measures are triggered. The MC processing unit is typically reset, and for example restarted in a degraded mode, safe for the controlled system but most often having limited performance, such as a mode, called in English "limp-home", authorizes operation of the engine / vehicle restricted in its functions and / or limited in time, but safe for the vehicle and its driver, in order to allow them to reach a place of destination or a garage.
Certaines anomalies sont inévitables et ne prêtent pas à conséquence. Il peut par exemple arriver qu’une réponse à une question postérieure soit reçue par le module MU avant une réponse à une question antérieure, autrement dit que deux réponses soient reçues dans un ordre différent de celui des questions. Ce phénomène est connu sous le nom de « jitter » ou guigue en français. Le module MU conclut alors à une mauvaise réponse. Ceci crée une anomalie qui n’est pas indicative d’une réelle défaillance, telle une défaillance d’un composant matériel. Ceci est d’autant plus probable lorsque l’unité de traitement MC comprend plusieurs coeurs et/ou que le module MU envoie les questions à une fréquence élevée. Il peut alors arriver que l’algorithme de détermination de la réponse sollicitant différents coeurs, soit retardé pour la détermination et ainsi la fourniture d’une réponse, si au moins un des coeurs est surchargé.Certain anomalies are inevitable and do not lend themselves to consequence. For example, it may happen that an answer to a later question is received by the MU module before an answer to an earlier question, in other words two answers are received in a different order from that of the questions. This phenomenon is known as "jitter" or guigue in French. The MU module then concludes with a wrong answer. This creates an anomaly that is not indicative of a real failure, such as a failure of a hardware component. This is all the more likely when the MC processing unit includes several hearts and / or when the MU module sends the questions at a high frequency. It can then happen that the algorithm for determining the response requesting different hearts is delayed for the determination and thus the supply of a response, if at least one of the hearts is overloaded.
Aussi, de manière connue, afin de ne pas indûment recourir aux mesures conservatoires contraignantes, il n’est pas diagnostiqué une défaillance à la première anomalie, mais après une succession de plusieurs anomalies, dans un temps limité, typiquement traitées au moyen d’un filtre.Also, in a known manner, in order not to unduly resort to restrictive protective measures, a failure is not diagnosed at the first anomaly, but after a succession of several anomalies, in a limited time, typically treated by means of a filtered.
Selon un mode de réalisation connu il est, par exemple, utilisé comme filtre un dispositif anti-rebond (ou « anti bounce » en anglais). Tel qu’illustré à la figure 2, un tel dispositif traite un signal d’anomalie AN de la manière suivante. Le dispositif anti-rebond comprend un compteur anti-rebond AB. Ce compteur AB est incrémenté à chaque anomalie (réponse mauvaise ou absente), indiquée par un état haut du signal AN, et est décrémenté à chaque bonne réponse, pour peu que cette bonne réponse soit reçue dans un délai donné consécutif à l’anomalie et limité. Ainsi lorsqu’une anomalie est détectée, le dispositif anti-rebond déclenche un timer, si au moins une bonne réponse est reçue avant l’expiration du timer, l’anomalie est ignorée et/ou annulée. Si au contraire, à l’expiration du timer, aucune bonne réponse n’a été reçue, l’anomalie est comptabilisée. Ainsi l’anomalie A1, présente durant un cycle, provoque un incrément B1 du compteur AB. Cependant, la bonne réponse reçue suite à A1, indiquée par un état bas du signal AN, provoque un décrément du compteur AB qui revient à sa valeur initiale. De même, l’anomalie A2, présente durant deux cycles successifs, provoque successivement deux incréments B2 du compteur AB. Cependant, deux bonnes réponses reçues pendant deux cycles suite à A2, provoquent deux décréments successifs du compteur AB qui revient à sa valeur initiale. Aussi les anomalies A1 et A2 sont ignorées.According to a known embodiment, it is, for example, used as a filter an anti-rebound device (or "anti bounce" in English). As illustrated in FIG. 2, such a device processes an AN anomaly signal in the following manner. The anti-rebound device includes an anti-rebound counter AB. This counter AB is incremented at each anomaly (bad or absent response), indicated by a high state of the signal AN, and is decremented at each good response, provided that this good response is received within a given period of time following the anomaly and limit. So when an anomaly is detected, the anti-rebound device triggers a timer, if at least one correct response is received before the timer expires, the anomaly is ignored and / or canceled. If on the contrary, at the expiration of the timer, no correct answer has been received, the anomaly is counted. Thus the anomaly A1, present during a cycle, causes an increment B1 of the counter AB. However, the correct response received following A1, indicated by a low state of the signal AN, causes the counter AB to decrement, which returns to its initial value. Similarly, the anomaly A2, present during two successive cycles, successively causes two increments B2 of the counter AB. However, two correct responses received during two cycles following A2, cause two successive decrements of the counter AB which returns to its initial value. Also anomalies A1 and A2 are ignored.
Lorsque le compteur anti-rebond AB dépasse un seuil donné AT, une défaillance est diagnostiquée. Ceci est illustré à la figure 2, par l’anomalie A3, successivement répétée pendant 8 cycles, qui incrémente successivement le compteur AB jusqu’à ce qu’il atteigne le seuil AT.When the anti-rebound counter AB exceeds a given threshold AT, a failure is diagnosed. This is illustrated in FIG. 2, by the anomaly A3, successively repeated for 8 cycles, which successively increments the counter AB until it reaches the threshold AT.
Ainsi, il faut plusieurs anomalies successives, dans un certain délai, sans bonne réponse intermédiaire, pour diagnostiquer une défaillance. Le seuil est un paramètre important. Il offre avantageusement une certaine tolérance et une possibilité de « correction », notamment des anomalies dues à un phénomène de « jitter >> ou guigue. De manière désavantageuse, la présence du seuil, et le « time-out >> retenu, retardent d’autant une prise de décision. Aussi le seuil est généralement réduit, typiquement égal à quelques unités, par exemple égal à 3 sur la figure 2. Ceci correspond temporellement à 3 récurrences de diagnostic, soit 30 ms pour une récurrence de 10 ms. Un tel dispositif antirebond évacue efficacement des anomalies non pertinentes telles que celles causées par un phénomène de « jitter >> ou guigue.Thus, it takes several successive anomalies, within a certain time, without good intermediate response, to diagnose a failure. The threshold is an important parameter. It advantageously offers a certain tolerance and a possibility of "correction", in particular anomalies due to a phenomenon of "jitter" or jitter. Disadvantageously, the presence of the threshold, and the "time-out" retained, delay all the more a decision-making. Also the threshold is generally reduced, typically equal to a few units, for example equal to 3 in FIG. 2. This corresponds temporally to 3 diagnostic recurrences, ie 30 ms for a recurrence of 10 ms. Such an anti-rebound device effectively evacuates irrelevant anomalies such as those caused by a phenomenon of "jitter" or guigue.
Cependant un tel dispositif anti-rebond présente encore un autre inconvénient. Sa capacité de « correction >> devient préjudiciable en ce qu’elle a pour effet de masquer une anomalie sporadique.However, such an anti-rebound device has yet another drawback. Its ability to "correct" becomes detrimental in that it has the effect of masking a sporadic anomaly.
Lorsqu’une anomalie présente une fréquence supérieure à la fréquence de bonne réponse, y inclus une anomalie continûment présente, comme c’est le cas pour l’anomalie A3 de la figure 2, le dispositif anti-rebond fonctionne bien en ce que le compteur anti-rebond AB va rapidement s’incrémenter jusqu’à dépasser le seuil AT et ainsi à juste titre conduire au diagnostic d’une défaillance. Cependant, si à l’instar des anomalies A1, A2 de la figure 2, une anomalie présente une fréquence inférieure à la fréquence de bonne réponse, cette anomalie A1, A2, même récurrente est masquée par le dispositif antirebond et est ignorée.When an anomaly has a frequency higher than the correct answer frequency, including a continuously present anomaly, as is the case for the anomaly A3 in Figure 2, the anti-rebound device works well in that the counter AB anti-rebound will rapidly increase until it exceeds the AT threshold and thus rightly lead to the diagnosis of a failure. However, if, like the anomalies A1, A2 in FIG. 2, an anomaly has a frequency lower than the frequency of correct response, this anomaly A1, A2, even recurrent, is masked by the anti-rebound device and is ignored.
L’objectif de l’invention est de proposer un dispositif de diagnostic de défaillance d’une unité de traitement présentant les mêmes fonctionnalités, mais sans présenter les inconvénients du dispositif anti-rebond, soit un dispositif apte à diagnostiquer une défaillance, présentant une certaine tolérance aux anomalies par exemple causées par un phénomène de « jitter » ou guigue et encore apte à diagnostiquer une défaillance sporadique.The objective of the invention is to propose a device for diagnosing the failure of a processing unit having the same functionalities, but without having the drawbacks of the anti-rebound device, ie a device capable of diagnosing a failure, having a certain tolerance to anomalies for example caused by a phenomenon of "jitter" or wasting and still capable of diagnosing a sporadic failure.
Cet objectif est atteint grâce à un dispositif de diagnostic de défaillance d’une unité de traitement comprenant un module apte à vérifier le bon fonctionnement de l’unité de traitement en lui posant régulièrement des questions et en analysant les réponses, et un compteur d’anomalie apte à compter les réponses mauvaises ou absentes et à produire un diagnostic de défaillance lorsqu’il dépasse un premier seuil, le compteur d’anomalie étant réinitialisé selon une période.This objective is achieved thanks to a device for diagnosing the failure of a processing unit comprising a module capable of verifying the proper functioning of the processing unit by regularly asking it questions and analyzing the answers, and a counter of anomaly capable of counting bad or absent responses and of producing a fault diagnosis when it exceeds a first threshold, the anomaly counter being reset according to a period.
Selon une autre caractéristique, le nombre d’incréments du compteur d’anomalie possibles au cours d’une période est supérieur au premier seuil, préférentiellement supérieur au double du premier seuil.According to another characteristic, the number of possible increment counter increments during a period is greater than the first threshold, preferably greater than twice the first threshold.
Selon une autre caractéristique, le dispositif comprend encore un moyen d’enregistrement apte à enregistrer au moins une information relative au compteur d’anomalie.According to another characteristic, the device also comprises a recording means capable of recording at least one item of information relating to the anomaly counter.
Selon une autre caractéristique, l’information enregistrée comprend la valeur du compteur d’anomalie avant réinitialisation.According to another characteristic, the information recorded comprises the value of the anomaly counter before reinitialization.
Selon une autre caractéristique, l’information enregistrée est le ou les instants où la valeur du compteur d’anomalie atteint ou dépasse un deuxième seuil, inférieur au premier seuil et/ou le nombre de fois où le compteur d’anomalie atteint ou dépasse le deuxième seuil.According to another characteristic, the information recorded is the time or times when the value of the anomaly counter reaches or exceeds a second threshold, below the first threshold and / or the number of times the anomaly counter reaches or exceeds the second threshold.
Selon une autre caractéristique, l’information enregistrée est le profil complet du compteur d’anomalie.According to another characteristic, the information recorded is the complete profile of the anomaly counter.
Selon une autre caractéristique, l’information enregistrée est accompagnée d’un état de l’environnement de l’unité de traitement.According to another characteristic, the information recorded is accompanied by a state of the environment of the processing unit.
Selon une autre caractéristique, l’information enregistrée est comparée à celle obtenue pour une unité de traitement de référence ou pour une unité de traitement moyenne afin de diagnostiquer une défaillance sporadique.According to another characteristic, the information recorded is compared with that obtained for a reference processing unit or for an average processing unit in order to diagnose a sporadic failure.
D’autres caractéristiques et avantages innovants de l’invention ressortiront à la lecture de la description ci-après, fournie à titre indicatif et nullement limitatif, en référence aux dessins annexés, dans lesquels :Other innovative characteristics and advantages of the invention will emerge on reading the description below, provided for information and in no way limitative, with reference to the appended drawings, in which:
- la figure 1, déjà décrite, illustre un système de diagnostic basé sur des questions réponses,FIG. 1, already described, illustrates a diagnostic system based on questions and answers,
- la figure 2, déjà décrite, présente le fonctionnement d’un dispositif anti rebond selon l’art antérieur,FIG. 2, already described, shows the operation of an anti-rebound device according to the prior art,
- la figure 3, présente le fonctionnement d’un dispositif selon l’invention.- Figure 3 shows the operation of a device according to the invention.
Pour plus de clarté, les éléments identiques ou similaires sont repérés par des signes de référence identiques sur l’ensemble des figures.For the sake of clarity, identical or similar elements are identified by identical reference signs in all of the figures.
L’invention concerne un dispositif 10 de diagnostic de défaillance d’une unité de traitement MC. Ce dispositif comprend un module MU apte à vérifier le bon fonctionnement de l’unité de traitement MC en lui posant régulièrement des questions et en analysant les réponses. Ce dispositif 10 comprend encore un compteur d’anomalie FC apte à compter les réponses mauvaises ou absentes et à produire un diagnostic de défaillance lorsqu’il dépasse un premier seuil FT. Le fonctionnement de ce compteur d’anomalie FC est illustré à la figure 3.The invention relates to a device 10 for diagnosing the failure of a processing unit MC. This device includes a MU module capable of verifying the proper functioning of the MC processing unit by regularly asking it questions and analyzing the answers. This device 10 also includes an FC anomaly counter capable of counting bad or absent responses and of producing a fault diagnosis when it exceeds a first FT threshold. The operation of this FC anomaly counter is illustrated in Figure 3.
Selon une caractéristique propre à l’invention, le compteur d’anomalie FC est périodiquement réinitialisé, et ce selon une période DT.According to a characteristic specific to the invention, the anomaly counter FC is periodically reset, and this according to a period DT.
Ainsi, tel que montré à la figure 3, un même signal d’anomalie AN que précédemment à la figure 2, est utilisé afin de faciliter une comparaison. Ce signal d’anomalie AN est traité par le dispositif 10 selon l’invention de la manière suivante. Un compteur d’anomalie FC est utilisé pour compter les réponses mauvaises ou absentes. Une réponse absente ou mauvaise provoque une incrémentation du compteur d’anomalie FC. Contrairement au dispositif anti-rebond il n’est pas tenu compte des bonnes réponses, en ce qu’une bonne réponse ne décrémente pas le compteur d’anomalie FC. Ainsi l’anomalie A1 provoque un incrément C1 du compteur d’anomalie FC. Cette valeur est ensuite maintenue malgré l’arrivée ultérieure d’au moins une bonne réponse. A l’issue d’une période DT, le compteur FC est réinitialisé en D1.Thus, as shown in Figure 3, the same AN fault signal as previously in Figure 2, is used to facilitate comparison. This AN anomaly signal is processed by the device 10 according to the invention in the following manner. An FC anomaly counter is used to count wrong or missing responses. An absent or incorrect response causes the FC anomaly counter to increment. Unlike the anti-rebound device, correct answers are not taken into account, in that a correct answer does not decrement the FC anomaly counter. Thus the anomaly A1 causes an increment C1 of the anomaly counter FC. This value is then maintained despite the subsequent arrival of at least one correct answer. At the end of a DT period, the FC counter is reset to D1.
Une période DT peut, par exemple, être déterminée au moyen d’un compteur CK incrémenté à chaque cycle et réinitialisé lorsqu’il atteint sa valeur maximale CT. Ainsi la période DT est égale à la durée d’un cycle multipliée par CT.A period DT can, for example, be determined by means of a counter CK incremented at each cycle and reset when it reaches its maximum value CT. Thus the period DT is equal to the duration of a cycle multiplied by CT.
Ensuite l’anomalie A2 provoque un double incrément C2. Le compteur d’anomalie FC maintient ensuite la valeur ainsi atteinte. A l’issue de la période DT suivante, le compteur FC est réinitialisé en D2.Then the anomaly A2 causes a double increment C2. The FC anomaly counter then maintains the value thus reached. At the end of the following DT period, the FC counter is reset to D2.
A contrario, l’anomalie A3 provoque un multiple incrément C3, tel que le compteur d’anomalie FC atteint le seuil FT de défaillance avant la fin de la période DT, et ainsi avant qu’une réinitialisation ne soit réalisée. Aussi une défaillance est diagnostiquée en D3.Conversely, the anomaly A3 causes a multiple increment C3, such that the anomaly counter FC reaches the failure threshold FT before the end of the period DT, and thus before a reset is carried out. Also a failure is diagnosed in D3.
Pour qu’un tel dispositif 10 puisse détecter une défaillance, il convient que le compteur d’anomalie FC puisse dépasser son seuil FT avant une réinitialisation. Aussi il faut que la période de réinitialisation DT soit suffisamment longue. A minima, il faut que le nombre d’incréments du compteur d’anomalie FC possibles au cours d’une période DT, soit le nombre d’incréments produit par une succession ininterrompue d’anomalies, soit supérieur au premier seuil FT. De manière préférentielle, la période DT est avantageusement choisie plus grande, par exemple au moins égale au double du premier seuil FT.In order for such a device 10 to be able to detect a fault, the anomaly counter FC should be able to exceed its threshold FT before a reset. Also, the reset period DT must be long enough. At a minimum, the number of increments of the FC anomaly counter possible during a period DT, that is to say the number of increments produced by an uninterrupted succession of anomalies, must be greater than the first threshold FT. Preferably, the period DT is advantageously chosen to be greater, for example at least equal to twice the first threshold FT.
Ainsi le temps étant découpé en cycles, le compteur d’anomalie FC est incrémenté à chaque cycle où une réponse est mauvaise ou absente et la période DT de réinitialisation est un nombre entier p de cycles au moins égal à la valeur et préférentiellement supérieur au premier seuil FT. Sur la figure 3, DT correspond à 6 cycles et FT est égal à 3.Thus the time being divided into cycles, the anomaly counter FC is incremented with each cycle where a response is bad or absent and the reset period DT is an integer p of cycles at least equal to the value and preferably greater than the first FT threshold. In Figure 3, DT corresponds to 6 cycles and FT is equal to 3.
Il ressort de la description précédente que le dispositif selon l’invention permet avantageusement de diagnostiquer une défaillance lorsqu’une succession suffisamment importante d’anomalies est présente, tout en tolérant une certaine marge d’erreur, et une certaine quantité d’anomalies, avantageusement « corrigée >> ou « oubliée >> temporellement grâce au mécanisme de réinitialisation périodique.It appears from the preceding description that the device according to the invention advantageously makes it possible to diagnose a failure when a sufficiently large succession of anomalies is present, while tolerating a certain margin of error, and a certain amount of anomalies, advantageously "Corrected" or "forgotten" temporally thanks to the periodic reset mechanism.
Le signal DF de la figure 3 est indicatif de l’état de défaillance. Il est au niveau bas en l’absence de défaillance. Il est au niveau haut suite à D3 et au dépassement par le compteur d’anomalie FC du seuil FT.The signal DF of FIG. 3 is indicative of the state of failure. It is at a low level in the absence of failure. It is at the high level following D3 and when the FT anomaly counter exceeds the FT threshold.
Afin de ne pas déclencher indûment les mesures conservatives mais contraignantes suite à un diagnostic de défaillance, le seuil FT peut être relevé d’une marge. En cas de panne d’un composant, conduisant généralement à une anomalie persistante, ce seuil FT, à raison d’un incrément par cycle, est rapidement atteint. Il convient cependant que le seuil FT ne soit pas trop grand afin de ne pas trop retarder le diagnostic.In order not to unduly trigger conservative but restrictive measures following a failure diagnosis, the FT threshold can be increased by a margin. In the event of a component failure, generally leading to a persistent anomaly, this FT threshold, at the rate of one increment per cycle, is quickly reached. However, the FT threshold should not be too high in order not to delay the diagnosis too much.
Le compteur d’anomalie FC contient avantageusement des informations sur le comportement de l’unité de traitement MC en termes de fiabilité et d’évolution de cette fiabilité. Aussi selon une autre caractéristique du dispositif 10, ce dernier comprend avantageusement encore un moyen d’enregistrement apte à enregistrer au moins une information relative au compteur d’anomalie FC. Cet enregistrement d’information peut être exploité de différentes manières ou sous différentes formes.The FC anomaly counter advantageously contains information on the behavior of the processing unit MC in terms of reliability and evolution of this reliability. Also according to another characteristic of the device 10, the latter advantageously further comprises a recording means capable of recording at least one item of information relating to the anomaly counter FC. This information recording can be used in different ways or in different forms.
Selon un premier mode de réalisation, l’information enregistrée comprend la valeur du compteur d’anomalie FC avant réinitialisation. Cette information est figurée par le signal VA de la figure 3. Ce signal vaut 1 pour la première période DT, 2 pour la deuxième période DT et 3 pour la troisième période DT.According to a first embodiment, the information recorded comprises the value of the FC anomaly counter before reinitialization. This information is represented by the signal VA of FIG. 3. This signal is worth 1 for the first period DT, 2 for the second period DT and 3 for the third period DT.
Entre une valeur minimale FTO, de quelques unités, nécessaire à évacuer les conséquences d’un « jitter >> ou guigue sans diagnostiquer une défaillance, et une valeur plus élevée du seuil FT effectivement retenue et pouvant inclure une marge, il apparaît une étendue dans laquelle une analyse du comportement des anomalies telles que vues par le compteur d’anomalie FC peut être intéressante pour la sécurité de fonctionnement et/ou la maintenance préventive sur le moyen ou long terme.Between a minimum value FTO, of a few units, necessary to remove the consequences of a "jitter" or wasting without diagnosing a failure, and a higher value of the FT threshold actually retained and which may include a margin, a range appears in which an analysis of the behavior of anomalies as seen by the FC anomaly counter can be useful for operational safety and / or preventive maintenance in the medium or long term.
Selon un autre mode de réalisation, afin d’observer une éventuelle évolution des anomalies, il est mis en place un deuxième seuil MT. Ce deuxième seuil est avantageusement inférieur au premier seuil FT et encore avantageusement supérieur à la valeur minimale FTO définie précédemment.According to another embodiment, in order to observe a possible evolution of the anomalies, a second MV threshold is implemented. This second threshold is advantageously lower than the first threshold FT and still advantageously greater than the minimum value FTO defined above.
Dans ce cas, l’information enregistrée est le ou les instants où la valeur du compteur d’anomalie FC atteint ou dépasse le deuxième seuil MT. Ceci est illustré par le signal PD de la figure 3. Alternativement il peut être enregistré le nombre de fois où le compteur d’anomalie FC atteint ou dépasse le deuxième seuil MT.In this case, the information recorded is the instant (s) when the value of the FC anomaly counter reaches or exceeds the second threshold MT. This is illustrated by the signal PD in FIG. 3. Alternatively, the number of times the anomaly counter FC reaches or exceeds the second threshold MT can be recorded.
Selon un autre mode de réalisation, l’information enregistrée est le profil complet du compteur d’anomalie FC.According to another embodiment, the information recorded is the complete profile of the FC anomaly counter.
Avantageusement, en vue d’une analyse plus détaillée de la situation d’anomalie, l’information enregistrée est accompagnée d’un état de l’environnement. Il est entendu ici par environnement, le système commandé par l’unité de traitement MC. Ainsi dans le cas d’une unité de traitement MC est un calculateur moteur, l’environnement est le moteur et/ou le véhicule. L’état de l’environnement peut comprendre un enregistrement des valeurs de paramètres parmi : température de l’eau, température de l’air autour de l’unité de traitement MC, régime moteur, vitesse véhicule ou tout autre paramètre signifiant.Advantageously, for a more detailed analysis of the anomaly situation, the information recorded is accompanied by a state of the environment. It is understood here by environment, the system controlled by the processing unit MC. Thus in the case of a processing unit MC is an engine computer, the environment is the engine and / or the vehicle. The state of the environment can include a recording of the parameter values among: water temperature, air temperature around the MC processing unit, engine speed, vehicle speed or any other significant parameter.
Avantageusement le deuxième seuil MT est disposé au plus près, par valeur supérieure, de la valeur minimale FTO. Ainsi, la valeur FTO étant indicative d’un fonctionnement nominal est uniquement dimensionnée pour évacuer le « jitter >> ou guigue. Il s’ensuit qu’un dépassement du deuxième seuil MT peut correspondre à une autre cause d’anomalie. Cette autre cause, suffisamment sporadique pour être corrigée par le mécanisme de réinitialisation, peut cependant être ainsi détectée par le dispositif 10.Advantageously, the second threshold MT is arranged as close as possible, by higher value, to the minimum value FTO. Thus, the FTO value being indicative of nominal operation is only dimensioned to evacuate the "jitter" or guigue. It follows that exceeding the second MV threshold may correspond to another cause of anomaly. This other cause, sporadic enough to be corrected by the reset mechanism, can however be thus detected by the device 10.
Alternativement ou complémentairement le deuxième seuil MT (ou un troisième seuil) peut être positionné à une valeur minimale ne diagnostiquant pas de défaillance en fonctionnement nominal. Cette valeur peut correspondre à FTO ou lui être supérieure en ce qu’elle inclut des anomalies acceptables mais non liées au « jitter >> ou guigue. Ces anomalies n’ont avantageusement pas à être identifiées, la valeur du seuil MT pouvant être déterminée empiriquement. Un tel seuil MT fournit alors une « photographie >> de l’état d’anomalie nominal de l’unité de traitement MC. Un franchissement de ce seuil MT est alors indicatif d’une augmentation du nombre d’anomalies relativement à l’état initial et signale une défaillance sporadique.Alternatively or additionally the second threshold MV (or a third threshold) can be positioned at a minimum value not diagnosing a failure in nominal operation. This value can correspond to or be higher than FTO in that it includes acceptable anomalies but not related to "jitter" or guigue. These anomalies do not advantageously have to be identified, the value of the threshold MT can be determined empirically. Such a threshold MT then provides a "photograph" of the nominal anomaly state of the processing unit MC. Crossing this MV threshold is then indicative of an increase in the number of anomalies relative to the initial state and signals a sporadic failure.
Ceci peut encore être mis à profit pour suivre l’évolution de la fiabilité dans le temps. Une augmentation du nombre d’anomalies, indiquée par une évolution d’une valeur constatée de seuil MT, pouvant fournir une métrique de la dégradation de la fiabilité.This can still be used to monitor the evolution of reliability over time. An increase in the number of anomalies, indicated by a change in an observed value of the MV threshold, which can provide a metric of the degradation of reliability.
Différents types de traitement des informations enregistrées par le dispositif 10 sont possibles. Il est possible de comparer les informations issues d’un même dispositif 10 au cours du temps afin d’observer l’évolution temporelle de la fiabilité. Il est encore possible de comparer les informations issues d’un dispositif 10 avec celles issues d’autres dispositifs. Une mise en réseau des informations ainsi obtenues permet de réaliser des traitements statistiques, afin de déterminer, par exemple, une moyenne et des tendances.Different types of processing of the information recorded by the device 10 are possible. It is possible to compare the information coming from the same device 10 over time in order to observe the time evolution of reliability. It is still possible to compare the information from a device 10 with that from other devices. A networking of the information thus obtained makes it possible to carry out statistical processing, in order to determine, for example, an average and trends.
Selon un mode de réalisation préféré l’information enregistrée peut encore être comparée à celle obtenue pour une unité de traitement de référence MCR ou pour une unité de traitement moyenne MCM afin de diagnostiquer une défaillance sporadique.According to a preferred embodiment, the recorded information can still be compared with that obtained for a reference MCR processing unit or for an average MCM processing unit in order to diagnose a sporadic failure.
Une unité de traitement de référence MCR est une unité dont il est sûr qu’elle est fonctionnelle. Il peut par exemple s’agir d’une unité neuve. Pour une telle unité de traitement de référence MCR, le comportement des anomalies peut être supposé minimum, soit typiquement uniquement réduit aux phénomènes causés par le « jitter » ou guigue. Ainsi en comparant le comportement, par exemple observé par le nombre d’anomalies, le nombre de dépassement du deuxième seuil MT ou toute autre métrique issu du compteur d’anomalie FC, il est possible de détecter une situation différente de la situation nominale. La cause de cette différence est nécessairement une défaillance sporadique. Elle n’est pas causée par le seul « jitter » ou guigue puisqu’une différence apparaît. Il ne s’agit par d’une défaillance soutenue puisqu’une telle défaillance soutenue aurait été détectée au moyen du premier seuil FT.An MCR reference processing unit is a unit that it is sure is functional. It can for example be a new unit. For such an MCR reference processing unit, the behavior of the anomalies can be assumed to be minimum, or typically only reduced to the phenomena caused by the “jitter” or guigue. Thus by comparing the behavior, for example observed by the number of anomalies, the number of exceedances of the second MV threshold or any other metric issuing from the FC anomaly counter, it is possible to detect a situation different from the nominal situation. The cause of this difference is necessarily sporadic failure. It is not caused by the only "jitter" or guigue since a difference appears. It is not a sustained failure since such a sustained failure would have been detected by means of the first FT threshold.
Il peut être difficile de déterminer une unité de traitement de référence MCR. En effet, il n’est pas certain qu’une unité prise au hasard soit totalement fonctionnelle. De plus, suite à une évolution du logiciel il peut être introduit une aggravation du phénomène de « jitter » ou guigue. Aussi, afin de s’affranchir de telles variations, il est avantageusement considéré une population de dispositifs selon l’invention. En analysant statistiquement les informations enregistrées par tous les dispositifs de cette population, il peut être déterminé une information enregistrée indicative d’une hypothétique unité de traitement moyenne MCM (ou alternativement une unité de traitement optimale, minimale, maximale, etc.). Une telle unité de traitement moyenne est avantageusement utilisée à l’instar d’une unité de traitement de référence MCR.It can be difficult to determine a reference MCR treatment unit. Indeed, it is not certain that a random unit is fully functional. In addition, following an evolution of the software, a worsening or jitter phenomenon may be introduced. Also, in order to overcome such variations, it is advantageously considered a population of devices according to the invention. By statistically analyzing the information recorded by all the devices of this population, it can be determined recorded information indicative of a hypothetical average MCM processing unit (or alternatively an optimal, minimum, maximum processing unit, etc.). Such an average processing unit is advantageously used like a reference processing unit MCR.
Les conséquences d’une défaillance sporadique sont différentes des conséquences d’une défaillance soutenue et généralement nettement moins critiques. Aussi un traitement différent peut avantageusement être envisagé. Si pour une défaillance soutenue des mesures conservatoires contraignantes sont typiquement prises en raison de l’urgence et de la criticité possible, pour une défaillance sporadique il peut être simplement conseillé, par exemple au moyen d’une indication au tableau de bord, de faire réaliser une analyse par un garage concessionnaire.The consequences of a sporadic failure are different from the consequences of a sustained failure and generally much less critical. Also a different treatment can advantageously be envisaged. If for a sustained failure binding conservative measures are typically taken due to urgency and possible criticality, for a sporadic failure it may be simply advisable, for example by means of an indication on the dashboard, to have an analysis by a dealer garage.
Une telle détection d’une défaillance sporadique est très avantageuse en ce qu’elle peut être réalisée au plus tôt dès l’apparition d’une variation du comportement d’anomalie. Aussi son traitement peut avantageusement prévenir une défaillance plus importante pouvant éventuellement suivre par aggravation de la cause de la défaillance.Such detection of a sporadic failure is very advantageous in that it can be carried out at the earliest upon the appearance of a variation in the abnormality behavior. Also its treatment can advantageously prevent a larger failure which may possibly follow by aggravation of the cause of the failure.
L’invention est décrite dans ce qui précède à titre d’exemple. Il est entendu que la personne de l’art est à même de réaliser différentes variantes de réalisation de 5 l’invention, en associant par exemple les différentes caractéristiques ci-dessus prises seules ou en combinaison, sans pour autant sortir du cadre de l’invention.The invention is described in the foregoing by way of example. It is understood that the person skilled in the art is able to carry out different variant embodiments of the invention, by combining for example the different characteristics above taken alone or in combination, without however departing from the scope of the invention.
Claims (8)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1855622A FR3082961A1 (en) | 2018-06-25 | 2018-06-25 | DEVICE FOR DIAGNOSING A FAILURE OF A PROCESSING UNIT BASED ON QUESTIONS / ANSWERS |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1855622 | 2018-06-25 | ||
FR1855622A FR3082961A1 (en) | 2018-06-25 | 2018-06-25 | DEVICE FOR DIAGNOSING A FAILURE OF A PROCESSING UNIT BASED ON QUESTIONS / ANSWERS |
Publications (1)
Publication Number | Publication Date |
---|---|
FR3082961A1 true FR3082961A1 (en) | 2019-12-27 |
Family
ID=63080158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1855622A Pending FR3082961A1 (en) | 2018-06-25 | 2018-06-25 | DEVICE FOR DIAGNOSING A FAILURE OF A PROCESSING UNIT BASED ON QUESTIONS / ANSWERS |
Country Status (1)
Country | Link |
---|---|
FR (1) | FR3082961A1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6061810A (en) * | 1994-09-09 | 2000-05-09 | Compaq Computer Corporation | Computer system with error handling before reset |
US20040078731A1 (en) * | 2000-10-06 | 2004-04-22 | Alwin Becher | Method for operating a processor-controlled system |
US20090217110A1 (en) * | 2008-02-25 | 2009-08-27 | International Business Machines Corporation | Method, system and computer program product involving error thresholds |
KR101826777B1 (en) * | 2016-09-12 | 2018-03-22 | 현대오트론 주식회사 | Apparatus and method for monitoring Microcontroller Unit |
-
2018
- 2018-06-25 FR FR1855622A patent/FR3082961A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6061810A (en) * | 1994-09-09 | 2000-05-09 | Compaq Computer Corporation | Computer system with error handling before reset |
US20040078731A1 (en) * | 2000-10-06 | 2004-04-22 | Alwin Becher | Method for operating a processor-controlled system |
US20090217110A1 (en) * | 2008-02-25 | 2009-08-27 | International Business Machines Corporation | Method, system and computer program product involving error thresholds |
KR101826777B1 (en) * | 2016-09-12 | 2018-03-22 | 현대오트론 주식회사 | Apparatus and method for monitoring Microcontroller Unit |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2914764A1 (en) | Avionic system's post-flight report failure determining method for aircraft, involves selecting post-flight report among constructed post-flight reports relative to plausibility criterions | |
FR2983335B1 (en) | METHOD AND DEVICE FOR CONTROLLING AN ACTIVE NOISE REDUCTION SYSTEM | |
FR2958911A1 (en) | METHOD AND SYSTEM FOR MONITORING THE OIL LEVEL CONTAINED IN A RESERVOIR OF AN AIRCRAFT ENGINE | |
FR2816078A1 (en) | Machine or system monitoring using cumulative and empirical distribution norms, uses data comparison with stochastic processing model to provide quantitative and qualitative data about the system | |
FR2996302A1 (en) | METHOD AND SYSTEM FOR MULTI-SENSOR MEASUREMENT | |
CA2751114A1 (en) | Redundant signal processing system, associated method, and aircraft equipped with such a system | |
WO2018115359A1 (en) | Unidirectional communication system and method | |
FR3082961A1 (en) | DEVICE FOR DIAGNOSING A FAILURE OF A PROCESSING UNIT BASED ON QUESTIONS / ANSWERS | |
FR3088909A1 (en) | Method and system for securing an aircraft against cyberattacks | |
EP2034409A1 (en) | Method of managing failures with memorisation of these failures for an automobile | |
WO2016055750A1 (en) | Method for dynamic adjustment of a level of verbosity of a component of a communications network | |
WO2010037955A1 (en) | Method for characterising entities at the origin of fluctuations in a network traffic | |
FR2888438A1 (en) | STATIC DETECTION OF ANOMALIES IN TRAFFIC RELATING TO A SERVICE ENTITY | |
EP2104277A1 (en) | Detection of breakdowns and isolation of a high-speed downstream CAN network | |
FR2878637A1 (en) | DELETING FALSE ALERTS AMONG ALERTS PRODUCED IN A MONITORED INFORMATION SYSTEM | |
FR2944117A1 (en) | METHODS AND DEVICES FOR MANAGING EVENTS RELATING TO THE SAFETY OF COMPUTER AIRCRAFT SYSTEMS | |
FR3069347B1 (en) | METHOD FOR MONITORING AN ONBOARD COMPONENT OF A MOTOR VEHICLE | |
WO2021099215A1 (en) | Method for managing sporadic anomalies of a power system of a motor vehicle | |
EP2773067B1 (en) | Method for improving the reliability of alert message generation on a synchronised data network | |
EP3672359A1 (en) | Electrical equipment that accesses, in an alternating operating mode, a mobile telephone network | |
FR3038659A1 (en) | FAULT MANAGEMENT METHOD FOR A VEHICLE ENGINE CONTROL SYSTEM | |
WO2023218138A1 (en) | Method for detecting an anomaly in a system of an aircraft | |
EP4020978B1 (en) | Method for calibrating an array of photodetectors, associated calibration device and imaging system | |
WO2024079408A1 (en) | Method for detecting an anomaly in an observed time series of values of a physical quantity representative of the performance of a system | |
FR3140958A1 (en) | Method for detecting an anomaly in an observed time series of values of a physical quantity representative of the performance of a system. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20191227 |
|
RX | Complete rejection |
Effective date: 20200326 |
|
TP | Transmission of property |
Owner name: CONTINENTAL AUTOMOTIVE FRANCE, FR Effective date: 20210309 Owner name: CONTINENTAL AUTOMOTIVE GMBH, DE Effective date: 20210309 |