JP2010218492A - 障害診断システム、障害診断装置および障害診断方法 - Google Patents

障害診断システム、障害診断装置および障害診断方法 Download PDF

Info

Publication number
JP2010218492A
JP2010218492A JP2009067379A JP2009067379A JP2010218492A JP 2010218492 A JP2010218492 A JP 2010218492A JP 2009067379 A JP2009067379 A JP 2009067379A JP 2009067379 A JP2009067379 A JP 2009067379A JP 2010218492 A JP2010218492 A JP 2010218492A
Authority
JP
Japan
Prior art keywords
time
series data
signal
failure
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009067379A
Other languages
English (en)
Other versions
JP5504658B2 (ja
Inventor
Morikazu Sato
守一 佐藤
Takuro Kutsuna
拓郎 沓名
Naoya Nakajo
直也 中條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2009067379A priority Critical patent/JP5504658B2/ja
Publication of JP2010218492A publication Critical patent/JP2010218492A/ja
Application granted granted Critical
Publication of JP5504658B2 publication Critical patent/JP5504658B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

【課題】事前に想定していなかった原因による障害が発生した場合であっても障害発生条件を特定できる障害診断システム等を提供する。
【解決手段】障害診断装置5は、相違信号集合を算出する(S105)。障害診断装置5は、比較した結果、値が相違する信号値が空集合となる正常時の時系列データが少なくとも一つ存在した場合には、比較対象の異常時の時系列データは障害発生条件を含まないと判断し、後続の処理対象から外す。障害診断装置5は、最大充足可能性問題の形に定式化する(S106)。障害診断装置5は、障害発生条件を算出する(S107)。障害診断装置5は、S106にて定式化した最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出する。
【選択図】図4

Description

本発明は、複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断する障害診断システム、障害診断装置および障害診断方法に関するものである。
近年、複数のモジュールが協調動作するシステムにおいて、システムの大規模化に伴い、障害診断が難しくなってきている。協調動作システムの一例としては、車両に搭載される車載システムがある。車載システムでは、複数のECU(Electronic Control Unit)が、CAN(Controller Area Network)などのネットワークを介して互いにデータの送受信を行い、協調して動作を行っている。その為、あるECUが故障すると他のECUにも異常が伝搬してしまい、障害の診断をすることが難しい。
特許文献1には、機器設備の障害を診断する仕組みが記載されている。特許文献1では、発生する障害として、計測データの発生源である機器設備のハードウェア故障を想定している。ハードウェア故障が発生すると、機器設備の動作特性の変化に起因して一部の計測データに異常が生じる。そこで、事前に機器設備の正常動作時の計測データから正常挙動モデル(機器設備の計測データ間の関係モデル)を構築しておく。異常検知後、正常挙動モデルに基づいて、障害(ハードウェア故障)が発生しなかった場合に得られる計測データを推定する。そして、推定データと、異常検知時に得られた実測データを比較することで異常となった計測項目を特定する。
特開平11−212637号公報
しかしながら、特許文献1に記載の仕組みでは、潜在的なバグが原因で発生する障害のように、機器設備の動作特性が正常時と障害発生時とで変化しない障害を想定していない。一方、協調動作システムでは、大規模化に伴ってシステム全体が複雑化しており、潜在的なバグが原因で発生する障害など事前に想定していなかった原因による障害が増加している。
本発明は、前述した問題点に鑑みてなされたもので、その目的とすることは、事前に想定していなかった原因による障害が発生した場合であっても障害発生条件を特定できる障害診断システム等を提供することである。
前述した目的を達成するために第1の発明は、複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断する障害診断システムであって、診断対象のシステムにおける正常時と異常時のデータログを取得するデータログ取得手段と、前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた時系列データを生成する時系列データ生成手段と、異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、値が相違する信号値の集まりを相違信号集合として算出する相違信号集合算出手段と、全ての前記相違信号集合を充足することを制約条件とし、各信号の値が障害発生条件の構成要素であることを否定する論理式に同じ重みを設定することで最大充足可能性問題の形に定式化する定式化手段と、前記最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出する障害発生条件算出手段と、を具備することを特徴とする障害診断システムである。
第1の発明における前記相違信号集合算出手段は、比較した結果、値が相違する信号値が空集合となる正常時の時系列データが少なくとも一つ存在した場合には、比較対象の異常時の時系列データは障害発生条件を含まないと判断し、後続の処理対象から外す。
また、第1の発明における前記相違信号集合算出手段は、例えば、1時刻単位で異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、相違信号集合を算出する。また、第1の発明における前記相違信号集合算出手段は、例えば、複数時刻単位で異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、相違信号集合を算出する。
第2の発明は、複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断する障害診断装置であって、診断対象のシステムにおける正常時と異常時のデータログを入力するデータログ入力手段と、前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた時系列データを生成する時系列データ生成手段と、異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、値が相違する信号の集まりを相違信号集合として算出する相違信号集合算出手段と、全ての前記相違信号集合を充足することを制約条件とし、各信号の値が障害発生条件の構成要素であることを否定する論理式に同じ重みを設定することで最大充足可能性問題の形に定式化する定式化手段と、前記最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出する障害発生条件算出手段と、を具備することを特徴とする障害診断装置である。
第3の発明は、複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断する障害診断方法であって、診断対象のシステムにおける正常時のデータログを取得し、前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた正常時の時系列データを生成するステップと、診断対象のシステムにおける異常時のデータログを取得し、前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた異常時の時系列データを生成するステップと、異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、値が相違する信号の集まりを相違信号集合として算出するステップと、全ての前記相違信号集合を充足することを制約条件とし、各信号の値が障害発生条件の構成要素であることを否定する論理式に同じ重みを設定することで最大充足可能性問題の形に定式化するステップと、前記最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出するステップと、を含むことを特徴とする障害診断方法である。
本発明により、事前に想定していなかった原因による障害が発生した場合であっても障害発生条件を特定できる障害診断システム等を提供することができる。
障害診断システム1の概略構成を示す図 障害診断装置5を実現するコンピュータのハードウェア構成図 データログ取得装置7のハードウェア構成図 障害診断システム1の処理全体を示すフローチャート 正常時の時系列データの一例を示す図 異常時の時系列データの一例を示す図 抽出前の異常時の時系列データの一例を示す図 抽出後の異常時の時系列データの一例を示す図 第1の相違信号集合算出処理の詳細を示すフローチャート 相違信号集合の算出結果の一例を示す図 相違信号集合の算出結果の一例を示す図 最大充足可能性問題の制約条件となる論理式の一例を示す図 各信号の値が障害発生条件の構成要素であることを否定する論理式の一例を示す図 障害発生条件算出処理の詳細を示すフローチャート 第2の相違信号集合算出処理の詳細を示すフローチャート
以下図面に基づいて、本発明の実施形態を詳細に説明する。
図1は、障害診断システム1の概略構成を示す図である。障害診断システム1は、複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断するためのシステムである。診断対象のシステムとしては、複数のECUを搭載する車載システムなどがある。
図1に示すように、障害診断システム1は、障害診断装置5、データログ取得装置7、障害検知装置9等から構成される。診断対象の車載システム3は、データログ取得装置7、障害検知装置9、複数のECU11等がCAN(Controller Area Network)などの車載ネットワーク13や無線通信などを介して接続されている。データログ取得装置7は、車載システム3に搭載されている。一方、障害診断装置5と障害検知装置9は、例えばコンピュータであって、車載システム3に搭載される必要はない。
障害診断装置5は、正常時と異常時のデータログを入力として、車載システム3において発生した障害を診断する。データログは、車載ネットワーク13に流れる複数の信号の値である。障害診断装置5の出力は、障害発生条件である。障害発生条件は、信号の値または信号の値の組み合わせである。例えば、発生した障害に対して、車速を示す信号がAkm/h、操舵角を示す信号がB度であることが障害発生条件という具合である。
データログ取得装置7は、車載ネットワーク13に流れる複数の信号の値をデータログとして取得する。取得したデータログは、無線で遠隔にあるコンピュータに送信しても良いし、ケーブル等を介してコンピュータに送信しても良い。
障害検知装置9は、障害の発生を検知し、障害が発生したことをデータログ取得装置7に通知する。障害検知装置9は、例えば、車両に搭載されている各種のセンサから障害発生を示すダイアグ信号を受信すると、障害が発生したと判断する。また、車両の運転者が障害の発生を検知したときに、入力装置等によってその旨を入力するようにしても良い。
データログ取得装置7は、常にデータログを記録し、特定の期間は記録を残すようにしておく。そして、障害検知装置9から障害発生の通知を受けると、記録しているデータログの中から障害発生の通知を受けた前後のデータログは、異常時のデータログとして記録する。一方、正常時のデータログは、車両の実験走行時などに取得して記録する。正常時のデータログは、様々な走行環境で取得することが望ましい。
ECU11は、診断対象のシステムにおける各機能を実現する。
図2は、障害診断装置5を実現するコンピュータのハードウェア構成図である。尚、図2のハードウェア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
図2に示すように、障害診断装置5は、制御部21、記憶部22、メディア入出力部23、通信制御部24、入力部25、表示部26、周辺機器I/F部27等が、バス28を介して接続される。
制御部21は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。CPUは、記憶部22、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス28を介して接続された各装置を駆動制御し、障害診断装置5が行う後述する処理を実現する。
ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部22、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部21が各種処理を行う為に使用するワークエリアを備える。
記憶部22は、HDD(ハードディスクドライブ)であり、制御部21が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OS(オペレーティングシステム)に相当する制御プログラムや、後述する処理をコンピュータに実行させるためのアプリケーションプログラムが格納されている。
これらの各プログラムコードは、制御部21により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
メディア入出力部23(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)、MOドライブ等のメディア入出力装置を有する。
通信制御部24は、通信制御装置、通信ポート等を有し、コンピュータとネットワーク29間の通信を媒介する通信インタフェースであり、ネットワーク29を介して、他のコンピュータ間との通信制御を行う。
入力部25は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。
入力部25を介して、コンピュータに対して、操作指示、動作指示、データ入力等を行うことができる。
表示部26は、CRTモニタ、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携してコンピュータのビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
周辺機器I/F(インタフェース)部27は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部27を介してコンピュータは周辺機器とのデータの送受信を行う。周辺機器I/F部27は、USBやIEEE1394やRS−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。
バス28は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
図3は、データログ取得装置7のハードウェア構成図である。尚、図3のハードウェア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
図3に示すように、データログ取得装置7は、制御部31、記憶部32、周辺機器I/F部33、通信インタフェース34等で構成される。
制御部31は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。CPUは、記憶部32、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、モジュール5全体を駆動制御する。
ROMは、不揮発性メモリであり、処理に必要なプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部32、ROM等からロードしたプログラム、データ等を一時的に保持するとともに、制御部31が各種処理を行う為に使用するワークエリアを備える。
記憶部32は、制御部31が実行するプログラム、プログラム実行に必要なデータ等が格納される。これらの各プログラムコードは、制御部31により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
周辺機器I/F(インタフェース)部27は、データログ取得装置7に周辺機器を接続させるためのポートであり、周辺機器I/F部27を介してデータログ取得装置7は周辺機器とのデータの送受信を行う。周辺機器は、遠隔のコンピュータと無線で通信するための無線通信機器、コンピュータと有線で通信するための各種ケーブル等である。
通信インタフェース34は、データログ取得装置7と車載ネットワーク13間の通信を媒介する。
図4は、障害診断システム1の処理全体を示すフローチャートである。
図4に示すように、データログ取得装置7は、正常時のデータログを取得する(S101)。正常時のデータログは、障害診断装置5に送信されて記憶部22に記憶される。
次に、障害診断装置5は、正常時の時系列データを生成する(S102)。
図5は、正常時の時系列データの一例を示す図である。時系列データは、データログに含まれる各信号の値を入力としたとき、各ECU11の処理結果が変わらない範囲、例えば、プログラム中の条件分岐やジャンプ部で同じ動きをする範囲を同値とみなし、同値とみなす範囲に信号の値を分割して変換し、同一時刻ごとに纏めたデータである。例えば、車速を示す信号の場合、0km/hであれば0、0km/h〜5km/hであれば1、5km/h〜20km/hであれば2、・・・といった具合に変換する。
図5に示すように、例えば、No.が「X1」の正常時の時系列データは、信号1が「0」、信号2が「1」、信号3が「0」、信号4が「1」、信号5が「0」である。
図4の説明に戻ると、データログ取得装置7は、異常時のデータログを取得する(S103)。異常時のデータログは、障害検知装置9から通知を受けたときの前後のデータログであり、障害診断装置5に送信されて記憶部22に記憶される。
次に、障害診断装置5は、異常時の時系列データを生成する(S104)。
図6は、異常時の時系列データの一例を示す図である。図6に示すデータは、図5に示す正常時の時系列データと同じように、同値とみなす範囲に信号の値を分割して変換し、同一時刻ごとに纏めたデータである。図6に示すデータでは、データ容量を圧縮する為、信号の値の組み合わせが変化する時刻のみを抽出するようにしている。
図7は、抽出前の異常時の時系列データの一例を示す図である。図8は、抽出後の異常時の時系列データの一例を示す図である。
図7に示すように、取得時刻が「t2」のデータは、取得時刻が「t1」のデータと比較して変化がない。そこで、図8に示すように、取得時刻が「t2」のデータは抽出しない。次に、取得時刻が「t3」のデータは、取得時刻が「t2」のデータと比較して信号1、信号5の値が変化している。そこで、図8に示すように、取得時刻が「t3」のデータを抽出する。同様に、取得時刻が「t5」と「t6」のデータは、それぞれ一時刻前のデータと信号の値が変化していることから抽出対象となる。
尚、データ容量を圧縮するためのデータの抽出は、一定時間間隔ごとに抽出するようにしても良い。
図4の説明に戻ると、障害診断装置5は、相違信号集合を算出する(S105)。相違信号集合は、異常時の時系列データのそれぞれを全ての正常時の時系列データと比較した結果、値が相違する信号値の集まりである。障害診断装置5は、比較した結果、値が相違する信号値が空集合となる正常時の時系列データが少なくとも一つ存在した場合には、比較対象の異常時の時系列データは障害発生条件を含まないと判断し、後続の処理(S106以降の処理)対象から外す。
図9は、第1の相違信号集合算出処理の詳細を示すフローチャートである。図9では、1時刻単位で異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、相違信号集合を算出する。
図9に示すように、障害診断装置5の制御部21は、正常時の時系列データXiの番号を示す添え字i、異常時の時系列データYjの番号を示す添え字jにそれぞれ1を代入する(S201)。
次に、制御部21は、正常時の時系列データXiと異常時の時系列データYjの相違を算出する(S202)。
図10は、相違信号集合の算出結果の一例を示す図である。図10は、図6に示すNo.が「Y1」の異常時の時系列データと、図5に示す全ての正常時の時系列データとを比較した結果である。
No.が「Y1」の異常時の時系列データは、信号1が「1」、信号2が「3」、信号3が「1」、信号4が「0」、信号5が「1」である。No.が「X1」の正常時の時系列データは、信号1が「0」、信号2が「1」、信号3が「0」、信号4が「1」、信号5」が0である。これらを比較すると、全ての信号の値が相違することから、図10に示すように、No.が「D1」の相違信号集合は、{S1、S2、S3、S4、S5}となる。ここで、S1は障害発生時における信号1の値、この例ではY1の信号1の値を意味する。
図9の説明に戻ると、障害診断装置5の制御部21は、S202の結果、正常時の時系列データXiと異常時の時系列データYjの相違がある場合(S203のYes)、S204に進む。一方、制御部21は、S202の結果、正常時の時系列データXiと異常時の時系列データYjの相違がない場合(S203のNo)、S206に進む。
S204では、制御部21は、添え字iと、正常時の時系列データXiの最終番号mを比較し、添え字iがmより小さくない場合(S204のNo)、添え字iにi+1を代入し(S205)、S202から繰り返す。一方、制御部21は、添え字iと、正常時の時系列データXiの最終番号mを比較し、添え字iがmより小さい場合(S204のYes)、現在処理対象の異常時の時系列データYjに障害発生条件が含まれるとして、全ての相違信号集合を記憶部22またはRAMに保存し(S208)、処理を終了する。
S206では、制御部21は、添え字jと、異常時の時系列データYjの最終番号nを比較し、添え字jがnより小さくない場合(S206のNo)、添え字jにj+1を代入し(S207)、S202から繰り返す。一方、制御部21は、添え字jと、異常時の時系列データYjの最終番号nを比較し、添え字jがnより小さい場合(S206のYes)、処理を終了する。尚、このケースでは、障害発生条件を特定できないことになる。この場合、図15の説明にて後述するように、複数時刻単位で異常時の時系列データのそれぞれを全ての正常時の時系列データと比較していくことになる。
図10に示す例では、No.が「D6」の相違信号集合が{φ}(空集合)になっている。この場合、S203の判定結果がNoになることから、制御部21は、S206に進む。相違信号集合が空集合になることは、異常時の時系列データYj(j=1)が正常時の時系列データXi(i=6)と一致することを意味する。従って、j=1に対応する時刻には、障害が発生していないと推定できる。
図11は、相違信号集合の算出結果の一例を示す図である。図11は、図6に示すNo.が「Y2」の異常時の時系列データYj(j=2)と、図5に示す全ての正常時の時系列データとを比較した結果である。
図11に示す例では、相違信号集合が全て空集合ではない。この場合、S203の判定結果が常にYesとなり、添え字iについて最後の番号まで処理を行うと、S204の判定結果がYesとなり、制御部21は、S208に進む。このケースでは、異常時の時系列データYj(j=2)が正常時の時系列データXiとのいずれとも一致しないことを意味する。従って、j=2に対応する時刻には、障害が発生していると推定できる。
図4の説明に戻ると、障害診断装置5の制御部21は、最大充足可能性問題(MAXSAT)の形に定式化する(S106)。最大充足可能性問題とは、重み付きの節(clause)の集合が与えられたときに、充足する節の重みの和を最大にする割り当てを求める問題である。節とは、n個の変数x,・・・,xとその否定¬x,・・・, ¬xの中から、いくつかを論理和(∨)でつなげた論理式である。
制御部21は、全ての相違信号集合を充足することを制約条件とし、各信号の値が障害発生条件の構成要素であることを否定する論理式に同じ重みを設定することで最大充足可能性問題の形に定式化する。
図12は、最大充足可能性問題の制約条件となる論理式の一例を示す図である。図12は、図11の例における最大充足可能性問題の制約条件となる論理式を示している。
障害診断装置5の制御部21は、S105にて算出した相違信号集合から、最大充足可能性問題の制約条件となる論理式を導出する。例えば、制御部21は、図11に示すNo.が「D1」の相違信号集合{S2、S3、S4}から、図12に示すNo.が「L1」の論理式cd(S2)∨cd(S3)∨cd(S4)を導出する。ここで、例えば、cd(S2)は、信号2の値が障害発生条件の一つを構成するときに真となる。
制御部21は、図12に示す7つの論理式の全てを最大充足可能性問題の制約条件として定式化する。
図13は、各信号の値が障害発生条件の構成要素であることを否定する論理式の一例を示す図である。
図13に示すように、例えば、信号1が障害発生条件の構成信号であることを否定する論理式は、¬cd(S1)である。制御部21は、全ての信号の値について、障害発生条件の構成信号であることを否定する論理式を導出し、それぞれの論理式に同じ重みを設定することで、最大充足可能性問題として定式化する。
図11の例では、図12に示す論理式(No.が「L1」〜「L7」)を制約条件とし、図13に示す論理式(No.が「L11」〜「L17」)に同じ重みを設定した最大充足可能性問題が定式化される。
図4の説明に戻ると、障害診断装置5は、障害発生条件を算出する(S107)。障害診断装置5は、S106にて定式化した最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出する。
図14は、障害発生条件算出処理の詳細を示すフローチャートである。
図14に示すように、障害診断装置5の制御部21は、最大充足可能性問題の解を算出する(S301)。初回のS301の処理では、制御部21は、図4のS106にて定式化した最大充足可能性問題のミニマム解を算出する。ミニマム解とは、信号を1つでも削るとsatisfiableにならない解である。
次に、制御部21は、解が存在したかどうか確認する(S302)。
解が存在する場合、制御部21は、算出された解を否定する論理式を制約条件として追加し(S303)、S301に進む。2回目以降のS301の処理では、制御部21は、S303にて追加された制約条件を含めた最大充足可能性問題のミニマム解を算出する。
一方、解が存在しない場合、制御部21は、算出された全ての解の和集合を障害発生条件として保存する(S304)。正常時の時系列データが十分に多い場合、ミニマム解の和集合が真の障害発生条件に収束すると考えられる。
図12に示す論理式(No.が「L1」〜「L7」)を制約条件とし、図13に示す論理式(No.が「L11」〜「L17」)に同じ重みを設定した最大充足可能性問題を解くと、例えば、最初のミニマム解として、{S1、S2}が算出される(S301)。解が算出されたことから(S302のYes)、算出された解を否定する論理式を制約条件として追加する(S303)。算出された解に対応する論理式は、cd(S1)∧cd(S2)である。この論理式を否定する論理式は、¬cd(S1)∨¬cd(S2)である。
次に、¬cd(S1)∨¬cd(S2)の論理式を制約条件として追加し、最大充足可能性問題を解くと、次のミニマム解として、{S2、S5}が算出される(S301)。解が存在することから(S302のYes)、算出された解を否定する論理式を制約条件として追加する(S303)。算出された解に対応する論理式は、cd(S2)∧cd(S5)である。この論理式を否定する論理式は、¬cd(S2)∨¬cd(S5)である。
次に、¬cd(S2)∨¬cd(S5)の論理式を制約条件として追加し、最大充足可能性問題を解くと、解は存在しない(S301)。解が存在しないことから(S302のNo)、算出された全ての解の和集合を障害発生条件として保存する(S304)。この場合の障害発生条件は、{S1、S2、S5}となる。
ミニマム解の和集合を障害発生条件とする理由は、正常時の時系列データが多くなると、ミニマム解の和集合が真の障害発生条件に近づくと考えられるからである。例えば、図6において、Y2中の信号2が「3」、信号5が「0」が真の障害発生条件であった場合を考える。正常時データが、信号2が「3」、かつ信号5が「0」であるデータを含んでいない図5に示すX1〜X7だった場合は、前述のように、ミニマム解の和集合は、{S1f、S2f、S5f}となる。正常時の時系列データがさらに多い状態を考えると、相違信号が極力少ない正常時データが存在する状況が考えられる。最も相違信号が小さい正常時データとしては、Y2中の信号2以外のすべての信号が同じ値であるデータ、つまり信号1が「0」、信号3が「1」、信号4が「0」、信号5が「0」で信号2が「3」でないデータ、及び、Y2中の信号5以外の全ての信号が同じ値であるデータ、つまり信号1が「0」、信号2が「3」、信号3が「1」、信号4が「0」で信号5が「0」でないデータが考えられる。Y2の上記2つの正常時データに対する相違信号はそれぞれ{S2f}、{S5f}となり、前述の手順からミニマム解及びその和集合は{S2f、S5f}となり、障害発生条件と一致する。このように、正常時データが多くなると、ミニマム解の和集合が真の障害発生条件に近づくと考えられることから、ミニマム解の和集合を障害発生条件とする。
以上の通り、障害診断システム1は、図4に示す処理を行い、障害発生条件を算出する。図9に示す処理では、1時刻単位で相違信号集合を算出している。この場合、同時刻における複数の信号の値のパターンが障害発生条件となる。一方、後述する図15に示す処理では、2時刻単位で相違信号集合を算出する。このように複数時刻単位で相違信号を算出する場合、複数の信号の値の時系列的な変化のパターンが障害発生条件となる。
図15は、第2の相違信号集合算出処理の詳細を示すフローチャートである。図15では、2時刻単位で異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、相違信号集合を算出する。
図9のS208を実行せずに第1の相違信号集合算出処理を終了した場合、障害診断装置5は、図15に示す第2の相違信号集合算出処理を実行する。
図15に示すように、障害診断装置5の制御部21は、正常時の時系列データXiの番号を示す添え字i、異常時の時系列データYjの番号を示す添え字jにそれぞれ1を代入する(S401)。
次に、制御部21は、正常時の時系列データXi、X(i+1)と異常時の時系列データYj、Y(j+1)の相違を算出する(S402)。
次に、障害診断装置5の制御部21は、S402の結果、正常時の時系列データXi、X(i+1)と異常時の時系列データYj、Y(j+1)の相違がある場合(S403のYes)、S404に進む。一方、制御部21は、S402の結果、正常時の時系列データXi、X(i+1)と異常時の時系列データYj、Y(j+1)の相違がない場合(S403のNo)、S406に進む。
S404では、制御部21は、添え字iと、正常時の時系列データXiの最終番号から1を引いたm−1を比較し、添え字iがm−1より小さくない場合(S404のNo)、添え字iにi+1を代入し(S205)、S402から繰り返す。一方、制御部21は、添え字iと、正常時の時系列データXiの最終番号から1を引いたm−1を比較し、添え字iがm−1より小さい場合(S404のYes)、現在処理対象の異常時の時系列データYj、Y(j+1)の組み合わせに障害発生条件が含まれるとして、全ての相違信号集合を記憶部22またはRAMに保存し(S408)、処理を終了する。
S406では、制御部21は、添え字jと、異常時の時系列データYjの最終番号から1を引いたn−1を比較し、添え字jがn−1より小さくない場合(S406のNo)、添え字jにj+1を代入し(S207)、S202から繰り返す。一方、制御部21は、添え字jと、異常時の時系列データYjの最終番号から1を引いたn−1を比較し、添え字jがn−1より小さい場合(S206のYes)、処理を終了する。尚、このケースでは、障害発生条件を特定できないことになる。この場合、更に3時刻単位、4時刻単位、・・・というように、異常時の時系列データのそれぞれを全ての正常時の時系列データと比較していくことで、障害発生条件を特定することができる。
本発明では、システムに潜在的に存在するバグに起因する障害等、事前に想定していなかった原因による障害が発生した場合であっても障害発生条件を特定できる。本発明では、障害原因に関する事前知識は必要としないため、製品を市場に投入する段階では想定できない障害に対しても対応することができる。また、本発明では、障害発生条件を特定する過程で、障害を繰り返し再現することを必要としないため、再現が困難な障害に対しても対応することができる。
以上、添付図面を参照しながら、本発明に係る障害診断システム等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1………障害診断システム
3………車載システム
5………障害診断装置
7………データログ取得装置
9………障害検知装置
11………ECU
13………車載ネットワーク
21………制御部
22………記憶部
23………メディア入出力部
24………通信制御部
25………入力部
26………表示部
27………周辺機器I/F部
28………バス
29………ネットワーク
31………制御部
32………記憶部
33………周辺機器I/F部
34………通信インタフェース

Claims (6)

  1. 複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断する障害診断システムであって、
    診断対象のシステムにおける正常時と異常時のデータログを取得するデータログ取得手段と、
    前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた時系列データを生成する時系列データ生成手段と、
    異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、値が相違する信号値の集まりを相違信号集合として算出する相違信号集合算出手段と、
    全ての前記相違信号集合を充足することを制約条件とし、各信号の値が障害発生条件の構成要素であることを否定する論理式に同じ重みを設定することで最大充足可能性問題の形に定式化する定式化手段と、
    前記最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出する障害発生条件算出手段と、
    を具備することを特徴とする障害診断システム。
  2. 前記相違信号集合算出手段は、比較した結果、値が相違する信号値が空集合となる正常時の時系列データが少なくとも一つ存在した場合には、比較対象の異常時の時系列データは障害発生条件を含まないと判断し、後続の処理対象から外すことを特徴とする請求項1に記載の障害診断システム。
  3. 前記相違信号集合算出手段は、1時刻単位で異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、相違信号集合を算出することを特徴とする請求項1または請求項2に記載の障害診断システム。
  4. 前記相違信号集合算出手段は、複数時刻単位で異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、相違信号集合を算出することを特徴とする請求項1から請求項3のいずれかに記載の障害診断システム。
  5. 複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断する障害診断装置であって、
    診断対象のシステムにおける正常時と異常時のデータログを入力するデータログ入力手段と、
    前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた時系列データを生成する時系列データ生成手段と、
    異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、値が相違する信号の集まりを相違信号集合として算出する相違信号集合算出手段と、
    全ての前記相違信号集合を充足することを制約条件とし、各信号の値が障害発生条件の構成要素であることを否定する論理式に同じ重みを設定することで最大充足可能性問題の形に定式化する定式化手段と、
    前記最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出する障害発生条件算出手段と、
    を具備することを特徴とする障害診断装置。
  6. 複数の機能モジュールが互いに信号をやり取りすることにより動作するシステムにおいて発生した障害を診断する障害診断方法であって、
    診断対象のシステムにおける正常時のデータログを取得し、前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた正常時の時系列データを生成するステップと、
    診断対象のシステムにおける異常時のデータログを取得し、前記データログに含まれる複数の信号を加工して、加工後の信号の値を同一時刻ごとに纏めた異常時の時系列データを生成するステップと、
    異常時の時系列データのそれぞれを全ての正常時の時系列データと比較し、値が相違する信号の集まりを相違信号集合として算出するステップと、
    全ての前記相違信号集合を充足することを制約条件とし、各信号の値が障害発生条件の構成要素であることを否定する論理式に同じ重みを設定することで最大充足可能性問題の形に定式化するステップと、
    前記最大充足可能性問題の解を算出し、算出された解を否定する論理式を制約条件として逐次追加して再度解を算出する処理を、解が存在しなくなるまで繰り返すことで、障害発生条件となる信号の値または信号の値の組み合わせを算出するステップと、
    を含むことを特徴とする障害診断方法。
JP2009067379A 2009-03-19 2009-03-19 障害診断システム、障害診断装置および障害診断方法 Expired - Fee Related JP5504658B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009067379A JP5504658B2 (ja) 2009-03-19 2009-03-19 障害診断システム、障害診断装置および障害診断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009067379A JP5504658B2 (ja) 2009-03-19 2009-03-19 障害診断システム、障害診断装置および障害診断方法

Publications (2)

Publication Number Publication Date
JP2010218492A true JP2010218492A (ja) 2010-09-30
JP5504658B2 JP5504658B2 (ja) 2014-05-28

Family

ID=42977216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009067379A Expired - Fee Related JP5504658B2 (ja) 2009-03-19 2009-03-19 障害診断システム、障害診断装置および障害診断方法

Country Status (1)

Country Link
JP (1) JP5504658B2 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070515A (ja) * 2009-09-28 2011-04-07 Toyota Central R&D Labs Inc 障害診断システム、障害診断装置および障害診断方法
JP2011075523A (ja) * 2009-10-02 2011-04-14 Toyota Central R&D Labs Inc 正常空間構築支援装置、正常空間構築支援方法、プログラム、および異常監視システム
JP2012128572A (ja) * 2010-12-14 2012-07-05 Fujitsu Ltd データ生成装置、データ生成方法及びプログラム
JP2012194724A (ja) * 2011-03-16 2012-10-11 Toyota Central R&D Labs Inc 障害診断方法及び障害診断システム
JP2013120528A (ja) * 2011-12-08 2013-06-17 Toyota Central R&D Labs Inc 障害診断システム及び障害診断方法
JP2015103146A (ja) * 2013-11-27 2015-06-04 株式会社豊田中央研究所 障害診断支援システム、障害診断支援装置および障害診断支援方法
WO2017203660A1 (ja) * 2016-05-26 2017-11-30 株式会社日立製作所 データ処理装置、データ処理方法、及び自律システム
KR101872827B1 (ko) * 2016-07-28 2018-07-02 (주)클루닉스 입출력 기록을 문맥에 따라 범주화하는 컴퓨터의 장애 발생 추정 장치 및 그 방법
CN110187294A (zh) * 2019-04-17 2019-08-30 安徽建筑大学 面向分段线性恒流驱动led光源的故障诊断方法及装置
CN111897304A (zh) * 2019-05-06 2020-11-06 埃尔构人工智能有限责任公司 用于机器系统中实时诊断和故障监视的方法、设备和系统
CN114265358A (zh) * 2021-12-24 2022-04-01 卡斯柯信号有限公司 一种基于综合监控的屏蔽门报警方法
CN116500240A (zh) * 2023-06-21 2023-07-28 江西索立德环保服务有限公司 一种土壤环境质量监测方法、系统及可读存储介质
US12093038B2 (en) 2019-05-06 2024-09-17 Argo AI, LLC Method and system for real-time diagnostics and fault monitoring in a robotic system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1091237A (ja) * 1996-09-13 1998-04-10 Mitsubishi Electric Corp 異常信号検出装置および異常信号源検出装置
JPH11212637A (ja) * 1998-01-22 1999-08-06 Hitachi Ltd 予防保全方法及び装置
JP2000155156A (ja) * 1998-11-20 2000-06-06 Matsushita Electric Ind Co Ltd 半導体集積回路の故障診断装置
JP2010122133A (ja) * 2008-11-21 2010-06-03 Toyota Central R&D Labs Inc 故障箇所特定システム、故障箇所特定方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1091237A (ja) * 1996-09-13 1998-04-10 Mitsubishi Electric Corp 異常信号検出装置および異常信号源検出装置
JPH11212637A (ja) * 1998-01-22 1999-08-06 Hitachi Ltd 予防保全方法及び装置
JP2000155156A (ja) * 1998-11-20 2000-06-06 Matsushita Electric Ind Co Ltd 半導体集積回路の故障診断装置
JP2010122133A (ja) * 2008-11-21 2010-06-03 Toyota Central R&D Labs Inc 故障箇所特定システム、故障箇所特定方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
佐藤 守一, 沓名 拓郎, 中條 直也, 佐野 範佳: "車載電子制御システムの障害診断手法 −WPMax-SATを利用したCANデータ特異関係の抽出−", 電子情報通信学会研究報告, vol. 第101巻, 第474号, JPN6014006935, 11 March 2011 (2011-03-11), JP, pages 39 - 44, ISSN: 0002749704 *
城戸 高弘, 郷田 和正, 永松 正博: "最大充足可能性問題に対するラグランジュの方法を用いた近似解法", バイオメディカル・ファジィ・システム学会大会講演論文集:BMFSA, vol. 第13回, JPN6014006936, 28 October 2000 (2000-10-28), JP, pages 15 - 17, ISSN: 0002749705 *
田中 崇浩, 土屋 達弘, 菊野 亨: "充足可能性判定を用いたモデル検査ツールの実装", 電子情報通信学会技術研究報告, vol. 第102巻, 第28号, JPN6014006937, 12 April 2002 (2002-04-12), JP, pages 1 - 6, ISSN: 0002749706 *
須山 敬之, 横尾 真, 澤田 宏, 名古屋 彰: "再構成可能なハードウェアを用いた充足可能性問題の解法", 電子情報通信学会論文誌.D-I,情報・システム,I-情報処理, vol. 第J84-D-1巻, 第4号, JPN6014006938, 1 April 2001 (2001-04-01), JP, pages 410 - 420, ISSN: 0002749707 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070515A (ja) * 2009-09-28 2011-04-07 Toyota Central R&D Labs Inc 障害診断システム、障害診断装置および障害診断方法
JP2011075523A (ja) * 2009-10-02 2011-04-14 Toyota Central R&D Labs Inc 正常空間構築支援装置、正常空間構築支援方法、プログラム、および異常監視システム
JP2012128572A (ja) * 2010-12-14 2012-07-05 Fujitsu Ltd データ生成装置、データ生成方法及びプログラム
JP2012194724A (ja) * 2011-03-16 2012-10-11 Toyota Central R&D Labs Inc 障害診断方法及び障害診断システム
JP2013120528A (ja) * 2011-12-08 2013-06-17 Toyota Central R&D Labs Inc 障害診断システム及び障害診断方法
JP2015103146A (ja) * 2013-11-27 2015-06-04 株式会社豊田中央研究所 障害診断支援システム、障害診断支援装置および障害診断支援方法
WO2017203660A1 (ja) * 2016-05-26 2017-11-30 株式会社日立製作所 データ処理装置、データ処理方法、及び自律システム
KR101872827B1 (ko) * 2016-07-28 2018-07-02 (주)클루닉스 입출력 기록을 문맥에 따라 범주화하는 컴퓨터의 장애 발생 추정 장치 및 그 방법
CN110187294A (zh) * 2019-04-17 2019-08-30 安徽建筑大学 面向分段线性恒流驱动led光源的故障诊断方法及装置
CN111897304A (zh) * 2019-05-06 2020-11-06 埃尔构人工智能有限责任公司 用于机器系统中实时诊断和故障监视的方法、设备和系统
CN111897304B (zh) * 2019-05-06 2023-12-05 埃尔构人工智能有限责任公司 用于机器系统中实时诊断和故障监视的方法、设备和系统
US12093038B2 (en) 2019-05-06 2024-09-17 Argo AI, LLC Method and system for real-time diagnostics and fault monitoring in a robotic system
CN114265358A (zh) * 2021-12-24 2022-04-01 卡斯柯信号有限公司 一种基于综合监控的屏蔽门报警方法
CN114265358B (zh) * 2021-12-24 2024-04-26 卡斯柯信号有限公司 一种基于综合监控的屏蔽门报警方法
CN116500240A (zh) * 2023-06-21 2023-07-28 江西索立德环保服务有限公司 一种土壤环境质量监测方法、系统及可读存储介质
CN116500240B (zh) * 2023-06-21 2023-12-29 江西索立德环保服务有限公司 一种土壤环境质量监测方法、系统及可读存储介质

Also Published As

Publication number Publication date
JP5504658B2 (ja) 2014-05-28

Similar Documents

Publication Publication Date Title
JP5504658B2 (ja) 障害診断システム、障害診断装置および障害診断方法
JP2010181212A (ja) 故障診断システム、故障診断方法
JP7438205B2 (ja) モデルベース推論器のためのパラメトリックデータモデリング
JP6361175B2 (ja) 異常診断装置及びプログラム
JP5901140B2 (ja) システムの高い可用性のためにセンサデータを補間する方法、コンピュータプログラム、システム。
US9122273B2 (en) Failure cause diagnosis system and method
US10635094B2 (en) Failure models for embedded analytics and diagnostic/prognostic reasoning
US9569325B2 (en) Method and system for automated test and result comparison
US11115295B2 (en) Methods and systems for online monitoring using a variable data
EP3859145A1 (en) Systems and methods for model based wind turbine diagnostics
CN102928690B (zh) 用于电子器件的异常检测方法
JPWO2016195092A1 (ja) 異常検知装置
US20180054085A1 (en) Power generation systems with monitoring for anomaly detection via nonlinear relationship modeling
JP5544804B2 (ja) 障害診断システム、障害診断装置および障害診断方法
US8762792B2 (en) Event monitor having switch matrix, separate counter, and compare circuitry
CN108362957B (zh) 设备故障诊断方法、装置、储存介质和电子设备
JP2013077048A (ja) 自己診断機能を備えたコンピュータ、ソフトウェア作成方法、およびソフトウェア作成装置
CN112699648A (zh) 数据处理方法及装置
US20100162269A1 (en) Controllable interaction between multiple event monitoring subsystems for computing environments
JP5157844B2 (ja) 故障箇所特定システム、故障箇所特定方法
JP5326978B2 (ja) 正常空間構築支援装置、正常空間構築支援方法、プログラム、および異常監視システム
JP7353539B2 (ja) 定常範囲決定システム、定常範囲決定方法、および、定常範囲決定プログラム
JP2019095370A (ja) 疲労損傷診断方法、疲労損傷診断システム及び疲労損傷診断プログラム
JP2022124240A (ja) 診断パターン生成方法及び計算機
CN110134000B (zh) 控制系统、诊断装置、诊断方法、以及存储有诊断程序的计算机可读介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140303

R151 Written notification of patent or utility model registration

Ref document number: 5504658

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees