JP2023131955A - 分散システムおよび分散システムを構成する分散装置 - Google Patents

分散システムおよび分散システムを構成する分散装置 Download PDF

Info

Publication number
JP2023131955A
JP2023131955A JP2022036984A JP2022036984A JP2023131955A JP 2023131955 A JP2023131955 A JP 2023131955A JP 2022036984 A JP2022036984 A JP 2022036984A JP 2022036984 A JP2022036984 A JP 2022036984A JP 2023131955 A JP2023131955 A JP 2023131955A
Authority
JP
Japan
Prior art keywords
communication
distributed
error
distributed system
communication signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022036984A
Other languages
English (en)
Inventor
和史 山科
Kazufumi Yamashina
哲司 大澤
Tetsuji Osawa
雄一朗 志賀
Yuichiro Shiga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi High Tech Corp
Original Assignee
Hitachi High Tech Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi High Tech Corp filed Critical Hitachi High Tech Corp
Priority to JP2022036984A priority Critical patent/JP2023131955A/ja
Priority to PCT/JP2022/048697 priority patent/WO2023171104A1/ja
Publication of JP2023131955A publication Critical patent/JP2023131955A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Selective Calling Equipment (AREA)

Abstract

【課題】本発明では、複数の分散装置で構成される分散システムにおける不具合の発生要因を推定することを課題とする。【解決手段】通信路を介した通信が可能な複数の分散装置で構成される分散システムにおいて、前記分散装置のそれぞれは、他の分散装置からの通信信号を受け付ける通信ポートと、前記分散システムの特性を示す装置情報を記憶する記憶部と、前記通信信号により、通信エラーを検知し、当該通信エラーを示し、通信エラーの発生時刻、前記通信エラーの種別および前記通信エラーを検知した場所を含む通信エラー情報と前記装置情報を突き合せて前記通信エラーの発生要因を推定する検査部を有する分散システムである。【選択図】 図5

Description

本発明は、複数のユニット(分散装置)でシステム全体を構成する分散システムや分散システムにおける通信技術に関する。分散システムには、複数の通信装置で構成される通信システムやシステム全体といった制御対象を制御する分散制御システムが含まれる。また、分散制御システムは、半導体検査装置や医用向け検査分析装置をはじめとする産業装置に適用できる。
半導体検査装置や医用向け検査分析装置をはじめとする産業装置では、中央集中管理された複数の制御基板から、装置に搭載するセンサやアクチュエータに対しアナログの入出力経路を備える電子制御システムを使用するのが一般的である。この際、近年の装置へのニーズ多様化に対応する必要があるが現状のシステムでは、機能拡張に応じて配線量の増加、基板の再設計等が発生するため、電子システムの設計生産性の向上は急務である。
そこで、特許文献1に記載されているように、装置内の電子システムにネットワーク型の分散制御システムを適用することで、アナログ配線を削減しつつ機能拡張性の向上が期待できる。一方、近年の装置内システム構成の複雑化により、搭載機器同士が電気的異常を受ける確率が高くなっている。しかし、不具合の原因箇所や要因を推定できる手段が現状乏しい。
また、特許文献2は、ロボットに設けられた複数の制御対象と、前記複数の制御対象を分散制御する分散制御システムと、を有する制御システムであって、前記制御システムを構成する複数の機能部の異常の有無を管理する異常管理部と、前記複数の機能部のそれぞれを表示部に表示する表示制御部と、を備え、前記表示制御部は、前記複数の機能部のうち、異常が発生していない前記機能部を第1態様で前記表示部に表示し、異常が発生している前記機能部を前記表示部に前記第1態様とは異なる第2態様で表示する制御システムである。
特開2018-22939号公報 特開2021-120165号公報
しかしながら、特許文献1に記載の技術では、上述のように、不具合の要因箇所や要因の推定が困難である。また、特許文献2に記載の技術では、前記制御システム内で、異常事象とその要因の因果関係を事前に用意することが必要である。すなわち、想定しえない異常が発生した場合、その発生要因の特定ができず異常状態から正常状態への復帰に時間がかかる。そこで、本発明では、複数の分散装置で構成される分散システムにおける不具合の発生要因を推定することを課題とする。
以上のことから、本発明では、
複数の分散装置で構成され、分散装置間に通信路が設けられている分散システムを対象とする。そして、各分散装置において、前記通信の通信エラーを検知し、検知された通信エラーの内容を示す通信エラー情報と分散システムないしこれを構成する分散装置の特性を示す装置情報と突き合せて、前記通信エラーの発生要因を推定する。
より具体的には、通信路を介した通信が可能な複数の分散装置で構成される分散システムにおいて、前記分散装置のそれぞれは、他の分散装置からの通信信号を受け付ける通信ポートと、前記分散システムの特性を示す装置情報を記憶する記憶部と、前記通信信号により、通信エラーを検知し、当該通信エラーを示し、通信エラーの発生時刻、前記通信エラーの種別および前記通信エラーを検知した場所を含む通信エラー情報と前記装置情報を突き合せて前記通信エラーの発生要因を推定する検査部を有する分散システムである。
また、本発明には、分散システムを構成する分散装置も含まれる。さらに、分散システムを用いた、異常の発生要因推定方法も本発明の一態様も含まれる。
本発明によれば、分散システムにおける不具合の発生要因を推定することが可能となる。
本発明の一実施形態における分散制御システムの構成例を示した図 実施例1におけるシリアル通信部の詳細を示した図 実施例1において分散制御システム1で用いられるパケットを示した図 実施例1において分散制御システム1で用いられる通信信号(パケット)のデータ構成例を示した図 実施例1における通信エラーを検知する様子を示した図 実施例1における通信信号に発生する異常パターンとその検知手段の対応関係を示した図 実施例1における通信エラー情報から推定される推定内容と参照されるべき装置情報の対応関係を示した図 実施例1における異常発生要因を推定する手順を示したフローチャート 実施例2における分散制御システムが搭載した産業装置の例を示した図 実施例2における通信ポート毎の、通信エラー情報の集計結果の例を示した図 実施例2における通信エラーの発生間隔を可視化したグラフと各制御デバイスの動作履歴のグラフを示した図 実施例3における分散制御システムの推定された異常の発生要因を表示する通信エラー監視画面を示した図 各実施例の一応用例を示す図
以下、本発明の一実施形態について説明する。本実施形態では、分散システムの一例として、自身を含む制御対象への制御を行うため分散制御システムを例とする。図1は、本実施形態における分散制御システム1の構成例を示した図である。図1において、分散制御システム1は、通信親局10と、通信路11と、通信子局12と、を備える。ここで、通信親局10および通信子局12が、本発明の分散装置に該当する。そして、これら通信親局10および通信子局12のそれぞれが、シリアル通信部101および通信ポート102を有する。このうち、通信ポート102は、他の装置(通信親局10および通信子局12)と通信を行う。つまり、通信親局10および通信子局12のそれぞれは、通信信号を互いに送受信する。また、シリアル通信部101は、分散制御システム1における不具合として、通信エラーを検知し、その発生要因を推定するCRC演算部20を有する。
これら各構成の具体的な処理については、各実施例において説明する。また、CRC演算部20は、分散制御システム1の通信エラー等の不具合の検知およびその発生要因を推定する検査部の一種である。
また、通信親局10および通信子局12は、分散制御システム1の特性を示す装置情報を記憶する記憶部を有する。ここで、装置情報は、通信親局10や通信子局12ないし分散制御システム1が設けられる産業装置の特性を示す情報であってもよい。
また、本実施形態では、分散制御システム1全体を統括的に管理するための操作や設定を実行するために、中央演算装置13と接続されることが望ましい。
なお、本実施形態の不具合には、通信エラー、障害、故障、劣化、異常などの各種不具合が含まれる。また、不具合には、分散制御システム1、通信親局10、通信子局12ないし産業装置における不具合が含まれる。以上で、本実施形態の説明を終わり、以下、より具体的な内容を示す各実施例について説明する。
以下、実施例1について、図1を参照して説明する。図1において、分散制御システム1を構成する各装置は、上述のとおりである。また、通信親局10は、分散制御システム1における通信の全体を管理する親局通信制御部100と、通信信号を受信あるいは送信することでデータを伝送するシリアル通信部101と、通信機能の物理層となる通信ポート102と、を備える。また、親局通信制御部100はシリアル通信部101と接続され、シリアル通信部101は、通信ポート102と接続される。さらに、通信親局10は、分散制御システム1の操作や設定を実行するために、中央演算装置13と接続されてもよい。
また、通信子局12は、通信親局10への応答あるいは他の通信子局12への通信の中継を管理する子局通信制御部120と、通信親局10と同様に、シリアル通信部101と、通信ポート102と、を備える。
ここで、通信親局10は、通信ポート102と通信路11を介して、通信子局12と接続される。また、通信子局12は、通信ポート102と通信路11を介して他の通信子局12あるいは通信親局10と接続される。また、通信親局10と通信子局12はシリアル通信によって任意のデータを互いに伝送しあうものである。
また、分散制御システム1は生産、運送等の各種業務を実行する産業装置内に搭載可能である。そして、産業装置において、故障やノイズ発生が発生した場合、通信路11で伝送される通信信号にも異常が発生することが予想される。本発明に関して、分散制御システム1は、通信親局10あるいは通信子局12において、通信路11で通信信号に生じた異常を通信エラーとして検知する。また、分散制御システム1は、この通信エラーの情報に基づいて、その発生要因を推定するものである。以降、シリアル通信の動作、通信エラー検知について説明する。なお、産業装置に搭載される例の詳細については、実施例2で説明する。
図2は、本実施例におけるシリアル通信部101の詳細を示した図である。シリアル通信部101は、検査部の一種であるCRC演算部20、エンコード部21と、シリアライズ部22と、デコード部23と、デシリアライズ部24と、サンプリング部25と、を備える。なお、これらの詳細動作については、後述する。
図3は、本実施例における分散制御システム1で用いられるパケット3を示した図である。パケット3は、分散制御システム1で通信される通信信号の一形式であり、これらにはデータコードや制御コードといったコードデータが含まれることがある。本実施例のパケット3は、CRC部30と、データ部31と、時刻部32と、コマンド部33と、アドレス部34と、を備える。
CRC部30は、パケット3に備えるバイナリ配列の誤りがないかを確認するための値であり、一般的に巡回冗長検査と呼ばれ、任意の多項式に従い、パケット3を構成するバイナリ配列に基づいて算出される。データ部31は、通信親局10あるいは通信子局12が通信で伝送したい任意のデータを格納する。時刻部32は、パケット3が発行される際の時刻が格納される。コマンド部33は、システム設定やエラー情報などデータ部31の値の属性などが格納される。アドレス部34は、パケット3が伝送されるべき宛先が格納される。
次に、分散制御システム1の通信で発生する通信エラーを、通信信号に発生するノイズを例に説明する。図4は、本実施例における通信信号(パケット)のデータ構成例を示した図である。本実施例で対象とするシリアル通信において、任意のデータを表現するバイナリ配列を通信信号として伝送する際、別のバイナリ配列に変換することで、通信信号の信頼性や追加情報を付加する場合がある。例えば、8B10B符号化という技術では、8ビットのバイナリ配列を10ビットのバイナリ配列に変換する。これによって、通信信号の1と0の並びを分散させ、信号に含まれる直流成分をなるべく軽減することで、通信信号の品質を向上させる。こうした符号化技術において、変換後のバイナリ配列は事前に定義されているものであって、さらに変換後のバイナリ配列は、しばしば、通常の数値を表すデータコードと通信の制御に使用可能な特殊なバイナリ配列の制御コードに分類される。
本実施例における分散制御システム1のシリアル通信は、こうした符号化技術を応用するものである。改めて、図4に示すように、分散制御システム1の通信信号は、クロック40に同期して、シリアルデータ41のように定義済みのバイナリ配列が一定幅で伝送される。この際、制御コード42は通信の制御に使用する特殊なバイナリ配列、データコード43は、通常の数値を表すバイナリ配列であり、どちらも事前に定義される。そのため、パケット3が転送される際は、少なくとも1つのデータコードで構成される。
ここで、改めて図2を用いて、シリアル通信部101の基本的な動作を説明する。はじめに、シリアル通信部101の送信側の動作を説明する。親局通信制御部100あるいは子局通信制御部120は、伝送するパケット3をCRC演算部20に入力する。CRC演算部20は、パケット3に対してCRC値(巡回冗長検査値)を演算し、パケット3のCRC部30へ格納する。エンコード部21は、パケット3を定義済みのデータコード43に変換していく。この際、CRC演算部20は、エンコード部21が変換可能なデータ単位でパケット3を分割してエンコード部21に順次入力する。エンコード部21で変換されたデータコード43は、シリアライズ部22に入力され、1ビットごとに伝送される。またこの通信信号は、通信ポート102と通信路11を介して、通信親局10あるいは通信子局12に伝送される。この際、シリアライズ部22は、伝送すべきデータコード43がない場合、その代わりに制御コード42を伝送する。また、制御コード42は、事前に定義されたすくなくとも1種類の制御コードを順に転送するものとする。したがって、分散制御システム1が備える全ての通信路11では、制御コード42あるいはデータコード43が連続的に伝送され続けられる。ここで、連続的な伝送とは、所定周期に通信信号が伝送されること、散発的に伝送信号が伝送されること、隙間なく通信信号が伝送されること、ダミー信号が含まれる伝送信号が伝送されることが含まれる。なお、散発的な伝送には、伝送が一時的に停止されることも含まれる。
次に、シリアル通信部101の受信側の動作を説明する。通信路11を介し、通信ポート102にて受信した通信信号は、最初にサンプリング部25に入力される。サンプリング部25では、入力された通信信号を1ビットのデータごとに適切なタイミングでサンプリングする。また、サンプリングされた通信信号は、デシリアライズ部24にてデータコード43として復元され、デコード部23へ転送する。また、デシリアライズ部24では、制御コード42を受信した場合でもデコード部23へ転送する。このとき、デシリアライズ部24では、受信した通信信号の値が、1あるいは0で一定時間変化がない場合に通信途絶と判断する、切断検査を継続的に実施している。
デコード部23では、データコード43を受信したときには、通常のデータに復号しCRC演算部20へ転送する。なお、この転送は、データコード43を受信したときのみに実行してもよい。このとき、デコード部23では、受信した制御コード42あるいはデータコード43が定義済みの正しいバイナリ配列であるかを確認する、コード誤り検査を継続的に実施している。さらに、デコード部23では、制御コード42を受信し続けるとき、事前に定義した制御コード42の順番となっているかを確認する、制御コード受信検査を実施している。
また、CRC演算部20では、デコード部23より転送されたデータを順次、パケット3として変換し、また、再度パケット3のCRC値を計算する。この際、パケット3に格納されたCRC値と新たに算出されたCRC値が一致するかどうかを確認する、巡回冗長検査を実施する。また、CRC演算部20では、1つ目のデータコード43を受信して、一定時間内にパケット3の受信が完了するかどうかを確認するパケット時間切れ検査を実施する。
以上説明したように、シリアル通信部101の受信側動作では、コード誤り検査、制御コード受信検査、巡回冗長検査、パケット時間切れ検査、切断検査が継続的に動作し、各検査で異常が発生した場合に、これらの結果を通信エラーとして通信制御部に通知する。
ここで、分散制御システム1で、ノイズ50が発生した場合の通信動作について、図5を用いて説明する。図5は、本実施例における通信エラーを検知する様子を示した図である。図5では、2つの通信子局12を接続する通信路11において、ノイズ50による異常が発生した場合を示す。この場合、2つの通信ポート51に接続されたシリアル通信部101にて通信エラーが検知される。通信子局12では、シリアル通信部101で通信エラーを検知した場合、子局通信制御部120に通知する。子局通信制御部120では、通信エラーの通知を受信した時刻、通信エラーの種別、通信エラーを検知した通信ポート51の情報をパケット3に格納する。このときのパケット3は、通信ポート102により、通信エラー情報52として、シリアル通信によって通信親局10へ伝送される。
なお、通信親局10と通信子局12の間の通信路11でノイズが発生した場合も同様の動作となるが、通信親局10にて検知した通信エラーの情報は、通信親局10で、ログ蓄積されるか中央演算装置13へ直接転送されてもよい。いずれにせよ、全ての通信親局10と通信子局12において、検知した通信エラー情報毎に、その発生時刻、エラー種別、検知された通信ポート102が記録される。
これまで、分散制御システム1のシリアル通信の動作を含む基本的な機能を説明してきた。次に、分散制御システム1における異常要因推定の方法について説明する。図6は、通信路11で伝送される通信信号に発生す異常のパターンとその検知手段の対応関係を示した図である。図6において、異常として通信信号がデータ化けした場合を説明する。通信信号にノイズが混入すると、伝送中の制御コード42あるいはデータコード43のバイナリ配列に誤りが発生し、データ化けする可能性がある。また、データ化けの発生パターンは4種類考えられる。
制御コード42あるいはデータコード43が未定義のバイナリ配列となる場合、前述したようにコード誤り検査によってこれを検出できる。
データコード43を受信中、意図せず別のデータコード43となる場合、データコード43は実質的にパケット3を転送するときのみ伝送されるので、巡回冗長検査によってこれを検出できる。
ここで、データコード43はパケット3を転送する際のみに伝送され、さらに、データコード43は連続して受信されるはずなので、一定時間内にパケット3を構成するデータコード43の受信は完了する。そのため、制御コード42が意図せず別のデータコード43となる場合、パケット時間切れ検査によって、これを検出できる。
制御コード42が意図せず別の制御コード42となる場合、前述したように、制御コード受信検査によって、これを検出できる。
次に、分散制御システム1内の故障などによって、通信信号が途絶する場合を説明する。
通信信号が途絶した際、しばしば、通信信号の電圧変化が一定時間発生しなくなる。これはすなわち、シリアル通信部101にて受信する通信信号の1と0が変化しなくなることであり、切断検査によってこれを検知できる。これらをもって、通信路11に発生しうる、通信信号の異常パターンそれぞれを検知可能である。また、分散制御システム1では、通信エラー情報と分散制御システム1が搭載される産業装置の各種情報に基づいて、通信エラー要因(異常要因)の可能性が高い箇所を推定していく。
ここで、図7は、本実施例における通信エラーから推定される推定内容70と参照されるべき装置情報71の対応関係を示した図である。まず、通信エラーの情報では、通信エラーの種別、通信エラーの発生時刻、通信エラーを検知した通信ポート102の情報が含まれる。また、通信親局10あるいは通信子局12にて発行された通信エラーの情報を集約することで、各種通信エラーの発生回数を取得できる。以上のように、装置情報71は、分散システムの一例である分散制御システム1の特性を示す情報である。この装置情報71の一例として、分散制御システム1,例えば、産業装置の制御手順や産業装置内デバイスの位置や機能等の稼働情報が含まれる。なお、装置情報71は、各通信子局や通信親局10のシリアル通信部の記憶部(図示せず)に記憶されることが望ましい。
これにより、通信エラーによる判断要素が、通信ポートの情報700、発生回数の情報701(通信回数)、発生時刻の情報702、エラー種別の情報703の4種類あることになる。さらに、これらの判断要素を組み合わせることで、通信エラーから推定される推定内容70を決定する。
初めに、CRC演算部20により、通信ポートの情報700と発生回数の情報701を組合せることで、異常な通信路704が推定できる。これは、分散制御システム1が備える各通信ポート102の中で、図5に示したように、通信路11に異常が発生した場合、少なくとも、異常の発生した通信路11に接続されるどちらかの通信ポート102において、通信エラーが検知される。そのため、分散制御システム1において、ある一定時間において、通信エラーを最も検知した2組の通信ポート102に接続される通信路11が異常な通信路704として推定できるもの。
この際、通信エラーの発生要因は、異常な通信路704の近傍に設置された機器による可能性高い。したがって、CRC演算部20により、装置情報71に含まれる産業装置のデバイス配置の情報710を参照することで、異常が発生した通信路704の近傍に設置された機器を列挙することができる。
次に、CRC演算部20により、複数の発生時刻の情報702を使用することで、通信エラーが発生する発生間隔の情報705を取得することができる。この情報は、特に周期的に発生する異常に対し有効な情報である。この際、通信エラーの要因は、発生間隔の情報705と近似する駆動周波数を持つ機器の可能性が高い。したがって、CRC演算部20により、装置情報71に含まれる産業装置のデバイスの駆動周波数の情報711を参照することで、異常要因である可能性が高い機器を列挙できる。
さらに、通信エラーの発生時刻の情報702において、それと同時刻に動作していた産業装置内の機器が異常要因の可能性が高い。したがって、装置の動作計画と動作履歴の情報712を参照することで、通信エラーの発生時に動作していた機器を列挙できる。
ここで、分散制御システム1において、ノイズ電圧あるいはノイズ電流が、通信路11で伝送中の通信信号にどのような影響を及ぼすかは、予想しがたい。分散制御システム1では、CRC演算部20により、ある所定期間(比較的短い時間)においてノイズの影響を受けた際に発生するデータ化けに関して、前述したコード誤り検査、巡回冗長検査、パケット時間切れ検査、制御コード受信検査によって、検知できる。
一方、切断検査において、切断が検知されるのには、一定時間の通信信号の変位がないことが条件である。この際、恒常的に通信信号が途絶した場合以外に、比較的長時間において、ノイズの影響を受けたと判断することもできる。したがって、CRC演算部20により、通信エラーの種別の情報703と発生回数の情報701を組み合わせることによって、以下の条件を満たす場合、分散制御システム1における障害が深刻であると判断する。ここで、条件には、通信エラーの発生回数が比較的多ければ多いほど、さらに、その通信エラーの中で切断が検知される場合を示す。
ここで、通信エラー情報と装置情報71に基づき、異常発生要因を推定する手順を、図8を用いて説明する。図8は、本実施例における異常発生要因を推定する手順をしたフローチャートである。なお、ここからは、説明の便宜上、通信子局12には、産業装置の稼働に必要な制御デバイスが接続されているものとする。
装置制御、つまり、分散制御システム1において不具合が発生した場合、まずステップS80にて、CRC演算部20が、通信エラーの有無を確認する。この結果、通信エラーが発生していない場合(NO)、ステップS81に遷移する。また、通史ねらーが発生している場合(YES)、ステップS84に遷移する。
また、ステップS81にて、CRC演算部20が、制御値の更新の有無を確認する。この結果、各制御値(例えば、前記制御値)に関して、更新がない場合は分散制御システム1の通信確立ができておらず、制御デバイスに対して、通信を介した入出力ができていない。この場合、未更新であると判断され(YES)、ステップS83に遷移する。そして、ステップS83において、CRC演算部20が、通信親局10の故障あるいは装置電源の不良によるシステム未確立と判断する。
一方、ステップS81で一部の制御値の更新が正常にできている場合(NO)、ステップS82に遷移する。この際、異常発生に該当する制御値に関して、更新していない、制御値が逸脱している、制御値の更新頻度が異常等のパターンが考えられる。このため、ステップS82において、CRC演算部20が、制御値の入出力に該当する通信子局12あるいは通信子局12に接続される制御デバイスの故障が第一に考えられると判断する。
また、ステップS84において、CRC演算部20が、通信エラー種別のそれぞれの発生回数を集計する。そして、ステップS89において、CRC演算部20が、集計された発生回数に応じて、現段階での装置内障害の重大度を判断する。なお、具体的な重大度は分散制御システム1が導入される産業装置毎に定義されることが望ましい。
また、ステップS85では、CRC演算部20が、通信エラーの発生回数と通信エラーを検知した通信ポートの情報を集計し、これを用いることで、異常が発生している通信路11を推定する。また、ステップS810において、CRC演算部20が、ステップS85で推定した通信路11の近傍の制御デバイスを、異常が発生した制御デバイスの候補として特定する。ここで、近傍とは、推定された通信路11に接続する制御デバイスや最も近く配置される等所定位置の制御デバイスが含まれる。
次に、ステップS86において、CRC演算部20が、通信エラーの発生間隔を解析、つまり、発声間隔を特定する。また、ステップS811にて、CRC演算部20が、解析された通信エラーの発生間隔に近似する駆動周波数の制御デバイスを、異常が発生した制御デバイスの候補として特定する。ここで、近似とは、その差が閾値以下など所定関係を示すものである。
次に、ステップS87にて、CRC演算部20が、通信エラーが発生した時刻歴を特定する。そして、S812にて、CRC演算部20が、分散制御システム1もしくはこれが搭載された産業装置の動作履歴あるいは動作計画と比較する。この結果を用いて、CRC演算部20が、通信エラーが発生した時刻に動作していた制御デバイスを、異常が発生した制御デバイスの候補として特定する。
そして、ステップS88において、CRC演算部20が、異常の要因と考えられる制御デバイスと発生する障害の重大度を推定する。そして、CRC演算部20は、ステップS812までに、ステップS810、S811、S812で特定された候補から異常の発生要因である制御デバイスを抽出する。このために、例えば、CRC演算部20は、各ステップで用いられた特定のために用いられた条件が多い制御デバイスを順に、異常の発生要因である制御デバイスとして抽出する。ここで、抽出される制御デバイスは、所定数の上位の制御デバイスとしてもよいし、条件が所定数以上のデバイスとしてもよい。以上で、実施例1の説明を終わる。
次に、実施例2について説明する。本実施例では、分散制御システム1を産業装置に搭載した例である。図9は、本実施例における分散制御システム1が搭載産業装置に搭載した際の構成例を示した図である。図9において、産業装置90は、通信親局10と、通信路11と、通信子局12と、入出力基板93と、制御デバイス94と、を備える。入出力基板93は、通信を介して制御デバイス94に制御指令あるいはフィードバック値の入出力を実施し、制御デバイス94は、産業装置を構成するアクチュエータあるいはセンサのような制御対象である。
なお、通信子局91と通信子局92は、通信子局12と同様の機能を有するまた、制御デバイス95は、制御デバイス94と同様の機能を有する。さらに、通信路96は、通信路11と同様の機能を有する。
本実施例では、分散制御システム1が有する異常要因の推定に関して、制御デバイス95が異常要因である場合の推定例について説明する。なお、ここでは、通信エラーが発生し、図8に示した推定の手順が開始されるものとする。
本実施例でも、実施例1の図8の説明で説明したように、通信エラーとして、通信エラーの種別が検知される。ここで、図10は、本実施例における通信ポート毎の、通信エラー情報の集計結果の例を示した図である。ここで、通信エラー情報の集計結果として、通信エラーの発生回数の集計結果が用いられる。図10の集計結果1000では、通信親局10あるいは通信子局12ごとに備える通信ポート102が示され、さらに、通信ポート102毎に検知された通信エラーの発生回数を示している。この集計結果1000は、CRC演算部20により集計されることになる。
ここで、集計結果1000を用いることで、通信エラーが発生していることが分かる。つまり、集計結果1000の通信親局10の通信ポート102に該当する通信エラー回数1001と、通信子局91の通信ポート102に該当する通信エラー回数1002と通信子局92のポート1に該当する通信エラー回数1003が用いられる。この際、通信エラー回数1002と通信エラー回数1003が突出して、通信エラーの発生回数が多い。また、切断の通信エラーが発生していないことから、CRC演算部20は、通信子局91と通信子局92を接続する通信路96において、ノイズによる異常が発生していることが推定できる。
また、図11は、通信エラーの発生間隔を視覚化したグラフ1100と各制御デバイスの動作履歴のグラフ1102を示した図である。ここで、グラフ1100の縦軸は通信エラーの発生回数を示し、グラフ1100とグラフ1102の横軸は時間経過を示す。また、グラフ1100の例では、通信エラーの発生間隔1101の頻度で通信路96にノイズが混入していることが分かる。また、各時刻で動作していた制御デバイス94あるいは制御デバイス95が示されている。
これまでの手順によって、最終的に、CRC演算部20は、異常の発生要因を推定できる。その内容としては、例えば、以下に示される制御デバイス95(機器)が、装置内異常の要因である可能性が最も高いと推定される。
・集計結果1000によって判断した通信路96の近傍に配置された機器
・グラフ1100によって判断した通信エラーの発生間隔1101に近似する駆動周波数を持つ機器
・通信エラーの発生時刻と動作時期が一致する機器
以上の実施例2においては、制御システムを導入する産業装置において、装置内部にて未知の故障あるいはノイズによって装置内に異常が発生しても、その異常発生要因を推定可能である。以上で、実施例2の説明を終わる。
次に、実施例3では、推定された発生要因の出力について説明する。図12は、本実施例における分散制御システム1の推定された異常の発生要因を表示する通信エラー監視画面1200を示した図である。この通信エラー監視画面1200は、図1の中央演算装置13に接続される表示装置で表示されることが望ましい。また、後述する端末装置902に表示されてもよい。
また、図12において、通信エラー監視画面1200は、産業装置に導入されている分散制御システム1の構成を表示するネットワーク表示画面1201と、通信エラー情報を表示するエラー情報画面1202と、を備える。
エラー情報画面1202は、エラー履歴画面1203と、エラーメッセージ画面1204と、エラー要因リスト画面1205と、を備える。ここで、エラー履歴画面1203は、通信エラーの種別や発生時刻などを表示する。エラーメッセージ画面1204は、分散制御システム1において、通信エラーが発生した場合にエラーメッセージを表示する。エラー要因リスト画面1205は、分散制御システム1において、異常要因の候補としてその機器を表示する。ここで、通信エラー監視画面1200のように、実施例2まで説明してきた、分散制御システム1で発生した通信エラーの状況と、その推定された異常要因の箇所を視覚的に表示することで、産業装置の早期な正常復帰に貢献できる。以上で、実施例3の説明を終わる。
次に、各実施例の応用例を説明する。図13は、各実施例の応用例を示す図である。本応用例は、中央演算装置13により、複数の分散制御システム1を管理可能とする。このために、図13において中央演算装置13を有するサーバ装置130を設けた。そして、サーバ装置130は、ネットワーク901および端末装置902と接続する。端末装置902は、サーバ装置130に対して各種指示を入力したり、サーバ装置130の処理結果を出力したりする。この出力には、通信エラー監視画面1200が含まれる。また、サーバ装置130は、いわゆるコンピュータで実現でき、クラウドシステム、と称することができる。
また、サーバ装置130は、インターネットのようなネットワーク901を介して、複数の分散制御システム1と接続する。この結果、サーバ装置130は、各分散制御システム1からその異常の発生要因を受信することができる。なお、実施例1における異常発生要因の推定の少なくとも一部を、サーバ装置130で実行してもよい。さらに、実施例1の構成において、中央演算装置13が異常発生要因の推定の少なくとも一部を実行ししてもよい。
以上で本発明の実施形態および各実施例の説明を終わるが、本発明はこれらに限定されない。例えば、分散システムとして、通信システムなど分散制御システム1以外のシステムも含まれる。また、本発明には、以下の態様も含まれる。なお、以下の分散制御システムは、通信システムを含む分散システム、と読み替え可能である。
(1)少なくとも1つの通信親局と少なくとも1つの通信子局と、を備え、
前記通信親局と前記通信子局あるいは、前記通信子局と他の前記通信子局は、通信路で接続される分散制御システムであって、
前記通信親局あるいは前記通信子局は、前記データコードあるいは前記制御コードのいずれかを絶え間なく伝送し続けるのであって、
前記通信親局あるいは前記通信子局は、前記データコードあるいは前記制御コードを受信する度に誤り検知を実施し、誤り発生時に通信エラーを発行するのであって、
前記分散制御システムは、前記通信エラーに基づいて前記通信路に発生した信号異常の特徴を定義し、
さらに、前記通信エラーの発生時刻、前記通信エラーの種別、前記通信エラーを検知した場所と、を記録し、
前記分散制御システムは、前記分散制御システムが搭載される産業装置の制御手順や装置内デバイスの位置等の稼働情報と複数の前記通信エラー情報を突き合わせることで、通信エラー発生の電気的要因を推定する分散制御システム。
(2)(1)の分散制御システムにおいて、
前記データコードと前記制御コードはいずれも前記分散制御システムにおいて事前に定義したバイナリ配列であって、
前記通信親局あるいは前記通信子局は、前記データコードあるいは前記制御コードを受信した際に未定義の前記バイナリ配列の場合は、コード誤りの通信エラーを検知する分散制御システム。
(3)(1)の散制御システムにおいて、
前記分散制御システムは、少なくとも1つの前記データコードを組合せたパケットと、を備え、
前記通信親局と前記通信子局は、前記パケットを受信した際、冗長巡回検査を実施し、
前記冗長巡回検査が不正だった場合、冗長巡回検査誤りの通信エラーを検知する分散制御システム。
(4)(1)の分散制御システムにおいて、
前記分散制御システムは、少なくとも1つの前記データコードを組合せたパケットと、を備え、
前記通信親局と前記通信子局は、前記データコードを受信し、一定時間後に一定数の前記データコードを受信できない場合、
前記パケットの受信における時間切れの通信エラーを検知する分散制御システム。
(5)(1)の分散制御システムにおいて、
前記通信親局と前記通信子局は、前記制御コードを受信し続ける間、
事前に定義した前記制御コードの順番によって、前記制御コードを受信しない場合、
前記制御コード受信誤りの通信エラーを検知する分散制御システム。
(6)(1)の分散制御システムにおいて、
前記通信親局あるいは前記通信子局は、通信信号の値が一定時間変位しない場合、切断の通信エラーを検知する分散制御システム。
(7)(1)~(6)のいずれかの分散制御システムにおいて、
前記通信エラーの発行された前記通信ポートと前記通信エラーの発生回数に基づき、前記通信エラーの検出数が最も多い前記通信ポートに接続された前記通信路が、異常要因の近傍に位置する前記通信路と、判断する分散制御システム。
(8)(1)~(6)のいずれかの分散制御システムにおいて、
少なくとも1つの前記通信エラーが発生してから次に少なくとも1つの前記通信エラーが発生するまでの発生時刻に基づいて、前記通信エラーの発生間隔と、を判断する分散制御システム。
(9)(7)または(8)の分散制御システムにおいて、
前記産業装置は、
少なくとも1つのアクチュエータあるいは少なくとも1つのセンサと、を含む制御デバイスを備え、前記制御デバイスは前記通信子局と接続されてもよいのであって、
前記分散制御システムは、
前記通信エラーの発生要因を推定するのであって、
前記通信エラーが無い場合、前記産業装置の制御中に前記分散制御システムによって収集された少なくとも1つの制御値の更新の有無を確認し、
すべての前記制御値が更新されない場合、前記通信親局の故障と判断し、
少なくとも1つの前記制御値が更新されない場合、該当の前記制御デバイスあるいは前記通信子局の故障と判断する分散制御システム。
(10)(9)の分散制御システムにおいて、
少なくとも1つの前記通信エラーにおいて、前記通信エラーの種別の分布とその発生回数によって、前記産業装置内で発生した障害の重大度を判断する分散制御システム。
(11)(9)の分散制御システムにおいて、
前記通信エラーが発生した場合、前記分散制御システムが搭載される前記産業装置の装置情報と比較するのであって、
前記通信エラーが発生した前記通信路において、その近傍に配置された前記制御デバイスを順に前記通信エラーの発生要因の候補とし、
前記候補の順番に該当の前記制御デバイスを前記通信エラー発生要因として列挙する分散制御システム。
(12)(9)の分散制御システムにおいて、
前記通信エラーが発生した場合、前記分散制御システムが搭載される前記産業装置の装置情報と比較するのであって、
前記通信エラーの発生間隔と前記制御デバイスの駆動周波数を比較し、
前記発生間隔と前記駆動周波数が近似する制御デバイスを順に前記通信エラーの発生要因の候補とし、
前記候補の順番に該当の前記制御デバイスを前記通信エラー発生要因として列挙する分散制御システム。
(13)(9)の散制御システムにおいて、
前記通信エラーが発生した場合、前記分散制御システムが搭載される前記産業装置の装置情報と比較するのであって、
前記通信エラーの発生時刻と前記産業装置の制御計画あるいは動作履歴に基づいて、前記通信エラーの発生時刻中に動作していた前記制御デバイスを順に前記通信エラーの発生要因の候補とし、
前記候補の順番に該当の前記制御デバイスを前記通信エラー発生要因として列挙する分散制御システム。
(14)(10)~(13)のいずれかの分散制御システムにおいて、
前記通信エラーの発生要因の候補となった条件が多い順番に、該当の前記制御デバイスを前記通信エラー発生要因として列挙する分散制御システム。
(15)(1)の分散制御システムにおいて、
前記分散制御システムは、少なくとも1つの前記データコードを組合せたパケットと、を用い、
前記通信ポートは、シリアル通信部と、を備え、
前記シリアル通信部は、前記パケット転送がない場合は前記制御コードを伝送し続け、
前記パケットの伝送準備が完了し、かつ伝送中の制御コードの伝送が完了次第、前記パケットに含まれる前記データコートを順次、伝送するのであって、前記通信親局あるいは前記子局は、前記パケットの伝送が完了次第、前記制御コードの伝送を再開する分散制御システム。
(16)(1)の分散制御システムにおいて、
前記通信親局は中央演算装置と接続され、
前記通信親局あるいは前記通信子局は、通信制御部と、を備え、
前記通信制御部は前記シリアル通信部と接続されるのであって、
前記通信エラーは、前記シリアル通信部で検知されるのであって、
前記通信子局は、前記通信エラーを検知した時刻と前記通信エラーの情報を前記パケットに格納し、
前記通信路を介して、前記通信親局に転送するのであって、
前記通信親局は、前記通信エラーを検知した時刻と前記通信エラー情報を前記中央演算装置に通知するのであって、
前記通信親局は、前記通信子局から転送された前記通信エラーの情報とその発生時刻を前記中央演算装置に通知する分散制御システム。
(17)(14)の分散制御システムにおいて、
前記分散制御システムの構成と、前記通信エラーの情報と、前記通信エラー発生要因の候補と、を備える情報を視覚的に表示する出力装置と、を備えた分散制御システム。
(18)(1)~(17)のいずれかの分散制御システムを用いた、異常の発生要因推定方法。
1 分散制御システム
10 通信親局
100 親局通信制御部
101 シリアル通信部
102 通信ポート
11 通信路
12 通信子局
120 子局通信制御部
20 CRC演算部
21 エンコード部
22 シリアライズ部
23 デコード部
24 デシリアライズ部
25 サンプリング部
3 パケット
30 CRC部
31 データ部
32 時刻部
33 コマンド部
34 アドレス部
40 クロック
41 シリアルデータ
42 制御コード
43 データコード
50 ノイズ
51 通信ポート
52 通信エラー情報
90 産業装置
91 通信子局
92 通信子局
93 入出力基板
94 制御デバイス
95 制御デバイス
96 通信路
1000 集計結果
1100 グラフ
1101 通信エラーの発生間隔
1102 グラフ
1200 通信エラー監視画面
1201 ネットワーク表示画面
1202 エラー情報画面
1203 エラー履歴画面
1204 エラーメッセージ画面
1205 エラー要因リスト画面

Claims (20)

  1. 通信路を介した通信が可能な複数の分散装置で構成される分散システムにおいて、
    前記分散装置のそれぞれは、
    他の分散装置からの通信信号を受け付ける通信ポートと、
    前記分散システムの特性を示す装置情報を記憶する記憶部と、
    前記通信信号により、通信エラーを検知し、当該通信エラーを示し、通信エラーの発生時刻、前記通信エラーの種別および前記通信エラーを検知した場所を含む通信エラー情報と前記装置情報を突き合せて前記通信エラーの発生要因を推定する検査部を有する分散システム。
  2. 請求項1に記載の分散システムにおいて、
    前記他の分散装置の通信ポートが、連続的に前記通信信号を、前記分散装置に出力し、
    前記通信ポートが、連続的に前記通信信号を、前記他の分散装置に出力する分散システム。
  3. 請求項2に記載の分散システムにおいて、
    前記分散装置の検査部は、受け付けられた前記通信信号を受け付けると、誤り検知を実施し、当該誤り検知の結果に応じて前記通信エラーを検知する分散システム。
  4. 請求項3に記載の分散システムにおいて、
    前記分散装置の検査部は、受け付けられた前記通信信号が未定義のバイナリ配列の場合は、前記発生要因としてコード誤りを推定する分散システム。
  5. 請求項3に記載の分散システムにおいて、
    前記通信信号は、1以上のデータコードを含むパケットであり、
    前記分散装置の検査部は、前記パケットに対する冗長巡回検査を実施し、前記冗長巡回検査が不正だった場合、前記発生要因として冗長巡回検査誤りを推定する分散システム。
  6. 請求項3に記載の分散システムにおいて、
    前記通信信号は、データコードであり、
    前記分散装置の検査部は、一定時間内に一定数の前記データコードを受信できない場合、前記発生要因として前記通信信号の受け付けにおける時間切れを推定する分散システム。
  7. 請求項3に記載の分散システムにおいて、
    前記通信信号は、制御コードであり、
    前記通信ポートが、連続的に前記通信信号を出力している間に、前記分散装置の検査部が、事前に定義した前記制御コードの順番によって、前記制御コードを受信しない場合、前記発生要因として、前記制御コードの受信誤りを推定する分散システム。
  8. 請求項3に記載の分散システムにおいて、
    前記検査部が、前記通信信号の値が一定時間変位しない場合、前記発生要因として、前記通信の切断を推定する分散システム。
  9. 請求項3に記載の分散システムにおいて、
    前記分散装置の検査部が、前記通信エラーの検知数が最も多い前記通信ポートに接続された前記通信路を、前記通信エラーの発生に近傍の通信路として特定する分散システム。
  10. 請求項1乃至9のいずれかに記載の分散システムにおいて、
    当該分散システムはさらに制御デバイスを有する分散制御システムであり、前記通信信号は前記制御デバイスを制御するための制御値を含む制御コードであり、
    前記複数の分散装置は、前記通信における通信親局および複数の通信子局であり、
    前記検査部は、複数の前記制御値の更新の有無を確認し、前記複数の制御値が更新されない場合、前記通信親局の故障と判断し、前記複数の制御値のうち一部の制御値が更新されない場合、前記制御デバイスあるいは前記通信子局の故障と判断する分散システム。
  11. 請求項10に記載の分散システムおいて、
    前記分散制御システムはアクチュエータおよびセンサを含む産業装置に搭載される分散システム。
  12. 請求項11に記載の分散システムにおいて、
    前記検査部は、前記通信エラーの種別の分布とその発生回数によって、前記産業装置で発生した障害の重大度を判断する分散システム。
  13. 他の分散装置と通信路を介した通信が可能であり、分散システムを構成する分散装置において、
    前記他の分散装置からの通信信号を受け付ける通信ポートと、
    前記分散システムの特性を示す装置情報を記憶する記憶部と、
    前記通信信号により、通信エラーを検知し、当該通信エラーを示し、通信エラーの発生時刻、前記通信エラーの種別および前記通信エラーを検知した場所を含む通信エラー情報と前記装置情報を突き合せて前記通信エラーの発生要因を推定する検査部を有する分散装置。
  14. 請求項13に記載の分散装置において、
    前記他の分散装置の通信ポートが、連続的に前記通信信号を、前記分散装置に出力し、
    前記通信ポートが、連続的に前記通信信号を、前記他の分散装置に出力する分散装置。
  15. 請求項14に記載の分散装置において、
    前記検査部は、受け付けられた前記通信信号を受け付けると、誤り検知を実施し、当該誤り検知の結果に応じて前記通信エラーを検知する分散装置。
  16. 請求項15に記載の分散装置において、
    前記検査部は、受け付けられた前記通信信号が未定義のバイナリ配列の場合は、前記発生要因としてコード誤りを推定する分散装置。
  17. 請求項15に記載の分散装置において、
    前記通信信号は、1以上のデータコードを含むパケットであり、
    前記検査部は、前記パケットに対する冗長巡回検査を実施し、前記冗長巡回検査が不正だった場合、前記発生要因として冗長巡回検査誤りを推定する分散装置。
  18. 請求項15に記載の分散装置において、
    前記通信信号は、データコードであり、
    前記検査部は、一定時間内に一定数の前記データコードを受信できない場合、前記発生要因として前記通信信号の受け付けにおける時間切れを推定する分散装置。
  19. 請求項15に記載の分散装置において、
    前記通信信号は、制御コードであり、
    前記通信ポートが、連続的に前記通信信号を出力している間に、前記検査部が、事前に定義した前記制御コードの順番によって、前記制御コードを受信しない場合、前記発生要因として、前記制御コードの受信誤りを推定する分散装置。
  20. 請求項15に記載の分散装置において、
    前記検査部が、前記通信信号の値が一定時間変位しない場合、前記発生要因として、前記通信の切断を推定する分散装置。
JP2022036984A 2022-03-10 2022-03-10 分散システムおよび分散システムを構成する分散装置 Pending JP2023131955A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022036984A JP2023131955A (ja) 2022-03-10 2022-03-10 分散システムおよび分散システムを構成する分散装置
PCT/JP2022/048697 WO2023171104A1 (ja) 2022-03-10 2022-12-29 分散システムおよび分散システムを構成する分散装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022036984A JP2023131955A (ja) 2022-03-10 2022-03-10 分散システムおよび分散システムを構成する分散装置

Publications (1)

Publication Number Publication Date
JP2023131955A true JP2023131955A (ja) 2023-09-22

Family

ID=87936655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022036984A Pending JP2023131955A (ja) 2022-03-10 2022-03-10 分散システムおよび分散システムを構成する分散装置

Country Status (2)

Country Link
JP (1) JP2023131955A (ja)
WO (1) WO2023171104A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5071151B2 (ja) * 2008-02-27 2012-11-14 トヨタ自動車株式会社 通信システム、その異常推定方法、及び情報読出装置
JP6977522B2 (ja) * 2017-12-07 2021-12-08 オムロン株式会社 制御システム、情報処理装置、異常要因推定プログラム
JP7149863B2 (ja) * 2019-01-25 2022-10-07 三菱電機株式会社 異常監視装置及び異常監視方法

Also Published As

Publication number Publication date
WO2023171104A1 (ja) 2023-09-14

Similar Documents

Publication Publication Date Title
US20040196844A1 (en) Control system including controller and field devices
US11221612B2 (en) System and method of communicating data over high availability industrial control systems
CN107870584B (zh) 一种业务板输入电源工作状态检测方法及机框式设备
US20090292951A1 (en) Method and device for fault location in a system
US7751906B2 (en) Method and automation system for operation and/or observing at least one field device
KR100448709B1 (ko) 데이터 버스 시스템 및 그 제어방법
CN102687122A (zh) 自动化系统和自动化系统的操作方法
US8576699B2 (en) Method for operating a network having a ring topology
WO2021176972A1 (ja) ケーブル異常判定システム、スレーブ装置、及びケーブル異常判定方法
WO2023171104A1 (ja) 分散システムおよび分散システムを構成する分散装置
JP2013232886A (ja) 通信装置、通信装置を用いた配線状態検出方法及びコンピュータプログラム
KR101581309B1 (ko) 보드단위별 연동고장검출 및 배제 방식 항공전자장비
CN113850033B (zh) 一种余度系统、余度管理方法及可读存储介质
US20230400838A1 (en) Apparatuses and methods for non-disruptive replacement of simplex i/o components
JPWO2019087849A1 (ja) 通信システム、被制御機器、及び、通信システムの制御方法
JP2007293678A (ja) 共用バス接続診断装置
US20080144535A1 (en) Ring-type network and fairness execution program for ring-type network
JP7188895B2 (ja) 通信システム
JP2009187284A (ja) ボード間接続監視装置
CN112291128B (zh) 基于总线的通信系统、片上系统和用于其的方法
JP4473107B2 (ja) 通信障害検出装置
US11997009B2 (en) Method and apparatus for an alternate communication path for connected networks
JP6234388B2 (ja) 2重系制御装置
US7724642B2 (en) Method and apparatus for continuous operation of a point-of-sale system during a single point-of-failure
JP2003140707A (ja) プロセス制御装置