JP6988727B2 - 保守タスク管理装置及び保守タスク管理方法 - Google Patents

保守タスク管理装置及び保守タスク管理方法 Download PDF

Info

Publication number
JP6988727B2
JP6988727B2 JP2018143319A JP2018143319A JP6988727B2 JP 6988727 B2 JP6988727 B2 JP 6988727B2 JP 2018143319 A JP2018143319 A JP 2018143319A JP 2018143319 A JP2018143319 A JP 2018143319A JP 6988727 B2 JP6988727 B2 JP 6988727B2
Authority
JP
Japan
Prior art keywords
failure
response
service
communication
immediate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018143319A
Other languages
English (en)
Other versions
JP2020022031A (ja
Inventor
篤 高田
恭子 山越
直幸 丹治
千尋 丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018143319A priority Critical patent/JP6988727B2/ja
Priority to US17/264,382 priority patent/US11388069B2/en
Priority to PCT/JP2019/027631 priority patent/WO2020026759A1/ja
Publication of JP2020022031A publication Critical patent/JP2020022031A/ja
Application granted granted Critical
Publication of JP6988727B2 publication Critical patent/JP6988727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • H04L41/5012Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF] determining service availability, e.g. which services are available at a certain point in time
    • H04L41/5016Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF] determining service availability, e.g. which services are available at a certain point in time based on statistics of service availability, e.g. in percentage or over a given time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5006Creating or negotiating SLA contracts, guarantees or penalties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5041Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
    • H04L41/5048Automatic or semi-automatic definitions, e.g. definition templates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Resources & Organizations (AREA)
  • Environmental & Geological Engineering (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ユーザ等の通信端末機に通信サービスを提供する通信装置における故障対応を判断する保守タスク管理装置及び保守タスク管理方法に関する。
通信キャリアは、通信装置(又は通信設備)によって広範囲に点在するユーザの通信端末機に各種の通信サービスを提供している。更に、通信キャリアは、サービス品質の向上を目的に通信装置を現用及び予備構成で冗長化した上で24時間365日の保守体制を構築している。通信装置の故障(装置故障という)時には、予備の通信装置によりサービスを継続しながら、即時の故障回復措置を行っている。
しかし、平日夜間帯及び土休日(以降、夜間帯という)に大規模な保守体制を維持するためには、平日昼間帯(以降、昼間帯という)よりも人件費等が掛かりOPEX(Operating Expense:運用コスト)が高額になる。但し、平日夜間帯は、通信キャリアの就業時刻(例えば9時から17時迄の昼間帯)以外の時間帯をいう。
このため、夜間帯に発生した装置故障に対する修理の対応を、翌昼間帯に実施可能か否かを適切に判断する指標が必要になる。装置故障の対応要否や優先度を判断する指標としては、ユーザとの間で取り決められるSLA(Service Level Agreement:サービスレベル合意)が考えられる。SLAは、実際にユーザと契約したサービス品質規定値に限らず、運用上のサービス品質の目標値を含む広義の規定であるとする。SLAが高いユーザにはハイグレードな保守サービスを行う等、SLAを基に保守の優先度を決定したり、即時に保守対応するか否かの決定を行ったりしている。
このようなSLAに基づく判断として、非特許文献1に記載のサービスレベル監視基盤がある。この技術は、SLAを監視し、通信装置のサービス品質の低下(故障)によるSLA違反を効率的に検知することを可能にしている。また、非特許文献2にユーザグレードに対応した設備監視システムが記載されている。この技術は、SLA対応警報振分機能が故障内容やSLAの指標に基づいた故障対応優先度の判定を可能としている。なお、この種の技術として更に特許文献1,2に記載の技術がある。
特開2017−175423号公報 特開2011−129055号公報
佐藤竜也 他1名,"クラウド事業向けサービスレベル監視基盤の提案と評価",電子情報通信学会,信学技術報,Vol.114,No.299,p87−92,November.2014. 風間雄大 他1名,"ユーザグレードに対応した設備監視システム構成方法の検討",電子情報通信学会,信学技術報,Vol.100,No.175,p25−30,July.2010.
しかし、上記非特許文献1,2の技術においては、夜間帯に発生した通信装置の故障や通信サービスの不具合(故障)に対して、夜間帯に対応が必要か否かを効果的に判断する指標が無い。即ち、夜間帯の上記故障に対して、SLAを尊守し、運用コストの抑制を図りながら、即時修理対応の要否を判断できないという問題がある。
本発明は、このような事情に鑑みてなされたものであり、夜間帯に発生した通信装置や通信サービスの故障に対して、SLAを尊守し、運用コストの抑制を図りながら、即時修理対応の要否を判断できる保守タスク管理装置及び保守タスク管理方法を提供することを課題とする。
上記課題を解決するための手段として、請求項1に係る発明は、予め定められた夜間帯に通信装置の故障である装置故障と、同夜間帯に通信装置によるユーザへの通信サービスの不具合であるサービス故障との双方又は当該装置故障のみの発生時に故障への対応を判断する保守タスク管理装置であって、前記通信装置が冗長化された冗長化装置の両系故障である二重故障を検知時に、当該二重故障による通信のサービス中断が、ユーザとのサービスレベル合意であるSLA違反か否かを判断する対応判断部と、前記SLA違反と判断された際に、即時故障修理を依頼する即時対応通知を作業員端末機へ送信する制御を行う対応制御部と、前記対応判断部が前記装置故障のみを検知時、又はSLA違反では無いとの判断時に、少なくとも当該装置故障に伴う罹障ユーザ数が予め定められたユーザ数を示す第1閾値を超えた際にユーザ影響大と判断するサービス影響確認部と、前記サービス影響確認部で、前記装置故障に伴う罹障ユーザ数が前記第1閾値以下でユーザ影響大では無いと判断された際に、前記装置故障の時刻から所定経過時間毎に前記二重故障となってサービス中断となるサービス中断確率を算出するリスク計算部と、前記装置故障した通信装置迄の移動時間を加味して、翌昼間帯の始業時から修理を開始し復旧する迄の時間である復旧見込時間を算出する復旧見込時間計算部と、前記算出された復旧見込時間と同時間の前記サービス中断確率が、予め定められた確率を示す第2閾値を超える場合に即時故障対応が必要と判断する故障影響判断部とを備え、前記対応制御部は、前記即時故障対応が必要と判断された際に、前記即時対応通知を前記作業員端末機へ送信する制御を行うことを特徴とする保守タスク管理装置である。
請求項に係る発明は、予め定められた夜間帯に通信装置の故障である装置故障と、同夜間帯に通信装置による通信端末機への通信サービスの不具合であるサービス故障との双方又は装置故障のみの発生時に故障の対応を行う保守タスク管理装置による保守タスク管理方法であって、前記保守タスク管理装置は、通信装置が冗長化された冗長化装置の両系故障である二重故障を検知時に、当該二重故障による通信のサービス中断が、ユーザとのサービスレベル合意であるSLA違反か否かを判断するステップと、前記SLA違反と判断された際に、即時対応通知を作業員端末機へ送信する制御を行うステップと、前記装置故障のみを検知時、又はSLA違反では無いとの判断時に、少なくとも当該装置故障に伴う罹障ユーザ数が予め定められたユーザ数を示す第1閾値を超えた際にユーザ影響大と判断するステップと、前記装置故障に伴う罹障ユーザ数が前記第1閾値以下でユーザ影響大では無いと判断された際に、前記装置故障の時刻から所定経過時間毎に前記二重故障となってサービス中断となるサービス中断確率を算出するステップと、前記装置故障した通信装置迄の移動時間を加味して、翌昼間帯の始業時から修理を開始し復旧する迄の時間である復旧見込時間を算出するステップと、前記算出された復旧見込時間と同時間の前記サービス中断確率が、予め定められた確率を示す第2閾値を超える場合に即時故障対応が必要と判断するステップと、前記即時故障対応が必要と判断された際に、前記即時対応通知を前記作業員端末機へ送信する制御を行うステップとを実行することを特徴とする保守タスク管理方法である。
請求項1の構成及び請求項の方法によれば、夜間帯の装置故障及びサービス故障の双方の二重故障の検知時に、SLA違反であれば、即時故障修理が必要と判断して作業員端末機へ即時対応通知を行うので、即時修理対応の要否を判断できる。このため、保守拠点ビルの夜間帯に突発故障対応に必要な作業員の数を削減して運用コストの抑制を次のように図ることができる。例えば、通信装置の近隣に住む作業員に、予め夜間帯の修理対応を保守拠点ビルでの駐在対応よりも安価に契約しておき、その作業員が所持するスマートフォン等の作業員端末機へ即時対応通知を行えば、夜間帯に突発故障対応に必要な数の作業員を保守拠点ビルに駐在させるよりも安価に故障対応を行うことができる。つまり、夜間帯に発生した通信装置や通信サービスの故障に対して、SLAを尊守し、運用コストの抑制を図りながら、即時修理対応の要否を判断できる。
また、装置故障のみの検知時、又はSLA違反では無いとの判断時に、装置故障に伴う罹障ユーザ数が第1閾値を超えればユーザ影響大と判断できる。
更に、夜間帯の次の昼間帯である翌昼間帯の始業時修理開始から復旧時刻までの復旧見込時間内に、サービス中断の確率が第2閾値よりも高ければ、即時故障対応を行うと判断できる。このため、即時故障対応の判断をより的確に行って、故障修理を翌昼間帯に移行できるので、夜間帯の運用コストを削減できる。
請求項に係る発明は、前記故障影響判断部で前記サービス中断確率が前記第2閾値以下と判断された際に、夜間帯の次の昼間帯である翌昼間帯での故障修理を依頼する昼間帯対応通知を、前記作業員端末機へ送信する制御を行う保守制御部を更に備えることを特徴とする請求項に記載の保守タスク管理装置である。
この構成によれば、夜間帯に装置故障が発生した際に、サービス中断確率が第2閾値以下で低いと判断された際に、翌昼間帯での故障修理対応を行うと判断できる。このため、夜間帯での故障修理対応が必要か否かの判断を、より的確に行うことができるので、夜間帯での運用コストを削減することができる。
請求項に係る発明は、前記即時対応通知又は前記昼間帯対応通知に応じた故障修理の作業と、前記通信装置に対して行われる当該故障修理以外の現作業とが同時間帯に重なる場合に、前記故障修理の作業の内容に応じて予め付けられた優先度と、前記現作業に予め付けられた優先度との高い方の作業から優先して行うことを判断する優先度判断部を更に備えることを特徴とする請求項に記載の保守タスク管理装置である。
この構成によれば、通信装置を保守する現作業中に、装置故障又はサービス故障の故障修理の作業が発生した際に、現作業、故障修理作業の何れを優先するかを適正に判断することができる。
本発明によれば、夜間帯に発生した通信装置や通信サービスの故障に対して、SLAを尊守し、運用コストの抑制を図りながら、即時修理対応の要否を判断できる保守タスク管理装置及び保守タスク管理方法を提供することができる。
本発明の実施形態に係る保守タスク管理装置を適用した通信システムの構成を示すブロック図である。 本実施形態の保守タスク管理装置による装置故障及びサービス故障の双方又は装置故障のみが生じた際の故障対応の動作を説明するためのシーケンス図である。 本実施形態の変形例の保守タスク管理装置を適用した通信システムの構成を示すブロック図である。 本実施形態の変形例の保守タスク管理装置による装置故障及びサービス故障の双方又は装置故障のみが生じた際の故障対応の動作を説明するためのシーケンス図である。
以下、本発明の実施形態を、図面を参照して説明する。但し、本明細書の全図において対応する構成部分には同一符号を付し、その説明を適宜省略する。
<実施形態の構成>
図1は、本発明の実施形態に係る保守タスク管理装置を適用した通信システムの構成を示すブロック図である。
図1に示す通信システム10は、保守タスク管理装置11と、設備収容管理装置40と、現地稼働登録装置41と、作業員端末機42と、オペレータ端末機43と、装置監視装置44と、サービス監視装置45と、通信装置46a,46bと、ユーザ等の通信端末機47a,47bとを備えて構成されている。この構成要素の内、通信端末機47a,47b以外の要素11,40〜46は、通信キャリアに属するものである。
保守タスク管理装置11は、夜間帯に発生した通信装置46a,46bの故障や、通信装置46a,46bが行う通信サービスの不具合(故障ともいう)に対して即時対応の要否を、SLAを尊守し、運用コストの抑制を図りながら判断するものである。この保守タスク管理装置11は、装置アラーム受信部21と、サービスアラーム受信部22と、対応判断部23と、復旧見込時間計算部25と、サービス影響確認部26と、故障影響判断部27と、リスク計算部28と、保守制御部30と、対応制御部31とを備えて構成されている。
通信装置46a,46bは、広範囲に点在しており、通信端末機47a,47b間のデータ通信、電話通信、イーサネット(登録商標)通信等の破線で示す通信サービスを行うものである。通信装置46a,46bは、サービス品質の向上等を目的に現用及び予備構成で冗長化されている。通信キャリアは、通信装置46a,46bや通信サービスの故障修理を含む保守作業を行う作業員を適正な保守が可能なように配置し、24時間365日の保守体制を確立している。
装置監視装置44は、通信装置46a,46bの運用状態を監視し、通信装置46a,46bに何らかの故障(装置故障ともいう)が生じた場合に、故障発生時刻を付けた装置アラームを保守タスク管理装置11へ通知する。ここで、通信装置46a,46bは上記のように冗長化されているが、この冗長化装置の両系故障を二重故障という。両系故障によりユーザへのサービス中断が発生し、サービス故障(サービスアラーム)に発展することとなる。
サービス監視装置45は、通信装置46a,46bによる通信サービスの運用状態を監視し、通信サービスに何らかの不具合(サービス故障ともいう)が生じた場合に、故障発生時刻を付けたサービスアラームを保守タスク管理装置11へ通知する。
保守タスク管理装置11の装置アラーム受信部21は、装置アラームを受信して対応判断部23へ出力する。サービスアラーム受信部22は、サービスアラームを受信して対応判断部23へ出力する。
対応判断部23は、装置アラーム又はサービスアラームの故障発生時刻が夜間帯である場合、装置アラーム及びサービスアラームの双方のアラームが発生した二重故障か否かを判断する。更に、対応判断部23は、二重故障発生時に生じるサービス中断時間が前述したSLAを違反(SLA違反)しているか否かを判断する。この結果、SLA違反の場合、対応判断部23は、即時に通信装置46a,46b及び通信サービスの双方の故障修理を行う即時対応通知を対応制御部31へ出力する。但し、SLAを違反していないことをSLA未達と称す。
即時対応通知を受けた対応制御部31は、オペレータ端末機43を介して作業員端末機42へ、上記双方の故障修理を依頼する。作業員端末機42は、作業員が所持する携帯電話機、スマートフォン及びダブレット等の通信端末機である。
設備収容管理装置40は、通信装置46a,46bの装置ID(IDentification)、通信装置46a,46bへの収容ユーザ数、110番や119番等の重要回線、通信装置46a,46bの過去の故障実績や平均故障間隔を示すMTBF(Mean Time Between Failures)値などの情報を記憶装置(図示せず)に記憶して管理している。
現地稼働登録装置41は、作業員ID、作業員の駐在位置、作業員が点在する通信装置46a,46bへの移動が所定時間内に可能な対応可能エリアや、作業員が修理等のために労働可能な時間である対応可能稼働時間等の現地作業員の情報を記憶装置(図示せず)に記憶して管理している。
保守タスク管理装置11のサービス影響確認部26は、対応判断部23で二重故障では無い又は、二重故障と判定後にSLA未達と判断された場合、後述のユーザ影響が大きい(ユーザ影響大ともいう)か否かを確認(判断)する。
上記二重故障で無い場合とは、装置故障のみで通信サービスは正常である場合をいう。
ユーザ影響大とは、装置故障に伴う障害トラブルに見舞われる罹障(りしょう)ユーザ数が、予め定められたユーザ数を示す第1閾値を超えて多かったり、110番や119番等への重要な回線による通信サービスに悪影響を及ぼしたりする等、ユーザに対する悪影響が大きいことである。
リスク計算部28は、サービス影響確認部26でユーザ影響大ではないと判断された場合、設備収容管理装置40に記憶された通信装置46a,46bの過去の故障実績やMTBF値を基に、装置故障時刻から所定経過時間毎に二重故障によりサービス中断となるリスクを計算(言い換えれば、サービス中断確率を計算)する。例えば、1時間毎にサービス中断となる確率(サービス中断確率)を算出する。但し、所定の経過時間毎とは、例えば30分毎の経過時間や、1時間や2時間等の異なる時間間隔の経過時間のことである。
復旧見込時間計算部25は、上記ユーザ影響大ではないと判断後に、作業員が駐在する保守拠点ビルから通信装置46a,46bの収容ビル迄の移動時間を加味し、翌昼間帯の始業時から修理を開始して復旧する迄の時間である復旧見込時間を算出する。
故障影響判断部27は、復旧見込時間計算部25で算出された復旧見込時間と同時間でのサービス中断確率が、予め定められた確率を示す第2閾値を超える場合に即時故障対応が必要と判断し、即時対応通知を対応制御部31へ出力する。即時対応通知を受けた対応制御部31は、オペレータ端末機43を介して作業員端末機42へ、該当通信装置46a,46bの故障修理を依頼する。
一方、故障影響判断部27は、上記復旧見込時間と同時間でのサービス中断確率が第2閾値以下の場合に昼間帯対応が可能と判断し、翌昼間帯での故障対応を行うための昼間帯対応通知を保守制御部30へ出力する。昼間帯対応通知を受けた保守制御部30は、現地稼働登録装置41にその昼間帯対応通知の情報を登録する。現地稼働登録装置41は、登録された昼間帯対応通知の情報を作業員端末機42へ送信して、該当通信装置46a,46bの故障修理を翌昼間帯に行うように依頼する。
ここで、上記第2閾値の決め方について説明する。例えば、夜間帯の午前1時に装置故障が発生し、翌昼間帯である午前9時から故障修理を開始した際に、移動時間や修理時間を加味した復旧時刻が正午の12時であり、この際の復旧に要する復旧時間は3時間であるとする。この場合、装置故障時刻の午前1時から復旧時刻12時まで11時間経過している。この11時間の間で二重故障となる確率(サービス中断確率)は何%位であるかを、リスク計算部28が計算しておく。例えば1%であるとする。
また、上記復旧時間が3時間であるので、装置故障時刻の午前1時から夜間帯対応で3時間かけて4時に復旧する場合の3時間において、二重故障となる確率(サービス中断確率)は0.01%であるとする。
上記昼間帯対応で装置故障の午前1時から正午の12時に復旧するまでのサービス中断確率は1%であるので、リスクが低いとみることができる。
この場合に、第2閾値を例えば1.5%に設定したとすると、故障影響判断部27は、リスク計算部28で計算されたサービス中断確率が1.5%までは翌昼間帯対応で修理可能と判断する。この例の場合、上述した通り昼間帯対応では二重故障となる確率が1%で1.5%以下のため昼間帯対応と判断する。
一方、第2閾値を0.5%に設定したとすると、故障影響判断部27は、この例の場合、昼間帯対応で二重故障となる確率が1%で、0.5%を超えるため夜間帯対応と判断する。
<実施形態の動作>
本実施形態の保守タスク管理装置11による装置故障及びサービス故障の双方又は装置故障のみが生じた際の故障対応の動作を、図2のシーケンス図を参照して説明する。
但し、装置監視装置44が夜間帯において装置故障を検知して装置アラームを送信し、この装置アラームが保守タスク管理装置11の装置アラーム受信部21で受信されるものとする。また、サービス監視装置45が夜間帯においてサービス故障を検知してサービスアラームを送信し、サービスアラーム受信部22で受信されるものとする。これら受信された装置アラーム及びサービスアラームの双方又は装置故障のみが、対応判断部23へ出力されることを前提条件とする。
図2に示すステップS1において、対応判断部23が、夜間帯に発生した装置アラーム及びサービスアラームの双方又は装置アラームのみを検知したとする。
ステップS2において、対応判断部23が、装置アラーム及びサービスアラームの双方を受信した二重故障か否かを判断する。
この結果、二重故障の場合(Yes)、ステップS3において、対応判断部23は二重故障によるサービス中断がSLA違反か否かを判断する。
SLA違反の場合(Yes)、ステップS4において、夜間帯故障対応が次のように実行される。即ち、対応判断部23が即時対応通知を対応制御部31を介してオペレータ端末機43へ通知する。この通知を受けたオペレータ端末機43は、オペレータの操作によって、即時対応通知で指定された通信装置46a,46b及び通信サービスへの修理対応の通知を、作業員端末機42へ送信する。これを受けた作業員が夜間帯に即時故障対応を行う。
一方、上記ステップS2において、対応判断部23が二重故障で無いと判断(No)した場合、又は、ステップS3において、SLA未達と判断(No)した場合、ステップS5において、サービス影響確認部26がユーザ影響大か否かを判断する。
この結果、ユーザ影響大であれば(Yes)、ステップS4において、上述したように夜間帯故障対応が実行される。
一方、ステップS5において、サービス影響確認部26がユーザ影響大で無いと判断(No)した場合、ステップS6において、リスク計算部28が所定経過時間毎のサービス中断(二重故障)となるリスクを次のように算出する。即ち、リスク計算部28が、設備収容管理装置40に記憶された通信装置46a,46bの過去の故障実績やMTBF値を基に、装置故障時刻から所定経過時間毎にサービス中断となるリスク(サービス中断確率)を算出する。例えば、装置故障時刻から30分毎にサービス中断となるサービス中断確率を算出する。
次に、ステップS7において、復旧見込時間計算部25が、作業員が駐在する保守拠点ビルから通信装置46a,46bの収容ビル迄の移動時間を加味し、翌昼間帯の始業時から修理を開始して復旧する迄の時間である復旧見込時間を算出する。
ステップS8において、故障影響判断部27が、ステップS7で算出された復旧見込時間と同時間でのサービス中断確率が、閾値(第2閾値)を超えたと判断(Yes)した場合、ステップS4において、上述したように夜間帯故障対応が実行される。
一方、ステップS8において、故障影響判断部27が、サービス中断確率が閾値(第2閾値)を超えていないと判断(No)した場合、ステップS9において、翌昼間帯故障対応が次のように行われる。即ち、故障影響判断部27は、サービス中断確率が閾値以下の場合に昼間帯対応が可能と判断し、翌昼間帯での故障対応を行うための昼間帯対応通知を保守制御部30へ出力する。この昼間帯対応通知を受けた保守制御部30は、現地稼働登録装置41にその昼間帯対応通知の情報を登録する。現地稼働登録装置41は、登録された昼間帯対応通知の情報を作業員端末機42へ送信して、該当通信装置46a,46bの故障修理を翌昼間帯に行うように依頼する。
<実施形態の効果>
本実施形態に係る保守タスク管理装置11による保守タスク管理処理の効果について説明する。保守タスク管理装置11は、予め定められた夜間帯に通信装置46a,46bの故障である装置故障と、同夜間帯に通信装置46a,46bによるユーザへの通信サービスの不具合であるサービス故障との双方又は当該装置故障のみの発生時に故障への対応を判断する。本実施形態の特徴構成について説明する。
(1)通信装置が冗長化された冗長化装置の両系故障である二重故障を検知時に、当該二重故障による通信のサービス中断が、ユーザとのサービスレベル合意であるSLA違反か否かを判断する対応判断部23を備える。また、SLA違反と判断された際に、即時故障修理を依頼する即時対応通知を作業員端末機42へ送信する制御を行う対応制御部31を備える構成とした。
この構成によれば、夜間帯の装置故障及びサービス故障の双方の二重故障の検知時に、SLA違反であれば、即時故障修理が必要と判断して作業員端末機42へ即時対応通知を行うので、即時修理対応の要否を判断できる。このため、保守拠点ビルの夜間帯に突発故障対応に必要な作業員の数を削減して運用コストの抑制を次のように図ることができる。例えば、通信装置46a,46bの近隣に住む作業員に、予め夜間帯の修理対応を保守拠点ビルでの駐在対応よりも安価に契約しておき、その作業員が所持するスマートフォン等の作業員端末機42へ即時対応通知を行えば、安価に故障対応を行うことができる。つまり、夜間帯に突発故障対応に必要な数の作業員を保守拠点ビルに駐在させるよりも安価に故障対応を行うことができる。従って、夜間帯に発生した通信装置46a,46bや通信サービスの故障に対して、SLAを尊守し、運用コストの抑制を図りながら、即時修理対応の要否を判断できる。
(2)対応判断部23が装置故障のみを検知時、又はSLA未達(SLA違反でない)との判断時に、少なくとも当該装置故障に伴う罹障ユーザ数が予め定められたユーザ数を示す第1閾値を超えた際にユーザ影響大と判断するサービス影響確認部26を備える。この場合、対応制御部31は、ユーザ影響大と判断された際に、即時故障修理を依頼する即時対応通知を作業員端末機42へ送信する制御を行う構成とした。
この構成によれば、装置故障のみの検知時、又はSLA未達との判断時に、装置故障に伴う罹障ユーザ数が第1閾値を超えればユーザ影響大と判断し、その装置故障を即時修理する即時対応通知を作業員端末機42に行うことができる。このため、素早い故障修理を行うことができる。
(3)保守タスク管理装置11は、リスク計算部28と、復旧見込時間計算部25と、故障影響判断部27とを備える。
リスク計算部28は、サービス影響確認部26で、装置故障に伴う罹障ユーザ数が第1閾値以下でユーザ影響大では無いと判断された際に、装置故障の時刻から所定経過時間毎に二重故障となってサービス中断となるサービス中断確率を算出する。
復旧見込時間計算部25は、装置故障した通信装置46a,46b迄の移動時間を加味して、翌昼間帯の始業時から修理を開始し復旧する迄の時間である復旧見込時間を算出する。
故障影響判断部27は、上記算出された復旧見込時間と同時間のサービス中断確率が第2閾値を超える場合に、即時故障対応が必要と判断する。
これら構成要素を更に備えた際に、対応制御部31は、即時故障対応が必要と判断されると、即時対応通知を作業員端末機42へ送信する制御を行う構成とした。
この構成によれば、夜間帯の次の昼間帯である翌昼間帯の始業時修理開始から復旧時刻までの復旧見込時間内に、サービス中断の確率が第2閾値よりも高ければ、即時故障対応を行うと判断できる。このため、即時故障対応の判断をより的確に行って、故障修理を夜間帯又は翌昼間帯に移行できるので、夜間帯の運用コストを削減できる。
(4)故障影響判断部27でサービス中断確率が第2閾値以下と判断された際に、夜間帯の次の昼間帯である翌昼間帯での故障修理を依頼する昼間帯対応通知を、作業員端末機42へ送信する制御を行う保守制御部30を更に備える構成とした。
この構成によれば、夜間帯に装置故障が発生した際に、サービス中断確率が第2閾値以下で低いと判断された際に、翌昼間帯での故障修理対応を行うと判断できる。このため、夜間帯での故障修理対応が必要か否かの判断を、より的確に行うことができるので、夜間帯での運用コストを削減することができる。
<実施形態の変形例>
図3は、本発明の実施形態の変形例に係る保守タスク管理装置を適用した通信システムの構成を示すブロック図である。
図3に示す変形例の通信システム10Aの保守タスク管理装置11Aが、上述した保守タスク管理装置11(図1)と異なる点は、優先度判断部29を更に備えたことにある。優先度判断部29は、対応判断部23に接続されると共に、故障影響判断部27及びリスク計算部28と、保守制御部30及び対応制御部31との間に接続されている。
優先度判断部29は、即時対応通知又は昼間帯対応通知に応じた故障修理の作業と、通信装置46a,46bに対して行われる当該故障修理以外の現作業とが同時間帯に重なる場合に、故障修理の作業の内容に応じて予め付けられた優先度と、現作業に予め付けられた優先度との高い方の作業から優先して行うことを判断(優先度判断処理)する。但し、故障修理は、装置故障又はサービス故障の即時対応通知に応じた故障修理、或いは装置故障の即時対応通知又は昼間帯対応通知に応じた故障修理のことである。現作業は、通信装置46a,46bに対して現在行われている現作業又はこれから行われる現作業のことである。
<実施形態の変形例の動作>
優先度判断部29を備えた保守タスク管理装置11による装置故障及びサービス故障の双方又は装置故障のみが生じた際の故障対応の動作を、図4のシーケンス図を参照して説明する。但し、図4のシーケンス図において、図2のシーケンス図に対応するステップには同一符号を付し、その説明を省略する。
図4に示すステップS3において、対応判断部23で二重故障によるサービス中断がSLA違反と判断(Yes)された場合、ステップS10において、対応判断部23が即時対応通知を優先度判断部29へ出力する。優先度判断部29は、優先度判断処理によって、現作業と即時対応通知に係る故障修理との何れを優先して行うかを判断する。この結果、故障修理を優先すると判断(Yes)された場合、ステップS4の夜間帯故障対応が行われる。
上記ステップS10で現作業を優先すると判断(No)された場合、ステップS11において、現作業が完了するまで実行された後、ステップS4の夜間帯故障対応が行われる。
また、ステップS8において、故障影響判断部27で、ステップS7で算出された復旧見込時間と同時間でのサービス中断確率が閾値(第2閾値)を超えたと判断(Yes)された場合、ステップS10,S11,S4において、上記同様の処理が行われる。
一方、ステップS8において、故障影響判断部27で、サービス中断確率が閾値(第2閾値)以下と判断(No)された場合、ステップS12において、故障影響判断部27が昼間帯対応通知を優先度判断部29へ出力する。優先度判断部29は、優先度判断処理によって、現作業と昼間帯対応通知に係る故障修理との何れを優先して行うかを判断する。この結果、故障修理を優先すると判断(Yes)された場合、ステップS9の昼間帯故障対応が行われる。
また、ステップS12において、現作業を優先すると判断(No)された場合、ステップS13において、現作業が完了するまで実行された後、ステップS9の昼間帯故障対応が行われる。
<実施形態の変形例の効果>
上述した優先度判断部29を備える保守タスク管理装置11によれば、通信装置46a,46bを保守する現作業中に、装置故障又はサービス故障の故障修理の作業が発生した際に、現作業、故障修理作業の何れを優先するかを適正に判断することができる。また、翌昼間帯に故障修理作業の依頼があり、この際、翌昼間帯にその故障修理以外の作業が予定されている場合に、何れの作業を優先して行うかを適正に判断することができる。
その他、具体的な構成について、本発明の主旨を逸脱しない範囲で適宜変更が可能である。
10,10A 通信システム
11,11A 保守タスク管理装置
21 装置アラーム受信部
22 サービスアラーム受信部
23 対応判断部
25 復旧見込時間計算部
26 サービス影響確認部
27 故障影響判断部
28 リスク計算部
29 優先度判断部
30 保守制御部
31 対応制御部
40 設備収容管理装置
41 現地稼働登録装置
42 作業員端末機
43 オペレータ端末機
44 装置監視装置
45 サービス監視装置
46a,46b 通信装置
47a,47b 通信端末機

Claims (4)

  1. 予め定められた夜間帯に通信装置の故障である装置故障と、同夜間帯に通信装置によるユーザへの通信サービスの不具合であるサービス故障との双方又は当該装置故障のみの発生時に故障への対応を判断する保守タスク管理装置であって、
    前記通信装置が冗長化された冗長化装置の両系故障である二重故障を検知時に、当該二重故障による通信のサービス中断が、ユーザとのサービスレベル合意であるSLA違反か否かを判断する対応判断部と、
    前記SLA違反と判断された際に、即時故障修理を依頼する即時対応通知を作業員端末機へ送信する制御を行う対応制御部と
    前記対応判断部が前記装置故障のみを検知時、又はSLA違反では無いとの判断時に、少なくとも当該装置故障に伴う罹障ユーザ数が予め定められたユーザ数を示す第1閾値を超えた際にユーザ影響大と判断するサービス影響確認部と、
    前記サービス影響確認部で、前記装置故障に伴う罹障ユーザ数が前記第1閾値以下でユーザ影響大では無いと判断された際に、前記装置故障の時刻から所定経過時間毎に前記二重故障となってサービス中断となるサービス中断確率を算出するリスク計算部と、
    前記装置故障した通信装置迄の移動時間を加味して、翌昼間帯の始業時から修理を開始し復旧する迄の時間である復旧見込時間を算出する復旧見込時間計算部と、
    前記算出された復旧見込時間と同時間の前記サービス中断確率が、予め定められた確率を示す第2閾値を超える場合に即時故障対応が必要と判断する故障影響判断部と
    を備え、
    前記対応制御部は、前記即時故障対応が必要と判断された際に、前記即時対応通知を前記作業員端末機へ送信する制御を行う
    ことを特徴とする保守タスク管理装置。
  2. 前記故障影響判断部で前記サービス中断確率が前記第2閾値以下と判断された際に、夜間帯の次の昼間帯である翌昼間帯での故障修理を依頼する昼間帯対応通知を、前記作業員端末機へ送信する制御を行う保守制御部を更に備える
    ことを特徴とする請求項に記載の保守タスク管理装置。
  3. 前記即時対応通知又は前記昼間帯対応通知に応じた故障修理の作業と、前記通信装置に対して行われる当該故障修理以外の現作業とが同時間帯に重なる場合に、前記故障修理の作業の内容に応じて予め付けられた優先度と、前記現作業に予め付けられた優先度との高い方の作業から優先して行うことを判断する優先度判断部を更に備える
    ことを特徴とする請求項に記載の保守タスク管理装置。
  4. 予め定められた夜間帯に通信装置の故障である装置故障と、同夜間帯に通信装置による通信端末機への通信サービスの不具合であるサービス故障との双方又は装置故障のみの発生時に故障の対応を行う保守タスク管理装置による保守タスク管理方法であって、
    前記保守タスク管理装置は、
    通信装置が冗長化された冗長化装置の両系故障である二重故障を検知時に、当該二重故障による通信のサービス中断が、ユーザとのサービスレベル合意であるSLA違反か否かを判断するステップと、
    前記SLA違反と判断された際に、即時対応通知を作業員端末機へ送信する制御を行うステップと
    前記装置故障のみを検知時、又はSLA違反では無いとの判断時に、少なくとも当該装置故障に伴う罹障ユーザ数が予め定められたユーザ数を示す第1閾値を超えた際にユーザ影響大と判断するステップと、
    前記装置故障に伴う罹障ユーザ数が前記第1閾値以下でユーザ影響大では無いと判断された際に、前記装置故障の時刻から所定経過時間毎に前記二重故障となってサービス中断となるサービス中断確率を算出するステップと、
    前記装置故障した通信装置迄の移動時間を加味して、翌昼間帯の始業時から修理を開始し復旧する迄の時間である復旧見込時間を算出するステップと、
    前記算出された復旧見込時間と同時間の前記サービス中断確率が、予め定められた確率を示す第2閾値を超える場合に即時故障対応が必要と判断するステップと、
    前記即時故障対応が必要と判断された際に、前記即時対応通知を前記作業員端末機へ送信する制御を行うステップと
    を実行することを特徴とする保守タスク管理方法。
JP2018143319A 2018-07-31 2018-07-31 保守タスク管理装置及び保守タスク管理方法 Active JP6988727B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018143319A JP6988727B2 (ja) 2018-07-31 2018-07-31 保守タスク管理装置及び保守タスク管理方法
US17/264,382 US11388069B2 (en) 2018-07-31 2019-07-12 Maintenance task management device and maintenance task management method
PCT/JP2019/027631 WO2020026759A1 (ja) 2018-07-31 2019-07-12 保守タスク管理装置及び保守タスク管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018143319A JP6988727B2 (ja) 2018-07-31 2018-07-31 保守タスク管理装置及び保守タスク管理方法

Publications (2)

Publication Number Publication Date
JP2020022031A JP2020022031A (ja) 2020-02-06
JP6988727B2 true JP6988727B2 (ja) 2022-01-05

Family

ID=69230640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018143319A Active JP6988727B2 (ja) 2018-07-31 2018-07-31 保守タスク管理装置及び保守タスク管理方法

Country Status (3)

Country Link
US (1) US11388069B2 (ja)
JP (1) JP6988727B2 (ja)
WO (1) WO2020026759A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7524964B2 (ja) 2020-11-02 2024-07-30 日本電信電話株式会社 ネットワーク管理装置、方法およびプログラム
CN114112446B (zh) * 2021-09-27 2024-06-28 北京市地铁运营有限公司 一种轨道交通车辆走行部健康状态监测维护系统和方法
CN114091918A (zh) * 2021-11-23 2022-02-25 南京尚网网络科技有限公司 调度方法和设备
CN116527549B (zh) * 2023-07-03 2023-09-12 深圳市乗名科技有限公司 一种通信交换设备专业修理控制方法、系统和存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7730172B1 (en) * 1999-05-24 2010-06-01 Computer Associates Think, Inc. Method and apparatus for reactive and deliberative service level management (SLM)
US8538843B2 (en) * 2000-07-17 2013-09-17 Galactic Computing Corporation Bvi/Bc Method and system for operating an E-commerce service provider
US7930681B2 (en) * 2005-12-30 2011-04-19 Sap Ag Service and application management in information technology systems
US8238253B2 (en) * 2006-08-22 2012-08-07 Embarq Holdings Company, Llc System and method for monitoring interlayer devices and optimizing network performance
US7916657B2 (en) * 2008-01-22 2011-03-29 At&T Intellectual Property Ii, L.P. Network performance and reliability evaluation taking into account abstract components
US8793529B2 (en) * 2008-11-04 2014-07-29 Verizon Patent And Licensing Inc. Congestion control method for session based network traffic
JP2011028490A (ja) * 2009-07-24 2011-02-10 Nec Corp システム監視装置、システム監視方法、及びプログラム
JP2011129055A (ja) 2009-12-21 2011-06-30 Ricoh Co Ltd 管理装置、サービスマン手配方法、プログラム、及び記録媒体
JP2013030826A (ja) * 2011-07-26 2013-02-07 Ricoh Co Ltd ネットワーク監視システム、ネットワーク監視方法
US9300548B2 (en) * 2011-10-14 2016-03-29 Alcatel Lucent Providing dynamic reliability and security in communications environments
US9667470B2 (en) * 2012-09-07 2017-05-30 Oracle International Corporation Failure handling in the execution flow of provisioning operations in a cloud environment
US9565080B2 (en) * 2012-11-15 2017-02-07 Microsoft Technology Licensing, Llc Evaluating electronic network devices in view of cost and service level considerations
US20140358626A1 (en) * 2013-06-04 2014-12-04 Hewlett-Packard Development Company, L.P. Assessing the impact of an incident in a service level agreement
JP6463703B2 (ja) 2016-03-24 2019-02-06 日本電信電話株式会社 ネットワーク監視装置およびネットワーク監視方法
US10284589B2 (en) * 2016-10-31 2019-05-07 Acentium Inc. Methods and systems for ranking, filtering and patching detected vulnerabilities in a networked system
US10498608B2 (en) * 2017-06-16 2019-12-03 Cisco Technology, Inc. Topology explorer
US10574513B2 (en) * 2017-06-16 2020-02-25 Cisco Technology, Inc. Handling controller and node failure scenarios during data collection

Also Published As

Publication number Publication date
US11388069B2 (en) 2022-07-12
JP2020022031A (ja) 2020-02-06
WO2020026759A1 (ja) 2020-02-06
US20210281494A1 (en) 2021-09-09

Similar Documents

Publication Publication Date Title
JP6988727B2 (ja) 保守タスク管理装置及び保守タスク管理方法
JP4795457B2 (ja) 昇降機保守管理システム
WO2018207469A1 (ja) 異常検出システム
US9239988B2 (en) Network event management
JP5263305B2 (ja) アクセスノード監視制御装置、アクセスノード監視システム、方法およびプログラム
JP5121381B2 (ja) 保守・管理サービス支援システムにおける品質評価システム
US8325881B2 (en) Facility outage restoration simulator inquiry tool
JP6812312B2 (ja) プラント支援評価システム及びプラント支援評価方法
WO2016104025A1 (ja) 障害情報提供サーバ、障害情報提供方法
JP6530252B2 (ja) リソース管理システム、及びリソース管理方法
CN107622320A (zh) 用于预测和显示站点安全度量的系统和方法
WO2020090513A1 (ja) 監視保守方法、監視保守装置及び監視保守プログラム
US7120633B1 (en) Method and system for automated handling of alarms from a fault management system for a telecommunications network
JP5496160B2 (ja) 列車運行管理システム
JP2014199618A (ja) 故障監視システム
JP4364879B2 (ja) 障害通報システム、障害通報方法及び障害通報プログラム
JP2006277685A (ja) 障害発生通知プログラム、および通知装置。
JP2021033901A (ja) 部品手配方法
JP2008230744A (ja) エレベータの保守管理システム
JP2015131728A (ja) エレベーターの広域災害復旧支援システム
JP2021082192A (ja) 施設管制装置および施設管制方法
JP2009093522A (ja) 保守・管理サービス支援システム
JP5447887B2 (ja) エレベータ監視装置およびエレベータ監視方法
JP6794822B2 (ja) 生産管理システム
JP2009003707A (ja) 遠隔監視システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211115

R150 Certificate of patent or registration of utility model

Ref document number: 6988727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150