JP2019219983A - オペレーション装置、および、オペレーション方法 - Google Patents
オペレーション装置、および、オペレーション方法 Download PDFInfo
- Publication number
- JP2019219983A JP2019219983A JP2018117673A JP2018117673A JP2019219983A JP 2019219983 A JP2019219983 A JP 2019219983A JP 2018117673 A JP2018117673 A JP 2018117673A JP 2018117673 A JP2018117673 A JP 2018117673A JP 2019219983 A JP2019219983 A JP 2019219983A
- Authority
- JP
- Japan
- Prior art keywords
- message
- component
- action
- rule
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5041—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
- H04L41/5054—Automatic deployment of services triggered by the service manager, e.g. service implementation by automatic configuration of network components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/0816—Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0894—Policy-based network configuration management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
- H04L41/0853—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Stored Programmes (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
したがって、オペレーション自動化の開発コストを低減させることができる。
本実施形態では、サービス保守のオペレーションとして実行される運用プロセスを機能単位に分類し、運用プロセスを部品化する。機能ごとに分類された運用プロセスの部品を「運用部品」と呼ぶ。また、運用部品ごとに閉じたワークフロー(ワークフロー部品)を定義し、個別のルールに従って運用部品を動作させることで運用部品を自律化する。運用部品の各々は、所定のIF(インタフェース)を介して疎結合し、運用部品間のメッセージのやり取りを可能にする。本実施形態は、各運用部品が自律的に動作した結果としてワークフロー全体を成立させる自律制御ループ方式を提案する。この方式によれば、大規模かつ複雑なワークフローの全体そのものを定義する必要が無くなるため、オペレーション自動化の開発コストを低減させることができる。
まず、本実施形態のオペレーション装置の構成について説明する。図1に示すように、本実施形態のオペレーション装置1は、入出力部10と、処理部20と、記憶部30といったハードウェアを備えている。処理部20の具体例となるCPU(Central Processing Unit)が、記憶部30の具体例となるメモリ上に読み込んだプログラムを実行することにより、本実施形態に係るオペレーション装置1の機能を実現する。
発火ルール保存部32は、運用部品に適用されるルールを保存する。
アクション保存部33は、運用部品の動作内容を示すアクションを保存する。
共通データ保存部34は、各運用部品が利用可能なデータを共通データとして保存する。共通データは、例えば、アクション実行部23によるアクションの実行結果や、アクション実行に伴う運用部品の各々の状態を示す状態情報であるが、これらに限定されない。
次に、本実施形態のオペレーション装置1が実行する処理ついて、図2を参照して説明する。図2に示す処理は、各運用部品に対して用意されたルール、つまり、発火ルール保存部32に保存されているルールに従って開始するが、例えば、所定の時間経過後に開始したり、メッセージを受信した場合に開始したりする。
したがって、オペレーション自動化の開発コストを低減させることができる。
また、オペレーション自動化の対象となる運用プロセスを表現するワークフロー全体の設計は、従来手法で行われるが、本実施形態の運用部品を表現するワークフロー部品の設計も、従来手法と同様に行うことができる。このため、運用部品の作成方法そのものの説明は省略する。
次に、本実施形態の具体例として、保守対象のサービスが提供されるネットワークにおける障害復旧を実現するオペレーション自動化について説明する。
なお、説明の便宜上、各運用部品(p1〜p6)にあてはまる場合、各運用部品(p1〜p6)を「共通」(all-parts)と呼ぶ場合がある。
各運用部品(p1〜p6)がやり取りするメッセージは、キー(key)と、値(value)と、メタデータ(metadata)の組を複数種類有して構成されている。具体例で扱うkey、value、metadataの組の例を図4に示す。図4に示すように、keyには、src、dst、src_type、dst_type、id、relation_msg、msg_type、expect_state、current_state、response_codeといった種類が存在するが、これらに限定されない。また、図4中、各keyに紐付けられたvalue、metadataの内容は例示である。metadataについては、keyの種類によっては存在しない場合があり、図4ではブランクで示す。
dstは、メッセージの送信先を表しており、紐付けられたvalueには、送信先となる運用部品の識別子が格納される。
dst_typeは、メッセージの送信先の種別を表しており、紐付けられたvalueには、送信先となる運用部品の種別が格納される。
本具体例では、メッセージに含まれる、運用部品の種別は、collector、analyzer、editor、tester、maintainer、administratorである。
本具体例における発火ルール保存部32は、運用部品(p1〜p6)ごとに用意されたルールを保存している。本具体例における発火ルール保存部32が保存するルールの例を図5に示す。図5に示すように、各ルールは、当該ルールの識別番号を示す「項番」と、当該ルールで動作する運用部品の種別を示す「運用部品」と、当該ルールによる動作のトリガを示す「if」と、当該ルールよる運用部品の動作内容を示す「then」との関連付けで表現される。
本具体例におけるアクション保存部33は、運用部品(p1〜p6)ごとに用意されたアクション(機能)を保存している。本具体例におけるアクション保存部33が保存するアクションの例を図6に示す。図6に示すように、各アクションは、当該アクションの識別番号を示す「項番」と、当該アクションを実行する運用部品の種別を示す「運用部品」と、当該アクションの名称となる「機能」と、当該アクションの実行に必要な引数を示す「実行に必要な引数」との関連付けで表現される。
具体例の運用部品(p1〜p6)の動作例について、図7〜図9を参照して説明する。本動作例は、障害アラームが発生していない定常状態(図7)と、障害アラームが発生したときのアラーム発生時(図8、図9)とに分けることができる。
まず、定常状態の動作例について説明する。
定常状態では、アクション保存部33(図6)に保存されているアクションに基づいて、例えば、以下の手順x1〜x3が実行される。
手順x2:情報加工p3が、収集情報を定期的に加工(可視化)
手順x3:情報解析p2が、収集情報の解析(外れ値検知)
次に、アラーム発生時の動作例について説明する。
アラーム発生時では、アクション保存部33(図6)に保存されているアクションに基づいて、例えば、以下の手順1〜6が実行される。
手順2:試験p4が、アラームに対して試験を開始(準備)し、試験条件(試験実行の許可願い)を提示。
手順3:保守者UI(p6)が、保守者による試験実行の許可を返信。
手順4:試験p4が、死活監視の試験実行。死活監視の結果、死んでいるサービスを発見(pingは帰ってくる)
手順5:構成変更p5が、アプリケーション(アプリA(e5)(図3))の再起動を実行。
手順6:情報解析p2が、アラームの解除を通知。
本具体例では、試験p4が試験を実行する場合には、保守者の許可を必要とすることとして説明した(保守者UI(p6)がメッセージ[4]を送信)。しかし、試験p4は、保守者の許可なく試験を実行してもよい。例えば、試験と並行した情報取得ができること、試験に伴うサービスへの影響度が所定の閾値を下回るなどの試験条件を満たした場合、試験p4は、保守者の許可なく試験を実行することができるとしてもよい。
また、保守者UI(p6)を除く運用部品(p1〜p5)の各々が実行するプロセスについて、保守者UI(p6)を介した保守者の許可を求めるようにしてもよいし、求めないようにしてもよい。
本実施形態で説明したソフトウェアをハードウェアとして実現することもでき、ハードウェアをソフトウェアとして実現することもできる。
その他、ハードウェア、ソフトウェア、フローチャートなどについて、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
10 入出力部
11 メッセージ受信部
12 メッセージ送信部
20 処理部
21 受信メッセージ処理部
22 ルール実行部
23 アクション実行部
24 送信メッセージ処理部
30 記憶部
31 メッセージ保存部
32 発火ルール保存部
33 アクション保存部
34 共通データ保存部
Claims (6)
- ネットワーク上のサービスに関するオペレーションを実行するオペレーション装置であって、
前記オペレーションとして実行される運用プロセスを部品化した、複数種類の運用部品の間でやり取りされるメッセージを保存するメッセージ保存部と、
前記運用部品の各々に適用されるルールを保存する発火ルール保存部と、
前記運用部品の各々の動作内容を示すアクションを保存するアクション保存部と、
前記メッセージ保存部および前記発火ルール保存部を参照して、前記ルールとして実行可能な発火ルールが存在すれば、前記アクション保存部から当該発火ルールに該当するアクションを選択する処理を、前記運用部品ごとに実行するルール実行部と、
前記選択されたアクションを、前記運用部品ごとに実行するアクション実行部と、
前記実行したアクションの実行結果に基づいて、他の前記運用部品宛のメッセージを作成する処理を、前記運用部品ごとに実行する送信メッセージ処理部と、を備える、
ことを特徴とするオペレーション装置。 - 前記オペレーションは、前記サービスが提供されるネットワークにおける障害復旧を実現するオペレーションであり、
前記運用部品は、
前記サービスを提供するネットワーク構成から情報を収集する情報収集部品と、
前記収集した情報を解析する情報解析部品と、
前記収集した情報を加工する情報加工部品と、
前記ネットワークにおける障害確認用の試験を行う試験部品と、
前記ネットワーク構成を変更する構成変更部品と、を含む、
ことを特徴とする請求項1に記載のオペレーション装置。 - 前記運用部品の各々の動作を保守者が許可するメッセージを、前記運用部品の各々に送信する保守者UI(ユーザインタフェース)を、前記運用部品として含む、
ことを特徴とする請求項1または請求項2に記載のオペレーション装置。 - ネットワーク上のサービスに関するオペレーションを実行するオペレーション装置におけるオペレーション方法であって、
前記オペレーション装置は、
前記オペレーションとして実行される運用プロセスを部品化した、複数種類の運用部品の間でやり取りされるメッセージを保存するメッセージ保存部と、
前記運用部品の各々に適用されるルールを保存する発火ルール保存部と、
前記運用部品の各々の動作内容を示すアクションを保存するアクション保存部と、を有しており、
前記メッセージ保存部および前記発火ルール保存部を参照して、前記ルールとして実行可能な発火ルールが存在すれば、前記アクション保存部から当該発火ルールに該当するアクションを選択する処理を、前記運用部品ごとに実行するステップと、
前記選択されたアクションを、前記運用部品ごとに実行するステップと、
前記実行したアクションの実行結果に基づいて、他の前記運用部品宛のメッセージを作成する処理を、前記運用部品ごとに実行するステップと、を実行する、
ことを特徴とするオペレーション方法。 - 前記オペレーションは、前記サービスが提供されるネットワークにおける障害復旧を実現するオペレーションであり、
前記運用部品は、
前記サービスを提供するネットワーク構成から情報を収集する情報収集部品と、
前記収集した情報を解析する情報解析部品と、
前記収集した情報を加工する情報加工部品と、
前記ネットワークにおける障害確認用の試験を行う試験部品と、
前記ネットワーク構成を変更する構成変更部品と、を含む、
ことを特徴とする請求項4に記載のオペレーション方法。 - 前記運用部品の各々の動作を保守者が許可するメッセージを、前記運用部品の各々に送信する保守者UIを、前記運用部品として含む、
ことを特徴とする請求項4または請求項5に記載のオペレーション方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117673A JP7047621B2 (ja) | 2018-06-21 | 2018-06-21 | オペレーション装置、および、オペレーション方法 |
PCT/JP2019/023235 WO2019244733A1 (ja) | 2018-06-21 | 2019-06-12 | オペレーション装置、および、オペレーション方法 |
US17/253,241 US11349730B2 (en) | 2018-06-21 | 2019-06-12 | Operation device and operation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117673A JP7047621B2 (ja) | 2018-06-21 | 2018-06-21 | オペレーション装置、および、オペレーション方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019219983A true JP2019219983A (ja) | 2019-12-26 |
JP7047621B2 JP7047621B2 (ja) | 2022-04-05 |
Family
ID=68982676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018117673A Active JP7047621B2 (ja) | 2018-06-21 | 2018-06-21 | オペレーション装置、および、オペレーション方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11349730B2 (ja) |
JP (1) | JP7047621B2 (ja) |
WO (1) | WO2019244733A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021156972A1 (ja) * | 2020-02-05 | 2021-08-12 | 日本電信電話株式会社 | 保守管理システム、メッセージ制御装置、メッセージ制御方法、およびプログラム |
JP7393696B2 (ja) | 2020-05-11 | 2023-12-07 | 日本電信電話株式会社 | 制御装置、制御方法、および制御プログラム |
WO2022024277A1 (ja) * | 2020-07-29 | 2022-02-03 | 日本電信電話株式会社 | 情報流通装置、情報流通方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012043121A (ja) * | 2010-08-18 | 2012-03-01 | Nippon Telegr & Teleph Corp <Ntt> | 運用管理システム、運用管理方法及び運用管理装置 |
US20170091007A1 (en) * | 2015-09-25 | 2017-03-30 | Annapurna Dasari | Management of a fault condition in a computing system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4576249B2 (ja) * | 2005-01-27 | 2010-11-04 | 株式会社クラウド・スコープ・テクノロジーズ | ネットワーク管理装置及び方法 |
WO2008085207A2 (en) * | 2006-12-29 | 2008-07-17 | Prodea Systems, Inc. | Multi-services application gateway |
US7933743B2 (en) * | 2007-11-28 | 2011-04-26 | Cisco Technology, Inc. | Determining overall network health and stability |
US10075329B2 (en) * | 2014-06-25 | 2018-09-11 | A 10 Networks, Incorporated | Customizable high availability switchover control of application delivery controllers |
JP6533475B2 (ja) | 2016-02-12 | 2019-06-19 | 日本電信電話株式会社 | 管理装置、および、ネットワークサービス管理方法 |
US10637758B2 (en) * | 2016-12-19 | 2020-04-28 | Jpmorgan Chase Bank, N.A. | Methods for network connectivity health check and devices thereof |
US10628251B2 (en) * | 2017-09-26 | 2020-04-21 | At&T Intellectual Property I, L.P. | Intelligent preventative maintenance of critical applications in cloud environments |
-
2018
- 2018-06-21 JP JP2018117673A patent/JP7047621B2/ja active Active
-
2019
- 2019-06-12 WO PCT/JP2019/023235 patent/WO2019244733A1/ja active Application Filing
- 2019-06-12 US US17/253,241 patent/US11349730B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012043121A (ja) * | 2010-08-18 | 2012-03-01 | Nippon Telegr & Teleph Corp <Ntt> | 運用管理システム、運用管理方法及び運用管理装置 |
US20170091007A1 (en) * | 2015-09-25 | 2017-03-30 | Annapurna Dasari | Management of a fault condition in a computing system |
Non-Patent Citations (1)
Title |
---|
JP1による業務システム運用管理の実践, vol. 第1版, JPN6019030379, 1 November 2009 (2009-11-01), JP, pages 300 - 308, ISSN: 0004639494 * |
Also Published As
Publication number | Publication date |
---|---|
WO2019244733A1 (ja) | 2019-12-26 |
US11349730B2 (en) | 2022-05-31 |
US20210266238A1 (en) | 2021-08-26 |
JP7047621B2 (ja) | 2022-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9015315B2 (en) | Identification and monitoring of distributed business transactions | |
WO2019244733A1 (ja) | オペレーション装置、および、オペレーション方法 | |
CN100549975C (zh) | 计算机维护帮助系统及分析服务器 | |
CN111052087B (zh) | 控制系统、信息处理装置以及记录介质 | |
JP2008191878A (ja) | 遠隔診断・障害対応システム、遠隔診断・障害対応装置、遠隔診断・障害対応指示装置、遠隔診断・障害対応方法、及び遠隔診断・障害対応プログラム | |
CN107908469B (zh) | 一种任务调度方法及系统 | |
JP6280862B2 (ja) | イベント分析システムおよび方法 | |
US10599476B2 (en) | Device and method for acquiring values of counters associated with a computational task | |
US9461879B2 (en) | Apparatus and method for system error monitoring | |
JP2010128597A (ja) | 情報処理装置及び情報処理装置の運用方法 | |
JP2014010772A (ja) | システム管理装置、システムの管理方法、及びシステムの管理プログラム | |
JP2016146020A (ja) | データ分析システム及び分析方法 | |
JP2011254179A (ja) | ネットワーク解析支援装置、ネットワーク解析支援方法及びプログラム | |
JP5501278B2 (ja) | フィルタリング装置、フィルタリング方法、フィルタリングプログラム | |
JP2011095886A (ja) | アプリケーションサーバ、アプリケーション障害再現方法、およびアプリケーション障害再現プログラム | |
JP2008181299A (ja) | 通信エラー情報出力プログラム、通信エラー情報出力方法および通信エラー情報出力装置 | |
JP6488600B2 (ja) | 情報処理システム、プログラム及び情報処理装置 | |
JP7421267B2 (ja) | サービス提供用アプリケーションの保守管理システム、保守管理装置、保守管理方法、および、保守管理用プログラム | |
JP5359385B2 (ja) | 統合管理システム、統合管理装置、統合管理方法およびプログラム | |
JP4816169B2 (ja) | グローバルプロセス生成方法、装置、システム、およびプログラム | |
JP2014032598A (ja) | インシデント管理システム及びその方法 | |
WO2022118427A1 (ja) | 異常検知支援装置、異常検知支援方法及びプログラム | |
WO2022168196A1 (ja) | 保守システム、情報処理装置、保守方法、およびプログラム | |
JP2018160020A (ja) | 監視システム、プログラムおよび監視方法 | |
JP3941942B2 (ja) | メッセージ相関システム、メッセージ相関方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220307 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7047621 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |