WO2015097772A1 - 監視方法及び監視システム - Google Patents

監視方法及び監視システム Download PDF

Info

Publication number
WO2015097772A1
WO2015097772A1 PCT/JP2013/084584 JP2013084584W WO2015097772A1 WO 2015097772 A1 WO2015097772 A1 WO 2015097772A1 JP 2013084584 W JP2013084584 W JP 2013084584W WO 2015097772 A1 WO2015097772 A1 WO 2015097772A1
Authority
WO
WIPO (PCT)
Prior art keywords
business
request
information
scheduling
monitoring
Prior art date
Application number
PCT/JP2013/084584
Other languages
English (en)
French (fr)
Inventor
真一 横田
克 玉木
俊道 捧
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2013/084584 priority Critical patent/WO2015097772A1/ja
Priority to US14/771,344 priority patent/US20160006635A1/en
Publication of WO2015097772A1 publication Critical patent/WO2015097772A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2425Traffic characterised by specific attributes, e.g. priority or QoS for supporting services specification, e.g. SLA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/82Miscellaneous aspects
    • H04L47/821Prioritising resource allocation or reservation requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Definitions

  • the present invention relates to a monitoring method and a monitoring system, and is suitable for application to an information system having a business device capable of executing a plurality of business programs (hereinafter simply referred to as business), for example.
  • the present invention has been made in consideration of the above points, and aims to reduce the occurrence of deadlocks and exclusion waits, and reduce the occurrence of business delays.
  • an information system having one or more business devices capable of executing a plurality of businesses having an exclusive relationship and a business terminal requesting the business devices to execute the business is monitored.
  • the information system holds a business scheduling device that receives a business execution request transmitted from the business terminal, and first information relating to an exclusive relationship between the business and a load tendency for each business
  • the monitoring system for monitoring an information system having one or a plurality of business devices capable of executing a plurality of businesses having an exclusive relationship and a business terminal that requests the business devices to execute the business
  • a business scheduling apparatus that receives a business execution request transmitted from the business terminal; and an analysis apparatus that holds first information related to an exclusive relationship between the business and a load trend for each business
  • the business scheduling apparatus Inquires of the analysis device about the business device to which the request from the business terminal is to be transferred, and the analysis device receives second information relating to the operational state of the business device from the operational state collection device of the monitored system. And the request is based on the acquired second information and the held first information.
  • the business scheduling device is notified of the business device to which the request is to be transferred and the standby time when the request is forwarded as necessary, and the business scheduling device, based on the notification from the analysis device, When the waiting time is designated, the request is transferred to the designated business device after waiting for the designated waiting time.
  • the present invention it is possible to realize a monitoring method and a monitoring system that can reduce the occurrence of deadlock and exclusion waiting and reduce the occurrence of business delay.
  • reference numeral 1 denotes an information system according to this embodiment as a whole.
  • This information system 1 is configured by connecting one or a plurality of business terminals 2, a monitoring target system 3, a business scheduling device 4, and an analysis device 5 to each other via a network 6.
  • the business terminal 2 is a communication terminal used by a user for business, and is composed of, for example, a personal computer, a workstation, or a mainframe.
  • the business terminal 2 transmits to the business scheduling device 4 a request to execute a business according to a user operation or a request from an installed program.
  • the monitoring target system 3 includes an operation state collection device 10 and one or a plurality of business devices 11, and each of the operation state collection device 10 and each business device 11 has a network (not shown). Are connected to each other.
  • the operating state collection device 10 starts processing of the CPU operation rate, the free memory capacity, and the business program running on the business device 11 (hereinafter, simply referred to as “business” as appropriate) from each business device 11.
  • This is a computer device having a function of periodically collecting various information relating to the operating state of the business device 11 (hereinafter referred to as operating state information), such as the elapsed time of the job.
  • the operating state collection device 10 includes a CPU (Central Processing Unit) 20 and a main storage device 21.
  • the CPU 20 is a processor that controls the operation of the entire operation state collection apparatus 10.
  • the main storage device 21 is composed of a semiconductor memory, for example, and is used for storing various programs.
  • the main storage device 21 of the operation state collection apparatus 10 stores an operation state collection processing unit 22 that is a program having a function of collecting operation state information from the business apparatus 11. Then, the CPU 20 collects operating state information of the business device 11 from each business device 11 existing in the monitoring target system 3 by periodically executing the operating state collection processing unit 22.
  • Each business device 11 is a server device having a function of providing a service in response to a request transmitted from the business terminal 2 via the business scheduling device 4 as described later.
  • Each business device 11 is equipped with a CPU 23 and a main storage device 24, and the main storage device 24 stores a Web service program 25, an application program 26, or a database program 27. These programs communicate with each other and execute predetermined processes in order to achieve a certain business purpose.
  • the Web service program 25 receives the request, requests the application program 26 to generate screen data of the management screen, 26 requests the database program 27 to acquire necessary data from the database, the application program 26 generates screen data based on the acquired data, and the Web service program 25 transmits the screen data to the business terminal 2.
  • a management screen based on the screen data is displayed on the business terminal 2.
  • the monitoring target system 3 has a configuration including a web three-layer model, that is, a web layer, an application layer, and a database layer.
  • a program other than the Web service program 25, the application program 26, or the database program 27 may be mounted on each business device 11 of the monitoring target system 3.
  • the business scheduling device 4 inquires the business device 11 to which the request should be transferred and the timing thereof to the analysis device 5, and analyzes the business device 11 instructed by the analysis device 5 with the analysis device 5 is a computer device having a function of transferring the request to the business device 11 at a timing instructed by 5.
  • the business scheduling device 4 includes a CPU 30, a main storage device 31, and a secondary storage device 32.
  • the CPU 30 is a processor that controls operation of the entire business scheduling apparatus 4.
  • the main storage device 31 is composed of, for example, a semiconductor memory, and is used for storing various programs. When the CPU 30 executes various programs stored in the main storage device 31, various processes as the entire task scheduling apparatus 4 are executed.
  • a business scheduling processing unit 33 to be described later is also stored and held in the main storage device 31.
  • the secondary storage device 32 is a large-capacity nonvolatile storage device that stores various programs and various data, and is composed of, for example, a hard disk device.
  • the analysis device 5 has a function of determining a business device 11 that processes a request from the business terminal 2 and a timing at which the request should be transferred to the business device 11 in response to an inquiry from the business scheduling device 4.
  • a computer device is a function of determining a business device 11 that processes a request from the business terminal 2 and a timing at which the request should be transferred to the business device 11 in response to an inquiry from the business scheduling device 4.
  • the analyzer 5 includes a CPU 40, a main storage device 41, and a secondary storage device 42 as shown in FIG. Since the CPU 40, the main storage device 41, and the secondary storage device 42 are the same as the CPU 30, the main storage device 31, and the secondary storage device 32 of the business scheduling device 4, detailed descriptions thereof are omitted.
  • the main storage device 41 of the analysis device 5 stores a schedule creation processing unit 43 described later, and the secondary storage device 42 of the analysis device 5 stores each business correlation table 44, SLA information management table 45, described later, An operating state information management table 46 and a schedule management table 47 are stored and held.
  • This system monitoring process executes the business requested from the business terminal 2 or the like based on the operating state of each business device 11 in the current monitored system 3, the exclusive relationship between the business, and the load trend for each business. This is a function for determining a business device 11 to be executed and requesting the business device 11 to execute the business.
  • exclusive relationship between business operations refers to the presence or absence of exclusion that occurs when, for example, the same file is used during business execution.
  • the business terminal 2 transmits a request for the business device 11 in the monitored system 3 to the business scheduling device 4 (SP1).
  • the business scheduling device 4 analyzes the schedule information request for inquiring about the business device 11 that should request the requested business and the timing at which the request from the business terminal 2 should be transferred to the business device 11. It transmits to the apparatus 5 (SP2).
  • the analysis device 5 When the analysis device 5 receives the schedule information request from the business scheduling device 4, the analysis device 5 requests the operation status collection device 10 in the monitoring target system 3 to transfer the operation status information of the corresponding business device 11. Is transmitted (SP3). Thus, the operation state collection device 10 transmits the operation state information to the analysis device 5 in response to the operation state request from the analysis device 5 (SP4).
  • the analysis apparatus 5 stores a service correlation table 44 (FIG. 5) for each service in which information regarding the exclusive relationship between the tasks executed by the task apparatus 11 and the load tendency when executing each task is stored. Pre-held.
  • the business correlation table 44 includes an average processing time for each business, a period during which the business device 11 has a heavy load when the business device 11 executes the business, and other business operations. It is a table in which information indicating the presence / absence of exclusion and whether or not to wait for execution of another job in the job apparatus 11 when the job apparatus 11 is executing the job is a table stored in advance.
  • the analysis device 5 determines the operation requested from the operation terminal 2 based on the received operation state information and the operation correlation table 44 as one of the operations. It is determined whether or not the apparatus 11 can be immediately executed. If the analysis device 5 determines that the job can be executed immediately, the analysis device 5 notifies the job scheduling device 4 as schedule information of the job device 11 that should be requested to execute the job, while executing the job immediately. If it is determined that it is not possible, the task scheduling device 4 is notified as schedule information of the time to wait and the task device 11 that should be requested to execute the task after waiting for that time (SP5).
  • the business scheduling device 4 Upon receiving the schedule information from the analysis device 5, the business scheduling device 4 waits for a period specified in the schedule information based on the received schedule information, and then in the schedule information in the monitoring target system 3. The request from the business terminal 2 is transferred to the designated business device 11 (SP6).
  • SP6 designated business device 11
  • the business device 11 in the monitoring target system 3 executes processing according to the request. If the business apparatus 11 needs to request another business apparatus 11 to process the request, the business apparatus 11 transmits the request to the business scheduling apparatus 4 (SP7).
  • SP7 business scheduling apparatus 4
  • the business scheduling device 4 Upon receiving this request, the business scheduling device 4 transmits to the analysis device 5 a schedule information request that inquires about the business device 11 that should request the requested business and the timing at which the request should be transferred to the business device 11. (SP2).
  • SP2 schedule information request
  • step SP3 to step SP5 the processing of step SP3 to step SP5 described above is executed, and thereafter, the business scheduling device 4 that has received the schedule information from the analysis device 5 uses the schedule information as necessary based on the received schedule information. After waiting for the specified period, the request transmitted from the business terminal 2 is transferred to the business device 11 specified in the schedule information in the monitoring target system 3 (SP6).
  • SP6 monitoring target system 3
  • the above processing is repeated as many times as necessary, and then the processing result of the request from the business terminal 2 is transmitted from the corresponding business device 11 to the business terminal 2.
  • a schedule creation processing unit 43 is stored in the main storage device 41 of the analyzer 5 as shown in FIG.
  • the secondary storage device 42 of the analysis device 5 stores a service correlation table 44, an SLA information management table 45, an operating state information management table 46, and a schedule management table 47 for each service.
  • the schedule creation processing unit 43 determines the business device 11 that should execute the requested business and the timing at which the request should be transferred to the business device 11. This is a program having a function of notifying the business scheduling apparatus 4 of the result as schedule information.
  • the business correlation table 44 is a table used for managing information regarding the exclusive relationship between business operations executed on the business device 11 and the load tendency when each business operation is executed. , Application service or database service). As shown in FIG. 5, the business correlation table 44 includes a business column 44A, an average processing time column 44B, a load soaring period column 44C, an exclusion presence / absence column 44D, and a standby necessity column 44E.
  • the business column 44A stores the business name of each business that can be executed on the business device 11 that provides the corresponding service
  • the average processing time column 44B stores the average processing time of the corresponding business. Is done.
  • the load soaring period column 44C stores a period during which the load soars during execution of the corresponding job.
  • FIG. 6 (A) the load on the business device 11 rises during “0 to 0.2 seconds” after execution, and “business B”
  • the load on the business apparatus 11 rises for “0.2 to 0.3 seconds” after execution, and “business C” is post-executed as shown in FIG. 6 (C). It is assumed that the load on the business apparatus 11 increases during “0 to 0.4 seconds”.
  • exclusion presence / absence column 44D whether or not exclusion occurs with another business when executing the corresponding business, and the period when exclusion occurs, are stored.
  • necessity / unnecessity column 44E whether or not the other business needs to wait when executing the corresponding business and the period when the other business needs to wait are stored.
  • other correlated jobs need to wait for the time zone when the load of the corresponding job increases, or when the exclusion is set when the corresponding job is executed It is supposed to be.
  • the average processing time is “0.5 seconds” for the task “task A”, “the load increases between 0 and 0.3 seconds”, and between “0 and 0.2 seconds” "Excluded from business B” occurs, indicating that "business B requires standby for 0 to 0.2 seconds” and "business C requires standby for 0 to 0.3 seconds”.
  • the SLA information management table 45 is a table used for managing a predetermined SLA for each business, and includes a business name column 45A and an SLA time column 45B as shown in FIG.
  • the business name column 45A the business name of each business is stored, and in the SLA time column 45B, the business terminal 2 issues a request after the request is issued by the business terminal 2 specified by the SLA for the corresponding business. 2 is stored in the upper limit of the response time until the data is transmitted to 2. Accordingly, in the case of FIG. 7, the upper limit of the response time is “2.0 seconds” for the job “job A”.
  • the operating state information management table 46 manages, among the operating state information collected by the analyzing device 5 from the operating state collection device 10 of the monitoring target system 3, in particular, the execution state of each business that can be executed in the corresponding business device 11. This table is used for the purpose, and is created for each business device 11. As shown in FIG. 8, the operating state information management table 46 includes a business name column 46A and an execution time column 46B. In the business name column 46A, the business name of each business that can be executed on the corresponding business device 11 is stored, and in the execution time column 46B, the process since the corresponding business device 11 starts executing the corresponding business. The time is stored. Therefore, in the case of FIG. 8, “business A” is shown to be in a state where “0.3 seconds have elapsed since the start” at the present time (more precisely, when the operation state collection device 10 collects the information). .
  • the schedule management table 47 is a table temporarily created in the process of a schedule creation process (FIG. 12) described later, and is created for each business apparatus 11 that provides the target service at that time. As shown in FIG. 9, the schedule management table 47 includes a business name column 47A and a standby necessity column 47B.
  • the business name column 47A stores the business name of each business that can be executed by the corresponding business device 11, and the standby necessity column 47B can immediately execute the business corresponding to the current time on the business device 11.
  • Information indicating whether or not it is executable (“standby not required” if executable, “standby required” if not executable). Therefore, for example, in the case of FIG. 9, in the corresponding business device 11, “business A” and “business B” are “standby unnecessary”, but “business C” is “necessary standby”. It is shown.
  • a business scheduling processing unit 33 is stored in the main storage device 31 of the business scheduling device 4 and the business scheduling device 4.
  • the secondary storage device 32 stores a request transmission destination list 34 and a standby time management table 35.
  • the business scheduling processing unit 33 is a program having a function of transmitting a request to the designated business device 11 after waiting for a designated time as required based on the schedule information from the analysis device 5.
  • the request transmission destination list 34 is a list in which device names, IP addresses, and the like of the respective business devices 11 are stored.
  • the standby time management table 35 is a table used for managing the standby time for each business notified from the analysis device 5, and includes a business name column 35A and a standby time column 35B as shown in FIG. Is done.
  • the business name column 35A the business name of each business for which the business scheduling apparatus 4 is requested to transfer a request is stored, and in the standby time column 35B, a standby time when a request for the corresponding business is transferred. Stored. Therefore, in the case of FIG. 10, for the task “task A”, it is indicated that the request should be transferred to the task device 11 designated by the analysis device 5 after waiting for “0.1 seconds”.
  • FIG. 11 shows a flow of the system monitoring process executed in the information system 1 in the configuration of the present embodiment.
  • An example is shown.
  • an application program in which a business device 11 in which the web service program 25 is installed (hereinafter referred to as a web service business device as appropriate) 11 processes a request from the business terminal 2.
  • a predetermined process is requested to the business apparatus 11 (hereinafter, referred to as an application service business apparatus as appropriate) 11 in which 26 is implemented.
  • a business apparatus (hereinafter referred to as a database service business apparatus) 11 in which the database program 27 is installed is requested to perform predetermined processing, and the application service business apparatus 11 performs processing based on the processing result of the database service business apparatus 11.
  • process the result -Bis business device 11 is a processing flow when transmitting the service terminal 2 of the original source of the request.
  • This system monitoring process is started when the business terminal 2 transmits a business request to the business scheduling device 4.
  • the business scheduling device 4 transmits a schedule information request to the analysis device 5 (SP11).
  • the analysis device 5 Upon receiving the schedule information request, the analysis device 5 acquires the operation state information of each Web service business device 11 by transmitting the operation state request to the operation state collection device 10 in the monitoring target system 3. Further, the analysis device 5 creates schedule information for the business specified in the schedule information request based on the acquired operating state information and the business correlation table 44 for the Web service. Then, the analysis device 5 transmits the created schedule information to the business scheduling device 4 (SP12).
  • SP12 business scheduling device 4
  • the business scheduling apparatus 4 When the business scheduling apparatus 4 receives the schedule information, if the standby time is specified in the schedule information, the business scheduling apparatus 4 waits for the standby time, and then the Web service specified in the schedule information in the monitored system 3 A request is transmitted to the business apparatus 11 (SP13).
  • the Web service business apparatus 11 that has received such a request transmits a request to the business scheduling apparatus 4 to cause the application service business apparatus 11 to execute a predetermined business.
  • the business scheduling device 4 When receiving the request (SP14), the business scheduling device 4 transmits a schedule information request corresponding to the request to the analysis device 5 (SP15).
  • the analysis device 5 When the analysis device 5 receives the schedule information request, the analysis device 5 transmits the operation state request to the operation state collection device 10 in the monitoring target system 3 to acquire the operation state information of each application service business device 11. Further, the analysis device 5 creates schedule information for the business specified in the schedule information request based on the acquired operating state information and the business service correlation table 44 for application service. Then, the analysis device 5 transmits the created schedule information to the business scheduling device 4 (SP16).
  • SP16 business scheduling device 4
  • the business scheduling apparatus 4 waits for the waiting time in the case where the waiting time is specified in the schedule information, and then waits for the waiting time, and then the application service specified in the schedule information in the monitored system 3 A request is transmitted to the business apparatus 11 (SP17).
  • the application service business apparatus 11 that has received such a request transmits a request that the database service business apparatus 11 should execute a predetermined business to the business scheduling apparatus 4.
  • the business scheduling apparatus 4 When receiving the request (SP18), the business scheduling apparatus 4 transmits a schedule information request corresponding to the request to the analysis apparatus 5 (SP19).
  • the analysis device 5 When the analysis device 5 receives the schedule information request, the analysis device 5 transmits the operation state request to the operation state collection device 10 in the monitoring target system 3 to acquire the operation state information of each database service business device 11. Further, the analysis device 5 creates schedule information for the business specified in the schedule information request based on the acquired operating state information and the business correlation table 44 for the database service. Then, the analysis device 5 transmits the created schedule information to the business scheduling device 4 (SP20).
  • SP20 business scheduling device 4
  • the business scheduling apparatus 4 Upon receiving such schedule information, the business scheduling apparatus 4 waits only for the waiting time in the schedule information, and then waits for the waiting time, and then the database service specified in the schedule information in the monitored system 3 A request is transmitted to the business apparatus 11 (SP21).
  • the business apparatus 11 that has received such a request executes the process specified in accordance with the request, and transmits the processing result to the application service business apparatus 11. Further, the application service business apparatus 11 executes necessary processing based on the processing result and transmits the processing result to the Web service business apparatus 11. Then, the Web service business apparatus 11 transmits the processing result of the predetermined process transmitted from the application service business apparatus 11 to the business terminal 2 that is the transmission source of the request (SP22).
  • FIG. 12 shows a specific processing procedure of the schedule creation processing executed by the analyzer 5 in step SP12, step SP16 and step SP20 of such system monitoring processing.
  • This schedule creation processing is executed by the schedule creation processing unit 43 (FIG. 4) of the analysis device 5.
  • step SP12 step SP16 or step SP20 of the system monitoring process
  • the schedule creation processing unit 43 starts the schedule creation process shown in FIG.
  • operational status information of each business device 11 that provides a corresponding service (Web service, application service, or database service) in the monitored system 3
  • execute the business out of the obtained operational status information Information on the state is stored in the corresponding operating state information management table 46 (SP30).
  • the schedule creation processing unit 43 determines the CPU operation rate of the business apparatus 11 based on the operational status information of each corresponding business apparatus 11 acquired in step SP30 and the business correlation table 44 for the current service.
  • Business device that can immediately execute the business specified in the schedule information request from the business scheduling device 4 in consideration of the free space of the memory and the presence or absence of the exclusive relationship with the business currently running on the business device 11 It is determined whether 11 is present in the monitored system 3 (SP31).
  • the schedule creation processing unit 43 If the schedule creation processing unit 43 obtains an affirmative result in this determination, the schedule creation processing unit 43 transmits schedule information designating the business device 11 as the business device 11 that should execute the corresponding business to the business scheduling device 4 (SP32). Thereafter, the schedule creation process is terminated and the process returns to the system monitoring process.
  • the schedule creation processing unit 43 determines whether or not there is a business device 11 that can execute the business specified in the schedule information request from the monitoring target system 3 (SP33).
  • the schedule creation processing unit 43 When the schedule creation processing unit 43 obtains an affirmative result in this determination, it designates the business device 11 as the business device 11 that should execute the corresponding business, and schedule information that designates the standby time as the business scheduling device 4. (SP34), and then the schedule creation process is terminated and the process returns to the system monitoring process.
  • SP34 business scheduling device 4.
  • the schedule creation processing unit 43 displays schedule information indicating that there is no business device 11 that can currently execute the business specified in the schedule information request. 4 (SP35), thereafter, the schedule process is terminated and the process returns to the system monitoring process.
  • FIG. 13 shows a specific processing procedure of the business scheduling process executed by the business scheduling apparatus 4 in step SP13, step SP17 and step SP21 of the system monitoring process.
  • This business scheduling process is executed by the business scheduling processing unit 33 (FIG. 3) of the business scheduling device 4.
  • the business scheduling processing unit 33 starts this business scheduling processing. First, based on the received schedule information, the business scheduling processing unit 33 is requested from the business terminal 2 or the business device 11. It is determined whether or not a business device 11 that can immediately execute business is designated (SP40).
  • the business scheduling processing unit 33 If the business scheduling processing unit 33 obtains a positive result in this determination, the business scheduling processing unit 33 transmits a request from the business terminal 2 or the business device 11 to the business device 11 specified in the schedule information (SP41). The scheduling process ends and the process returns to the system monitoring process.
  • the business scheduling processing unit 33 determines whether a standby time is specified in the schedule information (SP42). If the business scheduling processing unit 33 obtains an affirmative result in this determination, after waiting for the time specified in the schedule information, the business scheduling processing unit 33 sends a request from the business terminal 2 or the business device 11 to the business device 11 specified in the schedule information. (SP43). Thereafter, the task scheduling processing unit 33 ends the task scheduling process and returns to the system monitoring process.
  • step SP42 if the business scheduling processing unit 33 obtains a negative result in the determination at step SP42 (that is, if the received schedule information indicates that there is no business device 11 that can be executed), the business scheduling processing unit 33 Is notified to the business terminal 2 (SP44), and then the business scheduling process is terminated.
  • the system monitoring process is also ended.
  • the business scheduling device 4 and the analysis device 5 are configured as separate devices.
  • the present invention is not limited to this, and the business scheduling device 4 and the analysis device are also described. You may make it mount 5 functions in one apparatus.
  • the present invention can be applied to an information system having one or a plurality of business apparatuses capable of executing a plurality of businesses having an exclusive relationship and a business terminal that requests the business devices to execute the business.
  • SYMBOLS 1 ... Information system, 2 ... Business terminal, 3 ... Monitoring object system, 4 ... Business scheduling apparatus, 5 ... Analysis apparatus, 10 ... Operational condition collection apparatus, 11 ... Business equipment, 20, 23, 30, 40 ... CPU, 25 ... Web service program, 26 ... Application service program, 27 ... Database service program, 33 ... Business scheduling processing unit, 35 ... Standby time management table, 43 ... Schedule creation processing unit, 44 ... Business correlation management table, 45 ... SLA information Management table, 46 ... operating state information management table, 47 ... schedule management table.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】 デッドロック等による排他待ち発生を防止し、業務遅延の発生を有効に防止し得る監視方法及び監視システムを提案する。 【解決手段】 情報システムは、リクエストを受信する業務スケジューリング装置と、業務間の排他関係及び業務ごとの負荷傾向に関する第1の情報を保持する分析装置とを有し、業務スケジューリング装置が、リクエストを転送すべき業務装置を分析装置に問い合わせ、分析装置が、稼働状態収集装置から取得した業務装置の稼働状態に関する第2の情報と、保持している第1の情報とに基づいて、リクエストを転送すべき業務装置と、必要に応じて待機時間とを業務スケジューリング装置に通知し、業務スケジューリング装置が、分析装置からの通知に基づいて、待機時間が指定されている場合には指定された当該待機時間だけ待機した後に、指定された業務装置にリクエストを転送するようにした。

Description

監視方法及び監視システム
 本発明は監視方法及び監視システムに関し、例えば、複数の業務プログラム(以下、これを単に業務と呼ぶ)を実行可能な業務装置を有する情報システムに適用して好適なものである。
 近年、情報システムが企業活動や社会インフラの基盤としてますます重要な位置を占めるようになるにつれ、情報システムで発生する障害が看過できないものとなっている。すなわち障害の発生に起因して、情報システムが使用不可能になるシステムダウンという事象や、オンラインシステムにおいて応答性能が極端に劣化することによって使用が困難になるといった事象が、経済的及び社会的に重大な影響を及ぼす事例が散見されるようになってきた。
 このような状況の下、近年では、情報システムを構成する各業務装置単位で閾値や稼働状態の相関などを設定し、各業務装置の健全性を監視することにより、間接的に業務のSLA(Service Level Agreement)の維持を図っている。
"WebSAM Invariant Analyzer"、[online]、NEC、[平成25年11月26日検索]、インターネット<URL:http://jpn.nec.com/websam/invariantanalyzer/>
 ところが、例えば1つのシステム上で複数の業務プログラムが並列的に実行されている環境下では、並列的に実行される業務プログラムが同じファイルを利用することによりデッドロックが発生し、その結果として業務が遅延するケースがある。このケースは、システムを構成する業務装置の負荷を要因とする障害ではないため、上述のような従来手法のように閾値や稼働状態の相関を監視しても防ぐことはできない問題がある。
 本発明は以上の点を考慮してなされたもので、デッドロックや排他待ち発生を削減し、業務遅延の発生を削減することを目的とする。
 かかる課題を解決するため本発明においては、排他関係を有する複数の業務を実行可能な1又は複数の業務装置と、前記業務装置に前記業務の実行を依頼する業務端末とを有する情報システムを監視する監視方法において、前記情報システムは、前記業務端末から送信される業務実行のリクエストを受信する業務スケジューリング装置と、前記業務間の排他関係及び前記業務ごとの負荷傾向に関する第1の情報を保持する分析装置とを有し、前記業務スケジューリング装置が、前記業務端末からの前記リクエストを転送すべき前記業務装置を前記分析装置に問い合わせる第1のステップと、前記分析装置が、前記監視対象システムの前記稼働状態収集装置から前記業務装置の稼働状態に関する第2の情報を取得し、取得した前記第2の情報と、保持している前記第1の情報とに基づいて、前記リクエストを転送すべき前記業務装置と、必要に応じて前記リクエストを転送する際の待機時間とを前記業務スケジューリング装置に通知する第2のステップと、前記業務スケジューリング装置が、前記分析装置からの通知に基づいて、前記待機時間が指定されている場合には指定された当該待機時間だけ待機した後に、指定された前記業務装置に対して前記リクエストを転送する第3のステップとを設けるようにした。
 また本発明においては、排他関係を有する複数の業務を実行可能な1又は複数の業務装置と、前記業務装置に前記業務の実行を依頼する業務端末とを有する情報システムを監視する監視システムにおいて、前記業務端末から送信される業務実行のリクエストを受信する業務スケジューリング装置と、前記業務間の排他関係及び前記業務ごとの負荷傾向に関する第1の情報を保持する分析装置とを備え、前記業務スケジューリング装置は、前記業務端末からの前記リクエストを転送すべき前記業務装置を前記分析装置に問い合わせ、前記分析装置は、前記監視対象システムの前記稼働状態収集装置から前記業務装置の稼働状態に関する第2の情報を取得し、取得した前記第2の情報と、保持している前記第1の情報とに基づいて、前記リクエストを転送すべき前記業務装置と、必要に応じて前記リクエストを転送する際の待機時間とを前記業務スケジューリング装置に通知し、前記業務スケジューリング装置は、前記分析装置からの通知に基づいて、前記待機時間が指定されている場合には指定された当該待機時間だけ待機した後に、指定された前記業務装置に対して前記リクエストを転送するようにした。
 本発明によれば、デッドロックや排他待ち発生を削減し、業務遅延の発生を削減し得る監視方法及び監視システムを実現できる。
本実施の形態による情報システムの全体構成を示すブロック図である。 監視対象システムの概略構成を示すブロック図である。 業務スケジューリング装置の概略構成を示すブロック図である。 分析装置の概略構成を示すブロック図である。 業務相関管理テーブルの構成を示す概念図である。 (A)-(C)は、個々の業務の負荷傾向の変化の様子を示す特性曲線図である。 SLA情報管理テーブルの構成を示す概念図である。 稼働状態情報管理テーブルの構成を示す概念図である。 スケジュール管理テーブルの構成を示す概念図である。 待機時間管理テーブルの構成を示す概念図である。 システム監視処理の処理手順を示すフローチャートである。 スケジュール作成処理の処理手順を示すフローチャートである。 業務スケジューリング処理の処理手順を示すフローチャートである。
 以下図面について、本発明の一実施の形態を詳述する。
(1)本実施の形態による情報システムの構成
 図1において、1は全体として本実施の形態による情報システムを示す。この情報システム1は、1又は複数の業務端末2、監視対象システム3、業務スケジューリング装置4及び分析装置5がネットワーク6を介して相互に接続されることにより構成されている。
 業務端末2は、ユーザが業務で使用する通信端末であり、例えばパーソナルコンピュータ、ワークステーション又はメインフレームなどから構成される。業務端末2は、ユーザ操作又は実装されたプログラムからの要求に応じた業務を実行すべき旨のリクエストを業務スケジューリング装置4に送信する。
 監視対象システム3は、図2に示すように、稼働状態収集装置10と、1又は複数の業務装置11とから構成され、これら稼働状態収集装置10及び各業務装置11は、それぞれ図示しないネットワークを介して相互に接続されている。
 稼働状態収集装置10は、各業務装置11からCPU稼働率や、メモリの空き容量及びその業務装置11上で稼働している業務プログラム(以下、適宜、これを単に業務と呼ぶ)の処理開始からの経過時間といった、その業務装置11の稼働状態に関する各種情報(以下、これを稼働状態情報と呼ぶ)を定期的に収集する機能を有するコンピュータ装置である。
 稼働状態収集装置10は、CPU(Central Processing Unit)20及び主記憶装置21を備えて構成される。CPU20は、稼働状態収集装置10全体の動作制御を司るプロセッサである。また主記憶装置21は、例えば半導体メモリから構成され、各種プログラムを記憶するために用いられる。
 例えば、稼働状態収集装置10の主記憶装置21には、業務装置11から稼働状態情報を収集する機能を有するプログラムである稼働状態収集処理部22が格納される。そして、CPU20は、この稼働状態収集処理部22を定期的に実行することにより、監視対象システム3内に存在する各業務装置11からその業務装置11の稼働状態情報をそれぞれ収集する。
 各業務装置11は、後述のように業務端末2から業務スケジューリング装置4を経由して送信されるリクエストに応じてサービスを提供する機能を有するサーバ装置である。各業務装置11には、CPU23及び主記憶装置24が搭載されており、主記憶装置24には、Webサービスプログラム25、アプリケーションプログラム26又はデータベースプログラム27が格納される。そして、これらのプログラムが相互に通信を行いつつ、ある業務上の目的を達成すべくそれぞれ所定の処理を実行する。
 例えば、業務端末2から所定の管理画面を表示すべき旨のリクエストが与えられた場合、Webサービスプログラム25がリクエストを受け付け、かかる管理画面の画面データの生成をアプリケーションプログラム26にリクエストし、アプリケーションプログラム26がデータベースプログラム27にデータベースからの必要なデータの取得をリクエストし、取得したデータに基づいてアプリケーションプログラム26が画面データを生成し、この画面データをWebサービスプログラム25が業務端末2に送信することにより、当該画面データに基づく管理画面を業務端末2に表示させる。
 一般に、こうした複数の業務装置11に分散して実装された多数のプログラムが協調して動作するアプリケーションを分散アプリケーションと呼ぶ。つまり本実施の形態の監視対象システム3は、ウェブ3階層モデル、すなわちウェブ層、アプリケーション層及びデータベース層からなる構成を有する。ただし、これは監視対象システム3の構成例に過ぎず、監視対象システム3の各業務装置11にWebサービスプログラム25、アプリケーションプログラム26又はデータベースプログラム27以外のプログラムが実装されていても良い。
 業務スケジューリング装置4は、業務端末2からのリクエストに応じて、そのリクエストを転送すべき業務装置11及びそのタイミングを分析装置5に問い合わせ、分析装置5から指示された業務装置11に対して分析装置5から指示されたタイミングでそのリクエストをその業務装置11に転送する機能を有するコンピュータ装置である。
 この業務スケジューリング装置4は、図3に示すように、CPU30、主記憶装置31及び二次記憶装置32を備えて構成される。CPU30は、業務スケジューリング装置4全体の動作制御を司るプロセッサである。また主記憶装置31は、例えば半導体メモリから構成され、各種プログラムを記憶するために利用される。主記憶装置31に格納された各種プログラムをCPU30が実行することにより、業務スケジューリング装置4全体としての各種処理が実行される。後述する業務スケジューリング処理部33もこの主記憶装置31に格納されて保持される。
 二次記憶装置32は、各種プログラムや各種データが格納される大容量の不揮発性の記憶装置であり、例えばハードディスク装置から構成される。後述するリクエスト送信先リスト34及び待機時間管理テーブル35は、この二次記憶装置32に格納されて保持される。
 分析装置5は、業務スケジューリング装置4からの問合わせに応じて、業務端末2からのリクエストを処理する業務装置11と、当該リクエストをその業務装置11に転送すべきタイミングとを決定する機能を有するコンピュータ装置である。
 この分析装置5は、図4に示すように、CPU40、主記憶装置41及び二次記憶装置42を備えて構成される。これらCPU40、主記憶装置41及び二次記憶装置42は業務スケジューリング装置4のCPU30、主記憶装置31及び二次記憶装置32と同様のものであるため、その詳細説明については省略する。
 分析装置5の主記憶装置41には、後述するスケジュール作成処理部43が格納されると共に、分析装置5の二次記憶装置42には、後述する各業務相関テーブル44、SLA情報管理テーブル45、稼働状態情報管理テーブル46及びスケジュール管理テーブル47が格納されて保持される。
(2)本実施の形態によるシステム監視処理
 次に、本情報システム1において、実行される本実施の形態のシステム監視処理について説明する。このシステム監視処理は、現在の監視対象システム3内の各業務装置11の稼働状態と、業務間の排他関係及び業務ごとの負荷傾向とに基づいて、業務端末2等からリクエストされた業務を実行すべき業務装置11を決定し、その業務装置11にその業務の実行を依頼する機能である。ここで、「業務間の排他関係」とは、例えば、業務の実行時に同一のファイルを使用する場合等に発生する排他の有無を指す。
 実際上、本情報システム1の場合、図1に示すように、業務端末2は、監視対象システム3内の業務装置11に対するリクエストを業務スケジューリング装置4に送信する(SP1)。そして業務スケジューリング装置4は、かかるリクエストを受信すると、リクエストされた業務を依頼すべき業務装置11と、業務端末2からのリクエストをその業務装置11に転送すべきタイミングとを問い合わせるスケジュール情報リクエストを分析装置5に送信する(SP2)。
 分析装置5は、業務スケジューリング装置4からのスケジュール情報リクエストを受信すると、監視対象システム3内の稼働状態収集装置10に対して、対応する業務装置11の稼働状態情報の転送を要求する稼働状態リクエストを送信する(SP3)。かくして、稼働状態収集装置10は、分析装置5からの稼働状態リクエストに応じて、かかる稼働状態情報を分析装置5に送信する(SP4)。
 ここで、分析装置5は、業務装置11で実行される業務間の排他関係と、各業務を実行する際の負荷傾向とに関する情報が格納されたサービスごとの業務相関テーブル44(図5)を予め保持している。この業務相関テーブル44は、図5について後述するように、業務ごとの平均処理時間や、業務装置11がその業務を実行した場合に当該業務装置11の負荷が高騰する期間、他の業務との排他の有無、及び、業務装置11がその業務を実行している場合に当該業務装置11において他の業務を実行するのを待機すべきか否かを表す情報が予め格納されたテーブルである。
 そして分析装置5は、稼働状態収集装置10からの稼働状態情報を受信すると、受信した稼働状態情報と、かかる業務相関テーブル44とに基づいて、業務端末2から要求された業務をいずれかの業務装置11において直ちに実行可能であるか否かを判定する。そして分析装置5は、かかる業務を直ちに実行可能であると判定した場合には、その業務の実行を依頼すべき業務装置11をスケジュール情報として業務スケジューリング装置4に通知する一方、その業務を直ちに実行可能でないと判定した場合には、待機すべき時間と、当該時間だけ待機後にその業務の実行を依頼すべき業務装置11とをスケジュール情報として業務スケジューリング装置4に通知する(SP5)。
 業務スケジューリング装置4は、分析装置5からのスケジュール情報を受信すると、受信したスケジュール情報に基づいて、必要に応じてスケジュール情報において指定された期間だけ待機した後に、監視対象システム3内のスケジュール情報において指定された業務装置11に対して、業務端末2からのリクエストを転送する(SP6)。
 かくして、かかるリクエストを受信した監視対象システム3内の業務装置11は、そのリクエストに応じた処理を実行する。また業務装置11は、かかるリクエストを処理するために他の業務装置11に業務を依頼する必要がある場合には、業務スケジューリング装置4に対してリクエストを送信する(SP7)。
 そして、このリクエストを受信した業務スケジューリング装置4は、リクエストされた業務を依頼すべき業務装置11と、リクエストをその業務装置11に転送すべきタイミングとを問い合わせるスケジュール情報リクエストを分析装置5に送信する(SP2)。
 この結果、上述したステップSP3~ステップSP5の処理が実行され、この後、分析装置5からのスケジュール情報を受信した業務スケジューリング装置4が、受信したスケジュール情報に基づいて、必要に応じてスケジュール情報において指定された期間だけ待機した後に、監視対象システム3内のスケジュール情報において指定された業務装置11に対して、業務端末2から送信されてきたリクエストを転送する(SP6)。
 以上の処理が必要回数分だけ繰り返され、この後、業務端末2からのリクエストの処理結果が対応する業務装置11から業務端末2に送信される。
 以上のような本実施の形態によるシステム監視機能に基づくシステム監視処理を実行するための手段として、図4に示すように、分析装置5の主記憶装置41には、スケジュール作成処理部43が格納されると共に、分析装置5の二次記憶装置42には、サービスごとの業務相関テーブル44、SLA情報管理テーブル45、稼働状態情報管理テーブル46及びスケジュール管理テーブル47が格納されている。
 スケジュール作成処理部43は、業務スケジューリング装置4からのスケジュール情報リクエストに応じて、リクエストされた業務を実行すべき業務装置11と、当該業務装置11にリクエストを転送すべきタイミングとを決定し、決定結果をスケジュール情報として業務スケジューリング装置4に通知する機能を有するプログラムである。
 また業務相関テーブル44は、業務装置11上で実行される業務間の排他関係と、各業務を実行する際の負荷傾向とに関する情報を管理するために利用されるテーブルであり、サービス(Webサービス、アプリケーションサービス又はデータベースサービス)ごとに用意される。この業務相関テーブル44は、図5に示すように、業務欄44A、平均処理時間欄44B、負荷高騰期間欄44C、排他有無欄44D及び待機要否欄44Eから構成される。
 そして業務欄44Aには、対応するサービスを提供する業務装置11上で実行可能な各業務の業務名がそれぞれ格納され、平均処理時間欄44Bには、対応する業務の平均的な処理時間が格納される。また負荷高騰期間欄44Cには、対応する業務の実行時に負荷が高騰する期間が格納される。本実施の形態の場合、「業務A」については、図6(A)に示すように、実行後「0~0.2秒」の間は業務装置11の負荷が高騰し、「業務B」については、図6(B)に示すように、実行後「0.2~0.3秒」の間は業務装置11の負荷が高騰し、「業務C」については、図6(C)に示すように、実行後「0~0.4秒」の間は業務装置11の負荷が高騰するものとしている。
 さらに排他有無欄44Dには、対応する業務を実行する際に他業務との間で排他が発生するか否か、及び、排他が発生する場合にはその期間が格納される。さらに待機要否欄44Eには、対応する業務の実行時に他業務が待機する必要があるか否か、及び、他業務が待機する必要がある場合にはその期間が格納される。本実施の形態の場合、対応する業務の負荷が高騰する時間帯が重なる場合や、対応する業務の実行時に排他が設定される時間帯については、相関のある他の業務は待機する必要があるものとしている。
 従って、例えば図5の場合、「業務A」という業務については、平均的な処理時間が「0.5秒」であり、「0~0.3秒の間は負荷高騰」し、「0~0.2秒の間は業務Bと排他」が発生し、「業務Bは0~0.2秒の間は要待機」かつ「業務Cは0~0.3秒の間は要待機」であることが示されている。
 またSLA情報管理テーブル45は、予め定められた業務ごとのSLAを管理するために利用されるテーブルであり、図7に示すように、業務名欄45A及びSLA時間欄45Bから構成される。そして業務名欄45Aには、各業務の業務名が格納され、SLA時間欄45Bには、対応する業務についてのSLAにより規定された、業務端末2がリクエストを発行してからその結果が業務端末2に送信されるまでの応答時間の上限が格納されている。従って、図7の場合、「業務A」という業務については、応答時間の上限が「2.0秒」であることが示されている。
 稼働状態情報管理テーブル46は、分析装置5が監視対象システム3の稼働状態収集装置10から収集した稼働状態情報のうち、特に、対応する業務装置11において実行可能な各業務の実行状態を管理するために利用されるテーブルであり、業務装置11ごとに作成される。この稼働状態情報管理テーブル46は、図8に示すように、業務名欄46A及び実行時間欄46Bから構成される。そして業務名欄46Aには、対応する業務装置11上で実行可能な各業務の業務名が格納され、実行時間欄46Bには、対応する業務装置11が対応する業務を実行し始めてからの経過時間が格納される。従って、図8の場合、「業務A」については、現時点(正確には稼働状態収集装置10がその情報を収集した時点)において「開始から0.3秒経過」した状態にあることが示されている。
 スケジュール管理テーブル47は、後述するスケジュール作成処理(図12)の処理の過程において一時的に作成されるテーブルであり、そのとき対象としているサービスを提供する業務装置11ごとに作成される。このスケジュール管理テーブル47は、図9に示すように、業務名欄47A及び待機要否欄47Bから構成される。
 そして業務名欄47Aには、対応する業務装置11で実行可能な各業務の業務名が格納され、待機要否欄47Bには、現時点において対応する業務をその業務装置11で直ちに実行可能であるか否かを表す情報(実行可能である場合には「待機不要」、実行可能でない場合には「要待機」)が格納される。従って、例えば図9の場合には、対応する業務装置11において、「業務A」及び「業務B」については「待機不要」であるものの、「業務C」については「要待機」であることが示されている。
 他方、上述のようなシステム監視機能を実現するための手段として、図3に示すように、業務スケジューリング装置4の主記憶装置31には業務スケジューリング処理部33が格納されると共に、業務スケジューリング装置4の二次記憶装置32にはリクエスト送信先リスト34及び待機時間管理テーブル35が格納されている。
 業務スケジューリング処理部33は、分析装置5からのスケジュール情報に基づいて、必要に応じて指定された時間だけ待機した後に指定された業務装置11にリクエストを送信する機能を有するプログラムである。
 またリクエスト送信先リスト34は、各業務装置11の装置名及びIPアドレス等が格納されたリストである。
 さらに待機時間管理テーブル35は、分析装置5から通知された業務ごとの待機時間を管理するために利用されるテーブルであり、図10に示すように、業務名欄35A及び待機時間欄35Bから構成される。そして業務名欄35Aには、業務スケジューリング装置4がリクエストの転送を要求される各業務の業務名が格納され、待機時間欄35Bには、対応する業務についてのリクエストを転送する際の待機時間が格納される。従って、図10の場合、「業務A」という業務については、「0.1秒」だけ待機した後に分析装置5により指定された業務装置11にリクエストを転送すべきことが示されている。
(3)本システム監視機能に関連する各種処理
(3-1)本システム監視処理の一連の流れ
 図11は、本実施の形態の構成において、情報システム1において実行されるシステム監視処理の流れの一例を示す。この例は、監視対象システム3において、Webサービスプログラム25が実装された業務装置(以下、適宜、これをWebサービス業務装置と呼ぶ)11が、業務端末2からのリクエストを処理するためにアプリケーションプログラム26が実装された業務装置(以下、適宜、これをアプリケーションサービス業務装置と呼ぶ)11に所定の処理を依頼し、アプリケーションサービス業務装置11が、Webサービス業務装置11からの依頼を処理するためにデータベースプログラム27が実装された業務装置(以下、適宜、これをデータベースサービス業務装置と呼ぶ)11に所定の処理を依頼し、データベースサービス業務装置11の処理結果に基づいてアプリケーションサービス業務装置11が処理を実行し、その処理結果をWebサービス業務装置11がリクエストの送信元の業務端末2に送信する場合の処理の流れである。
 このシステム監視処理は、業務端末2が業務リクエストを業務スケジューリング装置4に送信することにより開始される。業務スケジューリング装置4は、かかる業務リクエストを受信すると(SP10)、スケジュール情報リクエストを分析装置5に送信する(SP11)。
 分析装置5は、スケジュール情報リクエストを受信すると、監視対象システム3内の稼働状態収集装置10に対して稼働状態リクエストを送信することにより、各Webサービス業務装置11の稼働状態情報を取得する。また分析装置5は、取得した稼働状態情報と、Webサービス用の業務相関テーブル44とに基づいて、スケジュール情報リクエストにおいて指定された業務についてのスケジュール情報を作成する。そして分析装置5は、作成したスケジュール情報を業務スケジューリング装置4に送信する(SP12)。
 業務スケジューリング装置4は、かかるスケジュール情報を受信すると、スケジュール情報において待機時間が指定されている場合には、その待機時間だけ待機した後に、監視対象システム3内の当該スケジュール情報において指定されたWebサービス業務装置11に対してリクエストを送信する(SP13)。
 かくして、かかるリクエストを受信したWebサービス業務装置11は、業務スケジューリング装置4に対してアプリケーションサービス業務装置11に所定の業務を実行させるべき旨のリクエストを送信する。
 業務スケジューリング装置4は、かかるリクエストを受信すると(SP14)、このリクエストに応じたスケジュール情報リクエストを分析装置5に送信する(SP15)。
 分析装置5は、スケジュール情報リクエストを受信すると、監視対象システム3内の稼働状態収集装置10に対して稼働状態リクエストを送信することにより、各アプリケーションサービス業務装置11の稼働状態情報を取得する。また分析装置5は、取得した稼働状態情報と、アプリケーションサービス用の業務相関テーブル44とに基づいて、スケジュール情報リクエストにおいて指定された業務についてのスケジュール情報を作成する。そして分析装置5は、作成したスケジュール情報を業務スケジューリング装置4に送信する(SP16)。
 業務スケジューリング装置4は、かかるスケジュール情報を受信すると、スケジュール情報において待機時間が指定されている場合には、その待機時間だけ待機した後に、監視対象システム3内の当該スケジュール情報において指定されたアプリケーションサービス業務装置11に対してリクエストを送信する(SP17)。
 かくして、かかるリクエストを受信したアプリケーションサービス業務装置11は、業務スケジューリング装置4に対してデータベースサービス業務装置11に所定の業務を実行させるべき旨のリクエストを送信する。
 業務スケジューリング装置4は、かかるリクエストを受信すると(SP18)、このリクエストに応じたスケジュール情報リクエストを分析装置5に送信する(SP19)。
 分析装置5は、スケジュール情報リクエストを受信すると、監視対象システム3内の稼働状態収集装置10に対して稼働状態リクエストを送信することにより、各データベースサービス業務装置11の稼働状態情報を取得する。また分析装置5は、取得した稼働状態情報と、データベースサービス用の業務相関テーブル44とに基づいて、スケジュール情報リクエストにおいて指定された業務についてのスケジュール情報を作成する。そして分析装置5は、作成したスケジュール情報を業務スケジューリング装置4に送信する(SP20)。
 業務スケジューリング装置4は、かかるスケジュール情報を受信すると、スケジュール情報において待機時間が指定されている場合には、その待機時間だけ待機した後に、監視対象システム3内の当該スケジュール情報において指定されたデータベースサービス業務装置11に対してリクエストを送信する(SP21)。
 かくして、かかるリクエストを受信した業務装置11は、当該リクエストに従って指定された処理を実行し、処理結果をアプリケーションサービス業務装置11に送信する。またアプリケーションサービス業務装置11は、この処理結果に基づいて必要な処理を実行し、その処理結果をWebサービス業務装置11に送信する。そしてWebサービス業務装置11は、アプリケーションサービス業務装置11から送信された所定処理の処理結果をリクエストの送信元の業務端末2に送信する(SP22)。
 そして業務端末2がこの処理結果を受信し(SP23)、これによりこのシステム監視処理が終了する。
(3-2)スケジュール作成処理
 図12は、かかるシステム監視処理のステップSP12、ステップSP16及びステップSP20において分析装置5により実行されるスケジュール作成処理の具体的な処理手順を示す。このスケジュール作成処理は、分析装置5のスケジュール作成処理部43(図4)により実行される。
 実際上、スケジュール作成処理部43は、システム監視処理のステップSP12、ステップSP16又はステップSP20に進むと、この図12に示すスケジュール作成処理を開始し、まず、監視対象システム3の稼働状態収集装置10にアクセスして、監視対象システム3内の対応するサービス(Webサービス、アプリケーションサービス又はデータベースサービス)を提供する各業務装置11の稼働状態情報を取得し、取得した稼働状態情報のうち、業務の実行状態に関する情報を対応する稼働状態情報管理テーブル46にそれぞれ格納する(SP30)。
 続いて、スケジュール作成処理部43は、ステップSP30において取得した対応する各業務装置11の稼働状態情報と、現在対象としているサービス用の業務相関テーブル44とに基づいて、業務装置11のCPU稼働率やメモリの空き容量及び現在業務装置11上で稼働している業務との排他関係の有無などを考慮して、業務スケジューリング装置4からのスケジュール情報リクエストにおいて指定された業務を直ちに実行可能な業務装置11が監視対象システム3内に存在するか否かを判断する(SP31)。
 そしてスケジュール作成処理部43は、この判断で肯定結果を得ると、その業務装置11を、対応する業務を実行すべき業務装置11として指定したスケジュール情報を業務スケジューリング装置4に送信し(SP32)、この後、このスケジュール作成処理を終了してシステム監視処理に戻る。
 これに対してスケジュール作成処理部43は、ステップSP31の判断で否定結果を得ると、SLA情報管理テーブル45(図7)を参照して、SLAが許す範囲で処理を遅らせることにより業務スケジューリング装置4からのスケジュール情報リクエストにおいて指定された業務を実行可能な業務装置11が監視対象システム3内に存在するか否かを判断する(SP33)。
 そしてスケジュール作成処理部43は、この判断で肯定結果を得ると、その業務装置11を、対応する業務を実行すべき業務装置11として指定し、かつ待機時間を指定したスケジュール情報を業務スケジューリング装置4に送信し(SP34)、この後、このスケジュール作成処理を終了してシステム監視処理に戻る。
 これに対してスケジュール作成処理部43は、ステップSP33の判断で否定結果を得ると、スケジュール情報リクエストにおいて指定された業務を現時点において実行可能な業務装置11が存在しない旨のスケジュール情報を業務スケジューリング装置4に送信し(SP35)、この後、このスケジュール処理を終了してシステム監視処理に戻る。
(3-3)業務スケジューリング処理
 他方、図13は、システム監視処理のステップSP13、ステップSP17及びステップSP21において業務スケジューリング装置4により実行される業務スケジューリング処理の具体的な処理手順を示す。この業務スケジューリング処理は、業務スケジューリング装置4の業務スケジューリング処理部33(図3)により実行される。
 実際上、業務スケジューリング処理部33は、分析装置5からのスケジュール情報を受信すると、この業務スケジューリング処理を開始し、まず、受信したスケジュール情報に基づいて、業務端末2又は業務装置11からリクエストされた業務を直ちに実行可能な業務装置11が指定されているか否かを判断する(SP40)。
 業務スケジューリング処理部33は、この判断で肯定結果を得ると、スケジュール情報において指定された業務装置11に対して業務端末2又は業務装置11からのリクエストを送信し(SP41)、この後、この業務スケジューリング処理を終了してシステム監視処理に戻る。
 これに対して、業務スケジューリング処理部33は、ステップSP40の判断で否定結果を得ると、かかるスケジュール情報において待機時間が指定されているか否かを判断する(SP42)。そして業務スケジューリング処理部33は、この判断で肯定結果を得ると、スケジュール情報において指定された時間だけ待機した後に、業務端末2又は業務装置11からのリクエストを当該スケジュール情報において指定された業務装置11に送信する(SP43)。そして業務スケジューリング処理部33は、この後、この業務スケジューリング処理を終了してシステム監視処理に戻る。
 これに対して、業務スケジューリング処理部33は、ステップSP42の判断で否定結果を得ると(つまり受信したスケジュール情報が実行可能な業務装置11が存在しない旨の内容であった場合には)、業務がビジーであることを業務端末2に通知し(SP44)、この後、この業務スケジューリング処理を終了する。なお、このステップSP44を経て業務スケジューリング処理を終了した場合には、システム監視処理も終了する。
(4)本実施の形態の効果
 以上のように本実施の形態の情報システム1では、現在の監視対象システム3内の各業務装置11の稼働状態と、業務間の排他関係及び業務ごとの負荷傾向とに基づいて、業務端末2等からリクエストされた業務を実行すべき業務装置11を決定し、その業務装置11にその業務の実行を依頼する。従って、本情報システム1によれば、デッドロックや排他待ち発生を削減し、業務遅延の発生を削減することができる。
(5)他の実施の形態
 なお上述の実施の形態においては、本発明を図1のように構成された情報システム1に適用する場合について述べたが、本発明はこれに限らず、この他種々の構成の情報システムに広く適用することができる。
 また上述の実施の形態においては、業務スケジューリング装置4及び分析装置5を別個の装置として構成するようにした場合について述べたが、本発明はこれに限らず、これら、業務スケジューリング装置4及び分析装置5の機能を1つの装置に搭載するようにしても良い。
 本発明は、排他関係を有する複数の業務を実行可能な1又は複数の業務装置と、前記業務装置に前記業務の実行を依頼する業務端末とを有する情報システムに適用することができる。
 1…情報システム、2…業務端末、3…監視対象システム、4…業務スケジューリング装置、5…分析装置、10…稼働状態収集装置、11…業務装置、20,23,30,40…CPU、25…Webサービスプログラム、26…アプリケーションサービスプログラム、27…データベースサービスプログラム、33…業務スケジューリング処理部、35…待機時間管理テーブル、43…スケジュール作成処理部、44……業務相関管理テーブル、45…SLA情報管理テーブル、46…稼働状態情報管理テーブル、47…スケジュール管理テーブル。

Claims (11)

  1.  排他関係を有する複数の業務を実行可能な1又は複数の業務装置と、前記業務装置に前記業務の実行を依頼する業務端末とを有する情報システムを監視する監視方法において、
     前記情報システムは、
     前記業務端末から送信される業務実行のリクエストを受信する業務スケジューリング装置と、
     前記業務間の排他関係及び前記業務ごとの負荷傾向に関する第1の情報を保持する分析装置と
     を有し、
     前記業務スケジューリング装置が、前記業務端末からの前記リクエストを転送すべき前記業務装置を前記分析装置に問い合わせる第1のステップと、
     前記分析装置が、前記監視対象システムの前記稼働状態収集装置から前記業務装置の稼働状態に関する第2の情報を取得し、取得した前記第2の情報と、保持している前記第1の情報とに基づいて、前記リクエストを転送すべき前記業務装置と、必要に応じて前記リクエストを転送する際の待機時間とを前記業務スケジューリング装置に通知する第2のステップと、
     前記業務スケジューリング装置が、前記分析装置からの通知に基づいて、前記待機時間が指定されている場合には指定された当該待機時間だけ待機した後に、指定された前記業務装置に対して前記リクエストを転送する第3のステップと
     を備えることを特徴とする監視方法。
  2.  前記第2のステップにおいて、前記分析装置は、
     前記第1及び第2の情報に基づいて、前記業務端末からの前記リクエストにおいて指定された前記業務を直ちに実行可能な前記業務装置が存在するか否かを判定し、
     当該業務を直ちに実行可能な前記業務装置が存在する場合には、前記リクエストの転送先として当該業務装置を前記業務スケジューリング装置に通知し、当該業務を直ちに実行可能な前記業務装置が存在しない場合には、前記リクエストに対する応答時間が予め定められた上限を超えない範囲で待機することにより当該業務を実行可能な前記業務装置が存在するか否かを判定し、
     当該応答時間の上限を超えない範囲で待機することにより当該業務を実行可能な前記業務装置が存在する場合には、前記リクエストの転送先として当該業務装置及び待機時間を前記業務スケジューリング装置に通知する
     ことを特徴とする請求項1に記載の監視方法。
  3.  前記第2のステップにおいて、前記分析装置は、
     前記リクエストに対する応答時間が予め定められた上限を超えない範囲で待機することにより当該業務を実行可能な前記業務装置が存在しない場合には、前記リクエストされた前記業務を実行可能な前記業務装置が現時点において存在しないことを前記業務スケジューリング装置に通知し、
     前記第3のステップにおいて、前記業務スケジューリング装置は、
     前記リクエストされた前記業務を実行可能な前記業務装置が現時点において存在しないことを前記分析装置から通知された場合には、前記業務装置に前記リクエストを転送することなく、前記リクエストされた前記業務を実行可能な前記業務装置が現時点において存在しないことを前記業務端末に通知する
     ことを特徴とする請求項2に記載の監視方法。
  4.  前記リクエストに対する前記応答時間の上限は、SLA(Service Level Agreement)により規定された時間である
     ことを特徴とする請求項2に記載の監視方法。
  5.  前記情報システムは、複数の前記業務装置を有し、
     前記業務スケジューリング装置からの前記リクエストを受信した前記業務装置が、当該リクエストにおいて指定された前記業務を実行するために他の前記業務装置が実行すべき業務の実行のリクエストを前記業務スケジューリング装置に送信する第4のステップと、
     前記業務スケジューリング装置が、当該リクエストを転送すべき前記業務装置を前記分析装置に問い合わせる第5のステップと、
     前記分析装置が、前記監視対象システムの前記稼働状態収集装置から対応する前記業務装置の稼働状態に関する前記第2の情報を取得し、取得した前記第2の情報と、保持している前記第1の情報とに基づいて、前記リクエストを転送すべき前記業務装置と、必要に応じて前記リクエストを転送する際の待機時間とを前記業務スケジューリング装置に通知する第6のステップと、
     前記業務スケジューリング装置が、前記分析装置からの通知に基づいて、前記待機時間が指定されている場合には指定された当該待機時間だけ待機した後に、指定された前記業務装置に対して前記リクエストを送信する第7のステップと
     を備えることを特徴とする請求項1に記載の監視方法。
  6.  必要に応じて前記ステップSP4乃至ステップSP7の処理を繰り返す
     ことを特徴とする請求項5に記載の監視方法。
  7.  排他関係を有する複数の業務を実行可能な1又は複数の業務装置と、前記業務装置に前記業務の実行を依頼する業務端末とを有する情報システムを監視する監視システムにおいて、
     前記業務端末から送信される業務実行のリクエストを受信する業務スケジューリング装置と、
     前記業務間の排他関係及び前記業務ごとの負荷傾向に関する第1の情報を保持する分析装置と
     を備え、
     前記業務スケジューリング装置は、前記業務端末からの前記リクエストを転送すべき前記業務装置を前記分析装置に問い合わせ、
     前記分析装置は、前記監視対象システムの前記稼働状態収集装置から前記業務装置の稼働状態に関する第2の情報を取得し、取得した前記第2の情報と、保持している前記第1の情報とに基づいて、前記リクエストを転送すべき前記業務装置と、必要に応じて前記リクエストを転送する際の待機時間とを前記業務スケジューリング装置に通知し、
     前記業務スケジューリング装置は、前記分析装置からの通知に基づいて、前記待機時間が指定されている場合には指定された当該待機時間だけ待機した後に、指定された前記業務装置に対して前記リクエストを転送する
     ことを特徴とする監視システム。
  8.  前記分析装置は、
     前記第1及び第2の情報に基づいて、前記業務端末からの前記リクエストにおいて指定された前記業務を直ちに実行可能な前記業務装置が存在するか否かを判定し、
     当該業務を直ちに実行可能な前記業務装置が存在する場合には、前記リクエストの転送先として当該業務装置を前記業務スケジューリング装置に通知し、当該業務を直ちに実行可能な前記業務装置が存在しない場合には、前記リクエストに対する応答時間が予め定められた上限を超えない範囲で待機することにより当該業務を実行可能な前記業務装置が存在するか否かを判定し、
     当該応答時間の上限を超えない範囲で待機することにより当該業務を実行可能な前記業務装置が存在する場合には、前記リクエストの転送先として当該業務装置及び待機時間を前記業務スケジューリング装置に通知する
     ことを特徴とする請求項7に記載の監視システム。
  9.  前記分析装置は、
     前記リクエストに対する応答時間が予め定められた上限を超えない範囲で待機することにより当該業務を実行可能な前記業務装置が存在しない場合には、前記リクエストされた前記業務を実行可能な前記業務装置が現時点において存在しないことを前記業務スケジューリング装置に通知し、
     前記業務スケジューリング装置は、
     前記リクエストされた前記業務を実行可能な前記業務装置が現時点において存在しないことを前記分析装置から通知された場合には、前記業務装置に前記リクエストを転送することなく、前記リクエストされた前記業務を実行可能な前記業務装置が現時点において存在しないことを前記業務端末に通知する
     ことを特徴とする請求項8に記載の監視システム。
  10.  前記リクエストに対する前記応答時間の上限は、SLA(Service Level Agreement)により規定された時間である
     ことを特徴とする請求項8に記載の監視システム。
  11.  前記情報システムは、複数の前記業務装置を有し、
     前記業務スケジューリング装置からの前記リクエストを受信した前記業務装置は、当該リクエストにおいて指定された前記業務を実行するために他の前記業務装置が実行すべき業務の実行のリクエストを前記業務スケジューリング装置に送信し、
     前記業務スケジューリング装置は、当該リクエストを転送すべき前記業務装置を前記分析装置に問い合わせ、
     前記分析装置は、前記監視対象システムの前記稼働状態収集装置から対応する前記業務装置の稼働状態に関する前記第2の情報を取得し、取得した前記第2の情報と、保持している前記第1の情報とに基づいて、前記リクエストを転送すべき前記業務装置と、必要に応じて前記リクエストを転送する際の待機時間とを前記業務スケジューリング装置に通知し、
     前記業務スケジューリング装置は、前記分析装置からの通知に基づいて、前記待機時間が指定されている場合には指定された当該待機時間だけ待機した後に、指定された前記業務装置に対して前記リクエストを送信する
     を備えることを特徴とする請求項7に記載の監視システム。
PCT/JP2013/084584 2013-12-25 2013-12-25 監視方法及び監視システム WO2015097772A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2013/084584 WO2015097772A1 (ja) 2013-12-25 2013-12-25 監視方法及び監視システム
US14/771,344 US20160006635A1 (en) 2013-12-25 2013-12-25 Monitoring method and monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/084584 WO2015097772A1 (ja) 2013-12-25 2013-12-25 監視方法及び監視システム

Publications (1)

Publication Number Publication Date
WO2015097772A1 true WO2015097772A1 (ja) 2015-07-02

Family

ID=53477714

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/084584 WO2015097772A1 (ja) 2013-12-25 2013-12-25 監視方法及び監視システム

Country Status (2)

Country Link
US (1) US20160006635A1 (ja)
WO (1) WO2015097772A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10698751B2 (en) * 2014-11-04 2020-06-30 Micro Focus Llc Web services generation based on client-side code
CN111125234B (zh) * 2019-11-29 2022-04-19 广东电网有限责任公司 一种基于调度运行早汇报系统的信息监测装置
CN112988361B (zh) * 2021-05-13 2021-08-20 中诚华隆计算机技术有限公司 集群任务分配方法、装置和计算机可读介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0462640A (ja) * 1990-06-29 1992-02-27 Casio Comput Co Ltd データ処理装置
JP2007156976A (ja) * 2005-12-07 2007-06-21 Hitachi Kokusai Electric Inc 情報処理システム
JP2010238051A (ja) * 2009-03-31 2010-10-21 Fujitsu Ltd 負荷分散プログラム及び負荷分散装置
JP2011113290A (ja) * 2009-11-26 2011-06-09 Nec Corp ジョブフロー管理装置、管理方法および管理プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0462640A (ja) * 1990-06-29 1992-02-27 Casio Comput Co Ltd データ処理装置
JP2007156976A (ja) * 2005-12-07 2007-06-21 Hitachi Kokusai Electric Inc 情報処理システム
JP2010238051A (ja) * 2009-03-31 2010-10-21 Fujitsu Ltd 負荷分散プログラム及び負荷分散装置
JP2011113290A (ja) * 2009-11-26 2011-06-09 Nec Corp ジョブフロー管理装置、管理方法および管理プログラム

Also Published As

Publication number Publication date
US20160006635A1 (en) 2016-01-07

Similar Documents

Publication Publication Date Title
US10691716B2 (en) Dynamic partitioning techniques for data streams
US10733010B2 (en) Methods and systems that verify endpoints and external tasks in release-pipeline prior to execution
US9794135B2 (en) Managed service for acquisition, storage and consumption of large-scale data streams
US20180189367A1 (en) Data stream ingestion and persistence techniques
AU2014346366B2 (en) Partition-based data stream processing framework
US7793308B2 (en) Setting operation based resource utilization thresholds for resource use by a process
US20110196957A1 (en) Real-Time Policy Visualization by Configuration Item to Demonstrate Real-Time and Historical Interaction of Policies
US8214843B2 (en) Framework for distribution of computer workloads based on real-time energy costs
US9223632B2 (en) Cross-cloud management and troubleshooting
AU2018202230A1 (en) Client-configurable security options for data streams
US9104572B1 (en) Automated root cause analysis
US9959047B2 (en) Capacity forecasting based on capacity policies and transactions
US20120072575A1 (en) Methods and computer program products for aggregating network application performance metrics by process pool
JP7175731B2 (ja) ストレージ管理装置、方法およびプログラム
US20150134799A1 (en) Path selection for network service requests
WO2015097772A1 (ja) 監視方法及び監視システム
CN106021544B (zh) 数据库分布式连接池管理方法和系统
Deelman et al. What makes workflows work in an opportunistic environment?
US9772877B2 (en) Managing I/O operations in a shared file system
CN105933368A (zh) 一种用户行为数据上载方法及装置
JP2011243089A (ja) 計算機の流量制御方法、流量制御装置および流量制御プログラム
Liu et al. Moving huge scientific datasets over the Internet
CN114064246A (zh) 一种用于执行调度的方法和装置
US10262065B2 (en) Hybrid task assignment
CN110825604A (zh) 一种应用的用户轨迹和性能监控方法、装置、设备及介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13900447

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14771344

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13900447

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP