WO2018011985A1 - 管理システム及びプラットフォーム構築支援方法 - Google Patents

管理システム及びプラットフォーム構築支援方法 Download PDF

Info

Publication number
WO2018011985A1
WO2018011985A1 PCT/JP2016/071023 JP2016071023W WO2018011985A1 WO 2018011985 A1 WO2018011985 A1 WO 2018011985A1 JP 2016071023 W JP2016071023 W JP 2016071023W WO 2018011985 A1 WO2018011985 A1 WO 2018011985A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
program
analysis
programs
template
Prior art date
Application number
PCT/JP2016/071023
Other languages
English (en)
French (fr)
Inventor
谷川 桂子
永見 明久
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2016/071023 priority Critical patent/WO2018011985A1/ja
Publication of WO2018011985A1 publication Critical patent/WO2018011985A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]

Definitions

  • the present invention generally relates to the construction of a platform (environment) of a computer system.
  • IoT Internet of Things
  • IT Informational Technology
  • OT Operaational Technology
  • RDB Relational Database
  • mission-critical systems have also started providing mass data analysis integrated systems that analyze both mission-critical data and IoT data, and OSS for IoT data analysis. Is actively utilized.
  • the IoT system handles a wide variety of data such as sensor data, documents, images, and voices, and can handle a large amount of data as an analysis target, combined with a backbone system that handles only predesigned data. Therefore, improvement in analysis accuracy can be expected by incorporating various viewpoints.
  • Patent Document 1 discloses an ETL package that defines an ETL workflow (processing procedure template and data parameters).
  • the most time-consuming processing is generally data preparation.
  • the time required for data preparation may occupy about 80% of the total processing time (whole life cycle).
  • H / W Hardware
  • VM Virtual Machine
  • VM configuration information specification VM configuration information specification
  • Complicated work such as installation of analysis M / W (Middleware) and acquisition of analysis target data from a data source is required.
  • the management system accepts an analysis platform construction request associated with user input information.
  • the input information represents a selected analysis template (analysis flow template selected by the user) among a plurality of analysis flow templates and one or more data sources associated with the selected analysis template.
  • Two or more programs that are components of the analysis platform to be constructed are associated with the input information.
  • the management system inputs the data input into the data input template that is the association information for the data input program for each of the one or more data input programs of the two or more programs.
  • the identification information of the virtual machine that is the deployment destination of the data storage program of the data transfer destination corresponding to the program is associated.
  • the management system deploys each of the two or more programs to a virtual machine to which the program is deployed.
  • the information included in the data input template corresponding to the data input program is associated with the deployed data input program.
  • the “user” is typically an analysis user described later, but may be a user other than the analysis user.
  • the structure of the whole system which concerns on an Example is shown.
  • 1 shows a configuration of a deployment management server 1.
  • the structure of the server 2 is shown.
  • the configuration of the VM management server 4 is shown.
  • the configuration of the client 5 is shown.
  • the structure of the analysis flow template management table 124 is shown.
  • 2 shows a configuration of a DI (Data Input) template management table 125.
  • the structure of a BI (Business Intelligence) template management table 123 is shown.
  • the structure of the H / W setting management table 121 is shown.
  • the structure of the VM management table 122 is shown.
  • the structure of the user management table 126 is shown.
  • the structure of the conversion table 127 is shown.
  • An example of an analysis flow template is shown.
  • the flow of analysis platform construction processing is shown.
  • 12 is a flowchart of a first example of redeployment processing 1513.
  • 12 is a flowchart of a second example of redeployment processing 1513.
  • An example of a main screen is shown.
  • An example of an analysis flow template selection screen is shown.
  • An example of an M / W selection screen is shown.
  • An example of a H / W performance selection screen is shown.
  • An example of a data source selection screen is shown. The flow of the whole process including the analysis platform construction process which concerns on one comparative example is shown.
  • the information may be described using expressions such as a table or a list.
  • the data structure of the information is not limited, and other data structures may be used. Since the information does not depend on the data structure, for example, “kkk table” or “kkk list” can be called “kkk information”.
  • Information such as a table or a list may be divided into two or more information elements, or all or part of two or more types of information may be aggregated into the same information.
  • the “interface unit” includes one or more interfaces.
  • the one or more interfaces may be one or more similar interface devices (for example, one or more NIC (Network Interface Card)) or two or more different types of interface devices (for example, NIC and HBA (Host Bus Adapter)). There may be.
  • NIC Network Interface Card
  • HBA Home Bus Adapter
  • the “storage unit” includes one or more memories.
  • the at least one memory may be a volatile memory or a non-volatile memory.
  • the storage unit may include one or more PDEVs in addition to one or more memories.
  • PDEV means a physical storage device and may typically be a non-volatile storage device (eg, an auxiliary storage device).
  • the PDEV may be, for example, an HDD (Hard Disk Drive) or an SSD (Solid State Drive).
  • the “processor unit” includes one or more processors.
  • the at least one processor is typically a CPU (Central Processing Unit).
  • the processor may include a hardware circuit that performs part or all of the processing.
  • time such as date and time may be expressed as year / month / day / hour / minute / second or a part thereof.
  • the “management system” may be composed of one or more computers.
  • the management computer when the management computer has a display device and the management computer displays information on its own display device, the management computer may be a management system.
  • a management computer for example, a server
  • transmits display information to a remote display computer for example, a client
  • the display computer displays the information (when the management computer displays information on the display computer)
  • a system including at least the management computer among the management computer and the display computer may be a management system.
  • the management system may include an interface unit, a storage unit, and a processor unit connected to them.
  • the interface unit may include at least one of a user interface unit and a communication interface unit.
  • the user interface unit includes at least one I / O device of one or more I / O devices (for example, an input device (for example, a keyboard and a pointing device), an output device (for example, a display device)), and a display computer.
  • the communication interface unit may include one or more communication interface devices. That the computer in the management system “displays the display information” may be that the display information is displayed on the display device of the computer, or that the computer transmits the display information to the display computer. (In the latter case, display information is displayed by a display computer).
  • the management system is at least a deployment management server among a deployment management server and a VM (Virtual Machine) management server. The deployment management server and the VM management server may be integrated.
  • the processor unit executes a program and performs processing using at least one of a storage unit (for example, a memory) and an interface unit (for example, a communication port).
  • a storage unit for example, a memory
  • an interface unit for example, a communication port
  • the subject of processing may be mainly a program, but a processor unit that executes the program may be the subject.
  • the processing mainly performed by the processor unit is performed by executing one or more programs.
  • the program may be installed in the computer from a program source.
  • the program source may be, for example, a storage medium that can be read by a program distribution server or a computer.
  • two or more programs may be realized as one program, or one program may be realized as two or more programs.
  • the “storage device” includes one or more storage devices and a controller that controls the one or more storage devices.
  • the controller provides a logical volume to the server based on one or more storage devices.
  • the logical volume may be a real logical volume or a virtual logical volume.
  • the storage device may be a physical storage device or a virtual storage device.
  • the physical storage device is an HDD (Hard Disk Drive) or SSD (Solid State Drive) drive.
  • a plurality of storage devices may constitute one or more RAID groups (Redundant Array of Independent (or Inexpensive) Disks).
  • the RAID group may be referred to as a parity group.
  • the virtual logical volume may be, for example, an externally connected logical volume, a TP (Thin Provisioning) -logical volume, and a snapshot logical volume.
  • the externally connected logical volume is based on a storage resource (for example, a logical volume) of an external storage system connected to the storage system, and is a logical volume according to the storage virtualization technology.
  • the TP-logical volume is a logical volume according to capacity virtualization technology (typically ThinThProvisioning).
  • the snapshot logical volume is a logical volume provided as a snapshot of the original logical volume.
  • the storage system may be composed of one or more storage devices.
  • a reference code or a common code among the reference codes is used, and when a description is given by distinguishing the same type of element, the element is assigned to that element. May use an identified identifier (eg, at least one of a number and a sign) or an entire reference sign.
  • analysis platform means an environment in which an analysis process is executed in response to an analysis request and an analysis result is returned.
  • the analysis platform may be referred to as an “analysis environment”.
  • the analysis platform includes one or more computer programs and data to be analyzed associated with at least one of the one or more computer programs (or a data store (for example, DWH (Data (Ware House) or DM (Data Mart)).
  • DWH Data (Ware House) or DM (Data Mart)
  • M / W is a computer program that can be at least one of one or more computer programs included in the analysis platform, and is positioned under the BI tool described later. Means a computer program.
  • H / W is a physical resource that can be allocated to a VM (Virtual Machine) (in other words, a physical resource that is a base of a virtual resource that is an element of the VM).
  • H / W is in the computer system.
  • the “computer system” is a plurality of servers and one storage device. However, the computer system is an environment in which a VM can be created, started (executed), terminated, and deleted, and at least It may be a system including one server or at least one storage device.
  • DI tool is an example of a data input tool, and is a program (for example, M / W) that acquires data from a data source and outputs the data to the output side.
  • the DI (Data Input) tool can convert the data format if necessary.
  • the DI tool is, for example, an ETL (Extract / Transform / Load) tool.
  • the DI tool can be a component of the analysis platform.
  • BI tool is an example of an analysis tool, and is a program (for example, an application program) that receives an analysis request and processes the request.
  • the BI (Business Intelligence) tool is positioned above the M / W and can be a component of the analysis platform.
  • the BI tool accepts an analysis request from the analysis user's computer (client).
  • DBMS Database Management System
  • DBMS Database Management System
  • M / W data storage program
  • the DBMS can be a component of the analysis platform.
  • DBMS is adopted for convenience.
  • data accessed by at least one of the data acquisition program and the data storage program is structured like RDB (Relational Database). Not only data but also unstructured data such as files and object data may be used.
  • data source is a source of data including analysis target data.
  • Data corresponding to conditions as an analysis viewpoint is acquired from the data source as analysis target data.
  • the acquired data is stored in a data store such as DWH or DM.
  • data to be analyzed in the data store is referred to.
  • the data source may be DWH and the data store may be DM. Further, at least one of the data source and the data store may be the logical volume described above.
  • deployment means issuing a request for the deployment target to be placed in the proment destination.
  • deployment target is a program as a component of the analysis platform
  • deployment refers to a request associated with an execution file of the program (for example, a file with a file identifier “.exe”) as a VM.
  • execution file for example, a file with a file identifier “.exe”
  • VM file identifier
  • FIG. 1 shows the configuration of the entire system according to an embodiment of the present invention.
  • a deployment management server 1 a computer system (a plurality of servers 2-1 to 2-n and a storage device 3), a VM management server 4 and a client 5. There may be a plurality of storage apparatuses 3 and clients 5. There may be one server 2.
  • the client 5 is an example of an analysis user computer. At least the deployment management server 1 of the servers 1, 2, and 4 receives from the client 5 information input from the analysis user or a request associated with the information.
  • NW6 may be Ethernet (registered trademark)
  • NW7 may be Fiber Channel (FC), Ethernet (registered trademark), or PCI Express (PCIe) (registered trademark).
  • the NWs 6 and 7 may be the same type of network or a single network.
  • Each of the servers 2-1 to 2-n receives a VM generation request from the VM management server 4, and generates a VM in response to the request.
  • the VM is executed.
  • VM migration may be performed between the servers 2.
  • H / W in the server 2 is associated with the VM.
  • a virtual resource based on H / W in the server 2 is associated as a VM resource.
  • the deployment management server 1 manages resources (for example, H / W (physical resources) and virtual resources) of the computer system (servers 2-1 to 2-n and the storage device 3). Further, the deployment management server 1 performs deployment management of the analysis platform (analysis environment) in accordance with a request from the client 5. That is, the deployment management server 1 supports the analysis platform construction process. At least part of the processing performed by the deployment management server 1 is processing included in the analysis platform construction support processing.
  • the VM management server 4 receives a VM deployment request from the deployment management server 1, and transmits a VM creation request to at least one of the servers 2-1 to 2-n according to the request. In the server 2 that has received the request, a VM is generated in response to the request. As a result, the VM is deployed on the server 2.
  • the VM management server 4 manages VMs that are deployed in this manner and that operate the analysis platform.
  • the storage device 3 stores analysis target data, VM images (image data), and M / W. There are at least a plurality of M / Ws among VM images and M / Ws.
  • the plurality of VM images may include a plurality of types of VM images or a plurality of versions of VM images.
  • each server 2 can execute one or more types of VMs.
  • a plurality of M / Ws may include a plurality of types of M / Ws or a plurality of versions of M / Ws.
  • the plurality of M / Ws include at least a plurality of types of M / Ws.
  • one storage device 3 is shared by a plurality of servers 2, but the number and configuration of the servers 2 and the storage devices 3 are not limited to this mode.
  • FIG. 2 shows the configuration of the deployment management server 1.
  • the deployment management server 1 includes an interface unit, a storage unit, and a processor unit connected to them.
  • the deployment management server 1 includes a memory 10, a CPU 11 that executes a program stored in the memory 10, a storage device (HDD or SSD) 12, an input device 13 such as a keyboard and a mouse, , An output device 14 such as a display device, and a network interface 15. These components are connected via an internal bus 16.
  • At least one of the memory 10 and the storage device 12 is an example of a storage unit.
  • the network interface 15 is an example of an interface unit.
  • the CPU 11 is an example of a processor unit.
  • the network interface 15 is, for example, a LAN (Local Area Network) interface, an HBA (Host Bus Adapter), or the like.
  • the memory 10 stores an OS 100, a management program 110, and a table group 120.
  • the table group 120 includes, for example, an H / W setting management table 121, a VM management table 122, a BI template management table 123, an analysis flow template management table 124, a DI template management table 125, a user management table 126, and a conversion table 127. .
  • the configuration of each table will be described later.
  • the management program 110 includes a plurality of modules such as an H / W management program 111, an M / W management program 112, a data management program 113, an analysis flow template management program 114, a DI management program 115, a deployment management program 116, and an API ( Application Programming Interface) 117. At least one of the plurality of modules may exist as an independent program instead of a module in one program.
  • the H / W management program 111 is a program for managing H / W configuration information of the computer system (server 2, storage device 3).
  • the H / W management program 111 manages the H / W setting management table 121.
  • the M / W management program 112 manages M / W that can be provided as at least a part of the analysis platform, such as a DBMS, a data storage program, a BI tool, and the like.
  • the data management program 113 manages the data source. There are one or more data sources.
  • the analysis flow template management program 114 manages the analysis flow template management table 124. There are one or more, typically a plurality of analysis flow templates.
  • the analysis flow template management program 114 may create at least one analysis flow template. That is, the analysis flow template management program 114 may pre-template analysis flows that are constructed relatively frequently.
  • FIG. 13 shows an example of an analysis flow template.
  • the analysis flow template 1300 shows an analysis flow related to SCM (Supply Chain Management).
  • the analysis flow represented by the analysis flow template 1300 is a flow in which the following four processes are arranged in the order of (F1), (F2), (F3), and (F4).
  • the DI tool 1303 collects data from each of the plurality of data sources 1304 and 1305.
  • the DI tool 1303 transfers the collected data to the DBMS 1302 (converts the data format if necessary)
  • the DBMS 1302 stores the transferred data.
  • the BI tool 1301 accesses data stored by the DBMS 1302. It is.
  • the analysis flow template may be edited or created by the client 5 (analysis user), and information on the analysis flow template after editing or after creation may be registered in the analysis flow template management table 124.
  • the analysis flow template is a template of a typical analysis flow based on, for example, the type of business, analysis frequency, characteristics of analysis target data, and the like.
  • the DI management program 115 includes the M / W associated with the data source, the identifier of the VM on which the M / W operates, the deployment target M / W, and the VM on which the deployment target M / W operates. It manages the association between an identifier and a data format conversion tool (for example, a DI tool). That is, the DI management program 115 manages the DI template management template 125.
  • a data format conversion tool for example, a DI tool
  • the deployment management program 116 follows the analysis platform construction request from the client 5, the H / W setting management table 121, the VM management table 122, the BI template management table 123, the analysis flow template management table 124, the DI management template 125, and the conversion table 127 is a program that uses 127 to prepare an analysis platform or link a data source and a conversion tool.
  • API 117 is an interface that accepts an analysis platform construction request from the client 5.
  • FIG. 2 shows the configuration of the server 2.
  • the VM management server 4 includes a memory 20, a CPU 21 that executes a program stored in the memory 20, a storage device 22, an input device 23 such as a keyboard and a mouse, an output device 24 such as a display device, and a network interface. 25. These elements are connected via an internal bus 26.
  • the network interface 25 is, for example, a LAN interface or an HBA.
  • the memory 20 stores the OS 200 and the hypervisor 201.
  • the hypervisor 201 controls creation, activation (execution), and deletion of the VM 202.
  • FIG. 3 illustrates a plurality of VMs 202-1 to 202-n.
  • the hypervisor 201 generates a VM 202 in response to a VM generation request from the VM management server 4.
  • An M / W is deployed by the deployment management server 1 to the generated VM 202, and the deployed M / W operates on the VM 202.
  • FIG. 4 shows the configuration of the VM management server 4.
  • the VM management server 4 includes a memory 40, a CPU 41 that executes a program stored in the memory 40, a storage device 42, an input device 43 such as a keyboard and a mouse, an output device 44 such as a display device, and a network interface. 45. These elements are connected via an internal bus 46.
  • the network interface 45 is, for example, a LAN interface.
  • the memory 40 stores a VM deployment management table 404 and a resource management table 405.
  • the memory 40 also stores an OS 400, a resource management program 401, a VM management program 402, and a user management program 403.
  • the resource management table 405 holds information about resources (for example, H / W and virtual resources) of the computer system (server 2 and storage device 3). For example, the resource management table 405 holds information about the resources of the server 2 (for example, resource type and resource amount) for each server 2. Further, for example, the resource management table 405 holds information (for example, resource type and resource amount) regarding the resources of the storage apparatus 3. Further, for example, the resource management table 405 holds information (for example, resource type and resource amount) regarding resources allocated to the VM for each VM 202.
  • the VM deployment management table 404 holds information representing the relationship between the VM 202 and the server 2.
  • the VM deployment management table 404 holds, for each VM 202, an identifier of the VM 202 (for example, a VM address such as an IP address) and an identifier of the server 2 on which the VM 202 operates.
  • the resource management program 401 uses the resource management table 405 to monitor H / W (for example, CPU, memory, network bandwidth) used by the VM 202. Based on the monitoring result, the resource management program 401 uses the resource usage rate (for example, CPU, memory and storage usage rate) for the VM 202, the network bandwidth usage rate, the CPU usage rate of each service, and the power supply You can manage at least one of them.
  • H / W for example, CPU, memory, network bandwidth
  • the resource management program 401 uses the resource usage rate (for example, CPU, memory and storage usage rate) for the VM 202, the network bandwidth usage rate, the CPU usage rate of each service, and the power supply You can manage at least one of them.
  • the VM management program 402 uses the VM deployment management table 404 to manage VM creation, activation, termination, addition, deletion, and the like.
  • the user management program 403 manages the generation, registration, deletion, and the like of user information for performing operation management for the VM 202.
  • the VM management server 4 loads a VM image from the storage device 3 to the VM management server 4 in response to a request specifying at least one of VM creation, deletion, information collection, etc. from the deployment management server 1 and A deployment that generates a VM 202 according to a VM image and requests VM identification information (for example, information including at least one of an identifier and an address (for example, an IP address) of the VM) assigned to the generated VM.
  • VM identification information for example, information including at least one of an identifier and an address (for example, an IP address) of the VM
  • FIG. 5 shows the configuration of the client 5.
  • the client 5 includes a memory 50, a CPU 51 that executes a program stored in the memory 50, a storage device 52, an input device 53 such as a keyboard and a mouse, an output device 54 such as a display device, and a network interface 55. Have. These elements are connected via an internal bus 56.
  • the network interface 55 is, for example, a LAN interface.
  • the memory 50 stores an OS 500, an analysis platform deployment application 501 that provides a Web GUI, and an analysis application 502.
  • the analysis platform deployment application 501 may be a Web browser or a program for inputting / outputting information to / from the analysis user via the Web browser.
  • the analysis platform deployment application 501 transmits an analysis platform construction request to the deployment management server 1.
  • the analysis application 502 transmits an analysis request for operating the analysis logic to the analysis platform constructed by the deployment management server 1.
  • the analysis request is accepted by the BI tool in the analysis platform.
  • At least one of the servers 1, 2, and 4 may not have at least one of an input device and an output device. This is because in this embodiment, the client 5 has an input device and an output device as a user interface of the analysis user.
  • FIG. 6 to 12 show the configuration of tables managed by the deployment management server 1.
  • FIG. 6 to 12 show the configuration of tables managed by the deployment management server 1.
  • FIG. 6 shows the analysis flow template management table 124.
  • the analysis flow template management table 124 holds analysis flow template information. Specifically, the analysis flow template management table 124 holds a template identifier 61, a DI tool identifier 62, a DBMS identifier 63, and a BI tool identifier 64 for each analysis flow template.
  • the template identifier 61 is an identifier of the analysis flow template.
  • the DI tool identifier 62 is an identifier of the DI tool.
  • the DBMS identifier 63 is a DBMS identifier.
  • the BI tool identifier 64 is an identifier of the BI tool.
  • the analysis flow is composed of a DI tool, a DBMS, and a BI tool, and the order of the analysis flow is also the DI tool processing, the DBMS processing, and the BI tool.
  • the order of tool processing is as follows.
  • the difference in the analysis flow template is at least one of the difference between the program adopted as the DI tool, the program adopted as the DBMS, and the program adopted as the BI tool. is there.
  • the analysis flow template may differ depending on other viewpoints such as the execution order of programs, and the configuration of the analysis flow template management table 124 may not be a simple configuration as shown in FIG. .
  • the analysis flow template management table 124 can be configured according to an analysis flow template configuration that can be employed.
  • FIG. 7 shows the configuration of the DI template management table 125.
  • the DI template management table 125 manages data source, input source, output destination, and DI tool association. Such association is referred to as “DI template” in the description of the present embodiment.
  • the DI template management table 125 holds a data source identifier 71, input management information 72, output management information 73, and a DI tool identifier 74 for each DI template.
  • the data source identifier 71 is an identifier of the data source.
  • the input management information 72 includes information regarding the input source, for example, a data acquisition program identifier 721 and a data acquisition address 722.
  • the data acquisition program identifier 721 is an identifier of the data acquisition program.
  • the “data acquisition program” is an identifier of a program (for example, M / W) that acquires (reads) data from a data source.
  • the data acquisition address 722 is identification information (information including at least one of an identifier and an address) of a computer (VM in this embodiment) that executes the data acquisition program.
  • the output management information 73 includes information regarding an output destination, for example, a data storage program identifier 731 and a data storage address 732.
  • the data storage program identifier 731 is an identifier of the data storage program.
  • the “data storage program” is an identifier of a program (eg, M / W) that stores data acquired from a data source in a data store (eg, DWH (Data (House) or DM (Data Mart)).
  • the data storage address 732 is identification information (information including at least one of an identifier and an address) of a computer (VM in this embodiment) that executes a data acquisition program.
  • the DI tool identifier 74 is an identifier of the DI tool.
  • the data storage address 732 is blank before the analysis platform construction process. This is because the VM 202 that is the deployment destination of the M / W (data storage program) included in the analysis platform is undecided. As will be described later, in the analysis platform construction process, the VM 202 of the M / W (data storage program) deployment destination is determined, and the VM address of the VM 202 is registered in the DI template management table 125 as the data storage address 732.
  • the DI template management table 125 is constructed by the DI template management program 115 as follows.
  • the DI template management program 115 can construct the table 125 by communicating with the deployment management program 116 or other programs.
  • the identifier of the DBMS associated with the data source is the data
  • the VM address registered as the acquisition program identifier 721 and executing the DBMS is registered as the data acquisition address 722.
  • An example of “specific data source” is a data source (for example, “POS” or “Event”) selected via a main screen 1800 in FIG.
  • the DI tool identifier in the selected analysis flow template is registered as the DI tool identifier 74.
  • the same DI tool identifier 74 is registered for the plurality of data sources.
  • the identifier of the DBMS associated with the selected analysis flow template (or the DBMS selected by the analysis user instead of the DBMS) is registered as the data storage program identifier 731.
  • the address of the deployment destination VM is the data It is registered as an acquisition address 722.
  • the DI template management table 125 is completed based on the selected analysis flow template.
  • the information held in the DI template management table 125 may be embedded in the DI tool to be deployed, or may be associated with a DI tool activation request transmitted after the DI tool is deployed. As a result, the DI tool can know the data acquisition source and the data transfer destination.
  • the data acquisition program identifier 721 and the data acquisition address 722 corresponding to the data source may be uniquely determined for the data source. If the data acquisition program is also a deployment target, the data acquisition address 722 may be registered when the deployment destination VM of the data acquisition program is determined.
  • the data in the storage destination data store of the data storage program is “analysis target data” in this embodiment.
  • the analysis target data is referred to by the BI tool in the analysis process after the analysis platform is constructed.
  • FIG. 8 shows the configuration of the BI template management table 123.
  • the BI template management table 123 includes a program (typically, a data acquisition program that stores data in a data store) that is an access destination of the BI tool for the BI tool to reference (acquire) analysis target data, and the program. Holds information about the interface of the.
  • a set of such a program and an interface of the program is referred to as a “BI template” in the description of this embodiment.
  • the BI template management table 125 holds a program identifier 81 and an interface type name 82 for each BI template.
  • the program identifier 81 is an identifier of a program (typically a data acquisition program) that is an access destination of the BI tool.
  • the interface type name 82 is the name of the interface type of the program.
  • FIG. 9 shows the configuration of the H / W setting management table 121.
  • the H / W setting management table 121 holds information relating to the association between the VM and the H / W associated with the VM.
  • the H / W setting management table 121 holds a host identifier 91, an IP address 92, an HBA address 93, and a VM identifier 94 for each VM.
  • the host identifier 91 is an identifier of the server 2 on which the VM operates.
  • the IP address 92 is the IP address of the server 2 on which the VM operates.
  • the HBA address 93 is an address of an HBA (HBA of the server 2) that is one of the H / Ws assigned to the VM.
  • An I / O (Input / Output) request from the VM is sent to the storage apparatus 3 via the HBA assigned to the VM.
  • the HBA address 93 may be blank.
  • the VM identifier 94 is a VM identifier.
  • FIG. 10 shows the configuration of the VM management table 122.
  • the VM management table 122 holds information about VMs.
  • the VM management table 122 holds an M / W identifier 1001, a VM identifier 1002, and an IP address 1003 for each VM.
  • the M / W identifier 1001 is an identifier of the M / W deployed in the VM.
  • the VM identifier 1002 is an identifier of the VM.
  • the IP address 1003 is an IP address assigned to the VM.
  • FIG. 11 shows the configuration of the user management table 126.
  • the user management table 126 holds information regarding the analysis user and the analysis platform regarding the analysis user.
  • the user management table 126 holds a user name 1101, a template identifier 1102, a construction date 1103, a data source identifier 1104, a data acquisition program identifier 1105, a data storage program identifier 1108, a DI tool identifier 1109, and a deletion date 1110.
  • the user name 1101 is the name of the analysis user (the user who requested the analysis platform construction).
  • the template identifier is an identifier of the analysis flow template selected by the analysis user.
  • the construction date and time 1103 is the date and time when the analysis platform according to the selected analysis flow template is constructed.
  • the data source identifier 1104 is an identifier of the data source.
  • the data acquisition program identifier 1105 is an identifier of the data acquisition program. There are as many pairs of identifiers 1104 and 1105 as the number of data sources from which data is acquired. In the example of FIG. 11, there are two sets, that is, a set of identifiers 1104A and 1105A and a set of identifiers 1104B and 1105B.
  • the data storage program identifier 1108 is an identifier of the data storage program.
  • the DI tool identifier 1109 is an identifier of the DI tool.
  • the deletion date and time 1110 is the date and time when the analysis platform is deleted (may be the date and time scheduled to be deleted). The analysis platform can be specified from the user management table 126.
  • FIG. 12 shows the configuration of the conversion table 127.
  • the conversion table 127 holds information regarding the necessity of data format conversion.
  • the conversion table 127 is a matrix of data acquisition program identifiers 1201 and data storage program identifiers 1202. “Yes” means that the data format needs to be converted. “No” means that data format conversion is not required.
  • FIG. 12 for example, when data acquired from a data source by the data acquisition program “DB-01” is transferred to the data storage program “DB-02”, the format of the acquired data needs to be converted. .
  • DB-01 data acquired from a data source by the data acquisition program “DB-01” is transferred to the data storage program “DB-03”, it is not necessary to convert the format of the acquired data.
  • 18 to 22 show examples of screens displayed on the client 5. Any screen shown in FIGS. 18 to 22 is displayed by the analysis platform deployment application 501.
  • the analysis platform deployment application 501 can display the screens shown in FIGS. 18 to 22 by communicating with the deployment management server 1.
  • 18 to 22 is a GUI (Graphical18User Interface) in this embodiment.
  • FIG. 18 shows an example of the main screen.
  • the main screen 1800 includes a column 1801 for inputting a user name, a column 1802 for inputting a password, a column 1803 for inputting an analysis project name, a column 1804 for inputting an identifier of an analysis flow template, M / W (here, A field 1805 for inputting an identifier of DBMS), a field 1806 for inputting an analysis scale, a field 1807 for inputting an identifier of a data source, and a “deploy” button 1809.
  • Column 1807 is the number of associated data sources.
  • the request includes information input in columns 1801 to 1807, such as analysis flow template identifier, M / W (here, DBMS) identifier, H / W related information (for example, analysis scale and H / W details). At least one) and a data source identifier.
  • analysis flow template identifier M / W (here, DBMS) identifier
  • H / W related information for example, analysis scale and H / W details.
  • At least one and a data source identifier.
  • the analysis flow template selection screen in FIG. 19 is displayed.
  • the M / W selection screen in FIG. 20 is displayed.
  • the H / W performance selection screen shown in FIG. 21 is displayed.
  • the data source selection screen in FIG. 22 is displayed.
  • FIG. 19 shows an example of the analysis flow template selection screen.
  • the analysis flow template selection screen 1900 displays a list of analysis flow templates registered in the analysis flow template management table 124.
  • a “Prev” button 1902, an “OK” button 1903, and a “Next” button 1904 are displayed on the screen 1900.
  • three analysis flow template objects 1901-1 to 1901-3 are displayed on one screen 1900.
  • the analysis flow template object 1901 is an object (for example, a block diagram of M / W and analysis target data) representing the analysis flow template.
  • the analysis user can view four or more analysis flow template objects 1901 by operating the “Prev” button 1902 and the “Next” button 1904. The analysis user selects a desired analysis flow template.
  • a radio button is provided for each analysis flow template object 1901, and the analysis user selects a radio button corresponding to a desired analysis flow template, and then presses an “OK” button 1903. .
  • the analysis flow template desired by the analysis user is selected (designated), and the identifier of the analysis flow template is reflected in the column 1804 in FIG.
  • FIG. 20 shows an example of the M / W selection screen.
  • the M / W selection screen 2000 displays a list of DBMSs 2001 and an “OK” button 2002.
  • the DBMS list 2001 can be displayed, for example, when the analysis platform deployment application 501 receives the DBMS list information from the M / W management program 112.
  • the analysis user selects a desired DBMS.
  • the list 2001 has a radio button for each DBMS identifier, and the analysis user selects a radio button corresponding to a desired DBMS, and then presses an “OK” button 2002.
  • the DBMS desired by the analysis user is selected (designated), and the identifier of the DBMS is reflected in the column 1805 of FIG.
  • the DBMS identifier selected here is an identifier registered as the data storage program identifier 731 in FIG.
  • the DBMS as the data storage program is common to the two data sources, and therefore, one DBMS can be selected. That is, here, when the DBMS “DB-01” linked to the analysis flow template “SCM-1” is to be changed to another DBMS, it can be changed to another DBMS desired by the analysis user.
  • FIG. 21 shows an example of the H / W performance selection screen.
  • the H / W performance selection screen 2100 includes a scale selection button group 2101, a scale information display field 2102, a simultaneous connection user number input field 2103, and an “OK” button 2104.
  • the scale selection button group 2101 is an example of a UI (user interface) that accepts selection of a scale desired by the analysis user among a plurality of scales (for example, three scales of Small, Medium, and Large).
  • a radio button of a desired scale H / W details corresponding to the scale are displayed in the scale information display field 2102.
  • the correspondence between the scale and the H / W details is registered in the H / W management program 111 (or a table (not shown) referred to by the program 111). Further, for example, H / W requirements for M / W and BI tools are also registered in the H / W management program 111 (or a table (not shown) referred to by the program 111).
  • An example of the correspondence between the scale and the H / W details is as follows.
  • VM -CPU Minimum value of H / W requirement for M / W and BI tools installed in VM -Memory: Minimum value of M / W and BI tool H / W requirements for VM -Storage: Recommended value of the H / W requirement for M / W installed in VM ⁇ Medium> -CPU: Recommended value for H / W requirement of M / W and BI tool installed in VM -Memory: Recommended value for H / W requirement of M / W and BI tool installed in VM -Storage: The larger of the recommended value of the H / W requirement of the M / W installed in the VM and the data source size.
  • the H / W details (H / W type and H / W resource amount) to be adopted may be H / W details specified from the following correspondence using the selected scale as a key.
  • the scale to be selected or the H / W details to be adopted is at least one of performance information periodically collected from the computer system and statistical information for each M / W and BI tool. May be determined based on
  • the performance information is information representing the performance of the computer system component.
  • the computer system component is at least one of the server 2, the resource in the server 2, the storage device 3, and the resource in the storage device 3.
  • the analysis user inputs the number of simultaneously connected users (the number of users who use the analysis platform in the same time zone) in the simultaneous connection user number input field 2103. Based on the number of simultaneously connected users input, the scale to be adopted or the H / W details are adjusted as necessary.
  • the correspondence relationship between the number of simultaneously connected users and the H / W adjustment amount is registered in the H / W management program 111 (or a table (not shown) referred to by the program 111).
  • the display of H / W details is possible, for example, when the analysis platform deployment application 501 communicates with the H / W management program 111.
  • FIG. 22 shows an example of the data source selection screen 2200.
  • the data source is displayed in a file system tree type.
  • the analysis user selects the desired data source from the tree.
  • the identifier of the selected data source is reflected in the column 1807 of FIG.
  • “POS” Point ⁇ Of Sale
  • Data1 first data source
  • Data2 second data source
  • Event is selected (see FIGS. 7 and 13).
  • FIG. 14 shows the flow of analysis platform construction processing.
  • the analysis flow template selected from the request is specified (step 1405).
  • the analysis platform construction request includes the identifier of the selected analysis flow template, and the selected analysis flow template can be identified from the identifier.
  • the deployment management program 116 notifies the VM management program 402 of the VM deployment request based on the H / W related information (for example, analysis scale and H / W details) included in the analysis platform construction request ( Step 1406).
  • the VM management program 402 deploys a required number of VM images to one or more servers 2 selected from a plurality of servers 2-1 to 2-n according to a VM deployment request (sends a request associated with a VM image) (Step 1407).
  • a VM 202 according to the deployed VM image is generated and started on the server 2 of the deployment destination.
  • the generation and activation of the VM 202 is executed by the hypervisor 201 in the server 2.
  • the VM 202 is deployed on the server 2.
  • the H / W amount (for example, CPU usage rate, memory amount, etc.) respectively assigned to one or more deployed VMs 202 may be the same (equal) or different.
  • the H / W details are determined based on the H / W requirement of the M / W or BI tool
  • the H / W amount allocated to the VM 202 to be deployed is the M / W for which the VM 202 is the deployment destination. And may be determined based on the H / W requirement of the BI tool.
  • the VM management program 402 When the VM 202 is deployed on the server 2, the address of the VM 202 is determined, and the VM management program 402 knows the address of the VM 202.
  • the VM management program 402 returns the deployed VM 202 address (IP address in this embodiment) to the deployment management program 116 (step 1408).
  • IP address IP address in this embodiment
  • four VMs 02 to 05 are deployed, and four IP addresses respectively corresponding to the four VMs 02 to 05 are notified to the deployment management program 116.
  • the deployment management program 116 notified of the address of the VM 202 adds or updates information related to the VM 202 in the H / W setting management table 121 and the VM management table 122 (step 1409).
  • the deployment management program 116 deploys the M / W and BI tools to the deployed VM 202 in accordance with the selected analysis flow template (analysis flow template specified in step 1405) (step 1410).
  • the deployment correspondence is determined.
  • the “deployment correspondence” is a relationship between a program (M / W or BI tool) as a component of the analysis platform and a VM to which the program is deployed.
  • the deployment destination VM 202 of the M / W or BI tool (an example of a program that is a component of the analysis platform) may be arbitrary, and is actually assigned with the H / W requirement required for the M / W or BI tool. It may be determined based on the determined H / W amount.
  • the deployment target (M / W or BI tool) is installed in the VM 202 of the deployment destination (steps 1411 and 1412).
  • the deployment destination of M / W (DBMS) is VM04
  • the deployment destination of BI tool is VM05.
  • the necessary program for example, the M / W
  • the monitor agent program periodically acquires OS log information of each VM 202 (step 1419). In the figure, for convenience, step 1419 is shown after step 1418, but step 1419 may be executed periodically after steps 1411 and 1412.
  • the deployment management program 116 updates the DI template management table 125 based on the selected analysis flow template and the determined deployment correspondence (step 1413). Specifically, the deployment management program 116 causes the DI template management program 115 to update the DI template management table 125, for example.
  • the update is as follows. That is, for each data source identifier 71 in the DI template management table 125, the DBMS identifier corresponding to the DI tool identifier 74 is registered as the data storage program identifier 731. Also, the address of the VM where the DBMS is deployed (the address returned in step 1408) is registered as the data storage address 732.
  • the deployment management program 116 deploys the DI tool to the VM 202 that is the deployment destination of the DI tool (for example, sends a request associated with the execution file of the DI tool to the VM 202) (step 1414).
  • the DI tool is installed in the VM 202 (steps 1415 and 1416).
  • the deployment destinations of the DI tool are VM02 and VM03.
  • the DI tool installed in the VM 202 acquires data from the data source indicated by the address embedded in the DI tool, and the acquired data is the data output destination M / W indicated by the address embedded in the DI tool. (Steps 1417 and 1418).
  • the transferred data is stored in the data store by the M / W (DBMS).
  • the DI tool performs data format conversion processing when data format conversion is required.
  • the deployment target DI tool may be associated with necessity of data format conversion based on the conversion table 127.
  • An analysis platform is constructed by the above analysis platform construction process.
  • the process performed by the deployment management server 1 corresponds to an analysis platform construction support process.
  • FIG. 15 is a flowchart of processing of the deployment management server 1.
  • the management program 110 receives an analysis platform construction request from the client 5 (step 1500).
  • the management program 110 identifies the selected analysis flow template from the analysis platform construction request (step 1501).
  • the selected analysis flow template is referred to as “selection analysis template”.
  • the management program 110 determines from the user management table 126 whether or not the issuer user of the analysis platform construction request is an existing user (step 1502).
  • step 1502 When the determination result of step 1502 is false (step 1502: n), that is, when the user is a new user, the management program 110 identifies the H / W configuration from the H / W related information related to the analysis platform construction request. (Step 1503). Based on the analysis platform construction request, the selected analysis template, and the H / W configuration, the management program 110 is a deployment target program (M / W, DI tool and BI tool) and the number of VMs 202 required to operate the program. And issues a VM deployment request that associates the calculation result (number of VMs) to the VM management server 4 (step 1504). In response to the VM deployment request, the VM management server 4 generates and starts VMs for the number of VMs. The management program 110 receives the generated VM 202 identification information (for example, VM identifier and IP address) from the VM management server 4 (step 1505).
  • M / W, DI tool and BI tool deployment target program
  • the VM management server 4
  • the management program 110 determines a deployment correspondence (assigns a deployment target program to the generated VM), and updates the VM management table 122 based on the relationship (step 1506).
  • the management program 110 deploys a deployment target program (M / W or the like) to the corresponding VM 202 in accordance with the determined deployment correspondence (step 1507).
  • a monitor agent program may be deployed together with a program to be deployed (a program as a component of the analysis platform). Those deployed programs are installed and activated in the VM of the deployment destination.
  • the management program 110 updates the DI template management table 125 (step 1508).
  • the management program 110 specifies a data source from the analysis platform construction request, acquires the address of the VM 202 that executes M / W (for example, DBMS) capable of operating the data source, and uses the address as the data input address 722.
  • M / W for example, DBMS
  • the management program 110 identifies the DI tool from the selected analysis template, and registers the identified DI tool identifier as the DI tool identifier 74.
  • the management program 110 further updates the DI template management table 125 (step 1509). For example, the management program 110 identifies the address of the VM 202 that executes the data output destination M / W from the VM management table 122, and registers the identified address as the data storage address 732 (step 1509).
  • the management program 110 deploys the DI tool to the deployment destination VM 202 of the DI tool according to the DI template management table 1102 (step 1510).
  • the deployed DI tool is installed in the VM 202 and activated.
  • the DI tool to be deployed includes information according to the DI template management table 1102, for example, a data source identifier, a data acquisition program identifier, a data acquisition address (which may include an IP address), a data storage program identifier, and a data storage address (IP May be associated).
  • the necessity of data format conversion is specified from the conversion table 127 based on the information, and the specified necessity of data format conversion may be associated with the DI tool to be deployed.
  • the DI tool knows the data acquisition source and transfer destination, and the necessity of data format conversion.
  • the DI tool acquires and transfers data from a data input source (data source). As a result, analysis target data is prepared, and as a result, an analysis platform is constructed.
  • the monitoring result is received from the monitoring agent, and the management program 110 displays the monitoring result. (Step 1511).
  • the monitoring result may be displayed on the deployment management server 1 or may be displayed on a remote computer connected to the server 1.
  • step 1502 determines that the identifier of the selected analysis template is a template identifier 1102 (FIG. 11) corresponding to the existing user. ) Or not (step 1512). If the determination result in step 1512 is false (step 1512: n), steps 1503 and after are executed. If the determination result in step 1512 is true (step 1512: y), redeployment processing that is deployment processing in the same environment as the already deployed environment is executed (step 1513).
  • FIG. 16 is a flowchart of a first example of the redeployment process 1513.
  • step 1600 It is determined whether or not the program group included in the selected analysis template is the same as the program group in the existing analysis platform (analysis platform specified from the user management table 126) (step 1600).
  • step 1600 determines whether or not the data source associated with the selected analysis template is the same as the data source associated with the existing analysis platform (step 1600). 1601).
  • the data source associated with the selected analysis template is identified from the data source identifier associated with the analysis platform construction request, and the data source associated with the existing analysis platform is identified from the data source identifier 1104 in the user management table. .
  • step 1601: y the management program 110 refers to the user management table 126 to determine whether the existing analysis platform is currently operating (whether it has been deleted). The determination is made (step 1602). If the construction date 1103 is registered and the deletion date 1110 is not registered, the existing platform is operating.
  • step 1602 If the determination result in step 1602 is true (step 1602: y), the management program 110 acquires the same H / W configuration information (number of servers, storage capacity) as the existing analysis platform (step 1603). Thereafter, steps 1504 to 1507 are performed. For example, the management program 110 calculates the required number of VMs based on the configuration information acquired in step 1603 and issues a VM deployment request for generating VMs for the required number to the VM management program 402. Thereafter, generation of the VM 202 and deployment to the VM 202 in which the M / W group is generated are performed.
  • H / W configuration information number of servers, storage capacity
  • steps 1504 to 1507 are performed. For example, the management program 110 calculates the required number of VMs based on the configuration information acquired in step 1603 and issues a VM deployment request for generating VMs for the required number to the VM management program 402. Thereafter, generation of the VM 202 and deployment to the VM 202 in which the M / W group
  • the management program 110 sets the data storage address 732 in the DI template management table 125 to the address specified based on the analysis platform construction request (M / W in the analysis platform to be constructed).
  • W an example of a data storage program
  • W is replaced with the address of the VM 202 that operates (step 1605). That is, only the data storage address (output destination address) 732 in the DI template management table 125 is changed, and the other elements of the existing analysis platform (or a duplicate thereof) are used as they are. If the data storage program (M / W) specified based on the analysis platform construction request is different from the data storage program in the existing analysis platform (or a duplicate thereof), the data storage program identifier 731 is also changed.
  • step 1600: n the management program 110 determines whether or not the data format can be converted based on the conversion table 127. (Step 1607).
  • step 1607: y the management program 110 acquires the H / W configuration information of the existing analysis platform, and based on the information of different M / W groups, the VM management table 122, The user management table 126 and the DI template management table 125 are updated (step 1608). Specifically, for example, the management program 110 can acquire configuration information associated with an existing analysis platform and replace M / W.
  • step 1601: n the determination result of step 1607 is false (step 1600: n), or after step 1608, the management program 110 relates to the analysis platform construction request.
  • the H / W configuration is specified from the attached H / W related information (step 1503).
  • the analysis platform construction process described above it is possible to reduce the load of the analysis platform construction process until the analysis user operates the analysis application 502 (a program that transmits an analysis request to the BI tool) to perform analysis. For this reason, it is possible to shorten the cycle of construction and analysis of the analysis platform, and it is possible to efficiently execute the Trial & Error type analysis technique. That is, according to this example, a new analysis platform is constructed in response to the analysis platform construction request. At this time, if the data source is the same, copying of data from the data source is avoided.
  • the M / W group (an example of at least a part of the program group) included in the selection analysis template is the same as the M / W group in the existing analysis platform
  • the M / W group is deployed.
  • the management program 110 sets a copy of the M / W group in the existing analysis platform as at least a part of the analysis platform to be constructed (at this time, at least a part of the M / W group is replaced). You may) In this way, since the same M / W group is deployed, it is possible to reduce the number of processing steps such as configuration construction and resource sizing.
  • the management program 110 may use the program group in the existing analysis platform as at least a part of the analysis platform to be constructed. That is, the existing analysis platform may be used. In other words, the M / W deployment (copying of the M / W group) as in step 1507 may not be performed.
  • FIG. 17 is a flowchart of a second example of the redeployment process 1513.
  • the data storage address 732 in the DI template management table 125 is the address specified based on the analysis platform construction request (M / W in the analysis platform to be constructed). Is replaced with the address of the VM 202 that operates. For this reason, it is necessary to prepare data again.
  • the analysis target data is copied from the data store according to the data storage address 732 before the change to the data store according to the data storage address 732 after the change.
  • data is acquired from the data source by the DI tool, and the data is transferred to the data storage program.
  • step 1700 is performed instead of step 1605.
  • the data storage address 732 in the DI template management table 125 is maintained at the address of the VM 202 operating the M / W in the existing analysis platform. This eliminates the need to copy existing data. Therefore, it is possible to reduce the data preparation time.
  • step 1701 is performed instead of step 1606. Also in step 1701, the data storage address 732 in the DI template management table 125 is maintained at the address of the VM 202 operating the M / W in the existing analysis platform. However, since the data format needs to be converted, the DI tool executes data acquisition from the data source and transfer of the data.
  • the management program 110 can determine, for example, as follows whether to adopt the first example or the second example. That is, the management program 110 determines whether both of the following (p) and (q) are satisfied. When the determination result is false, the management program 110 adopts the first example. When the determination result is true, the management program 110 adopts the second example.
  • P The identifier of the data storage program (M / W) in the analysis platform to be constructed is the same as the identifier of the data storage program in the existing analysis platform.
  • Q The address of the VM 202 that operates the data storage program (M / W) in the analysis platform to be constructed is the same as the address of the VM 202 that operates the data storage program in the existing analysis platform.
  • an analysis system including an analysis platform is operated by a plurality of parties as shown as a comparative example in FIG.
  • the analysis processing procedure according to one comparative example is as follows.
  • S1 According to the hypothesis of the data scientist, a meeting is held among PF related persons (analysis platform related persons) such as a data integration person and a system infrastructure person. Scheduling, meetings, analysis platform configuration review, and analysis platform provisioning often take days to weeks.
  • S2 After completing the construction of the analysis platform, the data integration person moves the data from the data source to the analysis platform. It may take several hours to several days or more depending on the data size and impact on the original business of the data source.
  • S3 The analysis user repeats the hypothesis verification, correction, and re-verification cycle.
  • the hypothesis verification is not limited to one for one analysis user, and a plurality of hypothesis verifications are often performed in parallel, or many analysis users often analyze in parallel.
  • the analysis system needs to be properly used depending on the characteristics of the M / W and BI tools, such as scale-up and scale-out. The whole manual adjustment takes a lot of time. When an analysis platform can be constructed, an analysis platform with a different configuration may be required.
  • analysis flow is made into a template.
  • a plurality of analysis flow templates are prepared.
  • the management program 110 accepts selection of a desired analysis flow template from the analysis user.
  • the analysis platform of the analysis flow represented by the selected analysis template (the selected analysis flow template) may be the construction target, or the analysis platform of the analysis flow after customization of the analysis flow may be the construction target.
  • the “analysis flow after customization” may be an analysis flow in which some elements (programs) in the analysis flow represented by the selected analysis template are replaced, or new elements (programs) in the analysis flow represented by the selected analysis template. ) May be added, or an analysis flow in which elements (programs) are deleted from the analysis flow represented by the selected analysis template may be used.
  • the analysis flow represented by the information associated with the analysis platform construction request is the analysis flow represented by the selected analysis template or an analysis flow after customization.
  • the DI template is association information for a DI tool (an example of a data input program).
  • the information held in the DI template is associated with the DI tool (for example, the information is embedded in the DI tool, or the information is associated with the activation request to the VM to which the DI tool is deployed), and deployed and activated.
  • the DI tool can specify a data acquisition source (for example, information used for acquiring data from a data source) and a data transfer destination (for example, information used for transferring acquired data).
  • At least the output management information 73 cannot be associated in advance with a DI template corresponding to the DI tool. This is because a data storage program (for example, M / W such as DBMS) corresponding to the DI tool and its deployment destination VM are not determined.
  • M / W such as DBMS
  • the output management information 73 including the identification information of the VM is converted by the management program 110 into the DI to which the data storage program is the data transfer destination. It is registered in the DI template corresponding to the tool.
  • the data transfer destination for example, input management information 72
  • the deployed and activated DI tool can execute data acquisition and transfer without receiving specification of information regarding the data acquisition source or transfer destination from the user. That is, automation of data (analysis target data) preparation is realized.
  • the deployment destination of the program as an element of the analysis platform may be a physical computer (for example, a server) instead of the VM.
  • a program identifier such as a DI tool identifier and a DBMS identifier is associated with the analysis flow template, but instead of at least one program identifier, a program type (for example, a DI tool) , Which type of DBMS or BI tool) may be associated.
  • a program type for example, a DI tool
  • the analysis flow template only needs to represent the relationship between the program types, and after selecting an analysis flow template, the analysis user selects which program type to specifically adopt in the analysis flow template. May be.
  • an existing analysis platform exists when an analysis platform construction request is received, a duplicate of the existing analysis put form is generated, and the existing analysis is based on the difference between the duplication of the existing analysis put form and the analysis platform to be constructed. A duplicate of the put form may be used.
  • the existing analysis platform is already unnecessary for the analysis user (can be deleted), the existing analysis platform itself may be diverted based on the difference between the existing analysis platform itself and the analysis platform to be constructed. .
  • “diversion” here refers to replacement of differences. Specifically, for example, it means replacement of a program such as M / W or replacement of a data source.
  • the replaced program is a data storage program
  • the deployment target is a BI tool
  • an address indicating the storage location of the analysis target data is associated with the BI tool (for example, the address is embedded in the BI tool or a BI tool activation request is issued) Associated with that address).
  • the replacement target program is a BI tool and the replacement BI tool is made accessible to the access destination of the BI tool before replacement
  • the replaced BI tool includes the BI tool before replacement.
  • the same address as the access destination address associated with the tool is associated (a specific example of the second example shown in FIG. 17).

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

管理システムが、ユーザにより選択された分析フローテンプレートと、そのテンプレートに関連付けられるデータソースとを表す情報が関連付けられた構築要求を受ける。その要求に応答した処理において、管理システムは、構築対象プラットフォームを構成するプログラムのうちのデータ入力プログラムに対応した関連付け情報に、そのデータ入力プログラムに対応したデータ転送先のデータ格納プログラムのデプロイメント先である仮想計算機の識別情報を関連付ける。管理システムは、上記2以上のプログラムの各々を、そのプログラムのデプロイメント先の仮想計算機にデプロイする。デプロイされたデータ入力プログラムに、そのデータ入力プログラムにより取得されたデータの転送先をそのデータ入力プログラムに特定可能にせしめるために、そのデータ入力プログラムに対応した関連付け情報が有する情報が関連付けられる。

Description

管理システム及びプラットフォーム構築支援方法
 本発明は、概して、計算機システムのプラットフォーム(環境)の構築に関する。
 IT(Informational Technology)/OT(Operational Technology)ベンダによる、IoT(Internet of Things)系データの活用が拡大している。IoT系データを扱うシステムにおいては、データや処理の急激な変化に対応すべく、OSS(Open Source Software)やクラウドを利用する傾向にある。一方、主に基幹系システム向けのRDB(Relational Database)ベンダも、基幹系データとIoT系データとを併せて分析する大量データ分析統合システムの提供を開始しており、IoT系データ分析にはOSSを積極的に活用している。IoT系システムでは、センサデータ、ドキュメント、画像、音声等の多種多様なデータが扱われ、大量のデータを分析対象として扱うことが可能であり、予め設計されたデータのみを扱う基幹系システムと組み合わせることで、多角的な観点取り入れによる分析精度の向上が期待できる。
 データ分析の一例として、ETL(Extract/Transform/Load)ツールにより所定の分析観点に従うデータのみをデータソースから収集しデータストア(例えばDWH(Data Ware House))に格納する技術が知られている。特許文献1には、ETLワークフロー(処理手順テンプレートとデータパラメータ)を定義するETLパッケージが開示されている。
US2007/0083850
 上記大量データ分析処理においては、多種多様なデータにアクセスして、様々な分析を短周期で行うTrial&Error型の分析手法が採られる。その理由の1つとして、データ分析の目的に適したデータを試行錯誤の中で見つけることがある。このため、分析プラットフォーム(分析環境)の構築(及び破棄)が繰り返されることがある。従って、分析プラットフォームの容易な構築が求められる。
 分析処理のライフサイクル(プラットフォーム構築から分析完了まで)において、最も時間のかかる処理は、一般に、データの準備である。データ準備にかかる時間は、全体処理時間(ライフサイクル全体)の約8割を占めることもある。分析ユーザ(データ分析を行うユーザ)が分析処理を開始するまでには、H/W(Hardware)の設定、VM(Virtual Machine)の生成、VMの構成情報の特定、その構成情報に基づいての分析M/W(Middleware)のインストール、及び、データソースからの分析対象データの取得といったような、煩雑な作業が必要となる。
 管理システムが、ユーザの入力情報が関連付けられた分析プラットフォーム構築要求を受け付ける。入力情報が、複数の分析フローテンプレートのうちの選択分析テンプレート(ユーザにより選択された分析フローテンプレート)と、選択分析テンプレートに関連付けられる1以上のデータソースとを表す。入力情報に、構築対象の分析プラットフォームの構成要素となる2以上のプログラムが関連付けられている。管理システムは、分析プラットフォーム構築要求に応答した処理において、その2以上のプログラムのうちの1以上のデータ入力プログラムの各々について、そのデータ入力プログラム用の関連付け情報であるデータ入力テンプレートに、そのデータ入力プログラムに対応したデータ転送先のデータ格納プログラムのデプロイメント先である仮想計算機の識別情報を関連付ける。管理システムは、2以上のプログラムの各々を、そのプログラムのデプロイメント先の仮想計算機にデプロイする。デプロイされたデータ入力プログラムに、そのデータ入力プログラムにより取得されたデータの転送先をそのデータ入力プログラムに特定可能にせしめるために、そのデータ入力プログラムに対応したデータ入力テンプレートが有する情報が関連付けられる。なお、「ユーザ」は、典型的には後述の分析ユーザであるが、分析ユーザ以外のユーザであってもよい。
 分析プラットフォームの構築(特に、分析対象データの準備)にかかる期間を短縮できる。
実施例に係るシステム全体の構成を示す。 デプロイメント管理サーバ1の構成を示す。 サーバ2の構成を示す。 VM管理サーバ4の構成を示す。 クライアント5の構成を示す。 分析フローテンプレート管理テーブル124の構成を示す。 DI(Data Input)テンプレート管理テーブル125の構成を示す。 BI(Business Intelligence)テンプレート管理テーブル123の構成を示す。 H/W設定管理テーブル121の構成を示す。 VM管理テーブル122の構成を示す。 ユーザ管理テーブル126の構成を示す。 変換テーブル127の構成を示す。 分析フローテンプレートの一例を示す。 分析プラットフォーム構築処理のフローを示す。 デプロイメント管理サーバ1の処理のフローチャートである。 再デプロイ処理1513の第1の例のフローチャートである。 再デプロイ処理1513の第2の例のフローチャートである。 メイン画面の一例を示す。 分析フローテンプレート選択画面の一例を示す。 M/W選択画面の一例を示す。 H/W性能選択画面の一例を示す。 データソース選択画面の一例を示す。 一比較例に係る分析プラットフォーム構築処理を含んだ処理全体のフローを示す。
 以下の説明では、情報について、テーブルやリスト等の表現で説明することがあるが、情報のデータ構造は限定されず、他のデータ構造であってもよい。情報はデータ構造に依存しないため、例えば「kkkテーブル」または「kkkリスト」を「kkk情報」と呼ぶことができる。テーブルやリストのような情報は、2以上の情報要素に分割されてもよいし、2種以上の情報の全部又は一部が同一情報に集約されてもよい。
 また、以下の説明において、「インタフェース部」は、1以上のインタフェースを含む。1以上のインタフェースは、1以上の同種のインタフェースデバイス(例えば1以上のNIC(Network Interface Card))であってもよいし2以上の異種のインタフェースデバイス(例えばNICとHBA(Host Bus Adapter))であってもよい。
 また、以下の説明において、「記憶部」は、1以上のメモリを含む。少なくとも1つのメモリは、揮発性メモリであってもよいし不揮発性メモリであってもよい。記憶部は、1以上のメモリに加えて、1以上のPDEVを含んでもよい。「PDEV」は、物理的な記憶デバイスを意味し、典型的には、不揮発性の記憶デバイス(例えば補助記憶デバイス)でよい。PDEVは、例えば、HDD(Hard Disk Drive)又はSSD(Solid State Drive)でよい。
 また、以下の説明において、「プロセッサ部」は、1以上のプロセッサを含む。少なくとも1つのプロセッサは、典型的には、CPU(Central Processing Unit)である。プロセッサは、処理の一部または全部を行うハードウェア回路を含んでもよい。
 また、以下の説明では、日時又は時刻等の時間は、年月日時分秒又はその一部で表現されてよい。
 また、以下の説明において、「管理システム」は、一以上の計算機で構成されてよい。具体的には、例えば、管理計算機が表示デバイスを有していて管理計算機が自分の表示デバイスに情報を表示する場合、管理計算機が管理システムでよい。また、例えば、管理計算機(例えばサーバ)が表示用情報を遠隔の表示用計算機(例えばクライアント)に送信し表示用計算機がその情報を表示する場合(管理計算機が表示用計算機に情報を表示する場合)、管理計算機と表示用計算機とのうちの少なくとも管理計算機を含んだシステムが管理システムでよい。管理システムは、インタフェース部、記憶部及びそれらに接続されたプロセッサ部を有してよい。インタフェース部は、ユーザインタフェース部と、通信インタフェース部とのうちの少なくとも1つを含んでよい。ユーザインタフェース部は、1以上のI/Oデバイス(例えば入力デバイス(例えばキーボード及びポインティングデバイス)と出力デバイス(例えば表示デバイス))と表示用計算機とのうちの少なくとも1つのI/Oデバイスを含んでよい。通信インタフェース部は、1以上の通信インタフェースデバイスを含んでよい。管理システムにおける計算機が「表示用情報を表示する」ことは、計算機が有する表示デバイスに表示用情報を表示することであってもよいし、計算機が表示用計算機に表示用情報を送信することであってもよい(後者の場合は表示用計算機によって表示用情報が表示される)。以下の説明では、管理システムは、デプロイメント管理サーバ及びVM(Virtual Machine)管理サーバのうちの少なくともデプロイメント管理サーバである。デプロイメント管理サーバとVM管理サーバは一体であってもよい。
 また、以下の説明において、プロセッサ部は、プログラムを実行し、記憶部(例えば、メモリ)及びインタフェース部(例えば、通信ポート)等のうちの少なくとも1つを用いながら処理を行う。処理の主体について、以下の説明ではプログラムを主体とする場合があるが、プログラムを実行するプロセッサ部を主体としてもよい。また、プロセッサ部が主体となっている処理は、1以上のプログラムを実行することにより行われると解釈することができる。プログラムは、プログラムソースから計算機にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読み取り可能な記憶メディアであってもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
 また、以下の説明において、「ストレージ装置」は、1以上の記憶デバイスと、その1以上の記憶デバイスを制御するコントローラとを有する。コントローラは、1以上の記憶デバイスに基づき、サーバに論理ボリュームを提供する。この際、論理ボリュームは、実論理ボリュームであっても良いし、仮想論理ボリュームであっても良い。記憶デバイスは、物理的な記憶デバイスであっても良いし、仮想的な記憶デバイスであっても良い。例えば、物理的な記憶デバイスは、HDD(Hard Disk Drive)又はSSD(Solid State Drive)のドライブ等である。複数の記憶デバイスで1以上のRAIDグループ(Redundant Array of Independent (or Inexpensive) Disks)が構成されてよい。RAIDグループは、パリティグループと呼ばれてもよい。仮想論理ボリュームとしては、例えば、外部接続論理ボリュームと、TP(Thin Provisioning)-論理ボリュームと、スナップショット論理ボリュームとがあってよい。外部接続論理ボリュームは、ストレージシステムに接続されている外部のストレージシステムの記憶資源(例えば論理ボリューム)に基づいており、ストレージ仮想化技術に従う論理ボリュームである。TP-論理ボリュームは、容量仮想化技術(典型的にはThin Provisioning)に従う論理ボリュームである。スナップショット論理ボリュームは、オリジナルの論理ボリュームのスナップショットとして提供される論理ボリュームである。ストレージシステムは、1以上のストレージ装置で構成されてよい。
 また、以下の説明において、同種の要素を区別しないで説明する場合には、参照符号又は参照符号のうちの共通符号を使用し、同種の要素を区別して説明する場合には、その要素に割り振られた識別子(例えば番号及び符号のうちの少なくとも1つ)又は参照符号全体を使用することがある。
 また、以下の説明において、「分析プラットフォーム」とは、分析要求に応答して分析処理を実行し分析結果を応答する環境を意味する。分析プラットフォームは「分析環境」と呼ばれてもよい。分析プラットフォームは、具体的には、1以上のコンピュータプログラムと、その1以上のコンピュータプログラムのうちの少なくとも1つに関連付けられた分析対象データ(又は当該データを格納したデータストア(例えば、DWH(Data Ware House)又はDM(Data Mart))とで構成された環境である。
 また、以下の説明において、「M/W」(Middleware)は、分析プラットフォームに含まれる1以上のコンピュータプログラムのうちの少なくとも1つとなり得るコンピュータプログラムであって、後述のBIツールの下位に位置づけられるコンピュータプログラムを意味する。
 また、以下の説明において、「H/W」(Hardware)は、VM(Virtual Machine)に割り当てられ得る物理リソース(言い換えれば、VMの要素となる仮想リソースの基になる物理リソース)である。H/Wは、計算機システムにある。なお、以下の実施例において、「計算機システム」は、複数のサーバと1つのストレージ装置であるが、計算機システムは、VMの生成、起動(実行)、終了及び削除が可能な環境であり、少なくとも1つのサーバ又は少なくとも1つのストレージ装置を含むシステムでよい。
 また、以下の説明において、「DIツール」は、データ入力ツールの一例であり、データソースからデータを取得し出力側にそのデータを出力するプログラム(例えばM/W)である。DI(Data Input)ツールは、必要があれば、データの形式を変換できる。DIツールは、例えば、ETL(Extract/Transform/Load)ツールである。DIツールは、分析プラットフォームの構成要素になり得る。
 また、以下の説明において、「BIツール」は、分析ツールの一例であり、分析要求を受け付けてその要求を処理するプログラム(例えばアプリケーションプログラム)である。BI(Business Intelligence)ツールは、M/Wの上位に位置し、分析プラットフォームの構成要素になり得る。以下の実施例では、BIツールは、分析ユーザの計算機(クライアント)から分析要求を受け付ける。
 また、以下の説明において、「DBMS」(Database Management System)は、データ取得プログラム及びデータ格納プログラムの少なくとも1つの一例であり、例えば、M/Wである。DBMSは、分析プラットフォームの構成要素になり得る。なお、以下の実施例では、便宜上、「DBMS」が採用されているが、データ取得プログラム及びデータ格納プログラムのうちの少なくとも1つによりアクセスされるデータは、RDB(Relational Database)のような構造化データに限らず、ファイルやオブジェクトデータのような非構造化データであってもよい。
 また、以下の説明において、「データソース」は、分析対象データを含んだデータのソースである。データソースから、分析観点としての条件に該当するデータが、分析対象データとして取得される。取得されたデータが、DWH又はDMのようなデータストアに格納される。分析処理では、データストア内の分析対象データが参照される。なお、データソースがDWHであり、データストアがDMであってもよい。また、データソース及びデータストアのうちの少なくとも1つは、上述の論理ボリュームでよい。
 また、以下の説明において、「デプロイ」とは、デプロイメント対象がでプロメント先に配置されるための要求を出すことである。例えば、デプロイメント対象が、分析プラットフォームの構成要素としてのプログラムの場合、「デプロイ」とは、そのプログラムの実行ファイル(例えばファイル識別子が「.exe」のファイル))が関連付けられた要求をVMのような計算機に送信することを意味する。
 図1は、本発明の一実施例に係るシステム全体の構成を示す。
 デプロイメント管理サーバ1と、計算機システム(複数のサーバ2-1~2-n及びストレージ装置3)と、VM管理サーバ4と、クライアント5とを有する。ストレージ装置3とクライアント5のいずれも、複数あってもよい。サーバ2は、1つであってもよい。クライアント5は、分析ユーザの計算機の一例である。サーバ1、2及び4のうちの少なくともデプロイメント管理サーバ1が、分析ユーザから入力された情報又はその情報を関連付けた要求を、クライアント5から受け付ける。
 デプロイメント管理サーバ1と、サーバ2と、VM管理サーバ4と、クライアント5とは、NW(ネットワーク)6を介して接続され、サーバ2とストレージ3とは、NW7を介して接続されている。NW6は、Ethernet(登録商標)で、NW7は、Fibre Channel(FC)、Ethernet(登録商標)、あるいはPCI Express(PCIe)(登録商標)であってよい。NW6及び7は、同種のネットワークでもよいし、1つのネットワークであってもよい。
 サーバ2-1~2-nの各々が、VM生成要求をVM管理サーバ4から受信し、その要求に応答してVMを生成する。VMが生成されたサーバ2において、そのVMが実行される。サーバ2間でVMのマイグレーションが行われてもよい。サーバ2内のH/WがVMに関連付けられる。言い換えれば、サーバ2内のH/Wに基づく仮想的なリソースがVMのリソースとして関連付けられる。
 デプロイメント管理サーバ1は、計算機システム(サーバ2-1~2-n及びストレージ装置3)のリソース(例えば、H/W(物理リソース)及び仮想リソース)を管理する。また、デプロイメント管理サーバ1は、クライアント5からの要求に従って、分析プラットフォーム(分析環境)のデプロイメント管理を行う。すなわち、デプロイメント管理サーバ1によって、分析プラットフォーム構築処理の支援がされる。デプロイメント管理サーバ1が行う処理の少なくとも一部が、分析プラットフォーム構築支援処理に含まれる処理である。
 VM管理サーバ4は、デプロイメント管理サーバ1からVMデプロイメント要求を受け、その要求に従って、サーバ2-1~2-nの少なくとも1つに、VM作成要求を送信する。その要求を受けたサーバ2において、その要求に応答してVMが生成される。結果として、VMがサーバ2上にデプロイされる。VM管理サーバ4は、このようにしてデプロイされた、分析プラットフォームを動作するVMの管理を行う。
 ストレージ装置3は、分析対象データ、VMイメージ(イメージデータ)、及び、M/Wを格納する。VMイメージ及びM/Wのうち少なくともM/Wが複数存在する。VMイメージが複数存在する場合、複数のVMイメージは、複数の種類のVMのイメージを含んでもよいし、複数のバージョンのVMのイメージを含んでもよい。これにより、各サーバ2は、1または複数の種類のVMを実行可能である。同様に、複数のM/Wも、複数の種類のM/Wを含んでもよいし、複数のバージョンのM/Wを含んでもよい。典型的には、複数のM/Wは、複数の種類のM/Wを少なくとも含む。
 図1では、1つのストレージ装置3が複数のサーバ2に共有されているが、サーバ2とストレージ装置3の数及び構成は、この態様に限られない。
 図2は、デプロイメント管理サーバ1の構成を示す。
 デプロイメント管理サーバ1は、インタフェース部と、記憶部と、それらに接続されたプロセッサ部とを有する。具体的には、例えば、デプロイメント管理サーバ1は、メモリ10と、メモリ10に格納されているプログラムを実行するCPU11と、記憶デバイス(HDDあるいはSSD)12と、キーボードやマウス等の入力デバイス13と、ディスプレイデバイス等の出力デバイス14と、ネットワークインタフェース15と、を有する。これらの構成要素は、内部バス16を介して接続されている。メモリ10及び記憶デバイス12のうちの少なくとも1つが、記憶部の一例である。ネットワークインタフェース15が、インタフェース部の一例である。CPU11が、プロセッサ部の一例である。ネットワークインタフェース15は、例えば、LAN(Local Area Network)インタフェース、HBA(Host Bus Adapter)等である。メモリ10は、OS100と、管理プログラム110と、テーブル群120とを記憶する。
 テーブル群120は、例えば、H/W設定管理テーブル121、VM管理テーブル122、BIテンプレート管理テーブル123、分析フローテンプレート管理テーブル124、DIテンプレート管理テーブル125、ユーザ管理テーブル126、及び変換テーブル127を含む。各テーブルの構成は後述する。
 管理プログラム110は、複数のモジュール、例えば、H/W管理プログラム111、M/W管理プログラム112、データ管理プログラム113、分析フローテンプレート管理プログラム114、DI管理プログラム115、デプロイメント管理プログラム116、及びAPI(Application Programming Interface)117を含む。これら複数のモジュールのうちの少なくとも1つが、1つのプログラム内のモジュールではなく、独立したプログラムとして存在してもよい。
 H/W管理プログラム111は、計算機システム(サーバ2、ストレージ装置3)のH/Wの構成情報を管理するプログラムである。H/W管理プログラム111は、H/W設定管理テーブル121を管理する。
 M/W管理プログラム112は、分析プラットフォームの少なくとも一部として提供可能なM/W、例えば、DBMS、データ格納プログラム、BIツール等を管理する。
 データ管理プログラム113は、データソースを管理する。データソースは、1以上存在する。
 分析フローテンプレート管理プログラム114は、分析フローテンプレート管理テーブル124を管理する。分析フローテンプレートは、1以上、典型的には複数存在する。分析フローテンプレート管理プログラム114が、少なくとも1つの分析フローテンプレートを作成してもよい。すなわち、分析フローテンプレート管理プログラム114が、比較的頻繁に構築される分析フローを予めテンプレート化してもよい。図13は、分析フローテンプレートの一例を示す。分析フローテンプレート1300は、SCM(Supply Chain Management)に関わる分析フローを示す。分析フローテンプレート1300が表す分析フローは、以下の4つの処理が(F1)、(F2)、(F3)及び(F4)の順に並んだフロー、
(F1)複数のデータソース1304、1305の各々からデータをDIツール1303が収集する、
(F2)収集されたデータをDIツール1303がDBMS1302へ転送する(必要があればデータの形式を変換する)、
(F3)転送されたデータをDBMS1302が格納する、
(F4)BIツール1301がDBMS1302により格納されたデータにアクセスする、
である。なお、分析フローテンプレートは、クライアント5(分析ユーザ)により編集又は作成されてよく、編集後又は作成後の分析フローテンプレートの情報が、分析フローテンプレート管理テーブル124に登録されてよい。分析フローテンプレートは、例えば、業種や、分析頻度、分析対象データの特性等により典型的な分析フローがテンプレート化されたものである。
 DI管理プログラム115は、データソースに紐付けられたM/Wと、当該M/Wが稼動するVMの識別子と、デプロイメント対象のM/Wと、当該デプロイメント対象のM/Wが稼動するVMの識別子と、データ形式の変換ツール(例えばDIツール)との紐付けを管理する。つまり、DI管理プログラム115は、DIテンプレート管理テンプレート125を管理する。
 デプロイメント管理プログラム116は、クライアント5からの分析プラットフォーム構築要求に従い、H/W設定管理テーブル121、VM管理テーブル122、BIテンプレート管理テーブル123、分析フローテンプレート管理テーブル124、DI管理テンプレート125、及び変換テーブル127を使用して、分析プラットフォームの準備を行ったり、データソースと変換ツールとの紐付けを行ったりするプログラムである。
 API117は、クライアント5からの分析プラットフォーム構築要求を受け付けるインタフェースである。
 図2は、サーバ2の構成を示す。
 VM管理サーバ4は、メモリ20と、メモリ20に格納されているプログラムを実行するCPU21と、記憶デバイス22と、キーボードやマウス等の入力デバイス23と、ディスプレイデバイス等の出力デバイス24と、ネットワークインタフェース25と、を有する。これらの要素は、内部バス26を介して接続されている。ネットワークインタフェース25は、例えば、LANインタフェース又はHBAである。
 メモリ20は、OS200と、ハイパバイザ201とを記憶する。ハイパバイザ201により、VM202の生成、起動(実行)及び削除が制御される。図3には、複数のVM202-1~202-nが例示されている。ハイパバイザ201が、VM管理サーバ4からのVM生成要求に応答してVM202が生成される。生成されたVM202に対して、デプロイメント管理サーバ1によりM/Wがデプロイされ、そのVM202上で、デプロイされたM/Wが動作する。
 図4は、VM管理サーバ4の構成を示す。
 VM管理サーバ4は、メモリ40と、メモリ40に格納されているプログラムを実行するCPU41と、記憶デバイス42と、キーボードやマウス等の入力デバイス43と、ディスプレイデバイス等の出力デバイス44と、ネットワークインタフェース45と、を有する。これらの要素は、内部バス46を介して接続されている。ネットワークインタフェース45は、例えば、LANインタフェースである。
 メモリ40は、VMデプロイメント管理テーブル404と、リソース管理テーブル405と、を記憶する。また、メモリ40は、OS400と、リソース管理プログラム401と、VM管理プログラム402と、ユーザ管理プログラム403と、を記憶する。
 リソース管理テーブル405は、計算機システム(サーバ2及びストレージ装置3)のリソース(例えばH/W及び仮想リソース)に関する情報を保持する。例えば、リソース管理テーブル405は、サーバ2毎に、サーバ2のリソースに関する情報(例えば、リソース種類、リソース量)を保持する。また、例えば、リソース管理テーブル405は、ストレージ装置3のリソースに関する情報(例えば、リソース種類、リソース量)を保持する。また、例えば、リソース管理テーブル405は、VM202毎に、VMに割り当てられているリソースに関する情報(例えば、リソース種類、リソース量)を保持する。
 VMデプロイメント管理テーブル404は、VM202とサーバ2との関係を表す情報を保持する。例えば、VMデプロイメント管理テーブル404は、VM202毎に、VM202の識別子(例えば、IPアドレスのようなVMアドレス)と、そのVM202が動作するサーバ2の識別子とを保持する。
 リソース管理プログラム401は、リソース管理テーブル405を用いて、VM202が使用しているH/W(例えば、CPU、メモリ、ネットワーク帯域)を監視する。リソース管理プログラム401は、監視の結果を基に、VM202についてのリソース使用率(例えば、CPU、メモリ及びストレージの使用率)、ネットワーク帯域の使用率、各サービスのCPUの使用率、及び、電源のうちの少なくとも1つを管理できる。
 VM管理プログラム402は、VMデプロイメント管理テーブル404を用いて、VMの生成、起動、終了、追加、削除等を管理する。
 ユーザ管理プログラム403は、VM202に対する運用管理を行うユーザ情報の生成、登録、削除等を管理する。
 VM管理サーバ4は、デプロイメント管理サーバ1からのVM生成、削除、情報収集等のうちの少なくとも1つを指定した要求に応じて、VMイメージをストレージ装置3からVM管理サーバ4にロードしてそのVMイメージに従うVM202を生成し、且つ、生成したVMに割り当てたVM識別情報(例えば、VMの識別子及びアドレス(例えばIPアドレス)のうちの少なくとも1つを含んだ情報)を、要求元であるデプロイメント管理サーバ1へ通知(応答)する。
 図5は、クライアント5の構成を示す。
 クライアント5は、メモリ50と、メモリ50に格納されているプログラムを実行するCPU51と、記憶デバイス52と、キーボードやマウス等の入力デバイス53と、ディスプレイデバイス等の出力デバイス54と、ネットワークインタフェース55と、を有する。これらの要素は、内部バス56を介して接続されている。ネットワークインタフェース55は、例えば、LANインタフェースである。
 メモリ50は、OS500と、Web GUIを提供する分析プラットフォームデプロイアプリケーション501と、分析アプリケーション502と、を記憶する。分析プラットフォームデプロイアプリケーション501は、Webブラウザでもよいし、Webブラウザ経由で分析ユーザに対して情報を入出力するプログラムであってもよい。分析プラットフォームデプロイアプリケーション501は、デプロイメント管理サーバ1に対して、分析プラットフォームの構築要求を送信する。分析アプリケーション502は、デプロイメント管理サーバ1により構築された分析プラットフォームに対して、分析ロジックを動作させる分析要求を送信する。分析要求は、分析プラットフォームにおけるBIツールにより受け付けられる。
 図2~図5に示した構成において、サーバ1、2及び4の少なくとも1つは、入力デバイス及び出力デバイスの少なくとも1つを有していなくてもよい。なぜなら、本実施例では、分析ユーザのユーザインタフェースとしての入力デバイス及び出力デバイスをクライアント5が有しているからである。
 図6~図12は、デプロイ管理サーバ1が管理するテーブルの構成を示す。
 図6は、分析フローテンプレート管理テーブル124を示す。
 分析フローテンプレート管理テーブル124は、分析フローテンプレートの情報を保持する。具体的には、分析フローテンプレート管理テーブル124は、分析フローテンプレート毎に、テンプレート識別子61、DIツール識別子62、DBMS識別子63、及び、BIツール識別子64を保持する。テンプレート識別子61は、分析フローテンプレートの識別子である。DIツール識別子62は、DIツールの識別子である。DBMS識別子63は、DBMSの識別子である。BIツール識別子64は、BIツールの識別子である。なお、本実施例では、説明を分かり易くするために、分析フローは、DIツール、DBMS、及びBIツールで構成され、また、分析フローの順序も、DIツールの処理、DBMSの処理、及びBIツールの処理の順としている。本実施例(特に図6が示す例)では、分析フローテンプレートの違いは、DIツールとして採用されたプログラム、DBMSとして採用されたプログラム、及び、BIツールとして採用されたプログラムの少なくとも1つの違いである。しかし、実際は、分析フローテンプレートは、プログラムの実行順序のような他の観点によっても違うことがあり、分析フローテンプレート管理テーブル124の構成は、図6のようなシンプルな構成にならないことは考えられる。分析フローテンプレート管理テーブル124の構成は、採用され得る分析フローテンプレート構成に応じた構成にすることができる。
 図7は、DIテンプレート管理テーブル125の構成を示す。
 DIテンプレート管理テーブル125は、データソース、入力元、出力先及びDIツールの紐付けを管理する。このような紐付けを、本実施例の説明において「DIテンプレート」と言う。例えば、DIテンプレート管理テーブル125は、DIテンプレート毎に、データソース識別子71、入力管理情報72、出力管理情報73、及び、DIツール識別子74を保持する。データソース識別子71は、データソースの識別子である。入力管理情報72は、入力元に関する情報、例えば、データ取得プログラム識別子721及びデータ取得アドレス722を含む。データ取得プログラム識別子721は、データ取得プログラムの識別子である。「データ取得プログラム」とは、データソースからデータを取得する(読み出す)プログラム(例えばM/W)の識別子である。データ取得アドレス722は、データ取得プログラムを実行する計算機(本実施例ではVM)の識別情報(識別子及びアドレスのうちの少なくとも1つを含んだ情報)である。出力管理情報73は、出力先に関する情報、例えば、データ格納プログラム識別子731及びデータ格納アドレス732を含む。データ格納プログラム識別子731は、データ格納プログラムの識別子である。「データ格納プログラム」とは、データソースから取得されたデータをデータストア(例えばDWH(Data Ware House)又はDM(Data Mart))に格納するプログラム(例えばM/W)の識別子である。データ格納アドレス732は、データ取得プログラムを実行する計算機(本実施例ではVM)の識別情報(識別子及びアドレスのうちの少なくとも1つを含んだ情報)である。DIツール識別子74は、DIツールの識別子である。
 なお、本実施例では、図7に示すように、分析プラットフォーム構築処理前は、データ格納アドレス732はブランクである。なぜなら、分析プラットフォームに含まれるM/W(データ格納プログラム)のデプロイメント先となるVM202が未決定だからである。後述するように、分析プラットフォーム構築処理において、M/W(データ格納プログラム)のデプロイメント先のVM202が決定し、そのVM202のVMアドレスが、データ格納アドレス732としてDIテンプレート管理テーブル125に登録される。
 また、本実施例では、DIテンプレート管理テーブル125は、DIテンプレート管理プログラム115により、下記のように構築される。例えば、DIテンプレート管理プログラム115は、デプロイメント管理プログラム116又は他のプログラムと通信することにより、テーブル125を構築できる。
(*)分析フローテンプレートが選択され、その分析フローテンプレートに関連付けられているデータソースの各々について具体的なデータソースが選択された場合、そのデータソースに紐付けられているDBMSの識別子が、データ取得プログラム識別子721として登録され、そのDBMSを実行するVMのアドレスが、データ取得アドレス722として登録される。なお、「具体的なデータソース」の一例が、後述の図18のメイン画面1800を介して選択されたデータソース(例えば「POS」又は「Event」)である。
(*)選択された分析フローテンプレート内のDIツール識別子が、DIツール識別子74として登録される。複数のデータソースについてDIツールが共通の場合、その複数のデータソースについて同一のDIツール識別子74が登録される。
(*)選択された分析フローテンプレートに紐付いているDBMS(又は、そのDBMSに代えて、分析ユーザにより選択されたDBMS)の識別子が、データ格納プログラム識別子731として登録される。
(*)上述したように、データ格納プログラムとしてのDBMSのデプロイメント先のVMが決まったときに(又は、そのDBMSが実際にVMにデプロイされたときに)、デプロイメント先のVMのアドレスが、データ取得アドレス722として登録される。これにより、選択された分析フローテンプレートに基づきDIテンプレート管理テーブル125が完成したことになる。
 また、DIテンプレート管理テーブル125が保持する情報は、デプロイメント対象のDIツールに埋め込まれてもよいし、DIツールのデプロイ後に送信されるDIツール起動要求に関連付けられてもよい。これにより、DIツールは、データの取得元とデータの転送先とを知ることができる。
 また、DIテンプレート管理テーブル125において、データソースについて一義的にそのデータソースに対応したデータ取得プログラム識別子721及びデータ取得アドレス722が決まってもよい。データ取得プログラムもデプロイメント対象であれば、データ取得プログラムのデプロイメント先のVMが決まった場合に、データ取得アドレス722が登録されてよい。
 また、データ格納プログラムの格納先データストア内のデータが、本実施例において、「分析対象データ」である。分析対象データが、分析プラットフォーム構築後の分析処理においてBIツールにより参照される。
 図8は、BIテンプレート管理テーブル123の構成を示す。
 BIテンプレート管理テーブル123は、BIツールが分析対象データの参照(取得)するためにBIツールのアクセス先となるプログラム(典型的には、データストアにデータを格納したデータ取得プログラム)と、そのプログラムのインタフェースとに関する情報を保持する。そのようなプログラムとそのプログラムのインタフェースとの組を、本実施例の説明において「BIテンプレート」と言う。例えば、BIテンプレート管理テーブル125は、BIテンプレート毎に、プログラム識別子81とインタフェース種類名82とを保持する。プログラム識別子81が、BIツールのアクセス先となるプログラム(典型的にはデータ取得プログラム)の識別子である。インタフェース種類名82は、そのプログラムのインタフェースの種類の名称である。
 図9は、H/W設定管理テーブル121の構成を示す。
 H/W設定管理テーブル121は、VMとVMに関連付けられたH/Wとの紐付けに関する情報を保持する。例えば、H/W設定管理テーブル121は、VM毎に、ホスト識別子91、IPアドレス92、HBAアドレス93、及びVM識別子94を保持する。ホスト識別子91は、VMが動作するサーバ2の識別子である。IPアドレス92は、VMが動作するサーバ2のIPアドレスである。HBAアドレス93は、VMに割り当てられたH/Wの1つであるHBA(サーバ2のHBA)のアドレスである。VMからのI/O(Input/Output)要求が、そのVMに割り当てられたHBA経由でストレージ装置3に送られる。ストレージ装置3へのアクセスが不要なVMについて、HBAアドレス93はブランクでもよい。VM識別子94は、VMの識別子である。
 図10は、VM管理テーブル122の構成を示す。
 VM管理テーブル122は、VMに関する情報を保持する。例えば、VM管理テーブル122は、VM毎に、M/W識別子1001、VM識別子1002及びIPアドレス1003を保持する。M/W識別子1001が、VMにデプロイされたM/Wの識別子である。VM識別子1002は、当該VMの識別子である。IPアドレス1003は、当該VMに割り当てられたIPアドレスである。
 図11は、ユーザ管理テーブル126の構成を示す。
 ユーザ管理テーブル126は、分析ユーザとその分析ユーザについての分析プラットフォームに関する情報を保持する。例えば、ユーザ管理テーブル126は、ユーザ名1101、テンプレート識別子1102、構築日時1103、データソース識別子1104、データ取得プログラム識別子1105、データ格納プログラム識別子1108、DIツール識別子1109、及び削除日時1110を保持する。ユーザ名1101は、分析ユーザ(分析プラットフォーム構築の要求元のユーザ)の名称である。テンプレート識別子は、分析ユーザにより選択された分析フローテンプレートの識別子である。構築日時1103は、その選択された分析フローテンプレートに従う分析プラットフォームが構築された日時である。データソース識別子1104は、データソースの識別子である。データ取得プログラム識別子1105は、データ取得プログラムの識別子である。識別子1104及び1105の組は、データ取得元となるデータソースの数分存在する。図11の例では、2つの組、すなわち、識別子1104A及び1105Aの組と、識別子1104B及び1105Bの組が存在する。データ格納プログラム識別子1108は、データ格納プログラムの識別子である。DIツール識別子1109は、DIツールの識別子である。削除日時1110は、当該分析プラットフォームが削除された日時である(削除予定の日時でもよい)。ユーザ管理テーブル126から分析プラットフォームを特定可能である。
 図12は、変換テーブル127の構成を示す。
 変換テーブル127は、データ形式の変換の要否に関する情報を保持する。例えば、変換テーブル127は、データ取得プログラム識別子1201と、データ格納プログラム識別子1202とのマトリクスである。「Yes」が、データ形式の変換が必要であることを意味する。「No」が、データ形式の変換が不要であることを意味する。図12によれば、例えば、データ取得プログラム「DB-01」によりデータソースから取得されたデータをデータ格納プログラム「DB-02」に転送する場合、取得されたデータの形式を変換する必要がある。また、例えば、データ取得プログラム「DB-01」によりデータソースから取得されたデータをデータ格納プログラム「DB-03」に転送する場合、取得されたデータの形式を変換する必要はない。
 図18~図22は、クライアント5に表示される画面例を示す。図18~図22が示すいずれの画面も、分析プラットフォームデプロイアプリケーション501により表示される。分析プラットフォームデプロイアプリケーション501は、デプロイ管理サーバ1と通信することにより、図18~図22が示す画面を表示できる。図18~図22が示すいずれの画面も、本実施例ではGUI(Graphical User Interface)である。
 図18は、メイン画面の一例を示す。
 メイン画面1800は、ユーザ名が入力される欄1801、パスワードが入力される欄1802、分析プロジェクト名が入力される欄1803、分析フローテンプレートの識別子が入力される欄1804、M/W(ここではDBMS)の識別子が入力される欄1805、分析規模が入力される欄1806、データソースの識別子が入力される欄1807、及び、「デプロイ」ボタン1809を有する。欄1807は、関連付けられるデータソースの数分ある。分析ユーザが、欄1801~1807に必要な情報を入力してボタン1809を押下することで、クライアント5から分析プラットフォーム構築要求が送信される。その要求には、欄1801~1807に入力された情報、例えば、分析フローテンプレート識別子、M/W(ここではDBMS)識別子、H/W関連情報(例えば、分析規模及びH/W詳細のうちの少なくとも一方)、及び、データソース識別子が含まれている。
 なお、欄1804が押下された場合、図19の分析フローテンプレート選択画面が表示される。欄1805が押下された場合、図20のM/W選択画面が表示される。欄1806が押下された場合、図21のH/W性能選択画面が表示される。欄1807が押下された場合、図22のデータソース選択画面が表示される。
 図19は、分析フローテンプレート選択画面の一例を示す。
 分析フローテンプレート選択画面1900は、分析フローテンプレート管理テーブル124に登録されている分析フローテンプレートの一覧を表示する。また、画面1900には、「Prev」ボタン1902、「OK」ボタン1903、及び、「Next」ボタン1904が表示される。例えば、1つの画面1900には、3つの分析フローテンプレートオブジェクト1901-1~1901-3が表示される。分析フローテンプレートオブジェクト1901は、分析フローテンプレートを表すオブジェクト(例えばM/W及び分析対象データのブロック図)である。4つ以上の分析フローテンプレートが存在する場合、「Prev」ボタン1902及び「Next」ボタン1904を操作することで、4つ以上の分析フローテンプレートオブジェクト1901を分析ユーザは見ることができる。分析ユーザは、所望の分析フローテンプレートを選択する。具体的には、例えば、分析フローテンプレートオブジェクト1901毎にラジオボタンが設けられており、分析ユーザは、所望の分析フローテンプレートに対応したラジオボタンを選択し、その後、「OK」ボタン1903を押下する。これにより、分析ユーザの所望の分析フローテンプレートが選択(指定)されたことになり、その分析フローテンプレートの識別子が、図18の欄1804に反映される。
 図20は、M/W選択画面の一例を示す。
 M/W選択画面2000は、DBMSの一覧2001と「OK」ボタン2002を表示する。DBMSの一覧2001は、例えば、分析プラットフォームデプロイアプリケーション501がM/W管理プログラム112からDBMS一覧情報を受信することにより表示可能である。分析ユーザは、所望のDBMSを選択する。具体的には、例えば、一覧2001は、DBMS識別子毎にラジオボタンを有しており、分析ユーザは、所望のDBMSに対応したラジオボタンを選択し、その後、「OK」ボタン2002を押下する。これにより、分析ユーザの所望のDBMSが選択(指定)されたことになり、そのDBMSの識別子が、図18の欄1805に反映される。なお、ここで選択されたDBMSの識別子は、図7のデータ格納プログラム識別子731として登録される識別子である。例えば、選択された分析フローテンプレート「SCM-1」(図13)によれば、2つのデータソースについてデータ格納プログラムとしてのDBMSは共通しているため、選択可能なDBMSは1つである。つまり、ここでは、分析フローテンプレート「SCM-1」に紐付いているDBMS「DB-01」を別のDBMSに変更したいときに、分析ユーザ所望の別のDBMSに変更できる。
 図21は、H/W性能選択画面の一例を示す。
 H/W性能選択画面2100は、規模選択ボタン群2101、規模情報表示欄2102、同時接続ユーザ数入力欄2103及び「OK」ボタン2104を有する。規模選択ボタン群2101は、複数段階の規模(例えば、Small、Medium、Largeの3段階の規模)のうちの分析ユーザ所望の規模の選択を受け付けるUI(ユーザインタフェース)の一例である。分析ユーザが所望の規模のラジオボタンを選択すると、その規模に対応したH/W詳細が規模情報表示欄2102に表示される。
 例えば、規模とH/W詳細との対応関係は、H/W管理プログラム111(又は、そのプログラム111が参照する図示しないテーブル)に登録されている。また、例えば、M/WやBIツールのH/W要件も、H/W管理プログラム111(又は、そのプログラム111が参照する図示しないテーブル)に登録されている。規模とH/W詳細の対応関係の一例は下記である。
-CPU:VMに搭載するM/WやBIツールのH/W要件の最小値
-メモリ:VMに搭載するM/WやBIツールのH/W要件の最小値
-ストレージ:VMに搭載するM/WのH/W要件の推奨値
<Medium>
-CPU:VMに搭載するM/WやBIツールのH/W要件の推奨値
-メモリ:VMに搭載するM/WやBIツールのH/W要件の推奨値
-ストレージ:VMに搭載するM/WのH/W要件の推奨値とデータソースサイズとのうちの大きい方。
<Large>
-CPU:VMに搭載するM/WやBIツールのH/W要件の推奨値×α(αは、分析対象データのサイズ等の条件を基に適宜決定)
-メモリ:VMに搭載するM/WやBIツールのH/W要件の推奨値×α
-ストレージ:VMに搭載するM/WのH/W要件の推奨値とデータソースサイズとのうちの大きい方
 採用されるべきH/W詳細(H/Wの種類とH/Wのリソース量)は、選択された規模をキーに下記の対応関係から特定されたH/W詳細でもよい。また、選択されるべき規模、又は、採用されるべきH/W詳細は、計算機システムから定期的に収集された性能情報と、M/WやBIツール毎の統計情報とのうちの少なくとも1つを基に決められてもよい。性能情報は、計算機システムコンポーネントの性能を表す情報である。計算機システムコンポーネントは、サーバ2、サーバ2内のリソース、ストレージ装置3、及び、ストレージ装置3内のリソースのうちの少なくとも1つである。
 分析ユーザは、同時接続ユーザ数入力欄2103に、同時接続ユーザ数(分析プラットフォームを同時間帯に使用するユーザ数)を入力する。入力された同時接続ユーザ数を基に、必要に応じて、採用される規模又はH/W詳細が調整される。同時接続ユーザ数とH/W調整量との対応関係は、H/W管理プログラム111(又は、そのプログラム111が参照する図示しないテーブル)に登録されている。
 H/W詳細の表示は、例えば、分析プラットフォームデプロイアプリケーション501がH/W管理プログラム111と通信することにより、可能である。
 規模の選択と同時接続ユーザ数の入力との後に「OK」ボタン2104が押された場合、規模が確定し、確定した規模が、図18の欄1806に反映される。
 図22は、データソース選択画面2200の一例を示す。
 データソース選択画面2200には、例えば、ファイルシステムのツリー型でデータソースが表示される。分析ユーザは、そのツリーから所望のデータソースを選択する。すると、選択されたデータソースの識別子が、図18の欄1807に反映される。なお、例えば、分析フローテンプレートとして、図13に例示のテンプレートが選択された場合、Data1(第1のデータソース)として「POS」(Point Of Sale)が選択され、Data2(第2のデータソース)として「Event」が選択される(図7及び図13参照)。
 以下、分析プラットフォーム構築処理の流れを説明する。
 図14は、分析プラットフォーム構築処理のフローを示す。
 デプロイメント管理プログラム116と、VM管理プログラム402と、VM202との間で情報の授受が行われ、分析プラットフォームが構築される。
 デプロイメント管理プログラム116が、クライアント5からの分析プラットフォーム構築要求を受け付けた場合、当該要求から、選択された分析フローテンプレートを特定する(ステップ1405)。分析プラットフォーム構築要求には、上述したように、選択された分析フローテンプレートの識別子が含まれており、その識別子から、選択された分析フローテンプレートを特定可能である。
 また、デプロイメント管理プログラム116は、分析プラットフォーム構築要求に含まれるH/W関連情報(例えば、分析規模及びH/W詳細)を基に、VM管理プログラム402に対して、VMデプロイ要求を通知する(ステップ1406)。VM管理プログラム402は、VMデプロイ要求に従い、必要な数のVMイメージを、複数のサーバ2-1~2-nから選択した1以上のサーバ2にデプロイし(VMイメージが関連付けられた要求を送信し)する(ステップ1407)。デプロイされたVMイメージに従うVM202が、そのデプロイメント先のサーバ2で生成され起動する。VM202の生成や起動は、サーバ2内のハイパバイザ201により実行される。結果として、VM202がサーバ2にデプロイされたことになる。なお、デプロイされた1以上のVM202にそれぞれ割り当てられたH/W量(例えば、CPU使用率、メモリ量等)は、同一(均等)であってもよいし異なっていてもよい。また、H/W詳細が、M/WやBIツールのH/W要件に基づいて決まった場合、デプロイメント対象のVM202に割り当てられるH/W量が、そのVM202がデプロイメント先とされるM/WやBIツールのH/W要件に基づき決められてもよい。
 VM202がサーバ2にデプロイされることで、VM202のアドレスが決まり、VM202のアドレスを、VM管理プログラム402が知ることになる。VM管理プログラム402は、デプロイしたVM202のアドレス(本実施例ではIPアドレス)をデプロイメント管理プログラム116に返信する(ステップ1408)。この例では、4つのVM02~05がデプロイされ、それら4つのVM02~05にそれぞれ対応した4つのIPアドレスがデプロイメント管理プログラム116に通知される。VM202のアドレスを通知されたデプロイメント管理プログラム116は、H/W設定管理テーブル121及びVM管理テーブル122のVM202に関わる情報を追加あるいは更新する(ステップ1409)。
 デプロイメント管理プログラム116は、デプロイされたVM202に対して、選択された分析フローテンプレート(ステップ1405で特定した分析フローテンプレート)に従い、M/WやBIツールをデプロイする(ステップ1410)。ステップ1410において、デプロイメント対応関係が決定する。「デプロイメント対応関係」とは、分析プラットフォームの構成要素としてのプログラム(M/WやBIツール)と、そのプログラムのデプロイメント先のVMとの関係である。M/WやBIツール(分析プラットフォームの構成要素となるプログラムの一例)のデプロイメント先のVM202は、任意であってもよいし、M/WやBIツールに求められるH/W要件と実際に割り当てられたH/W量とに基づき決定されてもよい。デプロイメント先のVM202において、デプロイメント対象(M/WやBIツール)がインストールされる(ステップ1411、1412)。図14の例によれば、M/W(DBMS)のデプロイメント先はVM04であり、BIツールのデプロイメント先はVM05である。更に、稼動状況を監視するモニタエージェントプログラム(図示せず)をM/Wに併せてVMにデプロイすることで、そのVMにおいて、必要なプログラム(例えば当該M/W)が正しくインストールされ稼動しているか否かを監視することができる。モニタエージェントプログラムは、例えば、各VM202のOSのログ情報を定期的に取得する(ステップ1419)。図では、便宜上、ステップ1419は、ステップ1418の後に示しているが、ステップ1419は、ステップ1411及び1412の後、定期的に実行されてよい。
 次に、デプロイメント管理プログラム116は、選択された分析フローテンプレート及び決定されたデプロイメント対応関係に基づき、DIテンプレート管理テーブル125を更新する(ステップ1413)。具体的には、デプロイメント管理プログラム116は、例えば、DIテンプレート管理プログラム115に、DIテンプレート管理テーブル125を更新させる。更新は、例えば次の通りである。すなわち、DIテンプレート管理テーブル125のデータソース識別子71毎に、DIツール識別子74に対応するDBMSの識別子が、データ格納プログラム識別子731として登録される。また、そのDBMSのデプロイメント先のVMのアドレス(ステップ1408で返信されたアドレス)が、データ格納アドレス732として登録される。
 デプロイメント管理プログラム116は、DIツールのデプロイメント先とされたVM202に対して、DIツールをデプロイする(例えばDIツールの実行ファイルが関連付いた要求をVM202に送信する)(ステップ1414)。DIツールが、VM202にインストールされる(ステップ1415、1416)。図14の例によれば、DIツールのデプロイメント先は、VM02及びVM03である。VM202にインストールされたDIツールは、そのDIツールに埋め込まれているアドレスが示すデータソースからデータを取得し、取得したデータを、そのDIツールに埋め込まれているアドレスが示すデータ出力先M/Wに転送する(ステップ1417、1418)。転送されたデータが、そのM/W(DBMS)によりデータストアに格納される。データ転送の際、DIツールは、データ形式の変換が必要な場合は、データ形式の変換処理を行う。デプロイメント対象のDIツールには、変換テーブル127に基づき、データ形式の変換の要否が関連付けられていてもよい。
 以上の分析プラットフォーム構築処理により、分析プラットフォームが構築される。その処理において、デプロイメント管理サーバ1により行われる処理が、分析プラットフォーム構築支援処理に相当する。
 図15は、デプロイメント管理サーバ1の処理のフローチャートである。
 管理プログラム110は、クライアント5より、分析プラットフォーム構築要求を受信する(ステップ1500)。管理プログラム110は、分析プラットフォーム構築要求から、選択された分析フローテンプレートを特定する(ステップ1501)。以下、その選択された分析フローテンプレートを、「選択分析テンプレート」と言う。管理プログラム110は、当該分析プラットフォーム構築要求の発行元ユーザが既存ユーザであるか否かを、ユーザ管理テーブル126から判断する(ステップ1502)。
 ステップ1502の判断結果が偽の場合(ステップ1502:n)、つまり、ユーザが新規ユーザの場合、管理プログラム110は、分析プラットフォーム構築要求に関連付いたH/W関連情報からH/W構成を特定する(ステップ1503)。管理プログラム110は、分析プラットフォーム構築要求、選択分析テンプレート及びH/W構成を基に、デプロイメント対象のプログラム(M/W、DIツール及びBIツール)とそのプログラムを動作させるために必要なVM202の台数とを算出し、VM管理サーバ4に対して、その算出結果(VM台数)を関連付けたVMデプロイ要求を発行する(ステップ1504)。VM管理サーバ4により、そのVMデプロイ要求に応答して、VM台数分のVMが生成され起動される。管理プログラム110は、VM管理サーバ4より、生成されたVM202の識別情報(例えばVMの識別子とIPアドレス)を受信する(ステップ1505)。
 管理プログラム110は、デプロイメント対応関係を決定し(生成されたVMにデプロイメント対象プログラムを割り当て)、その関係を基にVM管理テーブル122を更新する(ステップ1506)。管理プログラム110は、決定したデプロイメント対応関係に従い、デプロイメント対象のプログラム(M/W等)を、対応するVM202に対して、デプロイする(ステップ1507)。デプロイメント対象のプログラム(分析プラットフォームの構成要素としてのプログラム)と共にモニタエージェントプログラムもデプロイされてよい。デプロイされたそれらのプログラムは、デプロイメント先のVMにインストールされ、起動する。
 管理プログラム110は、DIテンプレート管理テーブル125を更新する(ステップ1508)。例えば、管理プログラム110は、分析プラットフォーム構築要求からデータソースを特定し、そのデータソースを操作可能なM/W(例えば、DBMS)を実行するVM202のアドレスを取得し、そのアドレスをデータ入力アドレス722として登録する。また、管理プログラム110は、選択分析テンプレートからDIツールを特定し、特定したDIツールの識別子を、DIツール識別子74として登録する。
 管理プログラム110は、DIテンプレート管理テーブル125を更に更新する(ステップ1509)。例えば、管理プログラム110は、データ出力先M/Wを実行するVM202のアドレスをVM管理テーブル122から特定し、特定したアドレスを、データ格納アドレス732として登録する(ステップ1509)。
 管理プログラム110は、DIテンプレート管理テーブル1102に従い、DIツールを、そのDIツールのデプロイメント先VM202にデプロイする(ステップ1510)。デプロイされたDIツールは、VM202にインストールされ、起動する。デプロイメント対象のDIツールには、DIテンプレート管理テーブル1102に従う情報、例えば、データソース識別子、データ取得プログラム識別子、データ取得アドレス(IPアドレスを含んでよい)、データ格納プログラム識別子、及びデータ格納アドレス(IPアドレスを含んでよい)が関連付けられてよい。また、その情報を基に変換テーブル127からデータ形式変換要否が特定されて、特定されたデータ形式変換要否も、デプロイメント対象のDIツールに関連付けられてよい。それらの関連付けられた情報を基に、DIツールは、データの取得元及び転送先や、データ形式の変換の要否がわかる。DIツールは、データ入力元(データソース)からデータを取得し転送する。これにより、分析対象データが用意され、結果として、分析プラットフォームが構築されたことになる。
 分析プラットフォーム構築後、各VM202にデプロイしたM/W群やアプリケーションが稼動しているかどうか、モニタエージェントにより監視され、その監視結果をモニタエージェントから受信し、管理プログラム110が、その監視結果を表示する(ステップ1511)。監視結果は、デプロイ管理サーバ1に表示されてもよいし、そのサーバ1に接続されている遠隔の計算機に表示されてもよい。
 さて、ステップ1502の判断結果が真の場合(ステップ1502:y)、つまり、ユーザが既存ユーザの場合、管理プログラム110は、選択分析テンプレートの識別子が、既存ユーザに対応したテンプレート識別子1102(図11)と同じか否かを判断する(ステップ1512)。ステップ1512の判断結果が偽の場合(ステップ1512:n)、ステップ1503以降が実行される。ステップ1512の判断結果が真の場合(ステップ1512:y)、既デプロイ環境と同じ環境のデプロイ処理である再デプロイ処理を実行する(ステップ1513)。
 図16は、再デプロイ処理1513の第1の例のフローチャートである。
 選択分析テンプレートに含まれるプログラム群が既存分析プラットフォーム(ユーザ管理テーブル126から特定された分析プラットフォーム)内のプログラム群と同じか否かを判断する(ステップ1600)。
 ステップ1600の判断結果が真の場合(ステップ1600:y)、管理プログラム110は、選択分析テンプレートに紐付いているデータソースと既存分析プラットフォームに紐付いているデータソースが同じか否かを判断する(ステップ1601)。選択分析テンプレートに紐付いているデータソースは、分析プラットフォーム構築要求に関連付いているデータソース識別子から特定され、既存分析プラットフォームに紐付いているデータソースは、ユーザ管理テーブルにおけるデータソース識別子1104から特定される。
 ステップ1601の判断結果が真の場合(ステップ1601:y)、管理プログラム110は、既存分析プラットフォームが現時点で稼動しているか否か(削除されていないか否か)を、ユーザ管理テーブル126を参照して、判断する(ステップ1602)。構築日時1103が登録されていて削除日時1110が未登録であれば、既存プラットフォームは稼働しているということである。
 ステップ1602の判断結果が真の場合(ステップ1602:y)、管理プログラム110は、既存分析プラットフォームと同じH/Wの構成情報(サーバ数、ストレージ容量)を取得する(ステップ1603)。その後、ステップ1504~1507が行われる。例えば、管理プログラム110は、ステップ1603で取得した構成情報に基づきVMの必要台数を算出し、必要台数分のVMを生成するためのVMデプロイ要求を、VM管理プログラム402へ発行する。その後、VM202の生成、M/W群の生成されたVM202へのデプロイが行われる。
 M/W群のデプロイ、インストール、起動終了後、管理プログラム110は、DIテンプレート管理テーブル125におけるデータ格納アドレス732を、分析プラットフォーム構築要求を基に特定されたアドレス(構築対象の分析プラットフォームにおけるM/W(データ格納プログラムの一例)を稼動するVM202のアドレス)に差し替える(ステップ1605)。つまり、DIテンプレート管理テーブル125のうちのデータ格納アドレス(出力先アドレス)732のみが変更され、その他は、既存分析プラットフォーム(又はその複製)の要素がそのまま使用されることになる。なお、分析プラットフォーム構築要求を基に特定されたデータ格納プログラム(M/W)と既存分析プラットフォーム(又はその複製)におけるデータ格納プログラムが異なっていれば、データ格納プログラム識別子731も変更される。
 ステップ1600の判断結果が偽の場合(すなわち、少なくとも1つのプログラムが異なる場合)(ステップ1600:n)、管理プログラム110は、データ形式の変換が可能か否かを変換テーブル127を基に判断する(ステップ1607)。
 ステップ1607の判断結果が真の場合(ステップ1607:y)、管理プログラム110は、既存分析プラットフォームのH/W構成情報を取得し、異なるM/W群の情報を基に、VM管理テーブル122、ユーザ管理テーブル126、及びDIテンプレート管理テーブル125を更新する(ステップ1608)。具体的には、例えば、管理プログラム110は、既存分析プラットフォームに紐付いている構成情報を取得し、M/Wを差替えることができる。
 ステップ1601の判断結果が偽の場合(ステップ1601:n)、ステップ1607の判断結果が偽の場合(ステップ1600:n)、又は、ステップ1608の後、管理プログラム110は、分析プラットフォーム構築要求に関連付いたH/W関連情報からH/W構成を特定する(ステップ1503)。
 以上の分析プラットフォーム構築処理によれば、分析ユーザが分析アプリケーション502(BIツールに分析要求を送信するプログラム)を操作して分析を行うまでの分析プラットフォーム構築処理の負荷を削減することができる。このため、分析プラットフォームの構築と分析のサイクルを短くすることが可能となり、Trial&Error型の分析手法を効率よく実行することが可能となる。すなわち、この例によれば、分析プラットフォーム構築要求に対して、新たに分析プラットフォームが構築される。その際、データソースが同じであれば、データソースからのデータのコピーは回避される。一方、選択分析テンプレートに含まれるM/W群(プログラム群の少なくとも一部の一例)が既存分析プラットフォーム内のM/W群と同じでも、M/W群のデプロイが行われる。具体的には、管理プログラム110は、既存分析プラットフォーム内のM/W群のコピーを、構築対象の分析プラットフォームの少なくとも一部とする(その際、M/W群の少なくとも一部の差し替えが行われてもよい)。このように、同じM/W群がデプロイされるので、構成の構築やリソースのサイジング等の処理工数を削減できる。
 なお、選択分析テンプレートに含まれるプログラム群が既存分析プラットフォーム内のプログラム群と同じ場合、管理プログラム110は、既存分析プラットフォーム内のプログラム群を、構築対象の分析プラットフォームの少なくとも一部としてもよい。すなわち、既存分析プラットフォームが流用されてもよい。言い換えれば、ステップ1507のようなM/Wデプロイ(M/W群のコピー)は行われないでよい。
 図17は、再デプロイ処理1513の第2の例のフローチャートである。
 第1の例によれば、ステップ1605及び1606のいずれにおいても、DIテンプレート管理テーブル125におけるデータ格納アドレス732が、分析プラットフォーム構築要求を基に特定されたアドレス(構築対象の分析プラットフォームにおけるM/Wを稼動するVM202のアドレス)に差し替えられる。このため、再度のデータ準備が必要である。具体的には、例えば、変更前のデータ格納アドレス732に従うデータストアから変更後のデータ格納アドレス732に従うデータストアに分析対象データがコピーされる。或いは、例えば、DIツールにより、データソースからデータが取得されそのデータがデータ格納プログラムに転送される。
 一方、第2の例によれば、ステップ1604:nの場合、ステップ1605に代えてステップ1700が行われる。ステップ1700では、DIテンプレート管理テーブル125におけるデータ格納アドレス732が、既存分析プラットフォームにおけるM/Wを稼動するVM202のアドレスに維持される点である。これにより、既存のデータを使用のコピーが不要である。故に、データの準備時間を削減することが可能となる。
 なお、第2の例によれば、ステップ1606に代えてステップ1701が行われる。ステップ1701でも、DIテンプレート管理テーブル125におけるデータ格納アドレス732が、既存分析プラットフォームにおけるM/Wを稼動するVM202のアドレスに維持される。しかし、データ形式の変換が必要であるため、DIツールにより、データソースからデータを取得しそのデータを転送することが実行される。
 また、管理プログラム110は、例えば、第1の例と第2の例のどちらを採用するかを、例えば次のように決定することができる。すなわち、管理プログラム110は、下記の(p)及び(q)の両方が満たされているか否かを判断する。その判断結果が偽の場合、管理プログラム110は、第1の例を採用する。その判断結果が真の場合、管理プログラム110は、第2の例を採用する。
(p)構築対象の分析プラットフォームにおけるデータ格納プログラム(M/W)の識別子と、既存分析プラットフォームにおけるデータ格納プログラムの識別子とが同じである。
(q)構築対象の分析プラットフォームにおけるデータ格納プログラム(M/W)を稼働するVM202のアドレスと、既存分析プラットフォームにおけるデータ格納プログラムを稼働するVM202のアドレスとが同じである。
 上述の実施例の説明の総括として、例えば下記を述べることができる。
 一般的に、分析プラットフォームを含んだ分析システムは、図23に一比較例として示すように、複数の関係者により運用される。具体的には、例えば、一比較例に従う分析処理手順は下記の通りである。
(S1)データサイエンティストの仮説に従い、データインテグレーション担当者、システム基盤担当者等のPF関係者(分析プラットフォーム関係者)間で打ち合わせを行う。日程調整、打ち合わせ、分析プラットフォーム構成の検討、分析プラットフォームプロビジョニングに、数日~数週間かかる場合が多い。
(S2)分析プラットフォーム構築完了後、データインテグレーション担当者が、データソースから、分析プラットフォームにデータを移動する。データサイズやデータソースに対する本来業務への影響等より、数時間~数日以上かかる場合がある。
(S3)分析ユーザは、仮説の検証、修正及び再検証のサイクルを繰り返す。
 仮説検証は、1分析ユーザに1つとは限らず、複数の仮説検証を並行して実施したり、多数の分析ユーザが並行して分析したりする場合が多い。分析システムも、集中型(scale-up)や分散型(scale-out)等、M/WやBIツールの特性により使い分けが必要である。人手による全体調整は膨大な時間がかかる。分析プラットフォームが構築できた時には既に異なる構成の分析プラットフォームが必要となる可能性がある。
 そして、分析処理において最も時間のかかる処理は、データの準備である。
 上記の課題は、一比較例に従う処理の少なくとも一部を単に自動化できたとしても、解決することはできないし、一比較例に従う処理のうちのどの処理を自動化できるのかを判断することも難しい。
 本実施例によれば、データの準備の自動化が実現される。
 具体的には、分析フローがテンプレート化される。複数の分析フローテンプレートが用意される。
 管理プログラム110が、分析ユーザから所望の分析フローテンプレートの選択を受け付ける。選択分析テンプレート(選択された分析フローテンプレート)が表す分析フローの分析プラットフォームが構築対象でもよいし、その分析フローのカスタマイズ後の分析フローの分析プラットフォームが構築対象でもよい。「カスタマイズ後の分析フロー」は、選択分析テンプレートが表す分析フローにおける一部の要素(プログラム)が差し替えられた分析フローであってもよいし、選択分析テンプレートが表す分析フローに新たな要素(プログラム)が追加された分析フローであってもよいし、選択分析テンプレートが表す分析フローから要素(プログラム)が削除された分析フローであってもよい。分析プラットフォーム構築要求に関連付けられた情報が表す分析フローは、選択分析テンプレートが表す分析フローであるか、カスタマイズ後の分析フローである。
 DIテンプレートは、DIツール(データ入力プログラムの一例)用の関連付け情報である。DIテンプレートが保持する情報がDIツールに関連付けられる(例えば、その情報がDIツールに埋め込まれる、又は、DIツールのデプロイメント先のVMに対する起動要求にその情報が関連付けられる)ことで、デプロイされ起動されたDIツールは、データ取得元(例えばデータソースからデータを取得するために使用する情報)と、データ転送先(例えば取得されたデータを転送するために使用する情報)とを特定できる。
 なお、各DIツールについて、そのDIツールに対応したDIテンプレートに予め少なくとも出力管理情報73を関連付けておくことはできない。なぜなら、そのDIツールに対応したデータ格納プログラム(例えばDBMSのようなM/W)及びそれのデプロイメント先のVMが決まっていないからである。
 そこで、本実施例では、データ格納プログラムが動作するVMが決まった場合に、そのVMの識別情報を含んだ出力管理情報73が、管理プログラム110により、そのデータ格納プログラムがデータ転送先となるDIツールに対応したDIテンプレートに登録される。この登録の処理が実行されることで、DIツールに、データ取得元(例えば入力管理情報72)の他にデータ転送先(出力管理情報73)を自動で関連付けることが可能となる。結果として、デプロイされ起動されたDIツールが、ユーザからデータの取得元や転送先に関する情報の指定を受けること無しに、データの取得と転送を実行できる。つまり、データ(分析対象データ)の準備の自動化が実現される。
 以上、本発明の一実施例を説明したが、本発明は、この実施例に限定されるものでなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
 例えば、分析プラットフォームの要素としてのプログラムのデプロイメント先は、VMに代えて、物理的な計算機(例えばサーバ)であってもよい。
 また、図6の例によれば、分析フローテンプレートには、DIツール識別子及びDBMS識別子のようなプログラム識別子が関連付けられているが、少なくとも1つのプログラム識別子に代えて、プログラム種類(例えば、DIツール、DBMS及びBIツールのうちのいずれの種類であるか)を表す識別子が関連付けられてよい。つまり、分析フローテンプレートは、プログラム種類の関連を表していればよく、分析フローテンプレートの選択後に、その分析フローテンプレートにおけるいずれのプログラム種類に具体的にいずれのプログラムを採用するかは分析ユーザにより選択されてもよい。
 また、分析プラットフォーム構築要求を受けたときに既存分析プラットフォームが存在する場合、既存分析プットフォームの複製が生成されて、既存分析プットフォームの複製と構築対象の分析プラットフォームとの差分に基づき、既存分析プットフォームの複製が流用されてもよい。或いは、既存分析プラットフォームが既に分析ユーザにとって不要であれば(削除可能であれば)、既存分析プラットフォームそれ自体と構築対象の分析プラットフォームとの差分に基づき、既存分析プラットフォームそれ自体が流用されてもよい。なお、ここで言う「流用」とは、差分の差し替えを意味する。具体的には、例えば、M/Wのようなプログラムの差し替えや、データソースの差し替えを意味する。データ形式の変換が不要であり、プログラムのみが差し替えられた場合、既存データストア内のデータを分析対象データとして使用継続が可能であることもある。また、差し替えられたプログラムがデータ格納プログラムの場合、データ格納プログラム識別子731が差し替えられてもデータ格納アドレス732の差し替えが不要であることもある(差し替え後のプログラムのデプロイメント先が、差し替え前のプログラムを稼働するVMである場合)。
 また、例えば、デプロイ対象がBIツールの場合、そのBIツールには、分析対象データの格納場所を示すアドレスが関連付けられる(例えば、BIツールに、そのアドレスが埋め込まれる、又は、BIツールの起動要求にそのアドレスが関連付けられる)。このため、例えば、差し替え対象のプログラムがBIツールであり、且つ、差し替え前のBIツールのアクセス先に差し替え後のBIツールをアクセス可能にする場合、差し替え後のBIツールには、差し替え前のBIツールに関連付けられていたアクセス先アドレスと同じアドレスが関連付けられる(図17に示した第2の例の一具体例)。
1:デプロイメント管理サーバ

Claims (15)

  1.  複数のハードウェアを有する1以上の計算機を含んだ計算機システムを管理する管理システムであって、
     ユーザの入力情報が関連付けられた分析プラットフォーム構築要求を受け付ける1以上のインタフェースを含んだインタフェース部と、
     前記インタフェース部に接続された1以上のプロセッサを含むプロセッサ部と
    を有し、
     前記入力情報が、下記を表す情報を含み、
      複数の分析フローテンプレートのうちの前記ユーザにより選択された分析フローテンプレートである選択分析テンプレート、及び、
      複数のデータソースのうちの前記ユーザにより選択され前記選択分析テンプレートに関連付けられる1以上のデータソース、
     前記複数の分析フローテンプレートの各々は、複数のミドルウェアを含む複数のプログラムのうちの少なくとも2つのプログラムの関連を分析フローとして定義したテンプレートであり、
     前記入力情報に、構築対象の分析プラットフォームの構成要素となる2以上のプログラムが関連付けられており、
     前記2以上のプログラムが、1以上のデータ入力プログラムと、1以上のデータ格納プログラムとを含み、
     前記1以上のデータ入力プログラムの各々は、そのプログラムに関連付けられたデータソースからデータを取得し取得されたデータを転送するプログラムであり、
     前記1以上のデータ格納プログラムの各々は、少なくとも1つのデータ入力プログラムにより取得されたデータの転送先でありその転送されたデータを格納するプログラムであり、
     前記プロセッサ部が、前記分析プラットフォーム構築要求に応答した処理である構築処理において、
      前記1以上のデータ入力プログラムの各々について、そのデータ入力プログラム用の関連付け情報であるデータ入力テンプレートに、前記1以上の計算機のうちの少なくとも1つの計算機に生成された1以上の仮想計算機のうちの、そのデータ入力プログラムに対応したデータ転送先のデータ格納プログラムのデプロイメント先である仮想計算機の識別情報を関連付け、
      前記2以上のプログラムの各々を、前記1以上の仮想計算機のうちの、そのプログラムのデプロイメント先の仮想計算機にデプロイし、
     デプロイされた前記1以上のデータ入力プログラムの各々に、そのデータ入力プログラムにより取得されたデータの転送先をそのデータ入力プログラムに特定可能にせしめるために、そのデータ入力プログラムに対応したデータ入力テンプレートが有する情報が関連付けられる、
    管理システム。
  2.  前記1以上の仮想計算機は、前記入力情報に基づき前記プロセッサ部によって決定された数の仮想計算機であって、前記計算機システムにデプロイされた仮想計算機である、
    請求項1記載の管理システム。
  3.  前記入力情報は、更に、前記構築対象の分析プラットフォームのためのハードウェア構成に関する情報であるハードウェア関連情報を含み、
     前記決定された数は、前記ハードウェア管理情報から前記プロセッサ部により特定されたハードウェア構成に基づき決定された数である、
    請求項2記載の管理システム。
  4.  前記プロセッサ部は、前記2以上のプログラムのうちの少なくとも1つについて、そのプログラムのデプロイメント先の仮想計算機に、そのプログラムの他に、そのプログラムがその仮想計算機に正しくインストールされ稼働しているか否かを監視するプログラムであるモニタエージェントプログラムをデプロイする、
    請求項1記載の管理システム。
  5.  既存の分析プラットフォームがある場合、前記構築処理が、前記既存の分析プラットフォームと前記構築対象の分析プラットフォームとの差分に依存する、
    請求項1記載の管理システム。
  6.  前記差分が、データ格納プログラムの場合、前記プロセッサ部は、前記データ入力テンプレートにおける、前記既存の分析プラットフォームにおけるデータ格納プログラムのデプロイメント先仮想計算機の識別情報を、前記構築対象の分析プラットフォームにおけるデータ格納プログラムのデプロイメント先仮想計算機の識別情報に差し替える、
    請求項5記載の管理システム。
  7.  前記構築対象の分析プラットフォームにおけるミドルウェア群と前記既存の分析プラットフォームにおけるミドルウェア群とが同じ場合、前記プロセッサ部は、前記構築処理において、前記既存の分析プラットフォーム内のそのミドルウェア群のコピーを、前記構築対象の分析プラットフォームの少なくとも一部とする、
    請求項5記載の管理システム。
  8.  前記構築対象の分析プラットフォームにおけるミドルウェア群と前記既存の分析プラットフォームにおけるミドルウェア群とが同じ場合、前記プロセッサ部は、前記構築処理において、前記既存の分析プラットフォーム内のそのミドルウェア群を、前記構築対象の分析プラットフォームの少なくとも一部とする、
    請求項5記載の管理システム。
  9.  複数のハードウェアを有する1以上の計算機を含んだ計算機システムに環境であるプラットフォームの構築を支援するプラットフォーム構築支援方法であって、
     (a)ユーザの入力情報が関連付けられた分析プラットフォーム構築要求を受け付け、
      前記入力情報が、下記を表す情報を含み、
        複数の分析フローテンプレートのうちの前記ユーザにより選択された分析フローテンプレートである選択分析テンプレート、及び、
        複数のデータソースのうちの前記ユーザにより選択され前記選択分析テンプレートに関連付けられる1以上のデータソース、
      前記複数の分析フローテンプレートの各々は、複数のミドルウェアを含む複数のプログラムのうちの少なくとも2つのプログラムの関連を分析フローとして定義したテンプレートであり、
      前記入力情報に、構築対象の分析プラットフォームの構成要素となる2以上のプログラムが関連付けられており、
      前記2以上のプログラムが、1以上のデータ入力プログラムと、1以上のデータ格納プログラムとを含み、
      前記1以上のデータ入力プログラムの各々は、そのプログラムに関連付けられたデータソースからデータを取得し取得されたデータを転送するプログラムであり、
      前記1以上のデータ格納プログラムの各々は、少なくとも1つのデータ入力プログラムにより取得されたデータの転送先でありその転送されたデータを格納するプログラムであり、
     (b)前記分析プラットフォーム構築要求に応答した処理である構築処理において、
      (b1)前記1以上のデータ入力プログラムの各々について、そのデータ入力プログラム用の関連付け情報であるデータ入力テンプレートに、前記1以上の計算機のうちの少なくとも1つの計算機に生成された1以上の仮想計算機のうちの、そのデータ入力プログラムに対応したデータ転送先のデータ格納プログラムのデプロイメント先である仮想計算機の識別情報を関連付け、
      (b2)前記2以上のプログラムの各々を、前記1以上の仮想計算機のうちの、そのプログラムのデプロイメント先の仮想計算機にデプロイし、
         デプロイされた前記1以上のデータ入力プログラムの各々に、そのデータ入力プログラムにより取得されたデータの転送先をそのデータ入力プログラムに特定可能にせしめるために、そのデータ入力プログラムに対応したデータ入力テンプレートが有する情報が関連付けられる、
    プラットフォーム構築支援方法。
  10.  前記1以上の仮想計算機は、前記入力情報に基づき前記プロセッサ部によって決定された数の仮想計算機であって、前記計算機システムにデプロイされた仮想計算機である、
    請求項9記載のプラットフォーム構築支援方法。
  11.  前記入力情報は、更に、前記構築対象の分析プラットフォームのためのハードウェア構成に関する情報であるハードウェア関連情報を含み、
     前記決定された数は、前記ハードウェア管理情報から前記プロセッサ部により特定されたハードウェア構成に基づき決定された数である、
    請求項10記載のプラットフォーム構築支援方法。
  12.  前記2以上のプログラムのうちの少なくとも1つについて、そのプログラムのデプロイメント先の仮想計算機に、そのプログラムの他に、そのプログラムがその仮想計算機に正しくインストールされ稼働しているか否かを監視するプログラムであるモニタエージェントプログラムをデプロイする、
    請求項9記載のプラットフォーム構築支援方法。
  13.  既存の分析プラットフォームがある場合、前記構築処理が、前記既存の分析プラットフォームと前記構築対象の分析プラットフォームとの差分に依存する、
    請求項9記載のプラットフォーム構築支援方法。
  14.  前記差分が、データ格納プログラムの場合、前記データ入力テンプレートにおける、前記既存の分析プラットフォームにおけるデータ格納プログラムのデプロイメント先仮想計算機の識別情報を、前記構築対象の分析プラットフォームにおけるデータ格納プログラムのデプロイメント先仮想計算機の識別情報に差し替える、
    請求項13記載のプラットフォーム構築支援方法。
  15.  複数のハードウェアを有する1以上の計算機を含んだ計算機システムの管理システムにおける少なくとも1つのプロセッサによって実行される管理プログラムであって、
     (a)ユーザの入力情報が関連付けられた分析プラットフォーム構築要求を受け付け、
      前記入力情報が、下記を表す情報を含み、
        複数の分析フローテンプレートのうちの前記ユーザにより選択された分析フローテンプレートである選択分析テンプレート、及び、
        複数のデータソースのうちの前記ユーザにより選択され前記選択分析テンプレートに関連付けられる1以上のデータソース、
      前記複数の分析フローテンプレートの各々は、複数のミドルウェアを含む複数のプログラムのうちの少なくとも2つのプログラムの関連を分析フローとして定義したテンプレートであり、
      前記入力情報に、構築対象の分析プラットフォームの構成要素となる2以上のプログラムが関連付けられており、
      前記2以上のプログラムが、1以上のデータ入力プログラムと、1以上のデータ格納プログラムとを含み、
      前記1以上のデータ入力プログラムの各々は、そのプログラムに関連付けられたデータソースからデータを取得し取得されたデータを転送するプログラムであり、
      前記1以上のデータ格納プログラムの各々は、少なくとも1つのデータ入力プログラムにより取得されたデータの転送先でありその転送されたデータを格納するプログラムであり、
     (b)前記分析プラットフォーム構築要求に応答した処理である構築処理において、
      (b1)前記1以上のデータ入力プログラムの各々について、そのデータ入力プログラム用の関連付け情報であるデータ入力テンプレートに、前記1以上の計算機のうちの少なくとも1つの計算機に生成された1以上の仮想計算機のうちの、そのデータ入力プログラムに対応したデータ転送先のデータ格納プログラムのデプロイメント先である仮想計算機の識別情報を関連付け、
      (b2)前記2以上のプログラムの各々を、前記1以上の仮想計算機のうちの、そのプログラムのデプロイメント先の仮想計算機にデプロイし、
         デプロイされた前記1以上のデータ入力プログラムの各々に、そのデータ入力プログラムにより取得されたデータの転送先をそのデータ入力プログラムに特定可能にせしめるために、そのデータ入力プログラムに対応したデータ入力テンプレートが有する情報が関連付けられる、
    管理プログラム。
PCT/JP2016/071023 2016-07-15 2016-07-15 管理システム及びプラットフォーム構築支援方法 WO2018011985A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/071023 WO2018011985A1 (ja) 2016-07-15 2016-07-15 管理システム及びプラットフォーム構築支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/071023 WO2018011985A1 (ja) 2016-07-15 2016-07-15 管理システム及びプラットフォーム構築支援方法

Publications (1)

Publication Number Publication Date
WO2018011985A1 true WO2018011985A1 (ja) 2018-01-18

Family

ID=60951678

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/071023 WO2018011985A1 (ja) 2016-07-15 2016-07-15 管理システム及びプラットフォーム構築支援方法

Country Status (1)

Country Link
WO (1) WO2018011985A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060161387A1 (en) * 2004-12-30 2006-07-20 Microsoft Corporation Framework for collecting, storing, and analyzing system metrics
WO2014010071A1 (ja) * 2012-07-13 2014-01-16 株式会社日立製作所 データ分析支援方法及びシステム
JP2016519810A (ja) * 2013-03-15 2016-07-07 アマゾン・テクノロジーズ・インコーポレーテッド 半構造データのためのスケーラブルな分析プラットフォーム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060161387A1 (en) * 2004-12-30 2006-07-20 Microsoft Corporation Framework for collecting, storing, and analyzing system metrics
WO2014010071A1 (ja) * 2012-07-13 2014-01-16 株式会社日立製作所 データ分析支援方法及びシステム
JP2016519810A (ja) * 2013-03-15 2016-07-07 アマゾン・テクノロジーズ・インコーポレーテッド 半構造データのためのスケーラブルな分析プラットフォーム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TANAKA MASAHIRO: "Software infrastructure for big data analysis on heterogeneous environment", IEICE TECHNICAL REPORT, vol. 114, no. 525, 15 August 2004 (2004-08-15), pages 83 - 88, ISSN: 0913-5685 *

Similar Documents

Publication Publication Date Title
JP7009455B2 (ja) 分散イベント処理システムにおけるデータシリアライズ
EP3579101B1 (en) Constraint-based upgrade and deployment
US7818428B1 (en) Methods and apparatus for naming resources
US8832130B2 (en) System and method for implementing on demand cloud database
US9026502B2 (en) Feedback optimized checks for database migration
CN104679717B (zh) 集群弹性部署的方法和管理系统
CN112099918A (zh) 容器化环境中的集群的实时迁移
WO2020253079A1 (zh) 基于Jmeter的分布式性能测试方法、装置、设备及存储介质
US9323789B1 (en) Automated application protection and reuse using a workflow component
CN112860479A (zh) 存储数据的方法及云数据中心
US20220327040A1 (en) Automated query retry execution in a database system
US8024169B2 (en) Storage area network management modeling simulation
JP2004164611A (ja) 属性データの管理
US9898273B1 (en) Dynamically updating APIS based on updated configuration file of a computing system
US11487708B1 (en) Interactive visual data preparation service
JP2013186793A (ja) 情報処理装置、イメージファイル作成方法およびプログラム
US7860919B1 (en) Methods and apparatus assigning operations to agents based on versions
JP6244496B2 (ja) サーバストレージシステムの管理システム及び管理方法
JP2011081579A (ja) Itシステム仮想化における仮想リソースのシステム運用管理方法およびシステム
WO2018011985A1 (ja) 管理システム及びプラットフォーム構築支援方法
JP6546704B2 (ja) データ処理方法、分散型データ処理システム及び記憶媒体
US20200028739A1 (en) Method and apparatus for closed-loop and dynamic capacity management in a web-scale data center
JP2019070972A (ja) 情報処理システム、情報処理装置及びプログラム
US9645851B1 (en) Automated application protection and reuse using an affinity module
CN102841842A (zh) 用于下一代测试系统的自动化控制器

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16908886

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16908886

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP