WO2019187208A1 - 情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムが格納された非一時的なコンピュータ可読媒体 - Google Patents

情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムが格納された非一時的なコンピュータ可読媒体 Download PDF

Info

Publication number
WO2019187208A1
WO2019187208A1 PCT/JP2018/032969 JP2018032969W WO2019187208A1 WO 2019187208 A1 WO2019187208 A1 WO 2019187208A1 JP 2018032969 W JP2018032969 W JP 2018032969W WO 2019187208 A1 WO2019187208 A1 WO 2019187208A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
file
data
output
management
Prior art date
Application number
PCT/JP2018/032969
Other languages
English (en)
French (fr)
Inventor
徹 脇谷
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2020508950A priority Critical patent/JP7081658B2/ja
Priority to US17/043,290 priority patent/US20210019323A1/en
Publication of WO2019187208A1 publication Critical patent/WO2019187208A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2308Concurrency control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata

Definitions

  • the present invention relates to an information processing device, a data management system, a data management method, and a data management program, and in particular, an information processing device, a data management system, a data management method, and data for managing data in files for a plurality of different uses. Regarding management programs.
  • Patent Documents 1 to 3 disclose techniques for converting log data into a common format.
  • Patent Document 1 log information is collected from various servers, and the collected log information is converted into a data set to be input data when performing statistical processing, statistical processing is performed, and the result of statistical processing is displayed in a display format.
  • a technique for storage is disclosed.
  • Patent Document 2 discloses a technique related to a log format conversion apparatus that automatically generates a log format necessary for making various log files into a common format.
  • the log format conversion apparatus according to Patent Literature 2 automatically generates a log format by extracting regularity from log format generation knowledge and a character string pattern of a log.
  • Japanese Patent Application Laid-Open No. 2004-151867 discloses a technique for performing format conversion on a plurality of types of log messages to share the log message format.
  • Patent Documents 1 to 3 have a problem that data in files of different uses cannot be managed uniformly. The reason is that Patent Documents 1 to 3 unify the format for a specific use file called a log file. This is because a plurality of different usage files are not suitable for unifying formats because the quality of records and attributes is different.
  • the present disclosure has been made to solve such problems, and is an information processing apparatus, a data management system, a data management method, and data for uniformly managing data in files of a plurality of different uses.
  • the purpose is to provide a management program.
  • An information processing apparatus that extracts a set of attributes and data from each of a plurality of collection files collected from an information system and described in a plurality of types of formats, based on the format corresponding to each collection file
  • a first specifying unit for specifying position information indicating a position in the collection file corresponding to the extracted data
  • a registration unit that registers in the database a management record in which the corresponding attribute, the identified location information, and the file identification information of the collected file are associated with each other; Is provided.
  • the data management system includes: A collection unit for collecting a plurality of collection files described in each of a plurality of types of formats from an information system and storing the collected files in a storage device; An extraction unit for extracting a set of attributes and data from each of the plurality of collection files in the storage device based on the format corresponding to each collection file; A first specifying unit for specifying position information indicating a position in the collection file corresponding to the extracted data; For the extracted data, a registration unit that registers in the database a management record in which the corresponding attribute, the identified location information, and the file identification information of the collected file are associated with each other; Is provided.
  • the data management method includes: Computer A set of attributes and data is extracted from each of a plurality of collected files collected from the information system and described in a plurality of types of formats based on the format corresponding to each collected file, Identifying location information indicating a location in the collection file corresponding to the extracted data; For the extracted data, a management record in which the corresponding attribute, the specified position information, and the file identification information of the collected file are associated is registered in the database.
  • a data management program includes: A process of extracting a set of attributes and data from each of a plurality of collected files collected from the information system and described in each of a plurality of types of formats, based on the format corresponding to each collected file; , A process for identifying position information indicating a position in the collection file corresponding to the extracted data; For the extracted data, a process of registering in the database a management record in which the corresponding attribute, the specified location information, and the file identification information of the collected file are associated with each other; Is executed on the computer.
  • an information processing apparatus a data management system, a data management method, and a data management program for uniformly managing data in a plurality of different usage files.
  • FIG. 1 is a block diagram showing a configuration of an information processing apparatus according to a first embodiment.
  • 3 is a flowchart for explaining a flow of a data management method according to the first exemplary embodiment; It is a block diagram which shows the whole structure containing the data management system concerning this Embodiment 2.
  • FIG. It is a figure explaining the concept of the collection file concerning this Embodiment 2.
  • FIG. It is a figure explaining the example of the setting file concerning this Embodiment 2.
  • FIG. It is a figure explaining the example of the setting file concerning this Embodiment 2.
  • FIG. It is a block diagram which shows the structure of the data management apparatus concerning this Embodiment 2. It is a figure explaining the example of the output definition information concerning this Embodiment 2.
  • FIG. 10 is a flowchart for explaining a flow of data registration processing according to the second embodiment; It is a figure explaining the example of the display screen in the management terminal concerning this Embodiment 2, and output information. 10 is a flowchart for explaining a flow of data output processing according to the second embodiment; It is a figure explaining the example of the display screen in the management terminal concerning this Embodiment 3, and output information. It is a figure explaining the example of the display screen in the management terminal concerning this Embodiment 4, and output information. It is a figure explaining the example of the display screen in the management terminal concerning this Embodiment 5, and output information.
  • FIG. 1 is a block diagram illustrating a configuration of the information processing apparatus 1 according to the first embodiment.
  • the information processing apparatus 1 is a computer system for uniformly managing data in files for a plurality of different uses.
  • the information processing apparatus 1 may be realized by a plurality of computers.
  • the information processing apparatus 1 receives a plurality of collected files as an input.
  • the plurality of collected files are files collected from an information system (not shown).
  • the information system is a system constituted by a computer, a communication device, a storage, and the like.
  • the information system is, for example, a service providing system that provides a predetermined service via a network, a business system in a company, or the like.
  • each collected file is a file in which data is described in any of a plurality of types of formats.
  • the format type applied to each collected file is at least 2 or more.
  • the collection file is, for example, a server setting file, a log file, or an inventory file including the execution result of a predetermined command.
  • the plurality of collected files not only have different formats for specific uses, but also include files for different uses.
  • the format is information that defines at least a rule for describing data, and is, for example, a delimiter between data.
  • the format may include a plurality of attribute types corresponding to each data, the arrangement order of the attributes, the configuration of the positional relationship between the attributes, and the like. Therefore, it is assumed that the plurality of collected files include a plurality of data records including a set of data corresponding to each attribute based on the corresponding format.
  • the information processing apparatus 1 includes an extraction unit 11, a specification unit 12, a registration unit 13, and a database 14.
  • the extraction unit 11 extracts a set of attributes and data from each of a plurality of collection files based on a format corresponding to each collection file.
  • the attribute indicates information indicating the nature and characteristics of the corresponding data, the type of parameter, the character string of the parameter name, and the like.
  • attributes include what are called elements and properties depending on the format.
  • the specifying unit 12 is an example of a first specifying unit, and specifies position information indicating a position in the collection file corresponding to the data extracted by the extracting unit 11.
  • the position information includes information for identifying the data record to which the extracted data belongs in the corresponding collection file, and the positional relationship in the data record in the corresponding attribute.
  • the position information may be an address value in the collection file.
  • the registration unit 13 registers, in the database 14, a management record 141 in which the corresponding attribute 1412, the specified position information 1413, and the file identification information 1414 of the corresponding collected file are associated with the extracted data 1411. .
  • extraction unit 11, identification unit 12, and registration unit 13 are realized when a control unit (not shown) in the information processing apparatus 1 reads and executes the data management program according to the present embodiment. .
  • the database 14 is a set of data stored in a storage device (not shown) inside the information processing apparatus 1.
  • the storage device may be an external device connected to the information processing apparatus 1.
  • the database 14 manages a plurality of management records 141.
  • the management record 141 is information in which data 1411, an attribute 1412, position information 1413, and file identification information 1414 are associated with each other.
  • a combination of the attribute 1412, the position information 1413, and the file identification information 1414 is a main key for uniquely specifying the management record 141 or the data 1411.
  • the database 14 is realized, for example, by managing the data in the storage device described above by reading and executing a predetermined database management program by the control unit described above.
  • the database 14 may be managed in a distributed manner.
  • FIG. 2 is a flowchart for explaining the flow of the data management method according to the first embodiment.
  • the extraction unit 11 extracts a set of attributes and data from each of a plurality of collection files based on a format corresponding to each collection file (S11).
  • Information regarding the format may be stored in advance in a storage device in the information processing apparatus 1.
  • the extraction unit 11 may select a format according to the collection file to be processed, read out format information corresponding to the selected format from the storage device, and perform extraction using the format information.
  • the extraction unit 11 may be preliminarily mounted with an extraction logic corresponding to a plurality of format types.
  • the specifying unit 12 specifies position information indicating the position in the collection file corresponding to the data extracted in step S11 (S12). Then, the registration unit 13 registers a management record in which the corresponding attribute, the identified position information, and the file identification information of the corresponding collection file are associated with each other in the database 14 for the extracted data ( S13).
  • each data is associated with a corresponding attribute as a one-to-one pair.
  • a plurality of data corresponding to the same attribute may be included in the data record. Therefore, the data included in the data record cannot be uniquely identified only by the attribute. Therefore, position information in the collection file is specified for each piece of extracted data. Then, for each piece of extracted data, attributes, position information, and file identification information are associated with each other and registered in the database.
  • the collection file to which the data belongs can be specified, the position in the file can be specified, and the attribute indicating the characteristics of the data can also be specified. Therefore, each data in the database can be selected according to various requests and appropriately processed. Therefore, according to the present embodiment, data in a plurality of different usage files can be managed in a unified manner.
  • Patent Documents 1 to 3 data is managed in units of records, and attributes in the records are associated with different formats. Therefore, when using data, it can be used only within the range of the unified format. Therefore, it depends on the format format after unification.
  • the record unit but also the value (data) unit is decomposed, and not only the attribute but also the unique identifier in the file is added to each value. Stored in combination with values. Thereby, the data after the division can be utilized from various viewpoints.
  • the second embodiment is an application example of the first embodiment described above.
  • the registration unit according to the second embodiment registers the management record in the database by further associating the update date and time of the collected file with the management record. Thereby, the update history of the same collected file can be managed.
  • the information processing apparatus includes the following storage unit, reception unit, second specifying unit, acquisition unit, and generation It is desirable to include a unit and an output unit.
  • the storage unit stores the output definition including the plurality of attributes to be output in association with the file identification information.
  • the accepting unit accepts an output condition including first file identification information corresponding to the collected file.
  • the second specifying unit specifies the first output definition associated with the first file identification information from the storage unit.
  • the acquisition unit acquires a plurality of first management records corresponding to a combination of any one of the attributes included in the first output definition and the first file identification information from the database.
  • the generation unit concatenates data in the plurality of first management records based on the first output definition and each of the position information in the plurality of first management records to generate a first output. Generate information.
  • the output unit outputs the first output information. As a result, the collected file can be restored and output. Therefore, it is not necessary to store the original collected file, and the storage cost can be reduced.
  • the registration unit generates the attribute extracted by the extraction unit for each collection file of the extraction source as the output definition, and file identification information of the collection file of the extraction source and the generated output definition Is preferably registered in the storage unit. Thereby, output definitions of a plurality of attributes used in the collection file can be automatically generated.
  • the generation unit classifies a plurality of records corresponding to the same attribute included in the first output definition among the plurality of first management records into a plurality of different groups based on the position information. And it is desirable for the said production
  • the plurality of collected files may include a setting file corresponding to the first device included in the information system, and the file identification information may include identification information of the first device.
  • the plurality of collected files may include a command execution result for the second device included in the information system.
  • the execution result (inventory) by the diagnostic command for the information system can be managed in a unified manner.
  • the plurality of collection files may include a plurality of data records including a set of data corresponding to each attribute based on the corresponding format.
  • the first specifying unit includes the information that identifies the data record to which the extracted data belongs in the corresponding collection file, and the positional relationship in the data record in the corresponding attribute. It may be specified as position information. Thereby, the data record in the original file can be accurately restored using the position information.
  • the data management system can be said to include the following collection unit, extraction unit, first specifying unit, and registration unit.
  • the collection unit collects a plurality of collection files described in a plurality of types of formats from the information system and stores them in the storage device.
  • the extraction unit extracts a set of attributes and data from each of the plurality of collection files in the storage device based on the format corresponding to each collection file.
  • the first specifying unit specifies position information indicating a position in the collection file corresponding to the extracted data.
  • the registration unit registers, in the database, a management record in which the corresponding attribute, the identified position information, and the file identification information of the collected file are associated with each other for the extracted data.
  • FIG. 3 is a block diagram showing an overall configuration including the data management system 3000 according to the second embodiment.
  • FIG. 3 shows an external system 1000, an information system 2000, and a data management system 3000.
  • the information system 2000 is a system that provides data to be managed by the data management system 3000 according to the present embodiment using a plurality of collection files.
  • the information system 2000 may be the above-described service providing system, a business system in a company, or the like.
  • the external system 1000 is an information system that is connected to the information system 2000 and a network (not shown), but is not subject to data management by the data management system 3000.
  • the information system 2000 and the data management system 3000 are connected via a network N.
  • the network N is a communication network such as the Internet or a dedicated line.
  • the information system 2000 includes a router 210, an AP (Application) server 220, a DB (DataBase) server 230, a switch 240, a GW (GateWay) server 250, an FW (FireWall) 260, and a storage device 270.
  • AP Application
  • DB DataBase
  • switch 240 a switch 240
  • GW GateWay
  • FW FireWall
  • Storage device 270 storage device 270.
  • the information system 2000 includes at least one of a computer server, a network device, a storage device, and the like, and may be any one that can provide files for a plurality of different uses.
  • the router 210 is a network device that is connected to the external system 1000 and the AP server 220 and performs routing of communication packets that pass through communication inside and outside the information system 2000.
  • the AP server 220 is a computer on which an AP server as middleware operates, and an application that operates on the AP server and provides a predetermined service.
  • the AP server 220 is connected to the router 210 and the switch 240.
  • the AP server 220 stores a setting file 221 and a log file 222 in an internal storage device (not shown). Each of the setting file 221 and the log file 222 may be two or more.
  • the setting file 221 is a file in which setting values such as an OS (Operating System), an AP server, or an application are defined for each attribute.
  • the log file 222 is a file that records a log message of, for example, an OS, an AP server, or an application.
  • the AP server 220 may be realized by a plurality of computers.
  • the DB server 230 is a computer that operates a DB server (DB management system) as middleware and manages data stored in the storage device 270.
  • the DB server 230 is connected to the switch 240 and the storage device 270.
  • the DB server 230 stores a setting file 231 and a log file 232 in an internal storage device (not shown). Each of the setting file 231 and the log file 232 may be two or more.
  • the setting file 231 is a file in which setting values such as an OS or a DB server are defined for each attribute.
  • the log file 232 is a file that records a log message such as an OS or DB server.
  • the DB server 230 may be realized by a plurality of computers.
  • the storage device 270 is a storage device connected to the DB server 230.
  • the storage device 270 stores a set of data managed by the DB server 230.
  • the switch 240 is a network device that is connected to the AP server 220, the DB server 230, and the FW 260 and relays communication data that passes through communication between them.
  • the FW 260 is a network device that is connected to the switch 240, the GW server 250, and the network N and relays and monitors communication between the information system 2000 and the network N.
  • the GW server 250 is a computer that is connected to the FW 260 and performs protocol conversion between the information system 2000 and the network N.
  • the GW server 250 stores a setting file 251 and a log file 252 in an internal storage device (not shown). Each of the setting file 251 and the log file 252 may be two or more.
  • the setting file 251 is, for example, a file in which setting values such as OS or GW server are defined for each attribute.
  • the log file 252 is a file in which a log message such as an OS or a GW server is recorded.
  • the GW server 250 may be realized by a plurality of computers.
  • each of a plurality of setting contents is assumed to be a data record, and one or more attributes (installation items) and one or more setting values are set in each data record.
  • the configuration files 221 and the like may have different formats.
  • Each of the setting files 221 and the like can be referred to as a setting file corresponding to the first device included in the information system 2000.
  • log files 222, 232, and 252 are appropriately updated by additional writing.
  • Each of the log files 222 and the like may have different formats.
  • the router 210, the switch 240, the FW 260, and the storage device 270 may store a setting file or a log file in an internal storage device (not shown), or may include these in a collection file.
  • the data management system 3000 includes a collection server 310, a data management device 320, and a management terminal 326.
  • the collection server 310 is an information processing apparatus that collects and stores a plurality of collection files from the information system 2000 via the network N.
  • the collection server 310 is connected to the network N and the data management device 320.
  • the collection server 310 may be realized by a plurality of computers.
  • the collection server 310 includes a collection unit 311 and a collection DB 312.
  • the collection unit 311 collects a plurality of collection files from the information system 2000 via the network N periodically or in response to an instruction from the management terminal 326 by an administrator. For example, the collection unit 311 acquires the setting file 221 and the log file 222 from the AP server 220 via the network N and stores them in the collection DB 312. Further, the collection unit 311 acquires the setting file 231 and the log file 232 from the DB server 230 via the network N and stores them in the collection DB 312. Also, the collection unit 311 acquires the setting file 251 and the log file 252 from the GW server 250 via the network N, and stores them in the collection DB 312.
  • the collection unit 311 may acquire a setting file or a log file from the router 210, the switch 240, the FW 260, and the storage device 270 via the network N and store them in the collection DB 312. Further, the collection unit 311 issues a predetermined diagnostic command to the second device included in the information system 2000 via the network N periodically or in response to an instruction from the management terminal 326 by the administrator. Then, the collection unit 311 stores the command execution result, which is a response to the diagnosis command, in the collection DB 312 as an inventory file.
  • the collection unit 311 issues a predetermined diagnosis command to at least one of the router 210, the AP server 220, the DB server 230, the switch 240, the GW server 250, the FW 260, and the storage device 270 via the network N. It shall be.
  • the diagnostic command is, for example, a PING command or the like, but is not limited thereto.
  • the collection unit 311 is realized by a control unit (not shown) in the collection server 310 reading and executing a predetermined collection program.
  • the collection DB 312 is a collection of data stored in a storage device (not shown) inside the collection server 310.
  • the storage device may be an external device connected to the information processing apparatus 1.
  • the collection DB 312 manages a plurality of collection files 313.
  • the plurality of collection files 313 include setting files 221, 231 and 251; log files 222, 232 and 252; and at least two or more of the above-described inventory files. Therefore, the plurality of collection files 313 include different types of setting files, log files, and inventory files, are files of a plurality of different uses, and can be said to be files described in a plurality of types of formats.
  • FIG. 4 is a diagram for explaining the concept of the collected file according to the second embodiment.
  • the collection file 400 is a generalization of the collection file 313 described above.
  • the record 410 includes a set of parameter name 4111 and data 4112, a set of parameter name 4121 and data 4122, and so on. That is, the data 4112 is a setting value corresponding to the parameter name 4111 or the like.
  • the data 4122 is a setting value corresponding to the parameter name 4121 or the like.
  • the file ID 41, the target host 42, and the last update date and time 43 are set as the file attribute 40.
  • the file ID 41 is information such as a file name and a file storage destination directory.
  • the target host 42 is identification information of a source device such as a record 410 described in the collection file 400, that is, a host ID.
  • the target host 42 is the machine name, IP (Internet Protocol) address, etc. of the AP server 220.
  • the target host 42 is a host to which the diagnostic command is executed.
  • the file ID 41 and the target host 42 are examples of file identification information of the collection file 400.
  • the target host 42 is not an essential configuration.
  • the last update date / time 43 is a time stamp indicating the year / month / day / hour / minute / second (or millisecond) when the collection file 400 was last updated in the target host.
  • the last update date and time 43 is the execution time of the diagnostic command or the storage time of the inventory file in the collection server 310.
  • FIG. 5 is a diagram for explaining an example of the setting file 400a according to the second embodiment.
  • the setting file 400a is an example of the collection file 400, and is a CSV (Comma-Separated Value) format file in which each data record is delimited by a line feed character and a plurality of attribute values in the data record are delimited by commas.
  • a line feed character or a comma character is defined as a delimiter in the format information corresponding to the setting file 400a.
  • the format information defines the type and order of attributes such that the first attribute of each data record is a record ID, the second attribute is a parameter 1, and the third attribute is a parameter 2. Also good.
  • FIG. 6 is a diagram for explaining an example of the setting file 400b according to the second embodiment.
  • the setting file 400b is an example of the collection file 400, and indicates that the file is in an XML (eXtensible Markup Language) format.
  • the format information corresponding to the setting file 400b defines, for example, that it is an XML format. Even if the format information defines that the element of the data record is “record” and its child elements are “element1”, “element2”, and “element1” are a plurality of child elements “element11” good.
  • the data management device 320 is an example of the information processing device 1 described above, and is a computer connected to the collection server 310 and the management terminal 326.
  • the data management device 320 reads a plurality of collection files 313 from the collection DB 312 and registers a plurality of management records 325 in the data management DB 324. Further, the data management device 320 acquires a part of the management records 325 from the data management DB 324 based on a predetermined output condition in response to a predetermined trigger or an instruction from the management terminal 326 by the administrator, and in a predetermined output format. Output to the management terminal 326 or the like. Further, the data management device 320 may be realized by a plurality of computers.
  • the data management device 320 includes at least an extraction unit 321, a specification unit 322, a registration unit 323, and a data management DB 324.
  • the data management apparatus 320 shows a schematic configuration, and a detailed configuration will be described later with reference to FIG.
  • the management terminal 326 is a terminal device operated by an administrator of the data management system 3000, and is, for example, a personal computer.
  • the management terminal 326 is communicably connected to the data management device 320 via a network or the like, and accesses the data management device 320 and inputs information according to the operation of the administrator.
  • the management terminal 326 may be connected to the collection server 310.
  • FIG. 7 is a block diagram showing a configuration of the data management apparatus 500 according to the second embodiment.
  • the data management device 500 corresponds to the data management device 320 of FIG.
  • the data management device 500 includes a storage unit 510, a data management DB 520, a control unit 530, and an IF unit 540.
  • the data management DB 520 may be realized on an external storage device connected to the data management device 500.
  • the storage unit 510 is a storage device such as a hard disk or a flash memory.
  • the storage unit 510 stores format information 511, output definition information 512, an expected value 513, and a program 514.
  • the format information 511 is information that defines the format of the setting file 221, the log file 222, or the inventory file.
  • the format information 511 is information indicating, for example, CSV, XML, JSON (JavaScript (registered trademark) Object Notation) or other formats.
  • the output definition information 512 is information in which an output definition including a plurality of attributes to be output is associated with file identification information of a collected file.
  • the output definition information 512 is, for example, a display format for reproducing and displaying the format of the collection file, or a file that is output to extract a part of attribute values used in the collection file and perform statistical processing or the like Format.
  • the output definition information 512 may be configuration information that defines the data structure of the collection file.
  • FIG. 8 is a diagram for explaining an example of the output definition information 512a according to the second embodiment.
  • the output definition information 512a is information defining an output format or the like when the collection file is in the CSV format.
  • the output definition information 512a is a table having output definition ID, file ID, and column order 1 to 3 as attributes.
  • the column orders 1 to 3 character strings indicating attribute names (parameter names) are set.
  • Column orders 1 to 3 indicate the order of attributes.
  • the column order may be two or more.
  • FIG. 9 is a diagram for explaining an example of the output definition information 512b according to the second embodiment.
  • the output definition information 512b is information defining an output format or the like when the collection file is in the XML format.
  • the output definition information 512b is a table having attributes of output definition ID, file ID, parent node, node name, and “repetition” (whether or not).
  • the node name is a character string indicating the name of the element, attribute, and parameter to which each node belongs per output definition ID and file ID.
  • the parent node indicates the parent node of the node name. That is, the parent node indicates the link destination of the child node. “Repeat” is flag information indicating whether or not to allow the corresponding node to be set repeatedly.
  • the output definition information 512b is not limited to this.
  • the expected value 513 is a value to be compared with data corresponding to a predetermined attribute in a predetermined collection file.
  • the program 514 is an example of a data management program, and is a computer program in which the data management processing according to the present embodiment is implemented.
  • the format information 511, the output definition information 512, and the expected value 513 may be information input from the management terminal 326.
  • the data management DB 520 corresponds to the data management DB 324 in FIG. 3 and is an example of the database 14 in FIG.
  • the data management DB 520 is, for example, KVS (Key-Value Store).
  • KVS Key-Value Store
  • the data management DB 520 may be managed by being distributed to a plurality of storage apparatuses. However, the data management DB 520 may be realized by a relational database or other database system.
  • the data management DB 520 manages management records 521, 522,.
  • the management record 521 is information in which data 5211, an attribute 5212, position information 5213, a file ID 5214, a target host 5215, and a last update date and time 5216 are associated with each other.
  • the management record 522 has the same configuration.
  • a set of the attribute 5212, the location information 5213, the file ID 5214, the target host 5215, and the last update date and time 5216 is KEY
  • the data 5211 is VALUE.
  • KEY may be at least a set of position information 5213, file ID 5214, and last update date 5216.
  • the target host 5215 may be used instead of the file ID 5214.
  • the data 5211 is an example of the data 1411 described above, and is information corresponding to the data 4112 in FIG.
  • the attribute 5212 is an example of the attribute 1412 described above, and is information corresponding to the parameter name 4111 and the like in FIG.
  • the position information 5213 is an example of the position information 1413 described above. That is, the position information 5213 includes information for identifying the data record to which the extracted data belongs in the corresponding collection file, and the positional relationship in the data record in the corresponding attribute.
  • the information for identifying the data record is, for example, a record ID.
  • the positional relationship in the data record is, for example, the column order number in FIG. 8, the hierarchical structure of the node in FIG. 9, the hierarchical number, the node connection relationship, or the like.
  • the file ID 5214 and the target host 5215 are examples of the file identification information 1414 described above, and are information corresponding to the file ID 41 and the target host 42 in FIG.
  • the last update date and time 5216 is information corresponding to the last update date and time 43 in FIG.
  • FIG. 10 is a diagram for explaining an example of a management record according to the second embodiment.
  • KEY 52a of the management record is a set of the last update date / time, file ID, target host, record ID, positional relationship, and attribute name.
  • the file ID and the target host can be referred to as file identification information 52a1, and the record ID and the positional relationship can be referred to as position information 52a2.
  • VALUE 52b of the management record is data.
  • FIG. 11 is a diagram for explaining another example of the management record according to the second embodiment.
  • an example of a management code corresponding to the setting file 400b of FIG. 6 described above is shown.
  • the positional relationship is information indicating the hierarchical structure of elements, but is not limited to this.
  • the control unit 530 includes a processor such as a CPU and a memory, and controls each component of the data management device 500.
  • the processor of the control unit 530 reads the program 514 from the storage unit 510 into the memory and executes the program 514. Thereby, the control unit 530 realizes the functions of the extraction unit 531, the first specification unit 532, the registration unit 533, the reception unit 534, the second specification unit 535, the acquisition unit 536, the generation unit 537, and the output unit 538. .
  • the extraction unit 531 is an example of the extraction unit 11 in FIG. 1 and corresponds to the extraction unit 321 in FIG.
  • the extraction unit 531 extracts a set of the attribute 5212 and the data 5211 from each of the plurality of collection files 313 in the collection DB 312 based on the format information 511 corresponding to each collection file.
  • the first specifying unit 532 is an example of the specifying unit 12 in FIG. 1 and corresponds to the specifying unit 322 in FIG.
  • the first specifying unit 532 specifies position information 5213 indicating the position in the collection file corresponding to the data extracted by the extraction unit 531.
  • the first specifying unit 532 includes information for identifying the data record to which the data extracted by the extraction unit 531 belongs in the corresponding collection file, and the positional relationship in the data record in the corresponding attribute.
  • the position information 5213 is specified.
  • the registration unit 533 is an example of the registration unit 13 in FIG. 1 and corresponds to the registration unit 323 in FIG.
  • the registration unit 533 generates, for the extracted data 5211, a management record 521 in which the corresponding attribute 5212, the specified location information 5213, the file ID 5214 of the collection file, and the target host 5215 are associated with each other.
  • the registration unit 533 registers the management record 521 in the data management DB 520 in further association with the last update date and time 5216 of the collected file.
  • the registration unit 533 generates the attributes extracted by the extraction unit 531 as an output definition for each collection file of the extraction source. Then, the registration unit 533 associates the file identification information of the collection file of the extraction source with the generated output definition and registers the output definition information 512 in the storage unit 510.
  • the accepting unit 534 accepts an output condition including the first file identification information corresponding to the collected file.
  • the reception unit 534 receives the output condition input by the administrator from the management terminal 326.
  • the second specifying unit 535 specifies the first output definition (output definition information 512) associated with the first file identification information from the storage unit 510.
  • the acquisition unit 536 acquires a plurality of first management records corresponding to a combination of one of the attributes included in the first output definition and the first file identification information from the data management DB 520. Based on the first output definition and each of the position information 5213 in the plurality of first management records, the generation unit 537 concatenates the data in the plurality of first management records to generate the first output information. Generate.
  • the generation unit 537 classifies the plurality of records corresponding to the same attribute included in the first output definition among the plurality of first management records into a plurality of different groups based on the position information. Output information is generated for each record classified as.
  • the output unit 538 outputs the first output information. For example, the output unit 538 transmits the first output information to the management terminal 326 for display. Alternatively, the output unit 538 outputs and stores the first output information in an external storage device or the like.
  • the IF unit 540 is an interface that performs communication with the outside of the data management device 500. For example, the IF unit 540 receives a request from the management terminal 326 and outputs the request to the control unit 530. The IF unit 540 receives an instruction from the control unit 530 and outputs the instruction to the management terminal 326. Further, the IF unit 540 transmits a read request for the collection file 313 to the collection DB 312 in response to an instruction from the control unit 530, and outputs the received collection file 313 as a response to the control unit 530.
  • FIG. 12 is a flowchart for explaining the flow of the data registration process according to the second embodiment.
  • the data management apparatus 500 starts data registration processing in response to a predetermined timing or an instruction from the management terminal 326 by the administrator.
  • the extraction unit 531 refers to the collection DB 312 and determines whether there is a collection file 313 to be registered (S101). For example, when a flag indicating whether or not the data registration processing has been completed for each collection file 313 is managed in the collection DB 312, the extraction unit 531 determines based on the flag.
  • the extraction unit 531 acquires an unregistered collection file 313 from the collection DB 312 as a registration target (S102). Then, the extraction unit 531 reads out the corresponding format information 511 from the storage unit 510 according to the type of the acquired collection file 313. The extraction unit 531 extracts a set of attributes and data based on the read format information 511 (S103). Specifically, first, the extraction unit 531 extracts one data record from the collection file 313 based on the data record delimiter information defined in the format information 511. Then, the extraction unit 531 divides the extracted data record into a plurality of data based on attribute delimiter information defined in the format information 511. Then, the extraction unit 531 extracts each divided data and the corresponding position attribute as a set based on the order of attributes and the positional relationship defined in the format information 511.
  • the extraction unit 531 extracts data for one line (“R1, aaa, bbb”) from the setting file 400a as a data record. Then, the extraction unit 531 divides the extracted data record with comma characters to obtain a plurality of data. Then, the extraction unit 531 sets the divided first data (“R1”) to the record ID, the second data (“aaa”) to the param1, and the third data (“bbb”). Extracted as a pair with param2.
  • the extraction unit 531 extracts the data surrounded by the “record” tag from the setting file 400b as one data record, and the data “ A pair of R1 ”and record ID is extracted. Then, the extraction unit 531 divides the extracted data record into data surrounded by “element1” tags and “element2” tags. Then, the extraction unit 531 extracts a set of data “ccc” and “element1” from the data surrounded by the divided “element1” tags. Further, the extraction unit 531 divides the data surrounded by the divided “element1” tags into data surrounded by the “element11” tags.
  • the extraction unit 531 extracts a set of data “dd1” and “element11” from the data surrounded by the “element11” tag. Similarly, the extraction unit 531 extracts a set of data “dd2” and “element11” and a set of data “eee” and “element2”.
  • the first specifying unit 532 specifies the position information of each extracted data in the collection file (S104). For example, when the extracting unit 531 extracts a combination of data and attributes from the collected file, the first specifying unit 532 holds the record ID in a memory or the like, and counts the positional relationship, thereby FIG. Or position information 52a2 as shown in FIG. 11 is specified.
  • the registration unit 533 generates a management record for each set of extracted data and attributes (S105). For example, the registration unit 533 associates the position information specified in step S104 with the combination of the data and attribute extracted in step S103 and creates a management record. Then, the registration unit 533 associates the management record with the file ID 41, the target host 42, and the last update date and time 43 in the collection file 313 acquired in step S102.
  • the registration unit 533 registers the generated management record in the data management DB 520 (S106). For example, as described above, when steps S103 to S105 are processed in units of data records, the registration unit 533 generates management records for the number of data in the data records and registers each management record in the data management DB 520. To do. Then, the control unit 530 determines whether there is no unextracted data in the acquired collection file 313 (S107). For example, when processing is performed in units of data records, it is determined whether there are any unextracted data records.
  • step S107 If it is determined in step S107 that there is unextracted data or data records, steps S103 to S107 are repeated. If it is determined in step S107 that there is no unextracted data or data record, the control unit 530 determines whether or not the output definition information 512 corresponding to the acquired collection file 313 is not in the storage unit 510 (S108). If it is determined that there is no corresponding output definition information 512, the registration unit 533 collectively generates the attributes extracted in step S103 as a new output definition. Then, the registration unit 533 associates the generated output definition with the file identification information of the collection file 313 acquired in step S102 and registers it in the storage unit 510 as output definition information 512 (S109).
  • step S109 After step S109 or when it is determined in step S108 that the corresponding output definition information 512 exists, the process returns to step S101. If it is determined in step S101 that there is a collection file 313 to be registered, steps S102 to S109 are repeated. On the other hand, if it is determined in step S101 that there is no collection file 313 to be registered, the data registration process is terminated.
  • the data management device 500 has a function of a WEB application, for example.
  • the data management device 500 generates an input screen for output conditions and transmits the input screen to the management terminal 326.
  • the management terminal 326 displays the received input screen on a display device (not shown).
  • FIG. 13 is a diagram for explaining an example of the display screen 600 and the output information 630 in the management terminal 326 according to the second embodiment. At this time, it is assumed that the output information 630 is not displayed on the display screen 600.
  • the display screen 600 includes a target file designation field 610 and a display button 620.
  • the target file designation column 610 is a column that accepts designation of file identification information to be output by pull-down.
  • the display button 620 is a button for transmitting an output condition including the file identification information designated in the target file designation field 610 to the data management device 500 when pressed.
  • the management terminal 326 accepts an input condition input or selection operation from an administrator via an input device (not shown). For example, the management terminal 326 accepts a target file designation operation in the target file designation field 610 from the administrator. The designation operation is, for example, pull-down. Then, the management terminal 326 receives a pressing operation of the display button 620 from the administrator. In response to this, the management terminal 326 transmits an output condition including the first file identification information (f3) indicated by the target file specified in the target file specification field 610 to the data management apparatus 500.
  • f3 the first file identification information
  • FIG. 14 is a flowchart for explaining the flow of the data output process according to the second embodiment.
  • the accepting unit 534 accepts an output condition including the first file identification information from the management terminal 326 (S201).
  • the second specifying unit 535 specifies the output definition information 512 associated with the received first file identification information from the storage unit 510 (S202).
  • the second specifying unit 535 specifies the output definition information 512b associated with the file ID “f3”.
  • the acquisition unit 536 acquires a plurality of first management records corresponding to a combination of one of the attributes included in the specified output definition information 512 and the first file identification information from the data management DB 520 (S203).
  • the acquisition unit 536 acquires the latest one of the management records illustrated in FIG. 11 as a plurality of first management records.
  • the generation unit 537 connects the data (VALUE 52b) in the plurality of first management records based on the output definition information 512b and each of the position information 52a2 in the plurality of first management records. Is generated (S204).
  • the generation unit 537 has a plurality of different records based on the position information 52a2 (a set of record ID and position relationship) for a plurality of records corresponding to the same attribute (for example, “element1”) included in the output definition information 512b. (For example, “R1” and “R2”).
  • generation part 537 produces
  • the output unit 538 outputs, that is, transmits each output information generated in step S204 to the management terminal 326 (S205). Thereafter, the management terminal 326 displays the received output information on the display device.
  • output information 630 is displayed like a display screen 600 of FIG.
  • the output information 630 indicates that two records of record data 631 and 632 are displayed. That is, the record data 631 is a set of all attributes and data included in the record R1, and the record data 632 is a set of all attributes and data included in the record R2.
  • the display format is not limited to this. Then, by specifying another target file on the display screen 600, the data included in the target file can be read and displayed based on the output definition corresponding to the specified target file.
  • the present invention can be applied to any of a setting file, log file, and inventory as a collection file. Further, as described above, the contents of the collected file can be reproduced and displayed on the display screen 600. Therefore, it is not necessary to save the original collected file, saving cost can be reduced, and saving area can be used effectively.
  • the third embodiment is an improved example of the second embodiment described above.
  • the subject of the other viewpoint in patent documents 1 to 3 mentioned above is explained.
  • Patent Documents 1 to 3 log files of various formats can be unified into a common format, but since each data after the unification depends on the format of the common format, there is a problem that the usage mode of collected data is limited.
  • a specific attribute value in a collection file of the same type cannot be compared in time series.
  • Patent Document 1 the results of statistical processing are stored in a specific display format, so the usage mode is limited.
  • Patent Document 2 since log messages of a plurality of formats are converted into a common specific format and stored, the usage mode of the log message depends on the specific format and is limited.
  • Patent Document 3 log messages of a plurality of formats are converted into a common specific format and stored in one monitoring log file. Therefore, the usage mode of each data in the monitoring log file depends on a specific format and becomes limited.
  • the third embodiment has the following configuration. That is, the output condition further includes two or more pieces of time information to be compared. Then, the acquisition unit includes a plurality of second management records corresponding to any one of the attributes included in the first output definition and any one of the two or more time information included in the output condition. Obtain from the database. And the said production
  • the configuration of the data management apparatus according to the third embodiment is the same as that of the second embodiment except for the above. Therefore, illustration and detailed description are omitted.
  • FIG. 15 is a diagram for explaining an example of the display screen 600a and output information 630a in the management terminal 326 according to the third embodiment.
  • the display screen 600a includes comparison date and time designation fields 641 and 642 and a history comparison display button 650.
  • the comparison target date and time designation columns 641 and 642 are columns for receiving designation of the date and time of comparison by pull-down.
  • the output condition including the file identification information specified in the target file specification column 610 and the two dates specified in the comparison target date / time specification columns 641 and 642 is sent to the data management apparatus 500. It is a button for sending.
  • the management terminal 326 accepts designation of the date and time of comparison in the comparison date and time designation fields 641 and 642 from the administrator. Then, the management terminal 326 accepts a pressing operation of the history comparison display button 650 from the administrator. In response to this, the management terminal 326 sets the output condition including the file identification information (f1) specified in the target file specification column 610 and the two dates / times specified in the comparison target date / time specification columns 641 and 642 to the data management device 500. Send to.
  • the accepting unit 534 accepts an output condition including the first file identification information and two pieces of time information from the management terminal 326 (S201).
  • the second specifying unit 535 specifies the output definition information 512 as described above (S202).
  • the acquisition unit 536 acquires a plurality of second management records corresponding to one of the attributes included in the output definition information 512 and one of the two pieces of time information included in the output condition from the data management DB 520. (S203). For example, the acquisition unit 536 acquires a management record corresponding to each of the two last update dates and times shown in FIG. 10 as the second management record.
  • generation part 537 produces
  • the output unit 538 outputs, that is, transmits the second output information (S205).
  • the management terminal 326 displays the received second output information on the display device.
  • output information 630a is displayed as in the display screen 600a of FIG.
  • the output information 630a indicates that record data 631a and 632a having different update dates and times are displayed for comparison with the same record ID “R1”.
  • the fourth embodiment is an improved example of the above-described second or third embodiment.
  • the output condition according to the fourth embodiment further includes an expected value of data in the first attribute.
  • the acquisition unit acquires a third management record corresponding to the first attribute from the database.
  • the generating unit generates third output information so as to compare the data in the third management record with the expected value.
  • the output unit outputs the third output information.
  • the expected value can be compared with the actual set value. Therefore, the usage mode can be further diversified.
  • the configuration of the data management apparatus according to the fourth embodiment is the same as that of the second or third embodiment except for the above. Therefore, illustration and detailed description are omitted.
  • FIG. 16 is a diagram for explaining an example of the display screen 600b and the output information 630b in the management terminal 326 according to the fourth embodiment.
  • output information 630b is not displayed on display screen 600b.
  • the display screen 600b includes a comparison target attribute designation field 660 and an expected value comparison display button 670.
  • the display screen 600b may be an improvement of the display screen 600a.
  • the comparison target attribute designation column 660 is a column that accepts designation of a target attribute for comparison with an expected value by pull-down.
  • the comparison target attribute designation column is one, but it may be two or more.
  • a field for receiving input of an expected value in the attribute may be provided.
  • the management terminal 326 accepts designation of a target attribute for comparison with an expected value in the comparison target attribute designation column 660 from the administrator. Then, the management terminal 326 accepts a pressing operation of the expected value comparison display button 670 from the administrator. In response to this, the management terminal 326 sends an output condition including the file identification information (f3) designated in the target file designation field 610 and the attribute (element2) designated in the comparison target attribute designation field 660 to the data management apparatus 500. Send. When the input of the expected value is accepted, the management terminal 326 transmits the further input expected value.
  • the accepting unit 534 accepts an output condition including the first file identification information and the first attribute from the management terminal 326 (S201).
  • the reception unit 534 specifies the expected value 513 corresponding to the first attribute (element2) included in the output condition. Therefore, it can be said that the accepting unit 534 accepts the designation of the first file identification information, the first attribute to be compared, and its expected value as output conditions in step S201.
  • the second specifying unit 535 specifies the output definition information 512 as described above (S202).
  • the acquiring unit 536 acquires the third management record corresponding to the first attribute (element2) from the data management DB 520 (S203). Then, the generation unit 537 generates third output information so as to compare the data in the third management record with the expected value 513 (S204). Then, the output unit 538 outputs, that is, transmits the third output information (S205).
  • the management terminal 326 displays the received third output information on the display device.
  • output information 630b is displayed as in the display screen 600b of FIG.
  • the output information 630b includes record data 631b and 632b.
  • the record data 631b is a record corresponding to the record ID “R1” in the file ID “f3”
  • the record data 632b is a record corresponding to the record ID “R2” in the file ID “f3”.
  • the record data 631b indicates that the actual set value “eee” of “element2” designated as the comparison target attribute is displayed so as to be compared with the expected value 633b “eee”.
  • the record data 632b indicates that the actual setting value “ee2” of “element2” specified as the attribute to be compared is displayed so as to be compared with the expected value 634b “EEE”.
  • the fifth embodiment is an improved example of the above-described second, third, or fourth embodiment.
  • the output condition according to the fifth embodiment further includes second file identification information of a file having the same format as the collected file according to the first file identification information.
  • the second specifying unit further specifies the second output definition associated with the second file identification information from the storage unit.
  • the acquisition unit further acquires, from the database, a plurality of fourth management records corresponding to a combination of any of the attributes included in the second output definition and the second file identification information.
  • the generating unit concatenates data in the plurality of fourth management records based on the second output definition and each of the position information in the plurality of fourth management records. 4 output information is generated.
  • the output unit outputs the fourth output information so as to be compared with the first output information. This makes it possible to select a plurality of host information and compare them in host units. Therefore, it is possible to compare files with respect to attributes of the same quality and to further diversify the usage mode.
  • the configuration of the data management apparatus according to the fifth embodiment is the same as that of the second, third, or fourth embodiment except for the above. Therefore, illustration and detailed description are omitted.
  • FIG. 17 is a diagram for explaining an example of the display screen 600c and output information 630c in the management terminal 326 according to the fifth embodiment.
  • the display screen 600c includes comparison target host designation columns 681 and 682, and a host comparison display button 690.
  • the display screen 600c may be an improvement of the display screen 600a or 600b.
  • the comparison target host designation columns 681 and 682 are columns for accepting designation of a comparison target host by pull-down.
  • the comparison target host column is two, but may be three or more.
  • the host comparison display button 690 is a button for transmitting an output condition including two host IDs designated in the comparison target host designation fields 681 and 682 to the data management apparatus 500 when pressed.
  • the management terminal 326 receives the designation of the comparison target hosts (host1 and host4) in the comparison target host designation columns 681 and 682, respectively, from the administrator.
  • the management terminal 326 accepts a pressing operation of the host comparison display button 690 from the administrator.
  • the management terminal 326 transmits an output condition including two host IDs designated in the comparison target host designation columns 681 and 682 to the data management apparatus 500. Since the host ID is an example of file identification information as described above, the output condition includes the first and second file identification information.
  • the accepting unit 534 accepts an output condition including the first and second file identification information (host1 and host4) from the management terminal 326 (S201).
  • the second specifying unit 535 specifies the first and second output definitions associated with the first and second file identification information from the storage unit 510 (S202).
  • the acquisition unit 536 acquires a plurality of first management records as described above (S203).
  • the acquisition unit 536 further acquires a plurality of fourth management records corresponding to a combination of any of the attributes included in the second output definition and the second file identification information from the data management DB 520.
  • generation part 537 produces
  • the generation unit 537 concatenates the data in the plurality of fourth management records based on the second output definition and each of the position information in the plurality of fourth management records, and outputs the fourth output information. Is generated. Then, the output unit 538 outputs, that is, transmits the fourth output information so as to be compared with the first output information (S205).
  • the management terminal 326 displays the received first and fourth output information on the display device so as to be compared.
  • output information 630c is displayed as in the display screen 600c of FIG.
  • the output information 630c indicates that the record data 631c and 632c corresponding to different hosts (host1 and host4) are displayed so as to be compared.
  • Non-transitory computer readable media include various types of tangible storage media (tangible storage medium).
  • Examples of non-transitory computer-readable media include magnetic recording media (eg flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (eg magneto-optical discs), CD-ROMs (Read Only Memory), CD-Rs, CD-R / W, DVD (Digital Versatile Disc), semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)).
  • the program may also be supplied to the computer by various types of temporary computer-readable media.
  • Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves.
  • the temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
  • An extraction unit that extracts a set of attributes and data from each of a plurality of collection files collected from an information system and described in a plurality of types of formats, based on the format corresponding to each collection file
  • a first specifying unit for specifying position information indicating a position in the collection file corresponding to the extracted data
  • a registration unit that registers in the database a management record in which the corresponding attribute, the identified location information, and the file identification information of the collected file are associated with each other;
  • An information processing apparatus comprising: (Appendix A2) The registration unit The information processing apparatus according to Appendix A1, wherein the management record is further associated with an update date and time of the collected file and registered in the database.
  • a storage unit that stores an output definition including a plurality of the attributes to be output and the file identification information in association with each other;
  • a receiving unit for receiving an output condition including first file identification information corresponding to the collected file;
  • a second specifying unit for specifying, from the storage unit, a first output definition associated with the first file identification information;
  • An acquisition unit that acquires, from the database, a plurality of first management records corresponding to a combination of any of the attributes included in the first output definition and the first file identification information; Based on the first output definition and each of the position information in the plurality of first management records, data in the plurality of first management records is concatenated to generate first output information.
  • a generator An output unit for outputting the first output information;
  • the information processing apparatus according to appendix A1 or A2.
  • the output condition further includes two or more pieces of time information to be compared,
  • the acquisition unit stores a plurality of second management records corresponding to any of the attributes included in the first output definition and any of the two or more time information included in the output condition. Get from The generation unit generates second output information so as to compare data associated with each of the two or more pieces of time information among data in the plurality of second management records, The output unit outputs the second output information.
  • the information processing apparatus according to attachment A3, which is subordinate to the attachment A2.
  • the output condition further includes an expected value of data in the first attribute
  • the acquisition unit acquires a third management record corresponding to the first attribute from the database,
  • the generation unit generates third output information so as to compare the data in the third management record with the expected value;
  • the information processing apparatus according to attachment A3 or A4, wherein the output unit outputs the third output information.
  • the output condition further includes second file identification information of a file having the same format as the collected file according to the first file identification information,
  • the second specifying unit further specifies a second output definition associated with the second file identification information from the storage unit;
  • the acquisition unit further acquires a plurality of fourth management records corresponding to a combination of any of the attributes included in the second output definition and the second file identification information from the database,
  • the generating unit concatenates data in the plurality of fourth management records based on the second output definition and each of the position information in the plurality of fourth management records, and Generate output information,
  • the information processing apparatus according to any one of appendices A3 to A5, wherein the output unit outputs the fourth output information so as to be compared with the first output information.
  • the registration unit The attributes extracted by the extraction unit are collectively generated for each collection file of the extraction source as the output definition, and the file identification information of the collection file of the extraction source and the generated output definition are associated with each other and stored
  • the information processing apparatus according to any one of appendices A3 to A6.
  • the generator is Of the plurality of first management records, a plurality of records corresponding to the same attribute included in the first output definition are classified into a plurality of different groups based on the position information, and are classified into each group.
  • the information processing apparatus according to any one of appendices A3 to A7, wherein the output information is generated for each record.
  • the plurality of collected files include a setting file corresponding to a first device included in the information system,
  • the file identification information includes identification information of the first device.
  • the information processing apparatus according to any one of appendices A1 to A8.
  • the information processing apparatus according to any one of appendices A1 to A9, wherein the plurality of collection files include a command execution result for a second apparatus included in the information system.
  • the plurality of collection files include a plurality of data records including a set of data corresponding to each attribute based on the corresponding format.
  • the first specifying unit includes, as the position information, including information for identifying a data record to which the extracted data belongs and a positional relationship in the data record in the corresponding attribute in the corresponding collection file.
  • the information processing apparatus according to any one of supplementary notes A1 to A10.
  • (Appendix B1) A collection unit for collecting a plurality of collection files described in each of a plurality of types of formats from an information system and storing the collected files in a storage device; An extraction unit for extracting a set of attributes and data from each of the plurality of collection files in the storage device based on the format corresponding to each collection file; A first specifying unit for specifying position information indicating a position in the collection file corresponding to the extracted data; For the extracted data, a registration unit that registers in the database a management record in which the corresponding attribute, the identified location information, and the file identification information of the collected file are associated with each other; A data management system comprising: (Appendix B2) The registration unit The data management system according to Appendix B1, wherein the management record is further associated with an update date and time of the collected file and registered in the database.
  • Appendix B3 A storage unit that stores an output definition including a plurality of the attributes to be output and the file identification information in association with each other; A receiving unit for receiving an output condition including first file identification information corresponding to the collected file; A second specifying unit for specifying, from the storage unit, a first output definition associated with the first file identification information; An acquisition unit that acquires, from the database, a plurality of first management records corresponding to a combination of any of the attributes included in the first output definition and the first file identification information; Based on the first output definition and each of the position information in the plurality of first management records, data in the plurality of first management records is concatenated to generate first output information.
  • a generator An output unit for outputting the first output information;
  • the data management system according to appendix B1 or B2.
  • Appendix C1 Computer A set of attributes and data is extracted from each of a plurality of collected files collected from the information system and described in a plurality of types of formats based on the format corresponding to each collected file, Identifying location information indicating a location in the collection file corresponding to the extracted data;
  • a data management method for registering, in a database, a management record in which the corresponding attribute, the specified position information, and file identification information of the collected file are associated with each other for the extracted data.
  • Appendix D1 A process of extracting a set of attributes and data from each of a plurality of collected files collected from the information system and described in each of a plurality of types of formats, based on the format corresponding to each collected file; , A process for identifying position information indicating a position in the collection file corresponding to the extracted data; For the extracted data, a process of registering in the database a management record in which the corresponding attribute, the specified location information, and the file identification information of the collected file are associated with each other; Data management program that causes a computer to execute.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

異なる複数の用途のファイル内のデータを統一的に管理すること。情報処理装置(1)は、情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応するフォーマットに基づいて、属性(1412)とデータ(1411)の組を抽出する抽出部(11)と、抽出されたデータ(1411)に対応する収集ファイル内の位置を示す位置情報(1413)を特定する第1の特定部(12)と、抽出されたデータ(1411)について、対応する属性(1412)と、特定された位置情報(1413)と、収集ファイルのファイル識別情報(1414)と、を対応付けた管理レコード(141)をデータベース(14)に登録する登録部(13)と、を備える。

Description

情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムが格納された非一時的なコンピュータ可読媒体
 本発明は、情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムに関し、特に、異なる複数の用途のファイル内のデータを管理するための情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムに関する。
 近年、情報システムの大規模化及び複雑化に伴い、情報システムから収集すべき収集対象のデータの種類が多様化している。また、収集対象のデータの収集元によってデータフォーマットが異なる。そこで、特許文献1から3には、ログデータに関して共通フォーマットに変換する技術が開示されている。
 特許文献1には、各種サーバからログ情報を収集し、収集したログ情報について、統計処理を行う際の入力データとなるデータセットに変換して統計処理を行い、統計処理の結果を表示形式で保存する技術が開示されている。また、特許文献2には、多種多様なログファイルを共通フォーマットにするために必要なログフォーマットを自動生成するログフォーマット変換装置に関する技術が開示されている。特許文献2にかかるログフォーマット変換装置は、ログフォーマット生成用知識とログの文字列パターンから規則性を抽出して、ログフォーマットを自動生成する。また、特許文献3には、複数種類のフォーマットのログメッセージに対してフォーマット変換を行って、ログメッセージのフォーマットの共通化を行う技術が開示されている。
特開平10-312323号公報 特開2007-249694号公報 特開2009-009448号公報
 しかしながら、特許文献1から3では、異なる複数の用途のファイル内のデータを統一的に管理することができないという問題点がある。その理由は、特許文献1から3は、ログファイルという特定用途のファイルを対象にしてフォーマットを統一するものであるためである。そして、異なる複数の用途のファイルについては、レコードや属性の質が異なるため、フォーマットの統一には適さないためである。
 本開示は、このような問題点を解決するためになされたものであり、異なる複数の用途のファイル内のデータを統一的に管理するための情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムを提供することを目的とする。
 本開示の第1の態様にかかる情報処理装置は、
 情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する抽出部と、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する第1の特定部と、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する登録部と、
 を備える。
 本開示の第2の態様にかかるデータ管理システムは、
 複数種類のフォーマットのそれぞれで記述された複数の収集ファイルを情報システムから収集して記憶装置に保存する収集部と、
 前記記憶装置内の前記複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する抽出部と、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する第1の特定部と、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する登録部と、
 を備える。
 本開示の第3の態様にかかるデータ管理方法は、
 コンピュータが、
 情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出し、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定し、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する。
 本開示の第4の態様にかかるデータ管理プログラムは、
 情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する処理と、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する処理と、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する処理と、
 をコンピュータに実行させる。
 本開示により、異なる複数の用途のファイル内のデータを統一的に管理するための情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムを提供することができる。
本実施の形態1にかかる情報処理装置の構成を示すブロック図である。 本実施の形態1にかかるデータ管理方法の流れを説明するためのフローチャートである。 本実施の形態2にかかるデータ管理システムを含む全体構成を示すブロック図である。 本実施の形態2にかかる収集ファイルの概念を説明する図である。 本実施の形態2にかかる設定ファイルの例を説明する図である。 本実施の形態2にかかる設定ファイルの例を説明する図である。 本実施の形態2にかかるデータ管理装置の構成を示すブロック図である。 本実施の形態2にかかる出力定義情報の例を説明する図である。 本実施の形態2にかかる出力定義情報の例を説明する図である。 本実施の形態2にかかる管理レコードの例を説明する図である。 本実施の形態2にかかる管理レコードの他の例を説明する図である。 本実施の形態2にかかるデータ登録処理の流れを説明するためのフローチャートである。 本実施の形態2にかかる管理端末における表示画面及び出力情報の例を説明する図である。 本実施の形態2にかかるデータ出力処理の流れを説明するためのフローチャートである。 本実施の形態3にかかる管理端末における表示画面及び出力情報の例を説明する図である。 本実施の形態4にかかる管理端末における表示画面及び出力情報の例を説明する図である。 本実施の形態5にかかる管理端末における表示画面及び出力情報の例を説明する図である。
 以下では、本開示の実施の形態について、図面を参照しながら詳細に説明する。各図面において、同一又は対応する要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。
<実施の形態1>
 図1は、本実施の形態1にかかる情報処理装置1の構成を示すブロック図である。情報処理装置1は、異なる複数の用途のファイル内のデータを統一的に管理するためのコンピュータシステムである。そして、情報処理装置1は、複数台のコンピュータにより実現したものであってもよい。
 情報処理装置1は、複数の収集ファイルを入力とし、処理対象とする。ここで、複数の収集ファイルは、情報システム(不図示)から収集されたファイルである。尚、情報システムは、コンピュータ、通信機器、ストレージ等により構成されたシステムである。情報システムは、例えば、ネットワークを介して所定のサービスを提供するサービス提供システムや企業内の業務システム等である。
 また、複数の収集ファイルは、複数種類のフォーマットのそれぞれで記述された電子データである。つまり、各収集ファイルは、複数種類のフォーマットのいずれかによりデータが記述されたファイルである。そして、各収集ファイルに適用されるフォーマットの種類は、少なくとも2以上である。収集ファイルは、例えば、サーバの設定ファイル、ログファイル、又は、所定のコマンドの実行結果を含むインベントリファイル等である。そして、複数の収集ファイルには、特定の用途について単にフォーマットが異なるだけではなく、異なる複数の用途のファイルが含まれる。また、フォーマットとは、少なくともデータを記述するためのルールを定義した情報であり、例えば、データ間の区切り文字等である。また、フォーマットは、各データに対応する複数の属性の種類や、属性の並び順、属性間の位置関係等の構成の規定を含むものでも良い。そのため、複数の収集ファイルには、対応するフォーマットに基づく各属性に対応するデータの集合を含む複数のデータレコードが含まれるものとする。
 情報処理装置1は、抽出部11と、特定部12と、登録部13と、データベース14とを備える。抽出部11は、複数の収集ファイルのそれぞれの中から、各収集ファイルに対応するフォーマットに基づいて、属性とデータの組を抽出する。ここで、属性とは、対応するデータの性質や特性を示す情報、パラメータの種類やパラメータ名の文字列等を示すものである。また、属性には、フォーマットによっては、要素、プロパティ等と呼ばれるものも含まれる。
 特定部12は、第1の特定部の一例であり、抽出部11により抽出されたデータに対応する収集ファイル内の位置を示す位置情報を特定する。ここで、位置情報とは、対応する収集ファイル内で、抽出されたデータが属するデータレコードを識別する情報、及び、対応する属性における当該データレコード内の位置関係を含む。尚、位置情報は、収集ファイル内のアドレス値等であってもよい。
 登録部13は、抽出されたデータ1411について、対応する属性1412と、特定された位置情報1413と、対応する収集ファイルのファイル識別情報1414と、を対応付けた管理レコード141をデータベース14に登録する。
 ここで、上述した抽出部11、特定部12及び登録部13は、情報処理装置1内の制御部(不図示)が本実施の形態にかかるデータ管理プログラムを読み込み実行することにより、実現される。
 データベース14は、情報処理装置1の内部の記憶装置(不図示)に保存されるデータの集合である。但し、当該記憶装置は、情報処理装置1と接続された外部装置であってもよい。データベース14は、複数の管理レコード141を管理する。管理レコード141は、データ1411と、属性1412と、位置情報1413と、ファイル識別情報1414とが対応付けられた情報である。そして、属性1412、位置情報1413及びファイル識別情報1414の組合せが管理レコード141又はデータ1411を一意に特定するための主キーである。尚、データベース14は、例えば、上述した制御部により所定のデータベース管理プログラムを読み込み実行することで、上述した記憶装置内のデータを管理することで実現される。また、データベース14は、分散管理するものであってもよい。
 図2は、本実施の形態1にかかるデータ管理方法の流れを説明するためのフローチャートである。まず、抽出部11は、複数の収集ファイルのそれぞれの中から、各収集ファイルに対応するフォーマットに基づいて、属性とデータの組を抽出する(S11)。尚、フォーマットに関する情報は、予め情報処理装置1内の記憶装置に格納されてもよい。その場合、抽出部11は、処理対象の収集ファイルに応じてフォーマットを選択し、選択したフォーマットに該当するフォーマット情報を記憶装置から読み出し、当該フォーマット情報を用いて抽出を行っても良い。または、抽出部11は、予め複数のフォーマットの種類に応じた抽出ロジックが実装されていてもよい。
 次に、特定部12は、ステップS11において抽出されたデータに対応する収集ファイル内の位置を示す位置情報を特定する(S12)。そして、登録部13は、前記抽出されたデータについて、対応する属性と、前記特定された位置情報と、対応する収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベース14に登録する(S13)。
 このように、本実施の形態では、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、データレコード単位ではなく、各データレコード内の複数の属性ごとのデータ単位に分割する。このとき、各データと対応する属性とを一対一の組として対応付ける。但し、データレコード内で同一の属性に対応するデータが複数含まれる場合がある。そのため、属性だけでは、データレコードに含まれるデータを一意に特定できない。そこで、抽出される各データについて、収集ファイル内での位置情報を特定する。そして、抽出される各データについて、属性、位置情報及びファイル識別情報を対応付けて、データベースに登録する。これにより、データが属する収集ファイルを特定し、ファイル内の位置も特定でき、その上で、データの特性を示す属性も特定できる。そのため、データベース内の各データについて、様々な要求に応じて選択して適宜加工を行うことができる。よって、本実施の形態により、異なる複数の用途のファイル内のデータを統一的に管理することができる。
 ここで、特許文献1から3では、レコード単位でデータを管理し、レコード内の属性を異なるフォーマット間で対応付けることになる。そのため、データを利活用する際には、統一後のフォーマットの範囲でしか利用できない。それ故、統一後のフォーマットの形式に依存してしまう。これに対し、本実施の形態では、レコード単位ではなく、値(データ)単位まで分解して、各値に属性だけでなく、ファイル内で一意な識別子を付加することで、ファイル内の識別子と値との組合せで保管するものである。これにより、様々な観点で分割後のデータを利活用できる。
<実施の形態2>
 本実施の形態2は、上述した実施の形態1の応用例である。本実施の形態2にかかる前記登録部は、前記管理レコードに前記収集ファイルの更新日時をさらに対応付けて前記データベースに登録するものである。これにより、同一の収集ファイルの更新履歴を管理できる。
 さらに、本実施の形態2にかかる情報処理装置は、実施の形態1の情報処理装置1の構成に加え、以下の記憶部と、受付部と、第2の特定部と、取得部と、生成部と、出力部と、を備えることが望ましい。ここで、記憶部は、出力対象の複数の前記属性を含む出力定義と前記ファイル識別情報とを対応付けて記憶する。受付部は、前記収集ファイルに対応する第1のファイル識別情報を含む出力条件を受け付ける。第2の特定部は、前記第1のファイル識別情報に対応付けられた第1の出力定義を前記記憶部から特定する。取得部は、前記第1の出力定義に含まれる前記属性のいずれかと前記第1のファイル識別情報との組合せに該当する複数の第1の管理レコードを前記データベースから取得する。生成部は、前記第1の出力定義と前記複数の第1の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第1の管理レコード内のデータを連結して第1の出力情報を生成する。出力部は、前記第1の出力情報を出力する。これにより、収集ファイルを復元して出力することができる。よって、元の収集ファイルを保管する必要がなくなり、ストレージコストを低減することができる。
 また、前記登録部は、前記抽出部により抽出された属性を、抽出元の収集ファイルごとにまとめて前記出力定義として生成し、当該抽出元の収集ファイルのファイル識別情報と当該生成された出力定義とを対応付けて前記記憶部へ登録することが望ましい。これにより、収集ファイル内で用いられる複数の属性の出力定義を自動生成できる。
 また、前記生成部は、複数の第1の管理レコードのうち第1の出力定義に含まれる同一の属性に該当する複数のレコードについて、位置情報に基づいて異なる複数のグループに分類する。そして、前記生成部は、各グループに分類されたレコードごとに、出力情報を生成することが望ましい。これにより、元のデータレコードに対応するように出力情報を復元できる。
 尚、前記複数の収集ファイルには、前記情報システムに含まれる第1の装置に対応する設定ファイルが含まれ、前記ファイル識別情報は、前記第1の装置の識別情報を含むものであるとよい。これにより、設定ファイル名が同一であっても、設定ファイルの対象となるホスト等により識別できる。
 また、前記複数の収集ファイルには、前記情報システムに含まれる第2の装置に対するコマンド実行結果が含まれるとよい。これにより、情報システムに対する診断コマンドによる実行結果(インベントリ)についても統一的に管理できる。
 また、前記複数の収集ファイルには、対応する前記フォーマットに基づく各属性に対応するデータの集合を含む複数のデータレコードが含まれるとよい。この場合、前記第1の特定部は、対応する前記収集ファイル内で、前記抽出されたデータが属するデータレコードを識別する情報、及び、対応する属性における当該データレコード内の位置関係を含めて前記位置情報として特定するとよい。これにより、位置情報を用いて正確に元のファイル内のデータレコードを復元できる。
 また、本実施の形態2にかかるデータ管理システムは、以下の収集部と、抽出部と、第1の特定部と、登録部と、を備えるものといえる。ここで、収集部は、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルを情報システムから収集して記憶装置に保存する。抽出部は、前記記憶装置内の前記複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する。第1の特定部は、前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する。登録部は、前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する。
 図3は、本実施の形態2にかかるデータ管理システム3000を含む全体構成を示すブロック図である。図3は、外部システム1000と、情報システム2000と、データ管理システム3000とを示す。情報システム2000は、本実施の形態にかかるデータ管理システム3000の管理対象のデータを複数の収集ファイルにより提供するシステムである。尚、情報システム2000は、上述したサービス提供システムや企業内の業務システム等であってもよい。外部システム1000は、情報システム2000とネットワーク(不図示)を接続されているが、データ管理システム3000によるデータの管理対象外の情報システムである。また、情報システム2000とデータ管理システム3000とはネットワークNを介して接続されている。ここで、ネットワークNは、インターネット、専用線等の通信ネットワークである。
 情報システム2000は、ルータ210と、AP(Application)サーバ220と、DB(DataBase)サーバ230と、スイッチ240と、GW(GateWay)サーバ250と、FW(FireWall)260と、ストレージ装置270とを備える。但し、情報システム2000の構成はこれらに限定されない。また、情報システム2000内の構成間の接続関係もこれに限定されない。情報システム2000は、コンピュータサーバ、ネットワーク機器、ストレージ装置等の少なくとも1以上を含むものであり、異なる複数の用途のファイルを提供できるものであればよい。
 ルータ210は、外部システム1000及びAPサーバ220と接続され、情報システム2000内外の通信で通過する通信パケットのルーティングを行うネットワーク機器である。
 APサーバ220は、ミドルウェアとしてのAPサーバが稼働し、また、当該APサーバ上で動作し、所定のサービスを提供するアプリケーションが稼働するコンピュータである。APサーバ220は、ルータ210及びスイッチ240と接続されている。APサーバ220は、設定ファイル221及びログファイル222を内部の記憶装置(不図示)内に保存している。尚、設定ファイル221及びログファイル222のそれぞれは、2以上であっても構わない。設定ファイル221は、例えば、OS(Operating System)、APサーバ又はアプリケーション等の設定値が属性ごとに定義されたファイルである。ログファイル222は、例えば、OS、APサーバ又はアプリケーション等のログメッセージを記録したファイルである。尚、APサーバ220は、複数台のコンピュータにより実現したものであってもよい。
 DBサーバ230は、ミドルウェアとしてのDBサーバ(DB管理システム)が稼働し、ストレージ装置270に保存されたデータを管理するコンピュータである。DBサーバ230は、スイッチ240及びストレージ装置270と接続されている。DBサーバ230は、設定ファイル231及びログファイル232を内部の記憶装置(不図示)内に保存している。尚、設定ファイル231及びログファイル232は、のそれぞれは、2以上であっても構わない。設定ファイル231は、例えば、OS又はDBサーバ等の設定値が属性ごとに定義されたファイルである。ログファイル232は、例えば、OS又はDBサーバ等のログメッセージを記録したファイルである。尚、DBサーバ230は、複数台のコンピュータにより実現したものであってもよい。
 ストレージ装置270は、DBサーバ230と接続された記憶装置である。ストレージ装置270は、DBサーバ230が管理するデータの集合が記憶されている。スイッチ240は、APサーバ220、DBサーバ230及びFW260と接続され、これらの間の通信で通過する通信データの中継を行うネットワーク機器である。FW260は、スイッチ240、GWサーバ250及びネットワークNと接続され、情報システム2000内とネットワークNとの通信の中継及び監視を行うネットワーク機器である。
 GWサーバ250は、FW260と接続され、情報システム2000内とネットワークNとの間のプロトコルの変換を行うコンピュータである。GWサーバ250は、設定ファイル251及びログファイル252を内部の記憶装置(不図示)内に保存している。尚、設定ファイル251及びログファイル252のそれぞれは、2以上であっても構わない。設定ファイル251は、例えば、OS又はGWサーバ等の設定値が属性ごとに定義されたファイルである。ログファイル252は、例えば、OS又はGWサーバ等のログメッセージを記録したファイルである。尚、GWサーバ250は、複数台のコンピュータにより実現したものであってもよい。
 尚、設定ファイル221、231及び251には、複数の設定内容のそれぞれをデータレコードとし、各データレコードに1以上の属性(設置項目)と1以上の設定値が設定されているものとする。但し、設定ファイル221等のそれぞれは、フォーマットが異なるものであってよい。また、設定ファイル221等のそれぞれは、情報システム2000に含まれる第1の装置に対応する設定ファイルということができる。
 また、ログファイル222、232及び252は、適宜、追記により更新されるものとする。また、ログファイル222等のそれぞれは、フォーマットが異なるものであってよい。尚、ルータ210、スイッチ240、FW260及びストレージ装置270は、設定ファイル又はログファイルを内部の記憶装置(不図示)内に保存してもよく、これらを収集ファイルに含めても良い。
 データ管理システム3000は、収集サーバ310と、データ管理装置320と、管理端末326とを備える。収集サーバ310は、ネットワークNを介して情報システム2000から複数の収集ファイルを収集し、保管する情報処理装置である。収集サーバ310は、ネットワークN及びデータ管理装置320と接続されている。そして、収集サーバ310は、複数台のコンピュータにより実現したものであってもよい。収集サーバ310は、収集部311と、収集DB312とを備える。
 収集部311は、定期的又は管理者による管理端末326からの指示に応じて、ネットワークNを介して情報システム2000から複数の収集ファイルを収集する。例えば、収集部311は、ネットワークNを介してAPサーバ220から設定ファイル221及びログファイル222を取得し、収集DB312に保存する。また、収集部311は、ネットワークNを介してDBサーバ230から設定ファイル231及びログファイル232を取得し、収集DB312に保存する。また、収集部311は、ネットワークNを介してGWサーバ250から設定ファイル251及びログファイル252を取得し、収集DB312に保存する。尚、収集部311は、ネットワークNを介してルータ210、スイッチ240、FW260、ストレージ装置270から設定ファイル又はログファイルを取得し、収集DB312に保存してもよい。また、収集部311は、定期的又は管理者による管理端末326からの指示に応じて、ネットワークNを介して情報システム2000に含まれる第2の装置に対して所定の診断コマンドを発行する。そして、収集部311は、診断コマンドの応答であるコマンド実行結果をインベントリファイルとして収集DB312に保存する。例えば、収集部311は、ネットワークNを介して、ルータ210、APサーバ220、DBサーバ230、スイッチ240、GWサーバ250、FW260及びストレージ装置270の少なくとも1以上に対して、所定の診断コマンドを発行するものとする。尚、診断コマンドとは、例えば、PINGコマンド等であるが、これに限定されない。尚、収集部311は、収集サーバ310内の制御部(不図示)が所定の収集プログラムを読み込み実行することにより、実現される。
 収集DB312は、収集サーバ310の内部の記憶装置(不図示)に保存されるデータの集合である。尚、当該記憶装置は、情報処理装置1と接続された外部装置であってもよい。収集DB312は、複数の収集ファイル313を管理する。複数の収集ファイル313には、設定ファイル221、231及び251、ログファイル222、232及び252、並びに、上述したインベントリファイルの少なくとも2以上が含まれる。そのため、複数の収集ファイル313は、異なる種類の設定ファイル、ログファイル、インベントリファイルが含まれ、異なる複数の用途のファイルであり、複数種類のフォーマットのそれぞれで記述されたファイルといえる。
 図4は、本実施の形態2にかかる収集ファイルの概念を説明する図である。収集ファイル400は、上述した収集ファイル313を一般化したものである。収集ファイル400は、複数のレコード410、420、・・・4n0(nは2以上の自然数。)が記述されている。レコード410は、パラメータ名4111及びデータ4112の組、パラメータ名4121及びデータ4122の組、・・・が含まれる。つまり、データ4112は、パラメータ名4111に対応する設定値等である。同様に、データ4122は、パラメータ名4121に対応する設定値等である。また、収集ファイル400は、ファイル属性40としてファイルID41、対象ホスト42、最終更新日時43が設定されている。ファイルID41は、ファイル名やファイルの保存先のディレクトリ等の情報である。また、対象ホスト42は、収集ファイル400に記述されるレコード410等の提供元の機器の識別情報、つまりホストIDである。例えば、収集ファイル400が設定ファイル221の場合、対象ホスト42は、APサーバ220のマシン名、IP(Internet Protocol)アドレス等である。また、収集ファイル400がインベントリファイルの場合、対象ホスト42は、診断コマンドの実行先のホストとなる。ここで、ファイルID41及び対象ホスト42は、収集ファイル400のファイル識別情報の一例である。但し、対象ホスト42は、必須の構成ではない。最終更新日時43は、収集ファイル400が対象ホストにおいて最後に更新された年月日時分秒(又はミリ秒)を示すタイムスタンプである。尚、収集ファイル400がインベントリファイルの場合、最終更新日時43は、診断コマンドの実行時刻か、収集サーバ310における当該インベントリファイルの保存時刻である。
 図5は、本実施の形態2にかかる設定ファイル400aの例を説明する図である。設定ファイル400aは、収集ファイル400の一例であり、各データレコードが改行文字で区切られ、データレコード内の複数の属性値がカンマで区切られたCSV(Comma-Separated Values)形式のファイルである。この場合、設定ファイル400aが対応するフォーマット情報には、例えば、区切り文字として改行文字、カンマ文字が定義されていることになる。また、当該フォーマット情報には、各データレコードの1つ目の属性がレコードID、2つ目の属性がパラメータ1、3つ目の属性がパラメータ2といった属性の種類及び並び順が定義されていてもよい。
 図6は、本実施の形態2にかかる設定ファイル400bの例を説明する図である。設定ファイル400bは、収集ファイル400の一例であり、XML(eXtensible Markup Language)形式のファイルであることを示す。この場合、設定ファイル400bが対応するフォーマット情報には、例えば、XMLフォーマットである旨が定義されていることになる。また、当該フォーマット情報には、データレコードの要素が“record”、その子要素が“element1”、“element2”、“element1”の子要素が複数個の“element11”である旨が定義されていても良い。
 図3に戻り説明を続ける。データ管理装置320は、上述した情報処理装置1の一例であり、収集サーバ310及び管理端末326と接続されているコンピュータである。データ管理装置320は、収集DB312から複数の収集ファイル313を読み出し、複数の管理レコード325をデータ管理DB324に登録する。また、データ管理装置320は、所定の契機又は管理者による管理端末326からの指示に応じて、所定の出力条件に基づきデータ管理DB324から一部の管理レコード325を取得し、所定の出力形式で管理端末326等へ出力する。また、データ管理装置320は、複数台のコンピュータにより実現したものであってもよい。データ管理装置320は、抽出部321と、特定部322と、登録部323と、データ管理DB324とを少なくとも備える。尚、データ管理装置320は、概略の構成を示すものであり、詳細な構成は図7を用いて後述する。
 管理端末326は、データ管理システム3000の管理者が操作を行う端末装置であり、例えば、パーソナルコンピュータ等である。管理端末326は、ネットワーク等を介してデータ管理装置320と通信可能に接続されており、管理者の操作に応じデータ管理装置320へアクセスし情報の入力等を行う。尚、管理端末326は、収集サーバ310と接続されていてもよい。
 図7は、本実施の形態2にかかるデータ管理装置500の構成を示すブロック図である。データ管理装置500は、図3のデータ管理装置320に相当するものである。データ管理装置500は、記憶部510と、データ管理DB520と、制御部530と、IF部540とを備える。尚、データ管理DB520は、データ管理装置500と接続された外部の記憶装置上で実現されてもよい。
 記憶部510は、ハードディスク、フラッシュメモリ等の記憶装置である。記憶部510は、フォーマット情報511と、出力定義情報512と、期待値513と、プログラム514とを記憶する。フォーマット情報511は、上述した通り、設定ファイル221等、ログファイル222等、又は、インベントリファイルのフォーマットを定義した情報である。フォーマット情報511は、例えば、CSV、XML、JSON(JavaScript(登録商標) Object Notation)その他の形式を示す情報である。
 出力定義情報512は、出力対象の複数の属性を含む出力定義と収集ファイルのファイル識別情報とを対応付けた情報である。出力定義情報512は、例えば、収集ファイルのフォーマットを再現して表示するための表示形式であるか、収集ファイルで用いられる一部の属性値を抽出して統計処理等を行うために出力するファイルフォーマット等である。または、出力定義情報512は、収集ファイルのデータ構造を定義した構成情報であってもよい。
 図8は、本実施の形態2にかかる出力定義情報512aの例を説明する図である。出力定義情報512aは、収集ファイルがCSV形式である場合の出力形式等を定義した情報である。例えば、出力定義情報512aは、出力定義ID、ファイルID、カラム順序1から3を属性とするテーブルである。カラム順序1から3には、属性名(パラメータ名)を示す文字列が設定される。また、カラム順序1から3は、属性の順序を示す。尚、カラム順序は、2以上であればよい。
 図9は、本実施の形態2にかかる出力定義情報512bの例を説明する図である。出力定義情報512bは、収集ファイルがXML形式である場合の出力形式等を定義した情報である。例えば、出力定義情報512bは、出力定義ID、ファイルID、親ノード、ノード名、「繰り返し」(可否)を属性とするテーブルである。ノード名は、1つの出力定義ID及びファイルIDあたりに、所属する要素、属性、パラメータの名称を示す文字列である。親ノードは、ノード名の親ノードを示す。つまり、親ノードは、子ノードのリンク先を示す。また、「繰り返し」は、該当ノードが繰り返し設定されることを許可するか否かを示すフラグ情報である。尚、出力定義情報512bは、これに限定されない。
 図7に戻り説明を続ける。期待値513は、所定の収集ファイル内の所定の属性に対応するデータとの比較対象の値である。プログラム514は、データ管理プログラムの一例であり、本実施の形態にかかるデータ管理処理が実装されたコンピュータプログラムである。尚、フォーマット情報511、出力定義情報512、期待値513は、管理端末326からの入力された情報であってもよい。
 データ管理DB520は、図3のデータ管理DB324に対応し、図1のデータベース14の一例である。データ管理DB520は、例えば、KVS(Key-Value Store)である。そして、データ管理DB520は、複数台のストレージ装置に分散して管理されてもよい。但し、データ管理DB520は、リレーショナルデータベースその他のデータベースシステムにより実現されてもよい。
 データ管理DB520は、管理レコード521、522・・・を管理する。管理レコード521は、データ5211と、属性5212と、位置情報5213と、ファイルID5214と、対象ホスト5215と、最終更新日時5216とが対応付けられた情報である。尚、管理レコード522も同様の構成である。データ管理DB520がKVSの場合、例えば、属性5212、位置情報5213、ファイルID5214、対象ホスト5215及び最終更新日時5216の組がKEYであり、データ5211がVALUEである。但し、KEYは少なくとも、位置情報5213、ファイルID5214及び最終更新日時5216の組であればよい。また、ファイルID5214の代わりに対象ホスト5215を用いても良い。
 データ5211は、上述したデータ1411の一例であり、図4のデータ4112等に対応する情報である。属性5212は、上述した属性1412の一例であり、図4のパラメータ名4111等に対応する情報である。位置情報5213は、上述した位置情報1413の一例である。つまり、位置情報5213は、対応する収集ファイル内で、抽出されたデータが属するデータレコードを識別する情報、及び、対応する属性における当該データレコード内の位置関係を含む。データレコードを識別する情報とは、例えば、レコードID等である。データレコード内の位置関係とは、例えば、図8におけるカラム順序の番号や、図9のノードの階層構造、階層番号、ノードの接続関係等である。ファイルID5214及び対象ホスト5215は、上述したファイル識別情報1414の一例であり、図4のファイルID41及び対象ホスト42に対応する情報である。最終更新日時5216は、図4の最終更新日時43に対応する情報である。
 図10は、本実施の形態2にかかる管理レコードの例を説明する図である。ここでは、上述した図5の設定ファイル400aに対応する管理コードの例を示す。ここで、管理レコードのKEY52aは、最終更新日時、ファイルID、対象ホスト、レコードID、位置関係及び属性名の組とする。尚、ファイルID及び対象ホストは、ファイル識別情報52a1ということができ、レコードID及び位置関係は、位置情報52a2ということができる。また、管理レコードのVALUE52bは、データとする。
 図11は、本実施の形態2にかかる管理レコードの他の例を説明する図である。ここでは、上述した図6の設定ファイル400bに対応する管理コードの例を示す。ここで、位置関係は、要素の階層構造を示す情報であるが、これに限定されない。
 図7に戻り説明を続ける。制御部530は、CPU等のプロセッサ及びメモリを含むものであり、データ管理装置500の各構成を制御する。制御部530のプロセッサは、記憶部510からプログラム514をメモリへ読み込み、プログラム514を実行する。これにより、制御部530は、抽出部531、第1の特定部532、登録部533、受付部534、第2の特定部535、取得部536、生成部537及び出力部538の機能を実現する。
 抽出部531は、図1の抽出部11の一例であり、図3の抽出部321に対応する。抽出部531は、収集DB312内の複数の収集ファイル313のそれぞれの中から、各収集ファイルに対応するフォーマット情報511に基づいて、属性5212とデータ5211の組を抽出する。
 第1の特定部532は、図1の特定部12の一例であり、図3の特定部322に対応する。第1の特定部532は、抽出部531により抽出されたデータに対応する収集ファイル内の位置を示す位置情報5213を特定する。特に、第1の特定部532は、対応する収集ファイル内で、抽出部531により抽出されたデータが属するデータレコードを識別する情報、及び、対応する属性における当該データレコード内の位置関係を含めて位置情報5213として特定する。
 登録部533は、図1の登録部13の一例であり、図3の登録部323に対応する。登録部533は、前記抽出されたデータ5211について、対応する属性5212と、前記特定された位置情報5213と、収集ファイルのファイルID5214及び対象ホスト5215と、を対応付けた管理レコード521を生成する。また、登録部533は、管理レコード521に、収集ファイルの最終更新日時5216をさらに対応付けてデータ管理DB520に登録する。また、登録部533は、抽出部531により抽出された属性を、抽出元の収集ファイルごとにまとめて出力定義として生成する。そして、登録部533は、当該抽出元の収集ファイルのファイル識別情報と当該生成された出力定義とを対応付けて出力定義情報512として記憶部510へ登録する。
 受付部534は、収集ファイルに対応する第1のファイル識別情報を含む出力条件を受け付ける。例えば、受付部534は、管理者により入力された出力条件を管理端末326から受信する。第2の特定部535は、第1のファイル識別情報に対応付けられた第1の出力定義(出力定義情報512)を記憶部510から特定する。取得部536は、第1の出力定義に含まれる属性のいずれかと第1のファイル識別情報との組合せに該当する複数の第1の管理レコードをデータ管理DB520から取得する。生成部537は、第1の出力定義と複数の第1の管理レコード内の位置情報5213のそれぞれとに基づいて、複数の第1の管理レコード内のデータを連結して第1の出力情報を生成する。特に、生成部537は、複数の第1の管理レコードのうち第1の出力定義に含まれる同一の属性に該当する複数のレコードについて、位置情報に基づいて異なる複数のグループに分類し、各グループに分類されたレコードごとに、出力情報を生成する。出力部538は、第1の出力情報を出力する。例えば、出力部538は、管理端末326に対して第1の出力情報を送信して、表示させる。または、出力部538は、外部の記憶装置等に第1の出力情報を出力して保存する。
 IF部540は、データ管理装置500の外部との通信等を行うインタフェースである。例えば、IF部540は、管理端末326からの要求を受信し、制御部530へ出力する。また、IF部540は、制御部530から指示を受け付け、管理端末326へ出力する。また、IF部540は、制御部530からの指示に応じて収集DB312に対して収集ファイル313の読み出し要求を送信し、応答として受信した収集ファイル313を制御部530へ出力する。
 図12は、本実施の形態2にかかるデータ登録処理の流れを説明するためのフローチャートである。まず、データ管理装置500は、所定のタイミング又は管理者による管理端末326からの指示に応じて、データ登録処理を開始する。そして、抽出部531は、収集DB312を参照し、登録対象の収集ファイル313があるか否かを判定する(S101)。例えば、収集DB312内で各収集ファイル313についてデータ登録処理済みか否かを示すフラグが管理されている場合、抽出部531は、当該フラグにより判定する。
 ステップS101において登録対象の収集ファイル313があると判定した場合、抽出部531は、収集DB312から未登録の収集ファイル313を登録対象として取得する(S102)。そして、抽出部531は、取得した収集ファイル313の種類に応じて記憶部510の中から該当するフォーマット情報511を読み出す。抽出部531は、読み出したフォーマット情報511に基づき属性とデータの組を抽出する(S103)。詳細には、まず、抽出部531は、フォーマット情報511に定義されたデータレコードの区切り情報に基づき、収集ファイル313の中から1件分のデータレコードを抽出する。そして、抽出部531は、フォーマット情報511に定義された属性の区切り情報に基づき、抽出したデータレコードを複数のデータに分割する。そして、抽出部531は、フォーマット情報511に定義された属性の順序や位置関係に基づき、分割した各データと対応する位置の属性とを一組として抽出する。
 例えば、取得した収集ファイルが図5の設定ファイル400aの場合、抽出部531は、設定ファイル400aの中から1行分のデータ(“R1, aaa, bbb”)をデータレコードとして抽出する。そして、抽出部531は、抽出したデータレコードをカンマ文字で分割して複数のデータとする。そして、抽出部531は、分割した1番目のデータ(“R1”)をレコードIDとの組、2番目のデータ(“aaa”)をparam1との組、3番目のデータ(“bbb”)をparam2との組として抽出する。
 また、例えば、取得した収集ファイルが図6の設定ファイル400bの場合、抽出部531は、設定ファイル400bの中から“record”タグで囲まれたデータを1件のデータレコードとして抽出し、データ“R1”とレコードIDとの組を抽出する。そして、抽出部531は、抽出したデータレコードを“element1”タグと“element2”タグとのそれぞれで囲まれたデータに分割する。そして、抽出部531は、分割した“element1”タグで囲まれたデータから、データ“ccc”と“element1”との組を抽出する。また、抽出部531は、分割した“element1”タグで囲まれたデータから、“element11”タグで囲まれたデータに分割する。そして、抽出部531は、“element11”タグで囲まれたデータから、データ“dd1”と“element11”との組を抽出する。同様に、抽出部531は、データ“dd2”と“element11”との組、データ“eee”と“element2”との組を抽出する。
 また、ステップS102と共に、第1の特定部532は、収集ファイル内における各抽出データの位置情報を特定する(S104)。例えば、第1の特定部532は、抽出部531が収集ファイルからデータと属性の組を抽出する際に、レコードIDをメモリ等に保持し、また、位置関係をカウント等することにより、図10や図11に示すような位置情報52a2を特定する。
 そして、登録部533は、抽出したデータ及び属性の組ごとに管理レコードを生成する(S105)。例えば、登録部533は、ステップS103で抽出したデータ及び属性の組に、ステップS104で特定した位置情報を対応付けて管理レコードとする。そして、登録部533は、当該管理レコードに、ステップS102において取得した収集ファイル313におけるファイルID41、対象ホスト42及び最終更新日時43を対応付ける。
 その後、登録部533は、生成した管理レコードをデータ管理DB520に登録する(S106)。例えば、上述のように、ステップS103からS105をデータレコード単位で処理した場合、登録部533は、当該データレコード内のデータ数分の管理レコードを生成し、それぞれの管理レコードをデータ管理DB520に登録する。そして、制御部530は、取得した収集ファイル313内に未抽出のデータがないか否かを判定する(S107)。例えば、データレコード単位で処理した場合、未抽出のデータレコードがないか否かを判定する。
 ステップS107において未抽出のデータ又はデータレコードがあると判定した場合、ステップS103からS107を繰り返す。ステップS107において未抽出のデータ又はデータレコードがないと判定した場合、制御部530は、取得した収集ファイル313に対応する出力定義情報512が記憶部510にないか否かを判定する(S108)。対応する出力定義情報512がないと判定した場合、登録部533は、ステップS103において抽出された属性をまとめて新たな出力定義として生成する。そして、登録部533は、生成した出力定義とステップS102において取得された収集ファイル313のファイル識別情報とを対応付けて出力定義情報512として記憶部510に登録する(S109)。
 ステップS109の後、又は、ステップS108において対応する出力定義情報512があると判定した場合、ステップS101へ戻る。そして、ステップS101において登録対象の収集ファイル313があると判定した場合、ステップS102からS109を繰り返す。一方、ステップS101において登録対象の収集ファイル313がないと判定した場合、当該データ登録処理を終了する。
 ここで、データ管理装置500は、例えば、WEBアプリケーションの機能を有するものとする。その場合、データ管理装置500は、出力条件の入力画面を生成し、管理端末326に対して、入力画面を送信する。管理端末326は、受信した入力画面を表示装置(不図示)に表示する。
 図13は、本実施の形態2にかかる管理端末326における表示画面600及び出力情報630の例を説明する図である。尚、この時点では、表示画面600には、出力情報630は表示されていないものとする。表示画面600は、対象ファイル指定欄610と、表示ボタン620とを備える。対象ファイル指定欄610は、プルダウンにより出力対象のファイル識別情報の指定を受け付ける欄である。表示ボタン620は、押下に応じて対象ファイル指定欄610で指定されたファイル識別情報を含む出力条件をデータ管理装置500へ送信するためのボタンである。
 ここで、管理端末326は、管理者から出力条件の入力又は選択の操作を入力装置(不図示)により受け付ける。例えば、管理端末326は、管理者から対象ファイル指定欄610に対象ファイルの指定操作を受け付ける。指定操作は、例えば、プルダウンである。そして、管理端末326は、管理者から表示ボタン620の押下操作を受け付ける。これに応じて、管理端末326は、対象ファイル指定欄610に指定された対象ファイルが示す第1のファイル識別情報(f3)を含む出力条件をデータ管理装置500へ送信する。
 図14は、本実施の形態2にかかるデータ出力処理の流れを説明するためのフローチャートである。受付部534は、管理端末326から、第1のファイル識別情報を含む出力条件を受け付ける(S201)。次に、第2の特定部535は、受け付けた第1のファイル識別情報に対応付けられた出力定義情報512を記憶部510から特定する(S202)。例えば、第2の特定部535は、ファイルID“f3”に対応付けられた出力定義情報512bを特定する。そして、取得部536は、特定した出力定義情報512に含まれる属性のいずれかと第1のファイル識別情報との組合せに該当する複数の第1の管理レコードをデータ管理DB520から取得する(S203)。例えば、取得部536は、図11に示す管理レコードのうち最新のものを複数の第1の管理レコードとして取得する。
 そして、生成部537は、出力定義情報512bと複数の第1の管理レコード内の位置情報52a2のそれぞれとに基づいて、複数の第1の管理レコード内のデータ(VALUE52b)を連結して第1の出力情報を生成する(S204)。特に、生成部537は、出力定義情報512bに含まれる同一の属性(例えば、“element1”等)に該当する複数のレコードについて、位置情報52a2(レコードID及び位置関係の組)に基づいて異なる複数のグループ(例えば、“R1”と“R2”)に分類する。そして、生成部537は、各グループに分類されたレコードごとに、出力情報を生成する。
 そして、出力部538は、ステップS204において生成された各出力情報を管理端末326へ出力、つまり送信する(S205)。その後、管理端末326は、受信した出力情報を表示装置に表示する。例えば、図14の表示画面600のように、出力情報630が表示される。出力情報630は、レコードデータ631と632の2レコードが表示されていることを示す。つまり、レコードデータ631は、レコードR1に含まれる全ての属性及びデータの組がまとめられており、レコードデータ632は、レコードR2に含まれる全ての属性及びデータの組がまとめられている。尚、表示形式をこれに限定されない。そして、表示画面600において管理者が他の対象ファイルを指定することで、指定された対象ファイルに対応する出力定義に基づいて、対象ファイルに含まれるデータを読み出し、表示することができる。
 このように、本実施形態では、異なる複数の用途、かつ、多様なフォーマットのデータを一元管理でき、収集データの活用が容易となる。例えば、収集ファイルとして設定ファイル、ログファイル、インベントリのいずれにも適用が可能である。また、上述したように、収集ファイルの内容を表示画面600により再現して表示することができる。そのため、元の収集ファイルの保存が不要となり、保存コストの低減、保存領域の有効活用ができる。
<実施の形態3>
 本実施の形態3は、上述した実施の形態2の改良例である。ここで、上述した特許文献1から3における他の観点の課題を説明する。特許文献1から3では、様々なフォーマットのログファイルを共通のフォーマットに統一できるが、統一後の各データが共通フォーマットの形式に依存するため、収集データの利用態様が限定的であるという問題点がある。例えば、特許文献1から3では、同種の収集ファイルにおける特定の属性値の時系列での比較ができない。すなわち、特許文献1では、統計処理の結果が特定の表示形式で保存されているため、利用態様が限定的となる。また、特許文献2では、複数のフォーマットのログメッセージを共通化した特定のフォーマットに変換して保存するため、ログメッセージの利用態様が特定のフォーマットに依存してしまい限定的となる。また、特許文献3では、複数のフォーマットのログメッセージを共通化した特定のフォーマットに変換した上で一つの監視用ログファイルに保存している。そのため、監視用ログファイル内の各データの利用態様が特定のフォーマットに依存してしまい限定的となる。
 そこで、本実施の形態3は、次のような構成を有する。すなわち、前記出力条件は、比較対象の2以上の時刻情報をさらに含む。そして、前記取得部は、前記第1の出力定義に含まれる前記属性のいずれか、及び、前記出力条件に含まれる前記2以上の時刻情報のいずれかに該当する複数の第2の管理レコードを前記データベースから取得する。そして、前記生成部は、前記複数の第2の管理レコード内のデータのうち、前記2以上の時刻情報のそれぞれに対応付けられたデータ同士を対比するように第2の出力情報を生成する。そして、前記出力部は、前記第2の出力情報を出力する。これにより、特定ファイル内の特定の属性のデータの更新履歴を比較できる。よって、利用態様の制限を緩和し、自由度を高めて、多様化することができる。利用態様の多様化としては、例えば、元の収集ファイルの形式に復元することに加え、特定の観点でのデータの抽出や絞り込み、同種の収集ファイルにおける特定の属性値の時系列での比較ができる。尚、本実施の形態3にかかるデータ管理装置の構成は、上記以外は実施の形態2と同様である。そのため、図示及び詳細な説明を省略する。
 図15は、本実施の形態3にかかる管理端末326における表示画面600a及び出力情報630aの例を説明する図である。まず、実施の形態2と同様、当初は、表示画面600aには、出力情報630aが表示されていないものとする。表示画面600aは、表示画面600に加え、比較対象日時指定欄641及び642と、履歴比較表示ボタン650を備える。比較対象日時指定欄641及び642は、プルダウンにより比較対象の日時の指定を受け付ける欄である。ここでは、比較対象日時指定欄が2つであるが3以上であっても構わない。履歴比較表示ボタン650は、押下に応じて、対象ファイル指定欄610で指定されたファイル識別情報並びに比較対象日時指定欄641及び642で指定された2つの日時を含む出力条件をデータ管理装置500へ送信するためのボタンである。
 ここで、例えば、管理端末326は、管理者から比較対象日時指定欄641及び642のそれぞれに比較対象の日時の指定を受け付ける。そして、管理端末326は、管理者から履歴比較表示ボタン650の押下操作を受け付ける。これに応じて、管理端末326は、対象ファイル指定欄610で指定されたファイル識別情報(f1)並びに比較対象日時指定欄641及び642に指定された2つの日時を含む出力条件をデータ管理装置500へ送信する。
 受付部534は、管理端末326から、第1のファイル識別情報及び2つの時刻情報を含む出力条件を受け付ける(S201)。第2の特定部535は、上記同様に、出力定義情報512を特定する(S202)。そして、取得部536は、出力定義情報512に含まれる属性のいずれか、及び、出力条件に含まれる2つの時刻情報のいずれかに該当する複数の第2の管理レコードをデータ管理DB520から取得する(S203)。例えば、取得部536は、図10に示す2つの最終更新日時のそれぞれに対応する管理レコードを第2の管理レコードとして取得する。
 そして、生成部537は、複数の第2の管理レコード内のデータのうち、2つの時刻情報のそれぞれに対応付けられたデータ同士を対比するように第2の出力情報を生成する(S204)。そして、出力部538は、第2の出力情報を出力、つまり送信する(S205)。その後、管理端末326は、受信した第2の出力情報を表示装置に表示する。例えば、図15の表示画面600aのように、出力情報630aが表示される。出力情報630aは、同一のレコードID“R1”について、更新日時が異なるレコードデータ631a及び632aが対比するように表示されていることを示す。
 このように、本実施の形態により、同一ファイルについての更新履歴の比較を行うことができる。
<実施の形態4>
 本実施の形態4は、上述した実施の形態2又は3の改良例である。本実施の形態4にかかる前記出力条件は、第1の属性におけるデータの期待値をさらに含む。そして、前記取得部は、前記第1の属性に該当する第3の管理レコードを前記データベースから取得する。そして、前記生成部は、前記第3の管理レコード内のデータと前記期待値とを対比するように第3の出力情報を生成する。そして、前記出力部は、前記第3の出力情報を出力する。これにより、期待値と実際の設定値の比較が可能となる。そのため、利用態様をさらに多様化することができる。尚、本実施の形態4にかかるデータ管理装置の構成は、上記以外は実施の形態2又は3と同様である。そのため、図示及び詳細な説明を省略する。
 図16は、本実施の形態4にかかる管理端末326における表示画面600b及び出力情報630bの例を説明する図である。まず、実施の形態2と同様、当初は、表示画面600bには、出力情報630bが表示されていないものとする。表示画面600bは、表示画面600に加え、比較対象属性指定欄660と、期待値比較表示ボタン670とを備える。尚、表示画面600bは、表示画面600aを改良したものであってもよい。比較対象属性指定欄660は、プルダウンにより、期待値と比較するための対象の属性の指定を受け付ける欄である。ここでは、比較対象属性指定欄が1つであるが、2以上であっても構わない。比較対象属性指定欄660に加えて、当該属性における期待値の入力を受け付ける欄を有しても構わない。期待値比較表示ボタン670は、押下に応じて、対象ファイル指定欄610で指定されたファイル識別情報並びに比較対象属性指定欄660で指定された属性を含む出力条件をデータ管理装置500へ送信するためのボタンである。
 ここで、例えば、管理端末326は、管理者から比較対象属性指定欄660に期待値と比較するための対象の属性の指定を受け付ける。そして、管理端末326は、管理者から期待値比較表示ボタン670の押下操作を受け付ける。これに応じて、管理端末326は、対象ファイル指定欄610で指定されたファイル識別情報(f3)並びに比較対象属性指定欄660に指定された属性(element2)を含む出力条件をデータ管理装置500へ送信する。尚、期待値の入力を受け付けていた場合、管理端末326は、さらに入力された期待値を送信する。
 受付部534は、管理端末326から、第1のファイル識別情報及び第1の属性を含む出力条件を受け付ける(S201)。ここで、受付部534は、出力条件に含まれる第1の属性(element2)に対応する期待値513を特定するものとする。そのため、受付部534は、ステップS201において、第1のファイル識別情報、並びに、比較対象の第1の属性及びその期待値の指定を出力条件として受け付けるものといえる。第2の特定部535は、上記同様に、出力定義情報512を特定する(S202)。
 そして、取得部536は、第1の属性(element2)に該当する第3の管理レコードをデータ管理DB520から取得する(S203)。そして、生成部537は、第3の管理レコード内のデータと期待値513とを対比するように第3の出力情報を生成する(S204)。そして、出力部538は、第3の出力情報を出力、つまり送信する(S205)。
 その後、管理端末326は、受信した第3の出力情報を表示装置に表示する。例えば、図16の表示画面600bのように、出力情報630bが表示される。出力情報630bは、レコードデータ631b及び632bが含まれる。レコードデータ631bは、ファイルID“f3”におけるレコードID“R1”に対応するレコードであり、レコードデータ632bは、ファイルID“f3”におけるレコードID“R2”に対応するレコードである。レコードデータ631bは、比較対象の属性として指定された“element2”の実際の設定値“eee”と期待値633b“eee”とを対比するように表示されていることを示す。また、レコードデータ632bは、比較対象の属性として指定された“element2”の実際の設定値“ee2”と期待値634b“EEE”とを対比するように表示されていることを示す。
 このように、本実施の形態により、期待値と実際の設定値の比較が可能となり、利用態様をさらに多様化することができる。
<実施の形態5>
 本実施の形態5は、上述した実施の形態2、3又は4の改良例である。本実施の形態5にかかる前記出力条件は、前記第1のファイル識別情報にかかる前記収集ファイルと前記フォーマットが共通するファイルの第2のファイル識別情報をさらに含む。そして、前記第2の特定部は、前記第2のファイル識別情報に対応付けられた第2の出力定義を前記記憶部からさらに特定する。そして、前記取得部は、前記第2の出力定義に含まれる前記属性のいずれかと前記第2のファイル識別情報との組合せに該当する複数の第4の管理レコードを前記データベースからさらに取得する。そして、前記生成部は、前記第2の出力定義と前記複数の第4の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第4の管理レコード内のデータを連結して第4の出力情報を生成する。そして、前記出力部は、前記第1の出力情報と対比するように、前記第4の出力情報を出力する。これにより、ホスト情報を複数選択してホスト単位の比較が可能となる。そのため、同質の属性についてファイルの横断的な比較が可能となり、利用態様をさらに多様化することができる。尚、本実施の形態5にかかるデータ管理装置の構成は、上記以外は実施の形態2、3又は4と同様である。そのため、図示及び詳細な説明を省略する。
 図17は、本実施の形態5にかかる管理端末326における表示画面600c及び出力情報630cの例を説明する図である。まず、実施の形態2と同様、当初は、表示画面600cには、出力情報630cが表示されていないものとする。表示画面600cは、表示画面600に加え、比較対象ホスト指定欄681及び682と、ホスト比較表示ボタン690とを備える。尚、表示画面600cは、表示画面600a又は600bを改良したものであってもよい。比較対象ホスト指定欄681及び682は、プルダウンにより、比較対象のホストの指定を受け付ける欄である。ここでは、比較対象ホスト欄が2つであるが3以上であっても構わない。ホスト比較表示ボタン690は、押下に応じて、比較対象ホスト指定欄681及び682で指定された2つのホストIDを含む出力条件をデータ管理装置500へ送信するためのボタンである。
 ここで、例えば、管理端末326は、管理者から比較対象ホスト指定欄681及び682のそれぞれに比較対象のホスト(host1及びhost4)の指定を受け付ける。尚、図17では、対象ファイル指定欄610にファイルが指定されていないものとする。そして、管理端末326は、管理者からホスト比較表示ボタン690の押下操作を受け付ける。これに応じて、管理端末326は、比較対象ホスト指定欄681及び682に指定された2つのホストIDを含む出力条件をデータ管理装置500へ送信する。尚、ホストIDは、上述の通り、ファイル識別情報の一例であるため、出力条件には、第1及び第2のファイル識別情報が含まれていることとなる。
 受付部534は、管理端末326から、第1及び第2のファイル識別情報(host1及びhost4)を含む出力条件を受け付ける(S201)。第2の特定部535は、第1及び第2のファイル識別情報のそれぞれに対応付けられた第1及び第2の出力定義を記憶部510から特定する(S202)。そして、取得部536は、上記同様、複数の第1の管理レコードを取得する(S203)。また、取得部536は、第2の出力定義に含まれる属性のいずれかと第2のファイル識別情報との組合せに該当する複数の第4の管理レコードをデータ管理DB520からさらに取得する。そして、生成部537は、上記同様、第1の出力情報を生成する(S204)。また、生成部537は、第2の出力定義と複数の第4の管理レコード内の位置情報のそれぞれとに基づいて、複数の第4の管理レコード内のデータを連結して第4の出力情報を生成する。そして、出力部538は、第1の出力情報と対比するように、第4の出力情報を出力、つまり送信する(S205)。
 その後、管理端末326は、受信した第1及び第4の出力情報を対比するように表示装置に表示する。例えば、図17の表示画面600cのように、出力情報630cが表示される。出力情報630cは、異なるホスト(host1及びhost4)に対応するレコードデータ631c及び632cが対比されるように表示されていることを示す。
 このように、本実施の形態により、同質の属性についてファイルの横断的な比較が可能となり、利用態様をさらに多様化することができる。
<その他の実施の形態>
 尚、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではない。本開示は、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。
 上述の例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、DVD(Digital Versatile Disc)、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
 なお、本開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。また、本開示は、それぞれの実施の形態を適宜組み合わせて実施されてもよい。
 上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
 (付記A1)
 情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する抽出部と、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する第1の特定部と、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する登録部と、
 を備える情報処理装置。
 (付記A2)
 前記登録部は、
 前記管理レコードに前記収集ファイルの更新日時をさらに対応付けて前記データベースに登録する
 付記A1に記載の情報処理装置。
 (付記A3)
 出力対象の複数の前記属性を含む出力定義と前記ファイル識別情報とを対応付けて記憶する記憶部と、
 前記収集ファイルに対応する第1のファイル識別情報を含む出力条件を受け付ける受付部と、
 前記第1のファイル識別情報に対応付けられた第1の出力定義を前記記憶部から特定する第2の特定部と、
 前記第1の出力定義に含まれる前記属性のいずれかと前記第1のファイル識別情報との組合せに該当する複数の第1の管理レコードを前記データベースから取得する取得部と、
 前記第1の出力定義と前記複数の第1の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第1の管理レコード内のデータを連結して第1の出力情報を生成する生成部と、
 前記第1の出力情報を出力する出力部と、
 をさらに備える
 付記A1又はA2に記載の情報処理装置。
 (付記A4)
 前記出力条件は、比較対象の2以上の時刻情報をさらに含み、
 前記取得部は、前記第1の出力定義に含まれる前記属性のいずれか、及び、前記出力条件に含まれる前記2以上の時刻情報のいずれかに該当する複数の第2の管理レコードを前記データベースから取得し、
 前記生成部は、前記複数の第2の管理レコード内のデータのうち、前記2以上の時刻情報のそれぞれに対応付けられたデータ同士を対比するように第2の出力情報を生成し、
 前記出力部は、前記第2の出力情報を出力する
 付記A2に従属する付記A3に記載の情報処理装置。
 (付記A5)
 前記出力条件は、第1の属性におけるデータの期待値をさらに含み、
 前記取得部は、前記第1の属性に該当する第3の管理レコードを前記データベースから取得し、
 前記生成部は、前記第3の管理レコード内のデータと前記期待値とを対比するように第3の出力情報を生成し、
 前記出力部は、前記第3の出力情報を出力する
 付記A3又はA4に記載の情報処理装置。
 (付記A6)
 前記出力条件は、前記第1のファイル識別情報にかかる前記収集ファイルと前記フォーマットが共通するファイルの第2のファイル識別情報をさらに含み、
 前記第2の特定部は、前記第2のファイル識別情報に対応付けられた第2の出力定義を前記記憶部からさらに特定し、
 前記取得部は、前記第2の出力定義に含まれる前記属性のいずれかと前記第2のファイル識別情報との組合せに該当する複数の第4の管理レコードを前記データベースからさらに取得し、
 前記生成部は、前記第2の出力定義と前記複数の第4の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第4の管理レコード内のデータを連結して第4の出力情報を生成し、
 前記出力部は、前記第1の出力情報と対比するように、前記第4の出力情報を出力する
 付記A3乃至A5のいずれか1項に記載の情報処理装置。
 (付記A7)
 前記登録部は、
 前記抽出部により抽出された属性を、抽出元の収集ファイルごとにまとめて前記出力定義として生成し、当該抽出元の収集ファイルのファイル識別情報と当該生成された出力定義とを対応付けて前記記憶部へ登録する
 付記A3乃至A6のいずれか1項に記載の情報処理装置。
 (付記A8)
 前記生成部は、
 前記複数の第1の管理レコードのうち前記第1の出力定義に含まれる同一の前記属性に該当する複数のレコードについて、前記位置情報に基づいて異なる複数のグループに分類し、各グループに分類されたレコードごとに、前記出力情報を生成する
 付記A3乃至A7のいずれか1項に記載の情報処理装置。
 (付記A9)
 前記複数の収集ファイルには、前記情報システムに含まれる第1の装置に対応する設定ファイルが含まれ、
 前記ファイル識別情報は、前記第1の装置の識別情報を含む、
 付記A1乃至A8のいずれか1項に記載の情報処理装置。
 (付記A10)
 前記複数の収集ファイルには、前記情報システムに含まれる第2の装置に対するコマンド実行結果が含まれる
 付記A1乃至A9のいずれか1項に記載の情報処理装置。
 (付記A11)
 前記複数の収集ファイルには、対応する前記フォーマットに基づく各属性に対応するデータの集合を含む複数のデータレコードが含まれ、
 前記第1の特定部は、対応する前記収集ファイル内で、前記抽出されたデータが属するデータレコードを識別する情報、及び、対応する属性における当該データレコード内の位置関係を含めて前記位置情報として特定する
 付記A1乃至A10のいずれか1項に記載の情報処理装置。
 (付記B1)
 複数種類のフォーマットのそれぞれで記述された複数の収集ファイルを情報システムから収集して記憶装置に保存する収集部と、
 前記記憶装置内の前記複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する抽出部と、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する第1の特定部と、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する登録部と、
 を備える
 データ管理システム。
 (付記B2)
 前記登録部は、
 前記管理レコードに前記収集ファイルの更新日時をさらに対応付けて前記データベースに登録する
 付記B1に記載のデータ管理システム。
 (付記B3)
 出力対象の複数の前記属性を含む出力定義と前記ファイル識別情報とを対応付けて記憶する記憶部と、
 前記収集ファイルに対応する第1のファイル識別情報を含む出力条件を受け付ける受付部と、
 前記第1のファイル識別情報に対応付けられた第1の出力定義を前記記憶部から特定する第2の特定部と、
 前記第1の出力定義に含まれる前記属性のいずれかと前記第1のファイル識別情報との組合せに該当する複数の第1の管理レコードを前記データベースから取得する取得部と、
 前記第1の出力定義と前記複数の第1の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第1の管理レコード内のデータを連結して第1の出力情報を生成する生成部と、
 前記第1の出力情報を出力する出力部と、
 をさらに備える
 付記B1又はB2に記載のデータ管理システム。
 (付記C1)
 コンピュータが、
 情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出し、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定し、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する
 データ管理方法。
 (付記D1)
 情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する処理と、
 前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する処理と、
 前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する処理と、
 をコンピュータに実行させるデータ管理プログラム。
 以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2018年3月30日に出願された日本出願特願2018-067081を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 1 情報処理装置
 11 抽出部
 12 特定部
 13 登録部
 14 データベース
 141 管理レコード
 1411 データ
 1412 属性
 1413 位置情報
 1414 ファイル識別情報
 1000 外部システム
 2000 情報システム
 210 ルータ
 220 APサーバ
 221 設定ファイル
 222 ログファイル
 230 DBサーバ
 231 設定ファイル
 232 ログファイル
 240 スイッチ
 250 GWサーバ
 251 設定ファイル
 252 ログファイル
 260 FW
 270 ストレージ装置
 N ネットワーク
 3000 データ管理システム
 310 収集サーバ
 311 収集部
 312 収集DB
 313 収集ファイル
 320 データ管理装置
 321 抽出部
 322 特定部
 323 登録部
 324 データ管理DB
 325 管理レコード
 326 管理端末
 400 収集ファイル
 410 レコード
 4111 パラメータ名
 4112 データ
 4121 パラメータ名
 4122 データ
 420 レコード
 4n0 レコード
 40 ファイル属性
 41 ファイルID
 42 対象ホスト
 43 最終更新日時
 400a 設定ファイル
 400b 設定ファイル
 500 データ管理装置
 510 記憶部
 511 フォーマット情報
 512 出力定義情報
 512a 出力定義情報
 512b 出力定義情報
 513 期待値
 514 プログラム
 520 データ管理DB
 521 管理レコード
 5211 データ
 5212 属性
 5213 位置情報
 5214 ファイルID
 5215 対象ホスト
 5216 最終更新日時
 522 管理レコード
 52a KEY
 52a1 ファイル識別情報
 52a2 位置情報
 52b VALUE
 530 制御部
 531 抽出部
 532 第1の特定部
 533 登録部
 534 受付部
 535 第2の特定部
 536 取得部
 537 生成部
 538 出力部
 540 IF部
 600 表示画面
 600a 表示画面
 600b 表示画面
 600c 表示画面
 610 対象ファイル指定欄
 620 表示ボタン
 630 出力情報
 631 レコードデータ
 632 レコードデータ
 630a 出力情報
 631a レコードデータ
 632a レコードデータ
 630b 出力情報
 631b レコードデータ
 632b レコードデータ
 633b 期待値
 634b 期待値
 630c 出力情報
 631c レコードデータ
 632c レコードデータ
 641 比較対象日時指定欄
 642 比較対象日時指定欄
 650 履歴比較表示ボタン
 660 比較対象属性指定欄
 670 期待値比較表示ボタン
 681 比較対象ホスト指定欄
 682 比較対象ホスト指定欄
 690 ホスト比較表示ボタン

Claims (16)

  1.  情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する抽出手段と、
     前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する第1の特定手段と、
     前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する登録手段と、
     を備える情報処理装置。
  2.  前記登録手段は、
     前記管理レコードに前記収集ファイルの更新日時をさらに対応付けて前記データベースに登録する
     請求項1に記載の情報処理装置。
  3.  出力対象の複数の前記属性を含む出力定義と前記ファイル識別情報とを対応付けて記憶する記憶手段と、
     前記収集ファイルに対応する第1のファイル識別情報を含む出力条件を受け付ける受付手段と、
     前記第1のファイル識別情報に対応付けられた第1の出力定義を前記記憶手段から特定する第2の特定手段と、
     前記第1の出力定義に含まれる前記属性のいずれかと前記第1のファイル識別情報との組合せに該当する複数の第1の管理レコードを前記データベースから取得する取得手段と、
     前記第1の出力定義と前記複数の第1の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第1の管理レコード内のデータを連結して第1の出力情報を生成する生成手段と、
     前記第1の出力情報を出力する出力手段と、
     をさらに備える
     請求項1又は2に記載の情報処理装置。
  4.  前記出力条件は、比較対象の2以上の時刻情報をさらに含み、
     前記取得手段は、前記第1の出力定義に含まれる前記属性のいずれか、及び、前記出力条件に含まれる前記2以上の時刻情報のいずれかに該当する複数の第2の管理レコードを前記データベースから取得し、
     前記生成手段は、前記複数の第2の管理レコード内のデータのうち、前記2以上の時刻情報のそれぞれに対応付けられたデータ同士を対比するように第2の出力情報を生成し、
     前記出力手段は、前記第2の出力情報を出力する
     請求項2に従属する請求項3に記載の情報処理装置。
  5.  前記出力条件は、第1の属性におけるデータの期待値をさらに含み、
     前記取得手段は、前記第1の属性に該当する第3の管理レコードを前記データベースから取得し、
     前記生成手段は、前記第3の管理レコード内のデータと前記期待値とを対比するように第3の出力情報を生成し、
     前記出力手段は、前記第3の出力情報を出力する
     請求項3又は4に記載の情報処理装置。
  6.  前記出力条件は、前記第1のファイル識別情報にかかる前記収集ファイルと前記フォーマットが共通するファイルの第2のファイル識別情報をさらに含み、
     前記第2の特定手段は、前記第2のファイル識別情報に対応付けられた第2の出力定義を前記記憶手段からさらに特定し、
     前記取得手段は、前記第2の出力定義に含まれる前記属性のいずれかと前記第2のファイル識別情報との組合せに該当する複数の第4の管理レコードを前記データベースからさらに取得し、
     前記生成手段は、前記第2の出力定義と前記複数の第4の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第4の管理レコード内のデータを連結して第4の出力情報を生成し、
     前記出力手段は、前記第1の出力情報と対比するように、前記第4の出力情報を出力する
     請求項3乃至5のいずれか1項に記載の情報処理装置。
  7.  前記登録手段は、
     前記抽出手段により抽出された属性を、抽出元の収集ファイルごとにまとめて前記出力定義として生成し、当該抽出元の収集ファイルのファイル識別情報と当該生成された出力定義とを対応付けて前記記憶手段へ登録する
     請求項3乃至6のいずれか1項に記載の情報処理装置。
  8.  前記生成手段は、
     前記複数の第1の管理レコードのうち前記第1の出力定義に含まれる同一の前記属性に該当する複数のレコードについて、前記位置情報に基づいて異なる複数のグループに分類し、各グループに分類されたレコードごとに、前記出力情報を生成する
     請求項3乃至7のいずれか1項に記載の情報処理装置。
  9.  前記複数の収集ファイルには、前記情報システムに含まれる第1の装置に対応する設定ファイルが含まれ、
     前記ファイル識別情報は、前記第1の装置の識別情報を含む、
     請求項1乃至8のいずれか1項に記載の情報処理装置。
  10.  前記複数の収集ファイルには、前記情報システムに含まれる第2の装置に対するコマンド実行結果が含まれる
     請求項1乃至9のいずれか1項に記載の情報処理装置。
  11.  前記複数の収集ファイルには、対応する前記フォーマットに基づく各属性に対応するデータの集合を含む複数のデータレコードが含まれ、
     前記第1の特定手段は、対応する前記収集ファイル内で、前記抽出されたデータが属するデータレコードを識別する情報、及び、対応する属性における当該データレコード内の位置関係を含めて前記位置情報として特定する
     請求項1乃至10のいずれか1項に記載の情報処理装置。
  12.  複数種類のフォーマットのそれぞれで記述された複数の収集ファイルを情報システムから収集して記憶装置に保存する収集手段と、
     前記記憶装置内の前記複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する抽出手段と、
     前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する第1の特定手段と、
     前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する登録手段と、
     を備える
     データ管理システム。
  13.  前記登録手段は、
     前記管理レコードに前記収集ファイルの更新日時をさらに対応付けて前記データベースに登録する
     請求項12に記載のデータ管理システム。
  14.  出力対象の複数の前記属性を含む出力定義と前記ファイル識別情報とを対応付けて記憶する記憶手段と、
     前記収集ファイルに対応する第1のファイル識別情報を含む出力条件を受け付ける受付手段と、
     前記第1のファイル識別情報に対応付けられた第1の出力定義を前記記憶手段から特定する第2の特定手段と、
     前記第1の出力定義に含まれる前記属性のいずれかと前記第1のファイル識別情報との組合せに該当する複数の第1の管理レコードを前記データベースから取得する取得手段と、
     前記第1の出力定義と前記複数の第1の管理レコード内の前記位置情報のそれぞれとに基づいて、前記複数の第1の管理レコード内のデータを連結して第1の出力情報を生成する生成手段と、
     前記第1の出力情報を出力する出力手段と、
     をさらに備える
     請求項12又は13に記載のデータ管理システム。
  15.  コンピュータが、
     情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出し、
     前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定し、
     前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する
     データ管理方法。
  16.  情報システムから収集され、かつ、複数種類のフォーマットのそれぞれで記述された複数の収集ファイルのそれぞれの中から、各収集ファイルに対応する前記フォーマットに基づいて、属性とデータの組を抽出する処理と、
     前記抽出されたデータに対応する前記収集ファイル内の位置を示す位置情報を特定する処理と、
     前記抽出されたデータについて、対応する前記属性と、前記特定された位置情報と、前記収集ファイルのファイル識別情報と、を対応付けた管理レコードをデータベースに登録する処理と、
     をコンピュータに実行させるデータ管理プログラムが格納された非一時的なコンピュータ可読媒体。
PCT/JP2018/032969 2018-03-30 2018-09-06 情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムが格納された非一時的なコンピュータ可読媒体 WO2019187208A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020508950A JP7081658B2 (ja) 2018-03-30 2018-09-06 情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラム
US17/043,290 US20210019323A1 (en) 2018-03-30 2018-09-06 Information processing apparatus, data management system, data management method, and non-temporary computer readable medium including data management program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-067081 2018-03-30
JP2018067081 2018-03-30

Publications (1)

Publication Number Publication Date
WO2019187208A1 true WO2019187208A1 (ja) 2019-10-03

Family

ID=68058026

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/032969 WO2019187208A1 (ja) 2018-03-30 2018-09-06 情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムが格納された非一時的なコンピュータ可読媒体

Country Status (3)

Country Link
US (1) US20210019323A1 (ja)
JP (1) JP7081658B2 (ja)
WO (1) WO2019187208A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765188A (zh) * 2020-12-31 2021-05-07 北京奇艺世纪科技有限公司 配置信息处理方法、配置管理系统、电子设备及存储介质
WO2022196625A1 (ja) * 2021-03-19 2022-09-22 日本電気株式会社 運用管理装置、システム及び方法並びにコンピュータ可読媒体
WO2023162271A1 (ja) * 2022-02-28 2023-08-31 日本電気株式会社 運用管理装置、システム及び方法、並びに、コンピュータ可読媒体

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021096788A (ja) 2019-12-19 2021-06-24 キヤノン株式会社 情報処理システム、および情報処理方法
CN115660250B (zh) * 2022-10-27 2024-03-19 武汉维新智云科技有限公司 一种用于干部人事信息的智能管理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243193A (ja) * 2007-02-26 2008-10-09 System Produce:Kk データ管理システム
JP2016099647A (ja) * 2014-11-18 2016-05-30 シャープ株式会社 情報処理装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014116893A (ja) * 2012-12-12 2014-06-26 Hitachi Information & Telecommunication Engineering Ltd ファイル管理システム及び方法、プログラム
US9922102B2 (en) * 2013-07-31 2018-03-20 Splunk Inc. Templates for defining fields in machine data
US10114148B2 (en) * 2013-10-02 2018-10-30 Nec Corporation Heterogeneous log analysis
US10503493B2 (en) * 2017-05-16 2019-12-10 Oracle International Corporation Distributed versioning of applications using cloud-based systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243193A (ja) * 2007-02-26 2008-10-09 System Produce:Kk データ管理システム
JP2016099647A (ja) * 2014-11-18 2016-05-30 シャープ株式会社 情報処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765188A (zh) * 2020-12-31 2021-05-07 北京奇艺世纪科技有限公司 配置信息处理方法、配置管理系统、电子设备及存储介质
CN112765188B (zh) * 2020-12-31 2023-09-08 北京奇艺世纪科技有限公司 配置信息处理方法、配置管理系统、电子设备及存储介质
WO2022196625A1 (ja) * 2021-03-19 2022-09-22 日本電気株式会社 運用管理装置、システム及び方法並びにコンピュータ可読媒体
WO2023162271A1 (ja) * 2022-02-28 2023-08-31 日本電気株式会社 運用管理装置、システム及び方法、並びに、コンピュータ可読媒体

Also Published As

Publication number Publication date
JPWO2019187208A1 (ja) 2021-03-11
JP7081658B2 (ja) 2022-06-07
US20210019323A1 (en) 2021-01-21

Similar Documents

Publication Publication Date Title
WO2019187208A1 (ja) 情報処理装置、データ管理システム、データ管理方法及びデータ管理プログラムが格納された非一時的なコンピュータ可読媒体
US11792291B1 (en) Proxying hypertext transfer protocol (HTTP) requests for microservices
US11860821B2 (en) Generating target application packages for groups of computing devices
US11539578B2 (en) Generating actionable alert messages for resolving incidents in an information technology environment
US11411804B1 (en) Actionable event responder
US7882213B2 (en) Network management system to monitor managed elements
US10594576B2 (en) Visualizing network activity involving networked computing devices distributed across network address spaces
US11601324B1 (en) Composite display of multi-sourced IT incident related information
US10169434B1 (en) Tokenized HTTP event collector
EP3370391A1 (en) System for data cleansing based aggregation and prioritization of it asset field values from real-time event logs and method thereof
EP3462315A2 (en) Systems and methods for service mapping
US11386113B2 (en) Data source tokens
US11093476B1 (en) HTTP events with custom fields
US11755531B1 (en) System and method for storage of data utilizing a persistent queue
US20170235785A1 (en) Systems and Methods for Robust, Incremental Data Ingest of Communications Networks Topology
US11582345B2 (en) Context data management interface for contact center
EP3798950A1 (en) Management and aggregation of ticket data from multiple sources
US20240086415A1 (en) Systems and methods for asset map interface for information technology infrastructure
EP3798955A1 (en) Management of tickets and resolution processes for an industrial automation environment
CN118092802A (zh) 设备资产数据的处理方法及装置、存储介质及电子设备
JP6061777B2 (ja) 構成管理装置及び構成管理方法及びプログラム
JP2023129154A (ja) 遠隔運用システム、タイムスタンプ修正方法、およびタイムスタンプ修正プログラム
WO2024054753A1 (en) Systems and methods for asset map interface for information technology infrastructure

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18911666

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020508950

Country of ref document: JP

Kind code of ref document: A

122 Ep: pct application non-entry in european phase

Ref document number: 18911666

Country of ref document: EP

Kind code of ref document: A1