WO2017158812A1 - データ分類方法及びデータ分類装置 - Google Patents

データ分類方法及びデータ分類装置 Download PDF

Info

Publication number
WO2017158812A1
WO2017158812A1 PCT/JP2016/058665 JP2016058665W WO2017158812A1 WO 2017158812 A1 WO2017158812 A1 WO 2017158812A1 JP 2016058665 W JP2016058665 W JP 2016058665W WO 2017158812 A1 WO2017158812 A1 WO 2017158812A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
abstraction
classification
level
abstract
Prior art date
Application number
PCT/JP2016/058665
Other languages
English (en)
French (fr)
Inventor
斉 修
琢也 小田
健 直野
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to JP2018505181A priority Critical patent/JP6476346B2/ja
Priority to PCT/JP2016/058665 priority patent/WO2017158812A1/ja
Publication of WO2017158812A1 publication Critical patent/WO2017158812A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Definitions

  • the present invention relates to a data classification method for classifying a large amount of data.
  • IoT Internet of Things
  • various data are analyzed to obtain knowledge.
  • data output from production equipment and data on materials can be collected and analyzed by a computer, which can be used to improve quality and productivity.
  • a wide variety of production facilities are operating in factories and the like, and the format of the data output from each production facility is not necessarily unified, so the computer that performs the analysis depends on the type and format of the data collected from each production facility. Needed to be classified.
  • Patent Document 1 a computer system learns feedback from a user by machine learning to generate teacher data, generates a data classifier based on the teacher data, and classifies data to be classified by the data classifier Techniques to do this are disclosed.
  • Patent Document 2 discloses a technique for classifying data to be classified by a computer that hierarchically abstracts data included in a data set.
  • Patent Document 1 it is necessary to classify data after generating teacher data by feedback from a user during machine learning, and there is a problem that time-series data cannot be processed at a time. Further, in the combination of the above-mentioned conventional examples 1 and 2, there is a problem that when data that is abstracted hierarchically in a plurality of stages is classified, the data to be classified must be matched with the abstraction level of the teacher data. .
  • an object of the present invention is to reduce the cost for classifying data with different formats based on preset master data.
  • the present invention relates to a data classification method for classifying a plurality of types of data having different data formats in a computer including a processor, a memory, and a storage device, wherein the computer represents the representative of the data for each type of the data format.
  • First abstraction that abstracts the master data for each abstraction level by applying rule information in which abstraction rules are preset for each abstraction level to master data information that stores master data as values
  • a first step of generating data a second step in which the computer acquires a plurality of types of data having different data formats as data information; and the calculator adds the rule information to the acquired data information.
  • the present invention even if the person in charge of classification does not understand the column name of the data and the contents of the column, it is possible to classify by the abstracted data type based on the master data. This eliminates the time required for the person in charge of classification to understand the data, shortens the classification time (data understanding and preparation time), and suppresses the cost of classification.
  • FIG. 1 is a block diagram illustrating an example of a computer system according to a first embodiment of this invention.
  • FIG. It is a block diagram which shows a 1st Example of this invention and shows an example of a data collection server. It is a figure which shows the 1st Example of this invention and shows an example of a master data table. It is a figure which shows the 1st Example of this invention and shows an example of a manufacture performance data table. It is a figure which shows 1st Example of this invention and shows an example of a compression sequence table. It is a figure which shows the 1st Example of this invention and shows an example of the abstraction rule table. It is a figure which shows the 1st Example of this invention and shows an example of the table after abstraction.
  • FIG. 1A is a block diagram showing an example of a computer system according to the first embodiment of this invention.
  • the manufacturing result data generated in the manufacturing process of the factory is collected by the data collection server 200, the data classification server 100 connected via the network 160 acquires the manufacturing result data, and the data An example in which the classification server 100 performs classification according to the type of manufacturing result data is shown.
  • the data collection server 200 collects manufacturing performance data from manufacturing facilities 310-1 to 310-N having different types of manufacturing performance data. Therefore, the collected manufacturing result data includes different data in different data formats for each of the manufacturing facilities 310-1 to 310-N. In the following description, the entire manufacturing facility is indicated by reference numeral 310 without “ ⁇ ”.
  • the data classification server 100 includes a CPU 101 that performs arithmetic processing, a main storage device 102 that stores programs and data, an information communication interface 103 that communicates with a network 160, and an external storage device that accesses the storage device 130.
  • the interface 104 includes an input device 140 including a keyboard and a mouse, and an output device 141 including a display.
  • the main processing unit 102 is loaded with a classification processing unit 10 that classifies manufacturing performance data based on a data format and is executed by the CPU 101.
  • the classification processing unit 10 includes a master data update detection unit 105, a data reception unit 106, a column compression unit 107, an abstraction level output unit 108, a column division result output unit 109, a user setting update detection unit 110, A column division unit 120.
  • the column division unit 120 includes an abstraction level setting unit 121, a data abstraction unit 122, and a data classification unit 123. The contents of each processing unit will be described later.
  • the storage device 130 stores programs and data.
  • the storage apparatus 130 includes a master data table 150, a manufacturing performance data table 300, a compressed column table 400, an abstraction rule table 500, an abstraction table 600, and data relations before and after abstraction.
  • a table 700 is stored. The contents of each table will be described later.
  • Each function unit of the classification processing unit 10 is loaded into the main storage device 102 as a program.
  • the CPU 101 operates as a functional unit that provides a predetermined function by performing processing according to a program of each functional unit.
  • the CPU 101 functions as the column division unit 120 by performing processing according to the column division program.
  • the CPU 101 also operates as a function unit that provides each function of a plurality of processes executed by each program.
  • a computer and a computer system are an apparatus and a system including these functional units.
  • the data classification server 100 may function as a data classification device.
  • Information such as programs and tables for realizing each function of the classification processing unit 10 is a storage device 130, a nonvolatile semiconductor memory, a hard disk drive, a storage device such as an SSD (Solid State Drive), or an IC card, SD card, DVD Etc., and can be stored in a computer readable non-transitory data storage medium.
  • a storage device 130 a nonvolatile semiconductor memory
  • a hard disk drive a storage device such as an SSD (Solid State Drive), or an IC card, SD card, DVD Etc.
  • the data classification server 100 processes manufacturing result data from a manufacturing facility 310 that outputs a plurality of types of data formats.
  • data having a plurality of types of data formats may be used. It is not limited.
  • FIG. 1B is a block diagram illustrating an example of the data collection server 200.
  • the data collection server 200 includes a CPU 201 that performs arithmetic processing, a main storage device 202 that stores programs and data, an information communication interface 203 that communicates with the network 160, and an external storage device that accesses the storage device 230.
  • An interface 204 and a control communication interface 205 for accessing the manufacturing facility 310 via the control system network 220 are included.
  • the main storage device 202 includes a manufacturing performance data collection unit 211 that collects manufacturing performance data from a plurality of manufacturing facilities 310-1 to 310-N and stores them in the manufacturing performance data table 240 of the storage device 230, and the data classification server 100.
  • the data transmission unit 210 is loaded which reads out the manufacturing result data from the manufacturing result data table 240 of the storage device 230 and transmits it to the data classification server 100.
  • the manufacturing performance data collection unit 211 collects manufacturing performance data from each manufacturing facility 310 at a predetermined cycle and writes it in the manufacturing performance data table 240 of the storage device 230. Note that when each manufacturing facility 310 generates manufacturing result data, the manufacturing result data may be transmitted to the data collection server 200.
  • the master data update detection unit 105 detects that a master data table 150 preset in the data classification server 100 has been updated, and outputs an abstraction result of the master data to the output device 141.
  • the data receiving unit 106 requests manufacturing result data from the data collection server 200, receives the manufacturing result data from the data collection server 200, and stores it in the manufacturing result data table 300 of the storage device 130.
  • the column compression unit 107 performs data compression in the column direction on the manufacturing result data stored in the manufacturing result data table 300 and stores the compressed data in the compressed column table 400.
  • the abstraction level output unit 108 displays the result of abstracting the master data in the master data table 150 on the output device 141. The abstraction will be described later.
  • the column division result output unit 109 displays the production result data classified based on the master data table 150 on the output device 141.
  • the user setting update detection unit 110 classifies the manufacturing performance data to the changed abstraction level, as will be described later.
  • An abstraction level to be processed by the abstraction level setting unit 121 of the column dividing unit 120 is set.
  • the data abstraction unit 122 of the column division unit 120 abstracts the manufacturing performance data based on the abstraction rule table 500 and stores the data in the post-abstraction table 600.
  • the data classifying unit 123 of the column dividing unit 120 sets the relationship between the data in the post-abstraction table 600, the abstraction level, and the manufacturing performance data before abstraction.
  • FIG. 2 is a diagram illustrating an example of a master data table.
  • the master data table 150 is a table in which representative values for each type of manufacturing performance data output from the manufacturing facilities 310-1 to 310-N are set in advance.
  • new master data is registered or updated in the master data table 150 by the input device 140 or the like operated by an administrator or the like.
  • a record is added to the master data table 150 for each data format. For example, if the data formats of the manufacturing facility 310-N-1 and the manufacturing facility 310-N are the same, one of the representative values can be set in the master data table 150.
  • the master data table 150 includes a line number 151, a product production time 152 that stores a time stamp given by the manufacturing facility 310, an individual identifier 153 that stores a product identifier, and a facility name that stores the name of the manufacturing facility 310.
  • One record includes 154, a facility number 155 for storing the identifier of the manufacturing facility 310, and a parameter value 156 for storing a parameter assigned to the manufacturing performance data.
  • a field name 157 indicating an attribute in the column direction is set for each field storing the master data.
  • a value used in each data format is set.
  • master data of manufacturing facilities 31-1 to 310-N is stored in five columns (from product production time 152 to parameter value 156). Instead, all the columns (field names) of manufacturing performance data generated by the manufacturing facilities 310-1 to 310-N may be included.
  • the line number 151 is assigned by the data classification server 100.
  • the master data need not be stored in all the columns of the master data table 150, and values may be stored in the columns included in the manufacturing performance data.
  • the field name 157 may be data in which the line number 151 is added to the data including the product production time 152, the individual identifier 153, and the facility number 155.
  • the manufacturing performance data generated by the manufacturing facility 310-N may be data obtained by adding the line number 151 to the data including the product production time 152, the facility number 155, and the worker name and lot number (not shown). Good.
  • FIG. 3 is a diagram showing an example of the manufacturing result data table 300.
  • the manufacturing result data table 300 is information acquired by the data classification server 100 by the data collection server 200 collecting data output from the manufacturing facilities 310-1 to 310-N in time series.
  • the data classification server 100 requests the data collection server 200 for data output from each of the manufacturing facilities 310-1 to 310-N at a predetermined timing, and stores the received data in the manufacturing performance data table 300.
  • the manufacturing performance data table 300 includes a row number 301 and columns 302 to 305. In the columns 302 to 305, field values received from the data collection server 200 are sequentially stored. As described above, since the manufacturing result data table 300 stores data with different formats from the plurality of manufacturing facilities 310-1 to 310-N in time series, the types of data stored in the columns 302 to 305 are the same. May vary from record to record.
  • the data classification server 100 assigns DATA001 to DATA004 as the field names of the columns 302 to 305.
  • the number of columns in the manufacturing result data table 300 may be a number corresponding to the longest record length among the records received by the data classification server 100 from the data collection server 200.
  • the row number 301 may store a value assigned by the data collection server 200.
  • FIG. 4 is a diagram illustrating an example of the compressed string table 400.
  • the compressed column table 400 shows an example in which the data classification server 100 compresses the data of the manufacturing performance data table 300 in the column (column) direction.
  • the compressed column table 400 includes a column name 401 for storing the names of the columns of the manufacturing performance data table 300, a representative data row number 402 for storing the row number 301 of the manufacturing performance data table 300 storing the data to be compressed, and a compression.
  • One record includes the compressed data line number 403 for storing the line number 301 of the manufacturing result data table 300 including the target data.
  • the column compression unit 107 of the data classification server 100 stores a plurality of row numbers 301 in the compressed data row number 403 when the values of the same columns 302 to 305 exist in other records (rows) in the manufacturing result data table 300. And compress it into one record.
  • the column compression unit 107 of the data classification server 100 may store the earliest row number 301 including the same data in the representative data row number 402. Further, the column compression unit 107 of the data classification server 100 may store the row number 301 of the column in the representative data row number 402 and the compressed data row number 403 for the columns that do not have the same data. Thereby, the compression column table 400 can be used as a table obtained by compressing the manufacturing performance data table 300 in the column direction.
  • FIG. 5 is a diagram illustrating an example of the abstraction rule table 500.
  • the abstraction rule table 500 is a table in which definitions for abstracting the values in the columns 302 to 305 of the manufacturing performance data table 300 are set in advance for each abstraction level.
  • the abstraction rule table 500 includes an abstraction level 501 that stores the level of abstraction, and an abstraction rule 502 that stores definitions that abstract the contents of the columns 302 to 305 of the manufacturing performance data table 300.
  • the abstraction level 501 indicates a value that determines the degree of abstraction, and the degree of abstraction decreases as the value of the abstraction level increases. That is, the value of the manufacturing performance data table 300 is abstracted as the abstraction level value is smaller, and the value of the manufacturing performance data table 300 is closer as the abstraction level value is larger.
  • the abstraction level 501 is the smallest, “1”, and the degree of abstraction is the maximum. That is, the data before the abstraction consisting of a 4-digit year and 2-digit month and day is abstracted as a date type. Similarly, data including kanji, alphabets, and numbers is abstracted as a character string, and data consisting of 0-9 is abstracted as a numeric type.
  • the character string data includes a kanji character string including kanji, an alphanumeric character string including alphabets and numbers, and an alphabetic character string including alphabets. It is abstracted into one. Similarly, data consisting of numerical values is abstracted into either a decimal number including a decimal point or an integer not including a decimal point.
  • the abstraction level 501 is “3”, which is the third level, the data consisting of character strings is further subdivided and is abstracted into either the number of characters + kanji character strings, the number of characters + alphanumeric character strings, or the number of characters + alphabetic character strings. It becomes.
  • FIG. 6 is a diagram illustrating an example of the post-abstraction table 600.
  • the post-abstraction table 600 stores the result of the data abstraction unit 122 of the data classification server 100 abstracting the manufacturing result data table 300 or the master data table 150 according to the abstract rule table 500.
  • the post-abstraction table 600 includes an abstraction level 601 that stores the degree of abstraction, a pre-abstraction column name 602 that stores a field name before abstraction, and a row number 301 of the manufacturing result data table 300 before abstraction.
  • One record includes pre-abstraction line number 603 to be stored and post-abstraction data 604 to store data after abstraction.
  • the result of abstracting 300 is stored in the post-abstraction table 600.
  • the “production time” of the pre-abstraction column name 602 in the illustrated example is a record storing the field name 157 of the master data table 150 as will be described later, and the abstraction data 604 contains the abstraction of the master data table 150. Stores the conversion result.
  • FIG. 7 is a diagram illustrating an example of the data relationship table 700 before and after abstraction.
  • the data classification table 123 of the data classification server 100 extracts the correspondence relationship between the data of the post-abstraction table 600 and the data of the compressed column table 400, and the column of the manufacturing performance data table 300 is extracted from the pre-abstraction data relevance table 700.
  • the results classified by the abstracted data 704 are stored for each.
  • the pre-abstraction data relationship table 700 includes a pre-abstraction column name 701 that stores the column name 401 of the compression column table 400, and a pre-abstraction row number 702 that stores the value of the compression data row number 403 of the compression column table 400.
  • One record includes an abstraction level 703 for storing the abstraction level 601 of the post-abstraction table 600 and post-abstraction data 704 for storing the post-abstraction data 604 of the post-abstraction table 600.
  • the data of the manufacturing performance data table 300 is specified.
  • post-abstraction data 704 can be acquired for each abstraction level 703 of the specified data. That is, the data classification server 100 can acquire how the data in the manufacturing performance data table 300 is abstracted by referring to the data relationship table 700 before and after abstraction.
  • FIG. 8 is a flowchart illustrating an example of processing performed by the master data update detection unit 105 of the data classification server 100. In this process, when the master data table 150 is updated, the processes after step S102 are executed.
  • step S101 the process proceeds to step S102.
  • step S103 the master data update detection unit 105 of the data classification server 100 refers to the abstract rule table 500 and determines whether there is an abstract rule 502 rule corresponding to the current abstract level. If the current abstract rule 502 exists in the abstract rule table 500, the process proceeds to step S104, and if not, the process ends.
  • step S104 the master data update detection unit 105 of the data classification server 100 determines whether or not processing has been completed for all columns of the master data in the master data table 150. If processing has not been completed for all columns, the process proceeds to step S105, and if processing has been completed for all columns, the process proceeds to step S107.
  • step S105 the data abstraction unit 122 acquires the data of the processing target column.
  • step S ⁇ b> 106 the data abstraction unit 122 abstracts the acquired data based on the abstract rule table 500. This abstraction process will be described in detail in the process of FIG.
  • step S107 in which processing has been completed for all the columns at the current abstraction level, the abstraction level setting unit 121 sets the current abstraction level to one level lower (the level value increases). If the current abstraction level is “1”, the abstraction level is changed to “2” to lower the degree of abstraction, and then the processing from step S103 onward is repeated.
  • the data classification server 100 displays all the master data abstracted by applying all the abstraction levels 501 of the abstraction rule table 500 on the output device 141.
  • the administrator of the data classification server 100 can check the abstraction result including the updated master data on the output device 141.
  • processing may be performed according to a command from the input device 140 operated by an administrator or the like.
  • FIG. 9 is a flowchart illustrating an example of master data abstraction processing performed by the data abstraction unit 122 of the data classification server 100. This process is performed in step S106 of FIG.
  • the data abstraction unit 122 acquires data of the row number (ID-C) to be processed in the master data table 150 with the designated column name (ID-B) (S1101, S1102). Note that the data abstraction unit 122 sequentially selects from the top row number of the master data table 150.
  • step S1103 the data abstraction unit 122 acquires the abstraction rule 502 of the abstraction level (ID-A) designated with reference to the abstraction rule table 500.
  • step S1104 the data abstraction unit 122 performs abstraction by applying the abstraction rule acquired in step S1103 to the data acquired in step S1102.
  • step S1105 the data abstraction unit 122 adds the abstraction result to the post-abstraction table 600.
  • the data abstraction unit 122 adds the result of abstraction to the post-abstraction table 600 as data of abstraction level ID-A, column name ID-B, and row number ID-C.
  • the abstraction result of the manufacturing performance data table 300 is also stored as will be described later.
  • the data to which the column name of the master data table 150 such as “product production time” is given by the pre-abstraction column name 602 and the column name of the manufacturing result data table 300 such as “DATA001” are given.
  • the abstracted result of the master data and the abstracted result of the manufacturing performance data can be identified from the recorded data.
  • step S1106 the data abstraction unit 122 determines whether or not processing has been completed for all records having the column name ID-B in the master data table 150.
  • the data abstraction unit 122 returns to step S1101 if the processing has not been completed for all the records, repeats the above processing, and ends the processing if the processing has been completed for all the records.
  • the field name 157 of the master data table 150 can be stored in the pre-abstraction column name 602 and associated with the post-abstraction data 604.
  • FIG. 10 is a flowchart showing an example of manufacturing performance data classification processing performed by the data classification server 100. This process is started based on a command from a user such as an administrator of the data classification server 100. In the present embodiment, an example in which manufacturing performance data classification processing is performed in response to a change in user settings is shown. As will be described later, the setting changed by the user is detected by the user setting update detection unit 110 of the data classification server 100 as a setting change when the abstraction level is changed.
  • step S203 the user setting update detection unit 110 refers to the abstraction rule table 500, acquires the abstraction level at which the user setting has been changed, and abstracts the current abstraction level (ID-D) and the user setting. It is determined whether or not an abstract rule 502 corresponding to the level exists. If the abstract rule of the current abstract level and the abstract rule of the user setting exist in the abstract rule table 500, the process proceeds to step S204, and if not, the process ends.
  • step S ⁇ b> 204 the user setting update detection unit 110 of the data classification server 100 determines whether or not the processing has been completed for all the columns of the manufacturing performance data table 300. If processing has not been completed for all columns, the process proceeds to step S205, and if processing has been completed for all columns, the process proceeds to step S210.
  • step S205 the column compression unit 107 of the data classification server 100 acquires an unprocessed column (column name is ID-E) from the manufacturing result data table 300.
  • step S206 the column compression unit 107 determines whether or not processing has been completed for all data for the acquired column name ID-B. The column compression unit 107 proceeds to the process of step S207 if the processing has not been completed for all the data, and proceeds to the process of step S208 if the processing has been completed for all the data.
  • step S207 the column compression unit 107 of the data classification server 100 selects an unprocessed row number (ID-F) in the selected column (ID-E) and performs compression in the column direction.
  • ID-F unprocessed row number
  • ID-E unprocessed column number
  • the compression in the column direction will be described later in steps S2101 to 2103 in FIG.
  • step S208 in which the column compression has been completed for the column (ID-E), the data abstraction unit 122 is present in the column (ID-E) data acquired in step S205, and the specified abstraction level.
  • Abstract with (ID-D) The abstraction process will be described later in steps S2201 to S2206 in FIG.
  • step S209 the data classification unit 123 divides the column data based on the abstraction result in step S208.
  • the division of data in the column direction is information obtained by classifying the same data in the post-abstraction data 604 in units of columns 302 to 305 of the manufacturing result data table 300. The dividing process will be described later in steps S2301 to S2305 in FIG.
  • step S210 when the processing of all the data in the manufacturing performance data table 300 is completed in the determination in step S204, the column division result output unit 109 displays the result of step S209 on the output device 141. Then, the abstraction level setting unit 121 lowers the abstraction level (ID-D) by one and then returns to step S203 to repeat the above processing.
  • ID-D abstraction level
  • the data in the manufacturing performance data table 300 is compressed in the column direction by the column compression unit 107 and then abstracted to the user-set abstraction level by the data abstraction unit 122. Accordingly, the data classification unit 123 divides the data in the column direction.
  • FIG. 11 is a flowchart illustrating an example of the manufacturing performance data compression process performed by the column compression unit 107 of the data classification server 100. This process is performed in step S207 of FIG.
  • step S2101 the column compression unit 107 searches for data having the same contents as the data having the row number ID-F for the column having the column name ID-E in the manufacturing performance data table 300.
  • step S2102 the column compression unit 107 acquires the searched row numbers as ID-G1 to ID-Gx.
  • x is a natural number.
  • step S2103 the column compression unit 107 stores the records having the column name 401 of ID-E, the representative data row number 402 of ID-F, and the compressed data row numbers 403 of ID-G1 to ID-Gx in the compressed column table 400. to add.
  • the contents of the columns 302 to 305 of the manufacturing performance data table 300 are compressed in the column direction and stored in the compressed column table 400.
  • FIG. 12 is a flowchart showing an example of the manufacturing performance data abstraction process performed by the data abstraction unit 122 of the data classification server 100. This process is performed in step S208 of FIG.
  • step S2201 the data abstraction unit 122 determines whether or not the processing has been completed for all the data in the column whose column name 401 in the compressed column table 400 is ID-E. If not, the process proceeds to step S2202. If the process is completed, the process ends.
  • step S2202 the data abstraction unit 122 acquires unprocessed data with the column name 401 of ID-E from the compressed column table 400, and sets the representative data row number 402 of the data to the variable ID-H.
  • step S 2203 the data abstraction unit 122 acquires data with the representative data row number 402 of the variable ID-H and the column name 401 of ID-E from the manufacturing performance data table 300.
  • step S2204 the data abstraction unit 122 acquires an abstract rule whose abstraction level is ID-D from the abstract rule table 500.
  • step S2205 the data abstraction unit 122 abstracts the data acquired in step S2203 based on the acquired abstraction rule 502.
  • step S2206 the data abstraction unit 122 sets the abstraction result in step S2205 as the post-abstraction data 604, the abstraction level 601 is ID-D, the pre-abstraction column name 602 is ID-E, and the pre-abstraction A record whose number 603 is ID-H is added to the post-abstraction table 600.
  • FIG. 13 is a flowchart illustrating an example of the abstraction result classification process performed by the data classification unit 123 of the data classification server 100. This process is performed in step S209 of FIG.
  • step S2301 the data classification unit 123 determines whether or not processing has been completed for all data in which the abstraction level 601 of the post-abstraction table 600 is ID-D and the pre-abstraction column name 602 is ID-E. If not completed, the process proceeds to step S2302, and if completed, the process ends.
  • step S2302 the data classification unit 123 obtains unprocessed post-abstraction data 604 among the data whose abstraction level 601 of the post-abstraction table 600 is ID-D and pre-abstraction column name 602 is ID-E, The abstraction result (ID-J) is assumed.
  • step S2303 the data classification unit 123 selects all the data in which the pre-abstraction column name 602 is ID-E and the post-abstraction data 604 is ID-J from the post-abstraction table 600.
  • the data classification unit 123 acquires the pre-abstraction line number 603 of the selected data and stores it in the variables ID-I1 to ID-Iy.
  • Y is a natural number.
  • step S 2340 the data classification unit 123 determines that the pre-abstraction column name 701 is ID-E, the pre-abstraction row numbers 702 are ID-I 1 to ID-Iy, the abstraction level 703 is ID-D, The row with the converted data ID-J is added to the data relationship table 700 before and after the abstraction.
  • the abstraction of the manufacturing performance data table 300 is added to the pre-abstraction data relationship table 700 indicating the correspondence between the column name and row number of the manufacturing performance data before abstraction, the data after abstraction, and the abstraction level. The result is stored.
  • FIG. 14 is a screen image showing an example of an abstraction level setting screen displayed on the output device 141 by the abstraction level output unit 108 of the data classification server 100.
  • the abstraction level output unit 108 displays the abstraction level and the abstraction result on the output device 141 in step S108 of FIG.
  • the abstract level setting screen 1000 includes a display area 1001 for displaying the post-abstraction data 604 of the master data table 150 as a graph 1010 for each abstract level, a pointer 1002 for setting the abstract level to be displayed, and an abstract level.
  • An execution button 1003 for reflecting the setting as a user setting is included.
  • abstraction of the master data table 150 is performed, and data after abstraction 604 including the column names 152 to 156 of the master data table 150 is output as an abstraction level setting screen 1000 in a graph 1010 as an output device.
  • 141 shows an example of display.
  • the subsequent data is displayed as “character string”, “numerical type”, and “date type”.
  • data including the date and time is defined as a date type, but the date and time may be managed separately.
  • the master data graph 1010 is a graph in which the post-abstraction data 604 obtained by abstracting the master data for each level of the abstraction level is arranged as a graph in relation to the attribute (type) of the data.
  • the data classification server 100 When a user such as an administrator of the data classification server 100 operates the pointer 1002 to set an abstraction level and clicks an execution button 1003, the data classification server 100 performs post-abstraction according to the setting of a new abstraction level. Data is displayed on the output device 141 as a graph 1010.
  • the graph 1010 of the abstracted data (first abstracted data) 604 obtained by abstracting the master data table 150 indicates the field name of the master data table 150 by the data classification server 100 referring to the abstracted table 600.
  • the pre-abstraction column name 602 that is 157 can be specified.
  • FIG. 15 is a screen image showing an example of a manufacturing performance data classification result display screen 1100 displayed on the output device 141 by the column convergence unit 111 of the data classification server 100.
  • the column division result output unit 109 displays, for example, the manufacturing result data classified according to the abstracted data for each of the columns 302 to 305 in step S210 of FIG.
  • the column data of the column 302 of the manufacturing performance data table 300 with the name “DATA001” is classified as “SM01” or the like as the value of the alphanumeric character string in the post-abstraction data, and the post-abstraction data is a decimal number. “ ⁇ 0.2273” or the like is classified as the value of “Yokohama”, and “Yokohama Taro” or the like is classified as the value of the kanji character string in the post-abstraction data.
  • a user such as an administrator of the data classification server 100 acquires the contents of the manufacturing result data table 300 classified by the master data graph (data after abstraction) 1010. can do.
  • the abstraction rule 502 for each abstraction level is applied to the master data of the master data table 150 to obtain the post-abstraction data 604 (first abstraction data).
  • a graph 1010 in which the master data after abstraction is classified for each type can be generated for each abstraction level.
  • the data classification server 100 abstracts the manufacturing result data based on the abstract rule table 500 for each of the columns 302 to 305 of the manufacturing result data table 300 and generates post-abstraction data 604 (second abstracted data).
  • the manufacturing result data after the abstraction can be classified in association with the graph 1010 of the master data after the abstraction.
  • manufacturing result data is received in time series from a plurality of manufacturing facilities 310-1 to 310-N having different data formats, stored in the manufacturing result data table 300, and the manufacturing result data is abstracted for each column.
  • the abstracted manufacturing performance data can be classified according to the abstracted master data graph 1010.
  • the post-abstraction data obtained by abstracting the master data in the master data table 150 and the post-abstraction data obtained by abstracting the production record data in the production record data table 300 are the same post-abstraction table.
  • the present invention is not limited to this.
  • the master data of the master data table 150 is abstracted
  • the post-abstraction data is stored in a first post-abstraction table
  • the post-abstraction data obtained by abstracting the manufacture result data of the manufacture result data table 300 is stored in the second data. You may store separately in the post-abstraction table.
  • the data classification server 100 can store the manufacturing performance data. It becomes possible to classify by the category of the master data (graph 1010). This eliminates the time required for the analyst to understand the data, shortens the analysis time (data understanding and preparation time), and suppresses the cost of the analysis process.
  • the data classification server 100 specifies the data type (post-abstraction data 604) of the manufacturing result data for each column of the manufacturing result data table 300 using the master data graph 1010, the time-series manufacturing results are identified. Data can be processed at high speed.
  • FIG. 16 is a block diagram illustrating an example of the data classification server 100 according to the second embodiment.
  • a column convergence section 111 for adding the abstracted manufacturing performance data in units of the abstracted data 604 is added to the classification processing section 10 of the first embodiment, and the column convergence table 800 is added to the storage apparatus 130. Is added.
  • Other configurations are the same as those of the first embodiment.
  • FIG. 17 is a diagram showing an example of the column convergence table 800. As shown in FIG. This column convergence table 800 is generated by processing of the column convergence unit 111 described later.
  • the column convergence table 800 includes post-abstraction data 801 that stores post-abstraction data 704 of the pre-abstraction data relationship table 700, column names 802 that store pre-abstraction column names 701, and pre-abstraction row numbers 702.
  • the row number 803 to be stored is included in one record.
  • the data classification server 100 can associate the abstracted data 604 obtained by abstracting the manufacturing performance data with the master data graph 1010 by referring to the column convergence table 800. That is, the data classification server 100 can classify the manufacturing result data in association with the master data graph 1010 regardless of the columns of the manufacturing result data table 300.
  • FIG. 18 is a screen image showing an example of the manufacturing result data classification result display screen 1100 displayed on the output device 141 by the column convergence unit 111 of the data classification server 100.
  • the column convergence unit 111 outputs the result of classifying the manufacturing performance data table 300 with the same abstracted data as the master data graph 1010 by the processing of FIG. 19B described later as a manufacturing performance data classification result display screen 1100 as an output device 141. To display.
  • the production result data classification result display screen 1100 has the same abstract data as the graph 1010 regardless of the columns 302 to 305 of the production result data table 300.
  • Manufacturing result data is output by the column convergence unit 111.
  • “SM010” and “C0010” are classified as “alphanumeric character string” data constituting the graph 1010 after the abstraction data, and “Kobe Taro” and “Yokohama Taro” are classified as “Kanji character strings”.
  • Magnnetizer are classified, and similarly, the production result data of numerical values and dates are classified.
  • a user such as an administrator of the data classification server 100 can easily grasp the data of the manufacturing result data table 300 corresponding to the abstracted data. be able to.
  • FIG. 19A is a flowchart showing an example of manufacturing performance data classification processing performed by the data classification server 100. This processing is obtained by adding the convergence processing of the classified data in step S3100 to the processing of FIG. 10 of the first embodiment, and the other processing is the same as that of the first embodiment.
  • the column convergence unit 111 In the processing of steps S204 to S209, when the division of the data in the column direction is completed for each of the columns 302 to 305, the column convergence unit 111 generates the column convergence table 800 in step S3100.
  • step S210 the column convergence unit 111 of the data classification server 100 collects the manufacturing result data for each abstracted data 801 in the column convergence table 800, and displays the result on the manufacturing result data classification result display screen 1100 shown in FIG. Output.
  • FIG. 19B is a flowchart illustrating an example of recombination (convergence) processing of manufacturing performance data performed by the column convergence unit 111 of the data classification server 100. This process is a process performed in step S3100 of FIG. 19A and is executed each time the data division in the column direction is completed at each abstraction level.
  • step S3101 the column convergence unit 111 determines whether or not the processing of the post-abstraction data 704 has been completed for all data whose abstraction level is ID-D in the pre-abstraction and data relevance table 700. If there is unprocessed data, the column convergence unit 111 proceeds to step S3102, and if all the data has been processed, completes this processing and returns to the processing in FIG. 19A.
  • step S3102 the column convergence unit 111 acquires the unprocessed post-abstraction data 704 as the variable ID-L at the abstraction level ID-D of the pre-abstraction / abstraction data relationship table 700.
  • step S3101 the column convergence unit 111 determines whether or not processing has been completed for all data with the abstraction level 703 of the pre-abstraction / abstraction data relationship table 700 being ID-D and the post-abstraction data 704 being ID-L. judge.
  • the column convergence unit 111 proceeds to step S3104 if there is unprocessed data, and returns to step S3101 if the processing has been completed for all data.
  • step S3104 the column convergence unit 111 acquires unprocessed data in which the abstraction level 703 of the pre-abstraction / abstraction data relationship table 700 is ID-D and the post-abstraction data 704 is ID-L.
  • step S3105 the column convergence unit 111 acquires the pre-abstraction column name 701 of the acquired data as a variable ID-M, and acquires pre-abstraction row numbers 702 of the record as variables ID-N1 to ID-Nz. Note that z is a natural number.
  • step S3106 the column convergence unit 111 records the records with the abstracted data 801 of ID-L, the column name 802 of ID-M, and the row numbers 803 of ID-N1 to ID-Nz in the column convergence table 800.
  • a column convergence table 800 is generated as shown in FIG. 17, and the data classified by the abstracted data 801 regardless of the columns 302 to 305 is specified by the column name 802 and the row number 803. It becomes possible.
  • the abstracted data 604 classified in the column direction of the manufacturing performance data table 300 by the column convergence table 800 is aggregated in the master data graph 1010.
  • the data classification server 100 can classify the manufacturing result data according to the master data graph 1010 regardless of the columns 302 to 305 of the manufacturing result data table 300.
  • manufacturing performance data is received in time series from a plurality of manufacturing facilities 310-1 to 310-N having different data formats, stored in the manufacturing performance data table 300, and the manufacturing performance data is abstracted to produce manufacturing results. Regardless of the columns of the data table 300, the graphs 1010 can be collected.
  • the category of the master data can be used. It is possible to classify manufacturing performance data, eliminating the time required for analysts to understand the data, reducing analysis time (data understanding and preparation time), and reducing the cost of analysis processing. .
  • the data classification server 100 can specify the data type (data after abstraction 604) of the manufacturing result data regardless of the column of the manufacturing result data table 300 using the master data graph 1010. Achievement data can be processed at high speed.
  • FIG. 20 is a block diagram illustrating an example of the data classification server 100 according to the third embodiment.
  • a teacher data generation unit 112 that abstracts the master data table 150 and generates teacher data
  • a learning model generation unit 113 that generates a machine learning learning model
  • An optimal abstraction level learning unit 114 that learns an abstraction level suitable for classifying manufacturing performance data, an abstraction target data specifying unit 115 that specifies data to be processed based on the abstraction condition table 900,
  • a machine learning result table 950 for storing machine learning results is added.
  • Other configurations are the same as those of the second embodiment.
  • FIG. 21A and 21B are screen images showing an example of the abstraction level adjustment and manufacturing performance data classification result display screen 1300 provided by the data classification server 100.
  • FIG. The abstract level adjustment / manufacturing result data classification result display screen 1300 includes areas 1301 to 1304 for displaying field names 1322 and post-abstraction data 1321 of the master data table 150 in a hierarchical structure for each abstract level, and manufacturing result data. It includes an area 1305 for displaying the classification result and a determination button 1310 for applying the abstraction level adjustment.
  • Areas 1301 to 1304 show examples of abstraction levels 1 to 4, and the post-abstraction data 1321 belonging to each abstraction level and the field name 1322 corresponding to the master data table 150 corresponding to the post-abstraction data are shown. Is displayed.
  • abstraction level 1 is a hierarchy in which abstraction is not performed.
  • the areas 1301 to 1304 function as an abstraction level adjustment screen for adjusting the optimum abstraction level by the input device 140 or the like.
  • the abstraction level adjustment screen when the “+” button 1330 is clicked, the field names 1322 classified in the post-abstraction data 1321 are expanded. Thereafter, the button 1330 is displayed as “ ⁇ ”.
  • buttons 1330 when the “-” button 1330 is clicked, a folding process is executed in which the expanded field name 1322 is deleted and only the abstracted data 1321 is displayed. Thereafter, the button 1330 is displayed as “+”.
  • the character string data includes “equipment number”, “equipment name”, “worker name”, “shift number”, and “product individual identifier” that are field names (data types) of the master data table 150. It shows that.
  • a user such as an administrator clicks the abstracted data or field name 1322 in the areas 1301 to 1304, and then clicks the decision button 1310, so that the production results at the adjusted abstraction level or the abstracted data 1321 are displayed. Data can be classified.
  • abstraction level adjustment and manufacturing performance data classification result display screen 1300 of FIGS. 21A and 21B can be generated by the abstraction level output unit 108.
  • FIG. 22 is a diagram illustrating an example of the data relationship table 700A before and after abstraction.
  • the data relationship table 700A before and after abstraction of the third embodiment is obtained by adding a data type 705 to the data relationship table 700A before and after abstraction shown in FIG. 7 of the first embodiment. Similar to Example 1.
  • the pre-abstraction data relationship table 700A includes a pre-abstraction column name 701 that stores the column name 401 of the compressed column table 400, a pre-abstraction row number 702 that stores the compressed data row number 403, and a post-abstraction table 600.
  • One record includes an abstraction level 703 that stores the abstraction level 601, post-abstraction data 704 that stores post-abstraction data 604, and a data type 705 that stores field names of the master data table 150.
  • FIG. 23 is a diagram showing an example of the abstraction condition table 900.
  • the abstraction condition table 900 is generated by the data classification unit 123.
  • the abstraction condition table 900 includes an abstraction level 901 that stores abstraction levels, an abstraction condition 902 that stores abstraction conditions, and an abstraction flag 903 that indicates the end of the abstraction level hierarchy.
  • the abstraction flag 903 is “1”, it indicates that there is a lower hierarchy of the abstraction level, and if it is “0”, it indicates that the abstraction level is the lowest layer.
  • FIG. 24 is a flowchart illustrating an example of learning model generation processing performed by the data classification server 100. This process is started when the master data update detection unit 105 detects an update of the master data table 150, as in FIG. 8 of the first embodiment.
  • step S402 the master data update detection unit 105 refers to the abstract rule table 500, determines whether there is an abstract rule 502 corresponding to the current abstract level, and stores the abstract rule table 500 in the abstract rule table 500. If the abstraction rule 502 corresponding to the current abstraction level ID-A exists, the process proceeds to step S403, and if not, the process proceeds to step S409.
  • step S403 the processing of steps S104 to S106 in FIG. 8 of the first embodiment is executed. That is, the data abstraction unit 122 updates the post-abstraction table 600 by performing abstraction processing for each column of the master data in the master data table 150 at each abstraction level ID-A.
  • the teacher data generation unit 112 refers to the abstracted table 600 and generates teacher data from the abstracted master data.
  • the teacher data generation unit 112 does not use all the data of the post-abstraction table 600 but uses a record in which the pre-abstraction column name 602 matches the column name (field name 157) of the master data table 150 as the teacher data.
  • step S405 the learning model generation unit 113 generates a machine learning learning model based on the teacher data.
  • a known or publicly known technique may be applied as the learning model for machine learning, and a decision tree, SVM (Support Vector Vector), or the like can be used as appropriate.
  • the optimum abstraction level learning unit 114 of the data classification server 100 executes machine learning using the generated learning model, and stores the machine learning result in the machine learning result table 950.
  • FIG. 28 is a diagram illustrating an example of a machine learning result table 950 that stores the results of machine learning using a learning model.
  • the machine learning result table 950 stores an abstraction level 951 that stores the level of abstraction, a classification condition 952 that stores a condition for classifying manufacturing performance data, and a field name of manufacturing performance data that is classified into the classification condition 952. Data type 953 to be included.
  • the classification condition 952 corresponds to the post-abstraction data 1321 corresponding to the node of the data type identification graph of FIG. 21A and the post-abstraction data relevance table 700A of FIG.
  • the data type 953 corresponds to the field name 1322 illustrated in FIG. 21A and corresponds to the field name 157 of the master data table 150.
  • step S406 the data classification unit 123 performs the processing of steps S4101 to S4105 in FIG. 25 to add the abstraction flag 903 to the abstraction condition table 900. This process will be described later with reference to FIG.
  • step S407 the data classification unit 123 performs the processing of steps S4201 to S4209 in FIG. 26 to classify all the abstracted data to be classified into field names, and classify the result of the classification before and after the abstraction. It outputs to the table 720. This process will be described later with reference to FIG.
  • step S408 the abstraction level setting unit 121 sets the current abstraction level to one level lower (the value of the level is increased). If the current abstraction level is “1”, the abstraction level is changed to “2” to lower the degree of abstraction, and then the processing from step S402 onward is repeated.
  • step S402 the master data update detection unit 105 repeats the above process until there is no abstraction rule 502 corresponding to the abstraction level ID-A, and then proceeds to the process of step S409.
  • step S409 the data classification server 100 displays the contents of the abstraction pre- and post-abstraction data relationship table 700 classified in step S407 on the abstraction level adjustment and manufacturing performance data classification result display screen 1300 shown in FIGS. 21A and 21B. Output.
  • the above process may be executed based on a predetermined command from the input device 140 operated by the administrator.
  • FIG. 25 is a flowchart illustrating an example of processing performed by the data classification unit 123 of the data classification server 100. This process is performed in step S406 in FIG. 24, and is a process for setting the abstraction condition table 900 in FIG.
  • step S4101 the data classification unit 123 determines whether or not processing has been completed for all classification conditions of the learning model generated in step S406 of FIG. If the process is not completed, the process proceeds to step S4102, and if the process is completed, the process returns to the process of FIG.
  • step S4102 the data classification unit 123 acquires one classification condition from the learning model. Note that the data classification unit 123 may select the classification conditions in a preset order.
  • step S4103 the data classification unit 123 searches the classification condition 952 that matches the classification condition acquired in step S4102 with reference to the machine learning result table 950, and selects the data type 953 set in the corresponding classification condition 952. get.
  • step S4104 the data classification unit 123 determines whether the acquired data type 953 is a plurality of data (field names). If it is a plurality of data, the process proceeds to step S41106, and if it is one data, the process proceeds to step S4105.
  • the data classification unit 123 can generate an abstraction condition table 900 that reflects the learning results of the machine learning result table 950 for each of the classification conditions of the learning model.
  • FIG. 26 is a flowchart illustrating an example of manufacturing performance data classification processing performed by the data classification unit 123 of the data classification server 100. This process is a process performed in step S407 in FIG.
  • step S4201 the data classification unit 123 determines whether the processing has been completed for all the column names 401 of the compressed column table 400. If the process has not been completed, the process advances to step S4202, and if the process has been completed, the process returns to the process of FIG.
  • step S4202 the data classification unit 123 selects a column name ID-O from the compressed column table 400 in a predetermined order.
  • the column names may be selected sequentially from the top record of the compressed column table 400.
  • the manufacturing result data is read from the manufacturing result data table 300, and the compressed column table 400 is generated as shown in steps S204 to S207 of FIG.
  • step S4203 the data classification unit 123 determines whether or not the processing has been completed for all the data of the column name ID-O in the compressed column table 400. If the process has not been completed, the process advances to step S4204. If the process has not been completed, the process returns to the process of FIG.
  • step S4204 the data classification unit 123 acquires one record (row) from the column name ID-O of the compressed column table 400, and sets the row number as the variable ID-P.
  • the selection of the record with the column name ID-O may be performed sequentially from the top record of the compressed column table 400, for example.
  • step S4206 the data classification unit 123 refers to the abstraction condition table 900, the abstraction condition 902 matches the post-abstraction data 604 acquired in step S4205, and the abstraction level 901 is from the record of ID-A. An abstraction flag 903 is acquired.
  • step S4207 the data classification unit 123 determines whether or not the abstraction flag 903 acquired in step S4206 is “1”. If the abstraction flag 903 is “1”, the process proceeds to step S4208, and if it is “0”, the process returns to step S4203 to repeat the above processing.
  • step S4209 the data classification unit 123 adds a classification result row to the data relationship table 700A before and after abstraction. That is, the data classification unit 123 acquires the pre-abstraction column name 701 as ID-O, the pre-abstraction row number 702 as ID-P, the abstraction level 703 as ID-A, and the post-abstraction data 704 obtained in step S4205. In the post-abstraction data 604, a row whose data type 705 is the classification result in step S4206 is added to the pre-abstraction data relationship table 700A.
  • all the data of the compressed data row number 403 of the column name 401 of the compressed column table 400 can be classified by the data type 953 of the machine learning result table 950 for each level of abstraction, and the classified result Are stored in the data relationship table 700A before and after abstraction.
  • machine learning result table 950 used in the classification process can use machine learning results generated by other computers in addition to the data generated by the data classification server 100 in advance.
  • FIG. 27 is a flowchart illustrating an example of processing performed by the user setting update detection unit 110 of the data classification server 100.
  • the user setting update detection unit 110 executes the flowchart of FIG. 27 when the button 1330 is operated on the abstraction level adjustment and manufacturing performance data classification result display screen 1300 shown in FIG. 21A.
  • step S4301 when the user of the data classification server 100 operates the input device 140 and clicks the button 1330, the user setting update detection unit 110 determines that the setting of the optimal abstraction level has been changed, and proceeds to step S4302. move on.
  • step S4302 the user setting update detection unit 110 acquires the abstraction level from the abstraction level adjustment screen (1301 to 1304), sets it to the variable ID-Q, and abstracts the clicked post-abstraction data 604. Get as a condition.
  • step S4303 the user setting update detection unit 110 determines whether or not the “+” button 1330 has been clicked. If the “+” button 1330 is clicked, the process proceeds to step S4304. If the “ ⁇ ” button 1330 is clicked, the process proceeds to step S4307.
  • step S4304 since the “+” button 1330 has been operated, the user setting update detection unit 110 performs the process of developing the abstracted data.
  • the user setting update detection unit 110 has an abstraction level (ID-Q + 1) one level lower than the abstraction level set in step S4302, and the abstraction condition set in step S4302 matches the post-abstraction data 704.
  • Row data pre-abstraction column name 701, pre-abstraction row number 702 is acquired from the pre-abstraction data relationship table 700A.
  • step S4305 the user setting update detection unit 110 refers to the abstraction rule table 500 and determines whether there is an abstraction level 501 that is one level lower than the current abstraction level ID-Q. If there is an abstraction level 501 that is one level lower than the current abstraction level ID-Q, the process advances to step S4306, and if not, the process ends.
  • step S4305 the data abstraction unit 122 generates post-abstraction data by applying the abstraction rule 502 at the abstraction level 501 that is one level lower than the abstraction level ID-Q for the data acquired in step S4304. Then, it is expanded and displayed at the lower abstraction level of the abstraction level adjustment screen.
  • step S4303 the process advances to step S4307, and the user setting update detection unit 110 deletes the field name 1322 under the clicked button 1330. Perform the folding process.
  • the data classification server 100 executes expansion processing or folding processing within the abstraction level adjustment screen.
  • the data classification server 100 abstracts the manufacturing result data in the manufacturing result data table 300 and then associates the data with the post-abstraction data 604 in the master data table 150. Manufacturing result data can be classified for each field name 157.
  • the data classification server 100 generates teacher data from the master data, generates a learning model from the teacher data, performs machine learning, and generates a machine learning result table 950. Then, by classifying the manufacturing performance data using the machine learning result table 950, the accuracy of classifying the manufacturing performance data can be improved.
  • the data classification server 100 receives manufacturing result data in time series from a plurality of manufacturing facilities 310-1 to 310-N having different data formats, stores them in the manufacturing result data table 300, and stores the manufacturing result data in a column.
  • the field name 157 of the master data table 150 can be specified for each post-abstraction data 604.
  • the data classification server 100 associates the abstracted manufacturing performance data with the abstracted master data graph 1010, so that each row of the time-series manufacturing performance data corresponds to any of the manufacturing facilities 310-1. It is possible to specify whether it was generated at 310-N.
  • the data classification server 100 specifies the data type (post-abstraction data 604) of the manufacturing result data regardless of the column of the manufacturing result data table 300 by using the master data graph 1010. Achievement data can be processed at high speed.
  • each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit.
  • each of the above-described configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function.
  • Information such as programs, tables, and files that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
  • control lines and information lines indicate what is considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

プロセッサとメモリとストレージ装置を備えた計算機が、データフォーマットの種類毎にデータの代表値としてのマスタデータを格納したマスタデータ情報に、抽象化レベル毎に抽象化ルールを設定したルール情報を適用して、マスタデータを抽象化した第1の抽象化データを生成し、データフォーマットの異なる複数の種類のデータを取得し、前記取得したデータにルール情報を適用して抽象化レベルごとに前記データを抽象化した第2の抽象化データを生成し、第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データで分類する。

Description

データ分類方法及びデータ分類装置
 本発明は、大量のデータを分類するデータ分類方法に関する。
 本発明は、IoT(Internet of Things)技術の登場に伴って、様々なデータを分析して知見を得ることが行われている。例えば、製品を製造する工場などでは、生産設備が出力するデータや、材料のデータを計算機で収集して分析を行い、品質の向上や生産性の向上に役立てることができる。
 工場などでは多種多様な生産設備が稼動しており、各生産設備から出力されるデータのフォーマットは必ずしも統一されていないため、分析を行う計算機では各生産設備から収集したデータの種類やフォーマットに応じて分類する必要があった。
 例えば、特許文献1には、機械学習により計算機システムがユーザからのフィードバックを学習して教師データを生成し、教師データに基づくデータ分類器を生成し、当該データ分類器で分類対象のデータを分類する技術が開示されている。また、特許文献2には、計算機がデータ集合に含まれるデータを階層的に抽象化することにより、分類対象のデータを分類する技術が開示されている。
米国特許出願公開第2011/0078187号明細書 特開2011-003156号公報
 しかしながら、上記特許文献1では、機械学習の際にユーザからのフィードバックにより教師データを生成してからデータを分類する必要があり、時系列のデータを一度に処理できないという問題があった。さらに、上記従来例1、2の組み合わせでは、複数段階で階層的に抽象化されたデータを分類する場合、分類対象のデータを教師データの抽象化レベルに合わせなければならない、という問題があった。
 そこで本発明は、予め設定したマスタデータに基づいて、フォーマットの異なるデータの分類にかかるコストを抑制することを目的とする。
 本発明は、プロセッサとメモリとストレージ装置を備えた計算機で、データフォーマットの異なる複数の種類のデータを分類するデータ分類方法であって、前記計算機が、前記データフォーマットの種類毎に前記データの代表値としてのマスタデータを格納したマスタデータ情報に、抽象化レベル毎に抽象化ルールを予め設定したルール情報を適用して、前記抽象化レベルごとに前記マスタデータを抽象化した第1の抽象化データを生成する第1のステップと、前記計算機が、前記データフォーマットの異なる複数の種類のデータをデータ情報として取得する第2のステップと、前記計算機が、前記取得したデータ情報に前記ルール情報を適用して前記抽象化レベルごとに前記データを抽象化した第2の抽象化データを生成する第3のステップと、前記計算機が、前記第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データで分類する第4のステップと、を含む。
 本発明によれば、分類担当者がデータの列名及びカラムの内容を理解していなくとも、マスタデータに基づく抽象化されたデータの種類で分類することが可能となる。これにより、分類担当者がデータを理解するまでの時間が不要となって、分類時間(データの理解や準備時間)を短縮して分類にかかるコストを抑制できる。
本発明の第1の実施例を示し、計算機システムの一例を示すブロック図である。 本発明の第1の実施例を示し、データ収集サーバの一例を示すブロック図である。 本発明の第1の実施例を示し、マスタデータテーブルの一例を示す図である。 本発明の第1の実施例を示し、製造実績データテーブルの一例を示す図である。 本発明の第1の実施例を示し、圧縮列テーブルの一例を示す図である。 本発明の第1の実施例を示し、抽象化ルールテーブルの一例を示す図である。 本発明の第1の実施例を示し、抽象化後テーブルの一例を示す図である。 本発明の第1の実施例を示し、抽象化前後データ関連性テーブルの一例を示す図である。 本発明の第1の実施例を示し、データ分類サーバで行われるマスタデータの更新処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、データ分類サーバのデータ抽象化部で行われるマスタデータの抽象化処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、データ分類サーバで行われる製造実績データの分類処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、データ分類サーバの列圧縮部で行われる製造実績データの圧縮処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、データ分類サーバのデータ抽象化部で行われる製造実績データの抽象化処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、データ分類サーバのデータ分類部で行われる製造実績データの分類処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、データ分類サーバが提供する抽象化レベルの設定画面の一例を示す画面イメージである。 本発明の第1の実施例を示し、データ分類サーバが提供する製造実績データの分割結果表示画面の一例を示す画面イメージである。 本発明の第2の実施例を示し、データ分類サーバの一例を示すブロック図である。 本発明の第2の実施例を示し、列コンバージテーブルの一例を示す図である。 本発明の第2の実施例を示し、データ分類サーバが提供する製造実績データの分類結果表示画面の一例を示す画面イメージである。 本発明の第2の実施例を示し、データ分類サーバで行われる製造実績データの分類処理の一例を示すフローチャートである。 本発明の第2の実施例を示し、データ分類サーバの列コンバージ部で行われる製造実績データの再結合処理の一例を示すフローチャートである。 本発明の第3の実施例を示し、データ分類サーバの一例を示すブロック図である。 本発明の第3の実施例を示し、データ分類サーバが提供する抽象化レベル調整及び製造実績データ分類結果表示画面の一例を示す画面イメージの前半部である。 本発明の第3の実施例を示し、データ分類サーバが提供する抽象化レベル調整及び製造実績データ分類結果表示画面の一例を示す画面イメージの後半部である。 本発明の第3の実施例を示し、抽象化前後データ関連性テーブルの一例を示す図である。 本発明の第3の実施例を示し、抽象化条件テーブルの一例を示す図である。 本発明の第3の実施例を示し、データ分類サーバで行われる学習及び分類処理の一例を示すフローチャートである。 本発明の第3の実施例を示し、データ分類サーバのデータ分類部で行われる分類処理の一例を示すフローチャートである。 本発明の第3の実施例を示し、データ分類サーバのデータ分類部で行われる製造実績データの分類処理の一例を示すフローチャートである。 本発明の第3の実施例を示し、データ分類サーバのユーザ設定更新部で行われる処理の一例を示すフローチャートである。 本発明の第3の実施例を示し、機械学習結果テーブルの一例を示す図である。
 以下、本発明の一実施形態について添付図面を用いて説明する。
 図1Aは本発明の第1の実施例を示し、計算機システムの一例を示すブロック図である。本発明を適用する計算機システムは、工場の製造過程で生成された製造実績データをデータ収集サーバ200で収集し、ネットワーク160を介して接続されたデータ分類サーバ100が製造実績データを取得し、データ分類サーバ100が製造実績データの種類に応じて分類する例を示す。
 データ収集サーバ200は、製造実績データの種類が異なる製造設備310-1~310-Nから製造実績データを収集する。このため、収集された製造実績データは、製造設備310-1~310-N毎に異なるデータフォーマットの異なるデータを含む。なお、以下の説明では、製造設備の全体を「-」のない符号310で示す。
 データ分類サーバ100は、演算処理を行うCPU101と、プログラムやデータを保持する主記憶装置102と、ネットワーク160との間で通信を行う情報用通信インタフェース103と、ストレージ装置130にアクセスする外部記憶装置インタフェース104と、キーボードやマウスなどを含む入力装置140と、ディスプレイ等を含む出力装置141を有する。
 主記憶装置102には、製造実績データをデータフォーマットに基づいて分類する分類処理部10がロードされてCPU101によって実行される。分類処理部10は、マスタデータ更新検出部105と、データ受信部106と、列圧縮部107と、抽象化レベル出力部108と、列分割結果出力部109と、ユーザ設定更新検出部110と、列分割部120と、を含む。また、列分割部120は、抽象化レベル設定部121と、データ抽象化部122と、データ分類部123と、を含む。なお、各処理部の内容については後述する。
 ストレージ装置130は、プログラムやデータを格納する。図示の例では、ストレージ装置130には、マスタデータテーブル150と、製造実績データテーブル300と、圧縮列テーブル400と、抽象化ルールテーブル500と、抽象化後テーブル600と、抽象化前後データ関連性テーブル700が格納される。各テーブルの内容については後述する。
 分類処理部10の各機能部はプログラムとして主記憶装置102にロードされる。CPU101は、各機能部のプログラムに従って処理することによって、所定の機能を提供する機能部として稼働する。例えば、CPU101は、列分割プログラムに従って処理することで列分割部120として機能する。他のプログラムについても同様である。さらに、CPU101は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。例えば、データ分類サーバ100を、データ分類装置として機能させてもよい。
 分類処理部10の各機能を実現するプログラム、テーブル等の情報は、ストレージ装置130や不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
 本実施例では、複数種のデータフォーマットを出力する製造設備310からの製造実績データをデータ分類サーバ100が処理する例を示すが、複数種のデータフォーマットからなるデータあればよく、製造実績データに限定されるものではない。
 図1Bは、データ収集サーバ200の一例を示すブロック図である。データ収集サーバ200は、演算処理を行うCPU201と、プログラムやデータを保持する主記憶装置202と、ネットワーク160との間で通信を行う情報用通信インタフェース203と、ストレージ装置230にアクセスする外部記憶装置インタフェース204と、制御系ネットワーク220を介して製造設備310にアクセスする制御用通信インタフェース205を含む。
 主記憶装置202には、複数の製造設備310-1~310-Nから製造実績データを収集してストレージ装置230の製造実績データテーブル240へ格納する製造実績データ収集部211と、データ分類サーバ100からの要求に応じてストレージ装置230の製造実績データテーブル240から製造実績データを読み出して、データ分類サーバ100に送信するデータ送信部210がロードされる。
 製造実績データ収集部211は、所定の周期で各製造設備310から製造実績データを収集してストレージ装置230の製造実績データテーブル240に書き込む。なお、各製造設備310がそれぞれ製造実績データを生成すると、データ収集サーバ200へ製造実績データを送信するようにしてもよい。
 次に、図1Aに示した分類処理部10を構成する各処理部の概要を説明する。まず、マスタデータ更新検出部105は、データ分類サーバ100に予め設定されたマスタデータテーブル150が更新されたことを検出してマスタデータの抽象化結果を出力装置141へ出力する。
 データ受信部106は、データ収集サーバ200へ製造実績データを要求し、データ収集サーバ200から製造実績データを受信して、ストレージ装置130の製造実績データテーブル300へ格納する。
 列圧縮部107は、製造実績データテーブル300に格納された製造実績データについて、列方向にデータ圧縮を行って、圧縮列テーブル400へ格納する。抽象化レベル出力部108は、マスタデータテーブル150のマスタデータを抽象化した結果を出力装置141へ表示する。なお、抽象化については後述する。列分割結果出力部109は、マスタデータテーブル150に基づいて分類された製造実績データを出力装置141へ表示する。
 ユーザ設定更新検出部110は、設定された抽象化レベルが変更されたことを検出すると、後述するように、製造実績データを変更された抽象化レベルまで分類する。列分割部120の抽象化レベル設定部121で処理を行う抽象化レベルを設定する。列分割部120のデータ抽象化部122は、抽象化ルールテーブル500に基づいて製造実績データを抽象化して抽象化後テーブル600に格納する。列分割部120のデータ分類部123は、抽象化後テーブル600のデータと抽象化レベルと抽象化前の製造実績データの関係を設定する。
 次に、データ分類サーバ100が使用する各テーブルについて説明する。図2は、マスタデータテーブルの一例を示す図である。マスタデータテーブル150は、製造設備310-1~310-Nがそれぞれ出力する製造実績データの種類毎の代表値を予め設定したテーブルである。このマスタデータテーブル150には、製造設備310のデータファーマットが変更あるいは追加されると、管理者などが操作する入力装置140等によって新たなマスタデータが登録あるいは更新される。
 マスタデータテーブル150には、データフォーマット毎にレコードが追加される。例えば、製造設備310-N-1と製造設備310-Nのデータフォーマットが同一であれば、何れか一方の代表値をマスタデータテーブル150に設定することができる。
 マスタデータテーブル150は、行番号151と、製造設備310が付与したタイムスタンプ等を格納する製品生産時刻152と、製品の識別子を格納する個体識別子153と、製造設備310の名称を格納する設備名154と、製造設備310の識別子を格納する設備番号155と、製造実績データに付与されたパラメータを格納するパラメータ値156と、をひとつのレコードに含む。また、マスタデータテーブル150には、マスタデータを格納する各フィールドについて、列方向の属性を示すフィールド名157が設定される。なお、フィールド名157は、各データフォーマットで使用する値が設定される。
 図2の例では、カラム(製品生産時刻152~パラメータ値156まで)の5つのカラムで、製造設備31-1~310-Nのマスタデータを格納する例を示すが、これに限定されるものではなく、製造設備310-1~310-Nがそれぞれ生成する製造実績データの全てのカラム(フィールド名)を含むようにしてもよい。なお、行番号151は、データ分類サーバ100によって付与される。
 また、マスタデータは、マスタデータテーブル150の全てのカラムにデータが格納される必要はなく、製造実績データに含まれるカラムに値を格納すればよい。例えば、製造設備310-1が生成した製造実績データでは、フィールド名157が製品生産時刻152と、個体識別子153と、設備番号155とからなるデータに行番号151を付加したデータであってもよく、あるいは、製造設備310-Nが生成した製造実績データでは、製品生産時刻152と、設備番号155と、図示しない作業者名とロット番号からなるデータに行番号151を付加したデータであってもよい。
 図3は、製造実績データテーブル300の一例を示す図である。製造実績データテーブル300は、データ収集サーバ200が、各製造設備310-1~310-Nが出力するデータを時系列的に収集し、データ分類サーバ100が取得した情報である。データ分類サーバ100は、所定のタイミングでデータ収集サーバ200に各製造設備310-1~310-Nが出力したデータを要求し、受信したデータを製造実績データテーブル300に格納する。
 製造実績データテーブル300は、行番号301と、カラム302~305を含む。カラム302~305には、データ収集サーバ200から受信したフィールドの値が順次格納される。上述したように、製造実績データテーブル300には、複数の製造設備310-1~310-Nからフォーマットの異なるデータが時系列的に格納されるため、カラム302~305に格納されるデータの種類は、レコード毎に異なる場合が生じる。
 なお、図示の例ではカラム302~305のフィールド名として、データ分類サーバ100がDATA001~DATA004を割り当てた例を示す。また、製造実績データテーブル300のカラムの数は、データ分類サーバ100がデータ収集サーバ200から受信したレコードのうち最長のレコード長に応じた数とすればよい。また、行番号301は、データ収集サーバ200が付与した値を格納すればよい。
 図4は、圧縮列テーブル400の一例を示す図である。圧縮列テーブル400は、データ分類サーバ100が、製造実績データテーブル300のデータを列(カラム)方向に圧縮した例を示す。
 圧縮列テーブル400は、製造実績データテーブル300のカラムの名称を格納する列名401と、圧縮対象のデータを格納した製造実績データテーブル300の行番号301を格納する代表データ行番号402と、圧縮対象のデータを含む製造実績データテーブル300の行番号301を格納する圧縮データ行番号403と、をひとつのレコードに含む。
 データ分類サーバ100の列圧縮部107は、製造実績データテーブル300で同一のカラム302~305の値が他のレコード(行)に存在する場合、圧縮データ行番号403に複数の行番号301を格納して、ひとつのレコードに圧縮する。
 例えば、図3の製造実績データテーブル300では、行番号301=「1」のカラム302には「神戸太郎」が格納され、行番号301=「7」のカラム302にも「神戸太郎」が格納される。データ分類サーバ100の列圧縮部107は、同一のカラム302で同一の値「神戸太郎」を格納している行番号301=「1」、「7」を、圧縮列テーブル400の圧縮データ行番号403へ格納し、代表データ行番号402へ先頭の行番号301=「1」を格納し、当該データを格納するフィールド名=「DATA001」を列名401へ格納する。
 なお、データ分類サーバ100の列圧縮部107は、同一のデータを含む最先の行番号301を代表データ行番号402へ格納すればよい。また、データ分類サーバ100の列圧縮部107は、同一のデータがないカラムについては、当該カラムの行番号301を代表データ行番号402と圧縮データ行番号403へ格納すればよい。これにより、圧縮列テーブル400は、製造実績データテーブル300を列方向へ圧縮したテーブルとして利用することが可能となる。
 図5は、抽象化ルールテーブル500の一例を示す図である。抽象化ルールテーブル500は、製造実績データテーブル300のカラム302~305の値を抽象化する定義を抽象化レベル毎に予め設定したテーブルである。
 抽象化ルールテーブル500は、抽象化のレベルを格納する抽象化レベル501と、製造実績データテーブル300の各カラム302~305の内容を抽象化する定義を格納した抽象化ルール502を含む。
 抽象化レベル501は、抽象化する度合を決定する値を示し、抽象化レベルの値が大きくなるにつれて、抽象化の度合は低下する。すなわち、抽象化レベルの値が小さいほど製造実績データテーブル300の値は抽象化され、抽象化レベルの値が大きいほど製造実績データテーブル300の値に近付く。
 図示の例では、抽象化レベル501が最も小さい「1」で抽象化の度合は最大となる。すなわち、抽象化前のデータが4桁の年と2桁の月日からなるデータは、日付型として抽象化される。同様に、漢字やアルファベットや数字を含むデータは、文字列として抽象化され、0-9からなるデータは数値型として抽象化される。
 また、抽象化レベル501が2番目に小さい「2」では、文字列からなるデータは、漢字を含む漢字文字列と、アルファベットと数字を含む英数文字列と、アルファベットからなる英文字文字列のいずれかに抽象化される。同様に、数値からなるデータは、小数点を含む小数と、小数点を含まない整数の何れかに抽象化される。
 抽象化レベル501が3番目の「3」では、文字列からなるデータは、さらに細分化されて、文字数+漢字文字列、文字数+英数文字列または文字数+英文字文字列の何れかに抽象化される。
 図6は、抽象化後テーブル600の一例を示す図である。抽象化後テーブル600は、データ分類サーバ100のデータ抽象化部122が、製造実績データテーブル300またはマスタデータテーブル150を抽象化ルールテーブル500に従って抽象化した結果を格納する。
 抽象化後テーブル600は、抽象化の度合を格納する抽象化レベル601と、抽象化前のフィールド名を格納する抽象化前列名602と、抽象化前の製造実績データテーブル300の行番号301を格納する抽象化前行番号603と、抽象化後のデータを格納する抽象化後データ604とをひとつのレコードに含む。
 図示では、抽象化レベル601=2までの例を示すが、実際には分類で指定されたレベルxまで、データ抽象化部122が抽象化レベル601=1~xまでのレベルで製造実績データテーブル300を抽象化した結果が抽象化後テーブル600に格納される。
 なお、図示の例の抽象化前列名602の「生産時刻」は、後述するように、マスタデータテーブル150のフィールド名157を格納したレコードで、抽象化後データ604にはマスタデータテーブル150の抽象化結果が格納される。
 図7は、抽象化前後データ関連性テーブル700の一例を示す図である。抽象化前後データ関連性テーブル700は、データ分類サーバ100のデータ分類部123が、抽象化後テーブル600のデータと、圧縮列テーブル400のデータの対応関係を抽出し、製造実績データテーブル300の列ごとに抽象化後データ704で分類した結果を格納する。
 抽象化前後データ関連性テーブル700は、圧縮列テーブル400の列名401を格納する抽象化前列名701と、圧縮列テーブル400の圧縮データ行番号403の値を格納する抽象化前行番号702と、抽象化後テーブル600の抽象化レベル601を格納する抽象化レベル703と、抽象化後テーブル600の抽象化後データ604を格納する抽象化後データ704とをひとつのレコードに含む。
 抽象化前後データ関連性テーブル700の抽象化前列名701と抽象化前行番号702を参照することで製造実績データテーブル300のデータが特定される。そして、特定されたデータの抽象化レベル703ごとの抽象化後データ704を取得することができる。すなわち、データ分類サーバ100は、抽象化前後データ関連性テーブル700を参照することで、製造実績データテーブル300のデータがどのように抽象化されたのかを取得することができる。
 図8は、データ分類サーバ100のマスタデータ更新検出部105で行われる処理の一例を示すフローチャートである。この処理は、マスタデータテーブル150が更新されるとステップS102以降の処理が実行される。
 ステップS101でデータ分類サーバ100のマスタデータ更新検出部105がマスタデータテーブル150の更新を検出すると、ステップS102へ進む。ステップS102では、抽象化レベル設定部121が、抽象化するレベルを最も高いレベル=1に初期化する。本実施例では、抽象化レベル設定部121が変数ID-Aに抽象化レベル=1を設定し、抽象化の度合が高い抽象化レベルから抽象化の度合が低い抽象化レベルへ順次低下させる例を示す。
 ステップS103では、データ分類サーバ100のマスタデータ更新検出部105が、抽象化ルールテーブル500を参照して、現在の抽象化レベルに対応する抽象化ルール502ルールが存在するか否かを判定する。抽象化ルールテーブル500に現在の抽象化ルール502が存在すればステップS104へ進み、存在しない場合には処理を終了する。
 ステップS104では、データ分類サーバ100のマスタデータ更新検出部105が、マスタデータテーブル150のマスタデータの全ての列について処理を完了したか否かを判定する。全ての列について処理を完了していなければステップS105へ進み、全ての列について処理を完了していればステップS107へ進む。
 ステップS105では、データ抽象化部122が、処理対象の列のデータを取得する。次に、ステップS106では、データ抽象化部122が、取得したデータを抽象化ルールテーブル500に基づいて抽象化する。この抽象化の処理は図9の処理で詳述する。
 一方、現在の抽象化レベルで全ての列について処理が完了したステップS107では、抽象化レベル設定部121が、現在の抽象化レベルを一段階低いレベル(レベルの値は増大)に設定する。現在の抽象化レベルが「1」であれば、抽象化レベルを「2」に変更して抽象化の度合を下げてから上記ステップS103以降の処理を繰り返す。
 データ分類サーバ100は、全てのマスタデータについて、抽象化ルールテーブル500の全ての抽象化レベル501を適用して抽象化した結果を出力装置141に表示する。データ分類サーバ100の管理者は、更新されたマスタデータを含む抽象化結果を出力装置141で確認することができる。
 なお、上記処理は管理者などが操作する入力装置140からの指令に応じて実施してもよい。
 図9は、データ分類サーバ100のデータ抽象化部122で行われるマスタデータの抽象化処理の一例を示すフローチャートである。この処理は、図8のステップS106で行われる。
 データ抽象化部122は、指定された列名(ID-B)で、マスタデータテーブル150の処理対象の行番号(ID-C)のデータを取得する(S1101、S1102)。なお、データ抽象化部122は、マスタデータテーブル150の先頭の行番号から順次選択する。
 次に、ステップS1103でデータ抽象化部122は、抽象化ルールテーブル500を参照して指定された抽象化レベル(ID-A)の抽象化ルール502を取得する。ステップS1104ではデータ抽象化部122が、上記ステップS1102で取得したデータに対して、ステップS1103で取得した抽象化ルールを適用して抽象化を実施する。
 ステップS1105では、データ抽象化部122が、抽象化の結果を抽象化後テーブル600に追加する。ここで、データ抽象化部122は、抽象化の結果を抽象化レベルがID-A、列名がID-B、行番号がID-Cのデータとして抽象化後テーブル600に追加する。
 なお、抽象化後テーブル600には、マスタデータテーブル150の抽象化結果に加えて、後述するように製造実績データテーブル300の抽象化結果も格納される。しかし、抽象化後テーブル600では、抽象化前列名602で「製品生産時刻」などマスタデータテーブル150の列名が付与されているデータと、「DATA001」など製造実績データテーブル300の列名が付与されているデータから、マスタデータの抽象化結果と製造実績データの抽象化結果を識別することができる。
 ステップS1106で、データ抽象化部122は、マスタデータテーブル150で列名がID-Bの全てのレコードについて処理が完了したか否かを判定する。データ抽象化部122は、全てのレコードについて処理が完了していなければステップS1101へ戻って上記処理を繰り返し、全てのレコードについて処理が完了していれば処理を終了する。
 以上のように、マスタデータの抽象化処理では、マスタデータテーブル150のフィールド名157を抽象化前列名602に格納して抽象化後データ604と対応付けることができる。
 図10は、データ分類サーバ100で行われる製造実績データの分類処理の一例を示すフローチャートである。この処理は、データ分類サーバ100の管理者などユーザからの指令に基づいて開始される。本実施例では、ユーザの設定の変更を契機に製造実績データの分類処理を行う例を示す。なお、ユーザが変更する設定としては、後述するように、抽象化レベルを変更した場合に、データ分類サーバ100のユーザ設定更新検出部110が設定変更として検出する。
 データ分類サーバ100のユーザ設定更新検出部110が、ユーザ設定の更新を検出すると処理を開始する(S201)。ステップS202では、抽象化レベル設定部121が、抽象化レベル(ID-D)として最も高いレベル=1に設定して初期化する。
 ステップS203では、ユーザ設定更新検出部110が抽象化ルールテーブル500を参照して、ユーザ設定が変更された抽象化レベルを取得し、現在の抽象化レベル(ID-D)とユーザ設定の抽象化レベルに対応する抽象化ルール502が存在するか否かを判定する。抽象化ルールテーブル500に現在の抽象化レベルの抽象化ルール及びユーザ設定の抽象化ルールが存在すればステップS204へ進み、存在しない場合には処理を終了する。
 ステップS204では、データ分類サーバ100のユーザ設定更新検出部110が、製造実績データテーブル300の全ての列について処理を完了したか否かを判定する。全ての列について処理を完了していなければステップS205へ進み、全ての列について処理を完了していればステップS210へ進む。
 ステップS205では、データ分類サーバ100の列圧縮部107が、製造実績データテーブル300から未処理の列(列名がID-E)を取得する。ステップS206では、列圧縮部107が、取得した列名ID-Bについて全てのデータについて処理が完了したか否かを判定する。列圧縮部107は、全てのデータについて処理が完了していなければステップS207の処理へ進み、全てのデータについて処理が完了していればステップS208の処理へ進む。
 ステップS207では、データ分類サーバ100の列圧縮部107が、選択された列(ID-E)で未処理の行番号(ID-F)を選択して列方向の圧縮を実施する。列方向の圧縮については、図11のステップS2101~2103で後述する。
 一方、列(ID-E)について列圧縮が完了しているステップS208では、データ抽象化部122が、ステップS205で取得した列(ID-E)のデータにいついて、指定された抽象化レベル(ID-D)で抽象化する。抽象化の処理については図12のステップS2201~S2206で後述する。
 ステップS209では、データ分類部123が、上記ステップS208の抽象化の結果に基づいて、列データを分割する。列方向のデータの分割は、製造実績データテーブル300のカラム302~305単位で抽象化後データ604が同一のデータを分類した情報である。なお、分割処理については図13のステップS2301~S2305で後述する。
 一方、上記ステップS204の判定で、製造実績データテーブル300の全てのデータについて処理を完了した場合のステップS210では、列分割結果出力部109がステップS209の結果を出力装置141に表示する。そして、抽象化レベル設定部121は、抽象化レベル(ID-D)をひとつ下げてからステップS203へ戻って上記処理を繰り返す。
 上記処理によって、製造実績データテーブル300のデータは、列圧縮部107で列方向に圧縮された後に、データ抽象化部122でユーザ設定の抽象化レベルまで抽象化され、その後、抽象化の結果に応じてデータ分類部123が列方向でデータを分割する。
 図11は、データ分類サーバ100の列圧縮部107で行われる製造実績データの圧縮処理の一例を示すフローチャートである。この処理は、図10のステップS207で行われる。
 まず、ステップS2101で列圧縮部107は、製造実績データテーブル300の列名がID-Eの列について、行番号がID-Fのデータと同じ内容のデータを検索する。次に、ステップS2102で列圧縮部107は、検索した行番号をID-G1~ID-Gxとして取得する。ただし、xは自然数である。
 ステップS2103で列圧縮部107は、列名401がID-Eで、代表データ行番号402がID-Fで、圧縮データ行番号403がID-G1~ID-Gxのレコードを圧縮列テーブル400に追加する。
 上記処理を繰り返すことで、製造実績データテーブル300の各カラム302~305の内容が列方向で圧縮され、圧縮列テーブル400に格納される。
 図12は、データ分類サーバ100のデータ抽象化部122で行われる製造実績データの抽象化処理の一例を示すフローチャートである。この処理は、図10のステップS208で行われる。
 まず、ステップS2201でデータ抽象化部122は、圧縮列テーブル400の列名401がID-Eの列の全てのデータについて処理が完了したか否かを判定し、完了していなければステップS2202へ進み、完了していれば処理を終了する。
 ステップS2202では、データ抽象化部122が圧縮列テーブル400から列名401がID-Eで未処理のデータを取得し、当該データの代表データ行番号402を変数ID-Hに設定する。ステップS2203では、データ抽象化部122が代表データ行番号402を変数ID-H、列名401がID-Eのデータを製造実績データテーブル300から取得する。
 ステップS2204でデータ抽象化部122は、抽象化レベルがID-Dの抽象化ルールを抽象化ルールテーブル500から取得する。そして、ステップS2205でデータ抽象化部122は、取得した抽象化ルール502に基づいて、ステップS2203で取得したデータを抽象化する。
 ステップS2206でデータ抽象化部122は、ステップS2205の抽象化の結果を抽象化後データ604として、抽象化レベル601がID-Dで、抽象化前列名602がID-Eで、抽象化前行番号603がID-Hのレコードを抽象化後テーブル600に追加する。
 以上の処理によって、圧縮列テーブル400の列名401がID-Eに該当するデータが順次抽象化されて抽象化後テーブル600に格納される。
 図13は、データ分類サーバ100のデータ分類部123で行われる抽象化結果の分類処理の一例を示すフローチャートである。この処理は、図10のステップS209で行われる。
 まず、ステップS2301でデータ分類部123は、抽象化後テーブル600の抽象化レベル601がID-Dで、抽象化前列名602がID-Eの全てのデータについて処理が完了したか否かを判定し、完了していなければステップS2302へ進み、完了していれば処理を終了する。
 ステップS2302では、データ分類部123が抽象化後テーブル600の抽象化レベル601がID-Dで、抽象化前列名602がID-Eのデータのうち未処理の抽象化後データ604を取得し、抽象化結果(ID-J)とする。
 ステップS2303でデータ分類部123は、抽象化後テーブル600から抽象化前列名602がID-Eで、かつ、抽象化後データ604がID-Jのデータを全て選択する。データ分類部123は、選択したデータの抽象化前行番号603を取得して変数ID-I1~ID-Iyに格納する。なお、yは自然数である。
 次に、ステップS2340でデータ分類部123は、抽象化前列名701がID-Eで、抽象化前行番号702がID-I1~ID-Iyで、抽象化レベル703がID-Dで、抽象化後データがID-Jの行を抽象化前後データ関連性テーブル700に追加する。
 上記処理によって、抽象化前の製造実績データの列名と行番号と、抽象化後のデータと抽象化レベルの対応関係を示す抽象化前後データ関連性テーブル700に製造実績データテーブル300の抽象化結果が格納される。
 図14は、データ分類サーバ100の抽象化レベル出力部108が出力装置141に表示する抽象化レベルの設定画面の一例を示す画面イメージである。抽象化レベル出力部108は、例えば、図8のステップS108等で抽象化レベルと抽象化の結果を出力装置141に表示する。
 抽象化レベル設定画面1000は、マスタデータテーブル150の抽象化後データ604を抽象化レベル毎のグラフ1010で表示する表示領域1001と、表示する抽象化レベルを設定するポインタ1002と、抽象化レベルの設定をユーザ設定として反映させる実行ボタン1003を含む。
 図示の例では、マスタデータテーブル150の抽象化を実施して、マスタデータテーブル150の列名152~156を含むデータの抽象化後データ604を、抽象化レベル設定画面1000としてグラフ1010で出力装置141に表示する例を示す。
 マスタデータテーブル150を抽象化したグラフ1010の起点には、抽象化の最上位となる「実績データ」が配置され、その直下には最も抽象化の度合いが最も高い抽象化レベル=1の抽象化後データが「文字列」、「数値型」及び「日付型」として表示される。なお、本実施例では、年月日と時刻を含むデータを日付型と定義するが、日付と時刻を分けて管理するようにしてもよい。
 抽象化レベル=1の直下には、2番目に抽象化の度合いが高い抽象化レベル=2の抽象化後データが「英字数字型文字列」、「英字型文字列」、「漢字字型文字列」、「整数」及び「小数」として表示される。
 抽象化レベル=2の直下には、3番目に抽象化の度合いが高い抽象化レベル=3の抽象化後データが「文字数+英字数字型文字列」、「文字数+英字型文字列」及び「文字数+漢字字型文字列」として表示される。
 マスタデータのグラフ1010は、このように、抽象化レベルの階層ごとにマスタデータを抽象化した抽象化後データ604をデータの属性(種類)の関係でグラフとして配置したものである。
 データ分類サーバ100の管理者などのユーザがポインタ1002を操作して抽象化レベルを設定し、実行ボタン1003をクリックすると、データ分類サーバ100は、新たな抽象化レベルの設定に応じて抽象化後データをグラフ1010で出力装置141に表示する。
 なお、マスタデータテーブル150を抽象化した抽象化後データ(第1の抽象化データ)604のグラフ1010は、データ分類サーバ100が抽象化後テーブル600を参照することでマスタデータテーブル150のフィールド名157である抽象化前列名602を特定可能である。
 図15は、データ分類サーバ100の列コンバージ部111が出力装置141に表示する製造実績データ分類結果表示画面1100の一例を示す画面イメージである。列分割結果出力部109は、例えば、図10のステップS210等でカラム302~305毎に抽象化後データに応じて分類された製造実績データを出力装置141に表示する。
 製造実績データ分類結果表示画面1100は、製造実績データテーブル300のカラム302~305の名称(DATA001)毎に、抽象化後データが同一のデータがまとめて表示される。
 図示の例では、製造実績データテーブル300のカラム302の名称が「DATA001」の列データは、抽象化後データが英数文字列の値として「SM01」等が分類され、抽象化後データが小数の値として「-0.2273」等が分類され、抽象化後データが漢字文字列の値として「横浜太郎」等が分類される。
 製造実績データ分類結果表示画面1100を参照することで、データ分類サーバ100の管理者などのユーザは、マスタデータのグラフ(抽象化後データ)1010によって分類される製造実績データテーブル300の内容を取得することができる。
 以上のように、本実施例1のデータ分類サーバ100では、マスタデータテーブル150のマスタデータに抽象化レベル毎の抽象化ルール502を適用して抽象化後データ604(第1の抽象化データ)を生成し、抽象化レベル毎に抽象化後のマスタデータを種類毎に分類したグラフ1010(図14参照)を生成することができる。そして、データ分類サーバ100は、製造実績データテーブル300のカラム302~305毎に抽象化ルールテーブル500に基づいて製造実績データを抽象化して抽象化後データ604(第2の抽象化データ)を生成し、上述の抽象化後のマスタデータのグラフ1010に対応付けて抽象化後の製造実績データを分類することができる。
 本実施例1では、データフォーマットの異なる複数の製造設備310-1~310-Nから時系列で製造実績データを受け付けて製造実績データテーブル300に格納し、製造実績データを列ごとに抽象化して、抽象化後のマスタデータのグラフ1010に応じて抽象化後の製造実績データを分類することができる。
 なお、上記実施例1では、マスタデータテーブル150のマスタデータを抽象化した抽象化後データと、製造実績データテーブル300の製造実績データを抽象化した抽象化後データを、同一の抽象化後テーブル600に格納したがこれに限定されるものではない。例えば、マスタデータテーブル150のマスタデータを抽象化して抽象化後データを第1の抽象化後テーブルに格納し、製造実績データテーブル300の製造実績データを抽象化した抽象化後データを第2の抽象化後テーブルに分離して格納してもよい。
 以上のように、データ分類サーバ100を利用するユーザ(分析担当者)が製造実績データの列名(フィールド名157)及びカラムの内容を理解していなくとも、データ分類サーバ100が製造実績データをマスタデータのカテゴリ(グラフ1010)で分類することが可能となる。これにより、分析担当者がデータ理解するまでの時間が不要となって、分析時間(データの理解や準備時間)を短縮して分析処理にかかるコストを抑制できる。
 また、データ分類サーバ100は、製造実績データのデータ種別(抽象化後データ604)を、マスタデータのグラフ1010を利用して製造実績データテーブル300の列毎に特定するので、時系列の製造実績データを高速に処理することが可能となる。
 図16は、第2の実施例のデータ分類サーバ100の一例を示すブロック図である。第2の実施例では、前記第1実施例の分類処理部10に抽象化後の製造実績データを抽象化後データ604単位でまとめる列コンバージ部111を追加し、ストレージ装置130に列コンバージテーブル800を追加したものである。その他の構成は、前記第1実施例と同様である。
 図17は、列コンバージテーブル800の一例を示す図である。この列コンバージテーブル800は、後述する列コンバージ部111の処理によって生成される。
 列コンバージテーブル800は、抽象化前後データ関連性テーブル700の抽象化後データ704を格納する抽象化後データ801と、抽象化前列名701を格納する列名802と、抽象化前行番号702を格納する行番号803とをひとつのレコードに含む。
 データ分類サーバ100は、列コンバージテーブル800を参照することにより、製造実績データを抽象化した抽象化後データ604とマスタデータのグラフ1010を対応付けることができる。すなわち、データ分類サーバ100は、製造実績データテーブル300の列にかかわらず製造実績データをマスタデータのグラフ1010に対応付けて分類することができる。
 図18は、データ分類サーバ100の列コンバージ部111が出力装置141に表示する製造実績データ分類結果表示画面1100の一例を示す画面イメージである。列コンバージ部111は、後述の図19Bの処理によって、マスタデータのグラフ1010と同一の抽象化後データで製造実績データテーブル300を分類した結果を、製造実績データ分類結果表示画面1100として出力装置141に表示する。
 製造実績データ分類結果表示画面1100は、前記実施例1の図15とは異なり、製造実績データテーブル300のカラム302~305に係わらず、抽象化後データがグラフ1010と同一の抽象化データを有する製造実績データが列コンバージ部111によって出力される。図示の例では、抽象化後データがグラフ1010を構成する「英字数字文字列」のデータとして「SM010」、「C0010」が分類され、「漢字型文字列」として「神戸太郎」、「横浜太郎」及び「着磁機」が分類され、同様に数値や日付の製造実績データが分類される。
 本実施例2の製造実績データ分類結果表示画面1100を参照することで、データ分類サーバ100の管理者などのユーザは、抽象化後データに対応する製造実績データテーブル300のデータを容易に把握することができる。
 図19Aは、データ分類サーバ100で行われる製造実績データの分類処理の一例を示すフローチャートである。この処理は、前記実施例1の図10の処理に、ステップS3100の分類されたデータのコンバージ処理を追加したもので、その他の処理は前記実施例1と同様である。
 ステップS204~S209の処理で、カラム302~305毎に列方向のデータの分割が全て完了すると、ステップS3100では、列コンバージ部111が列コンバージテーブル800を生成する。
 そして、ステップS210では、データ分類サーバ100の列コンバージ部111が列コンバージテーブル800の抽象化後データ801毎に製造実績データを集約した結果を、図18に示す製造実績データ分類結果表示画面1100に出力する。
 図19Bは、データ分類サーバ100の列コンバージ部111で行われる製造実績データの再結合(コンバージ)処理の一例を示すフローチャートである。この処理は、図19AのステップS3100で行われる処理で、各抽象化レベルで列方向のデータ分割が完了する度に実行される。
 ステップS3101で、列コンバージ部111は、抽象化前後データ関連性テーブル700の抽象化レベルがID-Dの全てのデータについて抽象化後データ704の処理が完了したか否かを判定する。列コンバージ部111は、未処理のデータがあればステップS3102へ進み、全てのデータについて処理が完了していればこの処理を完了して図19Aの処理に戻る。
 ステップS3102で列コンバージ部111は、抽象化前後データ関連性テーブル700の抽象化レベルID-Dで、未処理の抽象化後データ704を変数ID-Lとして取得する。
 ステップS3101で、列コンバージ部111は、抽象化前後データ関連性テーブル700の抽象化レベル703がID-Dで、抽象化後データ704がID-Lのデータについて全て処理が完了したか否かを判定する。列コンバージ部111は、未処理のデータがあればステップS3104へ進み、全てのデータについて処理が完了していればステップS3101へ戻る。
 ステップS3104で列コンバージ部111は、抽象化前後データ関連性テーブル700の抽象化レベル703がID-Dで、抽象化後データ704がID-Lで未処理のデータを取得する。
 ステップS3105で列コンバージ部111は、取得したデータの抽象化前列名701を変数ID-Mとして取得し、当該レコードの抽象化前行番号702を変数ID-N1~ID-Nzとして取得する。なお、zは自然数である。
 次に、ステップS3106で列コンバージ部111は、抽象化後データ801がID-Lで、列名802がID-Mで、行番号803がID-N1~ID-Nzのレコードを列コンバージテーブル800に追加する。
 上記処理を繰り返すことで、図17で示すように、列コンバージテーブル800が生成され、カラム302~305に係わらず抽象化後データ801で分類されたデータを列名802と行番号803で特定することが可能となる。
 以上のように、本実施例2のデータ分類サーバ100では、列コンバージテーブル800で製造実績データテーブル300の列方向に分類した抽象化後データ604を、マスタデータのグラフ1010で集約する。これにより、データ分類サーバ100は、製造実績データテーブル300のカラム302~305に係わらず、マスタデータのグラフ1010に応じて製造実績データを分類することができる。
 本実施例2では、データフォーマットの異なる複数の製造設備310-1~310-Nから時系列で製造実績データを受け付けて製造実績データテーブル300に格納し、製造実績データを抽象化して、製造実績データテーブル300の列に係わらずグラフ1010にまとめることができる。
 以上のように、データ分類サーバ100を利用するユーザ(分析担当者)が製造実績データの列名(フィールド名157)及びカラムの内容を理解していなくとも、マスタデータのカテゴリ(グラフ1010)で製造実績データを分類することが可能となり、分析担当者がデータを理解するまでの時間が不要となって、分析時間(データの理解や準備時間)を短縮して分析処理にかかるコストを抑制できる。
 また、データ分類サーバ100は、製造実績データのデータ種別(抽象化後データ604)を、マスタデータのグラフ1010を利用して製造実績データテーブル300の列に係わらず特定できるので、時系列の製造実績データを高速に処理することが可能となる。
 図20は、第3の実施例のデータ分類サーバ100の一例を示すブロック図である。第3の実施例では、前記第2実施例の構成に、マスタデータテーブル150を抽象化して教師データを生成する教師データ生成部112と、機械学習の学習モデルを生成する学習モデル生成部113と、製造実績データを分類するのに適した抽象化レベルを学習する最適抽象化レベル学習部114と、抽象化条件テーブル900に基づいて処理対象のデータを特定する抽象化対象データ特定部115と、機械学習の結果を格納する機械学習結果テーブル950を加えたものである。その他の構成は、前記第2実施例と同様である。
 本実施例3では、列コンバージテーブル800で分類された抽象化後テーブル600のデータと製造実績データと、製造実績データテーブル300のフィールド名との関係を特定する例を示す。
 図21A、図21Bは、データ分類サーバ100が提供する抽象化レベル調整及び製造実績データ分類結果表示画面1300の一例を示す画面イメージである。抽象化レベル調整及び製造実績データ分類結果表示画面1300は、抽象化レベル毎に階層構造でマスタデータテーブル150のフィールド名1322と抽象化後データ1321を表示する領域1301~1304と、製造実績データの分類結果を表示する領域1305と、抽象化レベルの調整を適用する決定ボタン1310とを含む。
 領域1301~1304は、抽象化レベルが1~4の例を示し、それぞれの抽象化レベルに属する抽象化後データ1321と、抽象化後データに対応するマスタデータテーブル150に対応するフィールド名1322が表示される。なお、図中抽象化レベル=1は抽象化を実施しない階層である。
 なお、領域1301~1304は、最適な抽象化のレベルを入力装置140等によって調整する抽象化レベル調整画面として機能する。抽象化レベル調整画面では、"+"のボタン1330がクリックされると抽象化後データ1321に分類されたフィールド名1322が展開される。その後、ボタン1330は"-"で表示される。
 また、"-"のボタン1330がクリックされると、展開されていたフィールド名1322を消去して抽象化後データ1321のみを表示する折りたたみ処理が実施される。その後、ボタン1330は"+"で表示される。
 抽象化レベル=1の領域1301には、抽象化後データ1321として「実績データ」(1321)が表示され、ボタン1330は展開状態の「-」となっており、当該抽象化後データに属するマスタデータテーブル150のフィールド名1322の一覧が展開されている。ボタン1330は「+」で代表のフィールド名1322のみを表示する折りたたみ状態を示す。ボタン1330が操作されると、後述するように、ユーザ設定更新検出部110が図27の処理を実行する。
 なお、抽象化レベル=1では、製造実績データの抽象化は実施しないので、「実績データ」配下のフィールド名1322にはマスタデータテーブル150の全ての列名(フィールド名157)が列挙される。
 抽象化レベル=2の領域1302には、抽象化後データ1321として、文字列データ、数値型データ、日付型データの3つが表示される。そして、文字列データには、マスタデータテーブル150のフィールド名(データ種別)となる「設備番号」、「設備名」、「作業者名」、「シフト番号」、「製品個体識別子」が含まれることを示す。
 製造実績データの分類結果を表示する領域1305には、抽象化レベル=4で抽象化後データ1311が「4文字以下+漢字型文字列」の「作業者名」のフィールド名1322で製造実績データを分類した結果が表示される。
 管理者などのユーザは、領域1301~1304で抽象化後データまたはフィールド名1322をクリックしてから、決定ボタン1310をクリックすることで、調整後の抽象化レベルまたは抽象化後データ1321で製造実績データを分類することができる。
 また、図21A、図21Bの抽象化レベル調整及び製造実績データ分類結果表示画面1300は、抽象化レベル出力部108で生成することができる。
 図22は、抽象化前後データ関連性テーブル700Aの一例を示す図である。本実施例3の抽象化前後データ関連性テーブル700Aは、前記実施例1の図7に示した抽象化前後データ関連性テーブル700Aにデータ種別705を追加したものであり、その他の構成は前記実施例1と同様である。
 抽象化前後データ関連性テーブル700Aは、圧縮列テーブル400の列名401を格納する抽象化前列名701と、圧縮データ行番号403を格納する抽象化前行番号702と、抽象化後テーブル600の抽象化レベル601を格納する抽象化レベル703と、抽象化後データ604を格納する抽象化後データ704と、マスタデータテーブル150のフィールド名を格納するデータ種別705をひとつのレコードに含む。
 図23は、抽象化条件テーブル900の一例を示す図である。抽象化条件テーブル900は、データ分類部123が生成する。抽象化条件テーブル900は、抽象化のレベルを格納する抽象化レベル901と、抽象化の条件を格納した抽象化条件902と、抽象化レベルの階層の終端を示す抽象化フラグ903とを含む。
 抽象化フラグ903は、「1」であれば当該抽象化レベルの下位の階層が存在することを示し、「0」であれば当該抽象化レベルが最下層であることを示す。
 図24は、データ分類サーバ100で行われる学習モデルの生成処理の一例を示すフローチャートである。この処理は前記実施例1の図8と同様に、マスタデータ更新検出部105がマスタデータテーブル150の更新を検出すると開始される。
 ステップS401では、前記実施例1の図8のステップS101、S102と同様に、ステップS101でマスタデータ更新検出部105がマスタデータテーブル150の更新を検出すると、ステップS102で抽象化レベル設定部121が、抽象化するレベルを最も高いレベル=1に初期化し、変数ID-Aに抽象化レベル=1を設定する。
 ステップS402では、マスタデータ更新検出部105が、抽象化ルールテーブル500を参照して、現在の抽象化レベルに対応する抽象化ルール502が存在するか否かを判定し、抽象化ルールテーブル500に現在の抽象化レベルID-Aに対応する抽象化ルール502が存在すればステップS403へ進み、存在しない場合にはステップS409へ進む。
 ステップS403では、前記実施例1の図8のステップS104~S106の処理を実行する。すなわち、データ抽象化部122が、マスタデータテーブル150のマスタデータの全ての列について各抽象化レベルID-Aで抽象化の処理を実施して抽象化後テーブル600を更新する。
 ステップS404では、教師データ生成部112が抽象化後テーブル600を参照し、抽象化されたマスタデータから教師データを生成する。教師データ生成部112は抽象化後テーブル600の全てのデータを用いるのではなく、抽象化前列名602がマスタデータテーブル150のカラムの名称(フィールド名157)と一致するレコードを教師データとして用いる。
 ステップS405では、学習モデル生成部113が教師データに基づいて、機械学習の学習モデルを生成する。なお、機械学習の学習モデルとしては周知または公知の技術を適用すればよく、決定木やSVM(Support Vector Machine)などを適宜用いることができる。
 そして、データ分類サーバ100の最適抽象化レベル学習部114は、生成された学習モデルによって機械学習を実行して、機械学習の結果を機械学習結果テーブル950に格納する。
 なお、学習モデルによる機械学習は、図示しない処理で実行され、図28に示す機械学習結果テーブル950に学習結果が格納される。図28は、学習モデルによる機械学習の結果を格納する機械学習結果テーブル950の一例を示す図である。
 機械学習結果テーブル950は、抽象化のレベルを格納する抽象化レベル951と、製造実績データを分類する条件を格納する分類条件952と、分類条件952に分類された製造実績データのフィールド名を格納するデータ種別953とを含む。
 分類条件952は、図21Aのデータ種別特定グラフのノードに相当する抽象化後データ1321及び図22の抽象化前後データ関連性テーブル700Aの抽象化後データ704に対応する。データ種別953は、図21Aに示したフィールド名1322に対応し、マスタデータテーブル150のフィールド名157に相当する。
 ステップS406では、データ分類部123が図25のステップS4101~S4105の処理を行って、抽象化条件テーブル900に抽象化フラグ903を追加する。この処理については、図25で後述する。
 ステップS407では、データ分類部123が図26のステップS4201~S4209の処理を行って、抽象化された全ての分類対象のデータをフィールド名に分類し、分類される結果を抽象化前後データ関連性テーブル720に出力する。この処理については、図26で後述する。
 次に、ステップS408では、抽象化レベル設定部121が、現在の抽象化レベルを一段階低いレベル(レベルの値は増大)に設定する。現在の抽象化レベルが「1」であれば、抽象化レベルを「2」に変更して抽象化の度合を下げてから上記ステップS402以降の処理を繰り返す。
 上記ステップS402では、マスタデータ更新検出部105が抽象化レベルID-Aに対応する抽象化ルール502がなくなるまで上記処理を繰り返した後にステップS409の処理へ進む。ステップS409では、データ分類サーバ100は、上記ステップS407で分類した抽象化前後データ関連性テーブル700の内容を、図21A、図21Bに示した抽象化レベル調整及び製造実績データ分類結果表示画面1300に出力する。
 上記処理により、機械学習の結果に基づく分類が実施されて、抽象化レベル調整及び製造実績データ分類結果表示画面1300の領域1305には、図21A、図21Bで示したように、製造実績データをマスタデータテーブル150のフィールド名157で分類した結果が表示される。図21Aの例では、マスタデータテーブル150のフィールド名=作業者名に分類された製造実績データの分類結果が表示される。
 なお、上記処理は管理者が操作する入力装置140からの所定の指令に基づいて実行してもよい。
 図25は、データ分類サーバ100のデータ分類部123で行われる処理の一例を示すフローチャートである。この処理は図24のステップS406で行われる処理で、図23の抽象化条件テーブル900を設定する処理である。
 ステップS4101では、データ分類部123が、図24のステップS406で生成された学習モデルの全ての分類条件について処理が完了したか否かを判定する。処理が完了していなければステップS4102へ進み、処理が完了した場合には図24の処理へ復帰する。
 ステップS4102では、データ分類部123が、学習モデルから分類条件を一つ取得する。なお、データ分類部123は、分類条件の中から予め設定した順序で選択すればよい。
 ステップS4103では、データ分類部123が、機械学習結果テーブル950を参照して上記ステップS4102で取得した分類条件に一致する分類条件952を検索し、該当する分類条件952に設定されたデータ種別953を取得する。
 ステップS4104では、データ分類部123が、取得したデータ種別953が複数のデータ(フィールド名)であるか否かを判定する。複数のデータであればステップS41106へ進み、ひとつのデータであればステップS4105へ進む。
 ステップS4105では、当該抽象化レベルで分類条件952とデータ種別953は1対1の関係となったので、データ分類部123は、現在の抽象化レベルID-Aを当該データ種別953の最終の抽象化レベルとする。このため、データ分類部123は、抽象化レベル901=抽象化レベルID-Aとし、ステップS4102で取得した分類条件952を抽象化条件902とし、抽象化フラグ903=0のレコードを抽象化条件テーブル900に追加する。
 一方、ステップS4105では、当該抽象化レベルで分類条件952に対して複数のデータ種別953が含まれるため、データ分類部123は、現在の抽象化レベルID-Aからさらに抽象化のレベルを低下させることができる。このため、データ分類部123は、抽象化レベル901=抽象化レベルID-Aとし、ステップS4102で取得した分類条件952を抽象化条件902とし、抽象化フラグ903=1のレコードを抽象化条件テーブル900に追加する。
 上記処理により、データ分類部123は、学習モデルの分類条件のそれぞれについて、機械学習結果テーブル950の学習結果を反映させた抽象化条件テーブル900を生成することができる。
 図26は、データ分類サーバ100のデータ分類部123で行われる製造実績データの分類処理の一例を示すフローチャートである。この処理は図24のステップS407で行われる処理である。
 まず、ステップS4201でデータ分類部123は、圧縮列テーブル400全ての列名401について処理が完了したか否かを判定する。処理が完了していなければステップS4202へ進み、処理が完了した場合には図24の処理へ復帰する。
 ステップS4202ではデータ分類部123が、圧縮列テーブル400から所定の順序で列名ID-Oを選択する。列名の選択は、例えば、圧縮列テーブル400の先頭のレコードから順次行えばよい。
 なお、初回の処理では、製造実績データテーブル300から製造実績データを読み込んで、前記実施例1の図10のステップS204~S207で示したように圧縮列テーブル400を生成しておく。
 ステップS4203ではデータ分類部123が、圧縮列テーブル400の列名ID-Oの全てのデータについて処理が完了したか否かを判定する。処理が完了していなければステップS4204へ進み、処理が完了していなければ図24の処理へ復帰する。
 ステップS4204ではデータ分類部123が、圧縮列テーブル400の列名ID-Oのうちひとつのレコード(行)を取得し、当該行番号を変数ID-Pとする。列名ID-Oのレコードの選択は、例えば、圧縮列テーブル400の先頭のレコードから順次行えばよい。
 ステップS4205ではデータ分類部123が、抽象化後テーブル600から抽象化レベル601=ID-A、抽象化前列名602=ID-O、抽象化前行番号603=ID-Pのレコードで抽象化後データ604を取得する。
 ステップS4206ではデータ分類部123が、抽象化条件テーブル900を参照し、抽象化条件902が上記ステップS4205で取得した抽象化後データ604と一致し、かつ抽象化レベル901がID-Aのレコードから抽象化フラグ903を取得する。
 ステップS4207ではデータ分類部123が、ステップS4206で取得した抽象化フラグ903が"1"であるか否かを判定する。抽象化フラグ903が"1"であればステップS4208へ進み、"0"であればステップS4203へ戻って上記処理を繰り返す。
 ステップS4208ではデータ分類部123が、製造実績データテーブル300から列名=ID-O、行番号301=ID-Pのデータを取得する。そして、データ分類部123は、学習モデルの機械学習結果テーブル950を参照して、製造実績データテーブル300取得したデータを分類し、データ種別953を取得する。
 ステップS4209で、データ分類部123は、抽象化前後データ関連性テーブル700Aに分類結果の行を追加する。すなわち、データ分類部123は、抽象化前列名701がID-O、抽象化前行番号702がID-P、抽象化レベル703がID-Aで、抽象化後データ704がステップS4205で取得した抽象化後データ604で、データ種別705がステップS4206の分類結果とする行を抽象化前後データ関連性テーブル700Aに追加する。
 上記処理により、圧縮列テーブル400の列名401の圧縮データ行番号403の全てのデータを、抽象化のレベル毎に機械学習結果テーブル950のデータ種別953で分類することができ、分類された結果が抽象化前後データ関連性テーブル700Aに格納される。
 なお、上記分類処理で用いる機械学習結果テーブル950は、予めデータ分類サーバ100で生成されたものに加え、他の計算機で生成された機械学習結果を用いることができる。
 図27は、データ分類サーバ100のユーザ設定更新検出部110で行われる処理の一例を示すフローチャートである。ユーザ設定更新検出部110は、図21Aに示した抽象化レベル調整及び製造実績データ分類結果表示画面1300で、ボタン1330が操作されると図27のフローチャートを実行する。
 ステップS4301では、データ分類サーバ100のユーザ等が、入力装置140を操作してボタン1330をクリックすると、ユーザ設定更新検出部110は、最適抽象化レベルの設定が変更されたと判定してステップS4302へ進む。
 ステップS4302では、ユーザ設定更新検出部110が、抽象化レベル調整画面(1301~1304)から抽象化のレベルを取得して変数ID-Qに設定し、クリックされた抽象化後データ604を抽象化条件として取得する。
 ステップS4303では、ユーザ設定更新検出部110が、"+"のボタン1330がクリックされたか否かを判定する。"+"のボタン1330がクリックされた場合にはステップS4304へ進み、"-"のボタン1330がクリックされた場合にはステップS4307へ進む。
 ステップS4304では、ユーザ設定更新検出部110が、"+"のボタン1330が操作されたので抽象化後データの展開処理を実施する。ユーザ設定更新検出部110は、ステップS4302で設定した抽象化レベルよりも一つ下の抽象化レベル(ID-Q+1)、かつ、ステップS4302で設定した抽象化条件が抽象化後データ704と一致する行のデータ(抽象化前列名701、抽象化前行番号702)を、抽象化前後データ関連性テーブル700Aから取得する。
 ステップS4305では、ユーザ設定更新検出部110が、抽象化ルールテーブル500を参照して、現在の抽象化レベルID-Qよりも一つ下の抽象化レベル501が存在するか否かを判定する。現在の抽象化レベルID-Qよりも一つ下の抽象化レベル501が存在すればステップS4306へ進み、存在しない場合に処理を終了する。
 ステップS4305では、データ抽象化部122が、ステップS4304で取得したデータについて、抽象化レベルID-Qよりも一つ下の抽象化レベル501の抽象化ルール502を適用して抽象化後データを生成し、抽象化レベル調整画面の下位の抽象化レベルに展開して表示する。
 一方、ステップS4303の判定で、"-"のボタン1330が操作された場合には、ステップS4307へ進み、ユーザ設定更新検出部110は、クリックされたボタン1330の配下のフィールド名1322を消去して折りたたみ処理を実施する。
 以上の処理によって、データ分類サーバ100は、ユーザがボタン1330を操作すると、抽象化レベル調整画面内で展開処理または折りたたみ処理を実行する。
 以上のように、本実施例3のデータ分類サーバ100では製造実績データテーブル300の製造実績データを抽象化した後に、マスタデータテーブル150の抽象化後データ604に対応付けることで、マスタデータテーブル150のフィールド名157毎に製造実績データを分類することができる。
 また、データ分類サーバ100は、マスタデータから教師データを生成し、教師データから学習モデルを生成して、機械学習を実施させて機械学習結果テーブル950を生成する。そして、製造実績データを機械学習結果テーブル950を利用して分類を実施することで、製造実績データを分類する精度を向上させることができる。
 本実施例3では、データ分類サーバ100がデータフォーマットの異なる複数の製造設備310-1~310-Nから時系列で製造実績データを受け付けて製造実績データテーブル300に格納し、製造実績データを列に係わらず抽象化して、抽象化後データ604毎にマスタデータテーブル150のフィールド名157を特定することができる。
 これにより、データ分類サーバ100では、抽象化後の製造実績データを、抽象化後のマスタデータのグラフ1010に付き合わせることで、時系列の製造実績データの各行がいずれの製造設備310-1~310-Nで生成されたかを特定することができる。
 以上のように、データ分類サーバ100を利用するユーザ(分析担当者)が製造実績データの列名(フィールド名157)及びカラムの内容を理解していなくとも、マスタデータのカテゴリ(グラフ1010)やフィールド名157で分類することが可能となり、分析担当者がデータ理解するまでの時間が不要となって、分析時間(データの理解や準備時間)を短縮して分析処理にかかるコストを抑制できる。
 また、データ分類サーバ100は、製造実績データのデータ種別(抽象化後データ604)を、マスタデータのグラフ1010を利用して製造実績データテーブル300の列に係わらず特定するので、時系列の製造実績データを高速に処理することが可能となる。
 <まとめ>
 なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。
 また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
 また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

Claims (14)

  1.  プロセッサとメモリとストレージ装置を備えた計算機で、データフォーマットの異なる複数の種類のデータを分類するデータ分類方法であって、
     前記計算機が、前記データフォーマットの種類毎に前記データの代表値としてのマスタデータを格納したマスタデータ情報に、抽象化レベル毎に抽象化ルールを予め設定したルール情報を適用して、前記抽象化レベルごとに前記マスタデータを抽象化した第1の抽象化データを生成する第1のステップと、
     前記計算機が、前記データフォーマットの異なる複数の種類のデータをデータ情報として取得する第2のステップと、
     前記計算機が、前記取得したデータ情報に前記ルール情報を適用して前記抽象化レベルごとに前記データを抽象化した第2の抽象化データを生成する第3のステップと、
     前記計算機が、前記第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データで分類する第4のステップと、
    を含むことを特徴とするデータ分類方法。
  2.  請求項1に記載のデータ分類方法であって、
     前記データは、行と列を有し、
     前記第4のステップは、
     前記データの列方向で、前記第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データで分類することを特徴とするデータ分類方法。
  3.  請求項2に記載のデータ分類方法であって、
     前記第4のステップは、
     前記データの列方向で分類された前記第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データ毎に集約することを特徴とするデータ分類方法。
  4.  請求項1に記載のデータ分類方法であって、
     前記マスタデータ情報は、
     前記マスタデータを格納するフィールドと、当該フィールドの列方向の属性を示すフィールド名を有し、
     前記第1のステップは、
     前記第1の抽象化データと前記フィールド名との対応関係を設定することを特徴とするデータ分類方法。
  5.  請求項1に記載のデータ分類方法であって、
     前記抽象化レベルは、予め設定された階層を有することを特徴とするデータ分類方法。
  6.  請求項1に記載のデータ分類方法であって、
     前記計算機が、前記マスタデータから教師データを生成し、前記教師データから学習モデルを生成し、当該学習モデルによって機械学習を実行させて前記抽象化レベル毎に機械学習の結果を機械学習結果情報に格納する第5のステップをさらに含み、
     前記第4のステップは、
     前記機械学習結果情報に基づいて前記第2の抽象化データを分類することを特徴とするデータ分類方法。
  7.  請求項6に記載のデータ分類方法であって、
     前記機械学習結果情報は、
     前記第1の抽象化データに対応するデータ種別が対応付けられ、
     前記第4のステップは、
     前記第1の抽象化データに該当する第2の抽象化データに前記データ種別を設定することを特徴とするデータ分類方法。
  8.  プロセッサとメモリとストレージ装置を備えて、データフォーマットの異なる複数の種類のデータを分類するデータ分類装置であって、
     前記データフォーマットの種類毎に前記データの代表値としてのマスタデータを格納したマスタデータ情報と、
     前記データ及び前記マスタデータを、抽象化レベル毎に抽象化ルールを予め設定したルール情報を適用して抽象化する抽象化部と、
     前記抽象化されたデータを分類する分類部と、を有し、
     前記抽象化部は、
     前記マスタデータ情報に、前記ルール情報を適用して、前記抽象化レベルごとに前記マスタデータを抽象化した第1の抽象化データを生成し、前記データフォーマットの異なる複数の種類のデータを取得したデータ情報に前記ルール情報を適用して前記抽象化レベルごとに前記データを抽象化した第2の抽象化データを生成し、
     前記分類部は、
     前記第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データで分類することを特徴とするデータ分類装置。
  9.  請求項8に記載のデータ分類装置であって、
     前記データは、行と列を有し、
     前記分類部は、
     前記データの列方向で、前記第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データで分類することを特徴とするデータ分類装置。
  10.  請求項9に記載のデータ分類装置であって、
     前記分類部は、
     前記データの列方向で分類された前記第2の抽象化データを、前記抽象化レベル毎の第1の抽象化データ毎に集約することを特徴とするデータ分類装置。
  11.  請求項8に記載のデータ分類装置であって、
     前記マスタデータ情報は、
     前記マスタデータを格納するフィールドと、当該フィールドの列方向の属性を示すフィールド名を有し、
     前記抽象化部は、
     前記第1の抽象化データと前記フィールド名との対応関係を設定することを特徴とするデータ分類装置。
  12.  請求項8に記載のデータ分類装置であって、
     前記抽象化レベルは、予め設定された階層を有することを特徴とするデータ分類装置。
  13.  請求項8に記載のデータ分類装置であって、
     前記マスタデータから教師データを生成し、前記教師データから学習モデルを生成し、当該学習モデルによって機械学習を実行させて前記抽象化レベル毎に機械学習の結果を機械学習結果情報に格納する学習部をさらに有し、
     前記抽象化部は、
     前記機械学習結果情報に基づいて前記第2の抽象化データを分類することを特徴とするデータ分類装置。
  14.  請求項13に記載のデータ分類装置であって、
     前記機械学習結果情報は、
     前記第1の抽象化データに対応するデータ種別が対応付けられ、
     前記抽象化部は、
     前記第1の抽象化データに該当する第2の抽象化データに前記データ種別を設定することを特徴とするデータ分類装置。
PCT/JP2016/058665 2016-03-18 2016-03-18 データ分類方法及びデータ分類装置 WO2017158812A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018505181A JP6476346B2 (ja) 2016-03-18 2016-03-18 データ分類方法及びデータ分類装置
PCT/JP2016/058665 WO2017158812A1 (ja) 2016-03-18 2016-03-18 データ分類方法及びデータ分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/058665 WO2017158812A1 (ja) 2016-03-18 2016-03-18 データ分類方法及びデータ分類装置

Publications (1)

Publication Number Publication Date
WO2017158812A1 true WO2017158812A1 (ja) 2017-09-21

Family

ID=59851811

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/058665 WO2017158812A1 (ja) 2016-03-18 2016-03-18 データ分類方法及びデータ分類装置

Country Status (2)

Country Link
JP (1) JP6476346B2 (ja)
WO (1) WO2017158812A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000348041A (ja) * 1999-06-03 2000-12-15 Nec Corp 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
JP2006139518A (ja) * 2004-11-11 2006-06-01 Nec Corp 文書クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
JP2009134378A (ja) * 2007-11-29 2009-06-18 Hitachi Systems & Services Ltd 文書群提示装置および文書群提示プログラム
JP2012043212A (ja) * 2010-08-19 2012-03-01 Toshiba Corp 情報分類階層管理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000348041A (ja) * 1999-06-03 2000-12-15 Nec Corp 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
JP2006139518A (ja) * 2004-11-11 2006-06-01 Nec Corp 文書クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
JP2009134378A (ja) * 2007-11-29 2009-06-18 Hitachi Systems & Services Ltd 文書群提示装置および文書群提示プログラム
JP2012043212A (ja) * 2010-08-19 2012-03-01 Toshiba Corp 情報分類階層管理装置

Also Published As

Publication number Publication date
JP6476346B2 (ja) 2019-02-27
JPWO2017158812A1 (ja) 2018-06-07

Similar Documents

Publication Publication Date Title
EP2727247B1 (en) Database compression system and method
AU2013329525C1 (en) System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data
US8266147B2 (en) Methods and systems for database organization
JP5782214B2 (ja) 情報検索プログラム、情報検索装置および情報検索方法
JP5241370B2 (ja) テーブル分類装置、テーブル分類方法及びテーブル分類プログラム
KR101663547B1 (ko) 데이터베이스의 아카이빙 방법 및 장치, 아카이빙된 데이터베이스의 검색 방법 및 장치
US20200097483A1 (en) Novel olap pre-calculation model and method for generating pre-calculation result
CN101432684A (zh) 对非结构化内容进行高效索引存储的方法和装置
US11030172B2 (en) Database archiving method and device for creating index information and method and device of retrieving archived database including index information
KR20160117965A (ko) NoSQL 모델 생성 방법 및 그 장치
CN104933096A (zh) 数据库的异常键识别方法、装置与数据系统
JP6476346B2 (ja) データ分類方法及びデータ分類装置
CN107430633B (zh) 用于数据存储的系统及方法和计算机可读介质
CN107577809A (zh) 离线小文件处理方法及装置
CN110825792A (zh) 基于golang中间件协程模式下的高并发分布式数据检索方法
US11954105B2 (en) Method and system for storing query plans in a cache and method for querying a database system
CN114168557A (zh) 一种访问日志的处理方法、装置、计算机设备和存储介质
CN113344023A (zh) 一种代码推荐方法、装置及系统
JP6668271B2 (ja) 業務仕様分析支援装置、業務仕様分析支援方法、及びプログラム
CN117112497B (zh) 一种档案数据存储方法、系统及存储介质
JP5494860B2 (ja) 情報管理プログラム、情報管理装置および情報管理方法
CN110599039B (zh) 产品管理方法及装置、电子设备及存储介质
CN114238378A (zh) 基于sql查询引擎的查询方法、装置、计算机设备及介质
Abid et al. Moving Towards Semantic Web: Relational Schema to Ontology
CN113468202A (zh) 内存数据的筛选方法、装置、设备及存储介质

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2018505181

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16894430

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 16894430

Country of ref document: EP

Kind code of ref document: A1