WO2021033338A1 - 分析システム、装置、制御方法、及びプログラム - Google Patents

分析システム、装置、制御方法、及びプログラム Download PDF

Info

Publication number
WO2021033338A1
WO2021033338A1 PCT/JP2019/041150 JP2019041150W WO2021033338A1 WO 2021033338 A1 WO2021033338 A1 WO 2021033338A1 JP 2019041150 W JP2019041150 W JP 2019041150W WO 2021033338 A1 WO2021033338 A1 WO 2021033338A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
display
item
template
algorithm
Prior art date
Application number
PCT/JP2019/041150
Other languages
English (en)
French (fr)
Inventor
範人 後藤
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US17/634,076 priority Critical patent/US20220351051A1/en
Priority to JP2021540620A priority patent/JP7371690B2/ja
Publication of WO2021033338A1 publication Critical patent/WO2021033338A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements

Definitions

  • the present invention relates to the generation of a prediction model.
  • Patent Document 1 based on the attribute of the user who made a reservation regarding the area where the business operator is located, the demand for the target of the business of the business operator and corresponding to the attribute of the user is predicted. The technology is disclosed.
  • Patent Document 2 discloses a technique that facilitates analysis of business data using a template.
  • Patent Document 2 is intended to make it easier to grasp past achievements by statistically analyzing past data, and does not mention making predictions. Therefore, the technology for facilitating prediction by data analysis is not disclosed.
  • the present invention has been made in view of the above-mentioned problems, and one of the objects thereof is to provide a technique for facilitating prediction by data analysis.
  • the analysis system of the present invention has 1) an input receiving unit that accepts an input that specifies one of a plurality of template information.
  • the template information is item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and view definition information that specifies a display mode of information about the prediction model. including.
  • the analysis system of the present invention further acquires 2) input data corresponding to each item specified by the item definition information of the specified template information and specifies it by the algorithm definition information of the specified template information.
  • the prediction model generation unit that generates the prediction model by processing the input data acquired based on the specified template information, and 3) the prediction model generated in the display mode specified by the view definition information of the specified template information. It has a display information generation unit that generates display information that represents information.
  • the apparatus of the present invention has 1) an input receiving unit that accepts an input that specifies one of a plurality of template information.
  • the template information is item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and view definition information that specifies a display mode of information about the prediction model. including.
  • the input receiving unit further accepts the specification of the input data corresponding to the item for each item specified by the item definition information of the specified template information.
  • the apparatus of the present invention further has a display information generation unit that generates display information representing information regarding the prediction model in a display mode specified by 2) view definition information of the specified template information.
  • the prediction model is generated by processing the specified input data based on the algorithm specified in the algorithm definition information of the specified template information.
  • the first control method of the present invention is performed by a computer.
  • the control method has 1) an input reception step for accepting an input for designating one of a plurality of template information.
  • the template information is item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and view definition information that specifies a display mode of information about the prediction model. including.
  • the control method further obtains input data corresponding to each item specified in 2) item definition information of the specified template information, and is specified by the algorithm definition information of the specified template information.
  • the prediction model generation step to generate the prediction model by processing the input data acquired based on the algorithm, and 3) the information about the prediction model generated in the display mode specified by the view definition information of the specified template information. It has a display information generation step for generating the display information to be represented.
  • the second control method of the present invention is performed by a computer.
  • the control method has 1) an input reception step for accepting an input for designating one of a plurality of template information.
  • the template information is item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and view definition information that specifies a display mode of information about the prediction model. including.
  • the input acceptance step for each item specified in the item definition information of the specified template information, the specification of the input data corresponding to the item is further accepted.
  • the control method further includes 2) a display information generation step of generating display information representing information about the prediction model in a display mode specified by the view definition information of the designated template information.
  • the prediction model is generated by processing the specified input data based on the algorithm specified in the algorithm definition information of the specified template information.
  • each block diagram unless otherwise specified, each block represents a functional unit configuration rather than a hardware unit configuration.
  • FIG. 1 is a diagram for explaining an outline of the analysis system 2000 of the present embodiment. Note that FIG. 1 is an example for facilitating understanding of the analysis system 2000, and the functions of the analysis system 2000 are not limited to those shown in FIG.
  • the analysis system 2000 analyzes the input data, generates a prediction model, and outputs information about the generated prediction model.
  • the method of generating the prediction model and the mode in which the information is output about the generated prediction model are defined in advance as templates.
  • the information representing this template is referred to as template information 10.
  • the template information 10 includes item definition information 12, algorithm definition information 14, and view definition information 16.
  • the item definition information 12 is information for specifying an item of each input data used for generating a prediction model. For example, suppose that information about a product or information about a store is used to generate a prediction model that predicts the sales of a product for each store. In this case, in the template information 10 for generating the prediction model, the item definition information 12 includes an item corresponding to "information about the product" (such as "product master") and an item corresponding to "information about the store” (information about the store). "Store master” etc.) are included.
  • the algorithm definition information 14 specifies an algorithm for generating a prediction model. For example, suppose that multiple types of AI engines are prepared as program modules that embody algorithms for generating prediction models. In this case, the algorithm definition information 14 indicates information (AI engine identification information) that identifies one of the plurality of types of AI engines. However, the algorithm definition information 14 may include the AI engine itself instead of the identification information of the AI engine. Moreover, the one that embodies the algorithm used to generate the prediction model is not limited to the AI engine.
  • the view definition information 16 specifies a display mode of information regarding the generated prediction model.
  • the view definition information 16 includes a type and structure of a chart used to represent information about a prediction model, an arrangement of a plurality of charts, and the like.
  • the analysis system 2000 accepts the designation of the template information 10 in order to realize the generation of the prediction model using the template information 10 described above.
  • the analysis system 2000 acquires the designated template information 10, and acquires the input data corresponding to each item specified by the item definition information 12 included in the template information 10. Further, the analysis system 2000 processes the acquired input data based on the algorithm specified by the algorithm definition information 14 included in the template information 10 and generates a prediction model. Further, the analysis system 2000 uses the view definition information 16 included in the template information 10 to generate display information.
  • the display information represents information about the prediction model in the display mode specified by the view definition information 16.
  • Example of action effect It is not easy to apply the forecast by data analysis to the field of business. For example, it is difficult to properly select a prediction model generation algorithm. It is also difficult to understand what kind of data is needed to generate a prediction model. Furthermore, it is difficult to grasp the appropriate view of the prediction results.
  • the item definition information 12 in which the items of the input data used for generating the prediction model are defined the algorithm definition information 14 in which the algorithm used for generating the prediction model is defined, and Template information 10 is provided as a set of view definition information 16 in which how to show the analysis result is defined, and the prediction model is generated and the analysis result is browsed by using the template information 10. Therefore, the user can easily perform data analysis related to his / her own business by designating the template information 10 corresponding to the business. Therefore, according to the present invention, prediction using data analysis can be easily performed.
  • the selection of an algorithm suitable for business is performed by a data analysis professional called a data scientist.
  • a data scientist since the number of data scientists is limited, if a data scientist is requested each time data is analyzed, there is a problem that the time required for data analysis becomes long and the cost becomes high.
  • the present invention if used, for example, by creating template information 10 suitable for each business in advance, the data scientist's knowledge can be easily spread to people in the business field. become. Therefore, it is possible to reduce the time and cost required for data analysis. Further, since the knowledge of the data scientist can be summarized in the form of template information 10, it is not necessary for the data scientist to deal with similar work individually, and there is an advantage that the work of the data scientist can be made more efficient.
  • FIG. 2 is a diagram illustrating the functional configuration of the analysis system 2000 of the first embodiment.
  • the analysis system 2000 has an input reception unit 2020, a prediction model generation unit 2040, and a display information generation unit 2060.
  • the input reception unit 2020 accepts the designation of the template information 10.
  • the prediction model generation unit 2040 acquires the input data corresponding to each item specified in the item definition information 12 of the designated template information 10. Further, the prediction model generation unit 2040 generates a prediction model by processing the input data acquired based on the algorithm specified by the algorithm definition information 14 of the designated template information 10.
  • the display information generation unit 2060 generates display information by using the view definition information 16.
  • Each functional component of the analysis system 2000 may be realized by hardware (eg, a hard-wired electronic circuit) that realizes each functional component, or a combination of hardware and software (eg, electronic). It may be realized by a combination of a circuit and a program that controls it).
  • hardware eg, a hard-wired electronic circuit
  • software eg, electronic
  • It may be realized by a combination of a circuit and a program that controls it).
  • a case where each functional component of the analysis system 2000 is realized by a combination of hardware and software will be further described.
  • FIG. 3 is a diagram illustrating a calculator 1000 for realizing the analysis system 2000.
  • the computer 1000 is an arbitrary computer.
  • the computer 1000 is a stationary computer such as a PC (Personal Computer) or a server machine.
  • the computer 1000 is a portable computer such as a smartphone or a tablet terminal.
  • the computer 1000 may be a dedicated computer designed to realize the analysis system 2000, or may be a general-purpose computer. In the latter case, for example, by installing a predetermined application on the computer 1000, the computer 1000 realizes at least a part of the functions of the analysis system 2000.
  • the application is an application composed of a program for realizing any one or more of the functional components of the analysis system 2000.
  • the analysis system 2000 may be composed of a back-end server 40 that generates a prediction model and a front-end server 30 that functions as an interface between the user terminal 20 and the back-end server 40 (see FIG. 5). ..
  • the front-end server 30 and the back-end server 40 are realized by computers 1000 that are different from each other.
  • the computer 1000 that realizes the front-end server 30 is installed with an application for realizing the function that the front-end server 30 has among the functions of the analysis system 2000.
  • an application for realizing the function that the back-end server 40 has among the functions of the analysis system 2000 is installed.
  • the computer 1000 has a bus 1020, a processor 1040, a memory 1060, a storage device 1080, an input / output interface 1100, and a network interface 1120.
  • the bus 1020 is a data transmission line for the processor 1040, the memory 1060, the storage device 1080, the input / output interface 1100, and the network interface 1120 to transmit and receive data to and from each other.
  • the method of connecting the processors 1040 and the like to each other is not limited to the bus connection.
  • the processor 1040 is various processors such as a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), and an FPGA (Field-Programmable Gate Array).
  • the memory 1060 is a main storage device realized by using RAM (Random Access Memory) or the like.
  • the storage device 1080 is an auxiliary storage device realized by using a hard disk, an SSD (Solid State Drive), a memory card, a ROM (Read Only Memory), or the like.
  • the input / output interface 1100 is an interface for connecting the computer 1000 and the input / output device.
  • an input device such as a keyboard and an output device such as a display device are connected to the input / output interface 1100.
  • the network interface 1120 is an interface for connecting the computer 1000 to the communication network.
  • This communication network is, for example, LAN (Local Area Network) or WAN (Wide Area Network).
  • LAN Local Area Network
  • WAN Wide Area Network
  • the analyzer and the user terminal are communicably connected via the network interface 1120.
  • the storage device 1080 stores a program module (a program module that realizes the above-mentioned application) that realizes each functional component of the analysis system 2000.
  • the processor 1040 realizes the function corresponding to each program module by reading each of these program modules into the memory 1060 and executing the program module.
  • FIG. 4 is a diagram illustrating an embodiment of the analysis system 2000.
  • the analysis system 2000 is composed of a front-end server 30 and a back-end server 40.
  • the front-end server 30 provides a user with a Web site for using the analysis system 2000.
  • a user who wants to use the analysis system 2000 first accesses the front-end server 30 by using the user terminal 20.
  • the front-end server 30 provides the user terminal 20 with a Web page for designating template information 10 and input data.
  • the user specifies the template information 10 and the input data by using the provided Web page on the user terminal 20.
  • the front-end server 30 causes the back-end server 40 to execute the analysis by using the designated template information 10 and the input data.
  • the front-end server 30 causes the back-end server 40 to execute analysis by transmitting a predetermined command including information received from the user terminal 20 such as the identification information of the template information 10 to the back-end server 40.
  • the back-end server 40 generates a prediction model by executing the analysis in response to this instruction.
  • the back-end server 40 transmits information representing the analysis result (information about the prediction model) to the front-end server 30.
  • the front-end server 30 generates display information by processing the information received from the back-end server 40 by using the view definition information 16 of the template information 10. Then, the front-end server 30 outputs display information to the user terminal.
  • this display information is a Web page on which information about the prediction model can be browsed in the display mode defined in the view definition information 16 of the template information 10.
  • the display information may be provided as a file such as a PDF file.
  • the implementation form of the analysis system 2000 is not limited to the above-mentioned example.
  • the front-end server 30 and the back-end server 40 may be realized by one computer.
  • the user terminal 20 may have a function equivalent to that of the front-end server 30. That is, a function of accepting the designation of template information 10 and input data, a function of instructing the back-end server 40 to execute analysis, a function of receiving analysis results from the back-end server 40, and display information from the received analysis results.
  • the user terminal 20 is provided with the function to be generated (that is, an application that realizes the function of interacting with the back-end server 40 is installed in the user terminal).
  • the user terminal 20 may have both the functions of the front-end server 30 and the back-end server 40. That is, the analysis system 2000 is realized by a computer operated by the user (applications that realize all the functions of the analysis system 2000 are installed in the user terminal 20).
  • FIG. 5 is a flowchart illustrating a flow of processing executed by the analysis system 2000 of the first embodiment.
  • the input reception unit 2020 receives the designation of the template information 10 (S102).
  • the prediction model generation unit 2040 acquires the designated template information 10 (S104).
  • the prediction model generation unit 2040 acquires the input data corresponding to each item specified by the item definition information 12 included in the acquired template information 10 (S106).
  • the prediction model generation unit 2040 generates a prediction model by analyzing the acquired input data based on the algorithm specified by the algorithm definition information 14 included in the acquired template information 10 (S108).
  • the display information generation unit 2060 generates display information for the generated prediction model (S110).
  • the display information generation unit 2060 outputs display information (S112).
  • the input reception unit 2020 receives the designation of the template information 10 (S102). For example, the input reception unit 2020 provides the user with a list of available template information 10, and causes the user to specify (select) the template information 10.
  • FIG. 6 is a diagram illustrating a search screen 50 that provides a list of template information 10.
  • the search screen 50 is displayed on a display device that can be controlled from the user terminal 20.
  • the search screen 50 is realized by the Web page provided by the front-end server 30 described above.
  • the search screen 50 includes an identification information designation area 52, a name designation area 54, a search button 56, and a search result display area 58.
  • the search button 56 When the search button 56 is pressed while nothing is entered in the identification information designation area 52 or the name designation area 54, the search result display area 58 contains all the template information 10 stored in the template storage device 60. Information is displayed.
  • the identification information includes information about only the template information 10 including the character string input in the identification information designation area 52. , Is displayed in the search result display area 58.
  • the search result is information about only the template information 10 in which the character string input in the name designation area 54 is included in the name. It is displayed in the display area 58.
  • the search for template information 10 is not limited to those using identification information and names.
  • the template information 10 includes information indicating an industry in which the template can be used, a solution provided by using the template, and the like.
  • Industries include, for example, retail, manufacturing, logistics, insurance, or finance.
  • Solutions include, for example, demand forecasting and anomaly detection.
  • an input area for designating an industry or a solution is provided on the search screen 50.
  • the input reception unit 2020 searches for the template information 10 in the designated industry or solution, and displays the information about the corresponding template information 10 in the search result display area 58. This makes it possible to easily select the template information 10 according to the industry and the solution.
  • the input reception unit 2020 may provide a function of searching the template information 10 that the same user has used in the past. By doing so, the user can easily use the template information 10 used in the past again easily.
  • the prediction model generation unit 2040 acquires the designated template information 10 (S104).
  • an existing technique can be used as a specific technique for acquiring the designated template information 10.
  • the prediction model generation unit 2040 acquires the designated template information 10 by reading it from the template storage device 60.
  • the prediction model generation unit 2040 acquires the input data corresponding to the item specified in the item definition information 12 (S106).
  • the item definition information 12 includes information representing an item of input data used for generating a prediction model.
  • Input data items can also be referred to as input data types. For example, various items such as a calendar, a product master, a store master, weather data, sales data, and customer number data can be adopted as items.
  • the prediction model generation unit 2040 acquires specific data representing the customer master (a file in which information about the customer is recorded, a table on a database, etc.).
  • the acquisition of input data is realized by accepting from the user the designation of the input data corresponding to the item specified by the item definition information 12.
  • the user provides the prediction model generation unit 2040 with an input file in which input data for the item is stored for each item specified in the item definition information 12.
  • the provision of the input file is realized, for example, by transmitting the input file from the user terminal 20 to the front-end server 30.
  • an input file is stored in advance in a storage device accessible from the front-end server 30, and identification information (path, etc.) of the input file is specified from the user terminal 20 to the front-end server 30. You may.
  • the method of providing input data is not limited to the method of using files.
  • the data stored in the database is used as the input data.
  • the user may specify the data (for example, a table) in the database in which the data for the item is stored for each item specified by the item definition information 12.
  • the prediction model generation unit 2040 acquires input data from the database according to the designation by the user.
  • the data corresponding to one item may be divided into more detailed items.
  • the data of the item called the product master may include a plurality of types of data such as a product code and a product name for each product.
  • the former item is referred to as a large item and the latter item is referred to as a minor item.
  • minor item is associated with the major item in this way, the association between the major item and the minor item is further defined in the item definition information 12.
  • the prediction model generation unit 2040 When a plurality of small items are associated with a large item, in order for the prediction model generation unit 2040 to correctly interpret the input data obtained in association with the large item, the prediction model generation unit 2040 reduces the input data. It must be possible to interpret each item separately. Therefore, for example, the input data is configured in a format that can be distinguished for each sub-item defined in the item definition information 12. As a data format in which the input data can be distinguished for each sub-item, for example, the csv format can be handled. In general, a csv file can contain a definition of a column name for each column and one or more records with data for each column.
  • the input data can be interpreted separately for each sub-item.
  • the format of the input file does not necessarily have to be the csv format.
  • the input data corresponding to one large item may be treated as a table on the database, and each column of the table may be treated as a small item.
  • the prediction model generation unit 2040 needs to be able to specify the correspondence between the sub-items in the item definition information 12 and the sub-items in the input data. Therefore, for example, the name of each sub-item in the input data is matched in advance with the name of each sub-item in the item definition information 12. By doing so, the prediction model generation unit 2040 can interpret the input data corresponding to the major item for each minor item corresponding to the major item.
  • the input receiving unit 2020 accepts an input that specifies the correspondence between the sub-items in the input data and the sub-items in the item definition information 12.
  • the prediction model generation unit 2040 interprets the input data using the designated correspondence.
  • FIG. 7 is a diagram illustrating a screen 70 for designating the correspondence between the sub-items in the input data and the sub-items in the item definition information 12.
  • the table on the left side shows a list of small items associated with a large item called a product master in the item definition information 12.
  • the table on the right shows a list of minor items in the file goods_master.csv given as input data corresponding to the major item called product master. If a database table is specified instead of a file here, the column name of each column of the specified table is displayed in the table on the right.
  • the user can drag and drop each sub-item shown in the table on the right to a cell in the column called mapping on the left.
  • mapping on the left the association of small items is realized.
  • the user drags and drops the sub-item "group_code” in the table on the right to the cell next to the sub-item "classification code” in the table on the left.
  • the sub-item "classification code” in the item definition information 12 and the sub-item "group_code” in the input file are associated with each other.
  • the user can specify the correspondence between the sub-item in the item definition information 12 and the sub-item in the input data. It is not limited to the method of accepting the designation by. For example, this correspondence may be specified by the order of the sub-items. For example, a rule that "the order of the sub-items in the item definition information 12 and the order of the sub-items in the input data match" is defined in advance. By using this rule, the prediction model generation unit 2040 can grasp the correspondence between the sub-items in the item definition information 12 and the sub-items in the input data.
  • the prediction model generation unit 2040 generates a prediction model by processing the input data based on the algorithm specified in the algorithm definition information 14.
  • various machine learning algorithms such as heterogeneous mixture learning (Patent Document 3), RAPID time series analysis (Non-Patent Document 1), neural network, or SVM (Support Vector Machine) are handled. be able to.
  • the prediction model generation unit 2040 is provided with an AI engine, which is a program module that realizes each of various machine learning algorithms.
  • the algorithm definition information 14 includes identification information that identifies one of the plurality of AI engines.
  • the prediction model generation unit 2040 generates a prediction model by using the AI engine specified by the identification information included in the algorithm definition information 14.
  • the same AI engine may be used for multiple analysis types (regression, discrimination, etc.).
  • the algorithm definition information 14 further includes information indicating the type of analysis to be performed (the type of prediction model to be generated).
  • the type of prediction model to be generated For example, in the template information 10 for generating a prediction model for predicting the sales of a product by heterogeneous mixture learning, it is "AI engine: heterogeneous mixture learning, analysis type: regression".
  • AI engine heterogeneous mixture learning, analysis type: discrimination.
  • the algorithm definition information 14 also includes information indicating the correspondence between the objective variable and the explanatory variable of the AI engine and the input data.
  • the objective variable and the explanatory variable need only have some relation with one or more sub-items specified in the item definition information 12, and do not have to completely match the sub-items.
  • the objective variable is "sales". It can be the difference from the moving average of the numbers.
  • algorithm definition information 14 may further define hyperparameters to be set in the AI engine.
  • Hyperparameters include the depth of trees in heterogeneous learning and the depth of layers in neural networks.
  • the prediction model generation unit 2040 may be provided with information for specifying the preprocessing to be performed on the input data before inputting to the AI engine.
  • the learning accuracy can be improved by performing scale conversion, etc., instead of using the input data as it is. Therefore, in the item definition information 12, such preprocessing to be added to the input data is defined.
  • a process of extracting only a part of input data as a processing target is defined as a preprocessing.
  • a process of converting the input data format into a predetermined format (a format that can be interpreted by the AI engine) defined for each AI engine is also defined as a preprocessing.
  • the algorithm definition information 14 may include a program module itself that realizes preprocessing, and identification information (function name, etc.) and setting information (arguments, etc.) for calling a program that realizes preprocessing. May be included. In the latter case, various preprocessings are provided in advance in the prediction model generation unit 2040. Then, in the algorithm definition information 14, the identification information of the preprocessing to be used and the setting information of the preprocessing are defined so that the prediction model generation unit 2040 executes the desired preprocessing.
  • the prediction model (prediction target) generated by the analysis using one template information 10 is not limited to one.
  • template information 10 for predicting the number of sales is prepared for each store and each product.
  • the target of the forecast is the number of sales for each combination of "stores and products". Therefore, when this template information 10 is used, a prediction model for each store and each product is generated.
  • What kind of prediction model is created by the analysis using one template information 10 is defined in advance by the algorithm definition information 14. That is, in the template information 10 for generating a prediction model for predicting the number of sales for each store and each product, the objective variable is defined in advance in the form of "sales for each store and each product". Therefore, the prediction model generation unit 2040 generates a prediction model for each store and each product.
  • the prediction model generation unit 2040 not only generates the prediction model but also evaluates (verifies) its accuracy.
  • the prediction model generation unit 2040 divides the input data into training data and verification data. Then, the prediction model generation unit 2040 generates a prediction model (learning of the model) using the training data, and verifies the prediction model using the verification data.
  • the prediction model generation unit 2040 may perform so-called cross validation. As a specific method for dividing the input data to generate and evaluate the model in this way, existing technology can be used.
  • the prediction model generation unit 2040 may execute the prediction using the prediction model in addition to the generation and verification of the prediction model.
  • the prediction model generation unit 2040 divides the input data into test data used for prediction and other data (data used for learning and verification). Then, the prediction model generation unit 2040 generates and verifies the prediction model in the latter, and then executes the prediction using the test data.
  • existing technology can be used for a specific method of dividing the input data in this way to generate and verify a prediction model, and to make a prediction.
  • the analysis system 2000 does not necessarily have to generate a prediction model and execute the prediction immediately.
  • the user first uses the analysis system 2000 to generate and verify a prediction model.
  • the generated prediction model is stored in a storage device accessible from the analysis system 2000. After that, when it becomes necessary for the user to make a prediction, the user makes a prediction using a prediction model generated in advance.
  • the method of dividing the input data may be fixedly defined regardless of the template information 10, may be defined by the template information 10, or may be specified by the user. For example, when the input data is divided by the period, the user specifies the period of the input data to be used for each of the learning data, the verification data, and the test data.
  • the execution of the prediction using the prediction model does not necessarily have to be executed by the analysis system 2000.
  • the analysis system 2000 is configured by the front-end server 30 and the back-end server 40 as described above, the prediction using the prediction model may be executed by the user terminal 20.
  • the prediction model generated by the analysis system 2000 is stored in a storage device accessible from the user terminal 20.
  • the display information generation unit 2060 generates display information about the prediction model generated by the prediction model generation unit 2040 in the display mode defined by the view definition information 16 of the designated template information 10 (S110). For example, information about a predictive model is displayed using a visually easy-to-understand diagram. Therefore, the view definition information 16 includes definitions such as a type and a structure for each of one or more figures included in the display information. Any type of diagram such as a table, a scatter plot, a line graph, and a bar graph can be adopted. The structure of the table contains, for example, the definition of each column. The structure of the graph includes, for example, a definition of each axis. Further, the view definition information 16 further includes information that determines the overall arrangement of the plurality of figures and other information.
  • the view definition information 16 corresponding to such a screen will be described while exemplifying a screen that can be generated as display information by the display information generation unit 2060.
  • the display information is composed of a scatter plot screen for displaying a scatter plot, a list screen for displaying a list, and a detail screen for displaying detailed information. These screens are configured so that they can move back and forth between them.
  • a prediction model regression model
  • Cross-validation is used to generate the prediction model. Therefore, a plurality of prediction models are generated for each prediction target. For example, suppose that among the input data, the input data used for learning and verification is divided into five periods. In this case, five prediction models are generated for each prediction target.
  • FIG. 8 is a diagram illustrating a scatter plot screen 80.
  • the horizontal axis of the scatter plot is the number of sales indicated by the input data for verification.
  • the vertical axis of the scatter plot is the verification error rate (error rate in the verification of the prediction model).
  • the error rate referred to here is a value representing the degree of deviation between the predicted value output by the prediction model and the actual value shown in the input data. Specifically, it is a value obtained by dividing the average of the absolute values of the differences between the actual values and the predicted values by the average of the absolute values of the actual values.
  • the representative prediction model is the best prediction model selected by the display information generation unit 2060 based on a predetermined criterion.
  • a standard regarding the magnitude of the error, a criterion regarding the magnitude of the influence of the explanatory variable on the objective variable, and the like can be adopted.
  • the criteria for selecting the best prediction model are defined in, for example, view definition information 16. However, the criteria for selecting the best prediction model may be specified by user operation. Further, the representative prediction model itself may be specified by user operation.
  • the details of the prediction model corresponding to the data point are displayed (pop-up window 82). Specifically, the identification information of the prediction target, the identification information of the best prediction model, the selection criteria of the best prediction model, the evaluation index (error rate, etc.) of each section (learning interval, verification interval, and prediction interval), etc. Information is displayed.
  • FIG. 9 is a diagram illustrating a list screen.
  • the user can transition the screen to the list screen 90 by pressing the list button on the scatter plot screen 80 or the detail screen 130 described later.
  • the list included in the list screen 90 shows information about a representative prediction model for each prediction target.
  • FIG. 10 is a diagram illustrating a scatter plot screen 110 for one prediction target.
  • data points are plotted for each of a plurality of prediction models generated for one prediction target, "store S1, product classification G1".
  • the horizontal axis is the learning error rate (error rate at the end of learning), and the vertical axis is the verification error rate.
  • the details of the prediction model corresponding to the data point are displayed.
  • the best prediction model automatically selected based on a predetermined criterion and the data points of the prediction model specified by the user can be distinguished from other prediction models. It is highlighted (filled).
  • FIG. 11 is a diagram illustrating a list screen 120 for one prediction target.
  • information on a plurality of prediction models generated for one prediction target is displayed in a list.
  • screens showing information about each of the plurality of models are generated only when there are a plurality of prediction models. Therefore, in this case, a screen focusing on one prediction model is displayed as an initial screen, such as the screens illustrated in FIGS. 10 and 11.
  • the display information may include a detailed screen.
  • the detail screen is a screen showing detailed information about one selected prediction target.
  • the transition to the detail screen can be realized, for example, by pressing the detail button with one prediction target selected on the scatter plot screen 80 or the list screen 90 in which information about all prediction targets is displayed. ..
  • the transition to the detail screen can be realized by pressing the detail button on the scatter plot screen 110 or the list screen 120 in which the information about the selected prediction target is displayed.
  • the detail screen may include various information such as information on evaluation indexes, information on explanatory variables, graphs on errors, information on the configuration of prediction models, and information on hyperparameters.
  • the configuration included in the detail screen may differ depending on the type of AI engine used to generate the prediction model.
  • FIG. 12 is a diagram illustrating a detailed screen. This example is a case where heterogeneous learning is used as an AI engine.
  • the detailed screen 130 of FIG. 12 includes an evaluation index area 131, an explanatory variable list area 132, a graph area 134, a gate tree area 135, and a prediction formula area 136.
  • evaluation index area 131 information on the evaluation index is displayed in a list. Specifically, for each evaluation index, the values of the evaluation indexes calculated at the time of learning (at the time of model generation), at the time of verification, and at the time of prediction execution are shown.
  • various ones such as an error rate, a mean square error (RMSE: Root Mean Square Error), and a mean square error (MSE: Mean Square Error) can be used.
  • RMSE Root Mean Square Error
  • MSE Mean Square Error
  • the explanatory variable list area 132 information on each explanatory variable is displayed in a list.
  • NULL indicates how many of the input records containing the data corresponding to the explanatory variable were missing the data.
  • NULL is 3/358 because the data of the latest past holiday elapsed days was missing in 3 of the 358 records. Shown.
  • the minimum and maximum indicate the minimum and maximum values in the input data for the explanatory variable, respectively.
  • explanatory variables indicate category values such as the day of the week and the weather.
  • the category values contained in at least one record are listed.
  • the explanatory variable that indicates the day of the week as the value five types of values "Monday, Tuesday, Thursday, Saturday, Sunday" are shown in the entered 100 records, and for "Wednesday, Friday". Was not shown in any of the records.
  • the explanatory variable list area 132 five category values of "Monday, Tuesday, Thursday, Saturday, and Sunday" are shown for this explanatory variable instead of the minimum and maximum.
  • the graph area 134 a graph showing information about the prediction model is displayed.
  • the horizontal axis represents time.
  • the time change of the predicted value (output of the prediction model) at the time of learning, the time change of the actual value (value of the input data), and the time change of the error are shown.
  • the time change of the formula number used for the prediction is also shown.
  • the Kadoki area 135 shows the overall structure of the prediction model generated by heterogeneous learning.
  • the prediction model generated by heterogeneous mixture learning has a tree structure (gate tree) representing conditional branching, and also has a prediction formula in each leaf. Therefore, in the gate tree area 135, the gate tree and the number of samples (the number of records included in the input data) for the prediction formula in each leaf are shown.
  • the condition shown in the node of the gate tree is described as "condition 1" or the like, but in reality, a specific conditional expression is described in the node. ..
  • Prediction formula area 136 shows the coefficients of each explanatory variable for the selected prediction formula. When "Stack" is selected, the sum of the coefficients of each explanatory variable for all prediction formulas is displayed.
  • the detailed screen 130 of FIG. 12 is a screen suitable when heterogeneous mixture learning is used as the AI engine.
  • the AI engine When using other AI engines, at least some areas will be different.
  • a regression model was generated as a prediction model.
  • the information to be provided for the discriminant model may differ from the information to be provided for the regression model.
  • the evaluation index of the discrimination model is different from the evaluation index of the regression model. Therefore, when the discrimination model is generated, the evaluation index of the discrimination model is displayed on each of the screens described above.
  • the evaluation index of the discrimination model includes the precision rate (true positive / ⁇ true positive + false positive ⁇ ), recall rate (true positive / ⁇ true positive + false negative ⁇ ), and F value (harmonic mean of precision rate and recall rate). ) Etc. can be adopted.
  • each of the above-mentioned screens contains a lot of information on the accuracy of the prediction model, and is particularly suitable for confirming the accuracy of the prediction model.
  • the analysis results (ie, display information) provided by the analysis system 2000 are not limited to those particularly suitable for confirming the accuracy of the prediction model, and may be particularly suitable for other purposes.
  • information particularly suitable for confirming the relationship between the prediction target and each explanatory variable may be provided. For example, suppose that you analyze for each product which advertising medium is effective in increasing sales of that product. In this case, in the prediction model for predicting the sales of the product, the amount of advertisement for each advertising medium can be used as an explanatory variable. Then, by generating a prediction model using a machine learning algorithm (for example, heterogeneous mixture learning) that can quantify the degree to which each explanatory variable contributes to prediction, the degree to which each advertising medium contributes to product sales is calculated. can do. Therefore, for example, the analysis system 2000 can easily confirm the relationship between the sales of the product to be predicted and the advertising medium which is an explanatory variable (the degree to which each advertising medium contributes to sales, etc.) as display information. Provide screen etc.
  • a machine learning algorithm for example, heterogeneous mixture learning
  • Timing to generate display information When handling a plurality of types of screens as display information, a plurality of information having different timings to be displayed may be handled as display information. In such a case, the plurality of pieces of information may be generated at once and collectively provided to the user, or may be generated at different timings and individually provided to the user. In the latter case, for example, the display information generation unit 2060 generates each information at a timing when the information should be displayed (that is, a timing required by the user).
  • the front-end server 30 first generates a Web page representing a screen (initial screen of the analysis result) to be displayed on the display device of the user terminal 20 as an analysis result, and transmits the analysis result to the user terminal 20.
  • a request based on the operation (such as a request indicating the identification information of the pressed button) is transmitted from the user terminal 20 to the front-end server 30.
  • the front-end server 30 generates a Web page representing a new screen (that is, a transition destination screen) to be provided to the user terminal 20 based on the received request, and transmits the generated Web page to the user terminal 20. ..
  • the screen output as display information may differ depending on the type of algorithm used to generate the prediction model. Therefore, for example, as the view definition information 16, information indicating the type of the prediction model generation algorithm can be used.
  • view definition information 16 indicates the identification information of the AI engine used to generate the prediction model (heterogeneous mixture learning, RAPID time series analysis, SVM, etc.) and the analysis type (regression analysis or discriminant analysis).
  • the information necessary for generating the display information hereinafter, the display template
  • the display template the display template in the case where the pair is shown in the view definition information 16 is stored in the storage device. I will do it.
  • the display template indicates the type and structure of the figures to be included in the screen, the arrangement of each figure, and the like.
  • the display information generation unit 2060 reads the display template stored in association with the identification information of the AI engine and the analysis type indicated by the view definition information 16 from the storage device, and generates display information using the read display template. ..
  • the identification information and analysis type of the AI engine can also be used as the algorithm definition information 14.
  • the common information is used in the algorithm definition information 14 and the view definition information 16 in this way, it is not necessary to duplicate these common information in the template information 10, and these common information is referred to as the algorithm definition information 14. It is preferable to treat it as both of the view definition information 16.
  • the display information is particularly suitable for confirming the accuracy of the prediction model (hereinafter, accuracy confirmation type) and for confirming the relationship between the prediction target and each explanatory variable. It can be classified into various types (hereinafter, relationship confirmation type). Therefore, the view definition information 16 may further indicate such a type of purpose of use.
  • a display template is prepared corresponding to each combination of the type of purpose of use, the identification information of the AI engine, and the analysis type, and stored in the storage device.
  • the display information generation unit 2060 reads a display template corresponding to the combination of the type of purpose of use, the identification information of the AI engine, and the analysis type indicated by the view definition information 16 from the storage device, and uses the read display template to display the display information. Generate.
  • the view definition information 16 may further include a parameter that specifies information to be included in the display information. For example, as described above, various evaluation indexes such as an error rate, a mean square error, or a mean square error can be adopted as the evaluation index of the prediction model. Therefore, in the view definition information 16, which of these various evaluation indexes is to be included in the display information is specified. In this case, the display information generation unit 2060 generates display information so that the evaluation index shown in the view definition information 16 is included.
  • a parameter that specifies information to be included in the display information For example, as described above, various evaluation indexes such as an error rate, a mean square error, or a mean square error can be adopted as the evaluation index of the prediction model. Therefore, in the view definition information 16, which of these various evaluation indexes is to be included in the display information is specified. In this case, the display information generation unit 2060 generates display information so that the evaluation index shown in the view definition information 16 is included.
  • An example of other parameters is the name of the evaluation index in the displayed information.
  • an evaluation index called an error rate is used as an index showing the low creditworthiness of a model.
  • the error rate can be specified as the evaluation index to be included in the display information, and "low credit rating of the model" can be specified as the name of the error rate.
  • the template information 10 has the attributes of analysis template name 302, analysis template ID 304, solution 306, outline 308, engine type 310, objective variable 312, output value 314, and item definition 316.
  • the view definition information 16 is omitted. A specific example of the view definition information 16 will be described later.
  • the analysis template name 302 indicates the name of the template information 10. Further, the analysis template ID 304 indicates the identification information of the template information 10. These pieces of information are displayed, for example, on the search screen 50 that allows the user to select the template information 10 (see FIG. 6).
  • Solution 306 indicates the type of solution provided by the analysis performed by template information 10. For example, as described above, the type of solution can be used to search the template information 10.
  • Outline 308 is information indicating an outline of the analysis performed by the template information 10. For example, by displaying this information on the search screen 50 or the like described above, the user can refer to it when selecting the template information 10.
  • the engine type 310, the objective variable 312, and the output value 314 are information constituting the algorithm definition information 14.
  • the engine type 310 indicates the identification information of the AI engine used to generate the prediction model. In FIG. 13 and the like, the name of the AI engine is shown in the engine type 310 for the sake of clarity. However, the engine type 310 can be arbitrary information (identification number, etc.) that can identify the AI engine.
  • the objective variable 312 represents the objective variable of the prediction model to be generated.
  • the objective variable 312 is a variable that is a target for minimizing an error when a prediction model is generated by learning using input data.
  • the output value 314 indicates a value output from the prediction model (prediction result of the prediction model) when the prediction model is used.
  • the objective variable is "the ratio of the number of daily sales to the moving average of the number of sales for each store and each product classification"
  • the output value is "1 for each store and each product classification”. The number of sales in the future ".
  • the "ratio of the number of daily sales to the moving average of the number of sales" is calculated for each store and each product classification so that the error is minimized. Learning is done in.
  • the prediction result output from the prediction model the number of sales one day ahead is output by using the moving average and the ratio to it.
  • Item definition 316 is information corresponding to item definition information 12. That is, the item definition 316 represents an item of data used in the prediction model. Here, in FIG. 13 and the like, the major items are shown in the item definition 316, and the minor items are omitted.
  • a common large item can be used in a plurality of template information 10, it is preferable to prepare a correspondence between the large item and the small item separately from the template information 10. By doing so, the correspondence between the large item and the small item can be managed separately from the template information 10, and the time and effort for the management can be reduced.
  • FIGS. 13 to 19 are templates for the following predictions, respectively.
  • ⁇ Fig. 13 Forecast of the number of sales
  • Fig. 14 Forecast of the number of customers
  • Fig. 15 Forecast of the number of shipments
  • Fig. 16 Forecast of the quantity of ordered products
  • Fig. 17 Forecast of the number of maintenance parts delivered
  • Fig. 18 Forecast of failure Prediction / Fig. 19: Determining whether or not there is a failure
  • FIG. 13 is a diagram illustrating template information 10 used for forecasting the number of sales.
  • the objective variables 312 of the template information T01, T02, and T03 are different from each other.
  • the template information T01 to T03 are "the ratio of the number of sales one day ahead to the moving average of the number of sales for each store and each product category” and “the number of sales for each store and each product category”.
  • the objective variables are "the difference in the number of sales one day ahead with respect to the moving average” and "the ratio of the number of sales one day ahead to the moving average of the number of sales for each store and each product".
  • the output value 314 is common to the template information T01 and T02, while the template information T03 is different from the other two. Specifically, the output value 314 in the template information T01 and T02 is "the number of sales in one day for each store and each product category", whereas the output value 314 in the template information T03 is "for each store and a single product”. The number of sales per day ahead. "
  • the solution 306 is "demand forecast”
  • the engine type 310 is “heterogeneous mixture learning”
  • the item definition 316 is "calendar, product master, store master, weather data, sales data, and customer number data”. Is common to all template information 10.
  • FIG. 14 is a diagram illustrating template information 10 used for predicting the number of customers.
  • the objective variables 312 of the template information T11, T12, and T13 are different from each other.
  • the template information T11 to T13 are "the ratio of the number of customers one day ahead to the moving average of the number of customers for each store” and “the difference in the number of customers one day ahead to the moving average of the number of customers for each store", respectively.
  • the number of customers one day ahead for each store is used as the objective variable.
  • the output value 314 is "the number of customers one day ahead”
  • the solution 306 is “demand forecast”
  • the engine type 310 is “heterogeneous mixture learning”
  • the item definition 316 is "calendar, store master, weather”. The point that it is "data and customer number data” is common to all template information 10.
  • FIG. 15 is a diagram illustrating template information 10 used for predicting the number of shipments.
  • the objective variables 312 of the template information T21, T22, and T23 are different from each other.
  • the template information T21 to T23 are "ratio of the number of shipments one day ahead to the moving average of the number of shipments by shipping center and by product classification” and “shipment by shipping center and by product classification, respectively”.
  • the objective variables are "the difference in the number of shipments one day ahead to the moving average of the number” and "the ratio of the number of shipments one day ahead to the moving average of the number of shipments for each shipping center and each individual product".
  • the template information T21 and T22 are common, while the template information T23 is different from the other two.
  • the output value 314 in the template information T21 and T22 is "the number of shipments in one day ahead for each shipping center and each product classification”
  • the output value 314 in the template information T23 is "for each shipping center and for each product classification”. The number of shipments of each product one day ahead.
  • the solution 306 is "demand forecast”
  • the engine type 310 is “heterogeneous mixture learning”
  • the item definition 316 is "calendar, product master, meteorological data, base master, and shipping data”. It is common to the template information 10 of.
  • FIG. 16 is a diagram illustrating template information 10 used for forecasting the order quantity of products.
  • the objective variable 312 and the output value 314 are both "order quantity in 3 months ahead for each product”.
  • the objective variable 312 and the output value 314 are both "order quantity 6 months ahead for each product”.
  • the input data is divided into learning and evaluation for each product, and a prediction model is generated and evaluated.
  • the input data is randomly divided into the learning and the evaluation, and the prediction model is generated and evaluated.
  • the reference for such data division is included in the algorithm definition information 14 as a hyperparameter given to the AI engine, for example.
  • solution 306 is “demand forecast”
  • engine type 310 is “heterogeneous mixture learning”
  • item definition 316 is "order record, large project order record, product master, empire DI (Diffusion Index), BOJ Tankan”.
  • Monthly exchange, estimate data, calendar, additional calendar ” is common to all template information 10.
  • FIG. 17 is a diagram illustrating template information 10 used for predicting the number of maintenance parts to be delivered.
  • the objective variables 312 of the template information T41 to T43 are different from each other. Specifically, the template information T41 to T43 have "the number of shipments one month ahead by parts", “the number of shipments two months ahead by parts”, and “the number of shipments three months ahead by parts”, respectively. It is used as the objective variable. The same applies to the output value 314.
  • FIG. 18 is a diagram illustrating template information 10 used for predicting a failure of a device.
  • the objective variable 312 and the output value 314 are both "whether or not the device fails 7 days in advance for each device".
  • the prediction models generated by the template information 10 illustrated in FIGS. 13 to 17 are all regression models, while the prediction models generated by the template information 10 illustrated in FIGS. 18 and 19 described later are discrimination models. It becomes.
  • the template information T51 to T53 differ in the learning algorithm of the prediction model.
  • the engine type 310 is heterogeneous learning
  • the engine type 310 is RAPID time series analysis.
  • preprocessing for processing and totaling the failure record of the device and the data of the sensor group mounted on the device is performed on an hourly basis.
  • preprocessing is performed for processing and tabulating the device failure record, the data of the sensor group mounted on the device, and the data of the sensor group around the device on an hourly basis.
  • template information T53 such preprocessing for processing and totaling in hourly units is not performed. The definition of such preprocessing is included in the algorithm definition information 14.
  • FIG. 19 is a diagram illustrating template information 10 used for determining whether or not it is in a failure state.
  • the objective variable 312 and the output value 314 are both "whether or not the device is in a failure state for each device".
  • Template information T61 and T62 have different preprocessing for input data.
  • preprocessing for processing and totaling the failure record of the device and the data of the sensor group mounted on the device is performed on an hourly basis.
  • preprocessing is performed for processing and tabulating the device failure record, the data of the sensor group mounted on the device, and the data of the sensor group around the device on an hourly basis.
  • the engine type 310 is "heterogeneous mixture learning”
  • the solution 306 is "abnormality detection”
  • the item definition 316 is "equipment sensor data, peripheral device sensor data, failure record data”. It is common to the template information 10.
  • the template information 10 can include information such as "analysis type”, "purpose of use type”, “presence or absence of evaluation index”, and "name of evaluation index” as the view definition information 16.
  • the engine type 310 can also be used as the view definition information 16.
  • a display template is prepared in association with the set of analysis type, engine type, and purpose of use type.
  • Presence or absence of use of evaluation index: use all evaluation indexes means to include all evaluation indexes prepared corresponding to the analysis type in the display information. For example, in this case, since the analysis type is regression analysis, all the evaluation indexes (applicability rate, recall rate, F value, etc.) prepared as evaluation indexes for regression analysis are included in the display information. .. Further, "name of evaluation index: no change” means that the name of the evaluation index is used as it is as the name of the evaluation index (for example, the error rate is displayed as it is as "error rate").
  • a part of the contents of the template information 10 may be customized by the user. That is, the user can select a favorite template information 10 from the pre-registered template information 10 and use it as it is, or can customize and use a part of the selected template information 10.
  • Customization of the template information 10 may be performed when executing the analysis, or may be performed in advance prior to the analysis. In the latter case, it is preferable that the analysis system 2000 registers the customized template information 10 as new template information 10 (stores it in the template storage device 60). In this case, when the user specifies the template information 10 (S102), the template information 10 customized by the user can be selected in the same manner as the existing template information 10. Therefore, the user can execute the analysis using the template information 10 by designating the template information 10 customized and registered in advance at the time of analysis.
  • the customized template information 10 can be registered in the analysis system 2000. By doing so, the customized template information 10 can be used for the next and subsequent analysis.
  • the template information includes item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and a view definition that specifies a display mode of information about the prediction model. Including information For each item specified in the item definition information of the specified template information, input data corresponding to the item is acquired, and the said is based on the algorithm specified in the algorithm definition information of the specified template information.
  • a predictive model generator that generates a predictive model by processing the acquired input data
  • An analysis system including a display information generation unit that generates display information representing information related to the generated prediction model in a display mode specified by the view definition information of the specified template information. 2.
  • the input receiving unit outputs a display representing each item specified by the item definition information, and accepts the designation of the input data corresponding to the item for each item.
  • the item definition information indicates one or more major items. A plurality of small items are associated with the large items.
  • the input reception unit 2. Accepts the designation of input data corresponding to the major item, and further accepts the input for specifying the correspondence relationship between the plurality of minor items corresponding to the major item and the plurality of minor items included in the input data.
  • the algorithm definition information includes a machine learning program used to generate the prediction model, or includes identification information of the machine learning program.
  • the analysis system described in any one. The algorithm definition information includes preprocessing for converting the value contained in the input data into the format required by the machine learning program.
  • the analysis system described in. 6 The algorithm definition information includes preprocessing for converting the value included in the input data into a value that improves the accuracy of the prediction model generated by the machine learning program.
  • a display template showing information necessary for generating the display information is defined in association with the combination of the identification information of the algorithm used for generating the prediction model and the type of analysis using the prediction model.
  • the view definition information indicates the identification information of the algorithm and the type of analysis.
  • the display information generation unit acquires the display template corresponding to the combination of the identification information of the algorithm indicated by the view definition information of the specified template information and the analysis type, and uses the display template. 1. Generate the display information.
  • the analysis system according to any one of 6 to 6.
  • the display template is defined in association with a combination of algorithm identification information, type of analysis, and type of purpose for which the display information is used.
  • the view definition information further indicates the purpose of use of the display information.
  • the display information generation unit acquires the display template corresponding to the combination of the identification information of the algorithm indicated by the view definition information of the specified template information, the type of analysis, and the purpose of use of the display information.
  • the analysis system described in. 9. It has an input reception unit that accepts input that specifies one of a plurality of template information.
  • the template information includes item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and a view definition that specifies a display mode of information about the prediction model.
  • the input receiving unit further accepts the designation of the input data corresponding to the item for each item specified by the item definition information of the specified template information. It has a display information generation unit that generates display information representing information about the prediction model in the display mode specified by the view definition information of the specified template information.
  • the prediction model is an apparatus generated by processing the specified input data based on the algorithm specified by the algorithm definition information of the specified template information. 10.
  • the input receiving unit outputs a display representing each item specified by the item definition information, and accepts the designation of the input data corresponding to the item for each item.
  • the item definition information indicates one or more major items. A plurality of small items are associated with the large items.
  • the input reception unit 2. Accepts the designation of input data corresponding to the major item, and further accepts the input for designating the correspondence between the plurality of minor items corresponding to the major item and the plurality of minor items included in the input data.
  • the algorithm definition information includes a machine learning program used to generate the prediction model, or includes identification information of the machine learning program. To 11. The device according to any one. 13.
  • the algorithm definition information includes preprocessing for converting the value contained in the input data into the format required by the machine learning program.
  • the algorithm definition information includes a preprocessing that converts a value contained in the input data into a value that improves the accuracy of the prediction model generated by the machine learning program.
  • the device described in. 15. A display template showing information necessary for generating the display information is defined in association with the combination of the identification information of the algorithm used for generating the prediction model and the type of analysis using the prediction model.
  • the view definition information indicates the identification information of the algorithm and the type of analysis.
  • the display information generation unit acquires the display template corresponding to the combination of the identification information of the algorithm indicated by the view definition information of the specified template information and the analysis type, and uses the display template.
  • the display template is defined in association with a combination of algorithm identification information, type of analysis, and type of purpose for which the display information is used.
  • the view definition information further indicates the purpose of use of the display information.
  • the display information generation unit acquires the display template corresponding to the combination of the identification information of the algorithm indicated by the view definition information of the specified template information, the type of analysis, and the purpose of use of the display information. , 15.
  • the device described in. 17. A control method performed by a computer It has an input reception step that accepts an input that specifies one of a plurality of template information.
  • the template information includes item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and a view definition that specifies a display mode of information about the prediction model.
  • item definition information that specifies an item of each input data used for generating a prediction model
  • algorithm definition information that specifies an algorithm for generating a prediction model
  • view definition that specifies a display mode of information about the prediction model.
  • a predictive model generation step that generates a predictive model by processing the acquired input data,
  • a control method comprising a display information generation step of generating display information representing information regarding the generated prediction model in a display mode specified by the view definition information of the specified template information. 18.
  • a display representing each item specified by the item definition information is output, and for each of the items, the designation of input data corresponding to the item is accepted.
  • the item definition information indicates one or more major items. A plurality of small items are associated with the large items.
  • Accepts the designation of input data corresponding to the major item and further accepts the input for designating the correspondence between the plurality of minor items corresponding to the major item and the plurality of minor items included in the input data.
  • the algorithm definition information includes a machine learning program used to generate the prediction model, or includes identification information of the machine learning program. To 19. The control method according to any one. 21.
  • the algorithm definition information includes preprocessing for converting a value contained in the input data into a format required by the machine learning program.
  • the algorithm definition information includes preprocessing for converting a value contained in the input data into a value that improves the accuracy of the prediction model generated by the machine learning program.
  • a display template showing information necessary for generating the display information is defined in association with the combination of the identification information of the algorithm used for generating the prediction model and the type of analysis using the prediction model.
  • the view definition information indicates the identification information of the algorithm and the type of analysis. In the display information generation step, the display template corresponding to the combination of the identification information of the algorithm and the analysis type indicated by the view definition information of the specified template information is acquired, and the display template is used.
  • the control method according to any one of 22. 24.
  • the display template is defined in association with a combination of algorithm identification information, type of analysis, and type of purpose for which the display information is used.
  • the view definition information further indicates the purpose of use of the display information.
  • the display template corresponding to the combination of the identification information of the algorithm indicated by the view definition information of the specified template information, the type of analysis, and the purpose of use of the display information is acquired.
  • 23. The control method described in. 25.
  • a control method performed by a computer It has an input reception step that accepts an input that specifies one of a plurality of template information.
  • the template information includes item definition information that specifies an item of each input data used for generating a prediction model, algorithm definition information that specifies an algorithm for generating a prediction model, and a view definition that specifies a display mode of information about the prediction model.
  • the specification of the input data corresponding to the item is further accepted. It has a display information generation step of generating display information representing information about a prediction model in a display mode specified by the view definition information of the specified template information.
  • the prediction model is a control method generated by processing the specified input data based on the algorithm specified by the algorithm definition information of the specified template information. 26.
  • a display representing each item specified by the item definition information is output, and for each of the items, the specification of the input data corresponding to the item is accepted.
  • the item definition information indicates one or more major items. A plurality of small items are associated with the large items.
  • the algorithm definition information includes a machine learning program used to generate the prediction model, or includes identification information of the machine learning program. ⁇ 27. The control method according to any one. 29.
  • the algorithm definition information includes preprocessing for converting a value contained in the input data into a format required by the machine learning program. 28.
  • the algorithm definition information includes a preprocessing that converts a value contained in the input data into a value that improves the accuracy of the prediction model generated by the machine learning program. 28.
  • a display template showing information necessary for generating the display information is defined in association with the combination of the identification information of the algorithm used for generating the prediction model and the type of analysis using the prediction model.
  • the view definition information indicates the identification information of the algorithm and the type of analysis.
  • the display template corresponding to the combination of the identification information of the algorithm and the analysis type indicated by the view definition information of the specified template information is acquired, and the display template is used. 2. Generate the display information.
  • the display template is defined in association with a combination of algorithm identification information, type of analysis, and type of purpose for which the display information is used.
  • the view definition information further indicates the purpose of use of the display information.
  • the display template corresponding to the combination of the identification information of the algorithm indicated by the view definition information of the specified template information, the type of analysis, and the purpose of use of the display information is acquired.
  • 31. The control method described in. 33. 17.
  • Template information 12 Item definition information 14 Algorithm definition information 16 View definition information 20 User terminal 30 Front-end server 40 Back-end server 50 Search screen 52 Identification information designation area 54 Name designation area 56 Search button 58 Search result display area 60 Template storage device 70 Screen 80 Scatter plot screen 82 Pop-up window 90 List screen 110 Scatter plot screen 120 List screen 130 Detailed screen 131 Evaluation index area 132 Explanatory variable list area 134 Graph area 135 Kadoki area 136 Predictive formula area 302 Analysis template name 304 Analysis template ID 306 Solution 308 Overview 310 Engine type 312 Objective variable 314 Output value 316 Item definition 1000 Computer 1020 Bus 1040 Processor 1060 Memory 1080 Storage device 1100 Input / output interface 1120 Network interface 2000 Analysis system 2020 Input reception unit 2040 Prediction model generation unit 2060 Display information generation Department

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

テンプレート情報(10)は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報(12)、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報(14)、及び予測モデルに関する情報の表示態様を特定するビュー定義情報(16)を含む。分析システム(2000)は、テンプレート情報(10)の指定を受け付ける。また、分析システム(2000)は、テンプレート情報(10)の項目定義情報(12)で特定される各項目について、その項目に対応する入力データの指定を受け付ける。さらに、分析システム(2000)は、テンプレート情報(10)のアルゴリズム定義情報(14)で特定するアルゴリズムで入力データを処理して、予測モデルを生成する。そして、分析システム(2000)は、テンプレート情報(10)のビュー定義情報(16)で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する。

Description

分析システム、装置、制御方法、及びプログラム
 本発明は予測モデルの生成に関する。
 過去のデータを分析して予測モデルを生成することで、将来の需要や異常発生などを予測する技術が開発されている。例えば、特許文献1には、事業者が位置するエリアに関する予約を行ったユーザの属性に基づいて、その事業者の事業の対象であってなおかつユーザの属性に対応する対象についての需要を予測する技術が開示されている。
特開2019-053737号公報 特開2000-285128号公報 米国特許出願公開第2014/0222741号明細書
福田 健二、「AIがもたらす金融サービスの変革」、NEC技報、vol.69、No.2、2016年、p.16-19
 データ分析による予測を業務の現場に適用することは容易ではない。例えば、予測モデルを生成するための具体的な手法には様々なものが存在する。そのため、これらの様々な手法の中から、適切な手法を選択する必要がある。
 この点、特許文献2は、テンプレートを用いて業務データの分析を容易にする技術が開示されている。しかしながら、特許文献2は、過去のデータを統計的に分析することで過去の実績を把握しやすくするためのものであり、予測を行うことについては言及されていない。そのため、データ分析による予測を容易にするための技術については開示されていない。
 本発明は、上述の課題に鑑みてなされたものであり、その目的の一つは、データ分析による予測を容易化する技術を提供することである。
 本発明の分析システムは、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有する。
 テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
 本発明の分析システムは、さらに、2)指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて取得した入力データを処理することにより、予測モデルを生成する予測モデル生成部と、3)指定されたテンプレート情報のビュー定義情報で特定される表示態様で生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成部と、を有する。
 本発明の装置は、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有する。
 テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
 入力受付部は、指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付ける。
 本発明の装置は、さらに、2)指定されたテンプレート情報のビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成部を有する。
 予測モデルは、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて指定された入力データを処理することで生成される。
 本発明の第1の制御方法は、コンピュータによって実行される。当該制御方法は、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有する。
 テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
 当該制御方法は、さらに、2)指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて取得した入力データを処理することにより、予測モデルを生成する予測モデル生成ステップと、3)指定されたテンプレート情報のビュー定義情報で特定される表示態様で生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップと、を有する。
 本発明の第2の制御方法は、コンピュータによって実行される。当該制御方法は、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有する。
 テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
 入力受付ステップにおいて、指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付ける。
 当該制御方法は、さらに、2)指定されたテンプレート情報のビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップを有する。
 予測モデルは、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて指定された入力データを処理することで生成される。
 本発明によれば、データ分析による予測を容易化する技術が提供される。
本実施形態の分析システムの概要を説明するための図である。 実施形態1の分析システムの機能構成を例示する図である。 分析システムを実現するための計算機を例示する図である。 分析システムの実現形態を例示する図である。 実施形態1の分析システムによって実行される処理の流れを例示するフローチャートである。 テンプレート情報の一覧を提供する検索画面を例示する図である。 入力データにおける小項目と項目定義情報における小項目との対応付けを指定する画面を例示する図である。 散布図画面を例示する図である。 一覧画面を例示する図である。 1つの予測対象についての散布図画面を例示する図である。 1つの予測対象についての一覧画面を例示する図である。 詳細画面を例示する図である。 売上数の予測に利用されるテンプレート情報を例示する図である。 客数の予測に利用されるテンプレート情報を例示する図である。 出荷数の予測に利用されるテンプレート情報を例示する図である。 製品の受注数量の予測に利用されるテンプレート情報を例示する図である。 保守部品の出庫数の予測に利用されるテンプレート情報を例示する図である。 機器の故障の予測に利用されるテンプレート情報を例示する図である。 故障状態か否かの判別に利用されるテンプレート情報を例示する図である。
 以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また各ブロック図において、特に説明がない限り、各ブロックは、ハードウエア単位の構成ではなく機能単位の構成を表している。
[実施形態1]
<概要>
 図1は、本実施形態の分析システム2000の概要を説明するための図である。なお、図1は、分析システム2000に対する理解を容易にするための例示であり、分析システム2000の機能は図1に表されているものに限定されない。
 分析システム2000は、入力データを分析して予測モデルを生成し、生成した予測モデルに関する情報を出力する。ここで、予測モデルの生成方法や、生成した予測モデルについてどのような態様で情報を出力するかは、予めテンプレートとして定められている。以下、このテンプレートを表す情報を、テンプレート情報10と呼ぶ。
 テンプレート情報10は、項目定義情報12、アルゴリズム定義情報14、及びビュー定義情報16を含む。項目定義情報12は、予測モデルの生成に利用する各入力データの項目を特定する情報である。例えば、店舗ごとの商品の売り上げを予測する予測モデルの生成に、商品に関する情報や店舗に関する情報を利用するとする。この場合、予測モデルを生成するためのテンプレート情報10において、項目定義情報12には、「商品に関する情報」に相当する項目(「商品マスタ」など)や、「店舗に関する情報」に相当する項目(「店舗マスタ」など)などが含まれる。
 アルゴリズム定義情報14は、予測モデルを生成するためのアルゴリズムを特定する。例えば、予測モデルを生成するためのアルゴリズムを具現化したプログラムモジュールとして、複数種類の AI エンジンが用意されているとする。この場合、アルゴリズム定義情報14は、それら複数種類の AI エンジンのうちの1つを特定する情報(AI エンジンの識別情報)を示す。ただし、アルゴリズム定義情報14には、AI エンジンの識別情報ではなく、AI エンジンそのものが含まれていてもよい。また、予測モデルの生成に利用するアルゴリズムを具現化したものは、AI エンジンに限定されない。
 ビュー定義情報16は、生成された予測モデルに関する情報の表示態様を特定する。例えばビュー定義情報16には、予測モデルに関する情報を表すために利用する図表の種類や構造、又は複数の図表の配置などが含まれる。
 上述したテンプレート情報10を利用した予測モデルの生成等を実現するため、まず分析システム2000は、テンプレート情報10の指定を受け付ける。分析システム2000は、指定されたテンプレート情報10を取得し、テンプレート情報10に含まれる項目定義情報12によって特定される各項目に対応する入力データを取得する。また、分析システム2000は、テンプレート情報10に含まれるアルゴリズム定義情報14によって特定されるアルゴリズムに基づいて、取得した入力データを処理し、予測モデルを生成する。さらに分析システム2000は、テンプレート情報10に含まれるビュー定義情報16を利用して、表示情報を生成する。表示情報は、ビュー定義情報16で特定される表示態様で、予測モデルに関する情報を表す。
<作用効果の一例>
 データ分析による予測を業務の現場に適用することは容易ではない。例えば、予測モデルの生成アルゴリズムを適切に選択することは難しい。また、予測モデルの生成にどのようなデータが必要なのかを把握することも難しい。さらには、予測結果の適切な見方も、把握が難しい。
 この点、本実施形態の解析システム2000では、予測モデルの生成に利用する入力データの項目が定義された項目定義情報12、予測モデルの生成に利用するアルゴリズムが定義されたアルゴリズム定義情報14、及び分析結果の見せ方が定義されたビュー定義情報16をセットにしたテンプレート情報10が提供され、このテンプレート情報10を利用して予測モデルの生成及び分析結果の閲覧が行われる。そのため、ユーザは、業務に対応したテンプレート情報10を指定することで、自身の業務に関連するデータ分析を容易に行うことができる。よって、本発明によれば、データ分析を利用した予測を容易に行えるようになる。
 ここで、一般に、業務に適したアルゴリズムの選定などは、データサイエンティストと呼ばれるデータ分析のプロフェッショナルによって行われる。しかしながら、データサイエンティストの数は限られているため、データ分析の度にデータサイエンティストに依頼をすると、データ分析に要する時間が長くなってしまったり、コストが高くなってしまったりするという問題がある。
 この点、本発明を利用すれば、例えば、データサイエンティストが予め各業務に適したテンプレート情報10を作成しておくことで、データサイエンティストの知見を業務現場の人に容易に展開することができるようになる。そのため、データ分析に要する時間やコストの削減を実現することができる。また、データサイエンティストの知見をテンプレート情報10という形にまとめることができるため、類似の業務について個別にデータサイエンティストが対応する必要が無くなり、データサイエンティストの業務を効率化できるというメリットもある。
 以下、本実施形態についてさらに詳細を述べる。
<機能構成の例>
 図2は、実施形態1の分析システム2000の機能構成を例示する図である。分析システム2000は、入力受付部2020、予測モデル生成部2040、及び表示情報生成部2060を有する。入力受付部2020は、テンプレート情報10の指定を受け付ける。予測モデル生成部2040は、指定されたテンプレート情報10の項目定義情報12で特定される各項目について、その項目に対応する入力データを取得する。また、予測モデル生成部2040は、指定されたテンプレート情報10のアルゴリズム定義情報14で特定されるアルゴリズムに基づいて取得した入力データを処理することにより、予測モデルを生成する。表示情報生成部2060は、ビュー定義情報16を利用して表示情報を生成する。
<分析システム2000のハードウエア構成の例>
 分析システム2000の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、分析システム2000の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
 分析システム2000は、1つ以上の計算機を用いて実現される。図3は、分析システム2000を実現するための計算機1000を例示する図である。計算機1000は、任意の計算機である。例えば計算機1000は、PC(Personal Computer)やサーバマシンなどといった、据え置き型の計算機である。その他にも例えば、計算機1000は、スマートフォンやタブレット端末などといった可搬型の計算機である。
 計算機1000は、分析システム2000を実現するために設計された専用の計算機であってもよいし、汎用の計算機であってもよい。後者の場合、例えば、計算機1000に対して所定のアプリケーションをインストールすることにより、計算機1000で、分析システム2000の機能の少なくとも一部が実現される。上記アプリケーションは、分析システム2000の機能構成部のいずれか1つ以上を実現するためのプログラムで構成されるアプリケーションである。
 例えば後述するように、分析システム2000は、予測モデルの生成を行うバックエンドサーバ40、及びユーザ端末20とバックエンドサーバ40とのインタフェースとして機能するフロントエンドサーバ30によって構成されうる(図5参照)。この場合、フロントエンドサーバ30とバックエンドサーバ40が、互いに異なる計算機1000によって実現される。この場合、フロントエンドサーバ30を実現する計算機1000には、分析システム2000の機能のうち、フロントエンドサーバ30に持たせる機能を実現するためのアプリケーションがインストールされる。一方で、バックエンドサーバ40を実現する計算機1000には、分析システム2000の機能のうち、バックエンドサーバ40に持たせる機能を実現するためのアプリケーションがインストールされる。
 計算機1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1040などを互いに接続する方法は、バス接続に限定されない。
 プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)などの種々のプロセッサである。メモリ1060は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、メモリカード、又は ROM(Read Only Memory)などを用いて実現される補助記憶装置である。
 入出力インタフェース1100は、計算機1000と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース1100には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
 ネットワークインタフェース1120は、計算機1000を通信網に接続するためのインタフェースである。この通信網は、例えば LAN(Local Area Network)や WAN(Wide Area Network)である。例えば分析装置とユーザ端末は、ネットワークインタフェース1120を介して通信可能に接続される。
 ストレージデバイス1080は、分析システム2000の各機能構成部を実現するプログラムモジュール(前述したアプリケーションを実現するプログラムモジュール)を記憶している。プロセッサ1040は、これら各プログラムモジュールをメモリ1060に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。
<分析システム2000の実現形態の例>
 前述したように、分析システム2000は1つ以上の計算機を用いて実現される。図4は、分析システム2000の実現形態を例示する図である。
 図4において、分析システム2000は、フロントエンドサーバ30及びバックエンドサーバ40で構成されている。例えばフロントエンドサーバ30は、分析システム2000を利用するための Web サイトをユーザに提供する。分析システム2000を利用したいユーザは、まず、ユーザ端末20を利用してフロントエンドサーバ30にアクセスする。フロントエンドサーバ30は、テンプレート情報10や入力データを指定するための Web ページを、ユーザ端末20に提供する。ユーザは、提供された Web ページをユーザ端末20で利用することで、テンプレート情報10や入力データの指定を行う。
 フロントエンドサーバ30は、指定されたテンプレート情報10及び入力データを利用して、バックエンドサーバ40に分析を実行させる。例えばフロントエンドサーバ30は、テンプレート情報10の識別情報等、ユーザ端末20から受信した情報が含まれる所定のコマンドをバックエンドサーバ40へ送信することで、バックエンドサーバ40に分析を実行させる。バックエンドサーバ40は、この指示を受けて分析を実行することで、予測モデルを生成する。
 バックエンドサーバ40は、分析結果を表す情報(予測モデルに関する情報)をフロントエンドサーバ30へ送信する。フロントエンドサーバ30は、バックエンドサーバ40から受信した情報を、テンプレート情報10のビュー定義情報16を利用して加工することで、表示情報を生成する。そして、フロントエンドサーバ30は、ユーザ端末に対して表示情報を出力する。例えばこの表示情報は、テンプレート情報10のビュー定義情報16で定義されている表示態様で予測モデルに関する情報を閲覧することができる Web ページである。その他にも例えば、表示情報は、PDF ファイルなどのファイルとして提供されてもよい。
 分析システム2000の実現形態は、前述した例に限定されない。例えばフロントエンドサーバ30とバックエンドサーバ40は、1つの計算機で実現されてもよい。その他にも例えば、フロントエンドサーバ30と同等の機能をユーザ端末20に持たせてもよい。すなわち、テンプレート情報10や入力データの指定を受け付ける機能、バックエンドサーバ40に対して分析の実行を指示する機能、バックエンドサーバ40から分析結果を受信する機能、及び受信した分析結果から表示情報を生成する機能をユーザ端末20に持たせる(すなわち、バックエンドサーバ40とやりとりする機能を実現するアプリケーションを、ユーザ端末にインストールする)。その他にも例えば、フロントエンドサーバ30とバックエンドサーバ40の機能の双方を、ユーザ端末20に持たせてもよい。すなわち、分析システム2000を、ユーザによって操作される計算機で実現する(分析システム2000の全ての機能を実現するアプリケーションを、ユーザ端末20にインストールする)。
<処理の流れ>
 図5は、実施形態1の分析システム2000によって実行される処理の流れを例示するフローチャートである。入力受付部2020は、テンプレート情報10の指定を受け付ける(S102)。予測モデル生成部2040は、指定されたテンプレート情報10を取得する(S104)。予測モデル生成部2040は、取得したテンプレート情報10に含まれる項目定義情報12によって特定される各項目について、その項目に対応する入力データを取得する(S106)。予測モデル生成部2040は、取得したテンプレート情報10に含まれるアルゴリズム定義情報14によって特定されるアルゴリズムに基づいて、取得した入力データを分析することにより、予測モデルを生成する(S108)。表示情報生成部2060は、生成した予測モデルについて表示情報を生成する(S110)。表示情報生成部2060は、表示情報を出力する(S112)。
<テンプレート情報10の指定及び取得:S102、S104>
 入力受付部2020は、テンプレート情報10の指定を受け付ける(S102)。例えば入力受付部2020は、利用可能なテンプレート情報10の一覧をユーザに提供し、ユーザにテンプレート情報10を指定(選択)させる。
 図6は、テンプレート情報10の一覧を提供する検索画面50を例示する図である。検索画面50は、ユーザ端末20から制御可能なディスプレイ装置に表示される。例えば検索画面50は、前述したフロントエンドサーバ30によって提供される Web ページで実現される。
 検索画面50は、識別情報指定エリア52、名称指定エリア54、検索ボタン56、検索結果表示エリア58を含む。識別情報指定エリア52や名称指定エリア54に何も入力されていない状態で検索ボタン56が押されると、検索結果表示エリア58には、テンプレート記憶装置60に格納されている全てのテンプレート情報10についての情報が表示される。一方、識別情報指定エリア52に入力が行われた状態で検索ボタン56が押されると、その識別情報に、識別情報指定エリア52に入力された文字列が含まれるテンプレート情報10のみについての情報が、検索結果表示エリア58に表示される。また、名称指定エリア54に入力が行われた状態で検索ボタン56が押されると、その名称に、名称指定エリア54に入力された文字列が含まれるテンプレート情報10のみについての情報が、検索結果表示エリア58に表示される。
 なお、テンプレート情報10の検索は、識別情報や名称を用いるものに限定されない。例えば、テンプレート情報10に、そのテンプレートが利用されうる業界や、そのテンプレートを用いて提供されるソリューションなどを表す情報を含めておく。業界としては、例えば、リテール、製造、物流、保険、又は金融などといったものが含まれる。ソリューションとしては、例えば、需要予測や異常検知などが含まれる。これらの情報を利用する場合、検索画面50において、業界やソリューションを指定する入力エリアを設ける。そして、入力受付部2020は、指定された業界やソリューションでテンプレート情報10を検索し、該当するテンプレート情報10についての情報を検索結果表示エリア58に表示させる。これにより、業界やソリューションに応じてテンプレート情報10を容易に選択できるようになる。
 その他にも例えば、入力受付部2020は、同一のユーザが過去に利用したテンプレート情報10を検索する機能を提供してもよい。こうすることで、ユーザは、過去に利用したテンプレート情報10を再度容易に利用することができる。
 予測モデル生成部2040は、指定されたテンプレート情報10を取得する(S104)。ここで、指定されたテンプレート情報10を取得する具体的な技術には、既存の技術を利用することができる。例えば予測モデル生成部2040は、指定されたテンプレート情報10をテンプレート記憶装置60から読み出すことで取得する。
<入力データの取得:S106>
 予測モデル生成部2040は、項目定義情報12で特定される項目に対応する入力データを取得する(S106)。項目定義情報12は、予測モデルの生成に利用する入力データの項目を表す情報が含まれる。入力データの項目は、入力データの種別ともいうことができる。例えば、項目としては、カレンダー、商品マスタ、店舗マスタ、気象データ、売上データ、又は客数データなどといった様々なものを採用できる。例えばテンプレート情報10に顧客マスタという項目が含まれる場合、予測モデル生成部2040は、顧客マスタを表す具体的なデータ(顧客に関する情報が記録されているファイルやデータベース上のテーブルなど)を取得する。
 例えば入力データの取得は、項目定義情報12によって特定される項目に対応する入力データの指定をユーザから受け付けることによって実現される。例えばユーザは、項目定義情報12で特定される項目ごとに、その項目についての入力データが格納されている入力ファイルを、予測モデル生成部2040へ提供する。入力ファイルの提供は、例えば入力ファイルをユーザ端末20からフロントエンドサーバ30へ送信することで実現される。そのほかにも例えば、フロントエンドサーバ30からアクセス可能な記憶装置に予め入力ファイルを格納しておき、ユーザ端末20からフロントエンドサーバ30へ対し、その入力ファイルの識別情報(パスなど)の指定を行ってもよい。
 入力データの提供方法は、ファイルを利用する方法に限定されない。例えば、入力データとして、データベースに格納されているデータを利用するとする。この場合、例えばユーザは、項目定義情報12によって特定される項目ごとに、その項目についてのデータが格納されているデータベース内のデータ(例えばテーブル)を指定してもよい。予測モデル生成部2040は、ユーザによる指定に従い、データベースから入力データを取得する。
 ここで、1つの項目に対応するデータが、さらに細かい項目に分かれることがある。例えば、商品マスタという項目のデータは、各商品について、商品コードや商品名などといった複数の種類のデータを含みうる。以下、1つの項目に対してさらに細かい複数の項目が対応づけられている場合、前者の項目を大項目、後者の項目を小項目と呼ぶ。このように大項目に複数の小項目が対応づけられている場合、項目定義情報12において、大項目と小項目の対応付けがさらに定義される。
 大項目に複数の小項目が対応づけられる場合、大項目に対応づけて得られた入力データを予測モデル生成部2040が正しく解釈するためには、予測モデル生成部2040が、その入力データを小項目ごとに分けて解釈できる必要がある。そのために、例えば入力データを、項目定義情報12で定義される小項目ごとに区別可能な形式で構成しておく。小項目ごとに入力データを区別可能なデータ形式としては、例えば、csv 形式を扱うことができる。一般に、csv ファイルには、各列の列名の定義と、各列それぞれにデータを有する1つ以上のレコードとを含むことができる。そこで、各列が1つの小項目を表すように入力データを構成することで、入力データを小項目ごとに区別して解釈することができる。ただし、入力ファイルの形式は、必ずしも csv 形式である必要はない。また、1つの大項目に対応する入力データをデータベース上のテーブルとし、そのテーブルの各列を小項目として扱うようにしてもよい。
 予測モデル生成部2040は、項目定義情報12における小項目と、入力データにおける小項目との対応関係を特定できる必要がある。そこで例えば、入力データにおける各小項目の名称を、項目定義情報12における各小項目の名称と予め一致させておく。こうすることで、予測モデル生成部2040は、大項目に対応する入力データを、その大項目に対応する小項目ごとに解釈することができる。
 ただし、入力データにおける各小項目の名称は、項目定義情報12における小項目の名称と一致していなくてもよい。この場合、例えば入力受付部2020が、入力データにおける小項目と、項目定義情報12における小項目との対応付けを指定する入力を受け付ける。予測モデル生成部2040は、指定された対応付けを用いて、入力データを解釈する。
 図7は、入力データにおける小項目と項目定義情報12における小項目との対応付けを指定する画面70を例示する図である。画面70において、左側の表は、項目定義情報12において、商品マスタという大項目に対応付けられている小項目の一覧を示している。一方、右側の表は、商品マスタという大項目に対応する入力データとして与えられた、goods_master.csv というファイルにおける小項目の一覧を示している。なお、ここでファイルの代わりにデータベースのテーブルを指定した場合、右側の表には、指定したテーブルの各列の列名が表示される。
 画面70において、ユーザは、右側の表が示す各小項目を、左側のマッピングという列のセルへドラッグ&ドロップすることができる。これにより、小項目の対応付けが実現される。例えばこの例において、ユーザは、右側の表の「group_code」という小項目を、左側の表の「分類コード」という小項目の隣のセルへドラッグ&ドロップしている。これにより、項目定義情報12における「分類コード」という小項目と、入力ファイルにおける「group_code」という小項目とが対応づけられる。
 なお、項目定義情報12における小項目の名称と入力データにおける小項目の名称とが一致しない場合において、項目定義情報12における小項目と入力データにおける小項目との対応関係を特定する方法は、ユーザによる指定を受け付ける方法に限定されない。例えば、この対応関係は、小項目の順序によって特定されてもよい。例えば、「項目定義情報12における小項目の順序と、入力データにおける小項目の順序は一致する」というルールを予め定めておく。このルールを利用することで、予測モデル生成部2040は、項目定義情報12における小項目と、入力データにおける小項目との対応関係を把握することができる。
<予測モデルの生成:S108>
 予測モデル生成部2040は、アルゴリズム定義情報14で特定されるアルゴリズムに基づいて入力データを処理することで、予測モデルを生成する。予測モデルを生成するアルゴリズムとしては、例えば、異種混合学習(特許文献3)、RAPID 時系列分析(非特許文献1)、ニューラルネットワーク、又は SVM(Support Vector Machine)などといった種々の機械学習アルゴリズムを扱うことができる。
 例えば予測モデル生成部2040には、様々な機械学習アルゴリズムそれぞれについて、そのアルゴリズムを実現するプログラムモジュールである AI エンジンを設けておく。この場合、例えばアルゴリズム定義情報14には、これら複数の AI エンジンのうちの1つを特定する識別情報が含まれる。予測モデル生成部2040は、アルゴリズム定義情報14に含まれる識別情報で特定される AI エンジンを利用して、予測モデルの生成を行う。
 ここで、同一の AI エンジンを複数の分析タイプ(回帰や判別など)で利用できることもある。この場合、アルゴリズム定義情報14には、行いたい分析のタイプ(生成したい予測モデルのタイプ)を示す情報をさらに含めておく。例えば、商品の売上げを予測する予測モデルを異種混合学習で生成するためのテンプレート情報10では、「AI エンジン:異種混合学習、分析タイプ:回帰」となる。一方、将来的に機器が故障するか否かを予測する予測モデルを異種混合学習で生成するためのテンプレート情報10では、「AI エンジン:異種混合学習、分析タイプ:判別」となる。
 また、アルゴリズム定義情報14には、AI エンジンの目的変数や説明変数と、入力データとの対応付けを表す情報も含めておく。例えば、項目定義情報12で特定される小項目のうち、どの小項目を目的変数として用いるか、及びどの小項目を説明変数として用いるかが、アルゴリズム定義情報14に定められている。ただし、目的変数や説明変数は、項目定義情報12で特定される1つ以上の小項目と何らかの関係を持てばよく、小項目と完全に一致する必要はない。例えば、商品の売上数の予測において、売上実績データに商品の売上数を含めておき(売上実績データという大項目に対応する小項目に「売上数」を含めておき)、目的変数を「売上数の移動平均からの差分」とすることができる。
 また、アルゴリズム定義情報14には、AI エンジンに設定するハイパーパラメータがさらに定められていてもよい。ハイパーパラメータとしては、異種混合学習における木の深さや、ニューラルネットワークにおける層の深さなどが挙げられる。
 さらに、予測モデル生成部2040には、AI エンジンへ投入する前に入力データに対して施す前処理を特定する情報が定められていてもよい。AI エンジンで予測モデルを生成する際、入力データをそのまま用いるのではなく、スケール変換等を行うことで、学習精度を向上させることができる。そこで、項目定義情報12において、入力データに対して加えるべきこのような前処理を定義しておく。その他にも例えば、入力データの一部のみを処理対象として抽出する処理なども、前処理として定義しておく。その他にも例えば、入力データのフォーマットを AI エンジンごとに定められている所定のフォーマット(AI エンジンが解釈可能なフォーマット)に変換する処理も、前処理として定義しておく。
 なお、アルゴリズム定義情報14には、前処理を実現するプログラムモジュールそのものが含まれていてもよいし、前処理を実現するプログラムを呼び出すための識別情報(関数名など)や設定情報(引数など)が含まれていてもよい。後者の場合、種々の前処理を予め予測モデル生成部2040に設けておく。そして、アルゴリズム定義情報14において、利用したい前処理の識別情報及びその前処理の設定情報を定めておくことで、予測モデル生成部2040によって所望の前処理が実行されるようにする。
 ここで、1つのテンプレート情報10を利用した分析で生成される予測モデル(予測の対象)は、1つに限定されない。例えば、店舗ごと及び商品ごとに売上数を予測するためのテンプレート情報10が用意されているとする。この場合、予測の対象は、「店舗、商品」の組み合わせごとの売上数となる。よって、このテンプレート情報10を利用すると、店舗ごと及び商品ごとの予測モデルが生成される。
 例えば簡単な例として、商品G1~G3という3種類の商品があり、店舗S1~S2という2つの店舗があるとする。この場合、6つの予測対象があるため、6個の予測モデルが生成される。具体的には、店舗S1とS2のそれぞれについて、商品G1~G3それぞれの売上数の予測モデルが生成される。
 1つのテンプレート情報10を利用した分析によってどのような予測モデルが作られるかは、アルゴリズム定義情報14によって予め定義される。すなわち、店舗ごと及び商品ごとの売上数を予測する予測モデルを生成するためのテンプレート情報10では、「店舗ごと及び商品ごとの売り上げ」などといった形で、目的変数が予め定義されている。そのため、予測モデル生成部2040により、店舗ごと及び商品ごとに予測モデルが生成される。
 ここで、予測モデル生成部2040は、予測モデルの生成だけでなく、その精度の評価(検証)も行うことが好適である。この場合、例えば予測モデル生成部2040は、入力データを学習用データと検証データに分割する。そして、予測モデル生成部2040は、学習用データを利用して予測モデルの生成(モデルの学習)を行い、検証データを利用して予測モデルの検証を行う。その他にも例えば、予測モデル生成部2040は、いわゆるクロスバリデーションを行ってもよい。このように入力データを分割してモデルの生成と評価を行う具体的な方法は、既存の技術を利用することができる。
 さらに、予測モデル生成部2040は、予測モデルの生成や検証に加え、予測モデルを利用した予測を実行してもよい。この場合、例えば予測モデル生成部2040は、入力データを、予測に利用するテストデータと、それ以外のデータ(学習と検証に利用するデータ)に分割する。そして、予測モデル生成部2040は、後者で予測モデルの生成と検証を行った後、テストデータを利用して予測を実行する。なお、このように入力データを分割して、予測モデルの生成と検証、及び予測を行う具体的な方法には、既存の技術を利用することができる。
 ただし、分析システム2000は、必ずしも、予測モデルを生成してすぐに予測を実行する必要はない。例えばユーザは、まず、分析システム2000を利用して、予測モデルの生成と検証を行っておく。生成された予測モデルは、分析システム2000からアクセス可能な記憶装置に格納される。その後、ユーザは、予測する必要が生じた際に、予め生成しておいた予測モデルを利用して、予測を行う。
 ここで、入力データの分割方法は、テンプレート情報10によらずに固定で定められていてもよいし、テンプレート情報10で定められていてもよいし、ユーザによって指定されてもよい。例えば入力データを期間で分割する場合、ユーザは、学習用データ、検証データ、テストデータそれぞれについて、利用する入力データの期間を指定する。
 なお、予測モデルを利用した予測の実行は、必ずしも分析システム2000で実行される必要はない。例えば前述したようにフロントエンドサーバ30とバックエンドサーバ40で分析システム2000が構成される場合に、予測モデルを利用した予測については、ユーザ端末20で実行されるようにしてもよい。この場合、分析システム2000によって生成された予測モデルを、ユーザ端末20からアクセス可能な記憶装置に格納しておく。
<表示情報の生成:S110>
 表示情報生成部2060は、指定されたテンプレート情報10のビュー定義情報16によって定義される表示態様で、予測モデル生成部2040によって生成された予測モデルについての表示情報を生成する(S110)。例えば予測モデルに関する情報は、視覚的に把握しやすい図を使って表示される。そこで、ビュー定義情報16には、表示情報に含まれる1つ以上の図それぞれについて、種類や構造などの定義が含まれる。図の種類には、テーブル、散布図、折れ線グラフ、及び棒グラフなどといった任意の種類を採用できる。テーブルの構造には、例えば、各列の定義が含まれる。グラフの構造には、例えば、各軸の定義が含まれる。また、ビュー定義情報16には、複数の図やその他の情報の全体的な配置を定める情報がさらに含まれる。
 以下、表示情報生成部2060が表示情報として生成しうる画面を例示しながら、そのような画面に対応するビュー定義情報16について説明する。
 例えば表示情報は、散布図を表示する散布図画面、一覧表を表示する一覧画面、及び詳細情報を表示する詳細画面で構成される。これらの画面は、互いに行き来できるように構成される。以下で説明する例では、店舗S1~S3それぞれに関し、商品分類G1からG3それぞれについての売上数を予測する予測モデル(回帰モデル)が生成されている。すなわち、「店舗、商品分類」の各組み合わせに対する売上数が予測対象となっている。また予測モデルの生成にはクロスバリデーションが用いられている。そのため、予測対象ごとに複数の予測モデルが生成されている。例えば、入力データのうち、学習と検証に用いる入力データを、5つの期間に分割するとする。この場合、予測対象ごとに、5つの予測モデルが生成される。
 図8は、散布図画面80を例示する図である。散布図の横軸は、検証用の入力データが示す売上数である。散布図の縦軸は、検証誤差率(予測モデルの検証における誤差率)としている。なお、ここでいう誤差率とは、予測モデルが出力した予測値と、入力データに示されている実績値との乖離度合いを表した値である。具体的には、実績値と予測値の差分の絶対値の平均を、実績値の絶対値の平均で割った値である。
 散布図には、予測対象ごと(店舗と商品分類の組み合わせごと)に、代表とする1つの予測モデルについて、データ点がプロットされている。代表とする予測モデルは、所定の基準に基づいて表示情報生成部2060が選択した最良の予測モデルである。このような基準としては、誤差の大きさに関する基準や、説明変数の目的変数への影響度の大きさに関する基準などを採用できる。
 最良の予測モデルを選択する基準は、例えば、ビュー定義情報16に定められている。ただし、最良の予測モデルを選択する基準は、ユーザ操作によって指定可能であってもよい。また、代表とする予測モデル自体も、ユーザ操作によって指定可能であってもよい。
 図8において、ユーザがデータ点を選択する(例えばクリックする)と、そのデータ点に対応する予測モデルの詳細が表示される(ポップアップウインドウ82)。具体的には、予測対象の識別情報、最良の予測モデルの識別情報、最良の予測モデルの選択基準、各区間(学習区間、検証区間、及び予測区間)の評価指標(誤差率など)などの情報が表示される。
 図9は、一覧画面を例示する図である。ユーザは、散布図画面80や後述する詳細画面130において、一覧ボタンを押すことで、一覧画面90へ画面を遷移させることができる。一覧画面90に含まれる一覧表は、予測対象ごとに、代表の予測モデルに関する情報を示している。
 ここで、散布図画面80や一覧画面90で1つの予測対象を選択することにより、その予測対象について生成された全ての予測モデルの情報を閲覧できる画面に遷移できるようにしてもよい。以下、図10と図11を用いて説明する。
 図10は、1つの予測対象についての散布図画面110を例示する図である。この散布図では、「店舗S1、商品分類G1」という1つの予測対象について生成された複数の予測モデルのそれぞれについて、データ点がプロットされている。横軸は学習誤差率(学習終了時における誤差率)であり、縦軸は検証誤差率である。この図でも、ユーザがデータ点を選択することで、そのデータ点に対応する予測モデルの詳細が表示される。
 なお、図10の散布図では、所定の基準に基づいて自動で選択される最良の予測モデルと、ユーザによって指定された予測モデルについてのデータ点は、それぞれ他の予測モデルと識別できるように、強調表示(塗りつぶし)されている。
 図11は、1つの予測対象についての一覧画面120を例示する図である。一覧画面120に含まれる一覧表では、1つの予測対象について生成された複数の予測モデルに関する情報が一覧表示されている。
 なお、図8や図9で例示した画面のように、複数のモデルそれぞれについての情報を示す画面は、予測モデルが複数ある場合のみ生成される。そのため、この場合、図10や図11で例示した画面のように、1つの予測モデルに着目した画面が初期画面として表示されるようにする。
 前述したように、表示情報には、詳細画面も含まれうる。詳細画面は、選択された1つの予測対象について、詳細な情報を示す画面である。詳細画面への遷移は、例えば、全ての予測対象についての情報が表示されている散布図画面80や一覧画面90において、1つの予測対象が選択された状態で詳細ボタンを押すことにより、実現できる。その他にも例えば、詳細画面への遷移は、選択された予測対象についての情報が表示されている散布図画面110や一覧画面120において、詳細ボタンを押すことで実現できる。
 詳細画面には、評価指標に関する情報、説明変数に関する情報、誤差に関するグラフ、予測モデルの構成に関する情報、ハイパーパラメータに関する情報など、様々な情報が含まれうる。詳細画面に含まれる構成は、予測モデルの生成に利用された AI エンジンの種類などによって異なりうる。
 図12は、詳細画面を例示する図である。この例は、AI エンジンとして異種混合学習が利用されたケースである。図12の詳細画面130は、評価指標エリア131、説明変数一覧エリア132、グラフエリア134、門木エリア135、予測式エリア136を含んでいる。
 評価指標エリア131では、評価指標に関する情報が一覧表示されている。具体的には、各評価指標について、学習時(モデル生成時)、検証時、予測実行時のそれぞれについて算出された評価指標の値が示されている。評価指標としては、誤差率、平均平方二乗誤差(RMSE: Root Mean Square Error)、平均二乗誤差(MSE: Mean Square Error)などといった様々なものを利用することができる。
 説明変数一覧エリア132では、各説明変数に関する情報が一覧表示されている。ここで、「NULL」は、その説明変数に対応するデータが含まれる入力のレコードのうち、いくつにおいてそのデータが欠落していたかを示している。例えば、「直近過去休日経過日数」という説明変数において、NULL が 3/358 となっているのは、358レコードのうち、3つのレコードにおいて、直近過去休日経過日数のデータが欠落していたことを示している。最小と最大はそれぞれ、その説明変数についての入力データにおける最小値と最大値を示している。
 なお、説明変数によっては、曜日や天気など、カテゴリ値を示すものがある。この場合、最小と最大の代わりに、少なくとも1つのレコードに含まれていたカテゴリ値が列挙される。例えば、値として曜日を示す説明変数について、入力された100個のレコードの中に、「月、火、木、土、日」という5種類の値が示されており、「水、金」についてはいずれのレコードにも示されていなかったとする。この場合、説明変数一覧エリア132において、この説明変数については、最小と最大の代わりに、「月、火、木、土、日」という5つのカテゴリ値が示される。
 グラフエリア134には、予測モデルに関する情報を表すグラフが表示される。横軸は時間を表している。図12のグラフエリア134には、学習時における予測値(予測モデルの出力)の時間変化、実績値(入力データの値)の時間変化、及び誤差の時間変化が示されている。また、「式番号」が選択されているため、予測に利用される式番号の時間変化(条件に合致する予測式の時間変化)も示されている。
 門木エリア135には、異種混合学習で生成される予測モデルの全体構造が示されている。異種混合学習で生成される予測モデルは、条件分岐を表すツリー構造(門木)を持ち、なおかつ、各リーフにおいて予測式を持つ。そこで、門木エリア135には、門木と、各リーフにおける予測式についてのサンプル数(入力データに含まれるレコード数)が示されている。なお、図示の関係上、図12では、門木のノード内に示される条件を「条件1」などと記載しているが、実際には、ノード内には具体的な条件式が記載される。
 予測式エリア136は、選択された予測式について、各説明変数の係数を示す。また、「積み上げ」が選択されると、各説明変数の係数を全ての予測式について合計した値が表示される。
 前述したように、図12の詳細画面130は、AI エンジンとして異種混合学習を利用した場合に適した画面である。その他の AI エンジンを利用した場合には、少なくとも一部のエリアが異なるものとなる。例えば、RAPID 時系列分析の場合、門木エリアや予測式エリアに代えて、学習の収束状況を示すグラフや、ハイパーパラメータに関する情報を詳細画面に含めることが好適である。なお、ハイパーパラメータに関する情報については、異種混合学習も含め、その他の AI エンジンを利用した場合においても、詳細画面に含まれることが好適である。
 前述した例では、予測モデルとして回帰モデルが生成されていた。この点、判別モデルについて提供すべき情報は、回帰モデルについて提供すべき情報と異なりうる。例えば判別モデルの評価指標は、回帰モデルの評価指標と異なる。そこで、判別モデルが生成される場合には、前述した各画面において、判別モデルの評価指標が表示される。例えば判別モデルの評価指標には、適合率(true positive/{true positive + false positive})や再現率(true positive/{true positive + false negative})、F 値(適合率と再現率の調和平均)などを採用できる。
 ここで、前述した各画面は、予測モデルの精度に関する情報が多く含まれており、予測モデルの精度の確認に特に好適な画面である。しかしながら、分析システム2000によって提供される分析結果(すなわち、表示情報)は、予測モデルの精度の確認に特に好適なものだけに限定されず、別の目的に特に好適なものであってもよい。
 例えば表示情報として、予測対象と各説明変数との関係性を確認することに特に好適な情報を提供してもよい。例えば、商品ごとに、どの広告媒体がその商品の売上げ増加に効果的であるかの分析を行うとする。この場合、商品の売上げを予測する予測モデルにおいて、広告媒体ごとの宣伝量などを説明変数として利用することができる。そして、各説明変数が予測に寄与する度合いを定量化可能な機械学習アルゴリズム(例えば、異種混合学習)を用いて予測モデルを生成することで、各広告媒体が商品の売上げに寄与する度合いを算出することができる。そこで例えば、分析システム2000は、表示情報として、予測対象である商品の売上げと説明変数である広告媒体との関係性(各広告媒体が売上げに寄与する度合いなど)を容易に確認することができる画面などを提供する。
<<表示情報を生成するタイミングについて>>
 表示情報として複数種類の画面を扱う場合など、表示情報として、表示すべきタイミングが互いに異なる複数の情報を扱うことがある。このような場合、これら複数の情報は、一度に生成されてまとめてユーザに提供されてもよいし、それぞれ異なるタイミングで生成されて個別にユーザへ提供されてもよい。後者の場合、例えば表示情報生成部2060は、各情報を、その情報が表示されるべきタイミング(すなわち、ユーザが必要とするタイミング)で生成する。
 例えば分析システム2000が、図4で例示した構成を持つとする。この場合、まずフロントエンドサーバ30は、分析結果として最初にユーザ端末20のディスプレイ装置に表示されるべき画面(分析結果の初期画面)を表す Web ページを生成し、ユーザ端末20へ送信する。その後、ユーザによって画面を遷移させる操作が行われたら、その操作に基づくリクエスト(押されたボタンの識別情報が示されるリクエストなど)が、ユーザ端末20からフロントエンドサーバ30へ送信される。フロントエンドサーバ30は、受信したリクエストに基づいて、ユーザ端末20へ提供すべき新たな画面(すなわち、遷移先の画面)を表す Web ページを生成し、生成した Web ページをユーザ端末20へ送信する。
<<ビュー定義情報16について>>
 前述したように、表示情報として出力される画面は、予測モデルの生成に利用されるアルゴリズムの種類によって異なりうる。そこで例えば、ビュー定義情報16として、予測モデルの生成アルゴリズムの種類を表す情報を利用することができる。例えば、ビュー定義情報16は、予測モデルの生成に利用する AI エンジンの識別情報(異種混合学習、RAPID 時系列分析、又は SVM など)と、分析タイプ(回帰分析又は判別分析)を示す。この場合、AI エンジンの識別情報と分析タイプのペアごとに、そのペアがビュー定義情報16に示されているケースにおいて表示情報の生成に必要な情報(以下、表示テンプレート)を、記憶装置に格納しておく。表示テンプレートは、画面に含める図の種類や構造、各図の配置などを示す。表示情報生成部2060は、ビュー定義情報16が示す AI エンジンの識別情報と分析タイプに対応づけて格納されている表示テンプレートを上記記憶装置から読み出し、読み出した表示テンプレートを用いて表示情報を生成する。
 なお、前述したように、AI エンジンの識別情報や分析タイプは、アルゴリズム定義情報14としても利用されうる。このようにアルゴリズム定義情報14とビュー定義情報16で共通の情報を利用する場合には、これら共通の情報を重複してテンプレート情報10に含める必要はなく、これら共通の情報をアルゴリズム定義情報14とビュー定義情報16の双方として扱うようにすることが好適である。
 さらに、前述したように、表示情報は、予測モデルの精度の確認に特に好適なタイプ(以下、精度確認タイプ)のものや、予測対象と各説明変数との関係性を確認することに特に好適なタイプ(以下、関係性確認タイプ)のものなどに分類できる。そこで、ビュー定義情報16は、このような利用目的のタイプをさらに示してもよい。この場合、例えば、利用目的のタイプ、AI エンジンの識別情報、及び分析タイプの各組み合わせに対応づけて表示テンプレートを用意し、記憶装置に格納しておく。表示情報生成部2060は、ビュー定義情報16が示す利用目的のタイプ、AI エンジンの識別情報、及び分析タイプの組み合わせに対応する表示テンプレートを記憶装置から読み出し、読み出した表示テンプレートを用いて表示情報を生成する。
 ビュー定義情報16には、さらに、表示情報に含める情報を指定するパラメータが含まれてもよい。例えば前述したように、予測モデルの評価指標には、誤差率、平均平方二乗誤差、又は平均二乗誤差などといった様々なものを採用しうる。そこで、ビュー定義情報16において、これら様々な評価指標のうちのどれを表示情報に含めるかを指定しておく。この場合、表示情報生成部2060は、ビュー定義情報16に示されている評価指標が含まれるように、表示情報を生成する。
 その他のパラメータの例として、表示情報における評価指標の呼称が挙げられる。例えば、誤差率という評価指標を、モデルの信用度の低さを表す指標として利用するとする。この場合、ビュー定義情報16において、。表示情報に含める評価指標として誤差率を指定し、誤差率の呼称として「モデルの信用度の低さ」を指定することができる。
<テンプレート情報10の具体例>
 以下、テンプレート情報10の具体例を、図を用いて説明する。各図において、テンプレート情報10は、分析テンプレート名302、分析テンプレートID304、ソリューション306、概要308、エンジンタイプ310、目的変数312、出力値314、及び項目定義316という属性を有する。なお、各図に示す具体例では、ビュー定義情報16が省略されている。ビュー定義情報16の具体例については後述する。
 分析テンプレート名302は、テンプレート情報10の名称を示す。また、分析テンプレートID304は、テンプレート情報10の識別情報を示す。これらの情報は、例えば、ユーザにテンプレート情報10の選択をさせる検索画面50に表示される(図6参照)。
 ソリューション306は、テンプレート情報10が行う分析が提供するソリューションの種類を示す。例えば前述したように、ソリューションの種類は、テンプレート情報10の検索に利用することができる。
 概要308は、テンプレート情報10が行う分析の概要を示す情報である。例えばこの情報は、前述した検索画面50などに表示することで、ユーザがテンプレート情報10を選択する際に参考とすることができる。
 エンジンタイプ310、目的変数312、及び出力値314は、アルゴリズム定義情報14を構成する情報である。エンジンタイプ310は、予測モデルの生成に利用される AI エンジンの識別情報を示している。なお、図13等においては、説明を分かりやすくするためにエンジンタイプ310に AI エンジンの名称が示されている。しかし、エンジンタイプ310は、AI エンジンを特定できる任意の情報(識別番号など)とすることができる。
 目的変数312は、生成する予測モデルの目的変数を表す。目的変数312は、入力データを用いた学習によって予測モデルを生成する際に、誤差を最小化する対象となる変数である。一方、出力値314は、予測モデルを利用した際に予測モデルから出力される値(予測モデルの予測結果)を示す。例えば図13におけるテンプレートT01では、目的変数が「店舗ごと及び商品分類ごとの、売上数の移動平均に対する1日先売上数の比率」であり、出力値は「店舗ごと及び商品分類ごとの、1日先の売上数」である。そのため、入力データを用いて予測モデルを生成する際には、店舗ごと及び商品分類ごとに「売上数の移動平均に対する1日先売上数の比率」が算出され、その誤差が最小化されるように学習が行われる。一方で、予測モデルから出力される予測結果としては、移動平均とそれに対する比率を利用して、1日先の売上数が出力される。
 また、目的変数として、「売上数の対数」のように、所定の項目の値を対数変換したものを利用することも考えられる。この場合、例えば、目的変数から対数を外した値を出力値として用いることが好適である。
 このように、目的変数に対して適切な加工を加えた値を予測モデルの最終的な出力とすることで、ユーザにとって有用な値を予測結果として提供することができる。そして、そのような加工の方法を予めテンプレート情報で定義しておくことにより、データ分析の専門家でないユーザでも容易に適切なデータ分析を行うことができるようになる。
 項目定義316は、項目定義情報12に相当する情報である。すなわち、項目定義316は、予測モデルに利用されるデータの項目を表す。ここで、図13等において、項目定義316に示されているのは大項目であり、小項目については省略されている。
 なお、複数のテンプレート情報10で共通の大項目が利用されうるため、大項目と小項目の対応付けについては、テンプレート情報10とは別途用意しておくことが好適である。こうすることで、大項目と小項目の対応付けをテンプレート情報10とは別途管理することができ、その管理の手間が軽減される。
 以下、図13から図19を利用して、テンプレート情報10の具体例を示す。図13から図19は、それぞれ以下の予測についてのテンプレートである。
・図13:売上数の予測
・図14:客数の予測
・図15:出荷数の予測
・図16:製品の受注数量の予測
・図17:保守部品の出庫数の予測
・図18:故障の予測
・図19:故障状態かどうかの判別
 図13は、売上数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T01、T02、T03は、目的変数312が互いに異なる。具体的には、テンプレート情報T01~T03はそれぞれ、「店舗ごと及び商品分類ごとの、売上数の移動平均に対する1日先の売上数の比率」、「店舗ごと及び商品分類ごとの、売上数の移動平均に対する1日先の売上数の差分」、及び「店舗ごと及び商品単品ごとの、売上数の移動平均に対する1日先の売上数の比率」を目的変数としている。
 出力値314については、テンプレート情報T01とT02では共通である一方、テンプレート情報T03では他の2つと異なっている。具体的には、テンプレート情報T01とT02における出力値314は「店舗ごと及び商品分類ごとの1日先の売上数」であるのに対し、テンプレート情報T03における出力値314は「店舗ごと及び商品単品ごとの1日先の売上数」である。
 一方、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「カレンダー、商品マスタ、店舗マスタ、気象データ、売上データ、及び客数データ」である点は、全てのテンプレート情報10で共通している。
 図14は、客数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T11、T12、T13は、目的変数312が互いに異なる。具体的には、テンプレート情報T11~T13はそれぞれ、「店舗ごとの、客数の移動平均に対する1日先の客数の比率」、「店舗ごとの、客数の移動平均に対する1日先の客数の差分」、及び「店舗ごとの1日先の客数」を目的変数としている。
 一方で、出力値314が「1日先の客数」であり、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「カレンダー、店舗マスタ、気象データ、及び客数データ」である点は、全てのテンプレート情報10で共通している。
 図15は、出荷数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T21、T22、T23は、目的変数312が互いに異なる。具体的には、テンプレート情報T21~T23はそれぞれ、「出荷センタごと及び商品分類ごとの、出荷数の移動平均に対する1日先の出荷数の比率」、「出荷センタごと及び商品分類ごとの、出荷数の移動平均に対する1日先の出荷数の差分」、及び「出荷センタごと及び商品単品ごとの、出荷数の移動平均に対する1日先の出荷数の比率」を目的変数としている。
 出力値314については、テンプレート情報T21とT22では共通である一方、テンプレート情報T23では他の2つと異なっている。具体的には、テンプレート情報T21とT22における出力値314は「出荷センタごと及び商品分類ごとの1日先の出荷数」であるのに対し、テンプレート情報T23における出力値314は「出荷センタごと及び商品単品ごとの1日先の出荷数」である。
 一方、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「カレンダー、商品マスタ、気象データ、拠点マスタ、及び出荷データ」である点は、全てのテンプレート情報10で共通している。
 図16は、製品の受注数量の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T31とT32では、目的変数312と出力値314がいずれも「製品ごとの、3ヶ月先の受注数量」となっている。一方、テンプレート情報T33では、目的変数312と出力値314がいずれも「製品ごとの、6ヶ月先の受注数量」となっている。
 また、テンプレート情報T31とT33では、概要308に記載されているように、入力データを製品ごとに学習用と評価用に分割して、予測モデルの生成と評価が行われる。一方で、テンプレート情報T32では、概要308に記載されているように、入力データをランダムに学習用と評価用に分割して、予測モデルの生成と評価が行われる。このようなデータ分割の基準は、例えば、AI エンジンに与えるハイパーパラメータとしてアルゴリズム定義情報14に含まれている。
 一方で、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「受注実績、大口案件受注実績、製品マスタ、帝国DI(Diffusion Index)、日銀短観、月次為替、見積もりデータ、カレンダ、追加カレンダ」という点は、全てのテンプレート情報10で共通している。
 図17は、保守部品の出庫数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T41~T43は、目的変数312が互いに異なる。具体的には、テンプレート情報T41~T43はそれぞれ、「部品別の1ヶ月先の出庫数」、「部品別の2ヶ月先の出庫数」、及び「部品別の3ヶ月先の出庫数」を目的変数としている。出力値314についても同様である。
 一方、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「出庫実績、稼働実績、部品マスタ、カレンダー」である点は、全てのテンプレート情報10で共通している。
 図18は、機器の故障の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T51~T53において、目的変数312と出力値314はいずれも、「機器ごとに、7日先に機器が故障するか否か」である。なお、図13~図17で例示したテンプレート情報10で生成される予測モデルはいずれも回帰モデルである一方、図18と後述する図19で例示するテンプレート情報10で生成される予測モデルは判別モデルとなる。
 テンプレート情報T51~T53は、予測モデルの学習アルゴリズムに違いがある。まず、テンプレート情報T51とT52は、エンジンタイプ310が異種混合学習であるのに対し、テンプレート情報T53は、エンジンタイプ310が RAPID 時系列分析となっている。
 エンジンタイプ310に加え、入力データに対して加える前処理についても違いがある。テンプレート情報T51では、機器の故障実績及び機器に搭載されているセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。テンプレート情報T52では、機器の故障実績、機器に搭載されているセンサー群のデータ、及びその機器の周辺のセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。テンプレート情報T53では、このような1時間単位に加工・集計する前処理が行われない。このような前処理の定義は、アルゴリズム定義情報14に含まれている。
 一方で、ソリューション306が「異常検知」であり、項目定義316が「機器センサデータ、周辺機器センサデータ、故障実績データ」である点は、全てのテンプレート情報10で共通している。
 図19は、故障状態か否かの判別に利用されるテンプレート情報10を例示する図である。テンプレート情報T61とT62において、目的変数312と出力値314はいずれも、「機器ごとに、機器が故障状態になるか否か」である。
 テンプレート情報T61とT62は、入力データに対する前処理に違いがある。テンプレート情報T61では、機器の故障実績及び機器に搭載されているセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。テンプレート情報T62では、機器の故障実績、機器に搭載されているセンサー群のデータ、及びその機器の周辺のセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。
 一方で、エンジンタイプ310が「異種混合学習」であり、ソリューション306が「異常検知」であり、項目定義316が「機器センサデータ、周辺機器センサデータ、故障実績データ」である点は、双方のテンプレート情報10で共通している。
<<ビュー定義情報16の具体例>>
 前述したテンプレート情報10の具体例に関し、ビュー定義情報16の具体例をいくつか説明する。例えばテンプレート情報10には、ビュー定義情報16として、「分析タイプ」、「利用目的タイプ」、「評価指標の有無」、及び「評価指標の名称」などの情報を含めることができる。また、エンジンタイプ310も、ビュー定義情報16として利用することができる。具体的には、分析タイプ、エンジンタイプ、及び利用目的タイプの組みに対応づけて、表示テンプレートを用意しておく。
 例えば、図13のテンプレート情報T01には、ビュー定義情報16として、以下の情報を付加することが好適である。
・分析タイプ:回帰
・利用目的タイプ:精度確認
・評価指標の利用有無:全ての評価指標を利用
・評価指標の名称:変更なし
 ここで、「評価指標の利用有無:全ての評価指標を利用」は、分析タイプに対応づけて用意されている全ての評価指標を表示情報に含めることを意味する。例えばこのケースでは、分析タイプが回帰分析であるため、回帰分析用の評価指標として用意されている全ての評価指標(適用率、再現率、及び F 値など)が表示情報に含まれることになる。また、「評価指標の名称:変更なし」は、評価指標の呼称として評価指標の名称をそのまま用いる(例えば、誤差率をそのまま「誤差率」と表示する)ことを意味する。
 その他にも例えば、図18のテンプレート情報T51には、ビュー定義情報16として、以下の情報を付加することが好適である。
・分析タイプ:判別
・利用目的タイプ:精度確認
・評価指標の利用有無:全ての評価指標
・評価指標の名称:変更なし
<ユーザによるテンプレート情報10のカスタマイズ>
 テンプレート情報10の内容の一部をユーザがカスタマイズできるようにしておいてもよい。すなわち、ユーザは、予め登録されているテンプレート情報10から好きなものを選んでそのまま利用することもできるし、選んだテンプレート情報10の一部をカスタマイズして利用することもできる。
 テンプレート情報10のカスタマイズは、分析を実行する際に行われてもよいし、分析に先立って予め行われてもよい。後者の場合、分析システム2000は、カスタマイズされたテンプレート情報10を、新たなテンプレート情報10として登録しておく(テンプレート記憶装置60に格納しておく)ことが好ましい。この場合、ユーザがテンプレート情報10の指定(S102)を行う際に、ユーザによってカスタマイズされたテンプレート情報10も、既存のテンプレート情報10と同様に選択可能となる。そこでユーザは、予めカスタマイズして登録しておいたテンプレート情報10を分析の際に指定することで、そのテンプレート情報10を利用した分析を実行することができる。
 なお、分析を実行する際にテンプレート情報10のカスタマイズを行った場合でも、カスタマイズ後のテンプレート情報10を分析システム2000に登録できることが好適である。こうすることで、次回以降の分析に、カスタマイズしたテンプレート情報10が利用可能となる。
 以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記各実施形態の組み合わせ、又は上記以外の様々な構成を採用することもできる。
 上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
1. 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
 前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
 前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成部と、
 前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成部と、を有する分析システム。
2. 前記入力受付部は、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、1.に記載の分析システム。
3. 前記項目定義情報は、1つ以上の大項目を示し、
 前記大項目には、複数の小項目が対応づけられており、
 前記入力受付部は、
  前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、2.に記載の分析システム。
4. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、1.乃至3.いずれか一つに記載の分析システム。
5. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、4.に記載の分析システム。
6. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、4.に記載の分析システム。
7. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
 前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
 前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、1.乃至6いずれか一つに記載の分析システム。
8. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
 前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
 前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、7.に記載の分析システム。
9. 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
 前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
 前記入力受付部は、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
 前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成部を有し、
 前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成される、装置。
10. 前記入力受付部は、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、9.に記載の装置。
11. 前記項目定義情報は、1つ以上の大項目を示し、
 前記大項目には、複数の小項目が対応づけられており、
 前記入力受付部は、
  前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、10.に記載の装置。
12. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、9.乃至11.いずれか一つに記載の装置。
13. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、12.に記載の装置。
14. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、12.に記載の装置。
15. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
 前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
 前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、9.乃至14いずれか一つに記載の装置。
16. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
 前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
 前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、15.に記載の装置。
17. コンピュータによって実行される制御方法であって、
 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
 前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
 前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成ステップと、
 前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップと、を有する制御方法。
18. 前記入力受付ステップにおいて、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、17.に記載の制御方法。
19. 前記項目定義情報は、1つ以上の大項目を示し、
 前記大項目には、複数の小項目が対応づけられており、
 前記入力受付ステップにおいて、
  前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、18.に記載の制御方法。
20. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、17.乃至19.いずれか一つに記載の制御方法。
21. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、20.に記載の制御方法。
22. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、20.に記載の制御方法。
23. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
 前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
 前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、17.乃至22いずれか一つに記載の制御方法。
24. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
 前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
 前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、23.に記載の制御方法。
25. コンピュータによって実行される制御方法であって、
 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
 前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
 前記入力受付ステップにおいて、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
 前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップを有し、
 前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成される、制御方法。
26. 前記入力受付ステップにおいて、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、25.に記載の制御方法。
27. 前記項目定義情報は、1つ以上の大項目を示し、
 前記大項目には、複数の小項目が対応づけられており、
 前記入力受付ステップにおいて、
  前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、26.に記載の制御方法。
28. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、25.乃至27.いずれか一つに記載の制御方法。
29. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、28.に記載の制御方法。
30. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、28.に記載の制御方法。
31. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
 前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
 前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、25.乃至30いずれか一つに記載の制御方法。
32. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
 前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
 前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、31.に記載の制御方法。
33. 17.乃至32.いずれか一つに記載の制御方法の各ステップをコンピュータに実行させるプログラム。
 この出願は、2019年8月22日に出願された日本出願特願2019-152096号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 テンプレート情報
12 項目定義情報
14 アルゴリズム定義情報
16 ビュー定義情報
20 ユーザ端末
30 フロントエンドサーバ
40 バックエンドサーバ
50 検索画面
52 識別情報指定エリア
54 名称指定エリア
56 検索ボタン
58 検索結果表示エリア
60 テンプレート記憶装置
70 画面
80 散布図画面
82 ポップアップウインドウ
90 一覧画面
110 散布図画面
120 一覧画面
130 詳細画面
131 評価指標エリア
132 説明変数一覧エリア
134 グラフエリア
135 門木エリア
136 予測式エリア
302 分析テンプレート名
304 分析テンプレートID
306 ソリューション
308 概要
310 エンジンタイプ
312 目的変数
314 出力値
316 項目定義
1000 計算機
1020 バス
1040 プロセッサ
1060 メモリ
1080 ストレージデバイス
1100 入出力インタフェース
1120 ネットワークインタフェース
2000 分析システム
2020 入力受付部
2040 予測モデル生成部
2060 表示情報生成部

Claims (33)

  1.  複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
     前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
     前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成部と、
     前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成部と、を有する分析システム。
  2.  前記入力受付部は、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、請求項1に記載の分析システム。
  3.  前記項目定義情報は、1つ以上の大項目を示し、
     前記大項目には、複数の小項目が対応づけられており、
     前記入力受付部は、前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、請求項2に記載の分析システム。
  4.  前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、請求項1乃至3いずれか一項に記載の分析システム。
  5.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、請求項4に記載の分析システム。
  6.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、請求項4に記載の分析システム。
  7.  前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
     前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
     前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、請求項1乃至6いずれか一項に記載の分析システム。
  8.  前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
     前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
     前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、請求項7に記載の分析システム。
  9.  複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
     前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
     前記入力受付部は、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
     前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成部を有し、
     前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成される、装置。
  10.  前記入力受付部は、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、請求項9に記載の装置。
  11.  前記項目定義情報は、1つ以上の大項目を示し、
     前記大項目には、複数の小項目が対応づけられており、
     前記入力受付部は、前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、請求項10に記載の装置。
  12.  前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、請求項9乃至11いずれか一項に記載の装置。
  13.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、請求項12に記載の装置。
  14.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、請求項12に記載の装置。
  15.  前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
     前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
     前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、請求項9乃至14いずれか一項に記載の装置。
  16.  前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
     前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
     前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、請求項15に記載の装置。
  17.  コンピュータによって実行される制御方法であって、
     複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
     前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
     前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成ステップと、
     前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップと、を有する制御方法。
  18.  前記入力受付ステップにおいて、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、請求項17に記載の制御方法。
  19.  前記項目定義情報は、1つ以上の大項目を示し、
     前記大項目には、複数の小項目が対応づけられており、
     前記入力受付ステップにおいて、前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、請求項18に記載の制御方法。
  20.  前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、請求項17乃至19いずれか一項に記載の制御方法。
  21.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、請求項20に記載の制御方法。
  22.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、請求項20に記載の制御方法。
  23.  前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
     前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
     前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、請求項17乃至22いずれか一項に記載の制御方法。
  24.  前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
     前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
     前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、請求項23に記載の制御方法。
  25.  コンピュータによって実行される制御方法であって、
     複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
     前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
     前記入力受付ステップにおいて、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
     前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップを有し、
     前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成される、制御方法。
  26.  前記入力受付ステップにおいて、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、請求項25に記載の制御方法。
  27.  前記項目定義情報は、1つ以上の大項目を示し、
     前記大項目には、複数の小項目が対応づけられており、
     前記入力受付ステップにおいて、前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、請求項26に記載の制御方法。
  28.  前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、請求項25乃至27いずれか一項に記載の制御方法。
  29.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、請求項28に記載の制御方法。
  30.  前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、請求項28に記載の制御方法。
  31.  前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
     前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
     前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、請求項25乃至30いずれか一項に記載の制御方法。
  32.  前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
     前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
     前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、請求項31に記載の制御方法。
  33.  請求項17乃至32いずれか一項に記載の制御方法の各ステップをコンピュータに実行させるプログラム。
PCT/JP2019/041150 2019-08-22 2019-10-18 分析システム、装置、制御方法、及びプログラム WO2021033338A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/634,076 US20220351051A1 (en) 2019-08-22 2019-10-18 Analysis system, apparatus, control method, and program
JP2021540620A JP7371690B2 (ja) 2019-08-22 2019-10-18 分析システム、装置、制御方法、及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-152096 2019-08-22
JP2019152096 2019-08-22

Publications (1)

Publication Number Publication Date
WO2021033338A1 true WO2021033338A1 (ja) 2021-02-25

Family

ID=74661024

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/041150 WO2021033338A1 (ja) 2019-08-22 2019-10-18 分析システム、装置、制御方法、及びプログラム

Country Status (3)

Country Link
US (1) US20220351051A1 (ja)
JP (1) JP7371690B2 (ja)
WO (1) WO2021033338A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023276051A1 (ja) * 2021-06-30 2023-01-05 日本電気株式会社 売上情報処理装置、売上情報処理方法、及びプログラム
WO2023276049A1 (ja) * 2021-06-30 2023-01-05 日本電気株式会社 店舗データ処理装置、店舗データ処理方法、及びプログラム
JP7320810B1 (ja) 2022-10-18 2023-08-04 株式会社サマデイ Aiサーバ用インターフェースシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160045A (ja) * 1999-12-03 2001-06-12 Hitachi Ltd 需要予測システム
JP2016134053A (ja) * 2015-01-21 2016-07-25 日通システム株式会社 経営管理支援システム、経営管理支援方法、及び、経営管理支援プログラム
WO2017094207A1 (ja) * 2015-11-30 2017-06-08 日本電気株式会社 情報処理システム、情報処理方法および情報処理用プログラム
JP2017520068A (ja) * 2014-05-23 2017-07-20 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160045A (ja) * 1999-12-03 2001-06-12 Hitachi Ltd 需要予測システム
JP2017520068A (ja) * 2014-05-23 2017-07-20 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術
JP2016134053A (ja) * 2015-01-21 2016-07-25 日通システム株式会社 経営管理支援システム、経営管理支援方法、及び、経営管理支援プログラム
WO2017094207A1 (ja) * 2015-11-30 2017-06-08 日本電気株式会社 情報処理システム、情報処理方法および情報処理用プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023276051A1 (ja) * 2021-06-30 2023-01-05 日本電気株式会社 売上情報処理装置、売上情報処理方法、及びプログラム
WO2023276049A1 (ja) * 2021-06-30 2023-01-05 日本電気株式会社 店舗データ処理装置、店舗データ処理方法、及びプログラム
JP7320810B1 (ja) 2022-10-18 2023-08-04 株式会社サマデイ Aiサーバ用インターフェースシステム
JP7320809B1 (ja) 2022-10-18 2023-08-04 株式会社サマデイ Aiサーバ用インターフェースシステム、及び非認知スキルブラッシュアップシステム
WO2024084995A1 (ja) * 2022-10-18 2024-04-25 株式会社サマデイ Aiサーバ用インターフェースシステム、及び非認知スキルブラッシュアップシステム
WO2024084996A1 (ja) * 2022-10-18 2024-04-25 株式会社サマデイ Aiサーバ用インターフェースシステム
JP2024059541A (ja) * 2022-10-18 2024-05-01 株式会社サマデイ Aiサーバ用インターフェースシステム
JP2024059115A (ja) * 2022-10-18 2024-05-01 株式会社サマデイ Aiサーバ用インターフェースシステム、及び非認知スキルブラッシュアップシステム

Also Published As

Publication number Publication date
JP7371690B2 (ja) 2023-10-31
JPWO2021033338A1 (ja) 2021-02-25
US20220351051A1 (en) 2022-11-03

Similar Documents

Publication Publication Date Title
US11954112B2 (en) Systems and methods for data processing and enterprise AI applications
Lazzeri Machine learning for time series forecasting with Python
US9811794B2 (en) Qualitative and quantitative modeling of enterprise risk management and risk registers
US8417715B1 (en) Platform independent plug-in methods and systems for data mining and analytics
US20180349446A1 (en) Interactive system employing machine learning and artificial intelligence to customize user interfaces
WO2021033338A1 (ja) 分析システム、装置、制御方法、及びプログラム
US9747574B2 (en) Project assessment tool
EP3267374A1 (en) Guided analytics system and method
US20180349793A1 (en) Employing machine learning and artificial intelligence to generate user profiles based on user interface interactions
US20220351004A1 (en) Industry specific machine learning applications
US20240193481A1 (en) Methods and systems for identification and visualization of bias and fairness for machine learning models
CN112200538A (zh) 数据处理方法、装置、设备及存储介质
US12050762B2 (en) Methods and systems for integrated design and execution of machine learning models
US20230065870A1 (en) Systems and methods of multimodal clustering using machine learning
Li et al. FIU-Miner (a fast, integrated, and user-friendly system for data mining) and its applications
Jeet et al. Learning Quantitative Finance with R
Yan et al. Teaching predictive audit data analytic techniques: Time-series forecasting with transactional and exogenous data
Schobel et al. Business process intelligence tools
da Silva et al. Method for assessing and selecting discrete event simulation software applied to the analysis of logistic systems
US20240311861A1 (en) Real-time marketplace for competitive pay
Panda et al. Predictive Analytics: An Overview of Evolving Trends and Methodologies
Mureithi Predictive Analytics Model for Small and Medium Enterprises in Kenya, Forecasting on Supply and Demand
CN117032636A (zh) 一种中台服务流程的构建方法、装置、系统及存储介质
RU161579U1 (ru) Информационная технология анализа процессов функционирования организационно-технической системы
CN116542779A (zh) 基于人工智能的产品推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19942382

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021540620

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19942382

Country of ref document: EP

Kind code of ref document: A1