WO2020188701A1 - 機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法 - Google Patents

機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法 Download PDF

Info

Publication number
WO2020188701A1
WO2020188701A1 PCT/JP2019/011193 JP2019011193W WO2020188701A1 WO 2020188701 A1 WO2020188701 A1 WO 2020188701A1 JP 2019011193 W JP2019011193 W JP 2019011193W WO 2020188701 A1 WO2020188701 A1 WO 2020188701A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
unit
input
explanatory
machine learning
Prior art date
Application number
PCT/JP2019/011193
Other languages
English (en)
French (fr)
Inventor
健一朗 猪田
啓至 北嶋
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2021506853A priority Critical patent/JP7255671B2/ja
Priority to US17/437,946 priority patent/US20220168640A1/en
Priority to PCT/JP2019/011193 priority patent/WO2020188701A1/ja
Publication of WO2020188701A1 publication Critical patent/WO2020188701A1/ja

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/60Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
    • A63F13/67Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor adaptively or by learning from player actions, e.g. skill level adjustment or by storing successful combat sequences for re-use
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/30Interconnection arrangements between game servers and game devices; Interconnection arrangements between game devices; Interconnection arrangements between game servers
    • A63F13/35Details of game servers
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/53Controlling the output signals based on the game progress involving additional visual information provided to the game scene, e.g. by overlay to simulate a head-up display [HUD] or displaying a laser sight in a shooting game
    • A63F13/533Controlling the output signals based on the game progress involving additional visual information provided to the game scene, e.g. by overlay to simulate a head-up display [HUD] or displaying a laser sight in a shooting game for prompting the player, e.g. by displaying a game menu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Definitions

  • the present invention relates to a machine learning system, an information terminal, an information processing device, an information processing method, a program, a trained model, and a method of producing a trained model.
  • Patent Document 1 has the following description.
  • the image recognition device evaluates the identification result of the learning evaluation image by the first classifier, and selects the erroneous identification area as a small area that is difficult to identify by the first classifier. Then, the image recognition device learns a second classifier for discriminating a region including a plurality of small regions including the selected misidentification region. Finally, the image recognition device integrates the identification result by the first classifier and the identification result by the second classifier to learn the integrated classifier.
  • the classification accuracy of the trained model (identifier in Patent Document 1) also depends on the data used for machine learning. Therefore, it is desired to collect data used for machine learning more efficiently.
  • the present invention provides a machine learning system, an information terminal, an information processing device, an information processing method, a program, a trained model, and a method for producing a trained model that can collect data used for machine learning more efficiently.
  • the purpose is to do.
  • the present invention has been made to solve the above-mentioned problems, and in order to achieve the above-mentioned object, one aspect of the present invention is that the first system has a presenting unit that presents purpose information for machine learning.
  • An input unit for inputting explanatory information for the target information from a user, an acquisition unit for acquiring the explanatory information and the target information, and a data set of input variables based on the explanatory information and output variables based on the target information.
  • An evaluation unit that evaluates the classification accuracy of the target information based on the explanatory information based on a predetermined learned model, and a reward giving unit that grants a reward according to the evaluation to the user.
  • a second system includes machine learning based on at least one of the data sets, including a history generation unit that generates history information associated with the target information, the evaluation result, and the reward. It includes a model storage unit that stores the trained model that has been performed, and an execution unit that outputs the target information when the explanatory information is input based on the trained model stored in the model storage unit. It is a machine learning system.
  • one aspect of the present invention is an evaluation using a presentation unit that presents target information for machine learning, an input unit that inputs explanatory information for the target information from a user, and the target information and the explanatory information. It is an information terminal including a reward giving unit for giving a reward according to the above to the user.
  • one aspect of the present invention is objective information for machine learning, explanatory information for the objective information that is input to the information terminal by the user, and evaluation based on a predetermined learned model.
  • An information processing device including an evaluation unit that evaluates the classification accuracy of the target information based on the explanatory information, and a history generation unit that generates history information in which the target information and the evaluation result are related. Is.
  • one aspect of the present invention is a transmission unit that transmits target information for machine learning to an information terminal, the target information, explanatory information for the target information, and explanatory information input from the user to the information terminal.
  • the evaluation is based on a predetermined learned model, and includes a reward determination unit that determines the reward to be given to the user according to the evaluation of the classification accuracy of the target information based on the explanatory information. It is an information processing device.
  • one aspect of the present invention is an input variable which is objective information for machine learning and is based on the objective information presented to the information terminal, and explanatory information for the objective information which is input by the user to the information terminal.
  • the trained model in which training has been performed is read from the model storage unit based on the input variable based on the explanatory information and at least one of the data sets, and the explanatory information is input based on the trained model.
  • the purpose information for machine learning is presented, the explanatory information for the target information is input by the user, and the reward according to the evaluation using the target information and the explanatory information is described.
  • This is an information processing method given to the user.
  • one aspect of the present invention is to acquire objective information for machine learning and explanatory information which is explanatory information for the objective information and is input to an information terminal by a user, and is an input variable based on the explanatory information.
  • the classification accuracy of the objective information based on the explanatory information is evaluated, and the objective information and the result of the evaluation are obtained. It is an information processing method that generates related history information.
  • the purpose information for machine learning is transmitted to the information terminal, and the target information, explanatory information for the target information and input to the information terminal by the user, and It is an evaluation based on a predetermined learned model, and is an information processing method for determining a reward to be given to the user according to an evaluation of the classification accuracy of the target information based on the explanatory information.
  • one aspect of the present invention is an input variable which is objective information for machine learning and is based on the objective information presented to the information terminal, and explanatory information for the objective information which is input by the user to the information terminal.
  • a trained model in which machine learning was performed was read from the model storage unit based on an input variable based on the explanatory information and at least one of the data sets, and the explanatory information was input based on the trained model. In this case, it is an information processing method that outputs the target information.
  • one aspect of the present invention is a presentation procedure in which a computer of an information processing device presents a target information for machine learning to a computer of an information terminal, an input procedure in which explanatory information for the target information is input by a user. It is a program for executing a reward giving procedure for giving a reward according to an evaluation using the target information and the explanatory information to the user.
  • one aspect of the present invention is an acquisition procedure for causing a computer of an information processing apparatus to acquire target information for machine learning and explanatory information for the target information, which is input to an information terminal by a user.
  • one aspect of the present invention is a transmission procedure for transmitting target information for machine learning to an information terminal to a computer of an information processing device, the target information, and explanatory information for the target information from the user to the information terminal.
  • one aspect of the present invention is to provide the computer of the information processing apparatus with input variables which are objective information for machine learning and are based on the objective information presented to the information terminal, and explanatory information for the objective information from the user.
  • input variables which are objective information for machine learning and are based on the objective information presented to the information terminal, and explanatory information for the objective information from the user.
  • the trained model in which machine learning has been performed is read from the model storage unit, and based on the trained model.
  • This is a program for executing an execution procedure for outputting the target information when the explanatory information is input.
  • one aspect of the present invention is an input variable which is objective information for machine learning and is based on the objective information presented to the information terminal, and explanatory information for the objective information which is input by the user to the information terminal.
  • one aspect of the present invention is an input variable which is objective information for machine learning and is based on the objective information presented to the information terminal, and explanatory information for the objective information which is input by the user to the information terminal.
  • a method of producing a trained model by acquiring at least one of a data set of an input variable based on explanatory information and performing machine learning based on at least one of the data sets. Is.
  • data used for machine learning can be collected more efficiently.
  • FIG. 1 is a schematic view showing an example of a screen flow according to an embodiment of the present invention.
  • This figure is a screen flow displayed by the mobile terminals 2-1 to 2-N of FIG. 2 (each of which is also referred to as a “portable terminal 2”; an example of an “information terminal”).
  • This screen flow is displayed on the display of the mobile terminal 2 by the mobile application (also referred to as “game application”) of the game installed on the mobile terminal 2.
  • the game app is a competitive game game app. In the battle-type game, an event occurs, and in each event, a battle between game characters is performed.
  • the battle character G111 is displayed on the screen G11.
  • the battle character G111 is a character that plays against a game character (also referred to as an "operation character") operated by the user.
  • a cat, cheese, and a car are displayed as an image class (an example of "purpose information") that attacks the opponent character G111.
  • the class is information for classifying (including identification) an image, and is, for example, a name of a subject (an example of an "object") drawn on the image. That is, the screen G11 indicates that the user should be provided with an image of a cat, cheese, or a car in order to attack the opponent character G111.
  • the mobile terminal 2 When the button BT11 is touched by the user, the mobile terminal 2 activates the camera and displays a screen on which a photograph can be taken (for example, the screen Ga12 in FIG. 36). On this screen, the user can shoot a still image or a moving image by tapping (touching) the shooting button.
  • the button BT12 When the button BT12 is touched by the user, the mobile terminal 2 displays a screen (not shown) at which files in the folder of the mobile terminal 2 can be selected. On this screen, the user can select an image file.
  • the mobile terminal 2 displays the screen G12 after the user has taken a picture or after the user has selected a file.
  • Image G121 (an example of "explanatory information") is displayed on the screen G12.
  • the image G121 is an image taken by the user or an image of an image file selected by the user.
  • cats, cheese, and automobiles are displayed as candidates for the class of the image G121.
  • the user can use the pull-down menu G122 to select any one of cat, cheese, or car. That is, the mobile terminal 2 uses the pull-down menu G122 to allow the user to select which class among the classes presented on the screen G11.
  • the class selected by the user is also called a definite class.
  • the button BT13 is a button that causes the operating character to attack the opponent G111 by using the image G121 and the confirmation class. When the button BT13 is touched by the user, the mobile terminal 2 displays the screen G13.
  • the image G131 is an image indicating that the image G121 is highly evaluated (“GREAT Picture”) as an evaluation (also referred to as “recognition evaluation”) of the image G121.
  • the recognition evaluation is an evaluation of the classification accuracy of the class by the image G121. For example, in the recognition evaluation, when machine learning is performed using the image G121 and a definite class, the recognition rate of the image (also referred to as "model recognition rate") by the trained model is improved, the evaluation is performed. It gets higher. On the other hand, the recognition evaluation becomes low when the model recognition rate decreases. The details of the recognition evaluation will be described later (see FIG. 26).
  • Image G132 shows that 300 points have been deducted from the hit points (an example of "reward” or “variable in the game") of the opponent character G111.
  • a hit point is data that means that the character has been defeated (lost) when the value becomes zero.
  • the image G133 shows that 100 points have been added to the hit points of the operating character.
  • the hit points show that 100 points are added to the 136 points on the screen G11 to reach 236 points.
  • the mobile terminal 2 increases or decreases the hit points of the opponent character G111 or the operating character according to the recognition evaluation of the image G121 provided by the user (an example of "update of variables in the game").
  • the user can defeat the battle character G111 and win the battle.
  • the mobile terminal 2 displays the screen G14.
  • the card G141 (an example of "reward” or "game object") given to the user as a result of winning the battle is displayed.
  • This card G141 is a "super rare” (also referred to as "SR") card having a high rarity value, and is given when the evaluation is high in the recognition evaluation.
  • SR super rare
  • the card is used for operating characters, items, generating special effects, updating variables in the game, and the like.
  • the mobile terminal 2 displays the class for machine learning on the screen G11 (area G112).
  • the mobile terminal 2 is input by the user with the image G121 for the presented class.
  • the mobile terminal 2 gives the user a reward (increase / decrease in hit points, card) according to the class (confirmed class selected in the pull-down menu G122) and the image G121.
  • the mobile terminal 2 can collect the data set of the class and the image G121 from the user as data used for machine learning. Since the user can provide an image with a simple operation after designating a class, the mobile terminal 2 can efficiently collect data used for machine learning.
  • the user since the user is given a reward according to the recognition evaluation, the user provides an image having a high evaluation in the recognition evaluation. In this case, the mobile terminal 2 can collect an image having a high model recognition rate as data used for machine learning.
  • the game application is executed on a general-purpose operating system (also referred to as "OS") installed in a smartphone or the like.
  • Game apps are downloaded via the Internet from an application store that distributes mobile applications (also referred to as "apps").
  • the application store is a town load distribution platform that supports apps. That is, the game application can be operated by a general OS of a mobile terminal, and since the application store is distributed, it can be widely used by general users.
  • the game app may be downloaded from a particular website or data folder, or may be downloaded via a local network or personal computer.
  • FIG. 2 is a schematic view showing a configuration example of the machine learning system Sys according to the present embodiment.
  • the machine learning system Sys is a data collection system SysA (an example of the "first system") and a plurality of artificial intelligence systems SysB-1 to SysB-M (an example of the "second system”. Each of them is an "artificial intelligence system SysB". Also referred to as).
  • the data collection system SysA includes a management server 1, mobile terminals 2-1 to 2-N, a game server 3, and a learning server 4.
  • the management server 1 and the terminal T1 are connected to each other via the local network area work L1.
  • the management server 1, the game server 3, and the learning server 4 are connected to each other via the local area network L1 and the Internet NW.
  • the game server 3 and the learning server 4 are connected to each other via the Internet NW.
  • the mobile terminal 2 and the game server 3 are connected to each other via the Internet NW and the base station device BS.
  • the artificial intelligence system SysB is a system that provides services using a trained model of the result of machine learning.
  • the control device 6-1 is a mobile terminal, and displays a class for an image input by the user.
  • the control device 6-2 is a robot arm, and controls the operation of the arm according to an image of the object to be transported.
  • the control device 6-M is a quality control device, and determines whether the inspection object is normal or abnormal according to the captured image of the inspection object.
  • the artificial intelligence server 5-1 and the control device 6-1 are connected via the Internet NW and the base station device BS.
  • the artificial intelligence server 5-2 and the control device 6-2 are connected via the local area network L2.
  • the artificial intelligence server 5-M and the control device 6-M are directly connected.
  • the machine learning system SysB may not include a plurality of artificial intelligence systems SysB but may include one artificial intelligence system SysB, or the artificial intelligence system SysB may be a single device (housing). Good.
  • the game server 3 transmits a class for machine learning to each mobile terminal 2.
  • Each mobile terminal 2 displays a class to the user.
  • Each mobile terminal 2 receives an image for the class from the user.
  • Each mobile terminal 2 transmits the input class and image data set to the game server 3.
  • the learning server 4 acquires the data set from each mobile terminal 2 via the game server 3.
  • the learning server 4 performs recognition evaluation based on the acquired data set and a predetermined trained model.
  • the game server 3 gives the user a reward according to the recognition evaluation.
  • the learning server 4 collects a plurality of data sets (also referred to as “collected data sets”) by repeating the above.
  • Each artificial intelligence server 5 stores a trained model (also referred to as an "additional trained model") that has undergone machine learning based on at least one of the collected data sets. Each artificial intelligence server 5 outputs a class when an image is input based on the additionally trained model.
  • a trained model also referred to as an "additional trained model”
  • the machine learning system Sys can collect class and image datasets as data used for machine learning from a large number of users.
  • the machine learning system Sys can acquire a large number of data sets or various data sets as compared with the case of acquiring data sets from a small number of users, and can collect data used for machine learning more efficiently.
  • FIG. 3 is a sequence diagram showing an example of the processing flow in the machine learning system Sys according to the present embodiment. Is. The sequence is not limited to this, and the order of each process may be changed, or a plurality of processes may be performed in parallel.
  • the terminal T1 is input with order information from the administrator.
  • the order information is information for requesting the collection of data (class and image data set) used for machine learning.
  • the order information includes request source information indicating the request source.
  • the requester is the requesting entity for which the administrator has been requested to collect data, for example, a company that provides the artificial intelligence system SysB.
  • the terminal T1 transmits the order information to the management server 1.
  • the artificial intelligence server 5 transmits the trained model setting (also referred to as “reference model setting”) and the reference data set used in the artificial intelligence system SysB to the management server 1.
  • the reference model setting includes a machine learning program before collecting the data set.
  • a machine learning program is an application program that generates a trained model by performing machine learning using a data set.
  • the machine learning program is, for example, a CNN (convolutional neural network) program.
  • the reference data set is a data set used for recognition evaluation, and is a set of an image and a class (correct class in terms of classification) of the subject of the image. For example, in the reference dataset, the "cat" class is correctly associated with the cat image.
  • Step S103 The management server 1 generates learning settings based on the order information in step S101, the reference model setting in step S102, and the reference data set.
  • the learning setting is a setting for performing recognition evaluation, and is set using the service setting screen (FIG. 4) of the terminal T1.
  • Learning settings include machine learning programs and reference datasets.
  • the management server 1 transmits the generated learning settings to the learning server 4.
  • Step S104 The management server 1 generates game settings based on the order information in step S101 (see FIG. 4).
  • the game setting is a setting for collecting data used for machine learning in the game application, and is set using the service setting screen (FIG. 4) of the terminal T1.
  • the management server 1 transmits the game settings including the class to the game server 3.
  • Step S111 The game server 3 and the mobile terminal 2 advance the game based on the user operation.
  • the game server 3 refers to the game setting in step S104 while the game is in progress.
  • the game server 3 transmits an image request including the game setting class to the mobile terminal 2.
  • Step S113 The mobile terminal 2 displays the class included in the image request in step S112 (screen G11 in FIG. 1).
  • the mobile terminal 2 acquires an image input by the user for the displayed class (screen G12).
  • the mobile terminal 2 transmits a response including the class (determined class) and the acquired image data set to the game server 3.
  • Step S114 The game server 3 transmits the data set included in the response of step S113 to the learning server 4 as an evaluation request.
  • the learning server 4 refers to the evaluation request in step S114 and performs recognition evaluation on the image of the data set.
  • the learning server 4 refers to the learning setting in step S103, and performs recognition evaluation using the reference model setting and the reference data set of the learning setting.
  • the learning server 4 transmits the evaluation result of the recognition evaluation to the game server 3.
  • the game server 3 determines rewards such as hit points and cards according to the evaluation result of step S115.
  • the game server 3 transmits the determined reward to the mobile terminal 2.
  • the mobile terminal 2 gives the received reward to the user who input the image in S113 (screens G13 and G14 in FIG. 1).
  • Step S117 The game server 3 transmits the game log to the learning server 4.
  • the game log is data collected by the game server 3 among the items of the service log of FIG.
  • Step S118 The learning server 4 generates a service log (FIG. 15) by adding the model recognition rate and the like calculated in the recognition evaluation in step S115 to the game log in step S117 as identification information.
  • the learning server 4 transmits the service log to the management server 1.
  • the process S11 from step S111 to step S118 is performed a plurality of times for the same or other mobile terminal 2 (same or other user). For example, when collecting 1000 data sets, the process S11 is performed at least 1000 times.
  • Step S121 When the management server 1 satisfies the condition for requesting the collected data set collected by the multiple processing S11 (also referred to as “learning information request condition”), the management server 1 transmits an additional learning information request to the learning server 4. To do. (Step S122) The learning server 4 performs machine learning on the trained model in which the reference model is set by using the collected data set. As a result of this learning, the learning server 4 generates an additional trained model. This additionally trained model is also referred to as "additional learning information”. The learning server 4 transmits the additional learning information and the collected data set to the management server 1.
  • Step S123 The management server 1 delivers the additional learned model and the collected data set received in step S122 by transmitting them to the artificial intelligence server 5. In addition, this delivery may be performed manually. For example, a human may store an additionally trained model or a collected data set in a storage medium, carry it, and replicate it from the storage medium to the artificial intelligence server 5.
  • Step S124 The management server 1 generates billing information based on the order information in step S101, and the billing information is transmitted to the requester of the order information. The requester completes the settlement by paying the billing information fee.
  • the processing of the sequence diagram of FIG. 3 is performed for each order.
  • the machine learning system Sys can receive multiple orders from one or more requesters at the same time or at different times.
  • the collection data set is collected in units of order information (for each order ID).
  • FIG. 4 is a schematic view showing an example of the service setting screen according to the present embodiment.
  • the service setting screen G2 is composed of an order information display G21 and a setting information display G22.
  • the order information display G21 is a display that allows the administrator to refer to the order information.
  • the setting information display G22 is a display for causing the administrator to refer to and update the learning setting and the game setting.
  • the service setting screen G2 is generated for each order (for each order ID input from the terminal T1) by the management server 1 and displayed by the application of the terminal T1.
  • the order information display G21 is composed of an order basic display G211, an order learning display G212, and an order charge display G213.
  • the information ordered from the requester is displayed on the order information display G21.
  • the order ID, request source, request date, delivery destination, delivery deadline, and delivery status are displayed on the basic order display G211.
  • the order ID is an identifier that identifies the order, and is generated by the management server 1 for each order.
  • the order learning display G212 displays a reference model, a reference model setting, a reference data set, an order class setting, and an order data collection condition.
  • the reference model is information indicating the name of the reference model and its type.
  • the order class setting is the ordered class setting.
  • the class setting is a setting for selecting a class.
  • the order data collection condition is a condition of collection period, number of cases, recognition rate (model recognition rate), and reward for collecting data, and is an ordered setting.
  • the charge is displayed on the order charge display G213.
  • the fee is a fee according to the improved recognition rate (model recognition rate), the total number of data sets (number of data), the number of users, the number of references, the opponent character, the hit points, and the reward given.
  • the above billing information is generated based on these pricing.
  • the setting information display G22 is composed of a game setting display G221, a learning setting display G222, and a reward setting display G223.
  • the service ID is displayed in the title portion of the setting information display G22.
  • the service ID is an identifier that identifies the service for each order, and is generated by the management server 1 for each order.
  • Game information, event information, and opponent characters are displayed on the game setting display G221.
  • the game information is a game ID that identifies the game application and a name of the game application.
  • the event information is an event ID that identifies the event and the name of the event.
  • the battle character is a battle character ID that identifies the battle character, and an image of the battle character.
  • the setting of the game setting display G221 is updated (newly set or changed) when the administrator clicks the button BT21 and inputs information.
  • the learning server information, class setting, and data collection conditions are displayed on the learning setting display G222.
  • the learning server information is identification information that identifies the learning server, and is a URI (Uniform Resource Identifier) or server name of the learning server.
  • the order class setting and the order data setting are duplicated in the class setting and the data collection condition.
  • the class setting and data collection conditions can be updated by the administrator by clicking the buttons BT22 and BT23, respectively.
  • the class having a low model recognition rate is automatically selected and the class specified by the requester is selected as the class setting.
  • the learning setting display G222 it is displayed that "cheese” and “automobile” are selected as the class with the lowest model recognition rate in ascending order of the model recognition rate, and "cat” is selected as the class specified by the requester. Has been done.
  • the class specified by the requester and the class with the lowest model recognition rate (lower is first) are prioritized, with “cat” in the first class, "cheese” in the second class, and third.
  • "Car” is set for the class.
  • the classes are displayed in this order in the area G112 and the pull-down menu G12 in FIG.
  • the learning setting display G222 displays the collection period, the number of cases, the recognition rate (model recognition rate), and the reward conditions as data collection conditions.
  • the condition of the number of cases is a condition based on the total number of collected data sets, for example, the total number of collected data sets is within the threshold value (1000 cases). That is, when the total number of collected data sets exceeds the threshold value, the collection is terminated.
  • the recognition rate condition is a condition based on the model recognition rate, for example, the model recognition rate is within the threshold value (90%). That is, when the model recognition rate exceeds the threshold value, the collection is terminated.
  • the reward condition is a condition based on the reward. For example, the number of super rare cards to be given is within the threshold value (1000 cards). That is, when the number of Super Rare cards granted exceeds the threshold value, the collection is terminated.
  • the reward setting display G223 displays the selected reward as the reward setting. On the reward setting display G223, it is displayed that a super rare card is given and that 300 points are deducted from the opponent character for hit points and 100 points are added to the user's operation character.
  • the reward setting can be updated by the administrator by clicking the button BT24.
  • the administrator can select the type of game object.
  • the game object is an object used in a game, for example, a card, a coin, an item, a character, a present, or the like.
  • the administrator can update the rarity of the card as the type of game object.
  • the administrator can update the variable to be rewarded and the variable value of the variable in the game.
  • Variables in the game include, for example, level, ability (attack power, defense power, etc.), magic points, probability of critical hits, appearance probability of cards and special effects, team level, life, and the like.
  • the information displayed on the service setting screen G2 is set.
  • the information displayed on the order learning display G212 and the learning setting display G222 is set on the management server 1 and the learning server 4 as learning settings.
  • the information displayed on the game setting display G221 and the reward setting display G223 is set on the management server 1 and the game server 3 as game settings.
  • the order data collection condition, price setting, event information, battle character, data collection condition, or reward setting may be set for each class, or a plurality of contents and conditions may be set for each class. ..
  • FIG. 5 is a schematic view showing an example of the service management screen G3 according to the present embodiment.
  • the service management screen G3 is composed of a service status display G31, a class status display G32, an order basic display G331, and a game setting display G332.
  • the service status display G31 and the class status display G32 are displays that allow the administrator to refer to the game status information and the collection status information (also referred to as “service status information”).
  • the class status display G32 refers to the service status information for each class
  • the service status display G31 refers to the service status information of the entire service.
  • the service management screen is generated for each order (for each input order ID) by the management server 1 and displayed by the application of the terminal T1.
  • the service ID In the service status display G31, the service ID, the recognition rate as the service status (overall), the number of battles, the number of successes, the number of failures, and the number of data sets are displayed.
  • the recognition rate is the average value of the model recognition rate for each class.
  • the number of matches, the number of successes, the number of failures, and the number of datasets are the total values of all classes (first class, second class, third class).
  • the number of battles is the number of times the set battle character and the operating character of each user have played against each other.
  • the number of successes is the number of times the model recognition rate has increased in the acquired data set.
  • the number of failures is the number of times the model recognition rate has decreased in the acquired data set.
  • the number of datasets is the number of times the dataset was acquired, and is the total value of the number of successes and the number of failures.
  • the number of battles, the number of successes, the number of failures, and the number of data sets are also calculated for each predetermined time unit (for example, one hour) and displayed on the service status display G31.
  • the game server 3 and the learning server 4 stop the service for the displayed order. For example, the game server 3 deletes the set event ID and prevents the set opponent character from appearing.
  • the button BT32 or the button BT33 is clicked, the additional learning information request is transmitted to the learning server 4 (step S121 in FIG. 3), and the additional learning information or the collected data set is transmitted to the management server 1 (step in FIG. 3). S122).
  • the service status display G31 is composed of a first class status display G321, a second class status display G322, and a third class status display G323.
  • the first class status display G321, the second class status display G322, and the third class status display G323 display the usage status and data collection status of the first class, second class, and third class games, respectively. ing.
  • the service status display G31 displays the recognition rate (model recognition rate), the number of battles, the number of successes, the number of failures, the number of data sets, and the number of rewards for each class.
  • the number of rewards is the number of times the reward is given for each reward.
  • buttons BT36 and BT37 have the same functions as buttons BT35 and BT36 for the second class, and buttons BT38 and BT39 for the second class, respectively.
  • FIG. 6 is a schematic block diagram showing the configuration of the management server 1 according to the present embodiment.
  • the management server 1 includes an input / output unit I1, a storage unit M1, and a control unit P1.
  • the input / output unit I1 includes a communication unit 111.
  • the storage unit M1 includes an order information storage unit 121, a game setting storage unit 122, a learning setting storage unit 123, a situation information storage unit 124, a collection information storage unit 125, and a service log storage unit 126.
  • the control unit P1 includes an order management unit 131, a setting update unit 132, a game setting unit 133, a learning setting unit 134, a service management unit 135, and a delivery management unit 136.
  • FIG. 7 is a schematic view showing an example of an order table according to the present embodiment.
  • the order table is used to generate the basic order display G211 (FIG. 4).
  • items of order ID, request source, request date, delivery deadline, delivery information, delivery date, order learning ID, order charge ID, and service ID are associated with each other.
  • the order ID is used as the primary key, and the basic order information among the order information is stored as a record.
  • Delivery information is information indicating the delivered item (additional learning information or collected data set) and the delivery destination.
  • the URI of the artificial intelligence server 5 is stored in the delivery destination.
  • the administrator or the like delivers the delivered product for the order of a certain order ID
  • the date is input to the delivery date of the record of the order ID. If there is no date on the delivery date, the delivery status is undelivered, and if there is no date on the delivery date, the delivery status is already delivered.
  • the order learning ID and the order charge ID are identifiers for associating with the order learning table and the order charge table, respectively, and are generated by the management server 1.
  • the order learning ID and the order charge ID are identifiers for associating the order learning table and the order charge table with the order table, respectively, and are generated by the management server 1.
  • the service ID associates the learning setting table, the game setting table, the status management table, and the collection management table with the order table.
  • FIG. 8 is a schematic view showing an example of an order learning table according to the present embodiment.
  • the order learning table is used to generate the order charge display G213 (FIG. 4).
  • each item of the order learning ID, the reference model setting, the reference data set, the order class setting, and the order data collection condition is associated with each other.
  • the order learning information is stored as a record among the order information with the order learning ID as the primary key.
  • the reference model setting and the reference data set store the URI of the storage destination of the reference model setting and the reference data set, respectively.
  • FIG. 9 is a schematic view showing an example of an order charge table according to the present embodiment.
  • the order charge table is used to generate the order charge display G213 (FIG. 4).
  • the order learning table each item of order charge ID, recognition rate unit price, data number unit price, user number unit price, battle character addition, parameter unit price, and reward addition is associated.
  • the order charge information is stored as a record among the order information with the order charge ID as the primary key.
  • Each item of the order learning table is a unit price of the charge setting displayed on the order charge display G213.
  • As the parameter unit price an example of the unit price for hit points is shown, but the unit price may be set for each variable in other games.
  • FIG. 10 is a schematic view showing an example of a game setting table according to the present embodiment.
  • the game setting table is used to generate the game setting display G221 and the learning setting display G222 (FIG. 4), and is updated with the contents displayed on the game setting display G221 and the learning setting display G222.
  • items of service ID, game_data collection condition, setting class, game ID, event ID, battle character ID, reward ID, and related server are associated with each other.
  • the service ID is used as the primary key, and the game setting is stored as a record.
  • the game_data collection condition is a condition set in the game server 3 among the data collection conditions.
  • the game_data collection condition is a reward condition.
  • the reward ID is an identifier that identifies the reward
  • the URI of the management server 1, the game server 3, and the learning server 4 is stored in the related server generated for each reward setting.
  • FIG. 11 is a schematic view showing an example of the learning setting table according to the present embodiment.
  • the learning setting table is used for generating the learning setting display G222 (FIG. 4), and is updated with the contents displayed on the learning setting display G222.
  • each item of service ID, learning_data collection condition, setting class, standard learning setting, standard data set, and related server is associated.
  • the learning setting is stored as a record with the service ID as the primary key.
  • the learning_data collection condition is a condition set in the learning server 4 among the data collection conditions.
  • the learning_data collection condition is the condition of the collection period, the number of cases, and the model recognition rate.
  • the URI of the management server 1, the game server 3, and the learning server 4 is stored in the related server.
  • FIG. 12 is a schematic view showing an example of a game status table according to the present embodiment.
  • the game status table is used to generate the service management screen G3 (FIG. 5).
  • each item of service ID, game status, first class game status, second class game status, third class game status, and game report setting is associated.
  • the game status information is stored as a record with the service ID as the primary key.
  • the game status stores the number of battles, the number of successes, the number of failures, and their time changes as the service status (overall).
  • the first class game situation, the second class game situation, and the third class game situation include the number of matches, the number of successes, the number of failures, and their times for the first class, the second class, and the third class, respectively. Changes are stored.
  • the game report setting is a setting for reporting game status information, and stores the URI and report timing of the report destination (management server 1).
  • FIG. 13 is a schematic view showing an example of a collection status table according to the present embodiment.
  • the collection status table is used to generate the service management screen G3 (FIG. 5).
  • each item of service ID, collection status, first class collection status, second class collection status, third class collection status, and collection report setting is associated.
  • the collection status information is stored as a record with the service ID as the primary key.
  • the collection status stores the model recognition rate and the number of data sets as the service status (overall), and their changes over time.
  • the first class collection status, the second class collection status, and the third class collection status include the model recognition rate, the number of data sets, and their temporal changes for the first class, the second class, and the third class, respectively.
  • the collection report setting is a setting for reporting collection status information, and stores the URI and report timing of the report destination (management server 1).
  • FIG. 14 is a schematic view showing an example of a collection management table according to the present embodiment.
  • the collection management table is used to manage additional learning information and collected data sets.
  • each item of service ID, additional learning information, first class data set, second class data set, third class data set, and acquisition date and time is associated with each other.
  • the collection information is stored as a record with the service ID as the primary key.
  • the URI of the additional learning information is stored in the additional learning information.
  • the first class data set, the second class data set, and the third class data set store the URIs of the collected data sets of the first class, the second class, and the third class, respectively.
  • FIG. 15 is a schematic view showing an example of a service log according to the present embodiment.
  • the service log is composed of a user ID, a date and time, a service ID, model information, a confirmed class, a data set, recognition information, a game ID, an event ID, a battle character ID, and a reward ID.
  • the service log is a history when recognition evaluation is performed.
  • the user ID is an identifier that identifies the user.
  • the user ID is a user ID in the service that collects data, but may be a user ID that identifies the user in the game.
  • the model information is the identification information of the trained model used for the recognition evaluation.
  • the recognition information is a model recognition rate, a recognition rate improvement value, and a recognition evaluation value.
  • the data set is a data set of a class (confirmed class) and an image input by the user.
  • the service log of FIG. 15 shows the class and image of the "data set" from the user of the "user ID" to the learning model indicated by the "model information" in the service of the "service ID" at the date and time of the "date and time”.
  • a data set is input, and this data set indicates that the recognition evaluation has become the model recognition rate, the recognition rate improvement value, and the recognition evaluation value of "recognition information".
  • this data set is input in a battle with the opponent character of the "competition character ID” in the event of the "event ID” of the game of the "game ID”, and the reward of the "reward ID” is given to the user. Show that.
  • FIG. 16 is a flow chart showing an example of processing of the management server 1 according to the present embodiment. Hereinafter, the processing of each part of the management server 1 will be described with reference to FIG.
  • Each unit of the management server 1 communicates with other devices via the communication unit 111.
  • Step S201 The order management unit 131 acquires order information from the terminal T1.
  • the order management unit 131 acquires the reference model setting and the reference data set from the artificial intelligence server 5.
  • the order management unit 131 stores the order information in the order table, the order learning table, and the order charge table of the order information storage unit 121.
  • Step S202 The setting update unit 132 generates a service setting screen G2 based on the order information in step S201 and displays it on the terminal T1.
  • the setting update unit 132 updates the game setting and the learning setting based on the input from the administrator.
  • the setting update unit 132 determines, for example, a class having a low recognition rate when "automatic" is selected in the class setting.
  • Step S203 The game setting unit 133 stores the game setting updated in step S202 in the game setting table of the game setting storage unit 122, and transmits the game setting to the game server 3.
  • Step S204 The learning setting unit 134 stores the learning setting updated in step S202 in the learning setting table of the learning setting storage unit 123, and transmits the learning setting to the learning server 4.
  • Step S205 The service management unit 135 acquires a service log from the learning server 4 and stores it in the service log storage unit 126.
  • the service management unit 135 acquires game status information from the game server 3 and stores it in the game status table of the status information storage unit 124.
  • the service management unit 135 acquires the collection status information from the learning server 4 and stores it in the learning status table of the status information storage unit 124.
  • Step S206 The service management unit 135 determines whether or not the learning information requirement condition is satisfied.
  • the learning information requirement condition is, for example, a condition that the administrator clicks the buttons BT32, BT33, BT34, BT35, or BT38 in FIG. Further, the learning information requirement condition is, for example, a condition that the data collection condition of the learning setting is satisfied. If the learning information requirement is not satisfied, the service management unit 135 continues the processes of steps S205 and S206.
  • Step S207 When the learning information request condition is satisfied, the service management unit 135 transmits an additional learning information request to the learning server 4.
  • the service management unit 135 acquires additional learning information and collected data sets from the learning server 4 and saves them in a folder.
  • the service management unit 135 stores the storage destination URI in the collection management table of the collection information storage unit 125.
  • Step S208 The delivery management unit 136 transmits the additional learning information and the collected data set acquired in step S206 to the delivery destination (for example, the artificial intelligence server 5) of the delivery information according to the delivery instruction from the manager.
  • the delivery management unit 136 writes the date on the delivery date of the order information in the order table. When the delivery date is input by the administrator, the delivery management unit 136 may write the date on the delivery date.
  • Step S209 The service management unit 135 aggregates the service logs acquired in step S205 and analyzes them together with the game status information and the collection status information.
  • FIG. 17 is a schematic block diagram showing the configuration of the mobile terminal 2 according to the present embodiment.
  • the mobile terminal 2 includes an input / output unit I2, a storage unit M2, and a control unit P2.
  • the input / output unit I2 includes a communication unit 211, an input unit 212, an output unit 213, an imaging unit 214, and a sensor unit 215.
  • the storage unit M2 includes an operation storage unit 221, a game storage unit 222, and a data storage unit 223.
  • the control unit P2 includes an operation unit 231, a game control unit 232, a shooting control unit 233, an information viewing unit 234, a file management unit 235, and a display control unit 236.
  • the communication unit 211 is realized by a communication module and communicates with other devices.
  • the input unit 212 is realized by a touch panel or a software keyboard, and receives input from the user.
  • the input unit 212 is realized by a microphone or a physical button, and receives input by voice or pressing from the user.
  • the output unit 213 is realized by a display and displays an image (including characters).
  • the output unit 213 is realized by a speaker, a light, or an oscillator, and outputs by sound, light, or vibration.
  • the image pickup unit 214 is realized by a camera and records an image (including a moving image) captured by the image pickup element as digital data (image file).
  • the sensor unit 215 is realized by sensors such as GPS (Global Positioning System), acceleration sensor, gyro sensor, or illuminance sensor, and measures the state of the device or the surrounding environment of the device (including the user's state), and the measurement result. Save the data of.
  • the operation unit 231 operates the computer by the OS installed in the operation storage unit 221.
  • the operation unit 231 performs an operation by reading and writing data to and from the operation storage unit 221.
  • the game control unit 232 controls the game by the game application installed in the game storage unit 222.
  • the game control unit 232 controls the game by reading and writing data to and from the game storage unit 222. The details of the game control unit 232 will be described later.
  • the imaging control unit 233 is an application that performs imaging using the imaging unit 214.
  • the shooting control unit 233 is operated by calling an API (application programming interface) from the game control unit 232.
  • the imaging control unit 233 stores the image file of the image captured by the imaging unit 214 in the data storage unit 223.
  • the information viewing unit 234 is a web browser.
  • the information viewing unit 234 calls the API from the game control unit 232 to allow the user to browse a file on the web (for example, the Internet).
  • the information viewing unit 234 is an application capable of transmitting and receiving images.
  • the information viewing unit 234 downloads the image file and stores it in the data storage unit 223.
  • the file management unit 235 is a file browser.
  • the file management unit 235 calls the API from the game control unit 232 and causes the user to browse the file stored in the storage unit M2.
  • the display control unit 236 generates a video signal according to the video data from each unit of the control unit P2, and causes the output unit 213 to display the image.
  • the shooting control unit 233, the information viewing unit 234, and the file management unit 235 may be applications that directly operate by input from the user.
  • FIG. 18 is a schematic block diagram showing the configuration of the game server 3 according to the present embodiment.
  • the game server 3 includes an input / output unit I3, a storage unit M3, and a control unit P3.
  • the input / output unit I3 includes a communication unit 311.
  • the storage unit M3 includes an operation storage unit 321 and a management application storage unit 322.
  • the control unit P3 includes an operation unit 331 and a management application control unit 332.
  • the communication unit 311 is realized by a communication module and communicates with other devices.
  • the operation unit 331 operates the computer by the OS installed in the operation storage unit 321.
  • the operation unit 331 performs an operation by reading and writing data to the operation storage unit 321.
  • the management application control unit 332 controls the game of the mobile terminal 2 by the management application installed in the management application storage unit 322.
  • the management application control unit 332 controls the game by reading and writing data to the management application storage unit 322. Details of the management application control unit 332 will be described later.
  • FIG. 19 is a schematic block diagram showing the configuration of the game control unit 232 and the management application control unit 332 according to the present embodiment.
  • the game control unit 232 includes an event management unit 2321, a class presentation unit 2322, an image acquisition unit 2323, a data set providing unit 2324, a variable value updating unit 2325, and a reward giving unit 2326.
  • the management application control unit 332 includes an event notification unit 3321, a class management unit 3322, a data set reception unit 3323, a determination unit 3324, a reward determination unit 3325, and a log generation unit 3326.
  • FIG. 20 is a sequence diagram showing an example of processing of the game control unit 232 and the management application control unit 332 according to the present embodiment.
  • the management application control unit 332 stores the game setting (FIG. 10) received from the management server 1 in the management application storage unit 322.
  • Step S301 The event notification unit 3321 reads the game settings stored in the management application storage unit 322, and notifies the game control unit 232 of the service ID, game ID, event ID, and battle character ID of the game settings.
  • Step S302 The event management unit 2321 causes the display control unit 236 to display the icon corresponding to the battle character ID in the game with the game ID notified in step S301. When this icon is tapped by the user, the event management unit 2321 notifies the management application control unit 332 of the service ID.
  • the class management unit 3322 refers to the setting class corresponding to the service ID notified in step S302 in the game setting.
  • the class management unit 3322 notifies the game control unit 232 of the first class, the second class, and the third class as the referenced setting class.
  • the class presentation unit 2322 causes the display control unit 236 to display the setting class notified in step S303. For example, in FIG. 1, the display control unit 236 displays the first class (cat), the second class (cheese), and the third class (automobile) in the area G112 of the screen G11 (output unit 213).
  • Step S305 When the user selects shooting, the image acquisition unit 2323 calls the shooting control unit 233 to cause the user to shoot. The user photographs the object of the setting class displayed in step S304.
  • the image acquisition unit 2323 acquires an image captured by the imaging control unit 233. For example, in FIG. 1, the user taps the button BT11 on the screen G11 to capture the image G121 on the screen G12.
  • the image acquisition unit 2323 calls the file management unit 235 to allow the user to select an image file.
  • the image acquisition unit 2323 acquires the image selected by the file management unit 235.
  • the data set providing unit 2324 causes the display control unit 236 to display a display for the user to select a class. For example, in FIG. 1, the display control unit 236 causes the screen G12 (output unit 213) to select one of the first class (cat), the second class (cheese), and the third class (automobile). The menu G122 is displayed. When the user selects a class, the data set providing unit 2324 sets the selected class as a definite class. (Step S307) The data set providing unit 2324 transmits the image acquired in step S305 and the confirmation class selected in step S306 as a data set to the management application control unit 332.
  • Step S308 The data set receiving unit 3323 receives the data set transmitted in step S307.
  • the determination unit 3324 transmits the data set received in step S308 to the learning server 4 as an evaluation request requesting recognition evaluation.
  • the determination unit 3324 receives the recognition rate improvement value from the learning server 4 as the evaluation result of the recognition evaluation.
  • the recognition rate improvement value is a value obtained by evaluating the improvement degree of the model recognition rate on a scale of 10 (FIG. 27 described later).
  • the reward determination unit 3325 determines the reward to be given to the user according to the recognition rate improvement value received in step S309 (also referred to as “reward determination process”). The reward determination process will be described later (see FIG. 20).
  • the variable value updating unit 2325 updates the variable (hit point) in the game among the rewards determined in step S301.
  • the variable value update unit 2325 causes the display control unit 236 to display the update result. For example, in FIG. 1, the display control unit 236 displays the image G132 (minus 300 points) and the image G133 (plus 100 points) on the screen G13 (output unit 213).
  • the reward giving unit 2326 grants a game object (card) among the rewards determined in step S301.
  • the reward giving unit 2326 causes the display control unit 236 to display the result of the grant. For example, in FIG. 1, the display control unit 236 displays the card G141 on the screen G14 (output unit 213).
  • Step S311 The log generation unit 3326 generates a game log (see FIG. 15) and transmits it to the management server 1. Specifically, the log generation unit 3326 displays the user's "user ID", the "date and time” when the recognition rate improvement value is received in step S309, and the "data set” (confirmed class and image) in step S307, as a game log. Record as. Further, the log generation unit 3326 includes a "game ID", an "event ID”, a "competition character ID” corresponding to the "service ID” notified in step S302, and a "reward ID” of the reward determined in step S301. Is recorded in the game log. The log generation unit 3326 transmits the recorded game log to the learning server 4.
  • the log generation unit 3326 generates game status information by calculating the number of battles, the number of successes, the number of failures, and their time changes for each service ID and setting class.
  • the log generation unit 3326 transmits to the management server 1 according to the game report setting.
  • the reward determination process performed by the reward determination unit 3325 will be described.
  • the reward determination unit 3325 refers to the reward selection table (FIG. 21), and sets the reward for the recognition rate improvement value as the reward given to the user.
  • FIG. 21 is a schematic view showing an example of the reward selection table according to the present embodiment.
  • the reward selection table is stored in the management application storage unit 322 and used for the reward determination process.
  • the reward selection table may be updated by input from the service setting screen G2 (FIG. 4).
  • each item of service ID, recognition evaluation value, target variable, variable value, grant condition, and game object is associated.
  • the reward selection information is stored as a record with the service ID and the recognition evaluation value as the primary keys.
  • the target variable is a variable in the game that is updated as a reward.
  • the variable value is the updated variable value or the change in the variable value.
  • the grant condition is a condition for granting a game object.
  • the higher the recognition evaluation value that is, the higher the model recognition rate, the better the reward is set.
  • the lower the recognition evaluation value that is, the lower the model recognition rate, the worse the reward is set.
  • Better rewards are rewards that raise the variable value of the operating character higher, rewards that lower the variable value of the opponent character, rewards that are given game objects, or rewards that are given game objects of higher rarity. is there.
  • the worse reward is the reward that the variable value of the operating character goes down lower, the reward that the variable value of the opponent character goes up higher, the reward that the game object is not given, or the reward that the game object of lower rarity is given. ..
  • the reward determination unit 3325 determines the reward according to the recognition evaluation value by using the reward selection table stored in the management application storage unit 322. Specifically, the reward determination unit 3325 determines the reward as a better reward as the recognition evaluation value becomes higher. On the contrary, the reward determination unit 3325 determines the reward as a worse reward as the recognition evaluation value becomes lower.
  • the recognition rate improvement value is a value obtained by subtracting the model recognition rate of the trained model before training from the model recognition rate of the trained model after training by the data set.
  • FIG. 22 is a schematic block diagram showing the configuration of the learning server 4 according to the present embodiment.
  • the learning server 4 includes an input / output unit I4, a storage unit M4, and a control unit P4.
  • the input / output unit I4 includes a communication unit 411.
  • the storage unit M4 includes a learning setting storage unit 421, a reference storage unit 422, a collection data storage unit 423, and a collection log storage unit 424 for each service ID.
  • the control unit P4 includes a learning setting unit 431, a data acquisition unit 432, a learning unit 433, an evaluation unit 434, and a reporting unit 435.
  • the collected data storage unit 423 includes an additional learned model storage unit 4231, a first data set storage unit 4232, a second data set storage unit 4233, and a third data set storage unit 4234.
  • FIG. 23 is a flow chart showing an example of processing of the learning server 4 according to the present embodiment. Hereinafter, the processing of each part of the learning server 4 will be described with reference to FIG. Each part of the learning server 4 communicates with another device via the communication part 411.
  • the learning setting unit 431 receives the learning setting (FIG. 11) transmitted from the management server 1 and stores it in the learning setting storage unit 421.
  • the learning setting unit 431 sets an opportunity learning program for the learning setting.
  • the trained model of the opportunity learning program set at this time is also referred to as a "standard trained model”.
  • the learning setting unit 431 stores the learning setting reference data set in the learning setting storage unit 421.
  • the learning setting unit 431 calculates the model recognition rate (also referred to as “reference recognition rate”) for the class of the reference data set by inputting the image of the reference data set into the reference trained model set in step S401. ..
  • the learning setting unit 431 inputs the cat image and determines the probability that the image is the "cat" among the output probabilities for each class. Calculated as the standard recognition rate.
  • the learning setting unit 431 stores the calculated reference recognition rate in the reference storage unit 422 as the reference recognition rate.
  • the learning setting unit 431 calculates the reference recognition rate based on at least one pair of reference data sets for each class and stores it in the reference storage unit 422.
  • the data acquisition unit 432 receives the evaluation request (step S114 of FIG. 3 and step S309 of FIG. 20) transmitted from the game server 3 and acquires the data set input from the user.
  • the data acquisition unit 432 stores the acquired data set in the collection data storage unit 423.
  • the data acquisition unit 432 may be used in the first data set storage unit, the second data set storage unit, and the third data set storage unit, respectively, when the definite classes are "cat", “cheese", and "automobile", respectively.
  • Step S404 Using the data set acquired in step S403, the learning unit 433 causes the opportunity learning program to perform further machine learning on the reference trained model set in step S401.
  • the trained model generated by the opportunity learning program by this machine learning is also referred to as an "evaluation trained model”.
  • the evaluation unit 434 calculates the model recognition rate (also referred to as “evaluation recognition rate”) by inputting the image of the reference data set of the fixed class of the data set into the evaluation-learned model.
  • the evaluation unit 434 calculates a value obtained by subtracting the reference recognition rate from the calculated evaluation recognition rate as a recognition rate improvement value.
  • Step S406 The evaluation unit 434 determines the recognition evaluation value according to the calculated recognition rate improvement value using the evaluation value table (see FIG. 27).
  • the evaluation unit 434 returns the determined recognition evaluation value as a response to the evaluation request in step S403. Details of the evaluation process from step S404 to step S406 will be described later.
  • Step S407 The reporting unit 435 receives the log (step S117 in FIG. 3 and step S313 in FIG. 20) transmitted from the game server 3.
  • the reporting unit 435 generates a service log by adding a model recognition rate, a recognition rate improvement value, and a recognition evaluation value as recognition information to the received log.
  • the reporting unit 435 stores the generated service log in the collection log storage unit 424 and transmits it to the management server 1 (see FIG. 15).
  • the reporting unit 435 generates collection status information by calculating the model recognition rate, the number of data sets, and their time changes for each service ID and setting class.
  • the reporting unit 435 transmits to the management server 1 according to the collection report setting.
  • Step S408 The reporting unit 435 determines whether or not the condition of "learning_data collection condition" of the learning setting is satisfied. When the condition is satisfied, the control unit P4 repeats the processes of steps S403 to S407.
  • the control unit P4 ends the data set collection.
  • the reporting unit 435 notifies the game server 3 of the service ID to be terminated, and terminates the event of the event ID corresponding to the service ID. If the condition for only a specific class (also referred to as "end class") is not satisfied, the control unit P4 ends the collection of the data set for that end class.
  • the reporting unit 435 notifies the game server 3 of the service ID to be terminated and the termination class, and causes, for example, to delete the display of the termination class in the event of the event ID corresponding to the service ID. In this case, for the other classes, the control unit P4 repeats the processes of steps S403 to S407.
  • Step S408 When the additional learning information request is received from the management server, the learning unit 433 receives the data stored in the first data set storage unit 4232, the second data set storage unit 4233, and the third data set storage unit 4234. Read the set (collected data set). The learning unit 433 causes the opportunity learning program to perform machine learning on the reference trained model using the read collected data set. With this machine learning, the opportunity learning program generates an additional trained model. The reporting unit 435 transmits the additional learning information and the collected data set of the additional learning model to the management server 1 as a response to the additional learning information request. In the case of a neural network such as CNN, the additional learning information includes a weighting coefficient of the additional learning model.
  • the additional learning information includes a weighting coefficient of the additional learning model.
  • the learning unit 433 extracts an image and a confirmation class from the data set input by the user.
  • the learning unit 433 sets the pixel value of the image as an input variable for inputting to the input layer and the deterministic class as an output variable output from the output layer for the CNN for learning.
  • the output variable may be a numerical value or a classification associated with a definite class.
  • FIG. 24 is an explanatory diagram illustrating an execution procedure in machine learning according to the present embodiment.
  • the CNN is composed of L layers L0 to L4.
  • the layer L1 is also called an input layer
  • the layers L2 to L3 are also called an intermediate layer or a hidden layer
  • the layer L4 is also called an output layer.
  • the input image is input to the input layer L0.
  • the input image is represented by a pixel matrix D11 in which the vertical position and the horizontal position of the input image are the positions of the matrix.
  • an R (red) sub-pixel value, a G (green) sub-pixel value, and a B (blue) sub-pixel value are input as pixel sub-pixel values corresponding to the positions of the matrix.
  • the first intermediate layer L1 is a layer on which a convolution process (also called a filter process) and a pooling process are performed.
  • the convolution process is a process of filtering the original image and outputting a feature map.
  • the input pixel value is divided into a sub-pixel matrix D121 of R, a sub-pixel matrix D122 of B, and a sub-pixel matrix D123 of G, respectively.
  • Each of the sub-pixel matrices D121, D122, and D123 (each also referred to as "sub-pixel matrix D12") is a submatrix of each element of the submatrix and a convolution matrix of the s row and t columns.
  • the first pixel value is calculated by multiplying and adding the elements of CM1 (also called the kernel).
  • the first pixel value calculated by each sub-pixel matrix D12 is multiplied by a weighting coefficient and added to calculate the second pixel value.
  • the second pixel value is set in each element of the convolution image matrix D131 as a matrix element corresponding to the position of the submatrix. By shifting the position of the submatrix in each sub-pixel matrix D12 for each element (sub-pixel), the second pixel value at each position is calculated, and all the matrix elements of the convoluted image matrix D131 are calculated.
  • FIG. 24 is an example of the case of the 3-by-3 convolution matrix CM1
  • the convolution pixel value D1311 is the second to fourth rows and the second to fourth columns of each sub-pixel matrix D12.
  • the first pixel value is calculated for the submatrix of 4 rows and 4 columns up to the eye.
  • the second pixel value is used as the matrix element of the second row and second column of the convoluted image matrix D131. It is calculated.
  • the second pixel value of the matrix element in the third row and the second column of the convolution image matrix D131 is calculated from the submatrix in the third to fifth rows and the second to fourth columns.
  • the convolution image matrix D132, ... Is calculated using another weighting coefficient or another convolution matrix.
  • the pooling process is a process of reducing an image while retaining the features of the image.
  • the representative values of the matrix elements in the region are calculated for each region PM of u rows and v columns.
  • the representative value is, for example, the maximum value.
  • the representative value is set in each element of the CNN image matrix D141 as a matrix element corresponding to the position of the region. By shifting the region in the convolutional image matrix D131 for each region PM, the representative value at each position is calculated, and all the matrix elements of the convolutional image matrix D131 are calculated.
  • FIG. 24 is an example in the case of the area PM of 2 rows and 2 columns, and is the area of 2 rows and 2 columns from the 3rd row to the 4th row and the 3rd column to the 4th column of the convolution image matrix D131.
  • the maximum value of the second pixel value in the region is calculated as a representative value.
  • This representative value is set in the matrix element of the second row and second column of the CNN image matrix D141.
  • the representative values of the matrix elements in the third row and the second column of the CNN image matrix D141 are calculated from the submatrixes in the fifth to sixth rows and the second to fourth columns.
  • a vector x is generated by arranging each matrix element (N) of the CNN image matrices D141, D142, ... In a predetermined order.
  • the function f (u (i) ) is an activation function, and the vector b (i) is a bias.
  • the vector u (0) is a vector x.
  • CCN outputs the vector y as an output variable when the pixel value of the input image is input as an input variable.
  • the vector y represents the recognition rate for each class.
  • FIG. 25 is an explanatory diagram illustrating a learning procedure in machine learning according to the present embodiment. In this figure, it is explanatory drawing when CNN of FIG. 24 performs machine learning.
  • the vector x output from the first intermediate layer be the vector X with respect to the pixel value of the image of the data set.
  • vector Y be a vector representing the definite class of the data set.
  • Initial values are set in the weight matrix W (i) .
  • the vector X is input to the second intermediate layer
  • the vector y (X) corresponding to the vector X is output from the output layer.
  • the error E between the vector y (X) and the vector Y is calculated using the loss function.
  • Gradient Delta] E i of the i-layer is calculated using the output z i and the error signal [delta] i from each layer.
  • the error signal ⁇ i is calculated using the error signal ⁇ i-1 .
  • transmitting an error signal from the output layer side to the input layer side in this way is also called back propagation.
  • the weight matrix W (i) is updated based on the gradient ⁇ E i .
  • the convolution matrix CM or the weighting coefficient is updated.
  • the learning setting unit 431 determines the number of layers, the number of nodes in each layer, the node connection method between each layer, the activation function, the error function, the gradient descent algorithm, the pooling area, the kernel, the weighting coefficient, and the weight matrix. Set.
  • the present invention is not limited to this, and the total number may be five or more layers.
  • the learning setting unit 431 performs 20 convolution matrix CMs of 5 rows and 5 columns, and sets a region PM of 2 rows and 2 columns.
  • the present invention is not limited to this, and a different number of matrices or a different number of convolution matrix CMs may be set. Further, a region PM having a different number of matrices may be set.
  • the learning setting unit 431 may perform more convolution processing or pooling processing.
  • the learning setting unit 431 sets a full connection as a connection of each layer of the neural network.
  • the bonding of some or all layers may be set to non-total bonding.
  • the learning setting unit 431 sets a sigmoid function as an activation function for the activation functions of all layers.
  • the activation function of each layer is a step function, a linear connection, a soft sign, a soft plus, a ramp function, a truncated power function, a polynomial, an absolute value, a radial basis function, a wavelet, maxout, etc.
  • Other activation functions may be used.
  • the activation function of one layer may be of a different type from that of another layer.
  • the learning setting unit 431 sets the square loss (mean square error) as an error function.
  • the error function may be cross entropy, ⁇ -division loss, Huber loss, or ⁇ sensitivity loss ( ⁇ tolerance function).
  • the learning setting unit 431 sets SGD (stochastic gradient descent) as an algorithm for calculating the gradient (gradient descent algorithm).
  • SDG stochastic gradient descent
  • Momentum inertia term
  • SDG AdaGrad
  • RMSprop AdaDelta
  • Adam Adaptive momentum
  • the learning setting unit 431 is not limited to the convolutional neural network (CNN), and may set other neural networks such as a perceptron neural network, a recurrent neural network (RNN), and a residual network (ResNet).
  • CNN convolutional neural network
  • RNN recurrent neural network
  • ResNet residual network
  • the learning setting unit 431 partially or all trained models of supervised learning such as decision tree, regression tree, random forest, gradient boosting tree, linear regression, logistic regression, or SVM (support vector machine). May be set to.
  • the learning unit 433 acquires the weight matrix w (i) the convolution matrix CM or the CNN whose weight coefficient is updated as an evaluation-learned model.
  • the evaluation unit 434 inputs the pixel value of the image of the reference data set into the evaluation-learned model, and acquires the evaluation recognition rate as the output.
  • the evaluation unit 434 calculates a value obtained by subtracting the reference recognition rate from the calculated evaluation recognition rate as a recognition rate improvement value.
  • FIG. 26 is an explanatory diagram illustrating the calculation process of the recognition rate improvement value according to the present embodiment.
  • This figure is an explanatory diagram when the processing of FIG. 23 is performed when the definite class is “cat”.
  • the reference recognition rate in the reference trained model is "89%" of "cat” with respect to the image of the reference data set.
  • an "evaluation trained model” is generated.
  • the reference recognition rate in the "evaluation-learned model” is "90.2%” of "cat” with respect to the image of the reference data set.
  • the recognition rate improvement value in the class "cat” is calculated to be 1.2% (90.2% -89%).
  • FIG. 27 is a schematic view showing an example of an evaluation value table according to the present embodiment.
  • the evaluation unit 434 determines the recognition evaluation value according to the recognition rate improvement value by using the evaluation value table stored in the reference storage unit 422.
  • the evaluation value table may be updated by input from the service setting screen G2 (FIG. 4).
  • each item of the service ID, the recognition rate improvement value, and the recognition evaluation value is associated with each other.
  • the recognition evaluation value the evaluation value information is stored as a record with the service ID and the recognition rate improvement value as the primary keys. The higher the recognition rate improvement value, the higher the recognition evaluation value is set. On the contrary, the recognition evaluation value is set to a lower value as the recognition rate improvement value becomes lower.
  • the relationship between the recognition rate improvement value and the recognition evaluation value can be set differently for each service ID.
  • the recognition rate improvement value is usually different in different reference model settings (reference trained model).
  • the relationship between the recognition rate improvement value and the recognition evaluation value can be set for each service ID, so that the machine learning system Sys can set different relationships even when the reference model settings are different (the service IDs are also different).
  • the machine learning system Sys can absorb the difference in the standard and give a reward to the user even if the calculation standard of the recognition rate improvement value in the recognition evaluation changes.
  • FIG. 28 is a schematic block diagram showing the configuration of the artificial intelligence server 5 according to the present embodiment.
  • the artificial intelligence server 5 includes an input / output unit I5, a storage unit M5, and a control unit P5.
  • the input / output unit I5 includes a communication unit 511.
  • the storage unit M5 includes an operation storage unit 521 and an application storage unit 522.
  • the control unit P5 includes an operation unit 531, an equipment control unit 532, and a learning unit 533.
  • the communication unit 511 is realized by a communication module and communicates with other devices.
  • the operation unit 531 operates the computer by the OS installed in the operation storage unit 521.
  • the operation unit 531 performs an operation by reading and writing data to and from the operation storage unit 521.
  • the device control unit 532 controls the control device 6 by the application installed in the application storage unit 522.
  • the device control unit 532 stores the additionally learned model delivered from the management server 1 in the application storage unit 522.
  • the device control unit 532 inputs the image input from the control device 6 into the additionally trained model, and controls the control device 6 by using the output class.
  • the learning unit 533 may perform further machine learning on the additionally trained model using another data set. Further, the learning unit 533 may perform machine learning on another trained model (for example, a reference trained model) by using a part or all of the collected data set delivered from the management server 1. ..
  • FIG. 29 is a schematic block diagram showing the configuration of the control device 6 according to the present embodiment.
  • the control device 6 includes an input / output unit I6, a storage unit M6, and a control unit P6.
  • the input / output unit I6 includes a communication unit 611, an input unit 612, an output unit 613, an image pickup unit 614, a sensor unit 615, and a part or all of the drive unit 616.
  • the storage unit M6 includes an operation storage unit 621 and an application storage unit 622.
  • the control unit P6 includes an operation unit 631, an application control unit 632, and a shooting control unit 633.
  • the communication unit 611 is realized by a communication module and communicates with other devices.
  • the input unit 612 is realized by a touch panel or a software keyboard, and receives input from the user.
  • the input unit 612 is realized by a microphone or a physical button, and receives input by voice or pressing from the user.
  • the output unit 613 is realized by a display and displays an image (including characters).
  • the output unit 613 is realized by a speaker, a light, or an oscillator, and outputs by sound, light, or vibration.
  • the image pickup unit 614 is realized by a camera and records an image (including a moving image) captured by the image pickup device as digital data (image file).
  • the sensor unit 615 is realized by sensors such as GPS, acceleration sensor, gyro sensor, illuminance sensor, infrared sensor, temperature sensor, and attitude sensor, measures the state of the device or the surrounding environment of the device, and stores the data of the measurement result. ..
  • the drive unit 616 is an operating device such as an arm portion or a grip portion of a robot arm, a control device such as air conditioning or temperature control, and a device that changes a physical operation or a physical state.
  • the operation unit 631 operates the computer by the OS installed in the operation storage unit 621.
  • the operation unit 631 performs an operation by reading and writing data to and from the operation storage unit 621.
  • the application control unit 632 controls the output by the application installed in the application storage unit 622.
  • the application control unit 632 controls the output by reading and writing data to the application storage unit 622.
  • the imaging control unit 633 is an application that performs imaging using the imaging unit 614.
  • the shooting control unit 633 calls the API from the application control unit 632 and operates.
  • the application control unit 632 transmits the image taken by the imaging unit 614 to the artificial intelligence server 5.
  • the application control unit 632 receives the class from the artificial intelligence server 5.
  • the application control unit 632 controls each unit of the input / output unit I6 according to the received class.
  • the machine learning system (for example, the machine learning system Sys) includes a first system (for example, a data acquisition system SysA) and a second system (artificial intelligence system SysB).
  • a presentation unit for example, a game control unit 232, a class presentation unit 2322
  • objective information for machine learning for example, a class
  • the input unit (for example, the image acquisition unit 2323) inputs explanatory information (for example, an image) for the target information from the user.
  • the acquisition unit (for example, the data set providing unit 2324, the data set receiving unit 3323, and the data acquisition unit 432) acquires the explanatory information and the target information.
  • the evaluation unit (for example, evaluation unit 434) includes a data set of an input variable (for example, a pixel value of an image) based on the explanatory information and an output variable (for example, a definite class) based on the target information, and a predetermined trained model. Based on the above, the evaluation (for example, recognition evaluation) of the classification accuracy (for example, recognition rate) of the target information based on the explanatory information is performed.
  • the reward giving unit (for example, the reward determining unit 3325 and the reward giving unit 2326) grants the reward (for example, increase / decrease in hit points, card) according to the evaluation to the user.
  • the history generation unit (for example, the reporting unit 435) generates history information (service log) associated with the target information, the evaluation result, and the reward.
  • the model storage unit (for example, the application storage unit 522) stores a trained model (for example, an additional trained model) that has been trained based on at least one of the data sets.
  • the execution unit (for example, the device control unit 532) outputs the target information when the explanatory information is input based on the learned model stored in the model storage unit.
  • the machine learning system can collect the data set of the target information and the explanatory information as the data used for the machine learning from each user after presenting the target information. Since each user inputs explanatory information, the machine learning system can acquire a large number of data sets or various data sets, and can more efficiently collect data used for machine learning. In addition, since the machine learning system can provide explanatory information by a simple operation after the user has specified the target information, it is possible to efficiently collect the data used for machine learning. In addition, since the user is given a reward according to the evaluation result, an image that improves the evaluation result is provided. In this case, the machine learning system can collect images with good evaluation results as data used for machine learning. In addition, since the machine learning system generates history information associated with the purpose information, the evaluation result, and the reward, for example, by aggregating the history information, the relationship between the purpose information, the evaluation result, and the reward can be analyzed. Can be done.
  • the objective information may be an objective variable other than the class, a dependent variable, or a foreign enemy standard.
  • the target information may be output or information related to output in supervised learning.
  • the target information may be teacher data.
  • the explanatory information may be an independent variable other than an image, and may be, for example, a character string, a waveform such as a sound, or a coordinate value such as a feature space.
  • the explanatory information may be input in supervised learning or information related to input.
  • the input variable and the output variable include duplication of explanatory information and purpose information, respectively. Further, the output variable may be an image.
  • inputting explanatory information from the user includes inputting a plurality of explanatory variables at once or continuously. For example, it includes transmitting a plurality of captured images of a "cat" to a presented class (for example, "cat") at one time.
  • Sending a plurality of images at once includes transmitting a group of continuously shot images at once.
  • the machine learning system Sys can acquire a plurality of similar images as a data set.
  • the machine learning system Sys can use, for example, an image having a high model recognition rate for learning as a plurality of image groups, and may be able to increase the recognition rate improvement value.
  • the game server 3 (control unit P3) or the learning server 4 (control unit P4) may set the maximum value of the recognition rate improvement value as the recognition rate improvement value, or the recognition rate.
  • the improvement value may be added or multiplied.
  • the game server 3 may determine a higher reward as compared with the case of transmitting one image.
  • the reward may be a reward other than the game.
  • the reward may be commercial transaction media content.
  • the commercial transaction medium may be, for example, electronic money, points in a point service, a voucher for goods or services, or a coupon.
  • Vouchers include those that download electronic data such as music, video, and images, and those that grant authority to use electronic data such as access to limited content.
  • the coupon includes, for example, a coupon that can be used at a partner restaurant, a point attached to a card that can be used at an electronic commerce site, and the like.
  • the card includes not only a credit card and a contactless card that can be used for payment of money, but also a card that can be used as a substitute for money.
  • the game server 3 may generate report information for reporting the number of rewards granted to the business partner. Further, the management server 1 may receive report information indicating the number of rewards granted from the game server 3 and generate payment information for paying to the business partner according to the number of rewards granted.
  • the classification accuracy is not limited to the classification accuracy and recognition accuracy, but also includes the identification accuracy.
  • the evaluation of the classification accuracy of the target information based on the explanatory information is not limited to the above-mentioned recognition evaluation.
  • an image of a dataset may be input and the recognition rate in the definite class may be compared with the reference recognition rate.
  • the value obtained by subtracting the reference recognition rate from the recognition rate in the definite class may be used as the recognition rate improvement value.
  • the predetermined trained model may be the type or various variables of the trained model obtained from the request destination, or may be a fixed or selected trained model.
  • the trained model used by the artificial intelligence server 5-1 and the trained model used by the learning server 4 for recognition evaluation may be different. When these are different, the management server 1 may deliver the collected data set, and the learning unit 533 may perform machine learning using the delivered collected data set.
  • the trained model used by the artificial intelligence server 5-1 may be machine-learned using a part of the collected data set.
  • the presentation unit presents target information representing an object (for example, a subject of an image).
  • the input unit inputs an image in which the object is drawn as the explanatory information.
  • the evaluation unit evaluates the classification accuracy of the target information based on the image.
  • the execution unit outputs target information representing the object.
  • the machine learning system can collect images according to the objects to be collected as data used for machine learning.
  • the user can know the presented object first, it is possible to identify the object, take a picture of the object, or search the folder.
  • the image is not limited to a photograph, an illustration, or an animation image.
  • the image may be an image in which a physical quantity is measured and its distribution is represented.
  • the image may be a thermography in which infrared rays emitted from an object are analyzed and the heat distribution is represented as a diagram.
  • Drawing may be something that can be rendered as an image or video on a computer. Further, the drawing may include being photographed, being photographed in an image, being drawn as an illustration or the like.
  • the presenting unit presents the target information to the display units of the information terminals (for example, mobile terminals 2-1 to 2-N) of a plurality of users.
  • the acquisition unit acquires the explanatory information input from the input unit of each of the information terminals.
  • the machine learning system can collect a data set of target information and explanatory information as data used for machine learning from a plurality of users. Since a plurality of users input explanatory information, the machine learning system can acquire a large number of data sets or various data sets, and can more efficiently collect data used for machine learning.
  • the information terminal is not limited to a smartphone, and may be a tablet terminal, a head-mounted display, a personal computer, a music player, a digital camera, a television, a smart speaker, a home appliance, a wearable terminal, or the like.
  • the information terminal is not limited to a portable terminal, and may be a stationary terminal.
  • the first system includes a plurality of information terminals and a server (learning server 4) connected to each of the plurality of information terminals via the Internet.
  • An application program for example, a mobile application or a game application
  • the server includes the acquisition unit.
  • the acquisition unit acquires the explanatory information and the target information from each of the information terminals of the plurality of users via the Internet.
  • the machine learning system provides the application program via the Internet, so that it can be widely used by general users.
  • the machine learning system can acquire a large number of data sets or various data sets, and can collect data used for machine learning more efficiently.
  • the application program is not limited to the game, and may be an application program such as information browsing, image browsing, communication, and office tools.
  • the first system further includes an order management unit (for example, order management unit 131) and a delivery management unit (for example, delivery management unit 136).
  • the order management unit is a request source for the second system, and manages the request source information indicating the request source for requesting the acquisition of the explanatory information and the target information.
  • the delivery management unit manages the delivery status of the data set and the delivery status to the request source indicated by the request source information.
  • the model storage unit stores a trained model that has been trained based on at least one of the delivered data sets.
  • the machine learning system can receive orders for collecting data sets from a plurality of requesters and manage the orders.
  • the machine learning system can also manage the delivery of the dataset.
  • the machine learning system can provide the administrator with a platform of a service for collecting data sets, and can smoothly carry out business by the service.
  • the presenting unit presents a plurality of the target information (see area G112 and pull-down menu G122 in FIG. 1).
  • the target information selected by the user and explanatory information for the target information are input.
  • the acquisition unit acquires the explanatory information and the target information for the plurality of the target information.
  • the user can select objective information that can provide explanatory variables from a plurality of objective information. For example, a user can choose a class that can take a picture or hold an image, so a machine learning system has the potential to collect a dataset compared to presenting only one. Can be high.
  • the machine learning system can reduce the possibility that the user cannot provide the image of the class, gives up the game, and does not use the service, as compared with the case where only one is presented.
  • the first system includes an information terminal, and the information terminal includes a presenting unit, an input unit, and an imaging unit (for example, an imaging unit 214), and the presenting unit.
  • the information terminal includes a presenting unit, an input unit, and an imaging unit (for example, an imaging unit 214), and the presenting unit.
  • Presents the target information representing the object, and the input unit inputs the image captured by the imaging unit as the explanatory information, and the image in which the object is drawn is input as the explanatory information.
  • the user can input an image to be captured or an image captured in the past from an information terminal capable of capturing and recording the image.
  • the user can take a picture of the presented object with the imaging unit of the information terminal whose presentation is referenced. Even if the presented object does not have an image in which the presented object is depicted, the user can take a picture with the information terminal that referred to the presentation and provide the taken image.
  • the game program causes each of the plurality of information terminals to function as the presentation unit, the input unit, and the reward giving unit.
  • the presenting unit presents the target information at an in-game event.
  • an image for the target information is input as the explanatory information so that the user can advance the game.
  • the reward giving unit updates variables in the game or grants game objects as rewards for the game. This allows the user to provide the dataset while having fun playing the game.
  • the in-game event is a match in the game or the like. In a game scenario, the user encounters an opponent, the user selects an opponent, or the battle starts automatically under predetermined conditions.
  • Opponents include not only non-player characters controlled by computers, but also characters operated by humans through communication and the like.
  • the setting unit causes the presentation unit to present the purpose information (for example, the recognition rate) based on the classification accuracy of the purpose information in the predetermined trained model. To determine the lower class).
  • the machine learning system can present the target information with low classification accuracy and acquire the explanatory information of the target information.
  • the machine learning system can preferentially improve the classification accuracy of the target information having low classification accuracy.
  • the setting update unit 132 inputs the reference data set to the reference trained model, and determines a class having a low recognition rate as the setting class.
  • FIG. 30 is an explanatory diagram illustrating a hardware configuration of each device according to the present embodiment.
  • Each device is a management server 1, a mobile terminal 2, a game server 3, a learning server 4, an artificial intelligence server 5, a control device 6, or a terminal T1.
  • Each device includes an input / output module I, a storage module M, and a control module P.
  • the input / output module I is realized by including a part or all of the communication module H11, the connection module H12, the pointing device H21, the keyboard H22, the display H23, the button H3, the microphone H41, the speaker H42, the camera H51, or the sensor H52. ..
  • the storage module M is realized including the tribe H7.
  • the storage module M may be further configured to include a part or all of the memory H8.
  • the control module P is realized including the memory H8 and the processor H9. These hardware components are communicably connected to each other via a bus, and are supplied with power from the power supply H6.
  • the connection module H12 is a digital input / output port such as USB (Universal Serial Bus).
  • USB Universal Serial Bus
  • the pointing device H21, the keyboard H22, and the display H23 are touch panels.
  • the sensor H52 is an acceleration sensor, a gyro sensor, a GPS receiving module, a proximity sensor, and the like.
  • the power supply H6 is a power supply unit that supplies electricity necessary for operating each device. In the case of mobile devices, the power supply H6 is a battery.
  • the drive H7 is an auxiliary storage medium such as a hard disk drive or a solid state drive.
  • the drive H7 may be a non-volatile memory such as an EEPROM or a flash memory, or a magneto-optical disk drive or a flexible disk drive. Further, the drive H7 is not limited to the one built in each device, and may be an external storage device connected to the connector of the IF module H12.
  • the memory H8 is a main storage medium such as a random access memory.
  • the memory H8 may be a cache memory.
  • the memory H8 stores these instructions when they are executed by one or more processors H9.
  • the processor H9 is a CPU (Central Processing Unit).
  • the processor H9 may be an MPU (microprocessing unit) or a GPU (graphics processing unit).
  • the processor H9 reads a program and various data from the drive H7 via the memory H8 and performs an operation to execute an instruction stored in one or a plurality of memories H8.
  • the input / output module I realizes the input / output units I1, I2, I3, I4, I5, and I6.
  • the storage module M realizes storage units M1, M2, M3, M4, M5, and M6.
  • the control module P realizes the control units P1, P2, P3, P4, P5, and P6.
  • the description of the management server 1, the mobile terminal 2, the game server 3, the learning server 4, the artificial intelligence server 5, and the control device 6 is described in the control units P1, P2, P3, P4, respectively.
  • the description of P5 and P6 may be replaced, and the description of each of these devices and the terminal T1 may be replaced with the description of the control module P.
  • the information terminal provides the user with an image of content displayed on a website such as a social network service (including a communication service), a blog, an information posting site, or an information retrieval site, or their mobile application. It may be selected and input by the user as an image of a confirmed class.
  • a website such as a social network service (including a communication service), a blog, an information posting site, or an information retrieval site, or their mobile application. It may be selected and input by the user as an image of a confirmed class.
  • FIG. 31 is a schematic view showing another example of the screen flow according to the present embodiment. This figure is an example of a screen flow displayed on the input / output unit I2 by the control unit P2 of the mobile terminal 2 which is an example of the information terminal. Comparing FIG. 31 and FIG. 1, the screen G1 and the button BT41 are different. Since the other displays are the same, the description thereof will be omitted.
  • the mobile terminal 2 When the button BT11 is touched by the user, the mobile terminal 2 (control unit P2) activates the web browser function and displays the website.
  • the screen G41 is a screen on which this website is displayed. On the screen G41, the user can select a still image or a moving image by tapping the image.
  • the button BT42 When the button BT42 is touched by the user while the image is selected, the mobile terminal 2 displays the screen G12 on which the image is selected.
  • the first system includes an information terminal.
  • the information terminal includes the presentation unit, the input unit, and an information viewing unit (for example, control unit P2, information viewing unit 234) that allows the user to view information including an image by a network service.
  • the presentation unit presents target information representing an object.
  • the input unit is at least a part of the image specified by the user, and the image on which the object is drawn is input as the explanatory information. This allows the user to select an image of the network service as an image of the dataset. Since the machine learning system can also acquire images of network services, it is possible to acquire a larger number of data sets or various data sets, and more efficiently, data used for machine learning can be collected.
  • the game application may be implemented as a function of a website such as a social network service, a blog, an information posting site, or an information search site, or a mobile application thereof.
  • the mobile terminal 2 (game application, game control unit 232) may present a setting class when the user refers to a friend's post.
  • the mobile terminal 2 presents the classes "curry", "ice cream”, and "car” when referred to a friend's post.
  • the user selects an image from the post and provides these datasets with a confirmed class.
  • the mobile terminal 2 provides a function for the user to obtain permission to select an image from a friend, and when the permission is obtained, the data set may be acquired or a reward may be given. You may.
  • the mobile terminal 2 may select a confirmation category according to a touch operation when the user selects an image.
  • Touch operations include multiple taps, drags, or swipes.
  • the mobile terminal 2 selects a confirmation category according to the positions of the start point and the end point of the drag (drag direction).
  • FIG. 32 is a schematic view showing another example of the screen flow according to the present embodiment.
  • This figure is an example of a screen flow displayed by the control unit P2 of the mobile terminal 2 on the input / output unit I2.
  • the mobile terminal 2 has a preset class to be selected for each operation. For example, when the mobile terminal 2 is dragged diagonally downward from the upper left to the lower right of the screen, the first class (cat) is selected, and when dragged from the upper right to the lower left of the screen, diagonally downward to the left. It is set to select the third class (automobile).
  • the screen G51 is dragged from the start point F51 to the end point F52, that is, from the upper left to the lower right of the screen and diagonally downward to the right.
  • the mobile terminal 2 displays a rectangle having a start point F51 and an end point F52 as vertices as a selection area G521 selected by the user, as in the screen G52.
  • the button BT51 is touched by the user while the selection area G521 is displayed, the mobile terminal 2 displays the screen G53.
  • the first class "cat" is selected and displayed as the initial value of the pull-down menu for selecting the class.
  • the screen G61 is dragged from the start point F61 to the end point F62, that is, from the upper right to the lower left of the screen and diagonally downward to the left.
  • the mobile terminal 2 displays a rectangle having a start point F61 and an end point F62 as vertices as a selection area G621 selected by the user, as in the screen G62.
  • the button BT61 is touched by the user while the selection area G621 is displayed, the mobile terminal 2 displays the screen G63.
  • the third class "automobile" is selected and displayed as the initial value of the pull-down menu for selecting the class.
  • the button BT13 is the same as that of FIG. Further, the start point and the end point may be specified by tapping twice.
  • the mobile terminal 2 selects and displays one of the pull-down menu options as an initial value according to the direction of operation or the positional relationship between the two points on the screen.
  • the mobile terminal 2 may select one or a plurality of radio button or check box options as initial values according to the direction of operation or the positional relationship between two points on the screen.
  • the mobile terminal 2 may display a shortcut menu on the screens G52 and G53 after dragging, and as a shortcut menu, prioritize the class corresponding to the direction of dragging and display it in a selectable manner.
  • the mobile terminal 2 may detect a face portion of the captured image and perform mosaic processing such as blurring the detected face portion.
  • the machine learning system Sys can acquire the image of the data set while considering the privacy protection of the user.
  • the learning server 4 (for example, the control unit P4) may acquire sound data as explanatory information.
  • FIG. 33 is a schematic view showing another example of the screen flow according to the present embodiment. This figure is an example of a screen flow displayed by the control unit P2 of the mobile terminal 2 on the input / output unit I2. Comparing FIG. 33 and FIG. 1, the screens G71, G72, and the display 732 of the screen G73 are different. Since the other displays are the same, the description thereof will be omitted.
  • the display of the area 712 and the button BT71 on the screen G71 is different from that on the screen G11.
  • the area G712 cats, dogs, and automobiles are displayed as image classes.
  • the button BT71 is touched by the user, the mobile terminal 2 activates the microphone and displays a screen (not shown) on which sound can be recorded. On this screen, the user can record the sound by tapping the record button.
  • sound data information (an example of "explanatory information”) is displayed on the image G721.
  • the sound data is sound data and can be played back by tapping the play button.
  • the image G732 of the screen 73 is an image indicating that the sound of the image G721 is highly evaluated (“GREAT Sound”).
  • the mobile terminal 2 may display guidance based on the recognition rate when the image pickup unit 214 makes an image. For example, the mobile terminal 2 recognizes an object from a captured image using a reference-learned model, and acquires the recognition rate of the object. This recognition rate may be the recognition rate of the setting class, or may be the recognition rate of the class that maximizes the recognition rate.
  • the mobile terminal 2 may transmit an image to the learning server 4, or may store the reference learned model in its own device.
  • the mobile terminal 2 displays the positional relationship with the subject, the zoom, or the guidance display of the orientation of the own device so that the recognition rate is high.
  • FIG. 34 is a schematic view showing another example of the screen flow according to the present embodiment.
  • This figure is an example of a screen flow displayed by the control unit P2 of the mobile terminal 2 on the input / output unit I2.
  • the subject S (cat) is recognized on the screen G81, and a frame G811 surrounding the subject S is displayed.
  • the guidance display G812 guides that the portion surrounded by the frame G811 should be enlarged, that is, the subject should be approached or the zoom function of the camera should be used (zoomed up).
  • the screen G82 is displayed when the user follows the guidance display and takes a large picture of the subject S.
  • the recognition rate has increased from 70% to 80% of the screen G81.
  • a frame G821 surrounding the subject S is displayed on the screen G82.
  • the guidance display G822 guides that the mobile terminal 2 should be rotated with respect to the subject S (rotation of the yaw axis).
  • the guidance display G822 also indicates that a normal card is given as a reward according to the recognition rate. That is, when the captured image of the subject S is used as a data set in the state of the screen G82, a normal card is given as a reward.
  • the screen G83 is displayed when the user rotates the mobile terminal 2 with respect to the subject S according to the guidance display.
  • the recognition rate has increased from 80% of the screen G82 to 85%.
  • a frame G831 surrounding the subject S is displayed on the screen G81.
  • the guidance display G832 indicates that the mobile terminal 2 should be rotated in another direction (rotation of the roll axis).
  • the guidance display G832 also indicates that a rare card is given as a reward according to the recognition rate. That is, when the captured image of the subject S is used as a data set in the state of the screen G82, a rare card is given as a reward.
  • the screen G84 is displayed when the user rotates the mobile terminal 2 according to the guidance display.
  • the recognition rate has increased from 85% on the screen G83 to 94%.
  • a frame G841 surrounding the subject S is displayed on the screen G84.
  • Guidance display G842 guides what should be photographed in this state.
  • the guidance display G832 also indicates that a super rare card is given as a reward according to the recognition rate. That is, when the captured image of the subject S is used as a data set in the state of the screen G84, a rare card is given as a reward.
  • the screen G85 indicates that the BT81 was tapped on the screen G84 and the frame G841 portion was photographed.
  • the management server 1 may have a plurality of users other than those who provided the data set evaluate the image of the data set, and determine whether or not the data set is appropriate according to the evaluation result. Whether or not it is appropriate as a data set may be whether or not it is used for learning as a data set or whether or not it is delivered as a data set.
  • FIG. 35 is a schematic view showing another example of the screen according to the present embodiment.
  • This figure is an example of a screen displayed on the input / output unit I2 by the control unit P2 of the mobile terminal 2.
  • the image G911 acquired from a certain user and the confirmation class "cat" are displayed.
  • a like button BT91 and a dislike button BT92 are displayed.
  • Button BT91 is tapped by 986 other users (986 user IDs) and button BT92 is tapped by 15 other users.
  • the management server 1 determines that the data set is appropriate. In this way, the machine learning system Sys can acquire a data set including human evaluation. Further, the machine learning system Sys can acquire an appropriate data set by evaluation of another person even when an unspecified number of users can provide the data set.
  • the mobile terminal 2 (for example, the control unit P2) is a screen that presents a class, a screen that can take a picture, or a screen that can select an image of a file or content, and a sample of the image of the class (also referred to as a “sample image”). ) May be displayed. This makes it easier for the user to recognize the image to be captured or selected. In addition, even a user who is unfamiliar with the language of characters representing a class, such as a young child or a foreigner, can recognize an image to be taken or selected. Further, since the user takes or selects a photograph similar to the sample image, the size and orientation (angle) of the subject can be specified in the sample image. As a result, the machine learning system Sys has a high possibility of acquiring an image in which a subject of a desired size and orientation is depicted as a learning data set.
  • FIG. 36 is a schematic view showing another example of the screen flow according to the present embodiment.
  • This figure is an example of a screen flow displayed by the control unit P2 of the mobile terminal 2 on the input / output unit I2.
  • Image Ga111 is a sample image of the class "cat".
  • a button for activating the camera and a button for generating a function for selecting an image are arranged for each class.
  • the mobile terminal 2 can specify the class and the type of image (captured image or selected image) selected by the user. For example, when the button BTa11 is touched by the user, the mobile terminal 2 activates the camera and displays the screen Ga12.
  • the class selected by the user and the sample image Ga121 thereof are displayed.
  • the image Ga122 is an image taken by the camera.
  • the mobile terminal 2 stores the image shot at that time as an image file. After that, the mobile terminal 2 displays the image of the image file on the screen Ga13.
  • the button Bta131 is touched by the user on the screen Ga13, the mobile terminal 2 displays the screen Ga14 after performing the processes of steps S308 to S310 of FIG.
  • a button linked to a site that consumes points is displayed on the screen Ga14.
  • a button is a button linked to a site that consumes points and exchanges for goods.
  • a button is a button that spends points and links to a shopping site.
  • the service log may be aggregated as follows (step S209 in FIG. 16).
  • the management server 1 (service management unit 135) sets the average value of the model recognition rate and the number of battles for each game factor (game ID, event ID, battle character ID, or reward ID) for each fixed class of the data set. Or calculate the number of datasets.
  • the management server 1 presents the game factor that maximizes the average value of the model recognition rate, the number of battles, or the number of data sets to the administrator, and sets it as a game setting. ..
  • the recognition rate improvement value or the recognition evaluation value may be used instead of or in addition to the model recognition rate.
  • the system or service provider, development entity, management entity, or operation entity, or the application installed on the device of each system, the application provider, the development entity, The management entity or the operation entity is different.
  • users general users and companies
  • clients general users' mobile terminals 2 and corporate control devices 6-2, 6-M
  • networks Internet
  • the data collection system SysA and the artificial intelligence system SysB have different rewards (variable updates or game objects and fees) for the dataset.
  • the present invention is not limited to this, and the data collection system SysA and the artificial intelligence system SysB may be provided by the same subject. In that case, for example, the information of the requester may not be available.
  • the management server 1, mobile terminal 2, game server 3, learning server 4, artificial intelligence server 5, and control device 6 described above have a computer system inside. Then, a part or all of the process of FIG. 5 described above is stored in a computer-readable recording medium in the form of a program, and the above processing is performed by the computer reading and executing this program.
  • the computer-readable recording medium refers to a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, a semiconductor memory, or the like.
  • this computer program may be distributed to a computer via a communication line, and the computer receiving the distribution may execute the program.
  • the program for realizing the function of the machine learning system Sys in FIG. 2 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into the computer system and executed to perform various processes. May be done.
  • the term "computer system” as used herein includes hardware such as an OS and peripheral devices.
  • the "computer system” shall also include a WWW system provided with a homepage providing environment (or display environment).
  • the "computer-readable recording medium” refers to a portable medium such as a flexible disk, a magneto-optical disk, a ROM, or a CD-ROM, or a storage device such as a hard disk built in a computer system.
  • a "computer-readable recording medium” is a volatile memory (RAM) inside a computer system that serves as a server or client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line.
  • RAM volatile memory
  • the above program may be transmitted from a computer system in which this program is stored in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium.
  • the "transmission medium” for transmitting a program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
  • the above program may be for realizing a part of the above-mentioned functions.
  • a so-called difference file (difference program) may be used, which can realize the above-mentioned functions in combination with a program already recorded in the computer system.
  • One aspect of the present invention can be used, for example, in a system or device that utilizes artificial intelligence, or in a system or device that collects data. Artificial intelligence can be used in a variety of devices.
  • Sys ... machine learning system SysA ... data collection system, SysB, SysB-1 to BM ... data collection system, 1 ... management server, 2,2-1 to 2-M ... -Mobile terminal, 3 ... Game server, 4 ... Learning server, 5,5-1 to 5-M ... Artificial intelligence server, 6,6-1 to 6-M ... Control device, I , I1, I2, I3, I4, I5, I6 ... Input / output unit, M, M1, M2, M3, M4, M5, M6, M ... Storage unit, P, P1, P2, P3, P4, P5, P6 ... Control unit, 111 ... Communication unit, 121 ... Order information storage unit, 122 ... Game setting storage unit, 123 ... Learning setting storage unit, 124 ...
  • Situation information storage Department 125 ... Collected information storage unit, 126 ... Service log storage unit, 131 ... Order management unit, 132 ... Setting update unit, 133 ... Game setting unit, 134 ... Learning setting Unit, 135 ... Service management unit, 136 ... Delivery management unit, 211 ... Communication unit, 212 ... Input unit, 213 ... Output unit, 214 ... Imaging unit, 215 ... Sensor unit, 221 ... Operation storage unit, 222 ... Game storage unit, 223 ... Data storage unit, 231 ... Operation unit, 232 ... Game control unit, 233 ... Shooting control unit, 234 ... Information browsing unit, 235 ... File management unit, 236 ... Display control unit, 311 ...
  • Communication unit 321 ... Operation storage unit, 322 ... Management application storage unit, 331. ⁇ ⁇ Operation department, 332 ⁇ ⁇ ⁇ Management application control department, 2321 ⁇ ⁇ ⁇ Event management department, 2322 ⁇ ⁇ ⁇ Class presentation department, 2323 ⁇ ⁇ ⁇ Image acquisition department, 2324 ⁇ ⁇ ⁇ Data set provision department, 2325 ⁇ ⁇ -Variable value update unit, 232 ... Reward granting unit, 3321 ... Event notification unit, 3322 ... Class management unit, 3323 ... Data set receiving unit, 3324 ... Judgment unit, 3325 ... Reward determination unit, 3326 ... Log generation unit, 411 ... Communication unit, 421 ... Learning setting storage unit, 422 ...

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Optics & Photonics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

複数の情報端末(2-1~2-N)は、機械学習のための目的情報を提示する。複数の情報端末(2-1~2-N)は、目的情報に対する説明情報を、ユーザから入力される。サーバ(4)は、説明情報と目的情報を取得する。

Description

機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法
 本発明は、機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法に関する。
 近年、機械学習に関する技術が発展している。例えば、画像認識の機械学習に関して、特許文献1には、次の記載がある。
 画像認識装置は、第1識別器による学習評価画像の識別結果を評価するとともに、第1識別器では誤識別領域を、識別が難しい小領域として選択する。そして、画像認識装置は、選択された誤識別領域を含む複数の小領域からなる領域を識別するための第2の識別器を学習する。最後に、画像認識装置は、第1識別器による識別結果と第2識別器による識別結果とを統合して、統合識別器を学習する。
特開2016-99668号公報
 しかしながら、学習済モデル(特許文献1では識別器)の分類精度は、機械学習に用いるデータにも依存する。したがって、より効率的に、機械学習に用いるデータを収集することが望まれている。
 そこでこの発明は、より効率的に、機械学習に用いるデータを収集できる機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法を提供することを目的としている。
 本発明は、上述の課題を解決すべくなされたもので、上記目的を達成するために、本発明の一態様は、第1システムは、機械学習のための目的情報を提示する提示部と、前記目的情報に対する説明情報を、ユーザから入力される入力部と、前記説明情報と前記目的情報を取得する取得部と、前記説明情報に基づく入力変数と前記目的情報に基づく出力変数のデータセット、及び、予め定められた学習済モデルに基づいて、前記説明情報による前記目的情報の分類精度についての評価を行う評価部と、前記評価に応じた報酬を、前記ユーザに対して付与する報酬付与部と、前記目的情報、前記評価の結果、及び前記報酬が関係付けられた履歴情報を生成する履歴生成部と、を備え、第2システムは、前記データセットの少なくとも1個に基づいて機械学習が行われた学習済モデルを記憶するモデル記憶部と、前記モデル記憶部が記憶する学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力する実行部と、を備える機械学習システムである。
 また本発明の一態様は、機械学習のための目的情報を提示する提示部と、前記目的情報に対する説明情報を、ユーザから入力される入力部と、前記目的情報と前記説明情報を用いた評価に応じた報酬を、前記ユーザに対して付与する報酬付与部と、を備える情報端末である。
 また本発明の一態様は、機械学習のための目的情報、前記目的情報に対する説明情報であってユーザから情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価を行う評価部と、前記目的情報、及び前記評価の結果が関係付けられた履歴情報を生成する履歴生成部と、を備える情報処理装置である。
 また本発明の一態様は、機械学習のための目的情報を、情報端末へ送信する送信部と、前記目的情報、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価に応じて、前記ユーザに付与する報酬を決定する報酬決定部と、を備える情報処理装置である。
 また本発明の一態様は、械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、学習が行われた学習済モデルをモデル記憶部から読み出し、前記学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力する実行部と、を備える情報処理装置である。
 また本発明の一態様は、機械学習のための目的情報を提示し、前記目的情報に対する説明情報を、ユーザから入力され、前記目的情報と前記説明情報を用いた評価に応じた報酬を、前記ユーザに対して付与する、情報処理方法である。
 また本発明の一態様は、機械学習のための目的情報と、前記目的情報に対する説明情報であってユーザから情報端末に入力された説明情報と、を取得し、前記説明情報に基づく入力変数と前記目的情報に基づく出力変数のデータセット、及び、予め定められた学習済モデルに基づいて、前記説明情報による前記目的情報の分類精度についての評価を行い、前記目的情報、及び前記評価の結果が関係付けられた履歴情報を生成する、情報処理方法である。
 また本発明の一態様は、機械学習のための目的情報を、情報端末へ送信し、前記目的情報、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価に応じて、前記ユーザに付与する報酬を決定する、情報処理方法である。
 また本発明の一態様は、機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、機械学習が行われた学習済モデルをモデル記憶部から読み出し、前記学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力する、情報処理方法である。
 また本発明の一態様は、情報処理装置のコンピュータに、情報端末のコンピュータに、機械学習のための目的情報を提示させる提示手順、前記目的情報に対する説明情報を、ユーザから入力される入力手順、前記目的情報と前記説明情報を用いた評価に応じた報酬を、前記ユーザに対して付与させる報酬付与手順、を実行させるためのプログラムである。
 また本発明の一態様は、情報処理装置のコンピュータに、機械学習のための目的情報と、前記目的情報に対する説明情報であってユーザから情報端末に入力された説明情報と、を取得させる取得手順、前記説明情報に基づく入力変数と前記目的情報に基づく出力変数のデータセット、及び、予め定められた学習済モデルに基づいて、前記説明情報による前記目的情報の分類精度についての評価を行わせる評価手順、前記目的情報、及び前記評価の結果が関係付けられた履歴情報を生成させる履歴生成手順、を実行させるためのプログラムである。
 また本発明の一態様は、情報処理装置のコンピュータに、機械学習のための目的情報を、情報端末へ送信する送信手順、前記目的情報、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価に応じて、前記ユーザに付与する報酬を決定する報酬決定手順、を実行させるためのプログラムである。
 また本発明の一態様は、情報処理装置のコンピュータに、機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、機械学習が行われた学習済モデルをモデル記憶部から読み出させ、前記学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力させる実行手順を実行させるためのプログラムである。
 また本発明の一態様は、機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、機械学習が行われた学習済モデルであって、前記説明情報が入力された場合に、前記目的情報を出力する学習済モデルである。
 また本発明の一態様は、機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個を取得し、前記データセットの少なくとも1個に基づいて機械学習を行うことで、学習済モデルを生産する、学習済モデルを生産する方法である。
 本発明によれば、より効率的に、機械学習に用いるデータを収集できる。
本発明の一実施形態に係る画面フローの一例を表す概要図である。 本実施形態に係る機械学習システムの構成例を示す概略図である。 本実施形態に係る機械学習システムでの処理の流れの一例を示すシーケンス図である。 本実施形態に係るサービス設定画面の一例を表す概略図である。 本実施形態に係るサービス管理画面の一例を表す概略図である。 本実施形態に係る管理サーバの構成を示す概略ブロック図である。 本実施形態に係る注文テーブルの一例を示す概略図である。 本実施形態に係る注文学習テーブルの一例を示す概略図である。 本実施形態に係る注文料金テーブルの一例を示す概略図である。 本実施形態に係るゲーム設定テーブルの一例を示す概略図である。 本実施形態に係る学習設定テーブルの一例を示す概略図である。 本実施形態に係るゲーム状況テーブルの一例を示す概略図である。 本実施形態に係る収集状況テーブルの一例を示す概略図である。 本実施形態に係る収集管理テーブルの一例を示す概略図である。 本実施形態に係るサービスログの一例を示す概略図である。 本実施形態に係る管理サーバの処理の一例を示すフロー図である。 本実施形態に係る携帯端末の構成を示す概略ブロック図である。 本実施形態に係るゲームサーバの構成を示す概略ブロック図である。 本実施形態に係るゲーム制御部と管理アプリ制御部の構成を示す概略ブロック図である。 本実施形態に係るゲーム制御部と管理アプリ制御部の処理の一例を示すシーケンス図である。 本実施形態に係る報酬選択テーブルの一例を示す概略図である。 本実施形態に係る学習サーバの構成を示す概略ブロック図である。 本実施形態に係る学習サーバの処理の一例を示すフロー図である。 本実施形態に係る機械学習における実行手順を説明する説明図である。 本実施形態に係る機械学習における学習手順を説明する説明図である。 本実施形態に係る認識率改善値の算出処理を説明する説明図である。 本実施形態に係る評価値テーブルの一例を示す概略図である。 本実施形態に係る人工知能サーバの構成を示す概略ブロック図である。 本実施形態に係る制御機器の構成を示す概略ブロック図である。 本実施形態に係る装置のハードウェア構成の一例を示す概略図である。 本実施形態に係る画面フローの別の一例を表す概要図である。 本実施形態に係る画面フローの別の一例を表す概要図である。 本実施形態に係る画面フローの別の一例を表す概要図である。 本実施形態に係る画面フローの別の一例を表す概要図である。 本実施形態に係る画面の別の一例を表す概要図である。 本実施形態に係る画面フローの別の一例を表す概要図である。
 以下、図面を参照しながら本発明の一実施形態について詳しく説明する。
<画面フロー>
 図1は、本発明の一実施形態に係る画面フローの一例を表す概要図である。
 この図は、図2の携帯端末2-1~2-N(各々を「携帯端末2」とも称する。「情報端末」の一例)が表示する画面フローである。この画面フローは、携帯端末2にインストールされたゲームのモバイルアプリケーション(「ゲームアプリ」とも称する)によって、携帯端末2のディスプレイに表示される。
 そのゲームアプリは、対戦型ゲームのゲームアプリである。その対戦型ゲームにおいて、イベントが発生し、各イベントにおいて、ゲームキャラクタ同士の対戦が行われる。
 画面G11には、対戦キャラクタG111が表示されている。対戦キャラクタG111は、ユーザが操作するゲームキャラクタ(「操作キャラクタ」とも称する)と対戦するキャラクタである。
 領域G112には、対戦キャラクタG111を攻撃する画像のクラス(「目的情報」の一例)として、猫、チーズ、及び、自動車が表示されている。クラスとは、画像を分類(識別も含む)する情報であり、例えば、画像に描画された被写体(「オブジェクト」の一例)の称呼である。つまり、画面G11は、ユーザに対して、対戦キャラクタG111を攻撃するためには、猫、チーズ又は自動車の画像を提供すべきことを表している。
 ボタンBT11がユーザにタッチされた場合、携帯端末2は、カメラを起動し、写真を撮影可能な画面(例えば図36の画面Ga12)を表示する。この画面では、ユーザは、撮影ボタンをタップ(タッチ)することで、静止画又は動画を撮影することができる。
 ボタンBT12がユーザにタッチされた場合、携帯端末2は、携帯端末2のフォルダ内のファイルを選択可能な画面(図示せず)を表示する。この画面では、ユーザは、画像ファイルを選択することができる。ユーザが撮影をした後、又は、ユーザがファイルを選択した後、携帯端末2は、画面G12を表示する。
 画面G12には、画像G121(「説明情報」の一例)が表示されている。画像G121は、ユーザが撮影した画像、又は、ユーザが選択した画像ファイルの画像である。
 プルダウンメニューG122には、画像G121のクラスの候補として、猫、チーズ、及び、自動車が表示されている。ユーザは、プルダウンメニューG122を用いて、猫、チーズ、又は自動車のいずれか1つを選択することができる。つまり、携帯端末2は、プルダウンメニューG122を用いて、画面G11で提示したクラスのうち、ユーザがどのクラスを選択させる。ユーザが選択したクラスを確定クラスとも称する。
 ボタンBT13は、画像G121と確定クラスを用いて、操作キャラクタに対戦相手G111を攻撃させるボタンである。ボタンBT13がユーザにタッチされた場合、携帯端末2は、画面G13を表示する。
 画面G13では、対戦キャラクタG111は、操作キャラクタから攻撃を受けている。画像G131は、画像G121の評価(「認識評価」とも称する)として、評価の高い画像である旨(「GREAT Picture」)を表す画像である。認識評価は、画像G121によるクラスの分類精度についての評価である。例えば、認識評価は、この画像G121と確定クラスを用いて機械学習が行われることで、その学習済モデルによる画像の認識率(「モデル認識率」とも称する)が向上する場合には、評価が高くなる。一方、認識評価は、モデル認識率が低下する場合には、評価が低くなる。認識評価の詳細については、後述する(図26参照)。
 画像G132は、対戦キャラクタG111のヒットポイント(「報酬」又は「ゲームでの変数」の一例)から、300ポイントを差し引かれたことを表している。ヒットポイントは、その値がゼロになった場合に、そのキャラクタが倒された(負けた)ことになるデータである。一方、画像G133は、操作キャラクタのヒットポイントに、100ポイントが加えられたことを表している。例えば、画像G134では、ヒットポイントが、画面G11の136ポイントに、100ポイントが加えられて、236ポイントになったことを表している。
 このように、携帯端末2は、ユーザが提供した画像G121の認識評価に応じて、対戦キャラクタG111又は操作キャラクタのヒットポイントの増減(「ゲームでの変数の更新」の一例)を行う。ユーザは、画像を提供することで、対戦キャラクタG111を倒し、対戦に勝利することができる。対戦キャラクタG111を倒した場合、携帯端末2は、画面G14を表示する。
 画面G12には、対戦に勝利した結果、ユーザに付与されたカードG141(「報酬」又は「ゲームオブジェクト」の一例)が表示されている。このカードG141は、希少価値の高い「スーパーレア」(「SR」とも称する)のカードであり、認識評価で評価が高い場合に付与される。なお、ゲームアプリにおいて、カードは、操作キャラクタ、アイテム、特殊効果の発生、ゲームでの変数の更新等に用いられる。
 以上のように、携帯端末2は、画面G11にて、機械学習のためのクラスを表示する(領域G112)。携帯端末2は、提示したクラスに対する画像G121を、ユーザから入力される。携帯端末2は、クラス(プルダウンメニューG122で選択された確定クラス)と画像G121に応じた報酬(ヒットポイントの増減、カード)を、ユーザに対して付与する。
 これにより、携帯端末2は、クラスと画像G121のデータセットを、機械学習に用いるデータとして、ユーザから収集できる。ユーザは、クラスを指定された上で、簡易な操作で画像を提供できるので、携帯端末2は、効率的に機械学習に用いるデータを収集できる。また、ユーザは、認識評価に応じた報酬が付与されるので、認識評価で評価が高くなる画像を提供する。この場合、携帯端末2は、モデル認識率が高くなる画像を、機械学習に用いるデータとして収集できる。
 なお、ゲームアプリは、スマートフォン等に搭載される汎用のオペレーティングシステム(「OS」とも称する)上で実行される。ゲームアプリは、モバイルアプリケーション(「アプリ」とも称する)を配信するアプリケーションストアから、インターネットを介してダウンロードされる。アプリケーションストアは、アプリに対応したタウンロードディストリビューションプラットフォームである。つまり、ゲームアプリは、携帯端末の一般的なOSで動作させることができ、アプリケーションストアが配信されるので、一般的なユーザに幅広く利用されることができる。ただし、ゲームアプリは、特定のウェブサイトやデータフォルダからダウンロードされてもよいし、ローカルネットワークやパーソナルコンピュータを介してダウンロードされてもよい。
<機械学習システム>
 図2は、本実施形態に係る機械学習システムSysの構成例を示す概略図である。
 機械学習システムSysは、データ収集システムSysA(「第1システム」の一例)、及び、複数の人工知能システムSysB-1~SysB-M(「第2システム」の一例。各々を「人工知能システムSysB」とも称する)を含んで構成される。
 データ収集システムSysAは、管理サーバ1、携帯端末2-1~2-N、ゲームサーバ3、及び学習サーバ4を具備する。管理サーバ1と端末T1は、ローカルネットエリアワークL1を介して接続さている。管理サーバ1と、ゲームサーバ3及び学習サーバ4とは、ローカルエリアネットワークL1とインターネットNWを介して接続されている。ゲームサーバ3と学習サーバ4は、インターネットNWを介して接続されている。携帯端末2とゲームサーバ3は、インターネットNWと基地局装置BSを介して、接続されている。
 人工知能システムSysB-mは、人工知能サーバ5-m(「人工知能サーバ5」とも称する)、及び制御機器6-m(「制御機器6」とも称する)を具備する(m=1~M)。人工知能システムSysBは、機械学習の結果の学習済モデルを用いて、サービスを提供するシステムである。制御機器6-1は、携帯端末であり、ユーザから入力された画像に対し、クラスを表示する。制御機器6-2は、ロボットアームであり、被搬送物を撮影した画像に応じて、アームの動作を制御する。制御機器6-Mは、品質管理装置であり、検査対象物を撮影した画像に応じて、検査対象物が正常であるか異常があるかを判定する。
 人工知能サーバ5-1と制御機器6-1は、インターネットNWと基地局装置BSを介して、接続されている。人工知能サーバ5-2と制御機器6-2は、ローカルエリアネットワークL2を介して、接続されている。人工知能サーバ5-Mと制御機器6-Mは、直接、接続されている。なお、機械学習システムSysは、複数の人工知能システムSysBを備えず、1個の人工知能システムSysBを備えてもよいし、人工知能システムSysBは、1個の装置(筐体)であってもよい。
 機械学習システムSysでは、ゲームサーバ3は、機械学習のためのクラスを、各携帯端末2へ送信する。各携帯端末2は、ユーザに対して、クラスを表示する。各携帯端末2は、クラスに対する画像を、ユーザから入力される。各携帯端末2は、入力されたクラスと画像のデータセットをゲームサーバ3に送信する。学習サーバ4は、各携帯端末2からゲームサーバ3を介して、そのデータセットを取得する。学習サーバ4は、取得したデータセット、及び、予め定められた学習済モデルに基づいて、認識評価を行う。ゲームサーバ3は、認識評価に応じた報酬を、ユーザに対して付与する。
 学習サーバ4は、上記の繰り返しによって、複数のデータセット(「収集データセット」とも称する)を収集する。各人工知能サーバ5は、収集データセットの少なくとも1個に基づいて機械学習が行われた学習済みモデル(「追加学習済モデル」とも称する)を記憶する。各人工知能サーバ5は、追加学習済モデルに基づいて、画像が入力された場合に、クラスを出力する。
 これにより、機械学習システムSysは、多数のユーザから、機械学習に用いるデータとして、クラスと画像のデータセットを収集できる。機械学習システムSysは、少数のユーザからデータセットを取得する場合と比較して、多数のデータセット又は多様なデータセットを取得でき、より効率的に、機械学習に用いるデータを収集できる。
<機械学習システムでの処理>
 図3は、本実施形態に係る機械学習システムSysでの処理の流れの一例を示すシーケンス図である。である。なお、シーケンスは、これに限られるものではなく、各処理の順序が変わっていてもよいし、複数の処理を並列して行ってもよい。
(ステップS101)端末T1は、管理者から、注文情報が入力される。注文情報は、機械学習に用いるデータ(クラスと画像のデータセット)の収集を依頼する情報である。注文情報には、依頼元を示す依頼元情報が含まれる。依頼元は、管理者がデータの収集を依頼された依頼主体であり、例えば、人工知能システムSysBを提供する企業である。端末T1は、注文情報を管理サーバ1へ送信する。
(ステップS102)人工知能サーバ5は、人工知能システムSysBで利用している学習済モデルの設定(「基準モデル設定」とも称する)及び基準データセットを、管理サーバ1へ送信する。
 ここで、基準モデル設定には、データセットの収集前の機械学習プログラムが含まれる。機械学習プログラムは、データセットを用いて機械学習を行うことで、学習済モデルを生成するアプリケーションプログラムである。機械学習プログラムは、例えば、CNN(畳み込みニューラルネットワーク)のプログラムである。
 基準データセットとは、認識評価に用いられるデータセットであって、画像とその画像の被写体のクラス(分類上、正しいクラス)のセットである。例えば、基準データセットでは、猫の画像に対して、正しく「猫」のクラスが対応付けられている。
(ステップS103)管理サーバ1は、ステップS101の注文情報、ステップS102の基準モデル設定及び基準データセットに基づいて、学習設定を生成する。学習設定は、認識評価を行うための設定であり、端末T1のサービス設定画面(図4)を用いて設定される。学習設定には、機械学習プログラムや基準データセットが含まれる。管理サーバ1は、生成した学習設定を学習サーバ4へ送信する。
(ステップS104)管理サーバ1は、ステップS101の注文情報に基づいて、ゲーム設定を生成する(図4参照)。ゲーム設定は、ゲームアプリにおいて、機械学習に用いるデータを収集するための設定であり、端末T1のサービス設定画面(図4)を用いて設定される。管理サーバ1は、クラスが含まれるゲーム設定をゲームサーバ3へ送信する。
(ステップS111)ゲームサーバ3と携帯端末2は、ユーザ操作に基づいて、ゲームを進行する。
(ステップS112)ゲームサーバ3は、ゲームの進行中に、ステップS104のゲーム設定を参照する。ゲームサーバ3は、そのゲーム設定のクラスを含む画像要求を、携帯端末2へ送信する。
(ステップS113)携帯端末2は、ステップS112の画像要求に含まれるクラスを表示する(図1の画面G11)。携帯端末2は、表示したクラスに対して、ユーザから入力された画像を取得する(画面G12)。携帯端末2は、そのクラス(確定クラス)と取得した画像のデータセットを含む応答を、ゲームサーバ3へ送信する。
(ステップS114)ゲームサーバ3は、ステップS113の応答に含まれるデータセットを、評価要求として、学習サーバ4へ送信する。
(ステップS115)学習サーバ4は、ステップS114の評価要求を参照し、データセットの画像に対して、認識評価を行う。ここで、学習サーバ4は、ステップS103の学習設定を参照し、その学習設定の基準モデル設定と基準データセットを用いて、認識評価を行う。学習サーバ4は、認識評価の評価結果をゲームサーバ3へ送信する。
(ステップS116)ゲームサーバ3は、ステップS115の評価結果に応じて、ヒットポイントやカード等の報酬を決定する。ゲームサーバ3は、決定した報酬を、携帯端末2へ送信する。携帯端末2は、受信した報酬を、S113で画像を入力したユーザに対して付与する(図1の画面G13、G14)。
(ステップS117)ゲームサーバ3は、ゲームログを学習サーバ4へ送信する。ゲームログは、図15のサービスログの項目うち、ゲームサーバ3で収集されるデータである。
(ステップS118)学習サーバ4は、ステップS117のゲームログに、ステップS115の認識評価で算出したモデル認識率等を、識別情報として追加することで、サービスログ(図15)を生成する。学習サーバ4は、サービスログを管理サーバ1へ送信する。
 以上のステップS111からステップS118の処理S11は、同一又は他の携帯端末2(同一又は他のユーザ)に対して、複数回、行われる。例えば、1000個のデータセットを収集する場合、処理S11は、少なくとも1000回は行われる。
(ステップS121)管理サーバ1は、複数回の処理S11によって収集した収集データセットを要求する条件(「学習情報要求条件」とも称する)を充足した場合、追加学習情報要求を、学習サーバ4へ送信する。
(ステップS122)学習サーバ4は、収集データセットを用いて、基準モデル設定の学習済モデルに対して機械学習を行う。学習サーバ4は、この学習の結果、追加学習済モデルを生成する。この追加学習済モデルを、「追加学習情報」とも称する。学習サーバ4は、追加学習情報と収集データセットを、管理サーバ1へ送信する。
(ステップS123)管理サーバ1は、ステップS122で受信した追加学習済モデルと収集データセットを、人工知能サーバ5へ送信することで納品する。なお、この納品は、人手を介して行われてもよい。例えば、人間は、追加学習済モデル又は収集データセットを記憶媒体に記憶させて運搬し、記憶媒体から人工知能サーバ5へ複製してもよい。
(ステップS124)管理サーバ1は、ステップS101の注文情報に基づいて請求情報を生成し、請求情報は、注文情報の依頼元へ送信される。依頼元は、請求情報の料金を支払うことで、決済が完了する。
 以上の図3のシーケンス図の処理は、1個の注文ごとに行われる。機械学習システムSysは、1又は複数の依頼元から、複数の注文を、同時期又は異なる時期に受注できる。収集データセットは、注文情報の単位(注文IDごと)に収集される。
<サービス設定画面>
 図4は、本実施形態に係るサービス設定画面の一例を表す概略図である。
 サービス設定画面G2は、注文情報表示G21、及び、設定情報表示G22から構成される。注文情報表示G21は、注文情報を、管理者に参照させる表示である。設定情報表示G22は、学習設定及びゲーム設定を、管理者に参照、更新させる表示である。
 なお、サービス設定画面G2は、管理サーバ1によって注文ごと(端末T1から入力された注文IDごと)に生成され、端末T1のアプリケーションによって表示される。
 注文情報表示G21は、注文基本表示G211、注文学習表示G212、及び注文料金表示G213から構成される。注文情報表示G21には、依頼元から注文された情報が表示される。
 注文基本表示G211には、注文ID、依頼元、依頼日、納品先、納品期限、及び納品状況が表示されている。注文IDは、注文を識別する識別子であり、注文ごとに管理サーバ1によって生成される。
 注文学習表示G212には、基準モデル、基準モデル設定、基準データセット、注文クラス設定、及び注文データ収集条件が表示されている。基準モデルは、基準モデルの名称とその種類を示す情報である。注文クラス設定は、注文されたクラス設定である。クラス設定は、クラスを選択する設定である。注文データ収集条件は、データを収集する収集の期間、件数、認識率(モデル認識率)、報酬の条件であり、注文された設定である。
 注文料金表示G213には、料金(料金設定)が表示されている。例えば、料金は、向上した認識率(モデル認識率)、データセットの総件数(データ数)、利用者数、参照数、対戦キャラクタ、ヒットポイント、付与した報酬に応じた料金である。これらの料金設定に基づいて、上述の請求情報が生成される。
 設定情報表示G22は、ゲーム設定表示G221、学習設定表示G222、及び報酬設定表示G223から構成される。設定情報表示G22のタイトル部分には、サービスIDが表示されている。サービスIDは、各注文に対するサービスを識別する識別子であり、注文ごとに管理サーバ1によって生成される。
 ゲーム設定表示G221には、ゲーム情報、イベント情報、及び対戦キャラクタが表示されている。ゲーム情報は、ゲームアプリを識別するゲームID、及びゲームアプリの名称である。イベント情報は、イベントを識別するイベントID、及びイベントの名称である。対戦キャラクタは、対戦キャラクタを識別する対戦キャラクタID、及び対戦キャラクタの画像である。ゲーム設定表示G221の設定は、管理者がボタンBT21をクリックして、情報を入力することで更新(新規に設定又は変更)される。
 学習設定表示G222には、学習サーバ情報、クラス設定、及びデータ収集条件が表示されている。学習サーバ情報は、学習サーバを識別する識別情報であり、学習サーバのURI(Uniform Resource Identifier)やサーバ名である。クラス設定及びデータ収集条件には、注文クラス設定及び注文データ設定が複製される。クラス設定及びデータ収集条件は、それぞれ、ボタンBT22、BT23をクリックすることで、管理者が更新できる。
 学習設定表示G222には、クラス設定として、自動でモデル認識率が低いクラスを選択すること、及び、依頼元が指定したクラスを選択すること、が表示されている。学習設定表示G222には、モデル認識率が低いクラスとして、モデル認識率が低い順に「チーズ」及び「自動車」が選択され、依頼元が指定したクラスとして「猫」が選択されていることが表示されている。この場合、依頼元が指定したクラス、モデル認識率が低いクラス(低い方が先)の順で、優先順位が付され、第1クラスに「猫」、第2クラスに「チーズ」、第3クラスに「自動車」が設定される。なお、図1の領域G112及びプルダウンメニューG12には、この順序で、クラスが表示されている。
 学習設定表示G222には、データ収集条件として、収集の期間、件数、認識率(モデル認識率)、報酬の条件が表示されている。件数の条件は、収集されたデータセットの合計件数に基づく条件であり、例えば、収集データセットの合計件数が閾値(1000件)以内である。つまり、収集データセットの合計件数が閾値を超えた場合、収集が終了される設定である。認識率の条件は、モデル認識率に基づく条件であり、例えば、モデル認識率が閾値(90%)以内である。つまり、モデル認識率が閾値を超えた場合、収集が終了される設定である。報酬の条件は、報酬に基づく条件であり、例えば、スーパーレアのカードを付与する枚数が閾値(1000枚)以内である。つまり、スーパーレアのカードの付与数が閾値を超えた場合、収集が終了される設定である。
 報酬設定表示G223には、報酬設定として、選択された報酬が表示される。報酬設定表示G223には、スーパーレアのカードを付与すること、及び、ヒットポイントについて対戦キャラクタから300ポイントを差し引き、ユーザの操作キャラクタに100ポイントを加えること、が表示されている。
 報酬設定は、ボタンBT24をクリックすることで、管理者が更新できる。例えば、管理者は、ゲームオブジェクトの種類(種別)を選択できる。ゲームオブジェクトとは、ゲームに用いられるオブジェクトであって、例えば、カード、コイン、アイテム、キャラクタ、又はプレゼント等である。また管理者は、ゲームオブジェクトの種類として、カードの場合、レアリティを更新できる。また管理者は、ゲームでの変数について、報酬の対象となる変数やその変数値を更新できる。ゲームでの変数には、例えば、レベル、能力(攻撃力や守備力等)、マジックポイント、クリティカルヒット等の確率、カードや特殊効果等の出現確率、チームレベル、ライフ等がある。
 ボタンBT25がクリックされた場合、サービス設定画面G2に表示された情報が設定される。例えば、注文学習表示G212及び学習設定表示G222に表示された情報は、学習設定として、管理サーバ1及び学習サーバ4に設定される。ゲーム設定表示G221及び報酬設定表示G223に表示された情報は、ゲーム設定として、管理サーバ1及びゲームサーバ3に設定される。
 なお、注文データ収集条件、料金設定、イベント情報、対戦キャラクタ、データ収集条件、又は報酬設定は、クラスごとに設定されてもよいし、クラスごとに、複数の内容や条件が設定されてもよい。
<サービス管理画面>
 図5は、本実施形態に係るサービス管理画面G3の一例を表す概略図である。
 サービス管理画面G3は、サービス状況表示G31、クラス状況表示G32、注文基本表示G331、及びゲーム設定表示G332から構成される。サービス状況表示G31及びクラス状況表示G32は、ゲーム状況情報や収集状況情報(「サービス状況情報」とも称する)を、管理者に参照させる表示である。クラス状況表示G32は、クラスごとにサービス状況情報を参照させ、サービス状況表示G31は、サービス全体のサービス状況情報を参照させる表示である。注文基本表示G331及びゲーム設定表示G332の各項目は、注文基本表示G211ゲーム設定表示G221の各項目と同じであるので、説明を省略する。なお、サービス管理画面は、管理サーバ1によって注文ごと(入力された注文IDごと)に生成され、端末T1のアプリケーションによって表示される。
 サービス状況表示G31には、サービスID、及び、サービス状況(全体)としての認識率、対戦数、成功数、失敗数、及びデータセット数が表示されている。認識率は、クラスごとのモデル認識率の平均値である。対戦数、成功数、失敗数、及び、データセット数は、全クラス(第1クラス、第2クラス、第3クラス)のものを合算した合計値である。
 対戦数は、設定された対戦キャラクタと各ユーザの操作キャラクタが対戦した回数である。成功数は、取得したデータセットで、モデル認識率が上がった回数である。失敗数は、取得したデータセットで、モデル認識率が下がった回数である。データセット数は、データセットを取得した回数であり、成功数と失敗数の合計値となる。対戦数、成功数、失敗数、及び、データセット数は、予め定めた時間単位(例えば1時間)ごとの回数も算出され、サービス状況表示G31に表示される。
 ボタンBT31がクリックされた場合、ゲームサーバ3及び学習サーバ4は、表示されている注文についてサービスを停止する。例えば、ゲームサーバ3は、設定されているイベントIDを削除し、設定された対戦キャラクタを登場させなくする。
 ボタンBT32又はボタンBT33がクリックされた場合、追加学習情報要求が学習サーバ4へ送信され(図3のステップS121)、追加学習情報又は収集データセットが管理サーバ1へ送信される(図3のステップS122)。
 サービス状況表示G31は、第1クラス状況表示G321、第2クラス状況表示G322、及び第3クラス状況表示G323から構成される。第1クラス状況表示G321、第2クラス状況表示G322、及び第3クラス状況表示G323は、それぞれ、第1クラス、第2クラス、及び第3クラスのゲームの利用状況やデータの収集状況が表示されている。
 サービス状況表示G31は、クラスごとに、認識率(モデル認識率)、対戦数、成功数、失敗数、データセット数、及び報酬数が表示されている。報酬数は、報酬ごとの報酬の付与回数である。ボタンBT34がクリックされた場合、追加学習情報要求が学習サーバ4へ送信され(図3のステップS121)、第1クラスの収集データセットが管理サーバ1へ送信される(図3のステップS122)。ボタンBT35がクリックされた場合、ゲームサーバ3及び学習サーバ4は、第1クラスについてサービスを停止する。例えば、ゲームサーバ3は、機械学習のためのクラスとして、第1クラスの表示を削除する(図1参照)。ボタンBT36、BT37は第2クラスについて、ボタンBT38、BT39は第2クラスについて、それぞれ、ボタンBT35、BT36と同様の機能を有する。
<管理サーバの構成>
 図6は、本実施形態に係る管理サーバ1の構成を示す概略ブロック図である。
 管理サーバ1は、入出力部I1、記憶部M1、及び制御部P1を含んで構成される。
 入出力部I1は、通信部111を含んで構成される。記憶部M1は、注文情報記憶部121、ゲーム設定記憶部122、学習設定記憶部123、状況情報記憶部124、収集情報記憶部125、及びサービスログ記憶部126を含んで構成される。制御部P1は、注文管理部131、設定更新部132、ゲーム設定部133、学習設定部134、サービス管理部135、及び納品管理部136を含んで構成される。
<データ>
(注文テーブル、注文学習テーブル、注文料金テーブル:注文情報)
 図7は、本実施形態に係る注文テーブルの一例を示す概略図である。
 注文テーブルは、注文基本表示G211(図4)の生成に用いられる。注文テーブルでは、注文ID、依頼元、依頼日、納品期限、納品情報、納品日、注文学習ID、注文料金ID、及びサービスIDの各項目が対応付けられている。注文テーブルは、注文IDを主キーとして、注文情報のうち、注文基本情報がレコードとして格納される。
 納品情報は、納品物(追加学習情報又は収集データセット)や納品先を示す情報である。納品先には、例えば、人工知能サーバ5のURIが格納される。また、ある注文IDの注文に対して、管理者等が納品物を納品した場合、その注文IDのレコードの納品日に日付が入力される。納品日に日付がない場合は、納品状態が未納品であり、納品日に日付がない場合は、納品状態が納品済みである。
 注文学習ID及び注文料金IDは、それぞれ、注文学習テーブル及び注文料金テーブルと関連付けるための識別子であり、管理サーバ1によって生成される。注文学習ID及び注文料金IDは、それぞれ、注文学習テーブル及び注文料金テーブルと注文テーブルを関連付けるための識別子であり、管理サーバ1によって生成される。サービスIDは、学習設定テーブル、ゲーム設定テーブル、状況管理テーブル、及び収集管理テーブルと注文テーブルを関連付ける。
 図8は、本実施形態に係る注文学習テーブルの一例を示す概略図である。
 注文学習テーブルは、注文料金表示G213(図4)の生成に用いられる。注文学習テーブルでは、注文学習ID、基準モデル設定、基準データセット、注文クラス設定、及び注文データ収集条件の各項目が対応付けられている。注文学習テーブルは、注文学習IDを主キーとして、注文情報のうち、注文学習情報がレコードとして格納される。
 基準モデル設定及び基準データセットには、それぞれ、基準モデル設定及び基準データセットの格納先のURIが格納される。
 図9は、本実施形態に係る注文料金テーブルの一例を示す概略図である。
 注文料金テーブルは、注文料金表示G213(図4)の生成に用いられる。注文学習テーブルでは、注文料金ID、認識率単価、データ数単価、利用者数単価、対戦キャラクタ加算、パラメータ単価、及び報酬加算の各項目が対応付けられている。注文料金テーブルは、注文料金IDを主キーとして、注文情報のうち、注文料金情報がレコードとして格納される。
 注文学習テーブルの各項目は、注文料金表示G213に表示される料金設定の単価である。パラメータ単価は、ヒットポイントについての単価の例を示したが、他のゲームでの変数ごとに、単価が設定されてもよい。
(ゲーム設定テーブル:ゲーム設定)
 図10は、本実施形態に係るゲーム設定テーブルの一例を示す概略図である。
 ゲーム設定テーブルは、ゲーム設定表示G221及び学習設定表示G222(図4)の生成に用いられ、また、ゲーム設定表示G221及び学習設定表示G222に表示された内容で更新される。
 ゲーム設定テーブルでは、サービスID、ゲーム_データ収集条件、設定クラス、ゲームID、イベントID、対戦キャラクタID、報酬ID、及び関連サーバの各項目が対応付けられている。ゲーム設定テーブルは、サービスIDを主キーとして、ゲーム設定がレコードとして格納される。ゲーム_データ収集条件は、データ収集条件のうち、ゲームサーバ3に設定される条件である。ゲーム_データ収集条件は、報酬の条件である。クラス設定には、第1クラス、第2クラス、第3クラス(図4の例の場合、「猫」、「チーズ」、「自動車」)が格納されている。報酬IDは、報酬を識別する識別子であり、報酬設定ごとに生成される関連サーバには、管理サーバ1、ゲームサーバ3、及び学習サーバ4のURIが格納される。
(学習設定テーブル:学習設定)
 図11は、本実施形態に係る学習設定テーブルの一例を示す概略図である。
 学習設定テーブルは、学習設定表示G222(図4)の生成に用いられ、また、学習設定表示G222に表示された内容で更新される。
 学習設定テーブルでは、サービスID、学習_データ収集条件、設定クラス、基準学習設定、基準データセット、及び関連サーバの各項目が対応付けられている。学習設定テーブルは、サービスIDを主キーとして、学習設定がレコードとして格納される。
 学習_データ収集条件は、データ収集条件のうち、学習サーバ4に設定される条件である。学習_データ収集条件は、収集の期間、件数、モデル認識率の条件である。関連サーバには、管理サーバ1、ゲームサーバ3、及び学習サーバ4のURIが格納される。
(ゲーム状況テーブル、収集状況テーブル:状況情報)
 図12は、本実施形態に係るゲーム状況テーブルの一例を示す概略図である。
 ゲーム状況テーブルは、サービス管理画面G3(図5)の生成に用いられる。
 ゲーム状況テーブルでは、サービスID、ゲーム状況、第1クラスゲーム状況、第2クラスゲーム状況、第3クラスゲーム状況、及びゲーム報告設定の各項目が対応付けられている。ゲーム状況テーブルは、サービスIDを主キーとして、ゲーム状況情報がレコードとして格納される。
 ゲーム状況には、サービス状況(全体)としての対戦数、成功数、失敗数、及びこれらの時間変化が格納される。第1クラスゲーム状況、第2クラスゲーム状況、及び第3クラスゲーム状況には、それぞれ、第1クラス、第2クラス、及び第3クラスについて、対戦数、成功数、失敗数、及びこれらの時間変化が格納される。ゲーム報告設定は、ゲーム状況情報を報告する設定であり、報告先(管理サーバ1)のURIや報告タイミングが格納されている。
 図13は、本実施形態に係る収集状況テーブルの一例を示す概略図である。
 収集状況テーブルは、サービス管理画面G3(図5)の生成に用いられる。
 収集状況テーブルでは、サービスID、収集状況、第1クラス収集状況、第2クラス収集状況、第3クラス収集状況、及び収集報告設定の各項目が対応付けられている。収集状況テーブルは、サービスIDを主キーとして、収集状況情報がレコードとして格納される。
 収集状況には、サービス状況(全体)としてのモデル認識率及びデータセット数、及びこれらの時間変化が格納される。第1クラス収集状況、第2クラス収集状況、及び第3クラス収集状況には、それぞれ、第1クラス、第2クラス、及び第3クラスについて、モデル認識率及びデータセット数、及びこれらの時間変化が格納される。収集報告設定は、収集状況情報を報告する設定であり、報告先(管理サーバ1)のURIや報告タイミングが格納されている。
(収集管理テーブル:追加学習情報、収集データセット)
 図14は、本実施形態に係る収集管理テーブルの一例を示す概略図である。
 収集管理テーブルは、追加学習情報及び収集データセットの管理に用いられる。
 収集状況テーブルでは、サービスID、追加学習情報、第1クラスデータセット、第2クラスデータセット、第3クラスデータセット、及び取得日時の各項目が対応付けられている。収集管理テーブルは、サービスIDを主キーとして、収集情報がレコードとして格納される。追加学習情報には、追加学習情報のURIが格納される。第1クラスデータセット、第2クラスデータセット、及び第3クラスデータセットには、それぞれ、第1クラス、第2クラス、及び第3クラスの収集データセットのURIが格納される。
(サービスログ)
 図15は、本実施形態に係るサービスログの一例を示す概略図である。
 サービスログは、ユーザID、日時、サービスID、モデル情報、確定クラス、データセット、認識情報、ゲームID、イベントID、対戦キャラクタID、及び報酬IDを含んで構成される。サービスログは、認識評価を行ったときの履歴である。
 ユーザIDは、ユーザを識別する識別子である。ユーザIDは、データを収集するサービスでのユーザIDであるが、ゲームでユーザを識別するユーザIDであってもよい。モデル情報は、認識評価に用いた学習済モデルの識別情報である。認識情報は、モデル認識率、認識率改善値、及び認識評価値である。データセットは、ユーザから入力されたクラス(確定クラス)と画像のデータセットである。
 図15のサービスログは、「ユーザID」のユーザから、「日時」の日時に、「サービスID」のサービスで「モデル情報」の示す学習モデルに対して、「データセット」のクラスと画像のデータセットが入力され、このデータセットは、認識評価で「認識情報」のモデル認識率、認識率改善値、及び認識評価値となったことを示す。また、このデータセットは、「ゲームID」のゲームの「イベントID」のイベントにおいて、「対戦キャラクタID」の対戦キャラクタとの対戦で入力され、ユーザに対して「報酬ID」の報酬が付与されたことを示す。
<管理サーバ1の処理>
 図16は、本実施形態に係る管理サーバ1の処理の一例を示すフロー図である。
 以下、図6を参照して、管理サーバ1の各部の処理を説明する。
 なお、管理サーバ1の各部は、他の装置と、通信部111を介して通信する。
(ステップS201)注文管理部131は、端末T1から注文情報を取得する。注文管理部131は、人工知能サーバ5から基準モデル設定及び基準データセットを取得する。注文管理部131は、注文情報を、注文情報記憶部121の注文テーブル、注文学習テーブル、注文料金テーブルに記憶させる。
(ステップS202)設定更新部132は、ステップS201の注文情報に基づいて、サービス設定画面G2を生成して、端末T1に表示させる。設定更新部132は、管理者からの入力に基づいて、ゲーム設定及び学習設定を更新する。ここで、設定更新部132は、クラス設定で「自動」が選択されている場合、例えば認識率の低いクラスを決定する。
(ステップS203)ゲーム設定部133は、ステップS202で更新されたゲーム設定を、ゲーム設定記憶部122のゲーム設定テーブルに記憶させるとともに、ゲームサーバ3へ送信する。
(ステップS204)学習設定部134は、ステップS202で更新された学習設定を、学習設定記憶部123の学習設定テーブルに記憶させるとともに、学習サーバ4へ送信する。
(ステップS205)サービス管理部135は、学習サーバ4から、サービスログを取得し、サービスログ記憶部126に記憶させる。サービス管理部135は、ゲームサーバ3からゲーム状況情報を取得し、状況情報記憶部124のゲーム状況テーブルに記憶させる。サービス管理部135は、学習サーバ4から収集状況情報を取得し、状況情報記憶部124の学習状況テーブルに記憶させる。
(ステップS206)サービス管理部135は、学習情報要求条件を充足するか否かを判定する。学習情報要求条件は、例えば、管理者が、図5のボタンBT32、BT33、BT34、BT35、又は、BT38をクリックするという条件である。また、学習情報要求条件は、例えば、学習設定のデータ収集条件を充足するという条件である。学習情報要求条件が充足されない場合、サービス管理部135は、ステップS205とステップS206の処理を継続する。
(ステップS207)学習情報要求条件が充足された場合、サービス管理部135は、追加学習情報要求を学習サーバ4へ送信する。サービス管理部135は、学習サーバ4から、追加学習情報と収集データセットを取得し、フォルダに保存する。サービス管理部135は、保存先のURIを、収集情報記憶部125の収集管理テーブルに記憶させる。
(ステップS208)納品管理部136は、管理者からの納品指示により、ステップS206で取得した追加学習情報と収集データセットを、納品情報の納品先(例えば、人工知能サーバ5)へ送信する。納品管理部136は、注文テーブルの注文情報の納品日に日付を書き込む。なお、納品管理部136は、管理者から納品日が入力された場合、その日付を納品日に書き込んでもよい。
(ステップS209)サービス管理部135は、ステップS205で取得したサービスログを集計し、ゲーム状況情報及び収集状況情報と併せて分析する。
<携帯端末とゲームサーバ>
 図17は、本実施形態に係る携帯端末2の構成を示す概略ブロック図である。
 携帯端末2は、入出力部I2、記憶部M2、及び制御部P2を含んで構成される。
 入出力部I2は、通信部211、入力部212、出力部213、撮像部214、及びセンサ部215を含んで構成される。記憶部M2は、オペレーション記憶部221、ゲーム記憶部222、及びデータ記憶部223を含んで構成される。制御部P2は、オペレーション部231、ゲーム制御部232、撮影制御部233、情報閲覧部234、ファイル管理部235、及び表示制御部236を含んで構成される。
 通信部211は、通信モジュールで実現され、他の装置と通信を行う。
 入力部212は、タッチパネルやソフトウェアキーボードで実現され、ユーザからの入力を受け付ける。入力部212は、マイクや物理的なボタンで実現され、ユーザから、声や押下による入力を受け付ける。
 出力部213は、ディスプレイで実現され、画像(文字を含む)を表示する。出力部213は、スピーカ、ライト又は振動子で実現され、音、光又は振動による出力を行う。
 撮像部214は、カメラで実現され、撮像素子で撮影した画像(動画を含む)をデジタルデータ(画像ファイル)として記録する。
 センサ部215は、GPS(全地球測位システム)、加速度センサ、ジャイロセンサ、又は照度センサ等のセンサで実現され、装置の状態又は装置の周囲環境(ユーザの状態を含む)を測定し、測定結果のデータを保存する。
 オペレーション部231は、オペレーション記憶部221にインストールされたOSによって、コンピュータのオペレーションを行う。オペレーション部231は、オペレーション記憶部221にデータを読み書きすることで、オペレーションを行う。
 ゲーム制御部232は、ゲーム記憶部222にインストールされたゲームアプリによって、ゲームを制御する。ゲーム制御部232は、ゲーム記憶部222にデータを読み書きすることで、ゲームを制御する。ゲーム制御部232の詳細は、後述する。
 撮影制御部233は、撮像部214を用いて撮影を行うアプリケーションである。撮影制御部233は、ゲーム制御部232からAPI(アプリケーションプログラミングインタフェース)を呼び出され、動作する。撮影制御部233は、撮像部214で撮影した画像について、その画像ファイルをデータ記憶部223に記憶させる。
 情報閲覧部234は、ウェブブラウザである。情報閲覧部234は、ゲーム制御部232からAPIを呼出され、ウェブ(例えば、インターネット)上のファイルを、ユーザに閲覧させる。また、情報閲覧部234は、画像の送受信が可能なアプリである。情報閲覧部234は、画像ファイルを、ダウンロードしてデータ記憶部223に記憶させる。
 ファイル管理部235は、ファイルブラウザである。ファイル管理部235は、ゲーム制御部232からAPIを呼出され、記憶部M2に記憶されているファイルを、ユーザに閲覧させる。
 表示制御部236は、制御部P2の各部からの映像データに従って、映像信号を生成し、出力部213に画像を表示させる。
 なお、撮影制御部233、情報閲覧部234、及びファイル管理部235は、ユーザからの入力により直接動作するアプリであってもよい。
 図18は、本実施形態に係るゲームサーバ3の構成を示す概略ブロック図である。
 ゲームサーバ3は、入出力部I3、記憶部M3、及び制御部P3を含んで構成される。
 入出力部I3は、通信部311を含んで構成される。記憶部M3は、オペレーション記憶部321、及び管理アプリ記憶部322を含んで構成される。制御部P3は、オペレーション部331、及び管理アプリ制御部332を含んで構成される。
 通信部311は、通信モジュールで実現され、他の装置と通信を行う。
 オペレーション部331は、オペレーション記憶部321にインストールされたOSによって、コンピュータのオペレーションを行う。オペレーション部331は、オペレーション記憶部321にデータを読み書きすることで、オペレーションを行う。
 管理アプリ制御部332は、管理アプリ記憶部322にインストールされた管理アプリケーションによって、携帯端末2のゲームを制御する。管理アプリ制御部332は、管理アプリ記憶部322にデータを読み書きすることで、ゲームを制御する。管理アプリ制御部332の詳細は、後述する。
 図19は、本実施形態に係るゲーム制御部232と管理アプリ制御部332の構成を示す概略ブロック図である。
 ゲーム制御部232は、イベント管理部2321、クラス提示部2322、画像取得部2323、データセット提供部2324、変数値更新部2325、及び報酬付与部2326を含んで構成される。管理アプリ制御部332は、イベント通知部3321、クラス管理部3322、データセット受信部3323、判定部3324、報酬決定部3325、及びログ生成部3326を含んで構成される。
 図20は、本実施形態に係るゲーム制御部232と管理アプリ制御部332の処理の一例を示すシーケンス図である。
 以下、図17、図18、図19を参照して、ゲーム制御部232と管理アプリ制御部332の各部の処理を説明する。なお、管理アプリ制御部332は、管理サーバ1から受信したゲーム設定(図10)を、管理アプリ記憶部322に記憶させる。
(ステップS301)イベント通知部3321は、管理アプリ記憶部322に記憶されたゲーム設定を読み出し、ゲーム設定のサービスID、ゲームID、イベントID及び対戦キャラクタIDを、ゲーム制御部232へ通知する。
(ステップS302)イベント管理部2321は、ステップS301で通知されたゲームIDのゲームにおいて、対戦キャラクタIDに対応するアイコンを、表示制御部236に表示させる。このアイコンがユーザにタップされた場合、イベント管理部2321は、サービスIDを、管理アプリ制御部332へ通知する。
(ステップS303)クラス管理部3322は、ステップS302で通知されたサービスIDに対して、ゲーム設定で対応する設定クラスを参照する。クラス管理部3322は、参照した設定クラスとして、第1クラス、第2クラス、第3クラスを、ゲーム制御部232へ通知する。
(ステップS304)クラス提示部2322は、ステップS303で通知された設定クラスを、表示制御部236に表示させる。例えば図1では、表示制御部236は、画面G11(出力部213)の領域G112に、第1クラス(猫)、第2クラス(チーズ)、及び第3クラス(自動車)を表示させている。
(ステップS305)ユーザが撮影を選択した場合、画像取得部2323は、撮影制御部233を呼出して、ユーザに撮影させる。ユーザは、ステップS304で表示された設定クラスのオブジェクトを、撮影する。画像取得部2323は、撮影制御部233が撮影した画像を取得する。例えば図1では、ユーザは、画面G11でボタンBT11をタップし、画面G12の画像G121を撮影している。
 なお、ユーザがボタンBT11をタップした場合、画像取得部2323は、ファイル管理部235を呼出して、ユーザに画像ファイルを選択させる。画像取得部2323は、ファイル管理部235で選択された画像を取得する。
(ステップS306)データセット提供部2324は、ユーザにクラスを選択させる表示を、表示制御部236に表示させる。例えば図1では、表示制御部236は、画面G12(出力部213)に、第1クラス(猫)、第2クラス(チーズ)、又は第3クラス(自動車)のいずれか1個を選択させるプルダウンメニューG122を、表示させている。ユーザがクラスを選択した場合、データセット提供部2324は、選択されたクラスを、確定クラスとする。
(ステップS307)データセット提供部2324は、ステップS305で取得された画像と、ステップS306で選択された確定クラスと、をデータセットとして、管理アプリ制御部332へ送信する。
(ステップS308)データセット受信部3323は、ステップS307で送信されたデータセットを受信する。
(ステップS309)判定部3324は、ステップS308で受信されたデータセットを、認識評価を要求する評価要求として、学習サーバ4へ送信する。判定部3324は、認識評価の評価結果として、学習サーバ4から、認識率改善値を受信する。認識率改善値は、モデル認識率の改善具合を10段階で評価した値(後述する図27)である。
(ステップS310)報酬決定部3325は、ステップS309で受信された認識率改善値に応じて、ユーザに付与する報酬を決定する(「報酬決定処理」とも称する)。報酬決定処理については、後述する(図20参照)。
(ステップS311)変数値更新部2325は、ステップS301で決定された報酬のうち、ゲームでの変数(ヒットポイント)を更新する。変数値更新部2325は、更新の結果を表示制御部236に表示させる。例えば図1では、表示制御部236は、画面G13(出力部213)に、画像G132(マイナス300ポイント)と画像G133(プラス100ポイント)を表示せている。
(ステップS312)報酬付与部2326は、ステップS301で決定された報酬のうち、ゲームオブジェクト(カード)を付与する。報酬付与部2326は、付与の結果を表示制御部236に表示させる。例えば図1では、表示制御部236は、画面G14(出力部213)に、カードG141を表示させている。
(ステップS311)ログ生成部3326は、ゲームログ(図15参照)を生成し、管理サーバ1へ送信する。具体的には、ログ生成部3326は、ユーザの「ユーザID」、ステップステップS309で認識率改善値を受信した「日時」、ステップS307の「データセット」(確定クラスと画像)を、ゲームログとして記録する。また、ログ生成部3326は、ステップS302で通知された「サービスID」に対応する「ゲームID」、「イベントID」、「対戦キャラクタID」、及び、ステップS301で決定された報酬の「報酬ID」を、ゲームログに記録する。ログ生成部3326は、記録したゲームログを、学習サーバ4へ送信する。また、ログ生成部3326は、サービスID及び設定クラスごとに、対戦数、成功数、失敗数、及びこれらの時間変化を算出することで、ゲーム状況情報を生成する。ログ生成部3326は、ゲーム報告設定に従って、管理サーバ1へ送信する。
(報酬決定処理)
 報酬決定部3325が行う報酬決定処理について、説明する。
 報酬決定部3325は、報酬選択テーブル(図21)を参照し、認識率改善値に対する報酬を、ユーザに付与する報酬とする。
 図21は、本実施形態に係る報酬選択テーブルの一例を示す概略図である。
 報酬選択テーブルは、管理アプリ記憶部322に記憶され、報酬決定処理に用いられる。報酬選択テーブルは、サービス設定画面G2(図4)からの入力で更新されてもよい。
 報酬選択テーブルでは、サービスID、認識評価値、対象変数、変数値、付与条件、及びゲームオブジェクトの各項目が対応付けられている。報酬選択テーブルは、サービスIDと認識評価値を主キーとして、報酬選択情報がレコードとして格納される。
 対象変数は、報酬として更新されるゲームでの変数である。変数値は、更新後の変数の値または変数の値の変化である。付与条件はゲームオブジェクトを付与する条件である。報酬は、認識評価値が高い程、つまり、モデル認識率が高くなる程、より良い報酬が設定されている。逆に、報酬は、認識評価値が低い程、つまり、モデル認識率が低くなる程、より悪い報酬が設定されている。
 より良い報酬とは、操作キャラクタの変数値がより高く上がる報酬、対戦キャラクタの変数値がより低く下がる報酬、ゲームオブジェクトが付与される報酬、又は、より高いレアリティのゲームオブジェクトが付与される報酬である。より悪い報酬とは、操作キャラクタの変数値がより低く下がる報酬、対戦キャラクタの変数値がより高く上がる報酬、ゲームオブジェクトが付与されない報酬、又は、より低いレアリティのゲームオブジェクトが付与される報酬である。
 報酬決定部3325は、管理アプリ記憶部322に記憶された報酬選択テーブルを用いることで、認識評価値に応じて報酬を決定する。具体的には、報酬決定部3325は、認識評価値が高くなるほど、報酬を、より良い報酬に決定する。逆に、報酬決定部3325は、認識評価値が低くなるほど、報酬を、より悪い報酬に決定する。
 なお、認識評価値は、モデル認識率が高くなる程、又は認識率改善値が増加する程、高い値となる。逆に、認識評価値は、モデル認識率が低くなる程、又は認識率改善値が減少する程、低い値となる。認識率改善値とは、データセットによる学習後の学習済モデルのモデル認識率から、学習前の学習済モデルのモデル認識率を差し引いた値である。
 図22は、本実施形態に係る学習サーバ4の構成を示す概略ブロック図である。
 学習サーバ4は、入出力部I4、記憶部M4、及び制御部P4を含んで構成される。
 入出力部I4は、通信部411を含んで構成される。記憶部M4は、サービスIDごとに、学習設定記憶部421、基準記憶部422、収集データ記憶部423、及び収集ログ記憶部424を含んで構成される。図22では、説明の簡便のため、特定のサービスIDについての学習サーバ4の構成が示されている。制御部P4は、学習設定部431、データ取得部432、学習部433、評価部434、及び報告部435を含んで構成される。
 収集データ記憶部423は、追加学習済モデル記憶部4231、第1データセット記憶部4232、第2データセット記憶部4233、及び第3データセット記憶部4234を含んで構成される。
<学習サーバ>
 図23は、本実施形態に係る学習サーバ4の処理の一例を示すフロー図である。
 以下、図22を参照して、学習サーバ4の各部の処理を説明する。
 なお、学習サーバ4の各部は、他の装置と、通信部411を介して通信する。
(ステップS401)学習設定部431は、管理サーバ1から送信された学習設定(図11)を受信し、学習設定記憶部421に記憶させる。学習設定部431は、その学習設定の機会学習プログラムを設定する。このとき設定された機会学習プログラムの学習済モデルを「基準学習済モデル」とも称する。
(ステップS402)学習設定部431は、学習設定の基準データセットを、学習設定記憶部421に記憶させる。学習設定部431は、ステップS401で設定された基準学習済モデルに基準データセットの画像を入力することで、基準データセットのクラスについてのモデル認識率(「基準認識率」とも称する)を算出する。例えば、猫の画像と「猫」が基準データセットの場合、学習設定部431は、その猫の画像を入力し、出力されたクラスごとの確率のうち、画像が「猫」である確率を、基準認識率として算出する。
 学習設定部431は、算出した基準認識率を、基準認識率として、基準記憶部422に記憶させる。ここで、学習設定部431は、クラスごとに、少なくとも1対の基準データセットに基づいて基準認識率を算出して、基準記憶部422に記憶させる。
(ステップS403)データ取得部432は、ゲームサーバ3から送信された評価要求(図3のステップS114、図20のステップS309)を受信し、ユーザから入力されたデータセットを取得する。データ取得部432は、取得したデータセットを収集データ記憶部423に記憶させる。なお、データ取得部432は、例えば、確定クラスが「猫」、「チーズ」、「自動車」の場合、それぞれ、第1データセット記憶部、第2データセット記憶部、第3データセット記憶部に記憶させる。
(ステップS404)学習部433は、ステップS403で取得されたデータセットを用いて、機会学習プログラムに、ステップS401で設定された基準学習済モデルに対して、さらなる機械学習を行わせる。この機械学習によって、機会学習プログラムが生成した学習済モデルを、「評価学習済モデル」とも称する。
(ステップS405)評価部434は、評価学習済モデルに、データセットの確定クラスの基準データセットの画像を入力することで、モデル認識率(「評価認識率」とも称する)を算出する。評価部434は、算出した評価認識率から基準認識率を差し引いた値を、認識率改善値として算出する。
(ステップS406)評価部434は、評価値テーブルを用いて(図27参照)、算出した認識率改善値に応じた認識評価値を決定する。評価部434は、決定した認識評価値を、ステップS403の評価要求への応答として返信する。
 ステップS404からステップS406までの評価処理についての詳細は、後述する。
(ステップS407)報告部435は、ゲームサーバ3から送信されたログ(図3のステップS117、図20のステップS313)を受信する。報告部435は、受信したログに、認識情報としてモデル認識率、認識率改善値、及び認識評価値を追加することで、サービスログを生成する。報告部435は、生成したサービスログを収集ログ記憶部424に記憶させるとともに、管理サーバ1へ送信する(図15参照)。また、報告部435は、サービスID及び設定クラスごとに、モデル認識率及びデータセット数、及びこれらの時間変化を算出することで、収集状況情報を生成する。報告部435は、収集報告設定に従って、管理サーバ1へ送信する。
(ステップS408)報告部435は、学習設定の「学習_データ収集条件」の条件を充足するか否かを判定する。その条件が充足されている場合、制御部P4は、ステップS403からS407の処理を繰り返す。
 一方、その条件が充足されない場合、制御部P4は、データセットの収集を終了する。この場合、報告部435は、ゲームサーバ3に、終了する対象のサービスIDを通知し、サービスIDに対応するイベントIDのイベントを終了させる。
 特定のクラス(「終了クラス」とも称する)のみについての条件が充足されない場合、制御部P4は、その終了クラスについてのデータセットの収集を終了する。報告部435は、ゲームサーバ3に、終了する対象のサービスID及び終了クラスを通知し、例えば、サービスIDに対応するイベントIDのイベントで、終了クラスの表示を削除させる。この場合、その他のクラスについて、制御部P4は、ステップS403からS407の処理を繰り返す。
(ステップS408)管理サーバから追加学習情報要求を受信した場合、学習部433は、第1データセット記憶部4232、第2データセット記憶部4233、及び第3データセット記憶部4234に記憶されたデータセット(収集データセット)を読み出す。学習部433は、読み出した収集データセットを用いて、機会学習プログラムに、基準学習済モデルに対して機械学習を行わせる。この機械学習によって、機会学習プログラムは、追加学習済モデルを生成する。報告部435は、追加学習済モデルの追加学習情報及び収集データセットを、追加学習情報要求への応答として、管理サーバ1へ送信する。
 追加学習情報には、例えばCNN等のニューラルネットワークの場合、追加学習済モデルの重み係数が含まれる。
<評価処理>
 以下、制御部P4が行う評価処理について、詳細を説明する。次の例は、学習設定のモデル種別が「CNN」の場合の例である。
 学習部433は、ユーザから入力されたデータセットから、画像と確定クラスを抽出する。学習部433は、学習用のCNNに対して、画像の画素値を入力層に入力する入力変数とし、確定クラスを出力層から出力される出力変数として設定する。なお、出力変数は、確定クラスに対応付けられた数値や分類であってもよい。
[CNNについて]
 図24は、本実施形態に係る機械学習における実行手順を説明する説明図である。
 この図において、CNNは、L個の層L0~L4から構成される。層L1は入力層、層L2~層L3は中間層或いは隠れ層、層L4は出力層とも呼ばれる。
 CNNは、入力層L0に、入力画像が入力される。入力画像は、入力画像の垂直方向の位置と水平方向の位置を、行列の位置とする画素行列D11で表される。画素行列D11の各要素は、行列の位置に対応する画素のサブ画素値として、R(赤)のサブ画素値、G(緑)のサブ画素値、B(青)サブ画素値が入力されている。
 1番目の中間層L1は、畳み込み処理(フィルター処理とも呼ばれる)とプーリング処理が行われる層である。
(畳み込み処理)
 中間層L1の畳み込み処理の一例について説明する。畳み込み処理は、元の画像にフィルタをかけて特徴マップを出力する処理である。
 具体的には、入力された画素値は、それぞれ、Rのサブ画素行列D121、Bのサブ画素行列D122、Gのサブ画素行列D123に分けられる。各サブ画素行列D121、D122、D123(各々を「サブ画素行列D12」とも称する)は、それぞれ、s行t列の部分行列ごとに、その部分行列の各要素とs行t列のコンボリューション行列CM1(カーネルとも呼ばれる)の要素が乗算されて加算されることで、第1画素値が算出される。各サブ画素行列D12で算出された第1画素値は、それぞれ、重み係数を乗算されて加算されることで、第2画素値が算出される。第2画素値は、部分行列の位置に対応する行列要素として、畳込画像行列D131の各要素に設定される。各サブ画素行列D12において部分行列の位置が要素(サブ画素)ごとにずらされることで、各位置での第2画素値が算出され、畳込画像行列D131の全ての行列要素が算出される。
 例えば、図24は3行3列のコンボレーション行列CM1の場合の一例であり、畳込画素値D1311は、各サブ画素行列D12の2行目から4行目、かつ、2列目から4列目までの4行4列の部分行列について第1画素値が算出される。各サブ画素行列D121、D122、D123の第1画素値に、重み係数が算出されて加算されることで、畳込画像行列D131の2行目2列目の行列要素として、第2画素値が算出される。同様に、3行目から5行目、かつ、2列目から4列目の部分行列から、畳込画像行列D131の3行目2列目の行列要素の第2画素値が算出される。
 また同様に、他の重み付け係数又は他のコンボリューション行列を用いて、畳込画像行列D132、・・・が算出される。
(プーリング処理)
 中間層L1のプーリング処理の一例について説明する。プーリング処理は、画像の特徴を残しながら画像を縮小する処理である。
 具体的には、畳込画像行列D131は、u行v列の領域PMごとに、領域内の行列要素の代表値が算出される。代表値は、例えば、最大値である。その代表値は、領域の位置に対応する行列要素として、CNN画像行列D141の各要素に設定される。畳込画像行列D131において領域が、領域PMごとにずらされることで、各位置での代表値が算出され、畳込画像行列D131の全ての行列要素が算出される。
 例えば、図24は2行2列の領域PMの場合の一例であり、畳込画像行列D131の3行目から4行目、かつ、3列目から4列目までの2行2列の領域について、領域内の第2画素値のうち最大値が、代表値として算出される。この代表値は、CNN画像行列D141の2行目2列目の行列要素に設定される。同様に、5行目から6行目、かつ、2列目から4列目の部分行列から、CNN画像行列D141の3行目2列目の行列要素の代表値が算出される。また同様に、畳込画像行列D132、・・・から、CNN画像行列D142、・・・が算出される。
 CNN画像行列D141、D142、・・・の各行列要素(N個)は、予め定められた順序で並べられることで、ベクトルxが生成される。図24では、ベクトルxの要素x(n=1、2、3、・・・N)は、N個のノードで表されている。
 中間層L2は、第i番目の中間層(i=2~L-1)の中間層を表している。第i目の中間層のノードからは、ベクトルu(i)が関数f(u(i))に入力された値として、ベクトルz(i)が出力される。ベクトルu(i)は、第i-1目の中間層のノードから出力されるベクトルz(i-1)に、重み行列W(i)を左から乗算し、ベクトルb(i)を加算したベクトルである。関数f(u(i))は、活性化関数であり、ベクトルb(i)は、バイアスである。またベクトルu(0)は、ベクトルxである。
 出力層L4のノードはz(L-1)であり、その出力は、M個のy(m=1、2、・・・M)である。つまり、CNNの出力層からは、yを要素とするベクトルy(=(y、y、y、・・・y))が出力される。
 以上により、CCNは、入力変数として入力画像の画素値が入力された場合に、出力変数としてベクトルyを出力する。ベクトルyは、クラスごとの認識率を表す。
 図25は、本実施形態に係る機械学習における学習手順を説明する説明図である。
 この図において、図24のCNNが機械学習を行う場合の説明図である。
 データセットの画像の画素値に対して、第1番目の中間層から出力されたベクトルxをベクトルXとする。データセットの確定クラスを表すベクトルをベクトルYとする。
 重み行列W(i)には、初期値が設定される。入力画像が入力層に入力され、その結果、第2番目の中間層にベクトルXが入力された場合、出力層からベクトルXに応じたベクトルy(X)が出力される。ベクトルy(X)とベクトルYの誤差Eは、損失関数を用いて計算される。第i層の勾配ΔEは、各層からの出力zと誤差信号δを用いて計算される。誤差信号δは、誤差信号δi-1を用いて計算される。なお、このように、出力層側から入力層側へ誤差信号を伝えていくことは、逆伝搬とも呼ばれる。
 重み行列W(i)は、勾配ΔEに基づいて更新される。同様に、第1番目の中間層においても、コンボリューション行列CM又は重み係数が更新される。
[基準学習済モデルの設定]
 学習設定部431は、CNNの場合、層数、各層のノード数、各層間のノードの結合方式、活性化関数、誤差関数、及び勾配降下アルゴリズム、プーリングの領域、カーネル、重み係数、重み行列を設定する。
 学習設定部431は、例えば、層数として、4層(L=3)を設定する。ただし、本発明はこれに限らず、総数は、5層以上であってもよい。学習設定部431は、各層のノードの数(「ノード数」とも称する)として、ベクトルxの要素数(ノード数N)に800、第2番目の中間層(i=2)のノード数に500、出力層(i=3)に10を設定する。ただし、ノード数には、別の値が設定されてもよい。
 学習設定部431は、20個の5行5列のコンボリューション行列CMをし、2行2列の領域PMを設定する。ただし、本発明はこれに限らず、別の行列数又は別の個数のコンボリューション行列CMが設定されてもよい。また、別の行列数の領域PMが設定されてもよい。
 学習設定部431は、より多くの畳み込み処理又はプーリング処理を行ってもよい。
 学習設定部431は、ニューラルネットワークの各層の結合として、全結合を設定する。ただし、本発明はこれに限らず、一部或いは全ての層の結合は、非全結合に設定であってもよい。学習設定部431は、活性化関数として、全ての層の活性化関数にシグモイド関数を設定する。ただし、本発明はこれに限らず、各層の活性化関数は、ステップ関数、線形結合、ソフトサイン、ソフトプラス、ランプ関数、切断冪関数、多項式、絶対値、動径基底関数、ウェーブレット、maxout等、他の活性化関数であってもよい。また、ある層の活性化関数は、他の層とは異なる種類であってもよい。
 学習設定部431は、誤差関数として、二乗損失(平均二乗誤差)を設定する。ただし、本発明はこれに限らず、誤差関数は、交差エントロピー、τ-分位損失、Huber損失、ε感度損失(ε許容誤差関数)であってもよい。また、学習設定部431は、勾配を計算するアルゴリズム(勾配降下アルゴリズム)として、SGD(確率的勾配降下)を設定する。ただし、本発明はこれに限らず、勾配降下アルゴリズムには、Momentum(慣性項) SDG、AdaGrad、RMSprop、AdaDelta、Adam(Adaptive moment estimation)等が用いられても良い。
 学習設定部431は、畳み込みニューラルネットワーク(CNN)に限らず、パーセプトロンのニューラルネットワーク、再起型ニューラルネットワーク(RNN)、残差ネットワーク(ResNet)等の他のニューラルネットワークを設定してもよい。また、学習設定部431は、決定木、回帰木、ランダムフォレスト、勾配ブースティング木、線形回帰、ロジスティック回帰、又は、SVM(サポートベクターマシン)等の教師あり学習の学習済モデルを一部或いは全部に設定してもよい。
[評価処理]
 学習部433は、上記CNNを用いた学習の結果、重み行列w(i)コンボリューション行列CM又は重み係数が更新されたCNNを、評価学習済みモデルとして取得する。
 評価部434は、基準データセットの画像の画素値を、評価学習済みモデルに入力することで、その出力として評価認識率を取得する。評価部434は、算出した評価認識率から基準認識率を差し引いた値を、認識率改善値として算出する。
 図26は、本実施形態に係る認識率改善値の算出処理を説明する説明図である。
 この図は、確定クラスが「猫」のとき、図23の処理が行われた場合の説明図である。
 ステップS402の処理で、基準データセットの画像に対して、基準学習済モデルでの基準認識率は、「猫」の「89%」である。
 ステップS404の処理で、ユーザから入力されたデータセットを用いて、基準学習済モデルに対して機械学習が行われた結果、「評価学習済モデル」が生成される。
 ステップS405では、基準データセットの画像に対して、「評価学習済モデル」での基準認識率は、「猫」の「90.2%」である。
 この場合、クラス「猫」での認識率改善値は、1.2%(90.2%-89%)と算出される。
 図27は、本実施形態に係る評価値テーブルの一例を示す概略図である。
 評価部434は、基準記憶部422に記憶されている評価値テーブルを用いて、認識率改善値に応じた認識評価値を決定する。なお、評価値テーブルは、サービス設定画面G2(図4)からの入力で更新されてもよい。
 評価値テーブルでは、サービスID、認識率改善値、及び認識評価値の各項目が対応付けられている。認識評価値は、サービスIDと認識率改善値を主キーとして、評価値情報がレコードとして格納される。
 認識評価値は、認識率改善値が高くなる程、高い値が設定されている。逆に、認識評価値は、認識率改善値が低くなる程、低い値が設定されている。
 なお、認識率改善値と認識評価値の関係は、サービスIDごとに、異なる関係を設定できる。例えば、同じデータセットでも、異なる基準モデル設定(基準学習済モデル)では、通常、認識率改善値は異なる。本実施形態では、サービスIDごとに認識率改善値と認識評価値の関係を設定できるので、機械学習システムSysは、基準モデル設定が異なる場合(サービスIDも異なる)でも、異なる関係を設定できる。これにより、機械学習システムSysは、認識評価での認識率改善値の算出基準が変わってしまう場合でも、ユーザに対して、基準の違いを吸収して、報酬を付与することができる。
<人工知能サーバ5と制御機器6>
 図28は、本実施形態に係る人工知能サーバ5の構成を示す概略ブロック図である。
 人工知能サーバ5は、入出力部I5、記憶部M5及び制御部P5を含んで構成される。
 入出力部I5は、通信部511を含んで構成される。記憶部M5は、オペレーション記憶部521、及びアプリ記憶部522を含んで構成される。制御部P5は、オペレーション部531、機器制御部532、及び学習部533を含んで構成される。
 通信部511は、通信モジュールで実現され、他の装置と通信を行う。
 オペレーション部531は、オペレーション記憶部521にインストールされたOSによって、コンピュータのオペレーションを行う。オペレーション部531は、オペレーション記憶部521にデータを読み書きすることで、オペレーションを行う。
 機器制御部532は、アプリ記憶部522にインストールされたアプリケーションによって、制御機器6を制御する。機器制御部532は、管理サーバ1から納品された追加学習済モデルを、アプリ記憶部522に記憶させる。機器制御部532は、制御機器6から入力された画像を、この追加学習済モデルに入力し、出力されたクラスを用いて、制御機器6を制御する。
 なお、学習部533は、他のデータセットを用いて、追加学習済モデルに対して、さらなる機械学習を行ってもよい。また、学習部533は、管理サーバ1から納品された収集データセットの一部或いは全部を用いて、他の学習済モデル(例えば、基準学習済モデル)に対して、機械学習を行ってもよい。
 図29は、本実施形態に係る制御機器6の構成を示す概略ブロック図である。
 制御機器6は、入出力部I6、記憶部M6、及び制御部P6を含んで構成される。
 入出力部I6は、通信部611、入力部612、出力部613、撮像部614、センサ部615、及び駆動部616の一部或いは全部を含んで構成される。記憶部M6は、オペレーション記憶部621、及びアプリ記憶部622を含んで構成される。制御部P6は、オペレーション部631、アプリ制御部632、及び撮影制御部633を含んで構成される
 通信部611は、通信モジュールで実現され、他の装置と通信を行う。
 入力部612は、タッチパネルやソフトウェアキーボードで実現され、ユーザからの入力を受け付ける。入力部612は、マイクや物理的なボタンで実現され、ユーザから、声や押下による入力を受け付ける。
 出力部613は、ディスプレイで実現され、画像(文字を含む)を表示する。出力部613は、スピーカ、ライト又は振動子で実現され、音、光又は振動による出力を行う。
 撮像部614は、カメラで実現され、撮像素子で撮影した画像(動画を含む)をデジタルデータ(画像ファイル)として記録する。
 センサ部615は、GPS、加速度センサ、ジャイロセンサ、照度センサ、赤外線センサ、温度センサ、姿勢センサ等のセンサで実現され、装置の状態又は装置の周囲環境を測定し、測定結果のデータを保存する。
 駆動部616は、ロボットアームのアーム部や把持部等の動作機器、空調や調温等の制御機器、物理的な動作又は物理的な状態を変化させる機器である。
 オペレーション部631は、オペレーション記憶部621にインストールされたOSによって、コンピュータのオペレーションを行う。オペレーション部631は、オペレーション記憶部621にデータを読み書きすることで、オペレーションを行う。
 アプリ制御部632は、アプリ記憶部622にインストールされたアプリケーションによって、出力を制御する。アプリ制御部632は、アプリ記憶部622にデータを読み書きすることで、出力を制御する。
 撮影制御部633は、撮像部614を用いて撮影を行うアプリケーションである。撮影制御部633は、アプリ制御部632からAPIを呼び出され、動作する。
 アプリ制御部632は、撮像部614で撮影した画像を、人工知能サーバ5へ送信する。アプリ制御部632は、人工知能サーバ5からクラスを受信する。アプリ制御部632は、受信したクラスに応じて、入出力部I6の各部を制御する。
<まとめ>
(1)以上のように、機械学習システム(例えば、機械学習システムSys)は、第1システム(例えばデータ収集システムSysA)と第2システム(人工知能システムSysB)を備える。
 第1システムでは、提示部(例えば、ゲーム制御部232、クラス提示部2322)、機械学習のための目的情報(例えばクラス)を提示する。入力部(例えば画像取得部2323)は、前記目的情報に対する説明情報(例えば、画像)を、ユーザから入力される。取得部(例えば、データセット提供部2324、データセット受信部3323、データ取得部432)は、前記説明情報と前記目的情報を取得する。評価部(例えば評価部434)は、前記説明情報に基づく入力変数(例えば画像の画素値)と前記目的情報に基づく出力変数(例えば確定クラス)のデータセット、及び、予め定められた学習済モデルに基づいて、前記説明情報による前記目的情報の分類精度(例えば認識率)についての評価(例えば認識評価)を行う。報酬付与部(例えば、報酬決定部3325、報酬付与部2326)は、前記評価に応じた報酬(例えばヒットポイントの増減、カード)を、前記ユーザに対して付与する。履歴生成部(例えば報告部435)は、前記目的情報、前記評価結果、及び前記報酬を関係付けられた履歴情報(サービスログ)を生成する。
 第2システムでは、モデル記憶部(例えばアプリ記憶部522)は、前記データセットの少なくとも1個に基づいて学習が行われた学習済モデル(例えば追加学習済モデル)を記憶する。実行部(例えば機器制御部532)は、前記モデル記憶部が記憶する学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力する。
 これにより、機械学習システムは、目的情報を提示した上で、各ユーザから、機械学習に用いるデータとして、目的情報と説明情報のデータセットを収集できる。各ユーザが説明情報を入力するので、機械学習システムは、多数のデータセット又は多様なデータセットを取得でき、より効率的に、機械学習に用いるデータを収集できる。
 また、機械学習システムは、ユーザが目的情報を指定された上で、簡易な操作で説明情報を提供できるので、効率的に機械学習に用いるデータを収集できる。また、ユーザが評価結果に応じた報酬が付与されるので、評価結果が良くなる画像を提供する。この場合、機械学習システムは、評価結果が良くなる画像を、機械学習に用いるデータとして収集できる。また、機械学習システムは、目的情報、評価結果、及び報酬を関係付けられた履歴情報を生成するので、例えば履歴情報を集計することで、目的情報、評価結果、及び報酬の関係を分析することができる。
 なお、目的情報は、クラス以外の目的変数、従属変数、外敵基準であってもよい。目的情報は、教示あり学習における出力又は出力に関する情報であってもよい。目的情報は、教師データであってもよい。説明情報は、画像以外の独立変数であってもよく、例えば文字列、音等の波形、又は特徴量空間等の座標の値であってもよい。説明情報は、教示あり学習における入力又は入力に関する情報であってもよい。 入力変数及び出力変数には、それぞれ、説明情報及び目的情報の複製も含まれる。また、出力変数は、画像であってもよい。
 また、説明情報をユーザから入力されることには、複数の説明変数を一度に、又は、連続して入力されることが含まれる。例えば、提示されたクラス(例えば「猫」)に対し、「猫」の撮像画像を、複数枚を一度に送信することが含まれる。複数枚を一度に送信することには、連続撮影した画像群を一度に送信させることが含まれる。連続撮影した画像群を送信させる場合、機械学習システムSysは、類似する複数の画像をデータセットとして取得できる。これにより、機械学習システムSysは、例えばモデル認識率が高い画像を、複数枚の画像群として学習に用いることができ、認識率改善値を高くできる場合がある。また連続撮影した画像群を送信する場合、ゲームサーバ3(制御部P3)又は学習サーバ4(制御部P4)は、認識率改善値の最大値を認識率改善値にしてもよいし、認識率改善値に加算や乗算をしてもよい。また連続撮影した画像群を送信する場合、ゲームサーバ3は、1枚の画像を送信する場合と比較して、高い報酬を決定してもよい。
 報酬は、ゲーム以外の報酬であってもよい。例えば、報酬は、商取引媒体コンテンツであってもよい。商取引媒体とは、例えば、電子マネー、ポイントサービスでのポイント、物やサービスとの引換券、クーポンであってもよい。引換券には、音楽や映像、画像等、電子的データをダウンロードするものや、限定コンテンツへのアクセス等の電子的データの利用権限を付与するものも含まれる。クーポンには、例えば提携先の飲食店で使用可能なクーポンや、電子商取引サイトで使用可能なカード等に付随するポイントが含まれる。ここで、カードには、お金の決済に利用できるクレジットカードや非接触型カードだけでなく、お金の代わりとして使えるカードが含まれる。なお、ゲームサーバ3は、報酬の付与数を、提携先に報告するための報告情報を生成してもよい。また、管理サーバ1は、ゲームサーバ3から報酬の付与数を示す報告情報を受信し、付与数に応じて、提携先に支払いをするための支払情報を生成してもよい。
 分類精度には、分類の精度や認識の精度に限らず、識別の精度も含まれる。説明情報による目的情報の分類精度についての評価は、上述の認識評価に限られない。例えば、データセットの画像を入力し、確定クラスでの認識率を基準認識率と比較してもよい。この場合、確定クラスでの認識率から基準認識率を差し引いた値を、認識率改善値としてもよい。
 予め定められた学習済モデルは、依頼先から入手した学習済モデルの種類や各種変数であってもよいし、固定或いは選択された学習済モデルであってもよい。例えば、人工知能サーバ5-1が用いる学習済モデルと、学習サーバ4が認識評価に用いる学習済モデルは異なっていてもよい。これらが異なる場合、管理サーバ1は、収集データセットを納品し、学習部533は、納品された収集データセットを用いて機械学習を行ってもよい。人工知能サーバ5-1が用いる学習済モデルは、収集データセットの一部を用いて、機械学習が行われたものであってもよい。
(2)また、機械学習システムでは、前記提示部は、オブジェクト(例えば画像の被写体)を表す目的情報を提示する。前記入力部は、前記オブジェクトが描画された画像を、前記説明情報として入力される。前記評価部は、前記画像による前記目的情報の分類精度についての評価を行う。前記実行部は、オブジェクトが描画された画像が入力された場合に、当該オブジェクトを表す目的情報を出力する。
 これにより、機械学習システムは、機械学習に用いるデータとして、収集したいオブジェクトに応じた画像を収集できる。また、ユーザが提示されたオブジェクトを先に知ることができるので、オブジェクトを特定した上で、そのオブジェクトの写真を撮ることや、フォルダから探すことができる。
 なお、画像は、写真やイラスト、アニメーションの画像に限られない。例えば、画像は、物理量を測定し、その分布を表した画像であってもよい。例えば、画像は、物体から放射される赤外線を分析し、熱分布を図として表したサーモグラフィであってもよい。
 描画とは、コンピュータにおいて、画像又は映像としてレンダリングできることであってもよい。また、描画とは、写真に写されること、映像に撮影されること、イラスト等として描かれることが含まれてもよい。
(3)また、機械学習システムでは、前記提示部は、複数のユーザの情報端末(例えば携帯端末2-1~2-N)各々の表示部に、前記目的情報を提示する。前記取得部は、前記情報端末各々の前記入力部から入力された前記説明情報を取得する。
 これにより、機械学習システムは、複数のユーザから、機械学習に用いるデータとして、目的情報と説明情報のデータセットを収集できる。複数のユーザが説明情報を入力するので、機械学習システムは、多数のデータセット又は多様なデータセットを取得でき、より効率的に、機械学習に用いるデータを収集できる。
 なお、情報端末は、スマートフォンに限られず、タブレット端末、ヘッドマウントディスプレイ、パーソナルコンピュータ、音楽プレーヤー、デジタルカメラ、テレビ、スマートスピーカ、家電機器、及び、ウェアラブル端末等であってもよい。情報端末は、携帯される端末に限らず、設置型の端末であってもよい。
(4)また、機械学習システムでは、前記第1システムは、複数の情報端末と、複数の情報端末各々とインターネットを介して接続されるサーバ(学習サーバ4)と、を具備する。インターネットを介して提供されたアプリケーションプログラム(例えばモバイルアプリケーション、ゲームアプリ)は、前記情報端末各々を前記提示部と前記入力部として機能させる。前記サーバは、前記取得部を備える。前記取得部は、複数のユーザの情報端末各々から、インターネットを介して、前記説明情報と前記目的情報を取得する。
 これにより、機械学習システムは、アプリケーションプログラムを、インターネットを介して提供するので、一般的なユーザに幅広く利用されることができる。機械学習システムは、多数のデータセット又は多様なデータセットを取得でき、より効率的に、機械学習に用いるデータを収集できる。
 なお、アプリケーションプログラムは、ゲームに限らず、情報閲覧、画像閲覧、コミュニケーション、オフィスツール等のアプリケーションプログラムであってもよい。
(5)また、機械学習システムでは、前記第1システムは、注文管理部(例えば注文管理部131)と納品管理部(例えば納品管理部136)をさらに備える。注文管理部は、第2システムに関する依頼元であって、前記説明情報と前記目的情報を取得することを依頼する依頼元を示す依頼元情報を管理する。納品管理部は、前記データセットの納品状況であって、前記依頼元情報が示す依頼元への納品状況を管理する。前記モデル記憶部は、納品された前記データセットの少なくとも1個に基づいて学習が行われた学習済モデルを記憶する。
 これにより、機械学習システムは、複数の依頼元から、データセットを収集する依頼を受注し、その注文管理することができる。また、機械学習システムは、データセットの納品を管理することができる。これにより、機械学習システムは、管理者に対して、データセットを収集するサービスのプラットフォームを提供でき、そのサービスによるビジネスを円滑に行わせることができる。
(6)また、機械学習システムでは、前記提示部は、複数の前記目的情報を提示する(図1の領域G112、プルダウンメニューG122参照)。前記入力部は、前記ユーザが選択した前記目的情報と、当該目的情報に対する説明情報と、を入力される。前記取得部は、複数の前記目的情報について、前記説明情報と前記目的情報を取得する。
 これにより、ユーザは、複数の目的情報から、説明変数を提供可能な目的情報を選択できる。例えば、ユーザは、写真を撮ることができるクラスや、画像を保持しているクラスを選択できるので、機械学習システムは、1つだけ提示する場合と比較して、データセットを収集できる可能性を高くすることができる。また、機械学習システムは、1つだけ提示する場合と比較して、ユーザがクラスの画像を提供できずに、ゲームをあきらめてしまい、サービスを利用しなくなる可能性を低くすることができる。
(7)また、機械学習システムでは、前記第1システムは、情報端末を具備し、前記情報端末は、前記提示部、前記入力部、及び撮像部(例えば撮像部214)を備え、前記提示部は、オブジェクトを表す目的情報を提示し、前記入力部は、前記説明情報として、前記撮像部で撮像された画像であって、前記オブジェクトが描画された画像を、前記説明情報として入力される。
 これにより、ユーザは、これから撮影する画像、又は過去に撮影した画像を、画像を撮影し記録可能な情報端末から入力することができる。例えば、ユーザは、提示されたオブジェクトを、提示が参照された情報端末の撮像部で撮影できる。ユーザは、提示されたオブジェクトが描写された画像を有していない場合でも、提示を参照した情報端末で撮影し、撮影した画像を提供できる。
(8)また、機械学習システムでは、ゲームプログラムは、複数の前記情報端末各々を前記提示部、前記入力部、報酬付与部として機能させる。前記提示部は、ゲーム内のイベントにおいて、前記目的情報を提示する。前記入力部は、前記ユーザが前記ゲームを進行させるために、前記目的情報に対する画像を、前記説明情報として入力される。前記報酬付与部は、前記ゲームの報酬として、前記ゲームでの変数の更新、又はゲームオブジェクトの付与を行う。
 これにより、ユーザは、ゲームで楽しみながら、データセットを提供できる。
 なお、ゲーム内のイベントとは、ゲームでの対戦等である。ゲームのシナリオにおいて、ユーザが対戦相手と遭遇すること、ユーザが対戦相手を選択すること、又は、所定条件で自動的に対戦が始まることも含まれる。対戦相手には、コンピュータが制御するノンプレイヤーキャラクタだけではなく、通信等で人間が操作するキャラクタも含まれる。
(9)また、機械学習システムでは、設定部(例えば設定更新部132)は、予め定められた学習済モデルにおける目的情報の分類精度に基づいて、前記提示部に提示させる目的情報(例えば認識率の低いクラス)を決定する。
 これにより、機械学習システムは、分類精度の低い目的情報を提示して、その目的情報の説明情報を取得することができる。これにより、機械学習システムは、分類精度の低い目的情報の分類精度を、優先して向上させることができる。
 なお、設定更新部132は、基準学習済モデルに基準データセットを入力し、認識率の低いクラスを、設定クラスに決定する。
<ハードウェア構成>
 図30は、本実施形態に係る各装置のハードウェア構成を説明する説明図である。
 各装置とは、管理サーバ1、携帯端末2、ゲームサーバ3、学習サーバ4、人工知能サーバ5、制御機器6、又は、端末T1である。各装置は、入出力モジュールI、記憶モジュールM、及び制御モジュールPを含んで構成される。入出力モジュールIは、通信モジュールH11、接続モジュールH12、ポインティングデバイスH21、キーボードH22、ディスプレイH23、ボタンH3、マイクH41、スピーカH42、カメラH51、又はセンサH52の一部或いは全部を含んで実現される。記憶モジュールMは、トライブH7を含んで実現される。記憶モジュールMは、さらに、メモリH8の一部或いは全部を含んで構成されてもよい。制御モジュールPは、メモリH8及びプロセッサH9を含んで実現される。これらのハードウェア構成要素は、バス(Bus)を介して、相互に通信可能に接続されるとともに、電源H6から電力を供給されている。
 接続モジュールH12は、USB(Universal Seriul Bus)等のデジタル入出力ポートである。携帯機器の場合、ポインティングデバイスH21、キーボードH22、及びディスプレイH23は、タッチパネルである。センサH52は、加速度センサ、ジャイロセンサ、GPS受信モジュール、近接センサ等である。電源H6は、各装置を動かすために必要な電気を供給する電源ユニットである。携帯機器の場合、電源H6は、バッテリーである。
 ドライブH7は、ハードディスクドライブやソリッドステートドライブ等の補助記憶媒体である。ドライブH7は、EEPROMやフラッシュメモリ等の不揮発性メモリ、又は、光磁気ディスクドライブやフレキシブルディスクドライブであってもよい。また、ドライブH7は、例えば、各装置に内蔵されるものに限らず、IFモジュールH12のコネクタに接続された外付け型の記憶装置でもよい。
 メモリH8は、ランダムアクセスメモリ等の主記憶媒体である。なお、メモリH8は、キャッシュメモリであってもよい。メモリH8は、一又は複数のプロセッサH9によって命令が実行されるときに、これらの命令を格納する。
 プロセッサH9は、プロセッサH9は、CPU(中央演算装置)である。プロセッサH9は、MPU(マイクロプロセッシングユニット)又はGPU(グラフィックスプロセッシングユニット)であってもよい。プロセッサH9は、メモリH8を介してドライブH7から、プログラム及び各種データを読み出して演算を行うことで、一又は複数のメモリH8に格納した命令を実行する。
 入出力モジュールIは、入出力部I1、I2、I3、I4、I5、及びI6を実現する。記憶モジュールMは、記憶部M1、M2、M3、M4、M5、及びM6を実現する。制御モジュールPは、制御部P1、P2、P3、P4、P5、及びP6を実現する。
 なお、本明細書等において、管理サーバ1、携帯端末2、ゲームサーバ3、学習サーバ4、人工知能サーバ5、及び制御機器6との記載は、それぞれ、制御部P1、P2、P3、P4、P5、及びP6との記載に置き換えられてもよいし、これらの各装置及び端末T1との記載は、制御モジュールPとの記載に置き換えられてもよい。
<変形例>
 上記実施形態において、情報端末は、ソーシャルネットワークサービス(コミュニケーションサービスを含む)、ブログ、情報掲載サイト、又は情報検索サイト等のウェブサイトや、それらのモバイルアプリケーションで表示されるコンテンツの画像を、ユーザに選択させて、確定クラスの画像としてユーザに入力させてもよい。
 図31は、本実施形態に係る画面フローの別の一例を表す概要図である。
 この図は、情報端末の一例である携帯端末2の制御部P2が、入出力部I2に表示させる画面フローの一例である。図31と図1を比較すると、画面G1とボタンBT41が異なる。これ以外の表示は同じであるので、説明を省略する。
 ボタンBT11がユーザにタッチされた場合、携帯端末2(制御部P2)は、ウェブブラウザ機能を起動し、ウェブサイトを表示する。画面G41は、このウェブサイトが表示された画面である。画面G41では、ユーザは、画像をタップすることで、静止画又は動画を選択することができる。画像が選択された状態で、ボタンBT42がユーザにタッチされた場合、携帯端末2は、その画像が選択された画面G12を表示する。
 このように、前記第1システムは、情報端末を具備する。前記情報端末は、前記提示部、前記入力部、及び、ネットワークサービスにて画像を含む情報を前記ユーザに閲覧させる情報閲覧部(例えば制御部P2、情報閲覧部234)を備える。前記提示部は、オブジェクトを表す目的情報を提示する。前記入力部は、前記ユーザが指定した前記画像の少なくとも一部であって、前記オブジェクトが描画された前記画像を、前記説明情報として入力される。
 これにより、ユーザは、ネットワークサービスの画像を、データセットの画像として選択できる。機械学習システムは、ネットワークサービスの画像も取得できるので、さらに多数のデータセット又は多様なデータセットを取得でき、より効率的に、機械学習に用いるデータを収集できる。
 なお、本実施形態に係るゲームアプリは、ソーシャルネットワークサービス、ブログ、情報掲載サイト、又は情報検索サイト等のウェブサイトや、それらのモバイルアプリケーションの一機能として、実装されてもよい。例えば、携帯端末2(ゲームアプリ、ゲーム制御部232)は、ユーザが友人の投稿を参照した場合に、設定クラスを提示してもよい。例えば、携帯端末2は、友人の投稿を参照させた場合に、クラス「カレー」、「アイスクリーム」、「自動車」を提示する。ユーザは、投稿から画像を選択し、確定クラスとともに、これらのデータセットを提供する。ここで、携帯端末2は、ユーザが友人に画像を選択することの許諾を得る機能を提供し、許諾が得られた場合に、データセットを取得してもよいし、または、報酬を付与してもよい。
 携帯端末2(例えば制御部P2)は、ユーザに画像を選択させる場合に、タッチ操作に応じて、確定カテゴリを選択してもよい。タッチ操作には、複数回のタップ、ドラッグ、又はスワイプが含まれる。例えば、携帯端末2は、ドラッグの始点と終点の位置(ドラッグの方向)に応じて、確定カテゴリを選択する。
 図32は、本実施形態に係る画面フローの別の一例を表す概要図である。
 この図は、携帯端末2の制御部P2が、入出力部I2に表示させる画面フローの一例である。携帯端末2は、操作ごとに選択するクラスを予め設定されている。
 例えば、携帯端末2は、画面の左上から右下へ、右斜め下がりにドラッグされた場合、第1クラス(猫)を選択し、画面の右上から左下へ、左斜め下がりにドラッグされた場合、第3クラス(自動車)を選択するように設定されている。
 画面G51は、始点F51から終点F52へ、つまり、画面の左上から右下へ、右斜め下がりにドラッグが行われている。この場合、携帯端末2は、画面G52のように、始点F51と終点F52を頂点とする矩形を、ユーザに選択された選択領域G521として、表示する。選択領域G521が表示された状態で、ボタンBT51がユーザにタッチされた場合、携帯端末2は、画面G53を表示する。画面G53では、クラスを選択するプルダウンメニューの初期値として、第1クラスの「猫」が選択されて表示されている。
 画面G61は、始点F61から終点F62へ、つまり、画面の右上から左下へ、左斜め下がりにドラッグが行われている。この場合、携帯端末2は、画面G62のように、始点F61と終点F62を頂点とする矩形を、ユーザに選択された選択領域G621として、表示する。選択領域G621が表示された状態で、ボタンBT61がユーザにタッチされた場合、携帯端末2は、画面G63を表示する。画面G63では、クラスを選択するプルダウンメニューの初期値として、第3クラスの「自動車」が選択されて表示されている。
 なお、ボタンBT13は、図1のものと同じである。また、始点と終点は、2回のタップで指定されてもよい。
 このように、携帯端末2は、操作の方向、又は、画面上の2点の位置関係に応じて、プルダウンメニューの選択肢の1個を、初期値として選択して表示する。これにより、ユーザは、簡易な操作で、入力する選択肢を、初期値として選択できる。
 なお、携帯端末2は、操作の方向、又は、画面上の2点の位置関係に応じて、ラジオボタンやチェックボックスの選択肢の1個又は複数を、初期値として選択してもよい。
 また、携帯端末2は、ドラッグ後の画面G52、画面G53において、ショートカットメニューを表示し、ショートカットのメニューとして、ドラッグの方向に対応するクラスを優先して、選択可能に表示してもよい。
 携帯端末2(例えば制御部P2)は、ユーザが撮影した後、撮影された画像について、顔部分を検出し、検出した顔部分をぼかす等のモザイク処理を行ってもよい。これにより、機械学習システムSysは、ユーザのプライバシー保護に配慮しつつ、データセットの画像を取得できる。
 学習サーバ4(例えば制御部P4)は、説明情報として音データを取得してもよい。
 図33は、本実施形態に係る画面フローの別の一例を表す概要図である。
 この図は、携帯端末2の制御部P2が、入出力部I2に表示させる画面フローの一例である。図33と図1を比較すると、画面G71、G72、及び画面G73の表示732が異なる。これ以外の表示は同じであるので、説明を省略する。
 画面G71は、画面G11と比較して、領域712とボタンBT71の表示が異なる。
 領域G712には、画像のクラスとして、猫、犬、及び、自動車が表示されている。
 ボタンBT71がユーザにタッチされた場合、携帯端末2は、マイクを起動し、音を録音可能な画面(図示せず)を表示する。この画面では、ユーザは、録音ボタンをタップすることで、音を録音することができる。
 画面G72には、画像G721に音データの情報(「説明情報」の一例)が表示されている。音データは、音データで、再生ボタンをタップすることで、再生可能である。
 画面73の画像G732は、画像G721の音の評価として、評価の高い音である旨(「GREAT Sound」)を表す画像である。
 携帯端末2(例えば制御部P2)は、撮像部214で撮像させる場合に、認識率に基づくガイダンス表示を行ってもよい。
 例えば、携帯端末2は、基準学習済モデルを用いて、撮影している画像からオブジェクトを認識し、そのオブジェクトの認識率を取得する。この認識率は、設定クラスの認識率であってもよいし、認識率の最大となるクラスの認識率であってもよい。携帯端末2は、学習サーバ4へ画像を送信してもよいし、自装置に基準学習済モデルを記憶してもよい。
 携帯端末2は、認識率が高くなるように、被写体との位置関係やズーム、又は、自装置の向きのガイダンス表示を行う。
 図34は、本実施形態に係る画面フローの別の一例を表す概要図である。
 この図は、携帯端末2の制御部P2が、入出力部I2に表示させる画面フローの一例である。画面G81には、被写体S(猫)が認識され、被写体Sを囲む枠G811が表示されている。ガイダンス表示G812は、枠G811で囲った部分を大きく写すこと、つまり、被写体に近づくかカメラのズーム機能を使うべき(ズームアップすべき)ことを案内している。
 画面G82は、ユーザがガイダンス表示に従って、被写体Sを大きく写した場合に表示される。画面G82では、認識率が画面G81の70%から80%に増加している。
 画面G82には、被写体Sを囲む枠G821が表示されている。ガイダンス表示G822は、携帯端末2を被写体Sに対して回転(ヨー軸の回転)させるべきことを案内している。また、ガイダンス表示G822は、認識率に応じた報酬として、ノーマルカードが付与されることも表している。つまり、画面G82の状態で、撮影した被写体Sの画像をデータセットにした場合、報酬としてノーマルカードが付与される。
 画面G83は、ユーザがガイダンス表示に従って、携帯端末2を被写体Sに対して回転させた場合に表示される。画面G83では、認識率が画面G82の80%から85%に増加している。
 画面G81には、被写体Sを囲む枠G831が表示されている。ガイダンス表示G832は、携帯端末2を、別の方向に回転(ロール軸の回転)させるべきことを案内している。また、ガイダンス表示G832は、認識率に応じた報酬として、レアカードが付与されることも表している。つまり、画面G82の状態で、撮影した被写体Sの画像をデータセットにした場合、報酬としてレアカードが付与される。
 画面G84は、ユーザがガイダンス表示に従って、携帯端末2を回転させた場合に表示される。画面G84では、認識率が画面G83の85%から94%に増加している。
 画面G84には、被写体Sを囲む枠G841が表示されている。ガイダンス表示G842は、この状態で、撮影すべきことを案内している。また、ガイダンス表示G832は、認識率に応じた報酬として、スーパーレアカードが付与されることも表している。つまり、画面G84の状態で、撮影した被写体Sの画像をデータセットにした場合、報酬としてレアカードが付与される。
 画面G85は、画面G84でBT81がタップされ、枠G841部分が撮影されたことを表している。
 管理サーバ1(制御部P1)は、データセットを提供した以外の複数のユーザに、データセットの画像を評価させ、評価結果に応じて、データセットとして適切か否かを判定してもよい。データセットとして適切か否かとは、データセットとして学習に用いるか否か、又は、データセットとして納品するか否かであってもよい。
 図35は、本実施形態に係る画面の別の一例を表す概要図である。
 この図は、携帯端末2の制御部P2が、入出力部I2に表示させる画面の一例である。画面G91には、あるユーザから取得した画像G911と確定クラス「猫」が表示されている。画面G91には、いいね(Like)ボタンBT91といやだね(Dislike)ボタンBT92が表示されている。ボタンBT91は、986人の他のユーザ(986個のユーザID)からタップされ、ボタンBT92は、15人の他のユーザからタップされている。
 つまり、986人の他のユーザは、画像G911を、「猫」の画像である、又は、「猫」の画像として適切である、と評価している。一方、15人の他のユーザは、画像G911を、「猫」の画像ではない、又は、「猫」の画像として適切でない、と評価している。
 管理サーバ1は、ボタンBT91による評価数とボタンBT92による評価数の差が、閾値以上になった場合、データセットとして適切であると判定する。
 このように、機械学習システムSysは、人間の評価も含めて、データセットを取得することができる。また、機械学習システムSysは、不特定多数のユーザがデータセットを提供可能である場合でも、他の人間の評価により、適切なデータセットを取得できる。
 携帯端末2(例えば制御部P2)は、クラスを提示する画面、写真を撮影可能な画面、又は、ファイルやコンテンツの画像を選択可能な画面において、クラスの画像のサンプル(「サンプル画像」とも称する)を表示してもよい。これにより、ユーザは、撮影或いは選択すべき画像を認識しやすくなる。また、年齢の低い子供や外国人等、クラスを表す文字の言語に不慣れなユーザであっても、撮影或いは選択すべき画像を認識できる。
 また、ユーザは、サンプル画像に似た写真を撮影或いは選択するので、サンプル画像で、被写体の大きさや向き(角度)を指定することもできる。これにより、機械学習システムSysは、学習データセットとして、所望の大きさや向きの被写体が描写された画像を取得できる可能性が高くなる。
 図36は、本実施形態に係る画面フローの別の一例を表す概要図である。
 この図は、携帯端末2の制御部P2が、入出力部I2に表示させる画面フローの一例である。画面Ga11には、クラスとして、猫及び自動車が、文字とサンプル画像で表示されている。画像Ga111は、クラス「猫」のサンプル画像である。また、画面Ga11では、クラスごとに、カメラを起動するボタン、画像を選択する機能を発生させるボタンが配置されている。これにより、携帯端末2は、ユーザが選択したクラスや画像の種類(撮影した画像又は選択した画像)を特定できる。例えばボタンBTa11がユーザにタッチされた場合、携帯端末2は、カメラを起動し、画面Ga12を表示する。
 画面Ga12には、ユーザに選択されたクラス及びそのサンプル画像Ga121が表示されている。画像Ga122は、カメラが撮影している画像である。
 ユーザが撮影ボタンBTa121をタップした場合、携帯端末2は、そのとき撮影していた画像を画像ファイルとして記憶する。その後、携帯端末2は、画面Ga13において、画像ファイルの画像を表示する。画面Ga13において、ボタンBta131がユーザにタッチされた場合、携帯端末2は、図20のステップS308~S310の処理を行った後、画面Ga14を表示する。
 画面Ga14には、例えば電子商取引サイトやクレジットカードのポイントとして、100ポイントが付与されたことが表示されている。また画面Ga14には、そのポイントの合計値が2300ポイントであることが表示されている。また画面Ga14には、ポイントを消費するサイトへリンクされたボタンが表示されている。例えばボタンは、ポイントを消費して、商品と交換するサイトへリンクされたボタンである。例えばボタンは、ポイントを消費して、買い物をするサイトへリンクされたボタンである。
なお、サービスログは、次のように集計されてもよい(図16のステップS209)。
管理サーバ1(サービス管理部135)は、データセットの確定クラスごとに、各ゲーム因子(ゲームID、イベントID、対戦キャラクタID、又は報酬ID)に対して、モデル認識率の平均値、対戦数又はデータセット数を算出する。管理サーバ1は、同一又は類似する確定クラスの画像を収集する場合に、モデル認識率の平均値、対戦数又はデータセット数が最大となるゲーム因子を管理者へ提示し、ゲーム設定として設定する。なお、サービスログの集計では、モデル認識率に代えて或いは追加して、認識率改善値や認識評価値が用いられてもよい。
 なお、データ収集システムSysAと人工知能システムSysBでは、システム或いはサービスの提供主体、開発主体、管理主体、或いは運用主体、又は、各システムの装置にインストールされるアプリケーション、アプリケーションの提供主体、開発主体、管理主体、或いは運用主体が異なる。データ収集システムSysAと人工知能システムSysB-2、B-Mでは、ユーザ(一般ユーザと企業)やクライアント(一般ユーザの携帯端末2と企業の制御機器6-2、6-M)、ネットワーク(インターネットNWと、ローカルエリアネットワークL2或いは直接接続)が異なる。データ収集システムSysAと人工知能システムSysBでは、データセットに対する報酬(変数の更新或いはゲームオブジェクトと、料金)が異なる。ただし、本発明はこれに限らず、データ収集システムSysAと人工知能システムSysBは、同一の主体が提供してもよい。その場合、例えば、依頼元の情報はなくてもよい。
 上述の管理サーバ1、携帯端末2、ゲームサーバ3、学習サーバ4、人工知能サーバ5、及び制御機器6は内部に、コンピュータシステムを有している。そして、上述した図5の一部又は全部の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
 なお、図2における機械学習システムSysの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各種処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
 また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
 本発明の一態様は、例えば、人工知能を利用するシステムや装置、データを収集するシステムや装置において、利用することができる。人工知能は、様々な機器に利用できる。
Sys・・・機械学習システム、SysA・・・データ収集システム、SysB、SysB-1~B-M・・・データ収集システム、1・・・管理サーバ、2、2-1~2-M・・・携帯端末、3・・・ゲームサーバ、4・・・学習サーバ、5、5-1~5-M・・・人工知能サーバ、6、6-1~6-M・・・制御機器、I、I1、I2、I3、I4、I5、I6・・・入出力部、M,M1、M2、M3、M4、M5、M6、M・・・記憶部、P、P1、P2、P3、P4、P5、P6・・・制御部、111・・・通信部、121・・・注文情報記憶部、122・・・ゲーム設定記憶部、123・・・学習設定記憶部、124・・・状況情報記憶部、125・・・収集情報記憶部、126・・・サービスログ記憶部、131・・・注文管理部、132・・・設定更新部、133・・・ゲーム設定部、134・・・学習設定部、135・・・サービス管理部、136・・・納品管理部、211・・・通信部、212・・・入力部、213・・・出力部、214・・・撮像部、215・・・センサ部、221・・・オペレーション記憶部、222・・・ゲーム記憶部、223・・・データ記憶部、231・・・オペレーション部、232・・・ゲーム制御部、233・・・撮影制御部、234・・・情報閲覧部、235・・・ファイル管理部、236・・・表示制御部、311・・・通信部、321・・・オペレーション記憶部、322・・・管理アプリ記憶部、331・・・オペレーション部、332・・・管理アプリ制御部、2321・・・イベント管理部、2322・・・クラス提示部、2323・・・画像取得部、2324・・・データセット提供部、2325・・・変数値更新部、232・・・報酬付与部、3321・・・イベント通知部、3322・・・クラス管理部、3323・・・データセット受信部、3324・・・判定部、3325・・・報酬決定部、3326・・・ログ生成部、411・・・通信部、421・・・学習設定記憶部、422・・・基準記憶部、423・・・収集データ記憶部、424・・・収集ログ記憶部、431・・・学習設定部、432・・・データ取得部、433・・・学習部、434・・・評価部、435・・・報告部、4231・・・追加学習済モデル記憶部、4232・・・第1データセット記憶部、4233・・・第2データセット記憶部、4234・・・第3データセット記憶部、511・・・通信部、521・・・オペレーション記憶部、522・・・アプリ記憶部、531・・・オペレーション部、532・・・機器制御部、533・・・学習部、611・・・通信部、612・・・入力部、613・・・出力部、614・・・撮像部、615・・・センサ部、616・・・駆動部、621・・・オペレーション記憶部、622・・・アプリ記憶部、631・・・オペレーション部、632・・・アプリ制御部、633・・・撮影制御部、H11・・・通信モジュール、H12・・・接続モジュール、H21・・・ポインティングデバイス、H22・・・キーボード、H23・・・ディスプレイ、H3・・・ボタン、H41・・・マイク、H42・・・スピーカ、H51・・・カメラ、H52・・・センサ、H6・・・電源、H7・・・ドライブ、H8・・・メモリ、H9・・・プロセッサ

Claims (24)

  1.  第1システムは、
     機械学習のための目的情報を提示する提示部と、
     前記目的情報に対する説明情報を、ユーザから入力される入力部と、
     前記説明情報と前記目的情報を取得する取得部と、
     前記説明情報に基づく入力変数と前記目的情報に基づく出力変数のデータセット、及び、予め定められた学習済モデルに基づいて、前記説明情報による前記目的情報の分類精度についての評価を行う評価部と、
     前記評価に応じた報酬を、前記ユーザに対して付与する報酬付与部と、
     前記目的情報、前記評価の結果、及び前記報酬が関係付けられた履歴情報を生成する履歴生成部と、
     を備え、
     第2システムは、
     前記データセットの少なくとも1個に基づいて機械学習が行われた学習済モデルを記憶するモデル記憶部と、
     前記モデル記憶部が記憶する学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力する実行部と、
     を備える機械学習システム。
  2.  前記提示部は、オブジェクトを表す目的情報を提示し、
     前記入力部は、前記オブジェクトが描画された画像を、前記説明情報として入力され、
     前記評価部は、前記画像による前記目的情報の分類精度についての評価を行い、
     前記実行部は、オブジェクトが描画された画像が入力された場合に、当該オブジェクトを表す目的情報を出力する
     請求項1に記載の機械学習システム。
  3.  前記提示部は、複数のユーザの情報端末各々の表示部に、前記目的情報を提示し、
     前記取得部は、前記情報端末各々の前記入力部から入力された前記説明情報を取得する
     請求項1又は請求項2に記載の機械学習システム。
  4.  前記第1システムは、複数の情報端末と、前記複数の情報端末各々とインターネットを介して接続されるサーバと、を具備し、
     インターネットを介して提供されたアプリケーションプログラムは、前記情報端末各々を前記提示部と前記入力部として機能させ、
     前記サーバは、前記取得部を備え、
     前記取得部は、複数のユーザの情報端末各々から、インターネットを介して、前記説明情報と前記目的情報を取得する
     請求項1から請求項3のいずれか一項に記載の機械学習システム。
  5.  前記第1システムは、
     第2システムに関する依頼元であって、前記説明情報と前記目的情報を取得することを依頼する依頼元を示す依頼元情報を管理する注文管理部と、
     前記データセットの納品状況であって、前記依頼元情報が示す依頼元への納品状況を管理する納品管理部と、
     をさらに備え、
     前記モデル記憶部は、納品された前記データセットの少なくとも1個に基づいて機械学習が行われた学習済モデルを記憶する
     請求項1から請求項4のいずれか一項に記載の機械学習システム。
  6.  前記提示部は、複数の前記目的情報を提示し、
     前記入力部は、前記ユーザが選択した前記目的情報と、当該目的情報に対する説明情報と、を入力され、
     前記取得部は、複数の前記目的情報について、前記説明情報と前記目的情報を取得する
     請求項1から請求項5のいずれか一項に記載の機械学習システム。
  7.  前記第1システムは、情報端末を具備し、
     前記情報端末は、前記提示部、前記入力部、及び撮像部を備え、
     前記提示部は、オブジェクトを表す目的情報を提示し、
     前記入力部は、前記説明情報として、前記撮像部で撮像された画像であって、前記オブジェクトが描画された画像を、前記説明情報として入力される
     請求項1から請求項6のいずれか一項に記載の機械学習システム。
  8.  前記第1システムは、情報端末を具備し、
     前記情報端末は、前記提示部、前記入力部、及び、ネットワークサービスにて画像を含む情報を前記ユーザに閲覧させる情報閲覧部を備え、
     前記提示部は、オブジェクトを表す目的情報を提示し、
     前記入力部は、前記ユーザが指定した前記画像の少なくとも一部であって、前記オブジェクトが描画された前記画像を、前記説明情報として入力される
     請求項1から請求項7のいずれか一項に記載の機械学習システム。
  9.  ゲームプログラムは、複数の情報端末各々を前記提示部、前記入力部、報酬付与部として機能させ、
     前記提示部は、ゲーム内のイベントにおいて、前記目的情報を提示し、
     前記入力部は、前記ユーザが前記ゲームを進行させるために、前記目的情報に対する画像を、前記説明情報として入力され、
     前記報酬付与部は、前記ゲームの報酬として、前記ゲームでの変数の更新、又はゲームオブジェクトの付与を行う
     請求項1から請求項8のいずれか一項に記載の機械学習システム。
  10.  予め定められた学習済モデルにおける目的情報の分類精度に基づいて、前記提示部に提示させる目的情報を決定する設定部をさらに備える
     請求項1から請求項9のいずれか一項に記載の機械学習システム。
  11.  機械学習のための目的情報を提示する提示部と、
     前記目的情報に対する説明情報を、ユーザから入力される入力部と、
     前記目的情報と前記説明情報を用いた評価に応じた報酬を、前記ユーザに対して付与する報酬付与部と、
     を備える情報端末。
  12.  機械学習のための目的情報、前記目的情報に対する説明情報であってユーザから情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価を行う評価部と、
     前記目的情報、及び前記評価の結果が関係付けられた履歴情報を生成する履歴生成部と、
     を備える情報処理装置。
  13.  機械学習のための目的情報を、情報端末へ送信する送信部と、
     前記目的情報、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価に応じて、前記ユーザに付与する報酬を決定する報酬決定部と、
     を備える情報処理装置。
  14.  機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、機械学習が行われた学習済モデルをモデル記憶部から読み出し、
     前記学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力する実行部と、
     を備える情報処理装置。
  15.  機械学習のための目的情報を提示し、
     前記目的情報に対する説明情報を、ユーザから入力され、
     前記目的情報と前記説明情報を用いた評価に応じた報酬を、前記ユーザに対して付与する、
     情報処理方法。
  16.  機械学習のための目的情報と、前記目的情報に対する説明情報であってユーザから情報端末に入力された説明情報と、を取得し、
     前記説明情報に基づく入力変数と前記目的情報に基づく出力変数のデータセット、及び、予め定められた学習済モデルに基づいて、前記説明情報による前記目的情報の分類精度についての評価を行い、
     前記目的情報、及び前記評価の結果が関係付けられた履歴情報を生成する、
     情報処理方法。
  17.  機械学習のための目的情報を、情報端末へ送信し、
     前記目的情報、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価に応じて、前記ユーザに付与する報酬を決定する、
     情報処理方法。
  18.  機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、機械学習が行われた学習済モデルをモデル記憶部から読み出し、
     前記学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力する、情報処理方法。
  19.  情報端末のコンピュータに、
     機械学習のための目的情報を提示させる提示手順、
     前記目的情報に対する説明情報を、ユーザから入力される入力手順、
     前記目的情報と前記説明情報を用いた評価に応じた報酬を、前記ユーザに対して付与させる報酬付与手順、
     を実行させるためのプログラム。
  20.  情報処理装置のコンピュータに、
     機械学習のための目的情報と、前記目的情報に対する説明情報であってユーザから情報端末に入力された説明情報と、を取得させる取得手順、
     前記説明情報に基づく入力変数と前記目的情報に基づく出力変数のデータセット、及び、予め定められた学習済モデルに基づいて、前記説明情報による前記目的情報の分類精度についての評価を行わせる評価手順、
     前記目的情報、及び前記評価の結果が関係付けられた履歴情報を生成させる履歴生成手順、
     を実行させるためのプログラム。
  21.  情報処理装置のコンピュータに、
     機械学習のための目的情報を、情報端末へ送信する送信手順、
     前記目的情報、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報、及び、予め定められた学習済モデルに基づく評価であって、前記説明情報による前記目的情報の分類精度についての評価に応じて、前記ユーザに付与する報酬を決定する報酬決定手順、
     を実行させるためのプログラム。
  22.  情報処理装置のコンピュータに、
     機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、機械学習が行われた学習済モデルをモデル記憶部から読み出させ、
     前記学習済モデルに基づいて、前記説明情報が入力された場合に、前記目的情報を出力させる実行手順
     を実行させるためのプログラム。
  23.  機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個に基づいて、機械学習が行われた学習済モデルであって、
     前記説明情報が入力された場合に、前記目的情報を出力する
     学習済モデル。
  24.  機械学習のための目的情報であって情報端末に提示された目的情報に基づく入力変数と、前記目的情報に対する説明情報であってユーザから前記情報端末に入力された説明情報に基づく入力変数と、のデータセットの少なくとも1個を取得し、
     前記データセットの少なくとも1個に基づいて機械学習を行うことで、学習済モデルを生産する、学習済モデルを生産する方法。
PCT/JP2019/011193 2019-03-18 2019-03-18 機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法 WO2020188701A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021506853A JP7255671B2 (ja) 2019-03-18 2019-03-18 機械学習システム、情報端末、情報処理方法、プログラム
US17/437,946 US20220168640A1 (en) 2019-03-18 2019-03-18 Machine learning system, information terminal, information processing device, information processing method, program, learned model, and method for generating learned model
PCT/JP2019/011193 WO2020188701A1 (ja) 2019-03-18 2019-03-18 機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/011193 WO2020188701A1 (ja) 2019-03-18 2019-03-18 機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法

Publications (1)

Publication Number Publication Date
WO2020188701A1 true WO2020188701A1 (ja) 2020-09-24

Family

ID=72520694

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/011193 WO2020188701A1 (ja) 2019-03-18 2019-03-18 機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法

Country Status (3)

Country Link
US (1) US20220168640A1 (ja)
JP (1) JP7255671B2 (ja)
WO (1) WO2020188701A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021093568A (ja) * 2019-12-06 2021-06-17 キヤノン株式会社 撮像装置、情報処理装置、及びこれらの制御方法並びにプログラム、学習済みモデル選択システム
US20220008824A1 (en) * 2020-07-13 2022-01-13 Nvidia Corporation Game generation using one or more neural networks

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP2018531543A (ja) * 2015-09-17 2018-10-25 クゥアルコム・インコーポレイテッドQualcomm Incorporated ワイヤレスネットワークにおけるクラウドソースの写真撮影の管理

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018531543A (ja) * 2015-09-17 2018-10-25 クゥアルコム・インコーポレイテッドQualcomm Incorporated ワイヤレスネットワークにおけるクラウドソースの写真撮影の管理
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AHN, LUIS VON ET AL.: "Labeling Images with a Computer Game", PROCEEDINGS OF THE SIGCHI CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS, 29 April 2004 (2004-04-29), pages 319 - 326, XP058264797, Retrieved from the Internet <URL:https://dl.acm.org/citation.cfm'?id=985733> [retrieved on 20190603], DOI: 10.1145/985692.985733 *

Also Published As

Publication number Publication date
US20220168640A1 (en) 2022-06-02
JPWO2020188701A1 (ja) 2020-09-24
JP7255671B2 (ja) 2023-04-11

Similar Documents

Publication Publication Date Title
CN109272380B (zh) 虚拟宠物商品的交易方法、装置、设备及存储介质
US20230022301A1 (ja)
CN105874447B (zh) 用于被引导用户动作的方法、介质和设备
US10102546B2 (en) System and method for tracking, utilizing predicting, and implementing online consumer browsing behavior, buying patterns, social networking communications, advertisements and communications, for online coupons, products, goods and services, auctions, and service providers using geospatial mapping technology, and social networking
US11263662B2 (en) Systems and methods for automatic hashtag embedding into user generated content using machine learning
US20130311566A1 (en) Method and apparatus for creating rule-based interaction of portable client devices at a live event
US20180369695A1 (en) Computer systems and computer-implemented methods for conducting and playing personalized games based on vocal and non-vocal game entries
CN106796700A (zh) 用于电子商务的使用标记媒体、3d索引虚拟现实图像和全球定位系统位置的用户界面
JP7245853B2 (ja) バーチャルペットの繁殖方法、装置、機器及びコンピュータプログラム
WO2021093452A1 (zh) 基于人工智能的博弈业务执行方法、装置、设备及介质
JP7255671B2 (ja) 機械学習システム、情報端末、情報処理方法、プログラム
US20220404949A1 (en) Systems and methods for augmented reality with precise tracking
CN104220137A (zh) 游戏控制装置、游戏控制方法、程序、记录介质、游戏系统
CN108885716A (zh) 信息处理装置、信息处理方法以及信息提供方法
CN107748785A (zh) 衣橱管理方法及移动终端
US11964209B2 (en) Machine learning based gaming platform messaging risk management using gamer behavior
CN107807940B (zh) 信息推荐方法和装置
CN113730906A (zh) 虚拟对局的控制方法、装置、设备、介质及计算机产品
WO2020219300A1 (en) Game controller with touchpad input
KR20200107091A (ko) 그룹간 경쟁을 이용한 증강현실 기반 보물 찾기를 제공하기 위한 서비스 제공 장치와 그 시스템 및 방법, 그리고 컴퓨터 프로그램이 기록된 비휘발성 기록매체
WO2014169191A2 (en) Mobile rewarder with mapping and tagging
JP6688353B2 (ja) ネットワークシステム、サーバコンピュータ及び制御プログラム
CN112669057A (zh) 一种数据预测方法、装置、电子设备及存储介质
CN113614767A (zh) 广告投放系统、信息处理设备和信息处理方法
JP7322307B1 (ja) ゲーム制御方法、プログラム、およびサーバ

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19920390

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021506853

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19920390

Country of ref document: EP

Kind code of ref document: A1