WO2021131739A1 - 情報処理システム、および情報処理方法、並びにプログラム - Google Patents

情報処理システム、および情報処理方法、並びにプログラム Download PDF

Info

Publication number
WO2021131739A1
WO2021131739A1 PCT/JP2020/046000 JP2020046000W WO2021131739A1 WO 2021131739 A1 WO2021131739 A1 WO 2021131739A1 JP 2020046000 W JP2020046000 W JP 2020046000W WO 2021131739 A1 WO2021131739 A1 WO 2021131739A1
Authority
WO
WIPO (PCT)
Prior art keywords
task
processing
information
unit
processing unit
Prior art date
Application number
PCT/JP2020/046000
Other languages
English (en)
French (fr)
Inventor
大樹 守谷
渓太郎 町田
至 清水
河本 献太
卓 青木
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Priority to JP2021567206A priority Critical patent/JPWO2021131739A1/ja
Priority to US17/777,206 priority patent/US20220391246A1/en
Priority to CN202080088143.6A priority patent/CN114830087A/zh
Publication of WO2021131739A1 publication Critical patent/WO2021131739A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Definitions

  • This disclosure relates to an information processing system, an information processing method, and a program, and more particularly to an information processing system, an information processing method, and a program that enable creative and highly flexible task processing to be realized.
  • Patent Document 2 a technique has been proposed in which both a diagnosis name that gives an inference result based on user information and a diagnosis name that gives a negative result about the inference result are presented.
  • Patent Documents 1 and 2 provide hints for considering creative and highly flexible task processing, but do not realize specific processing.
  • This disclosure was made in view of such a situation, and in particular, it realizes creative and highly flexible task processing.
  • the information processing system and program of one aspect of the present disclosure include a first information having a higher relevance to a recognized task than a predetermined standard, and a second information having a lower relevance to the task than a predetermined standard.
  • An information processing system and a program including a task processing unit that processes the task based on the information.
  • the information processing method of one aspect of the present disclosure is based on the first information having a higher relevance to the recognized task than the predetermined standard and the second information having a lower relevance to the task than the predetermined standard. It is an information processing method including a step of processing the task.
  • the said is based on first information that is more relevant to the recognized task than the predetermined criteria and second information that is less relevant to the task than the predetermined criteria.
  • the task is processed.
  • the present disclosure proposes a creative and highly flexible task process as a process for solving a task, and makes it possible to realize it.
  • "creative" means, for example, solving a problem by using information having a remote degree of relevance to a task (information having a low relevance to a task).
  • the information processing device 11 of FIG. 1 is, for example, a personal computer or the like, and constitutes a part of a system for processing various tasks, processes various tasks, and outputs various tasks as a result of the processing. Resolve the task.
  • the task may be, for example, object gripping (picking) of a robot.
  • the information processing device 11 is a robot having a manipulator that grips an object, such as gripping parts at a factory or assisting a user at home. Realize a system that controls the manipulator.
  • the task may be, for example, a route search (path planning).
  • the information processing device 11 realizes a system that presents a route from a set start point to a goal point.
  • the route search is used for route instruction to a moving body such as an automobile or for making an action plan for the moving body itself.
  • the task may be, for example, a recipe generation for cooking, etc.
  • the information processing device 11 realizes a system for generating and outputting a cooking recipe.
  • a recipe is, for example, a procedure for processing and editing a combination of ingredients and ingredients, and may be a work procedure or a research procedure in addition to cooking.
  • the task may be, for example, automatic generation of a conversation in a system that communicates with a user.
  • the information processing device 11 may, for example, perform system operation by conversation by a financial institution or the like, or provide service guidance at a store. , Realize a system for chatting at nursing care facilities and at home.
  • the task may be to support the user's decision making, in which case the information processing apparatus 11 generates and presents a candidate action option, recommends the priority to the option to the user, and navigates about the action. And realize a system that supports business behavior.
  • the tasks may be diverse and are not limited to the above-mentioned types of tasks.
  • the information processing device 11 of FIG. 1 is composed of a control unit 31, an input unit 32, an output unit 33, a storage unit 34, a communication unit 35, a drive 36, and a removable storage medium 37, and each other via a bus 38. It is connected and can send and receive data and programs.
  • the control unit 31 is composed of a processor and a memory, and controls the entire operation of the information processing device 11.
  • control unit 31 includes a task processing unit 51.
  • the task processing unit 51 recognizes a task to be processed based on the information input via the input unit 32, and realizes a process for solving the recognized task (hereinafter, also referred to as a task process). , The processing result is output from the output unit 33.
  • the input unit 32 includes an input device such as a keyboard for inputting operation commands by the user and a microphone for inputting by voice, and various sensors such as a camera, a distance measuring sensor, a temperature sensor, a humidity sensor, an illuminance sensor, and a biological sensor. , Various input or detected signals are supplied to the control unit 31.
  • an input device such as a keyboard for inputting operation commands by the user and a microphone for inputting by voice
  • various sensors such as a camera, a distance measuring sensor, a temperature sensor, a humidity sensor, an illuminance sensor, and a biological sensor.
  • the sensor constituting the input unit 32 is not limited to the above-mentioned sensor, and any sensor may be used as long as it detects information required for the task.
  • the output unit 33 is composed of an audio output unit composed of a speaker or the like and an image display unit composed of an LCD (Liquid Crystal Display), an organic EL (Organic Electro-Luminescence), or the like, and outputs various task processing results.
  • LCD Liquid Crystal Display
  • organic EL Organic Electro-Luminescence
  • the configuration of the output unit 33 may be any configuration necessary for realizing the task, and is not limited to the audio output unit and the image display unit.
  • control signal for operating the hardware is output and the task processing is realized by operating the hardware. ..
  • connection with the hardware may be wired or wireless, so if necessary, an interface capable of wired connection is connected to the output unit 33, and a control signal is supplied to the hardware via the interface.
  • the control signal may cause the hardware to perform an operation to realize the processing of the task.
  • control signal is supplied to the hardware by wired communication or wireless communication via the communication unit 35 described later, so that the hardware realizes the processing of the task by the control signal. You may want to perform the operation of.
  • the storage unit 34 is composed of an HDD (Hard Disk Drive), SSD (Solid State Drive), semiconductor memory, etc., and is controlled by the control unit 31 to write or read various data and programs.
  • HDD Hard Disk Drive
  • SSD Solid State Drive
  • semiconductor memory etc.
  • the storage unit 34 may be configured as a server on the network capable of communicating via the communication unit 35 described later.
  • the communication unit 35 is controlled by the control unit 31, and is connected to and from various devices via a communication network typified by a LAN (Local Area Network) or the like by wire (or wirelessly (not shown)). Send and receive data and programs.
  • a communication network typified by a LAN (Local Area Network) or the like by wire (or wirelessly (not shown)). Send and receive data and programs.
  • the drive 36 includes a magnetic disk (including a flexible disk), an optical disk (including a CD-ROM (Compact Disc-Read Only Memory), a DVD (Digital Versatile Disc)), an optical magnetic disk (including an MD (Mini Disc)), Alternatively, data is read / written to / from a removable storage medium 37 such as a semiconductor memory.
  • a magnetic disk including a flexible disk
  • an optical disk including a CD-ROM (Compact Disc-Read Only Memory), a DVD (Digital Versatile Disc)
  • an optical magnetic disk including an MD (Mini Disc)
  • data is read / written to / from a removable storage medium 37 such as a semiconductor memory.
  • the technique of the present disclosure includes, for example, a plurality of personal computers having the functions of the control unit 31, the input unit 32, the output unit 33, the storage unit 34, the drive 36, and the removable storage medium 37 included in the information processing device 11.
  • a server may be configured on a network, or may be configured by cloud computing so that it can be realized by an information processing system having a configuration capable of communicating with each other.
  • the task processing unit 51 is composed of a task input unit 71, a task processing module 72, a processing result evaluation module 73, an output unit 74, a bias value setting unit 75, an input data processing unit 76, and a storage module 77.
  • the task input unit 71 receives the input result and the detection result of the input unit 32 and grasps the content of the task to be solved.
  • the task input unit 71 performs input from a sensor, interpretation processing of input information, environment recognition processing, and the like as necessary, recognizes a predetermined task, and grasps the content thereof.
  • "recognizing" and “understanding” a predetermined task is defined as a state that can be handled by the system by applying it to a data format, pattern, or model handled by the system based on an input or detected signal. Means to retain task information.
  • the task input unit 71 outputs information related to the grasped task contents to the task processing module 72 and the processing result evaluation module 73.
  • the task input unit 71 converts the voice input result from the user into text, performs semantic analysis, and recognizes and recognizes it as "user's question content”. Grasp the generation of conversation according to the "user's question content” as the task content.
  • the task input unit 71 takes into account the user model, the user's behavior history, and environmental information as necessary, and depending on the context including information such as the user's position, time, and surrounding conditions, for example, " The user's question content may be recognized.
  • the task input unit 71 three-dimensionally recognizes the external shape of the object based on the information of the camera, the ultrasonic sensor, etc. Recognize as "three-dimensional information of the object" and grasp the grasp of the recognized object as the content of the task.
  • the task input unit 71 may estimate the position of the center of gravity, the hardness of the object surface, and the like, if necessary.
  • the task input unit 71 may acquire information such as the position of the movement destination and grasp it as the content of the task together with the grasping and the movement.
  • the task processing module 72 requests and acquires the input data required for task processing from the input data processing unit 76, and applies the acquired input data to a specific processing pattern or processing model. , The task supplied from the task input unit 71 is processed, and the processing result is output to the processing result evaluation module 73.
  • the task processing module 72 generates suitable answer candidates as the processing result for the task "user's question content", and the processing result. Output to the evaluation module 73.
  • the task processing module 72 processes candidates for manipulator control information such as an object gripping position by a manipulator constituting an output unit 33, torque, and a manipulator approach to gripping. It is generated as a result and output to the processing result evaluation module 73.
  • the manipulator In the case of a task related to object grasping, the manipulator is considered to be the hardware required to realize the task processing.
  • the input data processing unit 76 sets the information stored in the storage module 77, which belongs to the first data group 91, and the information belonging to the second data group 92, according to the bias value supplied from the bias value setting unit 75. Is extracted and supplied to the task processing module 72.
  • the information belonging to the first data group 91 is information related to the grasped task, information having a higher relevance to the grasped task than a predetermined value, or the grasped task. This is information whose relationship is higher than that of the second data group 92.
  • the information belonging to the first data group 91 is a group of terms related to the grasped task or a conversation sequence model.
  • the content of the conversation is an operator of a financial institution. If it is a conversation related to an agent, it is information such as a standard conversation sequence model related to the service contents of financial institutions and financial institutions and conversations of operators.
  • the information belonging to the first data group 91 includes three-dimensional model information, surface information, center of gravity information, and environment of the gripping object that frequently occur in situations applied when the object is gripped.
  • Information such as bias values optimized for the situation in recognition.
  • the information belonging to the second data group 92 includes information not related to the grasped task, information having a lower relevance to the grasped task than a predetermined value, or the grasped task.
  • the information has a low relationship with respect to the first data group 91.
  • the information belonging to the second data group 92 is a word group not related to the task or a conversation sequence model.
  • the processing content of the task is an operator agent of a financial institution.
  • Information such as words not related to finance, chat topics, standard conversation sequence models in the medical field, and atypical conversation sequence models.
  • the information belonging to the second data group 92 is information used in a situation different from the situation applied in realizing the object grasping, or information irrelevant to the object grasping.
  • information such as object gripping related information of a car body transport robot, a food shape model and a hardness model, and running information of a mobile robot.
  • the processing result evaluation module 73 evaluates whether or not the candidate output information generated as a processing result by the task processing module 72 is information that appropriately solves the input task as an evaluation value, and the evaluation result is predetermined. When the processing result is higher than the threshold value and the processing result can be considered to solve the task appropriately, the processing result is output to the output unit 74.
  • the processing result evaluation module 73 outputs the evaluation value to the bias value setting unit 75.
  • the processing result evaluation module 73 evaluates by obtaining the evaluation value of the processing result of the task based on, for example, the achievement prediction of the task, the reward amount prediction in the reinforcement learning model, and the like.
  • the processing result evaluation module 73 evaluates whether or not an appropriate reward amount can be obtained for the candidate answer, which is the candidate output result, in light of the user model and the question content. To do.
  • the processing result evaluation module 73 calculates and evaluates the success probability of object gripping based on the control as a candidate for gripping the object which is the candidate output result as an evaluation value. ..
  • the bias value setting unit 75 sets the bias value based on the evaluation value which is the evaluation result supplied from the processing result evaluation module 73.
  • the input data processing unit 76 includes information belonging to the first data group 91 and information belonging to the second data group 92, which are stored in the storage module 77 and are necessary for processing the grasped task. Is selectively extracted and supplied to the task processing module 72.
  • the input data processing unit 76 defaults to the task because the bias value is not supplied from the bias value setting unit 75 at the first time.
  • the information belonging to the first data group 91 which is related to or highly related to the task is extracted and supplied to the task processing module 72.
  • the input data processing unit 76 is associated with the task according to the bias value from the bias value setting unit 75 when the information is required for the task processing from the second time onward. Or, not only the information belonging to the first data group 91 having a high relevance to the task but also the information belonging to the second data group 92 not related to the task or having a low relevance to the task is extracted. It is supplied to the task processing module 72.
  • the bias value is, for example, information that specifies the ratio of the information belonging to the first data group 91 and the information belonging to the second data group 92 supplied to the task processing module 72 to be mixed and extracted. (Mixing ratio).
  • the bias value setting unit 75 gradually reduces the ratio of information belonging to the first data group 91 being extracted when the evaluation value continues to be lower than a predetermined threshold value, and belongs to the second data group 92.
  • the bias value may be set so as to increase the rate at which information is extracted.
  • the task processing module 72 initially performs task processing based on the information related to the task, but if the evaluation value for the processing result is low and the state in which appropriate processing is not realized continues, the task is related to the task. Processing will be performed based on the missing information.
  • the bias value setting unit 75 sets the bias value so that when the evaluation value continues to be lower than the predetermined threshold value, the information belonging to the first data group 91 is extracted until the predetermined number of times is exceeded. After the predetermined number of times is exceeded, the bias value may be set so as to extract the information belonging to the second data group 92.
  • information that is related to the task or information that is highly related to the task is performed by processing based on the information that is not related to the task or the information that is not related to the task.
  • Tasks that cannot be solved by processing based on the above can be solved by creative and highly flexible processing.
  • the storage module 77 includes model information to be applied (example: fixed conversation information, object grasping pattern information) and element information constituting output information (example: conversation topic, movement route) as information required for task processing. , Information generated in real time based on sensor information and environmental information, a learning model applied under each situation, and a learned model are stored as the first data group 91 and the second data group 92. ..
  • the output unit 74 has a configuration corresponding to the output unit 33 (FIG. 1), and outputs a processing result higher than a predetermined evaluation value evaluated as an appropriate processing result for solving the task in the processing result evaluation module 73. To do.
  • the processing result output by the output unit 74 is performed by an appropriate method according to the applied situation, such as voice output, text output, information presentation, manipulator control, device control, movement / change of the system itself, etc. Is.
  • the processing result is an answer corresponding to the "user's question content", text or voice, or presentation of appropriate information (for example, a map for a question related to directions).
  • Information presentation for example, a map for a question related to directions.
  • the processing result is the output of manipulator control information for actually gripping the object or the manipulator control itself.
  • the feedback based on the processing result may be recognized based on the sensor or new input information and fed back to the task processing module 72 and the processing result evaluation module 73.
  • the task processing module 72 and the processing result evaluation module 73 execute processing and evaluate the processing result in response to feedback.
  • the feedback is, for example, an estimation of whether the user has achieved the purpose based on the user's reaction (facial expression or emotion) based on user sensing, the evaluation input information by the user, and the user's behavior. The result etc.
  • the feedback is, for example, the result of whether or not the object can be gripped without any problem, the number of trials until the gripping is successful, and the stress information actually applied to the object.
  • step S11 the task input unit 71 receives various data related to the input result input by the input unit 32 or the detected detection result.
  • step S12 the task input unit 71 grasps the content of the task to be solved based on the input result of the input unit 32 and the data related to the detection result, and supplies the grasped task information to the task processing module 72. ..
  • step S13 the task processing module 72 requests the input data processing unit 76 for the data required for the task processing based on the grasped task information supplied from the task input unit 71. To do.
  • step S14 the input data processing unit 76 reads the data related to the processing of the grasped task from the storage module 77 and supplies it to the task processing module 72 in response to the request from the task processing module 72.
  • the input data processing unit 76 accesses the storage module 77, and is composed of information related to the grasped task or information highly related to the task supplied from the task processing module 72. Information belonging to the first data group 91 is extracted and supplied to the task processing module 72.
  • step S15 the task processing module 72 processes the task based on the information belonging to the first data group 91 supplied from the input data processing unit 76, and outputs the processing result to the processing result evaluation module 73.
  • step S16 the processing result evaluation module 73 calculates an evaluation value for evaluating whether or not the processing result appropriately solves the task, and evaluates the processing result.
  • step S17 the processing result evaluation module 73 determines whether or not the evaluation value for the processing result of the task processing module 72 is higher than a predetermined threshold value and the processing result appropriately solves the task.
  • step S17 If the evaluation value is lower than the predetermined threshold value in step S17 and the processing result is deemed not to properly solve the task, the processing proceeds to step S18.
  • step S18 the processing result evaluation module 73 outputs an evaluation value lower than the calculated predetermined threshold value to the bias value setting unit 75.
  • the bias value setting unit 75 sets the first data group 91 and the second data group 91 and the second based on the evaluation value which is the evaluation for the processing result of the task processing module 72 and the number of times when the evaluation value is considered to be lower than the predetermined threshold value.
  • a bias value indicating the mixing ratio (ratio) of the data extracted as information belonging to each of the data groups 92 is set and output to the input data processing unit 76.
  • step S19 the input data processing unit 76 accesses the storage module 77, and the data belonging to the first data group 91 and the second data group 92 are required to process the task at a mixing ratio based on the bias value. It is extracted as data and supplied to the task processing module 72, and the processing returns to step S15.
  • steps S15 to S19 is repeated until the evaluation value for the processing result of the task processing module 72 is higher than the predetermined threshold value and the processing result is considered to appropriately solve the task.
  • step S17 when the evaluation value is higher than the predetermined threshold value and the processing result is considered to appropriately solve the task, the processing proceeds to step S20.
  • step S20 the processing result evaluation module 73 outputs a processing result whose evaluation value is higher than a predetermined threshold value and which is considered to appropriately solve the task to the output unit 74.
  • the output unit 74 (output unit 33) outputs a processing result whose evaluation value is higher than a predetermined threshold value and which is considered to appropriately solve the task.
  • step S21 the task input unit 71 determines whether or not there is no data input for a new task and the end of the process is instructed, and if the end of the process is not instructed, the process returns to step S11.
  • steps S11 to S21 are repeated until the end of the process is instructed.
  • step S21 when it is considered that the end instruction has been given, the process ends.
  • the task processing module 72 first receives the information required for processing from the first data group 91, which is the information related to the task or the information highly related to the task. Handle the task.
  • the bias value setting unit 75 performs the task processing.
  • the data required for the task processing realized in the module 72 in addition to the data of the first data group 91 which is the data related to the task, the data of the second data group 92 which is the data not related to the task is set in a predetermined ratio. To set a bias value to be supplied to the task processing module 72, and supply the data to the input data processing unit 76.
  • the input data processing unit 76 adds the data of the first data group 91, which is (highly relevant) data related to the task, as the data required for the task processing realized in the task processing module 72, in addition to the data of the first data group 91.
  • the data of the second data group 92 which is data not related to the task (less relevant), is supplied to the task processing module 72.
  • the task processing module 72 includes data belonging to the (highly relevant) first data group 91 related to the task, and in addition to the data belonging to the second data group 92 not related to the task (less relevant). Since the task is processed using the data, the processing is different from the processing using the data related to the task.
  • the solution method of the task that cannot be solved is the method of solving the task not related to the task (less relevance) of the second data group 92. It will be possible to explore and realize creative and highly flexible processing using data.
  • the bias value setting unit 75 includes the data of the first data group 91, which is (highly relevant) data related to the task, and the data related to the task, as the data required for the task processing realized in the task processing module 72.
  • the data of the second data group 92 which is non-relevant (less relevant) data, each time the state in which the evaluation value is lower than the predetermined threshold is repeated, the data of the second data group is gradually added.
  • a bias value that is supplied to the task processing module 72 may be set so as to increase the mixing ratio, and the bias value may be supplied to the input data processing unit 76.
  • the data used for the task processing gradually becomes the first according to the number of times when the state where the evaluation value is lower than the predetermined threshold value is repeated.
  • the data belonging to the data group 91 may be switched to the data belonging to the second data group.
  • the data used for the task processing can be switched from the data belonging to the first data group 91 to the data belonging to the second data group. You may do it.
  • the task processing gradually changes to the processing using data unrelated to the task. Therefore, the processing of the task changes to a creative and flexible processing.
  • the processing of the task changes to a creative and flexible processing.
  • the data required to process a task can be changed from highly relevant to less relevant, and the task can be transformed into creative and flexible processing. It will be possible.
  • the initially assumed evaluation function and the input evaluation function (the first evaluation function). It is possible to search for a more suitable solution by setting a new evaluation function (data belonging to the second data group 92) based on a wider range of information and models as well as data belonging to one data group 91). It will be possible.
  • the task of searching the own route by the mobile robot including the autonomous traveling vehicle
  • the task of grasping the object which is not initially expected the initially assumed situation (first data).
  • data sources and models data belonging to the second data group 92
  • the processing result evaluation module 73 may evaluate the candidate output result based on this criterion.
  • cooking is an example and is effective for all processing tasks that create by combining elements and methods. For example, you may search for novel writing, automatic generation of video scenes, and so on.
  • conversation generation usually, based on the initially assumed usage situation and target user (data belonging to the first data group 91), the terms, speech methods, and conversation generation logic that compose the conversation are used. Conversations are generated, but users often speak unexpectedly, change situations, and are required to respond to conversations more flexibly, and in such unexpected situations and cases, we do not anticipate. More flexible conversation generation can be realized by referring to the term group, the example of speech method, and the conversation generation model (data belonging to the second data group 92).
  • tasks related to navigation systems tasks related to own route search by mobile robots (including autonomous vehicles), tasks related to grasping objects that are not initially expected, tasks related to cooking recipe generation, tasks related to conversation generation, etc.
  • Conservative solutions data belonging to the first data group 91
  • more ambitious solutions data belonging to the second data group 92
  • tasks including general tasks not limited to the series of tasks described above. It is possible to set more types of options such as.
  • conservative and “ambitious” indicate the degree of risk for the user and the ease of selection calculated based on the past selection tendency of the user. More specifically, the conservative solution is, for example, a solution having a relatively low risk to the user or a solution that is easily selected by the user. An ambitious solution is, for example, a solution that has a relatively high risk to the user, or a solution that may be selected by the user but is difficult to select.
  • the conditions may be too strict and the tasks that can be handled are too limited, but the event is broader than initially assumed.
  • by relaxing the conditions step by step by using the data belonging to the second data group 92 step by step), more flexible response becomes possible.
  • the processing result evaluation module 73 describes an example in which the evaluation value is higher than a predetermined threshold value and one processing result deemed to appropriately solve the task is output to the output unit 74.
  • a plurality of processing results having different evaluation values may be output together with the evaluation values and presented to the user so that the user can select them.
  • the search by normal trial (search by the data belonging to the first data group 91) drops to the nearest local solution (no further solution can be searched).
  • the local solution is temporarily suspended, and a wider range of searches (searches using data belonging to the second data group 92) is performed to reach a more optimal solution. It becomes possible to do.
  • the setting of the evaluation function is important because the learning is performed according to the evaluation function (reward).
  • the evaluation function is usually set in advance (by human design), but automation of the evaluation function (reward amount) setting is required.
  • the data required for task processing is classified into three or more types based on the relevance to the task, and the number of times the evaluation value of the processing result of the task processing module 72 is considered to be lower than a predetermined threshold value. Depending on the situation, data that is gradually less relevant may be used for processing the task.
  • the data required for task processing is classified into the first data group 111 to the nth data group as shown in FIG.
  • the first data group 111 is the data group most closely related to the task
  • the second data group 112 is the data group most closely related to the task next to the first data group 111.
  • the third data group 113 is the data group having a high relevance to the task next to the second data group 112, and thereafter, similarly, up to the nth data group n according to the high relevance to the task.
  • the nth data group n has the lowest relevance to the task.
  • the second data group 112 is also After that, the data up to the nth data group n are sequentially used for the processing of the task until the evaluation value becomes higher than the predetermined threshold value.
  • the data used for processing the task can be used in order from the one with the highest task relevance, so that the task that cannot be solved only by the data group related to the task can be appropriately solved. It becomes possible to do.
  • the configuration different from the task processing unit 51 of FIG. 2 is that the bias value setting unit 101, the input, instead of the bias value setting unit 75, the input data processing unit 76, and the storage module 77.
  • the data processing unit 102 and the storage module 103 are provided.
  • the bias value setting unit 101 has the same basic functions as the bias value setting unit 75, but further, the data group supplied to the task processing module 72 has an evaluation value lower than a predetermined threshold value and performs a task.
  • the bias value is set so as to increase the number of data groups that are not related to the task according to the number of times that it is determined that the problem cannot be solved appropriately.
  • the input data processing unit 102 extracts data based on the bias value supplied from the bias value setting unit 101 from the first data group 111 to the nth data group stored in the storage module 103, and the task processing module 102. Supply to 72.
  • the storage module 103 stores the first data group 111 and the nth data group n described with reference to FIG. 4 in place of the first data group 91 and the second data group 92 in the storage module 77.
  • the first data group 111 is the data group most related to the task, the second data group 112, the third data group 113, ...
  • the nth data group n is a group of data that is highly relevant to the task in the order of.
  • step S31 the bias value setting unit 101 initializes the counter m for identifying the data group stored in the storage module 103 to 1.
  • steps S32 to S38 the first data group 111 is used, the task is processed by the task processing module 72, the processing result is supplied to the processing result evaluation module 73, and the evaluation value is calculated.
  • step S38 if the evaluation value is lower than the predetermined threshold value, the process proceeds to step S39.
  • step S39 the bias value setting unit 101 increments the counter m by 1.
  • step S40 the bias value setting unit 101 sets the bias value so that the data of the data group corresponding to the counter m is supplied to the processing of the task processing module 72, and outputs the bias value to the input data processing unit 102.
  • step S41 the input data processing unit 102 accesses the storage module 103, and based on the bias value, in the first data group to the nth data group n, for example, the first data group to the mth data group m.
  • Data required for task processing is extracted from the belonging data and supplied to the task processing module 72, and the processing returns to step S36.
  • steps S36 to S41 is repeated until the processing result of the task processing module 72 is regarded as the processing result for appropriately solving the task and the evaluation value for the processing result becomes higher than the predetermined threshold value. Then, according to the number of repetitions, the processing of the task using the data of the data group having a gradually lower relevance to the task from the first data group to the nth data group n is repeated. ..
  • step S41 when the evaluation value is higher than the predetermined threshold value and the processing result is considered to appropriately solve the task, the processing proceeds to step S42.
  • step S42 the output unit 74 outputs a processing result whose evaluation value is higher than a predetermined threshold value and which is considered to appropriately solve the task.
  • the task processing module 72 first receives the data required for processing from the first data group 91, which is the data related to the task, and processes the task.
  • the bias value setting unit 75 is realized in the task processing module 72.
  • data required for task processing data of a data group that is not related to the task (less related to the task) is gradually included and supplied to the task processing module 72.
  • the task processing module 72 is gradually processed using the data of the data group not related to the task until the processing result is considered to solve the task appropriately. As a result, it becomes possible to realize creative and highly flexible processing.
  • the task will be gradually processed using data unrelated to the task, so it is created step by step. It is possible to process a task while changing it to a process with a high degree of freedom.
  • the task is processed by being used so as to gradually include data unrelated to the task.
  • the state in which the evaluation value is lower than the predetermined threshold value is repeated, only the less relevant data may be extracted stepwise and used for the task processing.
  • the input data processing unit 76 or 102 accesses the storage module 77 or 103, and the data belonging to the first data group 91 and the second data group 92, or the first data group 111 and the nth data group n.
  • An example has been described in which the data belonging to is mixed according to the bias value and supplied to the task processing module 72.
  • the main storage module is set, the data belonging to the first data group is stored by default, the task processing module reads the data stored in the main storage module and processes the task, and the processing result appropriately handles the task.
  • the data belonging to the second data group may be increased in the main storage module according to the bias value.
  • FIG. 7 provides a main storage module that stores data belonging to the first data group by default, and gradually increases and stores the data belonging to the second data group according to the bias value, and the task processing module stores the main storage.
  • a configuration example of the task processing unit 51 that processes the task based on the data stored in the module is shown.
  • the task processing unit 51 of FIG. 7 includes a task input unit 171, a task processing module 172, a processing result evaluation module 173, an output unit 174, a bias value setting unit 175, an input data processing unit 176, a main storage module 177, and a first sub storage. It includes a module 178 and a second sub-storage module 179.
  • the task input unit 171 and the task processing module 172, the processing result evaluation module 173, and the output unit 174 are configured with the task input unit 71, the task processing module 72, the processing result evaluation module 73, and the output unit 74 in FIG. Since the same is true, the description thereof will be omitted as appropriate.
  • the task processing module 172 is the same as the task processing module 72 in the basic function, but the task processing module 72 requests and acquires the data necessary for processing from the input data processing unit 76. While the task processing module 172 processes the task, the task processing module 172 differs from the task processing module 72 in that the task is processed based on the data stored in the main storage module 177.
  • the configurations of the main storage module 177, the first sub-storage module 178, and the second sub-storage module 179 are basically the same as those of the storage module 77, and may be configured in the storage unit 34 or separately. It may be configured as a storage unit of, or may be configured by an external server via a network.
  • first sub-storage module 178 stores the first data group 191 corresponding to the first data group 91
  • second sub-storage module 179 stores the second data corresponding to the second data group 92.
  • Group 192 is remembered.
  • the bias value setting unit 175 reads out the data belonging to the second data group 192 stored in the second sub storage module 179 by the input data processing unit 176 based on the evaluation value supplied from the processing result evaluation module 173. Set a bias value that specifies the amount of data to be stored in the main storage module.
  • the bias value setting unit 175 sets the bias value so that, for example, as the number of times the evaluation value is lower than the predetermined threshold value increases, the amount of data extracted belonging to the second data group 192 increases.
  • the input data processing unit 176 extracts the data of the second data group stored in the second sub storage module 179 based on the bias value supplied from the bias value setting unit 175, and stores it in the main storage module 177. Let me.
  • the main storage module 177 initially belongs to the first data group 191 stored in the first sub storage module 178 by default, and is related to the task (highly related to the task). ) Data is extracted and stored, used for task processing in the task processing module 172, and the processing result is output.
  • the bias value set by the bias value setting unit 175 is used as the basis for the bias value.
  • the input data processing unit 176 extracts data not related to the task belonging to the second data group 192 from the second sub storage module 179 and stores it in the main storage module 177.
  • the data belonging to the second data group 192 is stored in the main storage module 177, and is used by the task processing module 172 for task processing.
  • the main storage module 177 is gradually set. The amount of data that is stored and is not related to the task (less related to the task) and belongs to the second data group 192 increases.
  • the data not related to the task is gradually stored in the main storage module 177 and is not related to the task (highly related to the task). ) It changes to task processing by data.
  • step S51 the task input unit 171 receives various data related to the input result input by the input unit 32 or the detected detection result.
  • step S52 the task input unit 171 grasps the content of the task to be solved based on the input result of the input unit 32 and the data related to the detection result, and supplies the grasped task information to the task processing module 172. ..
  • step S53 the task processing module 72 supplies the grasped task information supplied from the task input unit 71 to the main storage module 177.
  • the main storage module 177 accesses the first sub storage module 178, extracts and stores data related to the task belonging to the first data group 191.
  • step S54 the task processing module 72 processes the task based on the data stored in the main storage module 177, and outputs the processing result to the processing result evaluation module 173.
  • step S55 the processing result evaluation module 173 calculates an evaluation value for evaluating whether or not the processing result appropriately solves the task, and evaluates the processing result.
  • step S56 the processing result evaluation module 173 determines whether or not the evaluation value for the processing result of the task processing module 172 is higher than a predetermined threshold value and the processing result appropriately solves the task.
  • step S56 if the evaluation value is lower than the predetermined threshold value and the processing result is deemed not to properly solve the task, the processing proceeds to step S57.
  • step S57 the processing result evaluation module 173 outputs an evaluation value lower than the calculated predetermined threshold value to the bias value setting unit 175. Then, the bias value setting unit 175 indicates the extraction amount of the data belonging to the second data group 192 stored in the second sub storage module 179 based on the evaluation value which is the evaluation for the processing result of the task processing module 172. The bias value is set and output to the input data processing unit 176.
  • step S58 the input data processing unit 176 accesses the second sub-storage module 179, and based on the bias value, the data that is not related to the task (less related to the task) than the second data group 192. Is extracted, supplied to the main storage module 177 for storage, and the process returns to step S54.
  • steps S54 to S58 is repeated until the processing result of the task processing module 172 has an evaluation value for the processing result higher than a predetermined threshold value and the processing result is considered to appropriately solve the task. Then, the processing of the task is repeated in a state where the amount of data of the second data group 192 stored in the main storage module 177 is gradually increased.
  • step S56 when the evaluation value is higher than the predetermined threshold value and the processing result is considered to appropriately solve the task, the processing proceeds to step S59.
  • step S59 the processing result evaluation module 173 outputs a processing result whose evaluation value is higher than a predetermined threshold value and which is considered to appropriately solve the task to the output unit 174.
  • the output unit 174 outputs a processing result whose evaluation value is higher than a predetermined threshold value and which is considered to appropriately solve the task.
  • step S60 the task input unit 171 determines whether or not the end of the process is instructed because there is no data input for a new task, and if the end of the process is not instructed, the process returns to step S51.
  • steps S51 to S60 are repeated until the end of the process is instructed.
  • step S60 when it is considered that the end instruction has been given, the process ends.
  • the task processing module 172 is the data of only the first data group 191 which is the data related to the task (highly related to the task) stored in the main storage module 177. To process the task.
  • the bias value setting unit 175 stores it in the second sub storage module 179.
  • a bias value is set so that the data of the second data group 192, which is the data not related to the task (less related to the task), is supplied to the main storage module 177, and is supplied to the input data processing unit 176. To do.
  • the input data processing unit 176 uses the data of the second data group 192, which is not related to the task (less related to the task), as the data required for the task processing realized in the task processing module 72. It is supplied to the main storage module 177 and stored.
  • the task processing module 72 is not related to the task (with the task) in addition to the data belonging to the first data group 191 related to the task (highly related to the task) stored by default.
  • the data belonging to the second data group 192 (which is less relevant) will be used.
  • the evaluation value of the processing result continues to be lower than the predetermined threshold value, the data belonging to the second data group 192 that is not related to the task increases as the data stored in the main storage module 177, so that the task Processing different from the processing using the data related to is performed, and as a result, it becomes possible to realize creative and highly flexible processing.
  • the main storage module 177 is set, the data belonging to the first data group 191 related to the task is stored by default, and the task processing module 172 performs the task based on the data stored in the main storage module 177.
  • the data belonging to the second data group 192 not related to the task is increased in the main storage module 177 to create the data.
  • the first task processing module that realizes data processing based on the specific processing pattern and processing model, and the processing pattern and processing used for the specific task processing in the first task processing module.
  • a second task processing module that realizes the process of switching the model may be provided so that the second task processing module switches the processing pattern and the processing model according to the bias value.
  • FIG. 9 shows a first task processing module that realizes data processing based on a specific processing pattern and a processing model in the task processing module, and a processing pattern used for specific task processing in the first task processing module.
  • the task processing unit 51 of FIG. 9 includes a task input unit 371, a task processing module 372, a processing result evaluation module 373, an output unit 374, a bias value setting unit 375, and a storage module 376.
  • the processing result evaluation module 373 Since the task input unit 371, the processing result evaluation module 373, and the output unit 374 have the same configurations as the task input unit 71, the processing result evaluation module 73, and the output unit 74 in FIG. 2, the description thereof will be omitted as appropriate. To do.
  • the storage module 376 has basically the same configuration as the storage module 77, and stores a processing pattern and a processing model for processing a task.
  • the storage module 376 may be configured in the storage unit 34, or may be configured by an external server via a network.
  • the processing pattern and processing model are, for example, a function used for specific task processing executed by the first task processing module 381, various parameters, and the like.
  • the processing pattern and processing model also include a learning model of machine learning, a trained model, a database describing the gradient of the feature amount, and a network structure of the machine learning algorithm.
  • the storage module 376 stores various levels of processing patterns and models related to tasks, from processing patterns and processing models that are highly relevant to tasks to processing patterns and processing models that are less relevant to tasks. ing.
  • the task processing module 372 basically processes the task recognized by the task input unit 371 and outputs the processing result to the processing result evaluation module 373, similarly to the task processing module 72.
  • the task processing module 372 includes a first task processing module 381 and a second task processing module 382, and realizes the following task processing.
  • the first task processing module 381 realizes specific task processing based on the processing pattern and processing model set by the second task processing module 382, and outputs the processing result to the processing result evaluation module 373.
  • the second task processing module 382 extracts the processing patterns and processing models related to the task (highly related to the task) from the storage module 376 by default, and supplies them to the first task processing module 381.
  • the second task processing module 382 is set by the bias value setting unit 375 when the evaluation value for the processing result of the first task processing module is lower than a predetermined threshold value and it is considered that the task cannot be solved appropriately. Based on the bias value, a processing pattern or processing model that is not related to the task (less related to the task) is extracted from the storage module 376 and supplied to the first task processing module 381.
  • the bias value setting unit 375 sets the bias value and the task processing module 372. It is supplied to the second task processing module 382 of the above.
  • the bias value setting unit 375 extracts the processing pattern and processing model related to the task from the storage module 376 when the bias value is set to 0 to 1 and the default value is set to 0, for example. Set the bias value to 0.
  • the bias value is gradually changed to a value close to 1.
  • the second task processing module 382 reads out a processing pattern or processing model that is less relevant to the task from the storage module 376 as it approaches 1 based on the bias value, and the first task processing module 381. Supply to.
  • the second task processing module 382 is related to the task among the processing patterns and processing models used for processing the task stored in the storage module 376. (Highly related to the task) is supplied to the first task processing module 381.
  • the first task processing module 381 processes the task according to the processing pattern and processing model that are highly related to the task.
  • the bias value setting unit 375 gradually sets the bias value to a value close to 1.
  • the second task processing module 382 gradually extracts processing patterns and processing models that are less relevant to the task and supplies them to the first task processing module 381.
  • the task processing is gradually changed so as to be performed based on the processing pattern and the processing model having low relevance to the task.
  • the processing is changed so that the processing pattern and processing model not related to the task increase for the task that cannot be solved, so that the task is creative and has a high degree of freedom. It is possible to search for task processing and solve it by processing.
  • step S81 the task input unit 371 receives various data related to the input result input by the input unit 32 or the detected detection result.
  • step S82 the task input unit 371 grasps the content of the task to be solved based on the input result of the input unit 32 and the data related to the detection result, and supplies the grasped task information to the task processing module 372. ..
  • step S83 the task processing module 372 acquires the grasped task information supplied from the task input unit 371.
  • the second task processing module 382 extracts the processing pattern and processing model related to the task in the state where the default bias value is 0 from the storage module 376, and processes the first task. Supply to module 381.
  • step S84 the first task processing module 381 processes the task based on the processing pattern and the processing model supplied from the second task processing module 382, and outputs the processing result to the processing result evaluation module 373.
  • step S85 the processing result evaluation module 373 calculates an evaluation value for evaluating whether or not the processing result appropriately solves the task, and evaluates the processing result.
  • step S86 the processing result evaluation module 173 determines whether or not the evaluation value for the processing result of the first task processing module 381 is higher than a predetermined threshold value and the processing result appropriately solves the task.
  • step S86 If the evaluation value is lower than the predetermined threshold value in step S86 and the processing result is deemed not to properly solve the task, the processing proceeds to step S87.
  • step S87 the processing result evaluation module 373 outputs an evaluation value lower than the calculated predetermined threshold value to the bias value setting unit 375.
  • the bias value setting unit 375 is based on the evaluation value which is an evaluation for the processing result of the first task processing module 381 and the number of times when the evaluation value is considered to be lower than a predetermined threshold value, and the second task processing module 382 A bias value indicating the relevance of the processing pattern and processing model extracted from the storage module 376 to the task is set and output to the task processing module 372.
  • step S88 the second task processing module 382 of the task processing module 372 accesses the storage module 376, extracts a processing pattern or processing model having a relationship with the task based on the bias value, and extracts the processing pattern or processing model related to the task, and the first task processing module. Supply to 381, the process returns to step S84.
  • steps S84 to S88 is performed until the processing result of the first task processing module 381 is regarded as the processing result for appropriately solving the task and the evaluation value for the processing result becomes higher than the predetermined threshold value. Is repeated, and the processing is repeated while gradually changing to the processing of the task using the processing pattern or processing model stored in the storage module 376 that is less relevant to the task.
  • step S86 when the evaluation value is higher than the predetermined threshold value and the processing result is considered to appropriately solve the task, the processing proceeds to step S89.
  • step S89 the processing result evaluation module 373 outputs the processing result whose evaluation value is higher than the predetermined threshold value and which is considered to appropriately solve the task to the output unit 374.
  • the output unit 374 outputs a processing result whose evaluation value is higher than a predetermined threshold value and which is considered to appropriately solve the task.
  • step S90 the task input unit 371 determines whether or not there is no data input for a new task and the end of the process is instructed, and if the end of the process is not instructed, the process returns to step S81.
  • steps S81 to S90 are repeated until the end of the process is instructed.
  • step S90 when it is considered that the end instruction has been given, the process ends.
  • the first task processing module 381 of the task processing module 372 is stored in the storage module 376 by the second task processing module 382 in the first processing, and is stored in the storage module 376 by the processing pattern and the processing model related to the task. Handle the task.
  • the bias value setting unit 375 determines the second task processing module 382.
  • the processing patterns and processing models stored in the storage module 376 the processing patterns and processes that are less relevant to the task are based on the number of times that the evaluation value or the evaluation value is considered to be lower than a predetermined threshold value.
  • the model is extracted from the storage module 177, a bias value is set so as to be supplied to the first task processing module 381, and the model is supplied to the task processing module 372.
  • the second task processing module 382 extracts from the storage module 376 a processing pattern or processing model having a relationship with the task according to the bias value as a processing pattern or processing model required for task processing, and is second. It is supplied to the 1-task processing module 381.
  • the first task processing module 381 processes the task by using a processing pattern or processing model having a relationship with the task based on the bias value.
  • the storage module 376 changes to a processing pattern or processing model that is less relevant to the task as the stored processing pattern or processing model. Therefore, the processing changes to a processing different from the processing using the processing pattern or processing model related to the task, and as a result, it becomes possible to realize a creative and highly flexible processing. ..
  • the process when setting the bias value, the process has a low relevance to the task depending on the conditions related to the task process. You may let the pattern or processing model be selected, or change its weighting.
  • the conditions related to task processing include, for example, the risk of task processing.
  • the risk of task processing when a task has a low risk of failure, it is possible to actively select a processing pattern or processing model that is less relevant to the task, so that task processing with a higher degree of creativity and freedom is achieved. It becomes possible to realize the search for.
  • tasks with a low risk of failure include, for example, tasks with a low trial limit, tasks that are less likely to destroy the target or make the user uncomfortable compared to other situations, communication with the user, and the like.
  • a solution including the possibility of destroying the target or making the user uncomfortable is presented, and when the risk is high, such a possibility is likely to be avoided. Only the solution can be presented.
  • Example of execution by software By the way, the series of processes described above can be executed by hardware, but can also be executed by software.
  • the programs that make up the software can execute various functions by installing a computer embedded in dedicated hardware or various programs. It is installed from a recording medium on a possible, eg, general purpose computer.
  • FIG. 11 shows a configuration example of a general-purpose computer.
  • This personal computer has a built-in CPU (Central Processing Unit) 1001.
  • the input / output interface 1005 is connected to the CPU 1001 via the bus 1004.
  • a ROM (Read Only Memory) 1002 and a RAM (Random Access Memory) 1003 are connected to the bus 1004.
  • the input / output interface 1005 includes an input unit 1006 including an input device such as a keyboard and a mouse for the user to input operation commands, an output unit 1007 for outputting a processing operation screen and an image of the processing result to a display device, a program, and various data.
  • a storage unit 1008 consisting of a hard disk drive or the like for storing, a LAN (Local Area Network) adapter or the like, and a communication unit 1009 for executing communication processing via a network represented by the Internet are connected.
  • magnetic disks including flexible disks
  • optical disks including CD-ROM (Compact Disc-Read Only Memory), DVD (Digital Versatile Disc)
  • optical magnetic disks including MD (Mini Disc)
  • a drive 1010 that reads and writes data to and from a removable storage medium 1011 such as a memory is connected.
  • the CPU 1001 is read from a program stored in the ROM 1002 or a removable storage medium 1011 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, installed in the storage unit 1008, and loaded from the storage unit 1008 into the RAM 1003. Various processes are executed according to the program.
  • the RAM 1003 also appropriately stores data and the like necessary for the CPU 1001 to execute various processes.
  • the CPU 1001 loads the program stored in the storage unit 1008 into the RAM 1003 via the input / output interface 1005 and the bus 1004 and executes the above-described series. Is processed.
  • the program executed by the computer (CPU1001) can be recorded and provided on the removable storage medium 1011 as a package medium or the like, for example.
  • the program can also be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • the program can be installed in the storage unit 1008 via the input / output interface 1005 by mounting the removable storage medium 1011 in the drive 1010. Further, the program can be received by the communication unit 1009 via a wired or wireless transmission medium and installed in the storage unit 1008. In addition, the program can be pre-installed in the ROM 1002 or the storage unit 1008.
  • the program executed by the computer may be a program that is processed in chronological order according to the order described in this specification, or may be a program that is processed in parallel or at a necessary timing such as when a call is made. It may be a program in which processing is performed.
  • the system means a set of a plurality of components (devices, modules (parts), etc.), and it does not matter whether all the components are in the same housing. Therefore, a plurality of devices housed in separate housings and connected via a network, and a device in which a plurality of modules are housed in one housing are both systems. ..
  • the present disclosure can have a cloud computing configuration in which one function is shared by a plurality of devices via a network and jointly processed.
  • each step described in the above flowchart can be executed by one device or shared by a plurality of devices.
  • one step includes a plurality of processes
  • the plurality of processes included in the one step can be executed by one device or shared by a plurality of devices.
  • Information processing system described in. ⁇ 3> Further includes an input data processing unit that supplies at least one of the first information and the second information to the task processing unit. When the evaluation of the processing result based on the first information by the task processing unit is lower than a predetermined threshold value, the input data processing unit supplies the second information to the task processing unit ⁇ 2>.
  • the information processing system described. ⁇ 4> The input data processing unit mixes the first information and the second information at a predetermined mixing ratio and supplies the information to the task processing unit. When the evaluation of the processing result based on the first information and the second information mixed at the predetermined mixing ratio by the task processing unit is lower than the predetermined threshold value, the input data processing unit is said to be said.
  • the information processing system according to ⁇ 3> wherein the first information and the second information are mixed and supplied to the task processing unit at a new mixing ratio in which the mixing ratio of the second information is increased.
  • a bias value indicating a mixing ratio of the first information and the second information to be supplied to the task processing unit is set, and a bias to be supplied to the input data processing unit is set.
  • Including the value setting part The information processing system according to ⁇ 4>, wherein the input data processing unit mixes the first information and the second information at a mixing ratio based on the bias value and supplies the second information to the task processing unit.
  • the bias value setting unit sets the bias value so that the mixing ratio of the second information becomes high when the evaluation of the processing result by the task processing unit is considered to be lower than a predetermined threshold value.
  • the second information is composed of a plurality of hierarchical information having a plurality of hierarchical structures according to the high degree of relevance to the task.
  • the bias value setting unit includes the hierarchical information having low relevance to the task when the evaluation of the processing result based on the first information by the task processing unit is considered to be lower than a predetermined threshold value.
  • the task processing unit further includes a main information storage unit that stores main information used when processing the task.
  • the main information storage unit stores the first information as the main information, When the evaluation of the processing result based on the first information by the task processing unit is lower than the predetermined threshold value, the second information is added to the already stored first information, and a new main element is added.
  • the information processing system according to ⁇ 2> which stores information in the main information storage unit.
  • a bias value setting unit for setting a bias value indicating the amount of information of the second information to be stored in the main information storage unit based on the evaluation of the processing result is further included.
  • the bias value setting unit increases the amount of information of the second information stored in the main information storage unit.
  • the task processing unit determines a processing pattern or processing model having a higher relevance to the task as the first information than a predetermined standard, and a relevance to the task as the second information.
  • the information processing system according to ⁇ 1> which processes the task based on a processing pattern or processing model lower than the reference.
  • the task processing unit processes the task based on a processing pattern or processing model whose relevance to the task as the first information related to the task is higher than a predetermined standard, and the processing result is obtained.
  • the information processing system according to ⁇ 11> which further processes the task based on a processing pattern or processing model whose relevance to the task as second information is lower than a predetermined criterion based on the evaluation.
  • the task processing unit is A supply processing unit that supplies at least one of the plurality of processing patterns or processing models having different relevance. It has a task pattern model processing unit that processes the task based on the processing pattern or processing model supplied by the supply processing unit.
  • the task pattern model processing unit processes the task based on a processing pattern or processing model whose relevance to the task as the first information is higher than a predetermined reference.
  • the supply processing unit is the second.
  • the information processing system according to ⁇ 12> which supplies a processing pattern or processing model whose relevance to the task as information is lower than a predetermined standard.
  • ⁇ 14> When the evaluation of the processing pattern based on the processing pattern or the processing model whose relevance to the task as the second information by the task pattern model processing unit is lower than the predetermined reference is lower than the predetermined threshold value, the above.
  • the supply processing unit supplies the task pattern model processing unit with a new processing pattern or processing model whose relevance to the task as the second information is lower than the other predetermined value, which is further lower than the predetermined reference.
  • a bias value indicating a high degree of relevance to the task corresponding to the processing pattern or processing model to be supplied is set, and a bias value setting unit to be supplied to the supply processing unit.
  • the bias value setting unit supplies a processing pattern or processing model having a high degree of relevance to the task when the evaluation of the processing result by the task pattern model processing unit is considered to be lower than a predetermined threshold value.
  • ⁇ 17> The information processing system according to any one of ⁇ 1> to ⁇ 16>, further comprising an output unit that outputs the processing result of the task processing unit.
  • the output unit outputs a processing result for which the evaluation of the processing result is deemed to be higher than the threshold value.
  • Information processing methods including. ⁇ 20> A task that processes the task based on the first information having a higher relevance to the recognized task than the predetermined criterion and the second information having a lower relevance to the task than the predetermined criterion.

Abstract

本開示は、タスクの処理を、創造的で、自由度の高い処理により実現することができるようにする情報処理システム、および情報処理方法、並びにプログラムに関する。 タスクに関連する情報に基づいて、タスクを処理し、処理結果の評価に基づいて、タスクとの関連性の低い情報に基づいて、さらにタスクを処理する。タスク処理装置に適用することができる。

Description

情報処理システム、および情報処理方法、並びにプログラム
 本開示は、情報処理システム、および情報処理方法、並びにプログラムに関し、特に、創造的で自由度の高いタスク処理を実現できるようにした情報処理システム、および情報処理方法、並びにプログラムに関する。
 機械学習を用いてタスクの処理を提示する技術が普及しつつある。
 このタスクの処理を提示する技術として、画一的な一般的な処理の提示だけでなく、創造的で自由度の高い処理の提示が求められている。
 そこで、例えば、タスクの処理について、成功事例と失敗事例とをデータベース化して、成功事例と失敗事例との両者を比較し、差分となる情報を提示する技術が提案されている(特許文献1参照)。
 また、診断に係るタスク処理として、ユーザの情報に基づいた推論結果となる診断名と、推論結果について否定的な結果となる診断名との両者を提示する技術が提案されている(特許文献2参照)。
 いずれにおいても、創造的で自由度の高いタスク処理を考える上でのヒントとして利用することができる。
特開平9-6619号公報 特開2013-165780号公報
 しかしながら、特許文献1,2のいずれにおいても、創造的で自由度の高いタスク処理を考える上でのヒントにはなるが、具体的な処理を実現するものではない。
 本開示は、このような状況に鑑みてなされたものであり、特に、創造的で自由度の高いタスク処理を実現するものである。
 本開示の一側面の情報処理システム、およびプログラムは、認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理するタスク処理部を備える情報処理システム、およびプログラムである。
 本開示の一側面の情報処理方法は、認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理するステップを含む情報処理方法である。
 本開示の一側面においては、認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクが処理される。
本開示の情報処理装置のハードウェアの構成例を説明する図である。 図1のタスク処理部の第1の実施の形態の構成例を説明する図である。 図2のタスク処理部によるタスク処理を説明するフローチャートである。 第1の実施の形態の変形例を説明する図である。 図1のタスク処理部の第1の実施の形態の変形例における構成例を説明する図である。 図5のタスク処理部によるタスク処理を説明するフローチャートである。 図1のタスク処理部の第2の実施の形態の構成例を説明する図である。 図7のタスク処理部によるタスク処理を説明するフローチャートである。 図1のタスク処理部の第3の実施の形態の構成例を説明する図である。 図9のタスク処理部によるタスク処理を説明するフローチャートである。 汎用のパーソナルコンピュータの構成例を説明する図である。
 以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
 以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
 1.第1の実施の形態
 2.第1の実施の形態の変形例
 3.第2の実施の形態
 4.第3の実施の形態
 5.ソフトウェアにより実行させる例
 <<1.第1の実施の形態>>
 <本開示の情報処理装置の構成例>
 本開示は、タスクを解決する処理として、創造的で自由度の高いタスク処理を提案すると共に、実現できるようにするものである。ここで「創造的である」とは、例えば、タスクとの関連度が遠隔する情報(タスクとの関連性の低い情報)を用いて問題解決を行うことを意味する。
 まず、図1のブロック図を参照して、本開示の情報処理装置のハードウェアの構成例について説明する。
 図1の情報処理装置11は、例えば、パーソナルコンピュータなどであり、各種のタスクを処理するためのシステムの一部を構成し、各種のタスクを処理し、処理結果として出力することで、各種のタスクを解決する。
 タスクは、例えば、ロボットの物体把持(ピッキング)であってもよく、この場合、情報処理装置11は、工場での部品把持や、家庭におけるユーザ支援など、物体把持を行うマニュピレータを持つロボット、またはマニュピレータを制御するシステムを実現する。
 また、タスクは、例えば、経路探索(パスプランニング)であってもよく、この場合、情報処理装置11は、設定されたスタート地点からゴール地点までの経路の提示を行うシステムを実現する。経路探索は、例えば自動車などの移動体への経路指示や、移動体自身の行動計画立案に用いられる。
 さらに、タスクは、例えば、料理などのレシピ生成であってもよく、この場合、情報処理装置11は、料理レシピを生成して出力するシステムを実現する。レシピは例えば、材料や素材を組み合わせて加工、編集するための手順であり、料理のほかに、工作手順や研究手順であってもよい。
 また、タスクは、例えば、ユーザとのコミュニケーションを行うシステムにおける会話の自動生成であってもよく、この場合、情報処理装置11は、例えば、金融機関等による会話によるシステムオペレーション、店舗でのサービス案内、介護施設や家庭における雑談を行うシステムを実現する。
 さらに、タスクは、ユーザの意思決定の支援であってもよく、この場合、情報処理装置11は、候補行動オプションの生成と提示や、オプションに対する優先度のユーザへの推薦を行い、行動に関するナビゲーションや業務上の行動支援を行うシステムを実現する。
 このようにタスクは、多岐に渡るものであってよく、上述した種類のタスクに限らない。
 図1の情報処理装置11は、制御部31、入力部32、出力部33、記憶部34、通信部35、ドライブ36、およびリムーバブル記憶媒体37より構成されており、相互にバス38を介して接続されており、データやプログラムを送受信することができる。
 制御部31は、プロセッサやメモリから構成されており、情報処理装置11の動作の全体を制御する。
 また、制御部31は、タスク処理部51を備えている。
 タスク処理部51は、入力部32を介して入力される情報に基づいて、処理する必要のあるタスクを認識し、認識したタスクを解決させるための処理(以下、タスク処理とも称する)を実現し、処理結果を出力部33より出力する。
 尚、タスク処理部51の詳細な構成については、図2を参照して後述する。
 入力部32は、ユーザが操作コマンドを入力するキーボードや音声により入力するマイクロフォンなどの入力デバイス、および、カメラ、測距センサ、温度センサ、湿度センサ、照度センサ、生体センサ等の各種センサより構成され、入力または検出された各種の信号を制御部31に供給する。
 尚、入力部32を構成するセンサについては、上述のセンサに限らず、タスクに必要とされる情報を検出するセンサであれば、どのようなセンサでもよい。
 出力部33は、スピーカ等からなる音声出力部、LCD(Liquid Crystal Display)や有機EL(Organic Electro-Luminescence)等からなる画像表示部より構成され、各種のタスク処理結果を出力する。
 尚、出力部33の構成については、タスクを実現させるために必要な構成であればよく、音声出力部や画像表示部に限らない。
 また、タスクの処理を実現する上で必要なハードウェアが別途存在する場合については、そのハードウェアを動作させるための制御信号を出力して、ハードウェアを動作させることによりタスクの処理を実現させる。
 この際、ハードウェアとの接続については、有線、または無線を問わないので、必要に応じて、出力部33に有線接続が可能なインタフェースを接続し、インタフェースを介してハードウェアに制御信号が供給されるようにして、制御信号によりハードウェアがタスクの処理を実現させるための動作を実行するようにしてもよい。
 また、出力部33に代えて、後述する通信部35を介して、有線通信または無線通信によりハードウェアに制御信号が供給されるようにして、制御信号によりハードウェアがタスクの処理を実現させるための動作を実行するようにしてもよい。
 記憶部34は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、または、半導体メモリなどからなり、制御部31により制御され、各種のデータおよびプログラムを書き込む、または、読み出す。
 尚、記憶部34は、必要に応じて、後述する通信部35を介して通信可能なネットワーク上のサーバに構成するようにしてもよい。
 通信部35は、制御部31により制御され、有線(または無線(図示せず))により、LAN(Local Area Network)などに代表される通信ネットワークを介して、各種の装置との間で各種のデータやプログラムを送受信する。
 ドライブ36は、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどのリムーバブル記憶媒体37に対してデータを読み書きする。
 尚、本明細書においては、本開示の技術が、情報処理装置11により実現される例について説明するものとするが、複数の装置により構成されるシステムにより実現されるようにしてもよい。
 すなわち、本開示の技術は、例えば、情報処理装置11が備える制御部31、入力部32、出力部33、記憶部34、ドライブ36、およびリムーバブル記憶媒体37の各機能を備えた複数のパーソナルコンピュータやサーバがネットワーク上で構成されるようにしてもよいし、クラウドコンピューティングにより構成されることにより、相互に通信可能な構成からなる情報処理システムにより実現されるようにしてもよい。
 <タスク処理部の第1の構成例>
 次に、図2の機能ブロック図を参照して、制御部31により実現されるタスク処理部51の機能における第1の構成例について説明する。
 タスク処理部51は、タスク入力部71、タスク処理モジュール72、処理結果評価モジュール73、出力部74、バイアス値設定部75、入力データ処理部76、および記憶モジュール77より構成される。
 タスク入力部71は、入力部32の入力結果や検出結果を受け付けて、解決しようとするタスクの内容を把握する。タスク入力部71は、必要に応じて、センサからの入力や、入力情報の解釈処理や環境認識処理等を行い、所定のタスクを認識し、その内容を把握する。ここで、所定のタスクを「認識する」、および「把握する」とは、入力または検出された信号に基づき、システムが扱うデータ形式やパターン、モデルに当てはめることにより、システムが扱える状態として所定のタスクの情報を保持することを意味する。
 また、タスク入力部71は、把握したタスクの内容に係る情報をタスク処理モジュール72および処理結果評価モジュール73に出力する。
 より具体的には、例えば、会話認識に係るタスクである場合、タスク入力部71は、ユーザからの音声入力結果をテキスト化し、意味解析を行い、「ユーザの質問内容」として認識し、認識した「ユーザの質問内容」に応じた会話の生成をタスクの内容として把握する。
 この際、タスク入力部71は、必要に応じて、ユーザモデルやユーザの行動履歴、環境情報も加味して、例えば、ユーザの位置、時刻、および周辺状況などの情報を含むコンテクストに応じて「ユーザの質問内容」を認識するようにしてもよい。
 また、例えば、物体把持に係るタスクである場合、タスク入力部71は、入力部32を構成するカメラや超音波センサ等の情報に基づき、物体の外観形状を三次元的に認識し、「把持対象の三次元情報」として認識し、認識した物体の把持をタスクの内容として把握する。
 この際、タスク入力部71は、必要に応じて、重心位置や、物体表面の硬度等を推定してもよい。
 物体を把持した上で、さらに物体の移動が求められるときには、タスク入力部71は、移動先位置等の情報を取得し、把持と移動と併せてタスクの内容として把握するようにしてもよい。
 タスク処理モジュール72は、入力データ処理部76に対してタスクの処理に必要とされる入力データを要求して取得し、取得した入力データを、具体的な処理パターンや処理モデルに適用することで、タスク入力部71より供給されるタスクを処理し、処理結果を処理結果評価モジュール73に出力する。
 より具体的には、例えば、会話認識に係るタスクである場合、タスク処理モジュール72は、タスクである「ユーザの質問内容」に対して、適した回答候補を、処理結果として生成し、処理結果評価モジュール73に出力する。
 また、物体把持に係るタスクである場合、タスク処理モジュール72は、例えば、出力部33を構成するマニュピレータによる物体把持位置や、トルク、把持までのマニュピレータのアプローチ等の、マニュピレータ制御情報の候補を処理結果として生成し、処理結果評価モジュール73に出力する。
 尚、物体把持に係るタスクである場合については、マニュピレータが、タスクの処理を実現させる上で必要とされるハードウェアとされる。
 入力データ処理部76は、記憶モジュール77に記憶されている、第1データ群91に属する情報と、第2データ群92に属する情報とを、バイアス値設定部75より供給されるバイアス値に応じて抽出し、タスク処理モジュール72に供給する。
 ここで、第1データ群91に属する情報とは、把握されているタスクに関連する情報や、把握されているタスクとの関連性が所定値よりも高い情報、あるいは、把握されているタスクとの関係性が第2データ群92に相対して高い情報である。
 例えば、会話認識に係るタスクである場合、第1データ群91に属する情報は、把握されているタスクに関連する用語群や、会話シーケンスモデルであり、例えば、会話の内容が、金融機関のオペレータエージェントに係る会話であれば、金融関連や金融機関のサービス内容やオペレータの会話に関する定型的会話シーケンスモデル等の情報である。
 また、物体把持に係るタスクである場合、第1データ群91に属する情報は、物体把持を実現する際に適応される状況に頻出する把持対象の三次元モデル情報、表面情報、重心情報、環境認識において状況に最適化されたバイアス値等の情報である。
 さらに、第2データ群92に属する情報とは、把握されているタスクに関連しない情報や、把握されているタスクとの関連性が所定値よりも低い情報、あるいは、把握されているタスクとの関係性が第1データ群91に相対して低い情報である。
 例えば、会話認識に係るタスクである場合、第2データ群92に属する情報は、タスクに関連しない用語群や、会話シーケンスモデルであり、例えば、タスクの処理内容が金融機関のオペレータエージェントであれば、金融に関連しない語や、雑談話題、医療分野の定型的会話シーケンスモデルや、非定型の会話シーケンスモデル等の情報である。
 また、物体把持のタスクである場合、第2データ群92に属する情報は、物体把持を実現する上で適用される状況とは異なる状況において用いられる情報や、物体把持とは無関係な情報であり、例えば、電子部品製造工場内においてなされるタスクであるときには、車体運搬ロボットの物体把持関連情報や、食品の形状モデルや硬度モデル、移動ロボットの走行情報等の情報である。
 処理結果評価モジュール73は、タスク処理モジュール72により処理結果として生成される候補出力情報が、入力されたタスクを適切に解決する情報であるか否かを評価値として評価し、評価結果が所定の閾値よりも高く、処理結果がタスクを適切に解決するとみなせるときには、処理結果を出力部74に出力する。
 また、評価結果が所定の閾値よりも低く、処理結果がタスクを適切に解決できないとみなせるときには、処理結果評価モジュール73は、評価値をバイアス値設定部75に出力する。
 より詳細には、処理結果評価モジュール73は、例えば、タスクの達成予測や、強化学習モデルにおける報酬量予測などに基づいて、タスクの処理結果の評価値を求めることにより評価する。
 より具体的には、会話認識に係るタスクである場合、処理結果評価モジュール73は、候補出力結果である候補回答について、ユーザモデルと質問内容に照らして、適切な報酬量が得られるかを評価する。
 また、物体把持に係るタスクである場合、処理結果評価モジュール73は、候補出力結果となる物体を把持するための候補となる制御に基づいた物体把持の成功確率を評価値として算定し、評価する。
 バイアス値設定部75は、処理結果評価モジュール73より供給される評価結果である評価値に基づいて、バイアス値を設定する。
 入力データ処理部76は、バイアス値に基づいて、記憶モジュール77に記憶されている把握されているタスクの処理に必要な第1データ群91に属する情報と、第2データ群92に属する情報とを選択的に抽出して、タスク処理モジュール72に供給する。
 タスク処理モジュール72からタスクの処理に必要な情報が要求された場合、初回である時には、バイアス値設定部75からのバイアス値の供給を受けないため、入力データ処理部76は、デフォルトで、タスクと関連する、または、タスクとの関連性の高い第1データ群91に属する情報を抽出して、タスク処理モジュール72に供給する。
 また、タスク処理モジュール72からタスクの処理に必要な情報が要求された場合、2回目以降である時には、入力データ処理部76は、バイアス値設定部75からのバイアス値に応じて、タスクと関連する、または、タスクとの関連性が高い第1データ群91に属する情報のみならず、タスクと関連しない、または、タスクとの関連性が低い第2データ群92に属する情報を抽出して、タスク処理モジュール72に供給する。
 バイアス値は、例えば、タスク処理モジュール72に供給される、第1データ群91に属する情報と、第2データ群92に属する情報とをどのような割合で混合して抽出するのかを指定する情報(混合比)である。
 例えば、バイアス値設定部75は、評価値が所定の閾値よりも低い状態が継続すると徐々に、第1データ群91に属する情報が抽出される割合を低減させて、第2データ群92に属する情報が抽出される割合が増大させるようにバイアス値を設定するようにしてもよい。
 この結果、タスク処理モジュール72は、当初はタスクに関連する情報に基づいてタスク処理がなされるが、処理結果に対する評価値が低く、適切な処理が実現されない状態が継続すると、タスクとは関係のない情報に基づいた処理がなされることになる。
 また、バイアス値設定部75は、評価値が所定の閾値よりも低い状態が継続すると、所定回数を超えるまでは、第1データ群91に属する情報が抽出されるようなバイアス値を設定するが、所定回数を超えた以降は、第2データ群92に属する情報を抽出させるようにバイアス値を設定するようにしてもよい。
 いずれにおいても、タスクとの関連がない情報、または、タスクとの関連性が低い情報に基づいた処理がなされることにより、タスクとの関連がある情報、または、タスクとの関連性が高い情報に基づいた処理では解決することができないタスクを、創造的で自由度の高い処理により解決させることが可能となる。
 記憶モジュール77は、タスク処理に必要となる情報として、適応すべきモデル情報(例:会話の定型情報、物体把持パターン情報)、出力情報を構成する要素情報(例:会話の話題、移動ルート)、センサ情報や環境情報に基づいて、リアルタイム生成される情報や、各状況下において適用される学習モデルや、学習済みモデルを、第1データ群91、および第2データ群92として記憶している。
 出力部74は、出力部33(図1)に対応する構成であり、処理結果評価モジュール73において、タスクを解決する適切な処理結果として評価された、所定の評価値よりも高い処理結果を出力する。
 出力部74により出力される処理結果は、適用される状況に応じ、適切な方法で行われるものであり、音声出力、テキスト出力、情報提示、マニュピレータ制御、機器制御、システム自身の移動・変更等である。
 より具体的には、例えば、会話認識に係るタスクである場合、処理結果は、「ユーザの質問内容」に応える回答を、テキストや音声、または適切な情報の提示(例えば道案内に関する質問に対する地図情報の提示)である。
 また、物体把持に係るタスクである場合、処理結果は、実際に物体を把持させるためのマニュピレータ制御情報の出力や、マニュピレータ制御そのものである。
 尚、処理結果を出力した後、処理結果に基づくフィードバックをセンサや新たな入力情報に基づき認識し、タスク処理モジュール72や処理結果評価モジュール73に対してフィードバックするようにしてもよく、この場合、タスク処理モジュール72や処理結果評価モジュール73は、フィードバックに応じた処理の実行や処理結果の評価を行う。
 さらに、会話認識に係るタスクである場合、フィードバックは、例えば、ユーザセンシングに基づくユーザの反応(表情や感情)、ユーザによる評価入力情報、ユーザの行動に基づいた、ユーザが目的を達成できたかの推定結果等である。
 また、物体把持に係るタスクである場合、フィードバックは、例えば、物体を問題なく把持できたか否かの結果、把持成功までの試行回数、および物体に実際にかかった応力情報等である。
 <図2のタスク処理部によるタスク処理>
 次に、図3のフローチャートを参照して、図2のタスク処理部51によるタスク処理について説明する。
 ステップS11において、タスク入力部71は、入力部32により入力される入力結果、または検出される検出結果に係る各種のデータを受け付ける。
 ステップS12において、タスク入力部71は、入力部32の入力結果や検出結果に係るデータに基づいて、解決しようとするタスクの内容を把握し、把握したタスクの情報をタスク処理モジュール72に供給する。
 ステップS13において、タスク処理モジュール72は、タスク入力部71より供給された、把握されているタスクの情報に基づいて、入力データ処理部76に対して、タスクの処理に必要とされるデータを要求する。
 ステップS14において、入力データ処理部76は、タスク処理モジュール72からの要求に応じて、把握されているタスクの処理に係るデータを記憶モジュール77より読み出してタスク処理モジュール72に供給する。
 より詳細には、入力データ処理部76は、記憶モジュール77にアクセスし、タスク処理モジュール72より供給された、把握されているタスクと関連する情報、または、タスクとの関連性の高い情報からなる第1データ群91に属する情報を抽出し、タスク処理モジュール72に供給する。
 ステップS15において、タスク処理モジュール72は、入力データ処理部76より供給される第1データ群91に属する情報に基づいて、タスクを処理し、処理結果を処理結果評価モジュール73に出力する。
 ステップS16において、処理結果評価モジュール73は、処理結果がタスクを適切に解決するものであるか否かを評価する評価値を算出し、処理結果を評価する。
 ステップS17において、処理結果評価モジュール73は、タスク処理モジュール72の処理結果に対する評価値が所定の閾値よりも高く、処理結果がタスクを適切に解決するものであるか否かを判定する。
 ステップS17において、評価値が所定の閾値よりも低く、処理結果がタスクを適切に解決するものではないとみなされた場合、処理は、ステップS18に進む。
 ステップS18において、処理結果評価モジュール73は、算出した所定の閾値よりも低い評価値をバイアス値設定部75に出力する。そして、バイアス値設定部75は、タスク処理モジュール72の処理結果に対する評価である評価値や、評価値が所定の閾値よりも低いとみなされた回数に基づいて、第1データ群91および第2データ群92のそれぞれに属する情報として抽出されるデータの混合比(割合)を示すバイアス値を設定し、入力データ処理部76に出力する。
 ステップS19において、入力データ処理部76は、記憶モジュール77にアクセスし、第1データ群91、および第2データ群92に属するデータを、バイアス値に基づいた混合比で、タスクの処理に必要なデータとして抽出し、タスク処理モジュール72に供給し、処理は、ステップS15に戻る。
 すなわち、タスク処理モジュール72の処理結果に対する評価値が、所定の閾値よりも高く、処理結果がタスクを適切に解決するものであるとみなされるまで、ステップS15乃至S19の処理が繰り返される。
 そして、ステップS17において、評価値が所定の閾値よりも高く、処理結果が、タスクを適切に解決するものであるとみなされると、処理は、ステップS20に進む。
 ステップS20において、処理結果評価モジュール73は、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた処理結果を出力部74に出力する。
 出力部74(出力部33)は、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた処理結果を出力する。
 ステップS21において、タスク入力部71は、新たなタスクのデータ入力がなく、処理の終了が指示されたか否かを判定し、処理の終了が指示されない場合、処理は、ステップS11に戻る。
 すなわち、処理の終了が指示されるまで、ステップS11乃至S21の処理が繰り返される。
 そして、ステップS21において、終了の指示がなされたとみなされた場合、処理は、終了する。
 以上の処理により、タスク処理モジュール72は、最初にタスクに関連する情報、または、タスクとの関連性の高い情報である第1データ群91より処理に必要とされるデータの供給を受けて、タスクを処理する。
 ここで、タスク処理モジュール72の処理結果の評価値が所定の閾値よりも低く、処理結果がタスクを適切に解決するものではないとみなされた場合には、バイアス値設定部75が、タスク処理モジュール72において実現されるタスク処理において必要なデータとして、タスクに関連するデータである第1データ群91のデータに加えて、タスクに関連しないデータである第2データ群92のデータを所定の割合で混合して、タスク処理モジュール72に供給されるようなバイアス値を設定し、入力データ処理部76に供給する。
 これにより、入力データ処理部76は、タスク処理モジュール72において実現されるタスク処理において必要なデータとして、タスクに関連する(関連性の高い)データである第1データ群91のデータに加えて、タスクに関連しない(関連性の低い)データである第2データ群92のデータをタスク処理モジュール72に供給する。
 タスク処理モジュール72は、タスクを処理するにあたって、タスクに関連する(関連性の高い)第1データ群91に属するデータに加えて、タスクに関連しない(関連性の低い)第2データ群92のデータを用いてタスクを処理することになるため、タスクに関連するデータを利用した処理とは異なる処理がなされる。
 結果として、タスクに関連する(関連性の高い)第1データ群91に属するデータでは、解決することができないタスクの解決手法を、タスクに関連しない(関連性の低い)第2データ群92のデータを用いた、創造的で自由度の高い処理で模索し、実現することが可能となる。
 また、バイアス値設定部75が、タスク処理モジュール72において実現されるタスク処理において必要なデータとして、タスクと関連する(関連性の高い)データである第1データ群91のデータと、タスクと関連しない(関連性の低い)データである第2データ群92のデータとを混合するようにして、評価値が所定の閾値よりも低い状態が繰り返される度に、徐々に第2データ群のデータの混合比が増えるようにタスク処理モジュール72に供給されるようなバイアス値を設定し、入力データ処理部76に供給するようにしてもよい。
 また、評価値が所定の閾値よりも低い状態が繰り返されたときに、タスクの処理に用いるデータが、評価値が所定の閾値よりも低い状態が繰り返された回数に応じて、徐々に第1データ群91に属するデータから、第2データ群に属するデータに切り替えられるようにしてもよい。
 さらに、評価値が所定の閾値よりも低い状態が所定回数繰り返されたときに、タスクの処理に用いるデータが、第1データ群91に属するデータから、第2データ群に属するデータに切り替えられるようにしてもよい。
 いずれにおいても、このような処理により、評価値が所定の閾値よりも低い状態が継続され続けると、タスクの処理が、徐々にタスクと関連性のないデータを用いた処理に変化していくことになるので、タスクの処理が創造的で自由度の高い処理へと変化する。
 また、評価値が所定の閾値よりも低い状態が継続され続けると、タスクの処理に用いられるデータが、タスクと関連性のない(関連性の低い)データに切り替えられてタスクが処理されることになるので、タスクの処理が創造的で自由度の高い処理へと変化する。
 いずれのおいても、タスクの処理に必要とされるデータがタスクの関連性が高いものから低いものに変化することで、タスクの処理を創造的で自由度の高い処理へと変化させることが可能となる。
 結果として、タスクに関連するデータだけでは解決することができないタスクであっても、適切に解決する処理を模索し、実現することが可能となる。
 例えば、ナビゲーションシステムや、移動ロボット(自律走行車含む)による自身の経路探索等に係るタスクの場合、様々な評価関数が存在する中で、当初想定する評価関数や、入力された評価関数(第1データ群91に属するデータ)だけでなく、より広範の情報やモデルに基づいた新たな評価関数(第2データ群92に属するデータ)を設定することで、より好適な解を探索することが可能となる。
 また、当初想定しない対象物の把持に係るタスクの場合、本開示の技術を適用することで、より柔軟な把持を実現することが可能になる。
 すなわち、想定する対象物に関する情報(形状、重心位置、硬さ、壊れやすさ、好適な把持アプローチモデル、移動アプローチモデル)(第1データ群91に属するデータ)だけでなく、これ以外の情報・モデル(第2データ群92に属するデータ)をも参照し、試行方法を拡張してより柔軟に対応することが可能となるので、対象物が当初想定される範囲から逸脱していたとしても、把持を実現することが可能になる。
 また、上述した、ナビゲーションシステムや、移動ロボット(自律走行車含む)による自身の経路探索等に係るタスクや、当初想定しない対象物の把持に係るタスクの場合、当初想定される状況(第1データ群91に属するデータ)以外のデータソースやモデル(第2データ群92に属するデータ)をも参照することで、より広範な解の探索や、処理がスタックしたときの局所解からの脱出が可能となる。
 さらに、料理レシピの生成に係るタスクである場合、目標とする料理カテゴリや、料理において通常想定されるアプローチ(第1データ群91に属するデータ)以外のアプローチ(第2データ群92に属するデータ)をも参照し、より創造的なレシピの出力が可能となる。
 すなわち、中華料理のレシピ生成にあたり、日本料理のレシピを参照したり、料理の盛り付けにあたり、料理とは無関係のアート関連情報を取り入れることが可能となる。
 なお、より遠隔した情報が組み合わされればよいわけではなく、料理として成立することを評価する評価関数(味、見た目、人間の飲食において一定の基準を満たすか否か、等)を有するようにしてもよく、処理結果評価モジュール73は、この基準に基づき候補出力結果の評価を行うようにしてもよい。
 また、料理は例示であり、要素や方法を組み合わせて創作を行う処理タスク全般に有効であり、例えば、小説執筆、映像シーンの自動生成等を捜索するようにさせてもよい。
 さらに、会話生成に係るタスクである場合、通常、当初想定される使用状況、ターゲットユーザ(第1データ群91に属するデータ)に基づき、会話を構成する用語、話法、会話生成ロジックを用いて会話が生成されるが、ユーザが想定外の発話をすることや、状況の変化、さらにはより柔軟な会話対応が求められることも多くあり、このような想定外の状況と場合に、想定しない用語群、話法例、会話生成モデル(第2データ群92に属するデータ)をも参照することで、より柔軟な会話生成を実現することが可能となる。
 また、ナビゲーションシステムや、移動ロボット(自律走行車含む)による自身の経路探索等に係るタスク、当初想定しない対象物の把持に係るタスク、料理レシピ生成に係るタスク、および会話生成に係るタスク等の上述した一連のタスクに限らず、一般的なタスクを含むタスク全般において、保守的な解(第1データ群91に属するデータ)と、より野心的な解(第2データ群92に属するデータ)など、より多くの種類のオプションを設定することが可能となる。
 ここで、「保守的」、および「野心的」とは、ユーザにとってのリスクの度合いや、ユーザによる過去の選択傾向に基づいて算定される選ばれ易さを示すものである。より具体的には、保守的な解とは、例えば、ユーザにとってのリスクが相対的に低い解、または、ユーザに選ばれ易い解である。また、野心的な解とは、例えば、ユーザにとってのリスクが相対的に高い解、または、ユーザに選ばれることはあるが選ばれ難い解である。
 さらに、タスクが最適化問題として解釈される場合には、制約条件を段階的に緩和して試行することで、柔軟な問題解決を実現するようにしてもよい。
 すなわち、当初設定の制約条件(第1データ群91に属するデータ)では、条件が厳しすぎて、対応できるタスクが限定されすぎてしまう場合があるが、当初想定される条件よりも広範な事象に対しては、段階的に条件を緩和することで(第2データ群92に属するデータを段階的に用いることで)、より柔軟な対応が可能となる。
 また、以上においては、処理結果評価モジュール73は、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた1つの処理結果を出力部74に出力する例について説明してきたが、評価値が異なる複数の処理結果を評価値と共に出力し、ユーザに提示して、ユーザにより選択できるようにしてもよい。このような処理により、例えば、所定の閾値よりも高い複数の処理結果をユーザに提示することが可能となり、評価値に基づいたユーザの判断を含めた柔軟な対応を実現することが可能となる。
 さらに、タスクの解が複数存在する場合には、通常の試行による探索(第1データ群91に属するデータによる探索)では最も近いローカル解に落ち込んでしまう(それ以上の解の探索ができなくなる)ことがあるが、本開示の技術を適用することで、ローカル解をいったん保留し、さらに広い範囲の探索(第2データ群92に属するデータによる探索)を行うことで、より最適な解に到達することが可能となる。
 すなわち、例えば、ロボットのパスプランニングに係るタスクの場合、評価関数が複数ありうる状況下において(最短経路、ユーザにとって心地の良い経路、リスクの少ない経路、…)、当初想定する評価関数のみに基づく解の出力で探索を終了せず、想定しない評価関数をも適応することにより、当初想定しないがより最適な解を探索することが可能となる。
 また、強化学習においては、評価関数(報酬)に応じた学習が行われるところ、評価関数の設定が重要になる。評価関数について、事前に(人間の設計によって)設定されることが通常であるが、評価関数(報酬量)設定の自動化が求められている。
 本開示の技術を適用することにより、タスクに関連する評価関数(複数あってもよい)と、タスクに関連しない評価関数、または都度自動生成する評価関数とを、柔軟に使い分けることが可能となるので、より柔軟な問題解決が可能になる。
 <<2.第1の実施の形態の変形例>>
 以上においては、タスクに関連する(タスクとの関連性が高い)データ群からなる第1データ群と、タスクに関連しない(タスクとの関連性が低い)データ群からなる第2データ群との2種類のデータをバイアス値に基づいて、混合する(または切り替える)ことで、タスク処理モジュール72における処理を変化させる例について説明してきた。
 しかしながら、タスク処理に必要とされるデータを、タスクとの関連性に基づいて、3種類以上に分類し、タスク処理モジュール72の処理結果の評価値が所定の閾値よりも低いとみなされる回数に応じて、徐々に関連性の低いデータをタスクの処理に用いるようにしてもよい。
 すなわち、例えば、タスクの処理に必要とされるデータを、図4で示されるように、第1データ群111乃至第nデータ群まで分類する。
 図4においては、第1データ群111がタスクと最も関連性の高いデータ群であり、第2データ群112が、第1データ群111の次に、タスクと関連性の高いデータ群であり、さらに、第3データ群113が、第2データ群112の次に、タスクと関連性の高いデータ群であり、以降同様に、タスクとの関連性の高さに応じた第nデータ群nまでが設定されるものとする。すなわち、第nデータ群nがタスクとの関連性が最も低い。
 そして、タスクの処理に第1データ群111が用いられて、処理結果の評価値が所定の閾値よりも低い場合、次の処理では、第1データ群111に加えて、第2データ群112も用いられて、以降、評価値が所定の閾値よりも高くなるまで、順次、第nデータ群nまでのデータがタスクの処理に順次使用されるようにする。
 このような処理により、タスクの処理に使用されるデータを、タスクの関連性が高いものから順に使用することが可能となるので、タスクに関連するデータ群だけでは解決できないタスクをも適切に解決することが可能となる。
 <タスク処理部の第1の構成例における変形例>
 次に、図5を参照して、タスク処理部の第1の構成例における変形例について説明する。
 尚、図5において、図2の構成と同一の機能を備えた構成については、同一の符号を付しており、その説明は適宜省略する。
 すなわち、図5のタスク処理部51において、図2のタスク処理部51と異なる構成は、バイアス値設定部75、入力データ処理部76、および記憶モジュール77に代えて、バイアス値設定部101、入力データ処理部102、および記憶モジュール103が設けられている点である。
 バイアス値設定部101は、基本的な機能は、バイアス値設定部75と同様であるが、さらに、タスク処理モジュール72に供給されるデータ群を、評価値が所定の閾値よりも低く、タスクを適切に解決することができないと判定された回数に応じて、タスクとの関連性の低いデータ群が増えていくように変化させるようにバイアス値を設定する。
 入力データ処理部102は、記憶モジュール103に格納されている第1データ群111乃至第nデータ群より、バイアス値設定部101より供給されるバイアス値に基づいたデータを抽出して、タスク処理モジュール72に供給する。
 記憶モジュール103は、記憶モジュール77における第1データ群91および第2データ群92に代えて、図4を参照して説明した第1データ群111および第nデータ群nを記憶している。
 すなわち、第1データ群111乃至第nデータ群は、第1データ群111がタスクに最も関連するデータ群であり、第2データ群112、第3データ群113、・・・第nデータ群nの順にタスクとの関連性が高いデータ群である。
 <図5のタスク処理部によるタスク処理>
 次に、図6のフローチャートを参照して、図5のタスク処理部51によるタスク処理について説明する。尚、図6のステップS32乃至S38の処理は、図3のステップS11乃至S17の処理と同様であるので、その説明は適宜省略する。
 ステップS31において、バイアス値設定部101は、記憶モジュール103に格納されているデータ群を識別するカウンタmを1に初期化する。
 ステップS32乃至S38において、第1データ群111が用いられて、タスク処理モジュール72によりタスクが処理されて、処理結果が、処理結果評価モジュール73に供給されて、評価値が算出される。
 そして、ステップS38において、評価値が所定の閾値よりも低い場合、処理は、ステップS39に進む。
 ステップS39において、バイアス値設定部101は、カウンタmを1インクリメントする。
 ステップS40において、バイアス値設定部101は、カウンタmに対応するデータ群のデータがタスク処理モジュール72の処理に供給されるようにバイアス値を設定し、入力データ処理部102に出力する。
 ステップS41において、入力データ処理部102は、記憶モジュール103にアクセスし、バイアス値に基づいて、第1データ群乃至第nデータ群nのうち、例えば、第1データ群乃至第mデータ群mに属するデータより、タスクの処理に必要なデータを抽出して、タスク処理モジュール72に供給し、処理は、ステップS36に戻る。
 すなわち、タスク処理モジュール72の処理結果が、タスクを適切に解決する処理結果であるとみなされて、処理結果に対する評価値が、所定の閾値よりも高くなるまで、ステップS36乃至S41の処理が繰り返されて、繰り返された回数に対応して、第1データ群乃至第nデータ群nのうち、タスクとの関連性が徐々に低いデータ群のデータが用いられたタスクの処理が繰り返されていく。
 そして、ステップS41において、評価値が所定の閾値よりも高く、処理結果が、タスクを適切に解決するものであるとみなされると、処理は、ステップS42に進む。
 そして、ステップS42において、出力部74より、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた処理結果が出力される。
 以上の処理により、タスク処理モジュール72は、最初にタスクに関連するデータである第1データ群91より処理に必要とされるデータの供給を受けて、タスクを処理する。
 ここで、タスク処理モジュール72の処理結果が、タスクを適切に解決するものではなく、評価値が所定の閾値よりも低い場合には、バイアス値設定部75が、タスク処理モジュール72において実現されるタスク処理において必要なデータとして、段階的にタスクとは関連しない(タスクとの関連性のより低い)データ群のデータが徐々に含まれてタスク処理モジュール72に供給される。
 これにより、タスク処理モジュール72は、タスクを処理するにあたって、処理結果がタスクを適切に解決するものとみなされるまで、段階的にタスクに関連しないデータ群のデータを利用した処理がなされることになり、結果として、創造的で自由度の高い処理を実現することが可能となる。
 このような処理により、評価値が所定の閾値よりも低い状態が継続され続けると、徐々にタスクと関連性のないデータが用いられてタスクが処理されていくことになるので、段階的に創造的で自由度の高い処理へと変化させながらタスクを処理することが可能となる。
 このように、徐々にタスクの処理に必要とされるデータがタスクの関連性が高いものから低いものに変化することで、タスクと関連するデータのみでは解決できないタスクを適切に解決することが可能となる。
 尚、以上においては、評価値が所定の閾値よりも低い状態が継続され続けると、徐々にタスクと関連性のないデータが含まれるように用いられてタスクが処理されていく例について説明してきたが、評価値が所定の閾値よりも低い状態が繰り返されるほど、より関連性の低いデータのみが段階的に抽出されてタスク処理に使用されるようにしてもよい。
 <<3.第2の実施の形態>>
 以上においては、入力データ処理部76または102が、記憶モジュール77または103にアクセスし、第1データ群91および第2データ群92に属するデータ、または、第1データ群111および第nデータ群nに属するデータを、バイアス値に応じて混合してタスク処理モジュール72に供給する例について説明してきた。
 しかしながら、メイン記憶モジュールを設定し、デフォルトで第1データ群に属するデータを格納し、タスク処理モジュールが、メイン記憶モジュールに格納されたデータを読み出してタスクを処理し、処理結果がタスクを適切に解決できないときには、バイアス値に応じてメイン記憶モジュールに、第2データ群に属するデータを増やしていくようにしてもよい。
 図7は、デフォルトで第1データ群に属するデータを格納し、バイアス値に応じて、第2データ群に属するデータを徐々に増やして格納するメイン記憶モジュールを設け、タスク処理モジュールが、メイン記憶モジュールに格納されたデータに基づいてタスクを処理するようにしたタスク処理部51の構成例を示している。
 図7のタスク処理部51は、タスク入力部171、タスク処理モジュール172、処理結果評価モジュール173、出力部174、バイアス値設定部175、入力データ処理部176、メイン記憶モジュール177、第1サブ記憶モジュール178、および第2サブ記憶モジュール179を備えている。
 尚、タスク入力部171、タスク処理モジュール172、処理結果評価モジュール173、および出力部174は、図2のタスク入力部71、タスク処理モジュール72、処理結果評価モジュール73、および出力部74の構成と同様であるので、その説明は適宜省略する。
 ただし、タスク処理モジュール172は、基本的な機能において、タスク処理モジュール72と同様であるが、タスク処理モジュール72が、入力データ処理部76に対して処理に必要なデータを要求し、取得してタスクを処理するのに対して、タスク処理モジュール172は、メイン記憶モジュール177に格納されたデータに基づいて、タスクを処理する点において、タスク処理モジュール72とは異なる。
 また、メイン記憶モジュール177、第1サブ記憶モジュール178、および第2サブ記憶モジュール179の構成は、基本的に記憶モジュール77と同様であり、記憶部34内に構成されてもよいし、それぞれ別の記憶部として構成してもよいし、ネットワークを介して外部のサーバにより構成されてもよい。
 さらに、第1サブ記憶モジュール178には、第1データ群91に対応する第1データ群191が記憶されており、第2サブ記憶モジュール179には、第2データ群92に対応する第2データ群192が記憶されている。
 バイアス値設定部175は、処理結果評価モジュール173より供給される評価値に基づいて、入力データ処理部176が、第2サブ記憶モジュール179に格納されている第2データ群192に属するデータを読み出してメイン記憶モジュールに格納させるデータ量を特定するバイアス値を設定する。
 より具体的には、バイアス値設定部175は、例えば、評価値が所定の閾値よりも低い回数が増えるほど、第2データ群192に属するデータの抽出量を増やすようにバイアス値を設定する。
 入力データ処理部176は、バイアス値設定部175より供給されるバイアス値に基づいて、第2サブ記憶モジュール179に記憶されている第2データ群のデータを抽出して、メイン記憶モジュール177に記憶させる。
 このような構成により、メイン記憶モジュール177には、当初においては、デフォルトで第1サブ記憶モジュール178に記憶されている第1データ群191に属する、タスクに関連する(タスクとの関連性の高い)データが抽出されて記憶され、タスク処理モジュール172においてタスクの処理に使用され、処理結果が出力される。
 そして、タスク処理モジュール172の処理結果の評価値が、所定の閾値よりも低く、処理結果によりタスクが適切に解決できないとみなされると、バイアス値設定部175により設定されたバイアス値に基づいて、入力データ処理部176が、第2サブ記憶モジュール179より第2データ群192に属する、タスクに関連しないデータを抽出して、メイン記憶モジュール177に記憶させる。
 この結果、メイン記憶モジュール177には、第1データ群191に属するデータに加えて、第2データ群192に属するデータが記憶され、タスク処理モジュール172によりタスクの処理に使用される。
 この処理が繰り返されて、タスク処理モジュール172の処理結果の評価値が所定の閾値よりも低く、タスクを適切に解決する処理結果になっていない回数が増えると、徐々に、メイン記憶モジュール177に記憶される、タスクに関連しない(タスクとの関連性の低い)、第2データ群192に属するデータが増えていく。
 すなわち、処理結果が、タスクを適切に解決するものとみなされない状態が続くと、タスクに関連しないデータが徐々にメイン記憶モジュール177に記憶されて、タスクに関連しない(タスクとの関連性の高い)データによるタスク処理に変化していく。
 結果として、タスクに関連する(タスクとの関連性の高い)データだけでは、解決することができないタスクに対して、タスクに関連しない(タスクとの関連性の低い)データが増えた処理に変化することで、創造的で自由度の高い処理によりタスクを解決することが可能となる。
 <図7のタスク処理部によるタスク処理>
 次に、図8のフローチャートを参照して、図7のタスク処理部51によるタスク処理について説明する。
 ステップS51において、タスク入力部171は、入力部32により入力される入力結果、または検出される検出結果に係る各種のデータを受け付ける。
 ステップS52において、タスク入力部171は、入力部32の入力結果や検出結果に係るデータに基づいて、解決しようとするタスクの内容を把握し、把握したタスクの情報をタスク処理モジュール172に供給する。
 ステップS53において、タスク処理モジュール72は、タスク入力部71より供給された、把握されているタスクの情報をメイン記憶モジュール177に供給する。これに応じて、メイン記憶モジュール177は、第1サブ記憶モジュール178にアクセスし、第1データ群191に属する、タスクに関連するデータを抽出して記憶する。
 ステップS54において、タスク処理モジュール72は、メイン記憶モジュール177に記憶されているデータに基づいて、タスクを処理し、処理結果を処理結果評価モジュール173に出力する。
 尚、最初の処理では、メイン記憶モジュール177には、デフォルトとなる第1データ群191に属する、タスクに関連するデータのみが記憶されているので、タスクに関連するデータのみで、タスクが処理される。
 ステップS55において、処理結果評価モジュール173は、処理結果がタスクを適切に解決するものであるか否かを評価する評価値を算出し、処理結果を評価する。
 ステップS56において、処理結果評価モジュール173は、タスク処理モジュール172の処理結果に対する評価値が所定の閾値よりも高く、処理結果がタスクを適切に解決するものであるか否かを判定する。
 ステップS56において、評価値が所定の閾値よりも低く、処理結果がタスクを適切に解決するものではないとみなされた場合、処理は、ステップS57に進む。
 ステップS57において、処理結果評価モジュール173は、算出した所定の閾値よりも低い評価値をバイアス値設定部175に出力する。そして、バイアス値設定部175は、タスク処理モジュール172の処理結果に対する評価である評価値に基づいて、第2サブ記憶モジュール179に記憶されている第2データ群192に属するデータの抽出量を示すバイアス値を設定し、入力データ処理部176に出力する。
 ステップS58において、入力データ処理部176は、第2サブ記憶モジュール179にアクセスし、バイアス値に基づいて、第2データ群192より、タスクとの関連がない(タスクとの関連性の低い)データを抽出して、メイン記憶モジュール177に供給して記憶させ、処理は、ステップS54に戻る。
 すなわち、タスク処理モジュール172の処理結果が処理結果に対する評価値が、所定の閾値よりも高くなり、処理結果がタスクを適切に解決するものであるとみなされるまで、ステップS54乃至S58の処理が繰り返されて、徐々にメイン記憶モジュール177に記憶される第2データ群192のデータ量が増えた状態でのタスクの処理が繰り返される。
 そして、ステップS56において、評価値が所定の閾値よりも高く、処理結果が、タスクを適切に解決するものであるとみなされると、処理は、ステップS59に進む。
 ステップS59において、処理結果評価モジュール173は、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた処理結果を出力部174に出力する。
 出力部174は、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた処理結果を出力する。
 ステップS60において、タスク入力部171は、新たなタスクのデータ入力がなく、処理の終了が指示されたか否かを判定し、処理の終了が指示されない場合、処理は、ステップS51に戻る。
 すなわち、処理の終了が指示されるまで、ステップS51乃至S60の処理が繰り返される。
 そして、ステップS60において、終了の指示がなされたとみなされた場合、処理は、終了する。
 以上の処理により、タスク処理モジュール172は、最初の処理では、メイン記憶モジュール177に記憶されている、タスクに関連する(タスクとの関連性の高い)データである第1データ群191のみのデータにより、タスクを処理する。
 ここで、タスク処理モジュール172の処理結果が、タスクを適切に解決するものではなく、評価値が所定の閾値よりも低い場合には、バイアス値設定部175が、第2サブ記憶モジュール179に記憶された、タスクに関連しない(タスクとの関連性の低い)データである第2データ群192のデータがメイン記憶モジュール177に供給されるようなバイアス値を設定し、入力データ処理部176に供給する。
 これにより、入力データ処理部176は、タスク処理モジュール72において実現されるタスク処理において必要なデータとして、タスクに関連しない(タスクとの関連性の低い)データである第2データ群192のデータをメイン記憶モジュール177に供給して記憶させる。
 タスク処理モジュール72は、タスクを処理するにあたって、デフォルトで記憶されているタスクに関連する(タスクとの関連性の高い)第1データ群191に属するデータに加えて、タスクに関連しない(タスクとの関連性の低い)第2データ群192に属するデータを用いることになる。
 そして、処理結果の評価値が所定の閾値よりも低い状態が続くと、メイン記憶モジュール177に記憶されているデータとして、タスクに関連しない第2データ群192に属するデータが増えていくため、タスクに関連するデータを利用した処理とは異なる処理がなされることになり、結果として、創造的で自由度の高い処理を実現することが可能となる。
 <<4.第3の実施の形態>>
 以上においては、メイン記憶モジュール177を設定し、デフォルトでタスクに関連する第1データ群191に属するデータを記憶させて、タスク処理モジュール172がメイン記憶モジュール177に記憶されたデータに基づいてタスクを処理し、処理結果の評価値が所定の閾値よりも低い状態が続くと、メイン記憶モジュール177内にタスクに関連しない第2データ群192に属するデータを増やしていくようにするすることで、創造的で自由度の高い処理を実現する例について説明してきた。
 しかしながら、タスク処理モジュール内に、具体的な処理パターンや処理モデルに基づいて、データ処理を実現する第1タスク処理モジュールと、第1タスク処理モジュールにおける具体的なタスク処理に用いられる処理パターンや処理モデルを切り替える処理を実現する第2タスク処理モジュールとを設けるようにして、第2タスク処理モジュールが、バイアス値に応じて処理パターンや処理モデルを切り替えるようにしてもよい。
 図9は、タスク処理モジュール内に、具体的な処理パターンや処理モデルに基づいて、データ処理を実現する第1タスク処理モジュールと、第1タスク処理モジュールにおける具体的なタスク処理に用いられる処理パターンや処理モデルを切り替える処理を実現する第2タスク処理モジュールとを設けるようにして、第2タスク処理モジュールが、バイアス値に応じて処理パターンや処理モデルを切り替えるようにしたタスク処理部51の構成例である。
 図9のタスク処理部51は、タスク入力部371、タスク処理モジュール372、処理結果評価モジュール373、出力部374、バイアス値設定部375、および記憶モジュール376を備えている。
 尚、タスク入力部371、処理結果評価モジュール373、および出力部374は、図2のタスク入力部71、処理結果評価モジュール73、および出力部74の構成と同様であるので、その説明は適宜省略する。
 記憶モジュール376は、基本的に記憶モジュール77と同様の構成であり、タスクを処理するための処理パターンや処理モデルを記憶している。
 尚、記憶モジュール376は、記憶部34に構成されるようにしてもよいし、ネットワークを介して外部のサーバにより構成されてもよい。
 処理パターンや処理モデルは、例えば、第1タスク処理モジュール381により実行される、具体的なタスク処理に用いられる関数や、各種のパラメータ等である。また、処理パターンや処理モデルは、機械学習の学習モデル、学習済モデル、特徴量の勾配を記述したデータベース、および機械学習のアルゴリズムのネットワーク構造も含むものである。
 記憶モジュール376は、タスクとの関連性が高い処理パターンや処理モデルからタスクとの関連性の低い処理パターンや処理モデルまで、タスクとの関連性について様々なレベルの処理パターンや処理モデルを記憶している。
 タスク処理モジュール372は、基本的にタスク処理モジュール72と同様に、タスク入力部371により認識されたタスクを処理し、処理結果を処理結果評価モジュール373に出力する。
 ただし、タスク処理モジュール372は、第1タスク処理モジュール381、および第2タスク処理モジュール382を備えており、以下のようなタスク処理を実現する。
 すなわち、第1タスク処理モジュール381は、第2タスク処理モジュール382により設定された処理パターンや処理モデルに基づいて、具体的なタスク処理を実現し、処理結果を処理結果評価モジュール373に出力する。
 第2タスク処理モジュール382は、デフォルトでタスクに関連する(タスクとの関連性が高い)処理パターンや処理モデルを記憶モジュール376より抽出し、第1タスク処理モジュール381に供給する。
 また、第2タスク処理モジュール382は、第1タスク処理モジュールの処理結果に対する評価値が所定の閾値よりも低く、タスクを適切に解決できないとみなされた場合、バイアス値設定部375により設定されたバイアス値に基づいて、タスクと関連しない(タスクとの関連性が低い)処理パターンや処理モデルを記憶モジュール376より抽出して、第1タスク処理モジュール381に供給する。
 バイアス値設定部375は、第1タスク処理モジュールの処理結果に対する評価値が所定の閾値よりも低く、タスクを適切に解決していないとみなされた場合、バイアス値を設定してタスク処理モジュール372の第2タスク処理モジュール382に供給する。
 より詳細には、バイアス値設定部375は、バイアス値を0乃至1に設定し、例えば、デフォルト値を0とするとき、タスクとの関連性がある処理パターンや処理モデルを記憶モジュール376より抽出するようなバイアス値を0に設定する。
 また、処理結果に対する評価値が所定の閾値よりも低く、タスクを適切に解決していない状態が継続するような場合については、バイアス値を徐々に1に近い値に変化させる。
 この場合、第2タスク処理モジュール382は、バイアス値に基づいて、1に近づくほど、よりタスクとの関連性の低い処理パターンや処理モデルを、記憶モジュール376より読み出して、第1タスク処理モジュール381に供給する。
 このような構成により、第2タスク処理モジュール382は、デフォルトでバイアス値が0の状態のときには、記憶モジュール376に記憶されているタスクの処理に用いられる処理パターンや処理モデルのうち、タスクと関連する(タスクとの関連性が高い)ものを第1タスク処理モジュール381に供給する。
 これにより、第1タスク処理モジュール381は、タスクとの関連性の高い処理パターンや処理モデルによりタスクを処理する。
 また、第1タスク処理モジュール381の処理結果に対する評価値が所定の閾値より低い状態が継続すると、バイアス値設定部375により、バイアス値が徐々に1に近い値に設定される。
 これにより、第2タスク処理モジュール382は、徐々にタスクとの関連性の低い処理パターンや処理モデルを抽出して、第1タスク処理モジュール381に供給する。
 結果として、第1タスク処理モジュール381においては、徐々にタスクとの関連性の低い処理パターンや処理モデルに基づいてタスク処理がなされるように変化していく。
 また、タスクに関連する処理パターンや処理モデルでは、解決することができないタスクに対して、タスクに関連しない処理パターンや処理モデルが増えるように処理が変化することで、創造的で自由度の高い処理によりタスク処理を模索し、解決することが可能となる。
 <図9のタスク処理部によるタスク処理>
 次に、図10のフローチャートを参照して、図9のタスク処理部51によるタスク処理について説明する。
 ステップS81において、タスク入力部371は、入力部32により入力される入力結果、または検出される検出結果に係る各種のデータを受け付ける。
 ステップS82において、タスク入力部371は、入力部32の入力結果や検出結果に係るデータに基づいて、解決しようとするタスクの内容を把握し、把握したタスクの情報をタスク処理モジュール372に供給する。
 ステップS83において、タスク処理モジュール372は、タスク入力部371より供給された、把握されているタスクの情報を取得する。
 これに応じて、第2タスク処理モジュール382は、記憶モジュール376よりデフォルトのバイアス値が0の状態における、すなわち、タスクとの関連性がある処理パターンや処理モデルを抽出して、第1タスク処理モジュール381に供給する。
 ステップS84において、第1タスク処理モジュール381は、第2タスク処理モジュール382より供給された処理パターンや処理モデルに基づいて、タスクを処理し、処理結果を処理結果評価モジュール373に出力する。
 ステップS85において、処理結果評価モジュール373は、処理結果がタスクを適切に解決するものであるか否かを評価する評価値を算出し、処理結果を評価する。
 ステップS86において、処理結果評価モジュール173は、第1タスク処理モジュール381の処理結果に対する評価値が所定の閾値よりも高く、処理結果がタスクを適切に解決するものであるか否かを判定する。
 ステップS86において、評価値が所定の閾値よりも低く、処理結果がタスクを適切に解決するものではないとみなされた場合、処理は、ステップS87に進む。
 ステップS87において、処理結果評価モジュール373は、算出した所定の閾値よりも低い評価値をバイアス値設定部375に出力する。そして、バイアス値設定部375は、第1タスク処理モジュール381の処理結果に対する評価である評価値と、評価値が所定の閾値よりも低いとみなされた回数に基づいて、第2タスク処理モジュール382により記憶モジュール376より抽出する処理パターンや処理モデルの、タスクとの関連性を示すバイアス値を設定し、タスク処理モジュール372に出力する。
 ステップS88において、タスク処理モジュール372の第2タスク処理モジュール382は、記憶モジュール376にアクセスし、バイアス値に基づいたタスクとの関連性を有する処理パターンや処理モデルを抽出し、第1タスク処理モジュール381に供給し、処理は、ステップS84に戻る。
 すなわち、第1タスク処理モジュール381の処理結果が、タスクを適切に解決する処理結果であるとみなされて、処理結果に対する評価値が、所定の閾値よりも高くなるまで、ステップS84乃至S88の処理が繰り返されて、徐々に記憶モジュール376に記憶される処理パターンや処理モデルのうち、タスクとの関連性がより低いものを用いたタスクの処理へと変化しながら処理が繰り返される。
 そして、ステップS86において、評価値が所定の閾値よりも高く、処理結果が、タスクを適切に解決するものであるとみなされると、処理は、ステップS89進む。
 ステップS89において、処理結果評価モジュール373は、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた処理結果を出力部374に出力する。
 出力部374は、評価値が所定の閾値よりも高く、タスクを適切に解決するものであるとみなされた処理結果を出力する。
 ステップS90において、タスク入力部371は、新たなタスクのデータ入力がなく、処理の終了が指示されたか否かを判定し、処理の終了が指示されない場合、処理は、ステップS81に戻る。
 すなわち、処理の終了が指示されるまで、ステップS81乃至S90の処理が繰り返される。
 そして、ステップS90において、終了の指示がなされたとみなされた場合、処理は、終了する。
 以上の処理により、タスク処理モジュール372の第1タスク処理モジュール381は、最初の処理では、第2タスク処理モジュール382により記憶モジュール376に記憶されている、タスクに関連する処理パターンや処理モデルにより、タスクを処理する。
 ここで、第1タスク処理モジュール381の処理結果が、タスクを適切に解決するものではなく、評価値が所定の閾値よりも低い場合には、バイアス値設定部375が、第2タスク処理モジュール382対して、記憶モジュール376に記憶された処理パターンや処理モデルのうち、評価値や評価値が所定の閾値よりも低いとみなされた回数に基づいた、タスクとの関連性の低い処理パターンや処理モデルを記憶モジュール177より抽出して、第1タスク処理モジュール381に供給するようなバイアス値を設定し、タスク処理モジュール372に供給する。
 これにより、第2タスク処理モジュール382は、タスク処理において必要な処理パターンや処理モデルとして、バイアス値に応じたタスクとの関連性を備えた処理パターンや処理モデルを記憶モジュール376より抽出して第1タスク処理モジュール381に供給する。
 第1タスク処理モジュール381は、タスクを処理するにあたって、バイアス値に基づいたタスクとの関連性を備えた処理パターンや処理モデルを用いることでタスクを処理する。
 このとき、処理結果の評価値が所定の閾値よりも低い状態が続くと、記憶モジュール376記憶されている処理パターンや処理モデルとして、タスクとの関連性の低い処理パターンや処理モデルに変化することになるため、タスクに関連する処理パターンや処理モデルを利用した処理とは異なる処理へと処理が変化することになり、結果として、創造的で自由度の高い処理を実現することが可能となる。
 尚、上述した本開示の第1の実施の形態乃至第3の実施の形態のいずれにおいても、バイアス値を設定するにあたっては、タスク処理に係る条件に応じて、タスクとの関連性が低い処理パターンや処理モデルを選択させたり、その重みづけを変えるようにしてもよい。
 タスク処理に係る条件は、例えばタスク処理のリスクが挙げられる。すなわち、失敗した場合のリスクが低いタスクであるようなときには、タスクとの関連性が低い処理パターンや処理モデルを積極的に選択させるようにすることで、より高い創造性と自由度の高いタスク処理の模索を実現させることが可能となる。
 ここで、失敗した場合のリスクが低いタスクとは、例えば、試行回数制限が低いタスク、他の状況と比べ対象を破壊したり、ユーザを不快にする可能性が低いタスク、ユーザとのコミュニケーションや情報提示を行うタスクの処理であって、行動認識や表情認識、音声や生体情報に基づく情動推定によりユーザがポジティブな状態にあるときになされるタスク、および、エージェントモデルのように仮想的な人格を備えた処理が求められる場合に、エージェントモデルの感情状態がポジティブな状態にあるときのタスクなどである。これにより、タスク処理のリスクが低い場合には、対象の破壊やユーザを不快にするといった可能性をふくむ解をも提示するとともに、リスクが高い場合には、このような可能性が避けられやすい解のみを提示することができる。
 <<5.ソフトウェアにより実行させる例>>
 ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどに、記録媒体からインストールされる。
 図11は、汎用のコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)1001を内蔵している。CPU1001にはバス1004を介して、入出力インタフェース1005が接続されている。バス1004には、ROM(Read Only Memory)1002およびRAM(Random Access Memory)1003が接続されている。
 入出力インタフェース1005には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部1006、処理操作画面や処理結果の画像を表示デバイスに出力する出力部1007、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部1008、LAN(Local Area Network)アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部1009が接続されている。また、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどのリムーバブル記憶媒体1011に対してデータを読み書きするドライブ1010が接続されている。
 CPU1001は、ROM1002に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブル記憶媒体1011ら読み出されて記憶部1008にインストールされ、記憶部1008からRAM1003にロードされたプログラムに従って各種の処理を実行する。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
 以上のように構成されるコンピュータでは、CPU1001が、例えば、記憶部1008に記憶されているプログラムを、入出力インタフェース1005及びバス1004を介して、RAM1003にロードして実行することにより、上述した一連の処理が行われる。
 コンピュータ(CPU1001)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記憶媒体1011に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
 コンピュータでは、プログラムは、リムーバブル記憶媒体1011をドライブ1010に装着することにより、入出力インタフェース1005を介して、記憶部1008にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部1009で受信し、記憶部1008にインストールすることができる。その他、プログラムは、ROM1002や記憶部1008に、あらかじめインストールしておくことができる。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 尚、図11におけるCPU1001が、図1の制御部31の機能を実現させる。
 また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本開示は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 尚、本開示は、以下のような構成も取ることができる。
<1> 認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理するタスク処理部
 を備える情報処理システム。
<2> 前記タスク処理部は、前記第1の情報に基づいて、前記タスクを処理し、処理結果の評価に基づいて、前記第2の情報に基づいて、さらに前記タスクを処理する
 <1>に記載の情報処理システム。
<3> 前記第1の情報および前記第2の情報の少なくともいずれかを前記タスク処理部に供給する入力データ処理部をさらに含み、
 前記タスク処理部による前記第1の情報に基づいた処理結果の評価が所定の閾値よりも低い場合、前記入力データ処理部は、前記第2の情報を前記タスク処理部に供給する
 <2>に記載の情報処理システム。
<4> 前記入力データ処理部は、前記第1の情報および前記第2の情報を所定の混合比で混合して前記タスク処理部に供給し、
 前記タスク処理部による、前記所定の混合比で混合された前記第1の情報および前記第2の情報に基づいた処理結果の評価が所定の閾値よりも低い場合、前記入力データ処理部は、前記第2の情報の混合比を高めた新たな混合比で、前記第1の情報および前記第2の情報を混合して前記タスク処理部に供給する
 <3>に記載の情報処理システム。
<5> 前記処理結果の評価に基づいて、前記タスク処理部に供給する前記第1の情報および前記第2の情報の混合比を示すバイアス値を設定し、前記入力データ処理部に供給するバイアス値設定部をさらに含み、
 前記入力データ処理部は、前記バイアス値に基づいた混合比で、前記第1の情報および前記第2の情報を混合して前記タスク処理部に供給する
 <4>に記載の情報処理システム。
<6> 前記バイアス値設定部は、前記タスク処理部による処理結果の評価が所定の閾値よりも低いとみなされると、前記第2の情報の混合比が高くなるように前記バイアス値を設定する
 <5>に記載の情報処理システム。
<7> 前記第2の情報は、前記タスクとの関連性の高さに応じた複数の階層構造を有する複数の階層情報から構成され、
 前記バイアス値設定部は、前記タスク処理部による前記第1の情報に基づいた処理結果の評価が所定の閾値よりも低いとみなされると、前記タスクとの関連性の低い前記階層情報を含む前記第2の情報の混合比が高くなるように前記バイアス値を設定する
 <6>に記載の情報処理システム。
<8> 前記タスク処理部が、前記タスクを処理する際に使用する主要情報を記憶する主要情報記憶部をさらに含み、
 前記主要情報記憶部は、前記第1の情報を前記主要情報として記憶し、
 前記タスク処理部による前記第1の情報に基づいた処理結果の評価が所定の閾値よりも低い場合、前記第2の情報を、既に記憶されている前記第1の情報に加えて、新たな主要情報として、前記主要情報記憶部に記憶させる
 <2>に記載の情報処理システム。
<9> 前記処理結果の評価に基づいて、前記主要情報記憶部に記憶させる前記第2の情報の情報量を示すバイアス値を設定するバイアス値設定部をさらに含み、
 前記主要情報記憶部は、前記第2の情報を、前記バイアス値に基づいて設定される情報量だけ記憶する
 <8>に記載の情報処理システム。
<10> 前記バイアス値設定部は、前記タスク処理部による処理結果の評価が所定の閾値よりも低いとみなされると、前記主要情報記憶部に記憶させる前記第2の情報の情報量が増えるように前記バイアス値を設定する
 <9>に記載の情報処理システム。
<11> 前記タスク処理部は、前記第1の情報としての前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデル、および前記第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルに基づいて、前記タスクを処理する
 <1>に記載の情報処理システム。
<12> 前記タスク処理部は、前記タスクに関連する第1の情報としての前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデルに基づいて、前記タスクを処理し、処理結果の評価に基づいて、第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルに基づいて、さらに前記タスクを処理する
 <11>に記載の情報処理システム。
<13> 前記タスク処理部は、
  前記関連性の異なる複数の処理パターンまたは処理モデルの少なくともいずれかを供給する供給処理部と、
  前記供給処理部により供給された処理パターンまたは処理モデルに基づいて、前記タスクを処理するタスクパターンモデル処理部とを有し、
 前記タスクパターンモデル処理部は、前記第1の情報としての前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデルに基づいて、前記タスクを処理し、
 前記タスクパターンモデル処理部による前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデルに基づいた処理結果の評価が所定の閾値よりも低い場合、前記供給処理部は、前記第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルを供給する
 <12>に記載の情報処理システム。
<14> 前記タスクパターンモデル処理部による第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルに基づいた処理結果の評価が所定の閾値よりも低い場合、前記供給処理部は、前記第2の情報としての前記タスクとの関連性が前記所定基準よりさらに低い他の所定値より低い新たな処理パターンまたは処理モデルを前記タスクパターンモデル処理部に供給する
 <13>に記載の情報処理システム。
<15> 前記処理結果の評価に基づいて、供給する処理パターンまたは処理モデルに対応する前記タスクとの関連性の高さを示すバイアス値を設定し、前記供給処理部に供給するバイアス値設定部をさらに含み、
 前記供給処理部は、前記バイアス値に対応する前記タスクとの関連性の高さの処理パターンまたは処理モデルを前記タスクパターンモデル処理部に供給する
 <14>に記載の情報処理システム。
<16> 前記バイアス値設定部は、前記タスクパターンモデル処理部による処理結果の評価が所定の閾値よりも低いとみなされると前記タスクとの関連性の高さの処理パターンまたは処理モデルを供給するように前記バイアス値を設定する
 <15>に記載の情報処理システム。
<17> 前記タスク処理部の処理結果を出力する出力部をさらに備える
 <1>乃至<16>のいずれかに記載の情報処理システム。
<18> 前記出力部は、前記処理結果の評価が閾値よりも高いとみなされた処理結果を出力する
 <17>に記載の情報処理システム。
<19> 認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理する
 ステップを含む情報処理方法。
<20> 認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理するタスク処理部
 としてコンピュータを機能させるプログラム。
 11 情報処理装置, 31 制御部, 32 入力部, 33 出力部, 34 記憶部, 35 通信部, 36 ドライブ, 37 リムーバブル記憶媒体, 51 タスク処理部, 71 タスク入力部, 72 タスク処理モジュール, 73 処理結果評価モジュール, 74 出力部, 75 バイアス値設定部, 76 入力データ処理部, 77 記憶モジュール, 91 第1データ群, 92 第2データ群, 101 バイアス値設定部, 102 入力データ処理部, 103 記憶モジュール, 111乃至n 第1データ群乃至第nデータ群, 171 タスク入力部, 172 タスク処理モジュール, 173 処理結果評価モジュール, 174 出力部, 175 バイアス値設定部, 176 入力データ処理部, 177 メイン記憶モジュール, 178 第1サブ記憶モジュール, 179 第2サブ記憶モジュール, 191 第1データ群, 192 第2データ群, 371 タスク入力部, 372 タスク処理モジュール, 373 処理結果評価モジュール, 374 出力部, 375 バイアス値設定部, 376 記憶モジュール, 381 第1タスク処理モジュール, 382 第2タスク処理モジュール

Claims (20)

  1.  認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理するタスク処理部
     を備える情報処理システム。
  2.  前記タスク処理部は、前記第1の情報に基づいて、前記タスクを処理し、処理結果の評価に基づいて、前記第2の情報に基づいて、さらに前記タスクを処理する
     請求項1に記載の情報処理システム。
  3.  前記第1の情報および前記第2の情報の少なくともいずれかを前記タスク処理部に供給する入力データ処理部をさらに含み、
     前記タスク処理部による前記第1の情報に基づいた処理結果の評価が所定の閾値よりも低い場合、前記入力データ処理部は、前記第2の情報を前記タスク処理部に供給する
     請求項2に記載の情報処理システム。
  4.  前記入力データ処理部は、前記第1の情報および前記第2の情報を所定の混合比で混合して前記タスク処理部に供給し、
     前記タスク処理部による、前記所定の混合比で混合された前記第1の情報および前記第2の情報に基づいた処理結果の評価が所定の閾値よりも低い場合、前記入力データ処理部は、前記第2の情報の混合比を高めた新たな混合比で、前記第1の情報および前記第2の情報を混合して前記タスク処理部に供給する
     請求項3に記載の情報処理システム。
  5.  前記処理結果の評価に基づいて、前記タスク処理部に供給する前記第1の情報および前記第2の情報の混合比を示すバイアス値を設定し、前記入力データ処理部に供給するバイアス値設定部をさらに含み、
     前記入力データ処理部は、前記バイアス値に基づいた混合比で、前記第1の情報および前記第2の情報を混合して前記タスク処理部に供給する
     請求項4に記載の情報処理システム。
  6.  前記バイアス値設定部は、前記タスク処理部による処理結果の評価が所定の閾値よりも低いとみなされると、前記第2の情報の混合比が高くなるように前記バイアス値を設定する
     請求項5に記載の情報処理システム。
  7.  前記第2の情報は、前記タスクとの関連性の高さに応じた複数の階層構造を有する複数の階層情報から構成され、
     前記バイアス値設定部は、前記タスク処理部による前記第1の情報に基づいた処理結果の評価が所定の閾値よりも低いとみなされると、前記タスクとの関連性の低い前記階層情報を含む前記第2の情報の混合比が高くなるように前記バイアス値を設定する
     請求項6に記載の情報処理システム。
  8.  前記タスク処理部が、前記タスクを処理する際に使用する主要情報を記憶する主要情報記憶部をさらに含み、
     前記主要情報記憶部は、前記第1の情報を前記主要情報として記憶し、
     前記タスク処理部による前記第1の情報に基づいた処理結果の評価が所定の閾値よりも低い場合、前記第2の情報を、既に記憶されている前記第1の情報に加えて、新たな主要情報として、前記主要情報記憶部に記憶させる
     請求項2に記載の情報処理システム。
  9.  前記処理結果の評価に基づいて、前記主要情報記憶部に記憶させる前記第2の情報の情報量を示すバイアス値を設定するバイアス値設定部をさらに含み、
     前記主要情報記憶部は、前記第2の情報を、前記バイアス値に基づいて設定される情報量だけ記憶する
     請求項8に記載の情報処理システム。
  10.  前記バイアス値設定部は、前記タスク処理部による処理結果の評価が所定の閾値よりも低いとみなされると、前記主要情報記憶部に記憶させる前記第2の情報の情報量が増えるように前記バイアス値を設定する
     請求項9に記載の情報処理システム。
  11.  前記タスク処理部は、前記第1の情報としての前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデル、および前記第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルに基づいて、前記タスクを処理する
     請求項1に記載の情報処理システム。
  12.  前記タスク処理部は、前記タスクに関連する第1の情報としての前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデルに基づいて、前記タスクを処理し、処理結果の評価に基づいて、第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルに基づいて、さらに前記タスクを処理する
     請求項11に記載の情報処理システム。
  13.  前記タスク処理部は、
      前記関連性の異なる複数の処理パターンまたは処理モデルの少なくともいずれかを供給する供給処理部と、
      前記供給処理部により供給された処理パターンまたは処理モデルに基づいて、前記タスクを処理するタスクパターンモデル処理部とを有し、
     前記タスクパターンモデル処理部は、前記第1の情報としての前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデルに基づいて、前記タスクを処理し、
     前記タスクパターンモデル処理部による前記タスクとの関連性が所定基準よりも高い処理パターンまたは処理モデルに基づいた処理結果の評価が所定の閾値よりも低い場合、前記供給処理部は、前記第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルを供給する
     請求項12に記載の情報処理システム。
  14.  前記タスクパターンモデル処理部による第2の情報としての前記タスクとの関連性が所定基準よりも低い処理パターンまたは処理モデルに基づいた処理結果の評価が所定の閾値よりも低い場合、前記供給処理部は、前記第2の情報としての前記タスクとの関連性が前記所定基準よりさらに低い他の所定値より低い新たな処理パターンまたは処理モデルを前記タスクパターンモデル処理部に供給する
     請求項13に記載の情報処理システム。
  15.  前記処理結果の評価に基づいて、供給する処理パターンまたは処理モデルに対応する前記タスクとの関連性の高さを示すバイアス値を設定し、前記供給処理部に供給するバイアス値設定部をさらに含み、
     前記供給処理部は、前記バイアス値に対応する前記タスクとの関連性の高さの処理パターンまたは処理モデルを前記タスクパターンモデル処理部に供給する
     請求項14に記載の情報処理システム。
  16.  前記バイアス値設定部は、前記タスクパターンモデル処理部による処理結果の評価が所定の閾値よりも低いとみなされると前記タスクとの関連性の高さの処理パターンまたは処理モデルを供給するように前記バイアス値を設定する
     請求項15に記載の情報処理システム。
  17.  前記タスク処理部の処理結果を出力する出力部をさらに備える
     請求項1に記載の情報処理システム。
  18.  前記出力部は、前記処理結果の評価が閾値よりも高いとみなされた処理結果を出力する
     請求項17に記載の情報処理システム。
  19.  認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理する
     ステップを含む情報処理方法。
  20.  認識されたタスクとの関連性が所定基準よりも高い第1の情報、および、前記タスクとの関連性が所定基準よりも低い第2の情報に基づいて、前記タスクを処理するタスク処理部
     としてコンピュータを機能させるプログラム。
PCT/JP2020/046000 2019-12-24 2020-12-10 情報処理システム、および情報処理方法、並びにプログラム WO2021131739A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021567206A JPWO2021131739A1 (ja) 2019-12-24 2020-12-10
US17/777,206 US20220391246A1 (en) 2019-12-24 2020-12-10 Information processing system, information processing method, and program
CN202080088143.6A CN114830087A (zh) 2019-12-24 2020-12-10 信息处理系统、信息处理方法和程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-232392 2019-12-24
JP2019232392 2019-12-24

Publications (1)

Publication Number Publication Date
WO2021131739A1 true WO2021131739A1 (ja) 2021-07-01

Family

ID=76575451

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/046000 WO2021131739A1 (ja) 2019-12-24 2020-12-10 情報処理システム、および情報処理方法、並びにプログラム

Country Status (4)

Country Link
US (1) US20220391246A1 (ja)
JP (1) JPWO2021131739A1 (ja)
CN (1) CN114830087A (ja)
WO (1) WO2021131739A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188787A (ja) * 1999-12-28 2001-07-10 Sony Corp 会話処理装置および方法、並びに記録媒体
JP2019036087A (ja) * 2017-08-14 2019-03-07 ヤフー株式会社 生成装置、生成方法、生成プログラム、学習データ、及びモデル

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188787A (ja) * 1999-12-28 2001-07-10 Sony Corp 会話処理装置および方法、並びに記録媒体
JP2019036087A (ja) * 2017-08-14 2019-03-07 ヤフー株式会社 生成装置、生成方法、生成プログラム、学習データ、及びモデル

Also Published As

Publication number Publication date
JPWO2021131739A1 (ja) 2021-07-01
US20220391246A1 (en) 2022-12-08
CN114830087A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN112189229B (zh) 针对计算机化个人助手的技能发现
US11328717B2 (en) Electronic device, operating method thereof, system having plural artificial intelligence devices
US20200259891A1 (en) Facilitating Interaction with Plural BOTs Using a Master BOT Framework
Hiatt et al. Human modeling for human–robot collaboration
JP2020140210A (ja) 会話システムにおいて意図が不明確なクエリを処理する方法およびシステム
KR102455056B1 (ko) 컨텍스트에 따라 이벤트의 출력 정보를 제공하는 전자 장치 및 이의 제어 방법
US20180165581A1 (en) Electronic apparatus, method of providing guide and non-transitory computer readable recording medium
KR20200046185A (ko) 전자 장치 및 이의 제어 방법
EP3528242A1 (en) Computer system and method for controlling user-machine dialogues
US10902209B2 (en) Method for content search and electronic device therefor
KR20200072592A (ko) 로봇용 학습 프레임워크 설정방법 및 이를 수행하는 디지털 제어 장치
Skočaj et al. An integrated system for interactive continuous learning of categorical knowledge
Taniguchi et al. Semiotically adaptive cognition: toward the realization of remotely-operated service robots for the new normal symbiotic society
US20220295134A1 (en) Dynamically using internet of things devices to control playback of multimedia
GB2607985A (en) Conversational AI platforms with closed domain and open domain dialog integration
WO2021131739A1 (ja) 情報処理システム、および情報処理方法、並びにプログラム
Liu et al. AI Autonomy: Self‐initiated Open‐world Continual Learning and Adaptation
US11769490B2 (en) Electronic apparatus and control method thereof
US20110071674A1 (en) Intelligent user interface apparatus and control method for control of service robots
Boboc et al. Point-and-command paradigm for interaction with assistive robots
US20180181345A1 (en) Systems and methods for contextual memory capture and recall
US20210394359A1 (en) Robotic Intervention Systems
JP2023120130A (ja) 抽出質問応答を利用する会話型aiプラットフォーム
Chávez-Olivares et al. On stiffness regulators with dissipative injection for robot manipulators
US20100169246A1 (en) Multimodal system and input process method thereof

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20904405

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021567206

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20904405

Country of ref document: EP

Kind code of ref document: A1