WO2011058621A1 - 最適手法探索方法及び最適手法探索システム - Google Patents

最適手法探索方法及び最適手法探索システム Download PDF

Info

Publication number
WO2011058621A1
WO2011058621A1 PCT/JP2009/069139 JP2009069139W WO2011058621A1 WO 2011058621 A1 WO2011058621 A1 WO 2011058621A1 JP 2009069139 W JP2009069139 W JP 2009069139W WO 2011058621 A1 WO2011058621 A1 WO 2011058621A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
execution unit
evaluation
node
neural network
Prior art date
Application number
PCT/JP2009/069139
Other languages
English (en)
French (fr)
Inventor
真之 吉信
Original Assignee
Yoshinobu Masayuki
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yoshinobu Masayuki filed Critical Yoshinobu Masayuki
Priority to JP2010550980A priority Critical patent/JP4997429B2/ja
Priority to EP09851255.1A priority patent/EP2500847B1/en
Priority to US13/508,908 priority patent/US8838514B2/en
Priority to CN200980163282.4A priority patent/CN102713944B/zh
Priority to PCT/JP2009/069139 priority patent/WO2011058621A1/ja
Publication of WO2011058621A1 publication Critical patent/WO2011058621A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Definitions

  • the present invention relates to an optimum method search method and an optimum method search system that efficiently derives an optimum method for solving a problem by adapting a cell differentiation algorithm to a neural network.
  • the advantage of incorporating a neural network into a system is that the nodes that form the network in the neural network repeat learning to derive an optimal method for solving the problem.
  • a system that employs a genetic algorithm in a neural network has various techniques for deriving highly accurate results in selecting an optimal method from image processing to robot control, as in Patent Document 1 and Patent Document 2. Used across the direction. JP-A-9-006881 JP 2003-317073 A
  • the first object of the present invention is to provide an optimal method search method and an optimal method search that improve search efficiency and derive an optimal method by using a cell differentiation mechanism as an algorithm and completing a certain degree of learning in advance. To provide a system.
  • a second object of the present invention is to provide an optimum method search method and an optimum method search system that can incorporate a neural network adapted to a genetic algorithm as software by simplifying the search process. is there.
  • the method of the present invention recognizes an environmental state as data under an arbitrary environment, and adapts the data to a preset / generated neural network to perform an operation according to the environmental state.
  • a characteristic technique is adopted in which a setting for performing the operation most efficiently from the plurality of processes is derived as an optimum technique by executing the operation a plurality of times.
  • the system of the present invention solves the above-described problems, and executes an initial setting for adapting a neural network to derive and execute an operation according to the environment under an arbitrary environment, and the initial setting for the execution unit.
  • an evaluation unit that evaluates the operation content of the execution unit after the operation ends, and the evaluation unit causes the operation subject to execute the operation a plurality of times, and includes the plurality of derived operation results. Therefore, the characteristic configuration means for deriving the initial setting of the execution unit that performs the most efficient operation as the optimum method is taken.
  • the present invention achieves the above-mentioned object by adopting a new characteristic configuration means ranging from the superordinate concept listed below to the subordinate concept. .
  • the first feature of the method of the present invention is that, under an arbitrary environment, an execution unit that is initially set to adapt a neural network to derive and execute an operation according to the environment, and the initial setting for the execution unit is set. And an evaluation unit that evaluates the operation content of the execution unit after completion of the operation, and the evaluation unit causes the operation subject to execute the operation a plurality of times, and from among the plurality of derived operation results
  • the node included in the initial setting is arranged, and a calculation process is executed based on the function to divide the node to generate a neural network, and after the neural network is generated, the execution unit includes The input data detected by the sensor is input to the neural network to derive output data, the operation unit included in the execution unit is operated based on the output data, and the operation result is transmitted to the evaluation unit.
  • the execution unit operation procedure and the evaluation unit execute the individual evaluation procedure when the individual evaluation of the execution unit is created based on the received operation result, and sequentially executes the individual evaluation procedure a plurality of times. It is in the configuration adoption of the optimum method search method that derives efficient operation.
  • the evaluation unit in the first feature of the method of the present invention includes: coordinate data for creating a neural network; evaluation criteria for the execution unit; the nodes; When the value is stored in the database as a parameter and the execution unit is operated, the parameter selected from the database is created as an initial setting, transmitted to the execution unit, and the operation is performed based on the initial setting.
  • the operation result of the execution unit creating an evaluation as an individual evaluation of the robot, and accumulating it in the database, an initial setting for performing the most efficient operation from the information accumulated in the database It is in the configuration adoption of the optimal method search method formed by searching for combinations.
  • the execution unit in the first or second feature of the method of the present invention uses the evaluation unit that detects the operation state of the execution unit to provide the detection result to the evaluation unit. It is in the configuration adoption of the optimum method search method that is transmitted.
  • the execution unit in the first or second feature of the method of the present invention configures the neural network based on the initial setting received from the evaluation unit,
  • the sensor unit included in the execution unit detects the state of the environment as input data and the neural network is configured
  • output data is derived by inputting the input data to the neural network
  • the configuration employs an optimum method search method in which an operation is performed by transmitting the output data to an operation unit provided.
  • the fifth feature of the method of the present invention is that the node in the first, second, or third feature of the method of the present invention is a parameter for distinguishing the characteristics of the node, and coordinates of the node and a plurality of the features
  • the connection strength of the connection line connecting the nodes, the connection destination of the node, the potential of the node, and the utilization rate of the mathematical formula group at the node are held, and the mathematical formula group is used as a parameter for each mathematical formula in the mathematical formula group.
  • the method employs a configuration of an optimum method search method that includes a mathematical expression indicating a calculation rule between the nodes and a mathematical expression indicating a parameter change degree in the node.
  • the first feature of the system of the present invention is that an execution unit that is initially set to adapt a neural network to derive and execute an operation according to the environment under an arbitrary environment, and to give the initial setting to the execution unit
  • An evaluation unit that evaluates the operation content of the execution unit after the operation ends, and the evaluation unit causes the execution unit to execute the operation a plurality of times, and from among the plurality of derived operation results
  • An optimal method search system for searching for an initial setting of an execution unit that performs an efficient operation, wherein the execution unit includes a virtual cell division section therein, and is a node that becomes a virtual cell set by the evaluation unit And the number of nodes adjusted in the cell division section based on a mathematical formula corresponding to a virtual molecule necessary for cell division, and the result of detection by a sensor included in the execution unit , It is propagated to the node as input data derived signals required for the operation, in the configuration adopting the best approach retrieval system comprising constituting the neural network operating output in the execution unit.
  • the execution unit in the first feature of the method of the present invention outputs a sensor unit that detects the state of the environment, a search unit that constitutes the neural network, and an output from the search unit.
  • An operation unit that executes the operation based on the obtained data, an evaluation unit that detects whether the operation of the execution unit is successful or failed, and detects it as an operation evaluation, the evaluation unit, and the operation in the evaluation unit And adopting a configuration of an optimum method searching system including a communication unit for communicating the evaluation and the initial setting.
  • a third feature of the system of the present invention is a database in which the evaluation unit in the first or second feature of the method of the present invention accumulates the parameters of the node and function transmitted to the execution unit and the evaluation of the execution unit.
  • an individual definition module that extracts the node and function parameter values from the database and transmits the initial setting of the node and function to be transmitted to the execution unit, and the operation evaluation and the execution received from the execution unit Create an individual evaluation of the execution unit from the initial settings transmitted to the unit, write and save it in the database, and execute each operation on the individual definition module, the individual evaluation module, and the execution unit
  • An optimal method search comprising an execution management module for instructing and a communication unit for communicating with the execution unit In the configuration adoption of the stem.
  • a fourth feature of the system of the present invention is that the node in the first, second, or third feature of the method of the present invention is a parameter that distinguishes the characteristics of the node, and coordinates of the node and a plurality of the features
  • the configuration employs an optimum technique search system that holds the connection strength of the connection line connecting the nodes, the connection destination of the node, the potential of the node, and the utilization rate of the mathematical formula group at the node.
  • a fifth feature of the system of the present invention is that the formula group in the first, second or third feature of the method of the present invention is a formula indicating a calculation rule between formulas in the formula group as a parameter, and the node 9.
  • the present invention by adapting the mechanism of cell differentiation to a neural network as a cell differentiation algorithm, it is possible to differentiate phenotypes and genotypes that have not been distinguished when using conventional genetic algorithms, By omitting the processing that is judged to be useless in detecting the optimum method for solving the problem, an efficient optimum method can be searched.
  • Optimal technique search system 1... execution unit 11, 14 a... sensor unit 11 a... CCD camera 12... detection unit 12 a ... input data reception unit 12 b.
  • Unit 12e ... Output data transmission unit 13, 14b ... Operation unit 14 ... Evaluation unit 15, 21 ... Communication unit 2 ... Evaluation unit 22 ... Database 23 ...
  • Individual definition module 24 ...
  • Individual evaluation module 25 ...
  • FIG. 1 is a system configuration diagram according to the present invention.
  • the optimum method search system ⁇ senses the operating environment by a sensor, performs an optimum operation by a neural network, performs basic settings for the execution unit 1, and It is comprised in the evaluation part 2 which evaluates an operation result.
  • the execution unit 1 detects the operating environment and the operation status of the execution unit 1 and converts the status into data as input data in.
  • the sensor 11 is necessary for the operation based on the input data in recognized by the sensor unit 11.
  • the detection unit 12 for deriving the output data out, the operation unit 13 for executing an operation based on the output data out received from the detection unit 12, the evaluation unit 14 for evaluating the operation of the execution unit 1, and the evaluation of the evaluation unit 14
  • the communication unit 15 is configured to transmit data and the operation state of the operation unit 13 by the sensor unit 11 to the evaluation unit 2.
  • the sensor unit 11 includes a sensor that senses an environmental state that is caused by a natural phenomenon or a machine and changes in electricity, magnetism, heat, sound, light, and the like.
  • the type of the sensor is the operation content of the execution unit 1. Can be changed as appropriate. For example, when it is desired to visually detect a change in the state of a certain space, a CCD camera or an image sensor such as a hyperspectral sensor may be used.
  • the detection unit 12 is a processing unit for deriving operation data to be operated by the operation unit 13 for a given purpose from the environmental state recognized by the sensor unit 11 as described above, and an input input from the sensor unit 11
  • An input data receiving unit 12a that receives the data in
  • an input data signal converting unit 12b that converts the input data in from the input data receiving unit 12a into an input data signal ins, and a neural network are incorporated, and the input data signal converting unit 12b
  • a signal calculation unit 12c that calculates an output data signal outs necessary for the operation of the operation unit 13 based on the received input data signal ins, and an output applicable to the operation unit 13 that receives the output data signal outs from the signal calculation unit 12c.
  • Output data signal conversion unit 12d for converting data out and output unit out Constituted by the output data transmitting unit 12d to be transmitted to the 3.
  • a neural network is employed in the signal calculation unit 12c so that the signal calculation unit 12c derives the output data signal outs based on the input data signal ins.
  • the algorithm of this neural network will be described in detail separately. I decided to.
  • the operation unit 13 can be appropriately equipped with necessary operation devices and devices according to the operation content of the execution unit 1, and the type thereof is not limited.
  • a drive motor is used.
  • the arm installed in the execution unit 1 is operated or when the execution unit 1 main body is intended to move up and down, It is recommended to use an actuator according to the operation.
  • the evaluation unit 14 includes a sensor unit 14a for detecting the movable state of the execution unit 1 used for the evaluation of the execution unit 1, and also includes an operation unit 14b as a single evaluation unit, and the result of the operation unit 14b is obtained. Used for evaluation of the execution unit 1. As shown in the following example, the operation unit 14b is not necessarily provided.
  • the evaluation unit when the execution unit 1 is intended to collect and select a specific substance, the evaluation unit is moved by the operation unit 13 to the target substance.
  • the communication unit 15 converts the evaluation result that the target operation of the execution unit 1 has succeeded (or failed) into the evaluation information e as an evaluation information e if the recovery of the target substance is attempted (or failed). Is transmitted to the evaluation unit 2.
  • the sensor unit 14a examines environmental conditions such as humidity and temperature in advance, and the operation unit After 13 moves to a predetermined position, the sensor unit 14a detects a change in state, and transmits the result (success / failure) of the executed operation to the evaluation unit 2 as evaluation information e.
  • the configuration content of the evaluation unit 14 may be only the sensor unit 14a, but the evaluation unit 14 is not limited to only the state detection, When collecting work is performed or when it is necessary to detect the state by moving the sensor unit 14a, the operation unit 14b is further configured.
  • the communication unit 15 in the execution unit 1 and the communication unit 21 in the evaluation unit 2 are units for communicating with each other, and the work evaluation information e in the execution unit 1 is transmitted to the communication unit 21 through the communication unit 15.
  • the communication unit 21 sends evaluation information e to the individual evaluation module 22 so that the evaluation unit 2 evaluates the execution unit 1 individual.
  • the evaluation unit 2 Before the operation of the execution unit 1, the evaluation unit 2 performs initial setting of the neural network for the execution unit 1, and the operation content of the execution unit 1 after the operation is set with any operation time of the execution unit 1 as one segment.
  • the evaluation information e evaluated by the evaluation unit 14 is held as one individual evaluation of the execution unit 1, and the most effective operation is executed by managing the evaluation information e of a plurality of operations or each of the execution units 1
  • This processing unit derives the initial setting to be performed as an optimal method.
  • the evaluation unit 2 transmits the initial setting es to the execution unit 1 and receives the operation evaluation of the execution unit 1 by the evaluation unit 14 and the combination group of the parameters of the node N and the execution unit 1
  • the individual definition module 23 that transmits the initial setting es from the database 22 to the execution unit 1, and the evaluation information e of the execution unit 1 transmitted from the execution unit 1
  • the score evaluation s obtained by scoring the evaluation result is written and stored in the database 22, and the individual definition module 23, the individual evaluation module 24, and the execution unit 1 are operated. It is comprised by the execution management module 25 which transmits an execution command.
  • each processing unit in the system of the present invention has been described, but in the system of the present invention, all may be configured in the same apparatus, such as attaching the evaluation unit 2 inside the execution unit 1, but the evaluation unit 2 A personal computer may be configured to exchange data by connecting the personal computer and the execution unit 1 by wire or wirelessly.
  • the search for the optimum method can be derived more efficiently.
  • Cell differentiation algorithm a cell differentiation algorithm employed in a neural network implemented in the signal calculation unit 12 in order to search for an optimum method will be described.
  • the present invention describes a phenomenon in which the state of cells and molecules changes as cell differentiation progresses in the process of cell division. The purpose is to become.
  • Non-Patent Document 1 Since specific terms and differentiation states for cell differentiation are based on Non-Patent Document 1, detailed explanations on the mechanism of cell differentiation shown in these documents will be omitted. What is life? Introduction to complex life theory, The University of Tokyo Press, Kunio Kaneko, 2003
  • cell differentiation is virtually performed by the signal calculation unit 2 using three elements of a cell division space (medium) RP, a node (cell) NP, and a molecule OP.
  • Each element holds a data group consisting of numerical values and mathematical formulas as parameters indicating the respective characteristics, and division is performed by the mutual calculation of each data in each element.
  • Non-Patent Document 1 when the number of cells increases due to division in the process of cell differentiation, changes in the state of molecules in the cells are observed.
  • the node N closer to the initial value is set as the input side,
  • the signal received by the output side derives the optimum result for the input signal.
  • a certain technology is adopted.
  • FIG. 3 shows an execution unit parameter RP assigned to the execution unit 1 held in the individual definition module 23, a node parameter NP set as an initial value of the node N, and a group of mathematical expressions used for the division of the node N.
  • the contents of the object parameter OP are as follows.
  • the execution unit parameter RP is a parameter for creating a virtual cell division space, and is set as an initial value in the execution unit 1 every time the cell differentiation algorithm is executed.
  • coordinate data R-01 indicating the coordinate information necessary for the cell division space in numerical values
  • the evaluation score R-02 of the execution unit 1 that has undergone cell differentiation and each execution unit 1 are allocated. It consists of the code R-03, which is worth the cell genetic code for node N.
  • the score R-02 is a value for quantifying the efficiency of work in the work to be performed by the execution unit 1, and is received from the evaluation unit 14.
  • the node parameter NP includes node coordinates N-01 indicating the coordinates of the node N that is the first node arranged in the coordinate data R-01, synapse coupling strength N-02 indicating the degree of synapse coupling of the node N, It consists of a synapse connection destination N-03 indicating the node N to which the synapse is connected, a node potential N-04 indicating the potential held by the connection destination node N, and an object execution frequency N-05 indicating the number of objects at the node N. These parameters are expressed numerically.
  • the node potential N-04 is not used at the time of cell division, and indicates a threshold value that triggers the node N to transmit a signal to another node.
  • the node potential N-04 is obtained by summing values transmitted from other nodes.
  • the object execution frequency N-05 indicates the number of objects O (numerators) existing in the node N, and is set so that the number of objects in the node N is halved at each division.
  • object parameter OP Since the object O is a molecule in cell division, and there are a considerable number of types of molecules in biology, various types of objects O1... K (in the initial setting stage in order to bring them closer to the actual cell division state. k is a natural number) and object parameters OP1 to k for each must be defined.
  • the constituent elements of the object parameter OP are composed of a calculation occurrence probability O-01 indicating a reaction coefficient between objects and a function occurrence probability O-02 for changing the value of each item of the node parameter NP.
  • the function occurrence probability O-02 can be appropriately changed depending on what function the object O has.
  • a mathematical expression necessary for setting the initial value to the function occurrence probability O-02 is set, such as setting a mathematical expression for changing the set value of the synaptic coupling strength N-02 or the node potential N-04.
  • the individual definition module sets initial values of the execution unit parameter RP, the node parameter NP, and the object parameter OP, and transmits these parameters to the signal calculation unit 12c (ST1).
  • the parameters set at this time are held in the database 22 and may be set with random or arbitrary regularity by the individual definition module, or may be rewritten as necessary.
  • the node parameter NP is set for each execution unit 1. However, since the operation of the execution unit 1 is compared and evaluated under the same conditions, the object parameter OP is set to the same parameter for a plurality of execution units 1 used for evaluation. To do.
  • the signal calculation unit 12c generates a virtual cell division space based on the initial setting es received from the individual definition module 23, and configures a neural network to which the cell differentiation algorithm is applied (ST2).
  • the signal calculation unit 12c arranges the node N in the neural network from the node parameter NP and defines the individual (ST3), and then randomly exists the object O, and the arrangement number of the object O is a fixed number. If it reaches, the division is started (ST4).
  • the node N1 Based on the execution coefficient N-05, the node N1 selects the operation occurrence probability O-01 or the function occurrence probability O-02 from the mathematical expression group in the object parameter OP, and applies the value of the node parameter N to obtain a virtual Node N1 continues to divide into nodes N2 and N3.
  • the node parameters NP of the nodes N2 and N3 are almost the same as those of the node N1, but only the execution coefficient N-05 halves the coefficient value.
  • the nodes N2 and N3 select the operation occurrence probability O-01 or the function occurrence probability O-02 from the mathematical formulas presented at random similarly to the split at the node N1, and apply the nodes N4, N5, N6 while applying them. , N7, and by repeating this process, the total number of nodes N increases.
  • FIG. 5A visually shows an example in which the number of nodes gradually increases after the arrangement of the node N1, and an example in which the characteristics of the object parameter OP existing in the node N change due to repeated division.
  • FIG. As shown in the figure, in the process of increasing the nodes N1... K (k is a natural number), the number of nodes N increases explosively because division is frequently performed in the initial stage of increasing the number of nodes. Since the number of mathematical formula groups of the object parameter OP distributed to the division space is set to a fixed number, the object parameter OP starts to be exchanged between the nodes N1... Nk, and the execution coefficient N-05 decreases at each division.
  • the number of divisions also decreases, and when a certain division is completed, the number of nodes N1... Nk tends to be stable, and the characteristics of the object included in the node N according to the location of the node N during the division process.
  • the node N having different characteristics is present on the input side and the output side, respectively.
  • FIG. 5 (b) represents that the stable nodes N1... K are actually connected to the input side / output side by synapses to form a neural network based on the diagram of FIG. 5 (a).
  • FIG. In the neural network that has been formed, the signal calculation unit 12c receives nodes N1... K from the input side when the nodes N are connected to the input side and the output side by synapses as shown in FIG. An input signal ins is sent. Then, the signal propagates between the nodes N1... K, and the signal output from the output node N1... K is output as the output signal outs for the operation of the operation unit 13.
  • the fitness of the output signal outs at this time is calculated (ST5), and it is determined whether or not the calculation result is an expected result (ST6). Note that the fitness data that is used as a determination material may be included in the initial setting es, or may be stored in the signal calculation unit 12c in advance.
  • a superior one is selected from the nodes N1... K (ST7), and the setting of the selected node Nk is rewritten as necessary to cause a virtual mutation (STEP).
  • ST8 By performing crossover again (ST9), new division is performed, and the processes after ST3 are repeated until the expected characteristics are obtained.
  • the data used for mutation is included in the initial setting es or the signal calculation unit 12c as well as the fitness determination data.
  • the obtained signal is output (ST10), the process is terminated, and the neural network is completed.
  • the garbage collection execution unit 1 is a robot that collects garbage such as waste paper and empty cans in a place such as a plaza
  • the CCD camera 11a provided as a sensor unit is an image in an operating environment.
  • the operation unit 13 moves to the place where the foreign matter has fallen based on the video data of the CCD camera 11a, and when the dust collection unit 14 serving as the evaluation unit recognizes the foreign matter by the sensor, it is collected as dust.
  • the evaluation unit 2 transmits the initial setting es including the execution unit parameter RP, the node parameter NP, and the object parameter OP to the execution unit 1 in the individual definition module 23 to the communication unit 15 of the execution unit 1 through the communication unit 21. Then, the communication unit 15 transfers the initial setting es to the signal calculation unit 12c and simultaneously transmits a start command to the sensor unit 11.
  • the sensor unit 11 captures the operating environment with a CCD camera to collect dust, and when detecting the presence of foreign matter (dust), transmits it as input data in to the input data receiving unit 12a.
  • the input data receiving unit 12a The received input data in is transmitted to the input data signal converter 12b.
  • the input data signal conversion unit 12b converts the received input data in into an input data signal ins for a neural network and transmits it to the signal calculation unit 12c.
  • the signal calculation unit 12c starts adjusting the number of nodes after arranging the node N, and creates a neural network.
  • the signal calculation unit 12c inputs the input data signal ins to the completed neural network. If the input data signal ins is transmitted from the data signal conversion unit before the neural network is created in the signal calculation unit 12c, the signal calculation unit 12c holds the input data signal ins as it is, and the neural network After completion, input of the input data signal ins to the neural network is started.
  • the signal calculation unit 12c transfers the output data signal outs to the output data signal conversion unit 12d.
  • the output data signal outs When the output data signal outs is converted into operation output data out by the output data signal conversion unit 12d, the output data out is transmitted to the operation unit 13 through the output data transmission unit 12e, and the operation unit 13 is converted to the output data out. Based on this, move to the specified position.
  • the dust collection unit 14 detects a foreign object with the sensor unit 14a, collects the dust with the operation unit 14b if there is a foreign object, and communicates evaluation information e indicating that the collection of the dust is successful.
  • the data is transmitted to the evaluation unit 2 through the unit 15.
  • the evaluation information e indicating that the collection of the dust has failed is transmitted to the evaluation unit 2.
  • the individual evaluation module 24 creates a score evaluation s composed of the unique data of the garbage collection execution unit 1 and the robot collection result from the received evaluation information e, and transmits the creation result of the score evaluation s to the execution management module 25.
  • the management module 25 starts a command to write to the database and writes the score evaluation s to the database.
  • the execution unit 1 repeatedly searches and collects garbage during an arbitrary set time, and the result is transmitted to the evaluation unit 2 each time, and the evaluation unit 2 accumulates the evaluation data of the execution unit 1.
  • the score evaluation s of the garbage collection status in the execution unit 1 is summarized and stored in the database 22 as the evaluation of the node N1 in the execution unit 1.
  • the evaluation unit 2 If the evaluation unit 2 needs to perform the evaluation again, the evaluation unit 2 transmits the initial setting es to the execution unit 1 to repeat the dust collection and the evaluation again.
  • the evaluation unit 2 compares the score data of the execution unit 1 with any number or number of units, and derives the parameter of the node N1 in the execution unit 1 with the highest result as the optimum parameter.
  • the neural network can be realized on software.

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Physiology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

 ニューラルネットワークに遺伝的アルゴリズムを採用することにより、従来よりも効率的な課題解決のための最適手法の探索を可能とする最適手法探索方法及び最適手法探索システムである。本発明は、遺伝的アルゴリズムを採用したニューラルネットワークを利用し最適手法を探索し、当該手法にて動作の実施を行う実行部1と、当該実行部に対して送信する初期設定を作成するとともに、実行部の動作終了後に動作内容を評価し、複数回実行部1に動作を実施させることにより、当該複数の導き出された動作結果の中から、最も効率的な動作を行った実行部1に対して送信した初期設定を最適手法として導き出す評価部2とを備えている。これにより、[0024]、[0025]にあるようにニューラルネットワークを利用しながらも小規模かつ効率的な最適手法の探索が可能になる。

Description

最適手法探索方法及び最適手法探索システム
 本発明は、ニューラルネットワークに細胞分化アルゴリズムを適応させることにより、課題を解決するための最適な手法を効率的に導き出す最適手法探索方法及び最適手法探索システムに関するものである。
 ニューラルネットワークをシステムに組み込む上での利点は、ニューラルネットワークにおいてネットワークを形成したノードが学習を繰り返すことにより、課題を解決するための最適な手法を導き出すことである。
 ニューラルネットワークの学習には、技術内容に限定がないため、今後も様々な分野への利用が期待できる。
 特に、ニューラルネットワークに遺伝的アルゴリズムを採用したシステムは、特許文献1や特許文献2のように、画像処理からロボット制御に至るまで、最適手法を選択するにあたって精度の高い結果を導き出す技術として多岐の方向にわたって利用されている。
特開平9-006881号公報 特開2003-317073号公報
 しかしながら、一般的に、ニューラルネットワークに遺伝的アルゴリズムを採用する手法は、表現型及び遺伝子型を区別することなく探索を行うため、探索効率が悪い上に、ノード数が増加する仕組みは更なる探索時間を費やすことにつながる。
 長時間かつ相当数の探索は、システムの規模をも大きくすることとなり、遺伝的アルゴリズムを採用する場合には、コスト、設置場所の面で大規模な企業や研究所などしか携わることができないものである。
 よって、比較的小規模な工場や開発現場などのシステムにおいてニューラルネットワークを実現することは困難であった。
 ここにおいて、本発明の解決すべき主要な目的は、次のとおりである。
 即ち、本発明の第1の目的は、細胞分化の仕組みをアルゴリズムとし、事前に一定程度の学習を済ませておくことにより、探索効率を向上し最適手法を導き出す、最適手法探索方法及び最適手法探索システムを提供することにある。
また、本発明の第2の目的は、探索処理を簡略化することにより、遺伝的アルゴリズムを適応したニューラルネットワークをソフトウェアとして組込み可能とする、最適手法探索方法及び最適手法探索システムを提供することにある。
 本発明方法は、上記課題の解決に当たり、任意の環境下において、環境状態をデータとして認識し、予め設定・生成されたニューラルネットワーク内に当該データを適応させることによって前記環境状態に応じた動作を行うとともに、当該動作を複数回実行処理することにより、当該複数回の処理の中から最も効率的に動作を行う設定を最適手法として導き出す、という特徴的手法を講じる。
 また、本発明システムは、上記課題の解決に当たり、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に前記動作を複数回実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出すという特徴的構成手段を講じる。
 さらに、具体的詳細に述べると、当該課題の解決では、本発明が次に列挙する上位概念から下位概念に亙る新規な特徴的構成手段を採用することにより、前記目的を達成するよう為される。
 即ち、本発明方法の第1の特徴は、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出す最適手法探索方法であって、前記評価部は、仮想の細胞(ノード)及び細胞分裂に必要とする分子(数式群)の組み合わせから初期設定を作成し、前記実行部に当該初期設定を送信する個体定義手順と、当該実行部は前記初期設定に基づいて内部に仮想の細胞分裂空間を作成した後、当該初期設定に含まれる前記ノードを配置し、前記関数に基づいて計算処理を実行することによりノードを分裂させてニューラルネットワークを生成するとともに、当該ニューラルネットワークが生成された後、当該実行部が具備するセンサーが検知した入力データを、当該ニューラルネットワークに入力することにより出力データを導き出し、当該出力データに基づいて当該実行部が具備する動作部を動作させ、当該動作結果を前記評価部に送信する実行部動作手順と、前記評価部は、受信した前記動作結果を元に、前記実行部の個体評価を作成すると個体評価手順と、を複数回順次実行することにより、前記個体評価の中から最も効率的な動作を導き出してなる最適手法探索方法の構成採用にある。
 本発明方法の第2の特徴は、本発明方法の第1の特徴における前記評価部が、ニューラルネットワーク作成のための座標データ及び、前記実行部の評価基準及び、前記ノード及び、前記数式群の値をパラメータとしてデータベースに保持し、前記実行部を動作させる際、前記データベースから前記パラメータを選択したものを初期設定として作成し、当該実行部に送信するとともに、前記初期設定に基づいて動作を行った前記実行部の動作結果を受信し、当該ロボットの個体評価として評価を作成し、前記データベースに蓄積することにより、前記データベースに蓄積された情報の中から最も効率的な動作を行う初期設定の組み合わせを探索してなる最適手法探索方法の構成採用にある。
 本発明方法の第3の特徴は、本発明方法の第1又は第2の特徴における前記前記実行部が、内部に前記実行部の動作状態を検知する評価ユニットにより、検知結果を前記評価部に送信してなる最適手法探索方法の構成採用にある。
 本発明方法の第4の特徴は、本発明方法の第1又は第2の特徴における前記前記実行部が、前記評価部から受け取った前記初期設定に基づいて前記ニューラルネットワークを構成する一方で、前記実行部が具備するセンサー部にて前記環境の状態を入力データとして検知し、前記ニューラルネットワークが構成されると、前記入力データを当該ニューラルネットワークに入力することにより出力データを導き出し、前記実行部が具備する動作部に対し、前記出力データを送信することにより動作を行ってなる最適手法探索方法の構成採用にある。
 本発明方法の第5の特徴は、本発明方法の第1、2又は第3の特徴における前記ノードが、当該ノードの特性を区別するパラメータとして、当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持するとともに、前記数式群は、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる最適手法探索方法の構成採用にある。
 本発明システムの第1の特徴は、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記実行部に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を探索する最適手法探索システムであって、前記実行部は、内部に仮想の細胞分裂区間を具備し、前記評価部が設定した仮想の細胞となるノード及び細胞分裂に必要な仮想の分子にあたる数式に基づいて、当該細胞分裂区間においてノード数の調整を行うとともに、当該実行部が具備するセンサーが検知した結果を、入力データとして当該ノードに伝播させて前記動作に必要な信号を導き出し、当該実行部にて動作出力するニューラルネットワークを構成してなる最適手法検索システムの構成採用にある。
 本発明システムの第2の特徴は、本発明方法の第1の特徴における前記実行部が、前記環境の状態を検知するセンサー部と、前記ニューラルネットワークを構成する探索部と、前記探索部により出力されたデータを元に前記動作を実行する動作部と、前記実行部の動作が成功又は失敗であるかを検知し動作評価として検出する評価ユニットと、前記評価部と、前記評価ユニットにおける前記動作評価及び前記初期設定を相互通信する通信ユニットと、を具備してなる最適手法探索システムの構成採用にある。
 本発明システムの第3の特徴は、本発明方法の第1又は第2の特徴における前記評価部が、前記実行部に対し送信する前記ノード及び関数のパラメータ及び前記実行部の評価を蓄積するデータベースと、前記データベースから前記ノード及び関数のパラメータの値を抽出し、前記実行部に送信する前記ノード及び関数の初期設定を作成する個体定義モジュールと、前記実行部より受信した前記動作評価と当該実行部に対し送信した初期設定とから当該実行部の個体評価を作成し、データベースに書込み保存する個体評価モジュールと、前記個体定義モジュール及び前記個体評価モジュール並びに前記実行部に対して、各動作の実行を指示する実行管理モジュールと、前記実行部との通信を行う通信ユニットと、を具備してなる最適手法探索システムの構成採用にある。
 本発明システムの第4の特徴は、本発明方法の第1、2又は第3の特徴における前記ノードが、当該ノードの特性を区別するパラメータとして、当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持してなる最適手法探索システムの構成採用にある。
 本発明システムの第5の特徴は、本発明方法の第1、2又は第3の特徴における前記数式群が、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、ことを特徴とする請求項6、7又は8に記載の最適手法システム。
本発明によれば、細胞分化の仕組みを細胞分化アルゴリズムとしてニューラルネットワークに適応することにより、従来の遺伝的アルゴリズムを利用する場合に区別していない表現型及び遺伝子型を区別化することができ、課題解決のための最適手法の検出に無駄であると判断される処理を省略することで、効率的な最適手法が探索可能になる。
 また、無駄な処理を大幅に省略することにより、小規模なシステムへニューラルネットワークを組込むことができるようになり、リアルタイムでの最適手法の検索が可能になる。
本発明のシステム例に係るシステム構成図である。 本発明のシステム例に係る検出部12の機能構成図である。 本発明の遺伝的アルゴリズム例におけるパラメータの概要図である。 本発明の遺伝的アルゴリズム例を示すフローチャートである。 (a)は、ノードの増加状態を示す図であり、(b)はニューラルネットワークにおける要部構成を示した図である。 本発明の実施形態例を示すシステム構成図である。
α、α1…最適手法探索システム
1…実行部
11、14a…センサー部
11a…CCDカメラ
12…検出部
12a…入力データ受信部
12b…入力データ信号変換部
12c…信号算出部
12d…出力データ信号変換部
12e…出力データ送信部
13、14b…動作部
14…評価ユニット
15、21…通信ユニット
2…評価部
22…データベース
23…個体定義モジュール
24…個体評価モジュール
25…実行管理モジュール
in…入力データ
ins…入力データ信号
out…出力データ
outs…出力データ信号
e…評価情報
es…初期設定
s…スコア評価
RP…実行部パラメータ
R-01…座標データ
R-02…スコア
R-03…コード
NP…ノードパラメータ
N-01…座標
N-02…シナプス結合強度
N-03…シナプス結合先
N-04…ノード電位
N-05…オブジェクト実行係数
OP…オブジェクトパラメータ
O-01…演算発生確率
O-02…機能発生確率
N1…k…ノード
 以下、本発明のシステム構成例及び本システム構成におけるアルゴリズム並びに、実施形態例を、添付図面を参照し説明する。
(システム構成例)
 図1は、本発明に係るシステム構成図である。同図に示すように、最適手法探索システムαは、センサーにより動作環境を感知し、ニューラルネットワークによって最適な動作を実施する実行部1と、実行部1に対する基本設定を行うとともに、実行部1の動作結果を評価する評価部2にて構成される。
 実行部1は、動作環境及び実行部1の動作状況を検知し、当該状況を入力データinとしてデータ化するセンサー部11及び、センサー部11にて認識した入力データinに基づいて動作に必要な出力データoutを導き出す検出部12及び、検出部12から受信した出力データoutをもとに動作を実行する動作部13及び、実行部1について動作を評価する評価ユニット14及び、評価ユニット14の評価データやセンサー部11による動作部13の動作状況を評価部2に送信する通信ユニット15にて構成される。
 センサー部11は、自然現象や機械により発生する、電気、磁気、熱、音、光等の変化となる環境状態を感知するセンサーを有するものとし、そのセンサーの種類は、実行部1の動作内容によって適宜変更可能である。例えば、一定空間の状態変化を視覚的に検知したい場合にはCCDカメラや、ハイパースペクトルセンサー等の画像センサーを利用してもよい。
 実行部1の検出部12については図2にその詳細な構成内容を示す。
検出部12は、上述のようにセンサー部11が認識した環境状態から、与えられた目的のために動作部13が動作すべき動作データを導き出す処理部であり、センサー部11から入力された入力データinを受信する入力データ受信部12a及び、入力データ受信部12aから入力データinを入力データ信号insに変換する入力データ信号変換部12b及び、ニューラルネットワークが組み込まれ、入力データ信号変換部12bから受け取った入力データ信号insに基づいて動作部13の動作に必要な出力データ信号outsを算出する信号算出部12c及び、出力データ信号outsを信号算出部12cから受取り動作部13用に適用可能な出力データoutに変換する出力データ信号変換部12d及び、出力データoutを動作部13に送信する出力データ送信部12dにて構成される。
 なお、入力データ信号insに基づいて信号算出部12cが出力データ信号outsを導き出すために、ニューラルネットワークを信号算出部12c内で採用しているが、このニューラルネットワークのアルゴリズムについては、別途詳細に説明することとする。
動作部13は、センサー部11と同様に、実行部1の動作内容に応じて適宜必要な動作装置、機器を設備可能としその種類に限定はない。例えば、実行部1の移動を目的とするのであれば駆動用モーターを利用し、実行部1に設置されたアームが稼動する場合や実行部1本体の上昇下降を目的とする場合には、各動作に応じたアクチュエーターを利用するとよい。
 評価ユニット14は、実行部1の評価に利用する実行部1の可動状況を検知するためのセンサー部14aを具備するとともに、評価ユニット単体での動作部14bをも備え、動作部14bの結果を実行部1の評価に使用する。なお、以下の例に示すように、動作部14bは必ずしも具備させる必要はない。
一つの例として、実行部1がある特定の物質を回収、選択することを動作目的とする場合には、動作部13にて、実行部1が目標とする物質まで移動したことにより、評価ユニット14が目的とする物質の回収を試み、回収が成功(又は失敗)すれば実行部1の目的とした動作が成功(又は失敗)したという評価結果を評価情報eとする信号にして通信ユニット15を介して評価部2に送信する。
 別の例としては、実行部1が、散水や可視光、放射線等の照射や送風などを行うことを目的とした場合、センサー部14aが予め湿度や温度など環境状態を調べておき、動作部13が所定の位置まで移動した後、センサー部14aにて状態の変化を検知し、実行した動作の結果(成功/失敗)を評価情報eとして評価部2に送信する。
上記の例において、実行部1の実行結果を、環境状態の検知により判断できる場合には、評価部14の構成内容はセンサー部14aのみでもよいが、評価ユニット14が状態検知のみに限らず、回収作業を行う場合やセンサー部14aを移動させて状態検知する必要がある場合には、動作部14bをさらに構成させるものとする。
 実行部1の通信ユニット15及び評価部2にある通信ユニット21は、相互に通信を行うためのユニットであり、実行部1における作業の評価情報eは通信ユニット15を通して通信ユニット21に送信され、通信ユニット21は個体評価モジュール22に対して評価情報eを送ることによって、評価部2にて実行部1個体の評価が行われる。
 次に、評価部2について説明する。評価部2は、実行部1の動作前に、実行部1に対してニューラルネットワークの初期設定を行うとともに、実行部1の任意の動作時間を一区切りとして、動作後の実行部1の動作内容について評価ユニット14が評価した評価情報eを実行部1の1個体評価として保持し、複数回の動作又は複数台の実行部1のそれぞれの評価情報eを管理することにより、最も有効な動作を実行する初期設定を、最適手法として導き出す処理部である。
 評価部2は、実行部1に対して、初期設定esを送信するとともに、評価ユニット14による実行部1の動作評価を受信する通信ユニット21と、ノードNのパラメータの組み合わせ群及び実行部1の評価情報e及び個体情報eoを保持するデータベース22と、実行部1に対してデータベース22から初期設定esを送信する個体定義モジュール23と、実行部1から送信された実行部1の評価情報eに基づいて実行部1の評価をし、評価結果をスコア化したスコア評価sをデータベース22に書き込み保存する個体評価モジュール24及び、個体定義モジュール23や個体評価モジュール24及び実行部1に対して動作の実行命令を送信する実行管理モジュール25にて構成される。
 以上、本発明システムにおける各処理部について説明したが、本発明システムにおいては、実行部1内部に評価部2を付属させるなど、全てを同一装置内に構成してもよいが、評価部2をパーソナルコンピュータ内部に構成し、当該パーソナルコンピュータと実行部1とを有線又は無線にて接続してデータのやり取りを行ってもよい。
 さらに、評価部2に対し実行部1を複数台接続し、一度に複数台の実行部1からの評価情報eが得られれば、最適手法の探索をより効率的に導き出すことができる。
(細胞分化アルゴリズム)
 次に、最適手法を探索するために、信号算出部12内で実施されるニューラルネットワークにおいて採用される細胞分化アルゴリズムについて説明する。
なお、本発明は、非特許文献1に記載される細胞分化の仕組みに記載されるように、細胞分裂の過程において、細胞分化が進むにつれ、細胞や分子の状態が変化していく現象をシステム化することを目的としている。
細胞分化についての具体的な用語や分化の状態については、非特許文献1に基づくものであるため、これらの文献に示される細胞分化の仕組みについての詳細説明は割愛することとする。
生命とは何か―複雑系生命論序説、東京大学出版会、金子邦男、2003年
はじめに、上記文献に記載される細胞分化の仕組みをシステム化する上で、細胞分化に必要な各要素をどのようにシステムに適応させるかについて説明する。
 細胞分化アルゴリズムにおいて、本発明では、細胞分裂空間(培地)RP及びノード(細胞)NP並びに分子OPの3つの要素を利用して細胞分化を信号算出部2にて仮想的に実施する。各要素は、それぞれの特徴を示すパラメータとして数値や数式からなるデータ群を保持し、各要素中の各データが相互に計算を行うことにより分裂を実施する。
非特許文献1にあるように、細胞分化の過程において、細胞の数が分裂によって増加していくと、細胞内の分子の状態に変化が見られるようになる。本発明では、この細胞内の分子の状態が変化する特性を利用し、入力側と出力側を設けた仮想細胞分裂空間にて細胞分裂を実施後、初期値寄りのノードNを入力側に、細胞分化後パラメータが変動したノードNを出力側に接続し、信号を分裂した入力側からノード群に伝播させることにより、出力側が受け取った信号が、入力信号に対して最適な結果を導き出すものである技術を採用している。
 以下、図3のパラメータの概念及び、図4のフローチャートに基づき、信号算出部12cにて実施される細胞分化アルゴリズムを適応したニューラルネットワークの処理手順を説明する。
 図3は、個体定義モジュール23内に保持される実行部1に振り当てる実行部パラメータRP及び、ノードNの初期値として設定されるノードパラメータNP及び、ノードNの分裂に利用される数式群からなるオブジェクトパラメータOPの内容を示している。
 まず、実行部パラメータRPは、仮想の細胞分裂空間を作成するためのパラメータであって、細胞分化アルゴリズムの実施毎に、実行部1に初期値として設定される。
 実行部パラメータRPの構成要素としては、細胞分裂空間に必要となる座標情報を数値で示す座標データR-01及び、細胞分化した実行部1の評価スコアR-02、実行部1毎に割り振られるノードNについて細胞の遺伝コードに値するものであるコードR-03からなる。なお、スコアR-02は実行部1が実施しようとする作業において、作業の効率度を評価として数値化するための値であり、評価ユニット14から受信する。
 一方、ノードパラメータNPは、座標データR-01中に配置される最初のノードとなるノードNの座標を示すノード座標N-01、ノードNのシナプスの結合度を示すシナプス結合強度N-02、シナプスの接続先であるノードNを示すシナプス接続先N-03、接続先ノードNの保有する電位を示すノード電位N-04、ノードNにおけるオブジェクトの数量を示すオブジェクト実行頻度N-05からなる。なお、これらのパラメータは数値で表現される。
また、ノード電位N-04は、細胞分裂時には利用されず、ノードNが他のノードに信号を伝達する契機となる閾値を示すものである。ここで、ノード電位N-04は、他のノードから伝達された値を総和していくこととする。
さらに、オブジェクト実行頻度N-05は、ノードN内に存在するオブジェクトO(分子)の数量を示し、分裂の度にノードN内のオブジェクトの数量が半減するよう設定する。
次に、オブジェクトパラメータOPについて説明する。オブジェクトOは細胞分裂における分子にあたり、分子の量は生物学上においても相当数の種類が存在するため、実際の細胞分裂状態により近づけるために、初期設定段階で様々な種類のオブジェクトO1…k(kは自然数)と、それぞれに対するオブジェクトパラメータOP1…kとを定義しておく必要がある。
オブジェクトパラメータOPの構成要素は、オブジェクト同士の反応係数を示す演算発生確率O-01と、ノードパラメータNPの各項目の値を変動させる機能発生確率O-02からなり、それぞれ数式で表現される。
 演算発生確率O-01は、オブジェクトO1においては、他に設定した総てのオブジェクトO2~オブジェクトOk(kは自然数)のそれぞれの反応係数とその反応によって生成される新たなオブジェクトOk+1を設定することとし、これを総てのオブジェクトOにおいて設定する。
 機能発生確率O-02は、オブジェクトOにどのような機能を持たせるかによって、設定する値を適宜変更可能とする。例えば、シナプスの結合強度N-02やノード電位N-04の設定値を変化させる数式を設定したり等、機能発生確率O-02に初期値を設定する時点で必要な数式を設定する。
 以上の値を個体定義モジュール23が信号算出部12cに初期値として設定すると、信号算出部12c内部で仮想の細胞分裂が実行される。
 次に、図4のフローチャートを利用して、信号算出部12cにて細胞分化アルゴリズムが実施される手順を示す。
 まず、個体定義モジュールは、実行部パラメータRP及びノードパラメータNP及びオブジェクトパラメータOPの初期値を設定し、信号算出部12cにこれらのパラメータを送信する(ST1)。
 このとき設定される各パラメータは、データベース22内に保持されて、個体定義モジュールによりランダムまたは任意の規則性をもって設定されてもよく、または、必要に応じて書き換えることもできるものとする。
 なお、ノードパラメータNPは実行部1毎に設定するが、実行部1の動作を同一条件下で比較評価するため、オブジェクトパラメータOPについては評価に利用する複数の実行部1に同一のパラメータを設定する。
 信号算出部12cは、個体定義モジュール23より受け取った初期設定esに基づいて、仮想の細胞分裂空間を生成し、細胞分化アルゴリズムを適応したニューラルネットワークを構成する(ST2)。
次に、信号算出部12cは、ノードパラメータNPからニューラルネットワーク内にノードNを配置し、個体の定義を行った後(ST3)、オブジェクトOをランダムに存在させ、オブジェクトOの配置数が一定数に達したならば分裂を開始することとする(ST4)。
 ノードN1は、実行係数N-05に基づいて、オブジェクトパラメータOP内の数式群から演算発生確率O-01又は機能発生確率O-02を選択し、ノードパラメータNの値を当てはめることにより、仮想的な細胞分裂が実施され、ノードN1はノードN2、N3に分裂を続けていく。
 このとき、ノードN2、N3のノードパラメータNPはノードN1とほぼ同一であるが、実行係数N-05のみは、係数の値を半減することとする。
 さらに、ノードN2、N3は、ノードN1における分裂時と同様に、ランダムに提示される数式群から演算発生確率O-01又は機能発生確率O-02を選択し、当てはめながらノードN4、N5、N6、N7に分裂し、この工程を繰り返すことによりノードNの総数は増加していく。
図5(a)は、ノードN1の配置後、徐々にノード数が増加する様子と、分裂を繰り返すことによりノードN内に存在するオブジェクトパラメータOPの特性が変化している例を可視的に表現した図である。同図に示すように、ノードN1…k(kは自然数)が増加する過程において、ノード数増加の初期段階では分裂が頻繁に行われるためノードNの数は爆発的に増えていくが、細胞分裂空間に配給されるオブジェクトパラメータOPの数式群の個数は一定数に設定しているため、ノードN1…Nk間それぞれでオブジェクトパラメータOPの取り合いが始まり、分裂の度に実行係数N-05が低下するとともに、分裂回数も減少していき、ある一定の分裂を終えるとノードN1…Nkの個数は安定傾向になり、分裂の過程で、ノードNの存在位置に応じてノードNが含むオブジェクトの特性の異なるという特徴が現れはじめ、特質の異なったノードNがそれぞれ入力側と出力側に存在することとなる。
 図5(b)は、図5(a)の図を元に、安定したノードN1…kが実際にシナプスによって入力側/出力側にそれぞれ接続され、ニューラルネットワークを形成していることを表現した図である。信号算出部12cは、形成されだしたニューラルネットワークにおいて、図5(b)のように、入力側と出力側にそれぞれノードNがシナプスによって接続されたことを契機に、入力側からノードN1…kに対して入力信号insを送る。すると、ノードN1…k間を信号が伝播し、出力側のノードN1…kから出力された信号が、動作部13の動作のための出力信号outsとして出力される。このときの出力信号outsの適応度を計算し(ST5)、計算結果が期待した結果であるか否かを判断する(ST6)。なお、判断材料となる適応度のデータについては、初期設定esに含めてもよく、又は予め信号算出部12cに保持させておいてもよい。
期待する結果が得られない場合には、ノードN1…kの中から優位なものを選択し(ST7)、必要に応じて仮想的な突然変異を起こすために選択したノードNkの設定を書き換え(ST8)、再度交叉させる(ST9)ことで新たな分裂を行い、期待する特性が得られるまでST3以降のプロセスを繰り返す。突然変異に利用されるデータについても適応度の判断データと同様、初期設定es又は信号算出部12cに含めておく。
 ST6にて、期待する特性が得られれば、得られた信号を出力し(ST10)、プロセスを終了させ、ニューラルネットワークが完成される。以上が、細胞分化の仕組みを採用した本発明のアルゴリズムの概要である。
(実施形態例)
 次に、実施形態例について図6の構成図を利用して説明する。なお、本実施形態例においては、具体例として本発明システムを利用したゴミ収集ロボットを例示するが、本発明システムの利用例はこれに限定されるものではない。
 本実施形態例では、ゴミ回収実行部1が、広場のような場所で、紙くずや空き缶などのゴミを回収するロボットであるとして想定し、センサー部として具備したCCDカメラ11aが動作環境下における映像を撮影し、CCDカメラ11aの映像データに基づいて、異物が落ちているところまで動作部13が移動し、評価ユニットとなるゴミ回収ユニット14が、センサーにより異物を認識すると、ゴミとして回収することを目的としたシステムとする。
 まず、評価部2は、個体定義モジュール23内において実行部1に対して実行部パラメータRP、ノードパラメータNP、オブジェクトパラメータOPからなる初期設定esを通信ユニット21を通じて実行部1の通信ユニット15に送信し、通信ユニット15は、初期設定esを信号算出部12cに受け渡すと同時に、開始命令をセンサー部11に送信する。
 センサー部11は、ゴミ回収のため、動作環境をCCDカメラにて撮影し、異物(ゴミ)の存在を検知すると、入力データinとして入力データ受信部12aへ送信し、入力データ受信部12aは、受信した入力データinを入力データ信号変換部12bへ送信する。
 入力データ信号変換部12bは、受信した入力データinをニューラルネットワーク用の入力データ信号insに変換し、信号算出部12cへ送信する。
 一方、信号算出部12cは、通信ユニット15から受け取った初期設定esに基づいて、ノードNの配置後、ノード数の調整を開始し、ニューラルネットワークを作成する。
 信号算出部12cは、ニューラルネットワークが完成すると、完成したニューラルネットワークに対し、入力データ信号insを入力する。なお、信号算出部12cにおいて、ニューラルネットワークが作成される前にデータ信号変換部から入力データ信号insが送信されれば、信号算出部12cは入力データ信号insをそのまま保持しておき、ニューラルネットワークが完成した後に入力データ信号insのニューラルネットワークへの入力を開始する。
 ニューラルネットワークにおけるノードN1…kの信号の伝播により、出力データ信号outsが出力されると、信号算出部12cは、出力データ信号outsを出力データ信号変換部12dに受け渡す。
 出力データ信号変換部12dで、出力データ信号outsが動作用の出力データoutに変換されると、出力データoutは出力データ送信部12eを通じて動作部13に送信され、動作部13は出力データoutに基づいて、指定の位置まで移動する。
 ゴミ回収ユニット14は、動作部13が動作を終了すると、センサー部14aで異物を検知し、異物があれば動作部14bにてゴミを回収し、ゴミの回収が成功である評価情報eを通信ユニット15を通じて評価部2へ送信する。センサー部14aが異物を検知できない場合には、ゴミの回収が失敗である評価情報eを評価部2へ送信する。
 個体評価モジュール24は、受け取った評価情報eを、ゴミ回収実行部1の固有データ及びロボット回収結果からなるスコア評価sを作成し、実行管理モジュール25にスコア評価sの作成結果を送信すると、実行管理モジュール25がデータベースへの書込み命令を開始し、スコア評価sをデータベースに書込む。
 実行部1は、設定された任意の時間中、ゴミの探索、回収を繰り返し、その都度結果が評価部2へ送信され、評価部2において実行部1の評価データを蓄積する。
 評価部2においては、任意の期間が終了すると、実行部1におけるごみ回収状況のスコア評価sを総括し実行部1におけるノードN1の評価としてデータベース22へ保管する。
 評価部2は、再度、評価を行う必要があれば、初期設定esを実行部1に送信することにより、改めてゴミ回収及びその評価を繰り返す。
 評価部2は任意の回数又は台数の実行部1のスコアデータを比較し、最も成果の高い実行部1におけるノードN1のパラメータを最適パラメータとして導き出す。
 以上、本発明の実施の形態につき、最適手法検索システムの実施例を説明したが、本発明は、必ずしも上述した手段にのみ限定されるものではなく、特許請求の範囲に記載の範囲内において、適宜、変更実施することが可能なものである。
 本発明による最適手法探索方法及び最適手法探索システムは、ニューラルネットワークをより効率的にリアルタイムで出力データを導き出すことができるため、ソフトウェア上においてもニューラルネットワークを実現することが可能となった。

Claims (10)

  1.  任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出す最適手法探索方法であって、
     前記評価部は、仮想の細胞(ノード)及び細胞分裂に必要とする分子(数式群)の組み合わせから初期設定を作成し、前記実行部に当該初期設定を送信する個体定義手順と、
     当該実行部は前記初期設定に基づいて内部に仮想の細胞分裂空間を作成した後、当該初期設定に含まれる前記ノードを配置し、前記関数に基づいて計算処理を実行することによりノードを分裂させてニューラルネットワークを生成するとともに、当該ニューラルネットワークが生成された後、当該実行部が具備するセンサーが検知した入力データを、当該ニューラルネットワークに入力することにより出力データを導き出し、当該出力データに基づいて当該実行部が具備する動作部を動作させ、当該動作結果を前記評価部に送信する実行部動作手順と、
     前記評価部は、受信した前記動作結果を元に、前記実行部の個体評価を作成すると個体評価手順と、
     を複数回順次実行することにより、前記個体評価の中から最も効率的な動作を導き出す、
     ことを特徴とする最適手法探索方法。 
  2.  前記評価部は、
     ニューラルネットワーク作成のための座標データ及び、前記実行部の評価基準及び、前記ノード及び、前記数式群の値をパラメータとしてデータベースに保持し、
     前記実行部を動作させる際、前記データベースから前記パラメータを選択したものを初期設定として作成し、当該実行部に送信するとともに、
     前記初期設定に基づいて動作を行った前記実行部の動作結果を受信し、当該ロボットの個体評価として評価を作成し、前記データベースに蓄積することにより、前記データベースに蓄積された情報の中から最も効率的な動作を行う初期設定の組み合わせを探索する、
     ことを特徴とする請求項1に記載の最適手法探索方法。
  3.  前記実行部は、
     内部に前記実行部の動作状態を検知する評価ユニットにより、
     検知結果を前記評価部に送信する、
     ことを特徴とする請求項1又は2に記載の最適手法探索方法。
  4.  前記実行部は、
    前記評価部から受け取った前記初期設定に基づいて前記ニューラルネットワークを構成する一方で、
    前記実行部が具備するセンサー部にて前記環境の状態を入力データとして検知し、
     前記ニューラルネットワークが構成されると、前記入力データを当該ニューラルネットワークに入力することにより出力データを導き出し、
     前記実行部が具備する動作部に対し、前記出力データを送信することにより動作を行う、
     ことを特徴とする請求項1又は2に記載の最適手法探索方法。
  5.  前記ノードは、
     当該ノードの特性を区別するパラメータとして、
     当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持するとともに、
     前記数式群は、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、
     ことを特徴とする請求項1、2又は3のいずれか1項に記載の最適手法検索方法。
  6.  任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記実行部に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を探索する最適手法探索システムであって、
     前記実行部は、内部に仮想の細胞分裂区間を具備し、前記評価部が設定した仮想の細胞となるノード及び細胞分裂に必要な仮想の分子にあたる数式に基づいて、当該細胞分裂区間においてノード数の調整を行うとともに、当該実行部が具備するセンサーが検知した結果を、入力データとして当該ノードに伝播させて前記動作に必要な信号を導き出し、当該実行部にて動作出力するニューラルネットワークを構成する、
    ことを特徴とする最適手法検索システム。
  7.  前記実行部は、
     前記環境の状態を検知するセンサー部と、
     前記ニューラルネットワークを構成する探索部と、
     前記探索部により出力されたデータを元に前記動作を実行する動作部と、
     前記実行部の動作が成功又は失敗であるかを検知し動作評価として検出する評価ユニットと、
     前記評価部と、前記評価ユニットにおける前記動作評価及び前記初期設定を相互通信する通信ユニットと、を具備する、
     ことを特徴とする請求項6に記載の最適手法検索システム。
  8.  前記評価部は、
     前記実行部に対し送信する前記ノード及び関数のパラメータ及び前記実行部の評価を蓄積するデータベースと、
     前記データベースから前記ノード及び関数のパラメータの値を抽出し、前記実行部に送信する前記ノード及び関数の初期設定を作成する個体定義モジュールと、
     前記実行部より受信した前記動作評価と当該実行部に対し送信した初期設定とから当該実行部の個体評価を作成し、データベースに書込み保存する個体評価モジュールと、
     前記個体定義モジュール及び前記個体評価モジュール並びに前記実行部に対して、各動作の実行を指示する実行管理モジュールと、
     前記実行部との通信を行う通信ユニットと、を具備する、
     ことを特徴とする請求項6又は7に記載の最適手法検索システム。
  9.  前記ノードは、
     当該ノードの特性を区別するパラメータとして、
     当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持する、
    ことを特徴とする請求項6、7又は8のいずれか1項に記載の最適手法検索システム
  10.  前記数式群は、
    パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、
     ことを特徴とする請求項6、7又は8のいずれか1項に記載の最適手法システム。
PCT/JP2009/069139 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム WO2011058621A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2010550980A JP4997429B2 (ja) 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム
EP09851255.1A EP2500847B1 (en) 2009-11-10 2009-11-10 Optimal technique search method and system
US13/508,908 US8838514B2 (en) 2009-11-10 2009-11-10 Optimal technique search method and system that creates a virtual cell division space to create/form a neural network
CN200980163282.4A CN102713944B (zh) 2009-11-10 2009-11-10 最优方法搜索方法以及最优方法搜索系统
PCT/JP2009/069139 WO2011058621A1 (ja) 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/069139 WO2011058621A1 (ja) 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム

Publications (1)

Publication Number Publication Date
WO2011058621A1 true WO2011058621A1 (ja) 2011-05-19

Family

ID=43991300

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/069139 WO2011058621A1 (ja) 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム

Country Status (5)

Country Link
US (1) US8838514B2 (ja)
EP (1) EP2500847B1 (ja)
JP (1) JP4997429B2 (ja)
CN (1) CN102713944B (ja)
WO (1) WO2011058621A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958455A (zh) * 2017-12-06 2018-04-24 百度在线网络技术(北京)有限公司 图像清晰度评估方法、装置、计算机设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8768873B2 (en) * 2011-05-03 2014-07-01 Space-Time Insight Space-time-node engine signal structure
JP2017162273A (ja) * 2016-03-10 2017-09-14 オムロン株式会社 センサネットワークにおける機器間連携装置、機器間連携方法、機器間連携プログラムおよびこれを格納した記録媒体

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096881A (ja) 1995-06-15 1997-01-10 Toyo Electric Mfg Co Ltd ニューラルネットワーク
JP2003317073A (ja) 2002-04-24 2003-11-07 Fuji Xerox Co Ltd ニューラルネットワーク処理装置
JP2004139606A (ja) * 1993-10-29 2004-05-13 Ricoh Co Ltd 自律システム及び自律型ロボット
JP2006323657A (ja) * 2005-05-19 2006-11-30 Mie Univ 概念型情報処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2040903C (en) * 1991-04-22 2003-10-07 John G. Sutherland Neural networks
US6470261B1 (en) * 1998-07-31 2002-10-22 Cet Technologies Pte Ltd Automatic freeway incident detection system and method using artificial neural network and genetic algorithms
US20040044633A1 (en) * 2002-08-29 2004-03-04 Chen Thomas W. System and method for solving an optimization problem using a neural-network-based genetic algorithm technique

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139606A (ja) * 1993-10-29 2004-05-13 Ricoh Co Ltd 自律システム及び自律型ロボット
JPH096881A (ja) 1995-06-15 1997-01-10 Toyo Electric Mfg Co Ltd ニューラルネットワーク
JP2003317073A (ja) 2002-04-24 2003-11-07 Fuji Xerox Co Ltd ニューラルネットワーク処理装置
JP2006323657A (ja) * 2005-05-19 2006-11-30 Mie Univ 概念型情報処理装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"What is life? - Introduction to complex systems biology", 2003, UNIVERSITY OF TOKYO PRESS
SUSUMU MARUNO: "Tekio Zoshoku Ryoshika Neuron (ASQA) ni yoru Moji Ninshiki", IEICE TECHNICAL REPORT, vol. 91, no. 302, 28 October 1991 (1991-10-28), pages 23 - 28 *
YOSHIAKI ICHIKAWA: "Identeki Algorithm to Men'eki System Ron GA no Mechatronis eno Oyo", MATHEMATICAL SCIENCES, vol. 30, no. 11, 1 November 1992 (1992-11-01), pages 32 - 37 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958455A (zh) * 2017-12-06 2018-04-24 百度在线网络技术(北京)有限公司 图像清晰度评估方法、装置、计算机设备及存储介质
CN107958455B (zh) * 2017-12-06 2019-09-20 百度在线网络技术(北京)有限公司 图像清晰度评估方法、装置、计算机设备及存储介质
US10922804B2 (en) 2017-12-06 2021-02-16 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for evaluating image definition, computer device and storage medium

Also Published As

Publication number Publication date
CN102713944B (zh) 2015-01-14
US8838514B2 (en) 2014-09-16
CN102713944A (zh) 2012-10-03
JP4997429B2 (ja) 2012-08-08
JPWO2011058621A1 (ja) 2013-03-28
US20120271783A1 (en) 2012-10-25
EP2500847A1 (en) 2012-09-19
EP2500847A4 (en) 2013-07-31
EP2500847B1 (en) 2018-04-18

Similar Documents

Publication Publication Date Title
Fei et al. CPS data streams analytics based on machine learning for Cloud and Fog Computing: A survey
CN109814556B (zh) 一种多机器人协作探索未知环境与地图构建的装置与方法
Xia et al. Closed-loop design evolution of engineering system using condition monitoring through internet of things and cloud computing
JP7060080B2 (ja) 組み合わせ制御システム、組み合わせ制御方法、および、組み合わせ制御プログラム
CN114595773B (zh) 基于工厂生产过程的多源异构孪生数据融合方法及系统
JP4997429B2 (ja) 最適手法探索方法及び最適手法探索システム
KR20180059335A (ko) 지식 증강을 위한 선순환 자가 학습 방법 및 그 장치
KR20230115970A (ko) 빅데이터 및 인공지능 기반의 제조 실행 시스템 및이의 운영방법
CN111291984A (zh) 多无人机分布式任务选择和轨迹设计方法及装置
Caiazzo et al. An IoT-based and cloud-assisted AI-driven monitoring platform for smart manufacturing: design architecture and experimental validation
Al-Salt A Comparsion between Genetic Algorithms and Sequential Quadratic Programming in Solving Constrained Optimization Problems
Qu et al. Comuptional reasoning and learning for smart manufacturing under realistic conditions
Zeng et al. A deep reinforcement learning approach to flexible job shop scheduling
Mahmood et al. Mining data generated by sensor networks: a survey
Liu et al. Survey of artificial immune system
Woo et al. Developing a big data analytics platform for increasing sustainability performance in machining operations
Sharif et al. Context Aware-Resource Optimality in Electric Vehicle Smart2Charge Application. A Deep Reinforcement Learning Base Approach
KR102191160B1 (ko) 로봇 데이터의 인공 지능형 데이터 모델링 시스템 및 그 모델링 방법
Zhang et al. A digital twin-driven flexible scheduling method in a human–machine collaborative workshop based on hierarchical reinforcement learning
Kumar et al. Optimal sub-path selection for maximum data gathering using mobile sink in wsn
Li et al. A new multi-objective genetic algorithm for assembly line balancing
Orouskhani et al. Integration of cat swarm optimization and Borda ranking method for solving dynamic multi-objective problems
Chen et al. Semantic Interaction Strategy of Multiagent System in Large-Scale Intelligent Sensor Network Environment
Scrimieri et al. A k-nearest neighbour technique for experience-based adaptation of assembly stations
Orides et al. A genetic fuzzy system for defining a reactive dispatching rule for AGVs

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980163282.4

Country of ref document: CN

ENP Entry into the national phase

Ref document number: 2010550980

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09851255

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2009851255

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13508908

Country of ref document: US