CN102713944B - 最优方法搜索方法以及最优方法搜索系统 - Google Patents
最优方法搜索方法以及最优方法搜索系统 Download PDFInfo
- Publication number
- CN102713944B CN102713944B CN200980163282.4A CN200980163282A CN102713944B CN 102713944 B CN102713944 B CN 102713944B CN 200980163282 A CN200980163282 A CN 200980163282A CN 102713944 B CN102713944 B CN 102713944B
- Authority
- CN
- China
- Prior art keywords
- mentioned
- enforcement division
- node
- action
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Physiology (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种最优方法搜索方法以及最优方法搜索系统,通过在神经网络中采用遗传算法,使得能够搜索比以往更有效率的用于解决问题的最优方法。本发明具备:执行部(1),其利用采用了遗传算法的神经网络来搜索最优方法,通过该方法来实施动作;以及评价部(2),其生成对该执行部发送的初始设定,并且在执行部的动作结束后对动作内容进行评价,通过使执行部(1)实施多次动作,来从多个导出的该动作结果中,将进行了最有效率的动作的对执行部(1)发送的初始设定作为最优方法而导出。由此,即使如[0024]、[0025]中所述那样利用神经网络,也能够小规模且有效率地搜索最优方法。
Description
技术领域
本发明涉及一种通过在神经网络中应用细胞分化算法来有效地导出用于解决问题的最优方法的最优方法搜索方法以及最优方法搜索系统。
背景技术
将神经网络组装到系统中的优点在于,通过在神经网络中形成网络的节点反复学习,来导出用于解决问题的最优方法。
在神经网络的学习方面,对技术内容没有限定,因此今后还能够期待使用到各种领域。
特别是,在神经网络中采用了遗传算法的系统如专利文献1、专利文献2那样,从图像处理乃至机器人控制,作为选择最优方法时导出高精度结果的技术而被用于多个方向。
专利文献1:日本特开平9-006881号公报
专利文献2:日本特开2003-317073号公报
发明内容
发明要解决的问题
然而,一般来说,在神经网络中采用遗传算法的方法不区分表现型以及基因型地进行搜索,因此导致搜索效率差,并且在节点数增加的结构中会耗费更多搜索时间。
长时间且相当数量的搜索会使系统的规模也变大,在采用遗传算法的情况下,从成本、设置地点的方面考虑,仅能够由大规模的企业、研究所等从事该搜索。
由此,在规模比较小的工厂、开发现场等的系统中难以实 现神经网络。
在这里,本发明要解决的主要目的如下。
即,本发明的第一目的在于提供一种最优方法搜索方法以及最优方法搜索系统,通过将细胞分化的结构设为算法并事先使其完成一定程度的学习来提高搜索效率并导出最优方法。
另外,本发明的第二目的在于提供一种最优方法搜索方法以及最优方法搜索系统,通过简化搜索处理使得能够将应用遗传算法的神经网络作为软件来进行组装。
用于解决问题的方案
本发明方法在解决上述问题时寻求如下一种方法,其特征在于,在任意的环境下,将环境状态识别为数据,通过使预先设定并生成的神经网络自适应于该数据来进行与上述环境状态相应的动作,并且,通过多次执行该动作的处理,来从多次的该处理中导出最有效率地进行动作的设定来作为最优方法。
另外,本发明系统在解决上述问题时寻求如下一种结构,其特征在于,具备:执行部,其进行了初始设定,使得在任意的环境下都使神经网络自适应来导出与上述环境相应的动作并执行该动作;以及评价部,其对该执行部提供上述初始设定,并且在上述动作结束后对该执行部的动作内容进行评价,其中,该评价部使上述动作主体执行多次上述动作,从多个导出的该动作结果中将进行最有效率的动作的执行部的初始设定作为最优方法而导出。
当进一步具体且详细地说明时,在解决该问题时,本发明通过采用下面列举的从上位概念到下位概念的新的特征性结构来达到上述目的。
即,本发明方法的第一特征在于,采用以下的最优方法搜索方法的结构:该最优方法搜索方法具备:执行部,其进行了 初始设定,使得在任意的环境下都使神经网络自适应于上述环境来导出与上述环境相应的动作并执行该动作;以及评价部,其对该执行部提供上述初始设定,并且在上述动作结束后对该执行部的动作内容进行评价,其中,该评价部使上述动作主体执行多次上述动作,将导出的多个动作的结果中执行部进行最有效率的动作的初始设定作为最优方法而导出,该最优方法搜索方法的特征在于,包括以下步骤:个体定义步骤,上述评价部根据虚拟的细胞(节点)和细胞分裂所需的分子(公式群)的组合来生成初始设定,将该初始设定发送给上述执行部;执行部动作步骤,该执行部如下这样生成神经网络,该执行部在基于上述初始设定创建出该神经网络内部的虚拟的细胞分裂空间后,配置该初始设定中所包含的上述节点,通过根据上述函数执行计算处理来使节点分裂以生成神经网络,并且在该神经网络生成后,通过将由该执行部所具备的传感器检测到的输入数据输入到该神经网络来导出输出数据,使该执行部所具备的动作部基于该输出数据进行动作,将该动作的结果发送给上述评价部;以及个体评价步骤,上述评价部基于接收到的上述动作的结果,生成上述执行部的个体评价,通过将上述步骤依次执行多次,来从上述个体评价中导出最有效率的动作。
本发明的第二特征在于,采用以下的最优方法搜索方法的结构:本发明方法的第一特征中的上述评价部将用于创建神经网络的坐标数据的值、上述执行部的评价基准的值、上述节点的值以及上述公式群的值作为参数保存到数据库,该评价部在使上述执行部动作时,将从上述数据库选择出的上述参数生成为初始设定,并发送给该执行部,并且,该评价部接收基于上述初始设定进行了动作的上述执行部的动作的结果,生成评价作为该机器人的个体评价并存储到上述数据库,由此从存储于 上述数据库的信息中搜索进行最有效率的动作的初始设定的组合。
本发明方法的第三特征在于,采用以下的最优方法搜索方法的结构:本发明方法的第一或第二特征中的上述执行部利用在内部检测上述执行部的动作状态的评价单元,将检测的结果发送给上述评价部。
本发明方法的第四特征在于,采用以下的最优方法搜索方法的结构:本发明方法的第一或第二特征中的上述执行部基于从上述评价部接收到的上述初始设定来构成上述神经网络,并且,上述执行部通过上述执行部所具备的传感器部检测上述环境的状态作为输入数据,当构成了上述神经网络时,上述执行部将上述输入数据输入到该神经网络,由此导出输出数据,对上述执行部所具备的动作部发送上述输出数据,由此上述执行部进行动作。
本发明方法的第五特征在于,采用以下的最优方法搜索方法的结构:在本发明方法的第一、第二或第三特征中,关于上述节点,作为区分该节点的特性的参数而保存配置该节点的坐标、连接该节点的多条连接线的连接强度、该节点的连接目的地、该节点的电位以及上述公式群在该节点中的利用率,并且,上述公式群的参数包括表示该公式群中的各个公式之间的计算规则的公式和表示上述节点的参数的变更度的公式。
本发明系统的第一特征在于,采用以下的最优方法搜索系统的结构:该最优方法搜索系统具备:执行部,其进行了初始设定,使得在任意的环境下都使神经网络自适应于上述环境来导出与上述环境相应的动作并执行该动作;以及评价部,其对该执行部提供上述初始设定,并且在上述动作结束后对该执行部的动作内容进行评价,其中,该评价部使上述执行部执行多 次上述动作,搜索导出的多个动作的结果中执行部进行最有效率的动作的初始设定,该最优方法搜索系统的特征在于,上述执行部构成神经网络,该神经网络在内部具备虚拟的细胞分裂区间,基于由上述评价部设定的作为虚拟细胞的节点以及相当于细胞分裂所需的虚拟分子的公式,在该细胞分裂区间内对节点数量进行调整,并且将由该执行部所具备的传感器检测出的结果作为输入数据,使该输入数据在节点中进行传播以导出上述动作所需的信号,并通过该执行部进行动作输出。
本发明系统的第二特征在于,采用以下的最优方法搜索系统的结构:本发明系统的第一特征中的上述执行部具备:传感器部,其检测上述环境的状态;搜索部,其构成上述神经网络;动作部,其基于由上述搜索部输出的数据来执行上述动作;评价单元,其检测上述执行部的动作是成功还是失败,将该动作是成功还是失败检测为动作评价;以及通信单元,其与上述评价部之间相互通信上述评价单元中的上述动作评价以及上述初始设定。
本发明系统的第三特征在于,采用以下的最优方法搜索系统的结构:本发明系统的第一或第二特征中的上述评价部具备:数据库,其存储对上述执行部发送的上述节点的参数、上述函数的参数以及对上述执行部的评价;个体定义模块,其从上述数据库提取上述节点的参数的值以及上述函数的参数的值,生成发送给上述执行部的上述节点的初始设定以及上述函数的初始设定;个体评价模块,其根据从上述执行部接收到的上述动作评价和对该执行部发送的初始设定来生成该执行部的个体评价,并写入到数据库进行保存;执行管理模块,其指示上述个体定义模块、上述个体评价模块以及上述执行部执行各动作;以及通信单元,其进行与上述执行部之间的通信。
本发明系统的第四特征在于,采用以下的最优方法搜索系统的结构:在本发明系统的第一、第二或第三特征中,关于上述节点,作为区分该节点的特性的参数而保存配置该节点的坐标、连接该节点的多条连接线的连接强度、该节点的连接目的地、该节点的电位以及上述公式群在该节点中的利用率。
本发明系统的第五特征在于,采用以下的最优方法搜索系统的结构:本发明系统的第一、第二或第三特征中的上述公式群的参数包括表示该公式群中的各个公式之间的计算规则的公式和表示上述节点的参数的变更度的公式。
发明的效果
根据本发明,通过将细胞分化的结构设为细胞分化算法而应用于神经网络,能够对以往利用遗传算法时不进行区分的表现型以及基因型进行区分,通过省略被判断为是对检测用于解决问题的最优方法无用的处理,能够有效率地搜索最优方法。
另外,通过大幅省略无用的处理,能够将神经网络组装到小规模系统,从而能够实时地搜索最优方法。
附图说明
图1是本发明的系统例所涉及的系统结构图。
图2是本发明的系统例所涉及的检测部12的功能结构图。
图3是本发明的遗传算法例中的参数的概要图。
图4是表示本发明的遗传算法例的流程图。
图5的(a)是表示节点的增加状态的图,图5的(b)是表示神经网络中的主要部分结构的图。
图6是表示本发明的实施方式例的系统结构图。
附图标记说明
α、α1:最优方法搜索系统;1:执行部;11、14a:传感器部;11a:CCD照相机;12:检测部;12a:输入数据接收部;12b:输入数据信号转换部;12c:信号计算部;12d:输出数据信号转换部;12e:输出数据发送部;13、14b:动作部;14:评价单元;15、21:通信单元;2:评价部;22:数据库;23:个体定义模块;24:个体评价模块;25:执行管理模块;in:输入数据;ins:输入数据信号;out:输出数据;outs:输出数据信号;e:评价信息;es:初始设定;s:分数评价;RP:执行部参数;R-01:坐标数据;R-02:分数;R-03:代码;NP:节点参数;N-01:坐标;N-02:突触连接强度;N-03:突触连接目的地;N-04:节点电位;N-05:对象执行频率;OP:对象参数;O-01:运算发生概率;O-02:功能发生概率;N 1…k:节点。
具体实施方式
下面,参照附图来说明本发明的系统结构例、本系统结构中的算法以及实施方式例。
(系统结构例)
图1是本发明所涉及的系统结构图。如该图所示,最优方法搜索系统α包括执行部1和评价部2,该执行部1通过传感器感知动作环境,通过神经网络实施最优动作,该评价部2对执行部1进行基本设定,并且对执行部1的动作结果进行评价。
执行部1包括:传感器部11,其检测动作环境以及执行部1的动作状况,将该状况数据化为输入数据in;检测部12,其根据通过传感器部11识别出的输入数据in来导出动作所需的输出数据out;动作部13,其基于从检测部12接收到的输出数据out来执行动作;评价单元14,其对执行部1的动作进行评价;以及通信单元15,其将评价单元14的评价数据、通过传感器部11获得的动作部13的动作状况发送到评价部2。
传感器部11具有用于感知通过自然现象、机械而产生的电、磁、热、声音、光等发生变化的环境状态的传感器,该传感器的种类能够根据执行部1的动作内容而适当变更。例如,在想要视觉检测固定空间的状态变化的情况下,也可以利用CCD照相机、超光谱传感器等图像传感器。
图2示出执行部1的检测部12的详细的结构内容。
检测部12是根据如上所述那样由传感器部11识别出的环境状态来导出动作部13要进行动作的动作数据以达到所赋予的目的的处理部,包括:输入数据接收部12a,其接收从传感器部11输入的输入数据in;输入数据信号转换部12b,其将来自输入数据接收部12a的输入数据in转换为输入数据信号ins;信号计算部12c,其组装有神经网络,根据从输入数据信号转换部12b接收到的输入数据信号ins来计算动作部13进行动作所需的输出数据信号outs;输出数据信号转换部12d,其从信号计算部12c接收输出数据信号outs并转换成能够应用于动作部13的输出数据out;以及输出数据发送部12e,其将输出数据out发送给动作部13。
此外,在信号计算部12c内采用了神经网络,以由信号计算部12c根据输入数据信号ins导出输出数据信号outs,关于该神经网络的算法,另外详细地进行说明。
动作部13与传感器部11同样地,能够根据执行部1的动作内容适当地配置所需的动作装置、设备,其种类没有限定。例如,如果以移动执行部1为目的则利用驱动用马达,在由设置于执行部1的机器手进行动作的情况下、以使执行部1主体上升下降为目的的情况下,只要利用与各动作相应的致动器即可。
评价单元14具备用于检测在执行部1的评价中使用的执行 部1的可动状况的传感器部14a,并且还具备评价单元组件中的动作部14b,将动作部14b的结果使用于执行部1的评价。此外,如下面的例所示,并不必须具备动作部14b。
作为一例,在执行部1以回收、选择某特定物质为动作目的的情况下,通过动作部13使执行部1移动到目标物质处,由此评价单元14尝试目的物质的回收,如果回收成功(或失败),将执行部1的目的动作成功(或失败)这样的评价结果转换为作为评价信息e的信号,经由通信单元15发送给评价部2。
作为其它例,在执行部1以进行洒水、照射可视光、放射线等、送风等为目的的情况下,传感器部14a预先调查湿度、温度等环境状态,在动作部13移动到规定的位置处后,通过传感器部14a来检测状态的变化,将执行动作后的动作的结果(成功/失败)作为评价信息e发送给评价部2。
在上述的例中,在能够通过检测环境状态来判断执行部1的执行结果的情况下,评价单元14的结构内容也可以仅为传感器部14a,但是在评价单元14并不限于仅检测状态还进行回收作业的情况下、需要使传感器部14a移动来检测状态的情况下,还要包括动作部14b。
执行部1的通信单元15以及位于评价部2的通信单元21是用于相互进行通信的单元,执行部1中的作业的评价信息e通过通信单元15发送给通信单元21,通信单元21对个体评价模块22发送评价信息e,由此在评价部2中对执行部1个体进行评价。
接着,对评价部2进行说明。评价部2是进行以下处理的处理部:在执行部1动作前,对执行部1进行神经网络的初始设定,并且,将执行部1的任意的动作时间作为一个分割,将动作后的评价单元14对执行部1的动作内容进行评价而得到的评价信息e作为执行部1的一个个体评价进行保存,对多次动作或多台执行 部1各自的评价信息e进行管理,由此导出最有效率的执行动作的初始设定作为最优方法。
评价部2包括:通信单元21,其对执行部1发送初始设定es,并且接收评价单元14对执行部1的动作评价;数据库22,其保存节点N的参数的组合群、执行部1的评价信息e以及个体信息eo;个体定义模块23,其将初始设定es从数据库22发送给执行部1;个体评价模块24,其根据从执行部1发送的执行部1的评价信息e来对执行部1进行评价,将对评价结果进行评分而得到的分数评价s写入到数据库22来进行保存;以及执行管理模块25,其对个体定义模块23、个体评价模块24以及执行部1发送动作的执行命令。
以上,说明了本发明系统中的各处理部,但在本发明系统中,也可以使评价部2附属在执行部1的内部等,将全体构成在同一装置内,还可以将评价部2构成在个人计算机内部,使该个人计算机与执行部1通过有线或无线连接来进行数据的交换。
并且,如果对评价部2连接多台执行部1并一次从多台执行部1获得评价信息e,则能够更有效率地导出最优方法的搜索。
(细胞分化算法)
接着,说明为了搜索最优方法而在信号计算部12内实施的神经网络中采用的细胞分化算法。
此外,本发明的目的在于,如非专利文献1中记载的细胞分化的结构所述的那样,将在细胞分裂的过程中细胞或分子的状态随着细胞分化的进行而变化的现象进行系统化。
细胞分化中的具体用语、分化的状态基于非专利文献1,因此省略对这些文献所示的细胞分化的结构的详细说明。
非专利文献1:生命とは何か—複雑系生命論序説、東京大学出版会、金子邦男、2003年
首先,说明在将上述文献中记载的细胞分化的结构进行系统化后,如何将细胞分化所需的各要素应用于系统。
在细胞分化算法中,在本发明中,使用细胞分裂空间(培养基)RP、节点(细胞)NP以及分子OP这三个要素,在信号计算部2中虚拟地实施细胞分化。对于各要素,将由数值、公式构成的数据群作为表示各自特征的参数进行保存,通过由各要素中的各数据相互进行计算来实施分裂。
如非专利文献1中所述,在细胞分化的过程中,当细胞的数量通过分裂而增加时,可以看到细胞内的分子状态发生变化。本发明中采用了如下技术:利用该细胞内的分子状态发生变化的特性,在设置了输入侧和输出侧的虚拟细胞分裂空间实施细胞分裂,之后,将靠近初始值的节点N与输入侧连接,将细胞分化后参数发生变动的节点N与输出侧连接,使信号从分裂后的输入侧向节点群进行传播,由此输出侧所接收到的信号即为针对输入信号导出的最优结果。
下面,根据图3的参数的概念以及图4的流程图,说明信号计算部12c所实施的应用了细胞分化算法的神经网络的处理过程。
图3示出了个体定义模块23内所保存的要分配给执行部1的执行部参数RP、作为节点N的初始值而设定的节点参数NP以及在节点N的分裂中利用的由公式群构成的对象参数OP。
首先,执行部参数RP是用于创建虚拟的细胞分裂空间的参数,在每次实施细胞分化算法时作为初始值设定到执行部1。
作为执行部参数RP的结构要素,包括:坐标数据R-01,其以数值表示细胞分裂空间所需的坐标信息;进行细胞分化后的执行部1的评价分数R-02;以及代码R-03,其相当于分配给每个执行部1的节点N的细胞遗传代码。此外,分数R-02是用于在 执行部1所要实施的作业中将作业效率度数值化以进行评价的值,从评价单元14接收该分数。
另一方面,节点参数NP包括:节点坐标N-01,其表示配置在坐标数据R-01中的成为最初的节点的节点N的坐标;突触连接强度N-02,其表示节点N的突触的连接度;突触连接目的地N-03,其表示作为突触的连接目的地的节点N;节点电位N-04,其表示连接目的地节点N所具有的电位;以及对象执行频率N-05,其表示节点N中的对象的数量。此外,以数值来表现这些参数。
另外,节点电位N-04在细胞分裂时不被利用,其是表示成为节点N向其它节点传递信号的契机的阈值。在此,节点电位N-04对从其它节点传递来的值进行累计。
并且,对象执行频率N-05表示存在于节点N内的对象O(分子)的数量,设定为每次分裂时节点N内的对象的数量减半。
接着,说明对象参数OP。对象O相当于细胞分裂中的分子,分子在生物学上也存在相当数量的种类,因此为了更接近实际的细胞分裂状态,需要在初始设定阶段事先定义各种种类的对象O1…Ok(k为自然数)和分别对应的对象参数OP1…OPk。
对象参数OP的构成要素包括表示对象之间的反应系数的运算发生概率O-01和使节点参数NP的各项目的值变动的功能发生概率O-02,分别以公式来进行表现。
运算发生概率O-01用于在对象O1中设定与除该对象O1以外而设定的所有对象O2~对象Ok(k为自然数)的各自的反应系数和通过该反应生成的新的对象Ok+1,在所有对象O中进行该设定。
功能发生概率O-02能够根据使对象O具有何种功能来适当地变更设定值。例如,设定使突触的连接强度N-02、节点电位 N-04的设定值改变的公式等在对功能发生概率O-02设定初始值的时刻设定所需的公式。
当由个体定义模块23将以上值作为初始值设定到信号计算部12c时,在信号计算部12c内部执行虚拟的细胞分裂。
接着,利用图4的流程图来表示由信号计算部12c实施细胞分化算法的步骤。
首先,个体定义模块设定执行部参数RP、节点参数NP以及对象参数OP的初始值,将这些参数发送到信号计算部12c(ST1)。
此时设定的各参数被保存在数据库22内,可以通过个体定义模块随机或以任意规则设定该参数,另外,也能够根据需要来更新该参数。
此外,针对每个执行部1设定节点参数NP,而为了在同一条件下对执行部1的动作进行比较评价,对于对象参数OP,对评价中使用的多个执行部1设定同一参数。
信号计算部12c根据从个体定义模块23接收到的初始设定es来生成虚拟的细胞分裂空间,构成应用细胞分化算法的神经网络(ST2)。
接着,信号计算部12c根据节点参数NP在神经网络内配置节点N,进行个体的定义(ST3),之后使对象O随机存在,当对象O的配置数量达到一定数量时开始进行分裂(ST4)。
节点N1根据执行频率N-05从对象参数OP内的公式群中选择运算发生概率O-01或功能发生概率O-02,通过代入节点参数N的值来实施虚拟的细胞分裂,节点N1连续分裂为节点N2、节点N3。
此时,节点N2、节点N3的节点参数NP与节点N1基本相同,仅执行频率N-05的频率值减半。
进一步,节点N2、节点N3与节点N1中的分裂时同样地,从随机提示的公式群中选择运算发生概率O-01或功能发生概率O-02,代入而分裂为节点N4、节点N5、节点N6、节点N7,通过反复进行该工序,节点N的总数增加。
图5的(a)是可视地表示在配置节点N1后节点数量渐渐增加的样子以及通过反复分裂而存在于节点N内的对象参数OP的特性发生变化的例子的图。如该图所示,在节点N1…节点Nk(k为自然数)增加的过程中,在节点数量增加的初始阶段,分裂频繁地进行,因此节点N的数量爆发性增加,但分配给细胞分裂空间的对象参数OP的公式群的个数被设定为固定数量,因此节点N1…节点Nk间开始相互争夺对象O,每次分裂时执行频率N-05减半,并且分裂次数也减少,在某个固定的分裂结束时节点N1…节点Nk的个数趋于稳定,在分裂的过程中,根据节点N的存在位置不同而节点N所包含的对象的特性不同这样的特征开始显现,不同特质的节点N分别存在于输入侧和输出侧。
图5的(b)以图5的(a)的图为基础,是表现稳定后的节点N1…节点Nk实际上通过突触分别与输入侧/输出侧连接而形成神经网络的图。信号计算部12c在形成出的神经网络中,以如图5的(b)所示那样节点N通过突触分别与输入侧和输出侧连接为契机,从输入侧对节点N1…节点Nk发送输入信号ins。于是,信号在节点N1…节点Nk之间传播,从输出侧的节点N1…节点Nk输出的信号作为用于动作部13的动作的输出信号outs而输出。计算此时的输出信号outs的自适应度(ST5),判断计算结果是否为期待的结果(ST6)。此外,对于作为判断材料的自适应度的数据,可以包含在初始设定es中,或者也可以事先保存在信号计算部12c中。
在没有获得期待的结果的情况下,从节点N1…节点Nk中选择优势节点(ST7),根据需要更新所选择的节点Nk的设定以引起虚拟的突然变异(ST8),使其再次交叉(ST9),由此进行新的分裂,重复ST3之后的流程直到获得期待的特性。突然变异中所使用的数据也与自适应度的判断数据同样地,事先包含在初始设定es或信号计算部12c中。
如果在ST6中获得期待的特性,则将获得的信号输出(ST10),结束流程,完成神经网络。上面就是采用细胞分化结构的本发明的算法的概要。
(实施方式例)
接着,利用图6的结构图来说明实施方式例。此外,在本实施方式中,作为具体例,例示利用了本发明系统的垃圾收集机器人,但本发明系统的利用例并不限定于此。
在本实施方式例中,提供一种目的如下的系统:假设垃圾回收执行部1是在如广场那样的场所回收纸屑、空瓶等垃圾的机器人,由设置作为传感器部的CCD照相机11a拍摄动作环境下的影像,根据CCD照相机11a的影像数据,动作部13移动到异物掉落的位置,在作为评价单元的垃圾回收单元14通过传感器识别到异物时,作为垃圾进行回收。
首先,评价部2将在个体定义模块23内针对执行部1设定的由执行部参数RP、节点参数NP以及对象参数OP构成的初始设定es通过通信单元21发送到执行部1的通信单元15,通信单元15在将初始设定es转移给信号计算部12c的同时,向传感器部11发送开始命令。
为了回收垃圾,传感器部11通过CCD照相机11a拍摄动作环境,当检测到存在异物(垃圾)时,作为输入数据in发送给输入数据接收部12a,输入数据接收部12a将接收到的输入数据in发送给输入数据信号转换部12b。
输入数据信号转换部12b将接收到的输入数据in转换为神经网络用的输入数据信号ins,并发送给信号计算部12c。
另一方面,信号计算部12c基于从通信单元15接收到的初始设定es,在配置节点N后,开始调整节点数量,创建神经网络。
信号计算部12c在神经网络完成时,对完成的神经网络输入输入数据信号ins。此外,在信号计算部12c中,如果在创建神经网络前从数据信号转换部发送了输入数据信号ins,则信号计算部12c原样保存输入数据信号ins,在神经网络完成后开始将输入数据信号ins输入到神经网络。
当通过信号在神经网络中的节点N1…节点Nk中传播而输出输出数据信号outs时,信号计算部12c将输出数据信号outs转移给输出数据信号转换部12d。
当在输出数据信号转换部12d中将输出数据信号outs转换为动作用的输出数据out时,输出数据out通过输出数据发送部12e被发送到动作部13,动作部13根据输出数据out移动到指定的位置。
在动作部13结束动作时,垃圾回收单元14通过传感器部14a检测异物,如果存在异物就通过动作部14b回收垃圾,将垃圾回收成功的评价信息e通过通信单元15发送给评价部2。在传感器部14a检测不到异物的情况下,将垃圾回收失败的评价信息e发送给评价部2。
个体评价模块24利用接收到的评价信息e来生成包括垃圾回收执行部1的固有数据以及机器人回收结果的分数评价s,当向执行管理模块25发送分数评价s的生成结果时,执行管理模块25开始对数据库的写入命令,将分数评价s写入到数据库。
执行部1在所设定的任意时间中重复垃圾的搜索、回收,每次都将结果发送给评价部2,在评价部2中存储对执行部1的评价 数据。
在评价部2中,当任意的期间结束时,对执行部1的垃圾回收状况的分数评价s进行汇总并将其作为对执行部1中的节点N1的评价而保存到数据库22中。
评价部2如果需要再次进行评价,则通过将初始设定es发送给执行部1来再一次重复垃圾回收及其评价。
评价部2将任意次数的分数数据进行比较或将任意台数的执行部1的分数数据进行比较,将成果最高的执行部1中的节点N1的参数作为最优参数而导出。
以上,关于本发明的实施方式,说明了最优方法搜索系统的实施例,但本发明并不仅限定于上述的方法,在专利权利要求所记载的范围内能够适当地实施变更。
产业上的可利用性
本发明的最优方法搜索方法以及最优方法搜索系统能够利用神经网络更有效率地实时导出输出数据,因此在软件上也能够实现神经网络。
Claims (10)
1.一种最优方法搜索系统的最优方法搜索方法,该最优方法搜索系统具备:
执行部,其进行了初始设定,使得在任意的环境下都使神经网络自适应于上述环境来导出与上述环境相应的动作并执行该动作;以及
评价部,其对该执行部提供上述初始设定,并且在上述动作结束后对该执行部的动作内容进行评价,
其中,该评价部使上述执行部执行多次上述动作,将导出的多个动作的结果中执行部进行最有效率的动作的初始设定作为最优方法而导出,
该最优方法搜索方法的特征在于,包括以下步骤:
个体定义步骤,上述评价部根据作为虚拟细胞的节点和相当于细胞分裂所需的分子的公式群的组合来生成初始设定,将该初始设定发送给上述执行部;
执行部动作步骤,该执行部如下这样生成神经网络,该执行部在基于上述初始设定创建出该神经网络内部的虚拟的细胞分裂空间后,配置该初始设定中所包含的上述节点,通过根据上述公式群执行计算处理来使节点分裂以生成神经网络,并且在该神经网络生成后,通过将由该执行部所具备的传感器检测到的输入数据输入到该神经网络来导出输出数据,使该执行部所具备的动作部基于该输出数据进行动作,将该动作的结果发送给上述评价部;以及
个体评价步骤,上述评价部基于接收到的上述动作的结果,生成上述执行部的个体评价,
通过将上述步骤依次执行多次,来从上述个体评价中导出最有效率的动作。
2.根据权利要求1所述的最优方法搜索方法,其特征在于,
上述评价部将用于创建神经网络的坐标数据的值、上述执行部的评价基准的值、上述节点的值以及上述公式群的值作为参数保存到数据库,
该评价部在使上述执行部动作时,将从上述数据库选择出的上述参数生成为初始设定,并发送给该执行部,
并且,该评价部接收基于上述初始设定进行了动作的上述执行部的动作的结果,生成评价作为该执行部的个体评价并存储到上述数据库,由此从存储于上述数据库的信息中搜索进行最有效率的动作的初始设定的组合。
3.根据权利要求1或2所述的最优方法搜索方法,其特征在于,
上述执行部利用内部的评价单元检测上述执行部的动作状态,并将检测的结果发送给上述评价部。
4.根据权利要求1或2所述的最优方法搜索方法,其特征在于,
上述执行部基于从上述评价部接收到的上述初始设定来构成上述神经网络,
并且,上述执行部通过上述执行部所具备的传感器部检测上述环境的状态作为输入数据,
当构成了上述神经网络时,上述执行部将上述输入数据输入到该神经网络,由此导出输出数据,
对上述执行部所具备的动作部发送上述输出数据,由此上述执行部进行动作。
5.根据权利要求1或2所述的最优方法搜索方法,其特征在于,
关于上述节点,作为区分该节点的特性的参数而保存配置该节点的坐标、连接该节点的多条连接线的连接强度、该节点的连接目的地、该节点的电位以及上述公式群在该节点中的利用率,
并且,上述公式群的参数包括表示该公式群中的各个公式之间的计算规则的公式和表示上述节点的参数的变更度的公式。
6.一种最优方法搜索系统,具备:
执行部,其进行了初始设定,使得在任意的环境下都使神经网络自适应于上述环境来导出与上述环境相应的动作并执行该动作;以及
评价部,其对该执行部提供上述初始设定,并且在上述动作结束后对该执行部的动作内容进行评价,
其中,该评价部使上述执行部执行多次上述动作,搜索导出的多个动作的结果中执行部进行最有效率的动作的初始设定,
该最优方法搜索系统的特征在于,
上述执行部构成神经网络,该神经网络在内部具备虚拟的细胞分裂空间,基于由上述评价部设定的作为虚拟细胞的节点以及相当于细胞分裂所需的虚拟分子的公式群,在该细胞分裂空间内对节点数量进行调整,并且将由该执行部所具备的传感器检测出的结果作为输入数据,使该输入数据在节点中进行传播以导出上述动作所需的信号,并通过该执行部进行动作输出。
7.根据权利要求6所述的最优方法搜索系统,其特征在于,
上述执行部具备:
传感器部,其检测上述环境的状态;
搜索部,其构成上述神经网络;
动作部,其基于由上述搜索部输出的数据来执行上述动作;
评价单元,其检测上述执行部的动作是成功还是失败,将该动作是成功还是失败检测为动作评价;以及
通信单元,其与上述评价部之间相互通信上述评价单元中的上述动作评价以及上述初始设定。
8.根据权利要求6或7所述的最优方法搜索系统,其特征在于,
上述评价部具备:
数据库,其存储对上述执行部发送的上述节点的参数、上述公式群的参数以及对上述执行部的评价;
个体定义模块,其从上述数据库提取上述节点的参数的值以及上述公式群的参数的值,生成发送给上述执行部的上述节点的初始设定以及上述公式群的初始设定;
个体评价模块,其根据从上述执行部接收到的上述动作评价和对该执行部发送的初始设定来生成该执行部的个体评价,并写入到数据库进行保存;
执行管理模块,其指示上述个体定义模块、上述个体评价模块以及上述执行部执行各动作;以及
通信单元,其进行与上述执行部之间的通信。
9.根据权利要求6或7所述的最优方法搜索系统,其特征在于,
关于上述节点,作为区分该节点的特性的参数而保存配置该节点的坐标、连接该节点的多条连接线的连接强度、该节点的连接目的地、该节点的电位以及上述公式群在该节点中的利用率。
10.根据权利要求6或7所述的最优方法搜索系统,其特征在于,
上述公式群的参数包括表示该公式群中的各个公式之间的计算规则的公式和表示上述节点的参数的变更度的公式。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2009/069139 WO2011058621A1 (ja) | 2009-11-10 | 2009-11-10 | 最適手法探索方法及び最適手法探索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102713944A CN102713944A (zh) | 2012-10-03 |
CN102713944B true CN102713944B (zh) | 2015-01-14 |
Family
ID=43991300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980163282.4A Active CN102713944B (zh) | 2009-11-10 | 2009-11-10 | 最优方法搜索方法以及最优方法搜索系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8838514B2 (zh) |
EP (1) | EP2500847B1 (zh) |
JP (1) | JP4997429B2 (zh) |
CN (1) | CN102713944B (zh) |
WO (1) | WO2011058621A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8768873B2 (en) * | 2011-05-03 | 2014-07-01 | Space-Time Insight | Space-time-node engine signal structure |
JP2017162273A (ja) * | 2016-03-10 | 2017-09-14 | オムロン株式会社 | センサネットワークにおける機器間連携装置、機器間連携方法、機器間連携プログラムおよびこれを格納した記録媒体 |
CN107958455B (zh) * | 2017-12-06 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 图像清晰度评估方法、装置、计算机设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1311880A (zh) * | 1998-07-31 | 2001-09-05 | 特许科技有限公司 | 采用人造神经网络和遗传算法的高速公路事件自动检测系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2040903C (en) * | 1991-04-22 | 2003-10-07 | John G. Sutherland | Neural networks |
JP2004139606A (ja) * | 1993-10-29 | 2004-05-13 | Ricoh Co Ltd | 自律システム及び自律型ロボット |
JPH096881A (ja) | 1995-06-15 | 1997-01-10 | Toyo Electric Mfg Co Ltd | ニューラルネットワーク |
JP2003317073A (ja) | 2002-04-24 | 2003-11-07 | Fuji Xerox Co Ltd | ニューラルネットワーク処理装置 |
US20040044633A1 (en) * | 2002-08-29 | 2004-03-04 | Chen Thomas W. | System and method for solving an optimization problem using a neural-network-based genetic algorithm technique |
JP4803419B2 (ja) * | 2005-05-19 | 2011-10-26 | 国立大学法人三重大学 | 概念型情報処理装置 |
-
2009
- 2009-11-10 EP EP09851255.1A patent/EP2500847B1/en not_active Not-in-force
- 2009-11-10 CN CN200980163282.4A patent/CN102713944B/zh active Active
- 2009-11-10 WO PCT/JP2009/069139 patent/WO2011058621A1/ja active Application Filing
- 2009-11-10 JP JP2010550980A patent/JP4997429B2/ja active Active
- 2009-11-10 US US13/508,908 patent/US8838514B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1311880A (zh) * | 1998-07-31 | 2001-09-05 | 特许科技有限公司 | 采用人造神经网络和遗传算法的高速公路事件自动检测系统 |
Non-Patent Citations (2)
Title |
---|
基于并行遗传神经网络算法的限制搜索区域最优路径方法;吴成东等;《公路交通科技》;20060831;第23卷(第8期);第126-129、142页 * |
翟宜峰等.用遗传算法优化神经网络初始权重的方法.《吉林大学学报(工学版)》.2003,第33卷(第2期),第45-50页. * |
Also Published As
Publication number | Publication date |
---|---|
EP2500847B1 (en) | 2018-04-18 |
EP2500847A4 (en) | 2013-07-31 |
EP2500847A1 (en) | 2012-09-19 |
JP4997429B2 (ja) | 2012-08-08 |
US20120271783A1 (en) | 2012-10-25 |
US8838514B2 (en) | 2014-09-16 |
WO2011058621A1 (ja) | 2011-05-19 |
CN102713944A (zh) | 2012-10-03 |
JPWO2011058621A1 (ja) | 2013-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111091200B (zh) | 训练模型的更新方法、系统、智能设备、服务器及存储介质 | |
Yang et al. | Robust integral of neural network and error sign control of MIMO nonlinear systems | |
Smith et al. | An enhanced genetic algorithm for automated assembly planning | |
KR101961421B1 (ko) | 소스 시스템들의 운영 데이터를 사용하여 초기에 트레이닝되는 제 1 재귀 신경망 모델 및 제 2 재귀 신경망 모델을 별도로 트레이닝함으로써 타겟 시스템을 제어하기 위한 방법, 제어기, 및 컴퓨터 프로그램 제품 | |
Siebel et al. | Evolutionary reinforcement learning of artificial neural networks | |
Han et al. | $ H_\infty $ Model-free Reinforcement Learning with Robust Stability Guarantee | |
CN102713944B (zh) | 最优方法搜索方法以及最优方法搜索系统 | |
Glinton et al. | Exploiting scale invariant dynamics for efficient information propagation in large teams. | |
CN104966136A (zh) | 一种流程执行动态预测方法 | |
KR20220154785A (ko) | 다중 태스크 강화 학습에서 메타-그래디언트를 사용한 액션 선택을 위한 학습 옵션 | |
CN113329850A (zh) | 机器人控制系统和机器人控制方法 | |
Curran et al. | Using PCA to efficiently represent state spaces | |
KR102266620B1 (ko) | 로봇 물체 조작 학습 시스템 | |
Riley | Discrete-event simulation optimization: a review of past approaches and propositions for future direction. | |
Meier et al. | Efficient Bayesian local model learning for control | |
CN111079175B (zh) | 数据处理方法、装置、计算机可读存储介质和计算机设备 | |
Wicks | Radar the next generation-sensors as robots | |
Cutello et al. | An immune algorithm with hyper-macromutations for the Dill's 2D hydrophobic-hydrophilic model | |
Lin et al. | A recurrent neural fuzzy controller based on self‐organizing improved particle swarm optimization for a magnetic levitation system | |
Akkaladevi et al. | Programming by interactive demonstration for a human robot collaborative assembly | |
Liu et al. | KG-Planner: Knowledge-Informed Graph Neural Planning for Collaborative Manipulators | |
Liu et al. | Evolving hidden Markov model based human intention learning and inference | |
Zhang et al. | H∞ robust control design for teleoperation systems | |
KR101451785B1 (ko) | 군수 시뮬레이션을 위한 bdi기반의 종합 에이전트 모델링 장치 및 그 방법 | |
Del Sagrado et al. | Ant colony optimization for requirement selection in incremental software development |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |