CN111062494A - 具有终身学习能力的机器人自组织-反思认知发育方法及系统 - Google Patents
具有终身学习能力的机器人自组织-反思认知发育方法及系统 Download PDFInfo
- Publication number
- CN111062494A CN111062494A CN201911370545.0A CN201911370545A CN111062494A CN 111062494 A CN111062494 A CN 111062494A CN 201911370545 A CN201911370545 A CN 201911370545A CN 111062494 A CN111062494 A CN 111062494A
- Authority
- CN
- China
- Prior art keywords
- sorcn
- node
- nodes
- network
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种具有终身学习能力的机器人自组织‑反思认知发育及系统,包括:构建基于单层增量式自组织神经网络的SORCN认知发育模型;当输入的数据为所述SORCN的已知类别时,识别匹配的节点并输出相应的类别;当输入的数据为所述SORCN的未知类别时,创建一个新的节点来学习这个知识;同时,将所述新节点记录在一个缓存区中;当缓冲区满时,所述SORCN进行一次反思,执行聚类算法,产生的聚类结果用于更新SORCN。本发明方法不仅能够利用其泛化能力来缓解存储问题,还能够利用其高效的竞争学习策略来降低计算量。此外,本方法在反思过程中能够进行类内拓扑构建,为节点相似度阈值的调整提供可靠的指导。
Description
技术领域
本发明涉及机器学习技术领域,尤其涉及一种具有终身学习能力的机器人自组织-反思认知发育方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
认知发育对于实现机器人拥有像人类一样的智能行为如感知、注意、推理和动作等方面具有重要作用。由于认知机器人通常需要在复杂多变的环境中工作,它必须要在线学习持续的数据流、将感知的特征转化为知识概念、记得所学的知识并能够根据出现的情况恰当地调用。而且这些技能需要能够作为辅助来支持更高的认知能力而不是只适用于单一任务。因此,具备在整个生涯中逐步发育认知即终身学习的能力对机器人非常必要。
然而,考虑终身学习的认知发育对于机器人仍然是个巨大的挑战。因为在此过程中机器人需要处理持续的数据流。一方面,这种序列性且不确定的输入要求机器人能够实时探测新类和识别熟悉的物体。另一方面大规模的数据将导致巨大的存储和计算消耗。目前大部分认知模型都无法解决这种存储和计算问题。尽管有一些模型由于其方便的在线更新方法能够取得很高的效率,但是也无法解决存储消耗。甚至有些方法只是训练一个增量式分类器来实现物体识别,而不是发育物体表示。幸运的是,各种增量式神经网络模型不仅能够根据Hebbian Learning恰当地处理数据流,还能够利用其泛化能力产生简洁的表示来降低存储量。因此,SOINN有希望作为实现终身学习的模型。
但是SOINN也存在缺点。它的自组织结果严重依赖于激活条件或者相似度阈值。尽管有方法能够在学习过程中调节相似度阈值,但是容易受数据输入顺序的影响。先前的研究提出了一种视听融合的认知模型和一种交互式认知模型,也能够动态调节节点相似度阈值。但是这两种方法是利用了其他模态信息作为指导。另外,SOINN所采用的竞争学习原理需要网络为新输入遍历所有节点来寻找它的最佳匹配节点。因此,随着节点的增加,网络也将面临巨大的计算负担和效率下降的问题。
CFS聚类算法由Rodriguez等人提出,能够高效且有效地处理不同形状和分布的数据。由于CFS仍然存在一些缺点,这些研究主要集中于算法的改进上。首先,CFS的聚类结果对于截断距离的取值很敏感。一种解决方法是利用最小化密度或高斯距离的估计信息熵来获得最优的截断距离值。但是这将产生巨大的计算消耗。另一种方法考虑避免传统截断距离的计算,比如重新定义CFS的参数或者选择其他聚类有效性指标作为目标函数来进行聚类评估。其次CFS的聚类中心是人工从决策图中选择的,这种方式并不适合SOINN的在线学习方式。最后也是最重要的阻碍SOINN与CFS结合的点是,CFS是为静态数据设计的,不能用增量的方式聚类流型数据。
发明内容
本发明为了解决上述问题,提出了一种具有终身学习能力的机器人自组织-反思认知发育方法及系统,通过两个阶段的增量式学习和定期反思发育物体概念,采用了一种自主中心选择策略和融合、分割策略来提高算法的聚类效果,并实现增量式聚类;并且基于反思结果提出了一种新颖的竞争学习方法,用于降低SOINN的计算量,提高网络的学习速度。
在一些实施方式中,采用如下技术方案:
一种具有终身学习能力的机器人自组织-反思认知发育方法,其特征在于,包括:
构建基于单层增量式自组织神经网络的SORCN认知发育模型;所述SORCN开始是一个空网络,在学习期间随着流型数据的输入逐渐发育节点;
当输入的数据为所述SORCN的已知类别时,识别匹配的节点并输出相应的类别;
当输入的数据为所述SORCN的未知类别时,创建一个新的节点来学习这个知识;同时,将所述新节点记录在一个缓存区中;当缓冲区满时,所述SORCN进行一次反思,执行聚类算法,产生的聚类结果用于更新SORCN。
在另一些实施方式中,公开了一种具有终身学习能力的机器人自组织-反思认知发育系统,包括:
用于构建基于单层增量式自组织神经网络的SORCN认识发育模型的装置;所述SORCN开始是一个空网络,在学习期间随着流型数据的输入逐渐发育节点;
用于当输入的数据为所述SORCN的已知类别时,识别匹配的节点并输出相应的类别的装置:
用于当输入的数据为所述SORCN的未知类别时,创建一个新的节点来学习这个知识;同时,将所述新节点记录在一个缓存区中;当缓冲区满时,所述SORCN进行一次反思,执行聚类算法,产生的聚类结果用于更新SORCN的装置。
与现有技术相比,本发明的有益效果是:
本发明提出了一种自组织-反思认知网络(SORCN),通过增量式学习和定期反思实现机器人的终身认知发育。该网络融合了增量式自组织神经网络(SOINN)和一种改进的CFS聚类算法。SOINN利用其泛化能力产生简洁的物体表示,可缓减存储的消耗。
本发明基于反思结果为SOINN提出了一种高效的竞争方法,可降低学习的计算量。改进的CFS聚类算法用于周期性反思SOINN学到的知识。该方法将传统的CFS改进为聚类、融合、分割三个步骤。聚类采用了一种自主中心选择策略使CFS能够适应SOINN的在线学习方式。此外,所提的一系列融合和分割策略使CFS能够实现增量式聚类并提高聚类效果。反思结果被用于调节SOINN的拓扑结构并指导其进一步的学习。
本发明方法不仅能够利用其泛化能力来缓解存储问题,还能够利用其高效的竞争学习策略来降低计算量。此外,本方法在反思过程中能够进行类内拓扑构建,为节点相似度阈值的调整提供可靠的指导。
实验结果表明,SORCN能够取得很好的学习效果及很高的学习效率。
附图说明
图1为Kolb学习循环及大脑皮层区域示意图;
图2为本发明实施例一中SORCN的结构示意图;
图3为本发明实施例一中SORCN的初始学习阶段的流程图;
图4为本发明实施例一中SORCN的发育学习阶段的流程图;
图5为本发明实施例一中改进的CFS聚类算法的原理图;
图6为本发明实施例一中自主中心选择策略的决策图;
图7(a)-(e)分别为SORCN初始学习阶段结束后的一个反思过程;
图8(a)-(e)分别为SORCN在发育学习阶段间隙的一个反思过程;
图9(a)-(e)分别为不同认知网络的发育结果;
图10(a)-(b)为在有无反思过程的情况下,SORCN的每个节点的相似性阈值的比较;
图11(a)-(e)分别为不同网络在学习数据流期间的实时结果。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
Kolb的经验学习理论(ELT)将人类的学习过程描述为一个持续的循环。如图1所示,人类首先从感知中获取具体的经验,然后反思学到的知识并产生抽象的概念。这些知识随后可被用于其他实验或应用中。特别地,反思能够将新经验整合到已知的学习结构中。这将促进人类的认知发育和终身学习。
基于此,在一个或多个实施方式中,公开了一种具有终身学习能力的机器人自组织-反思认知发育方法,包括如下过程:
构建基于单层增量式自组织神经网络的SORCN认知发育模型;所述SORCN开始是一个空网络,在学习期间随着流型数据的输入逐渐发育节点;
当输入的数据为所述SORCN的已知类别时,识别匹配的节点并输出相应的类别;
当输入的数据为所述SORCN的未知类别时,创建一个新的节点来学习这个知识;同时,将所述新节点记录在一个缓存区中;当缓冲区满时,所述SORCN进行一次反思,执行聚类算法,产生的聚类结果用于更新SORCN。
下面对本实施例方法进行详细的说明。
如图2所示,SORCN是一个结合了改进的CFS聚类算法的单层增量式自组织神经网络。SORCN在终身学习期间不断循环“学习-反思”的过程。SORCN开始是一个空网络,在学习期间会随着流型数据的输入逐渐发育节点。它能够识别出熟悉的物体为已知的类别,并更新匹配的节点。当侦测到未知的输入时,网络创建一个节点来学习这个知识。同时,这个新节点也会被记录在一个缓存区中。当缓冲区满了以后,SORCN就进行一次反思,执行一个高效的CFS聚类算法,根据节点的密度分布将其进行分类。产生的聚类结果将被用于更新SORCN,如与已知类合并或创建新类别。反思过程也会在SORCN的每个类别中执行类内拓扑重构,用于调节每个节点的相似度阈值。反思过程结束之后,缓冲区被清空,网络开始一个新的学习迭代。
因为SOINN具有很好的泛化能力,能够降低流型数据的存储,且CFS擅长对已有的知识进行恰当地分类,所以融合SOINN和CFS来实现终身学习是具有合理性的。而且两种方法之间可以互补。CFS产生的聚类结果不仅能够帮助调节SOINN中各个节点的相似度阈值,还能够为它的竞争学习提供可靠的信息从而降低SOINN的计算量。反过来,SOINN则可以在终身学习中为CFS增量地提供聚类的实例。为了能够使CFS可被用于在线学习的任务中,本实施例采用了一种自主中心选择策略来改进传统CFS算法中的人工设置中心。另外,一系列聚类融合和分割策略被用于整合缓冲区中的新类别和SORCN中的已知类别,不仅能够实现增量式聚类,还能提高CFS的聚类效果。
1、在线学习
不同于SOINN传统的单一学习过程,SORCN包括两个阶段的在线学习过程:初始学习阶段和发育学习阶段。这两个阶段根据知识水平的不同采用了不同的竞争学习方式。
1)初始学习阶段
在初始学习阶段,SORCN的学习经验非常少。因此网络采用和传统单一学习过程一样的竞争方式,即通过遍历网络中所有的节点来为输入找最匹配的节点。该过程的流程图如图3所示。
当收到输入x时,如果节点数目少于2,那么网络创建一个新节点wi=x。节点的初始相似度阈值为Tinitial=ε·||wi||,ε表示节点的差异率。否则,网络遍历所有节点并计算它们与输入之间的欧氏距离,找到最佳匹配节点b和次佳匹配节点s。当||x-wb||<Tb且||x-ws||<Ts时,b被激活。SORCN将它的实例数nb加1并更新b及其邻节点N的权重,如式(1)和(2)所示。
w'b=wb+(wb-x)/nb (1)
w'N=wN+(wN-x)/100nb (2)
然后,两个节点之间建立一条连接(b-s)。b及其邻节点N的相似度阈值也会被更新。对于节点i,它的相似度阈值Ti由与其邻节点Ni之间最大的连接长度更新,如式(3)所示。
否则,网络将创建一个新节点来学习这个新输入。同时,这个新节点也会被记录在一个缓冲区中B。如果有节点被更新了,它在缓冲区的记录也会相应地改变。当缓冲区满了以后,SORCN开始反思学到的知识,利用改进的CFS聚类算法建立初始聚类。然后,SORCN进入发育学习阶段。
初始学习阶段,缓冲区满了之后执行一次反思聚类,形成最初的类别概念。接下来的学习过程就是发育学习阶段。
2)发育学习阶段
在发育学习阶段如图4所示,SORCN采用了一种新的基于反思结果的竞争方式。假设SORCN已经经历了t-1轮反思。在当前学习时刻,SORCN有m个已知子图且有l个中心网络中剩余的未知类别节点同时也被记录在缓冲区B中。
SORCN首先计算新输入与所有聚类中心而不是所有节点之间的距离。输入与某个子图的中心越接近,就越可能属于这个类别。每个子图按照从近到远的顺序排序为然后,SORCN选择最近的子图并从中找出与输入最近的两个节点和如果节点满足上述的激活条件,输入被识别为概念SORCN更新节点及其邻节点和它们的拓扑连接。否则,SORCN再从中找下一个最接近的子图,继续刚才的激活实验直找到最终的匹配节点。如果没有一个子图符合条件,SORCN则从缓冲区中找两个最匹配节点b'和s'。如果b'仍不能被激活,输入就被认为是一个新类。网络为其创建一个新节点并存到缓冲区中。然后,SORCN继续学习下一个数据。当缓冲区满了以后,SORCN进行新一轮的反思过程。
2、反思过程
在反思过程中,SORCN分析所学知识之间的内部关系,并利用改进的CFS聚类算法产生恰当的类别概念。如图5所示,该算法包括三个步骤:聚类、融合和分割。该方法能够提高CFS的聚类效果并使其能够增量式地聚类数据。此外,网络的拓扑连接根据聚类结果进行调整,有助于发育出更可靠的节点相似度阈值。
1)CFS聚类
在聚类步骤中,CFS算法被用于对缓冲区中的新节点进行聚类。对于节点i,本实施例采用高斯核局部密度如式(4)所示而不是截断核。原因是高斯核可以预防不同节点有相同的密度。
其中dij表示节点i和j之间的欧氏距离,dc是截断距离,取缓冲区中节点之间距离升序排列后第2%的数值。尽管CFS主要应用于原始实例的聚类,这个密度公式也适用于表示实例原型的节点。SOINN也是根据节点分布产生聚类的。本实施例并未像现有技术一样考虑节点中包含的实例数,因为这种方法将导致错失只被激活了几次真正的聚类中心而把激活多次的边界点作为中心。而这种错误将导致这个真正的聚类中心及其邻近的节点被分配到一个错误的类别中。
传统方法中的中心点数目是人为选择的,但是这种方法并不适合在线学习。本实施例采用了自主中心选择策略来适应增量式学习。该策略包括两个源于CFS中心定义的约束条件:期望的聚类中心必须要与其他中心保持很大的距离,且需要具备大的密度,如公式(6)所示。
δi≥2σ(δi)∩ρi≥μ(ρi), (6)
本实施例的一个新颖点是节点按照的顺序测试约束条件直到出现一个节点不满足条件为止而不是遍历缓冲区中所有节点,如图6所示。这种方法可以降低计算量。传统方法是遍历所有的点,找出满足中心条件的点。本实施例采用的方法按的顺序,逐个测试节点的距离密度是否满足中心点条件。前面满足条件的都被作为中心点。一旦出现第一个不满足条件的节点,列表中剩余点的距离和密度是不会满足中心选择条件的。所以测试过程在找到第一个不满素条件的点之后就可以停止了,不需要再测试剩余点了。
2)融合
为了使CFS能够增量式聚类,本实施例提出一种新的融合策略用于融合缓冲区中的新类与SORCN中的已知子图,如图5所示。该策略包括两个部分:缓冲区-网络融合和网络-网络融合。
在缓冲区-网络融合中,每个缓冲区Bt中的新类要决定是否与网络Gt-1中的已知子图融合。该策略的关键是如何设计一个可靠的融合策略。第一,根据和之间的中心距离为找最接近的3个子图 对于类别为每个节点ih从该类中找4个最接近的节点作为它的邻节点。然后根据公式(7)计算整个类别的平均邻域距离。
第二,根据类别h的平均邻域距离调整类内的拓扑结构。如果节点ih与其邻节点之间没有连接且那么创建连接并根据公式(3)更新他们的相似度阈值。这种类内拓扑构建能够加快SORCN的发育并为节点相似度阈值的调整提供可靠的指导。
d(ip,jbu)<dmnd(p)∪d(ip,jbu)<dmnd(bu)。 (8)
得到所有满足融合条件的子图后,和其他子图将被融合到第一个融合的子图中(因为与最近,如果它能够与融合,不一定能融合。但是如果都不能满足条件,另外两个也不会满足融合条件的。所以,最终是保留了将和满足融合条件的都归入中。)。因此,融合操作为且
当所有的类别都被整合到网络中后,缓冲区就被清空SORCN进入网络-网络融合过程。该过程的融合动作几乎和上述的方法一样。区别在于该过程是对网络中的各个子图进行融合且所有的类内距离矩阵已经在缓冲区-网络融合过程中得到不需要计算。最终SORCN的网络为每个子图的类内距离矩阵为Dk。
所提的融合策略的一个新颖点是该方法主张融合类别,但不融合中心。具体地,该方法在融合后保留了所有的中心点而不是用K均值为融合的类找一个最优的中心。每个中心作为融合类别的一个表示,因为单一中心不能准确地表示非球面或不平衡的数据。因此,该方法可以克服CFS的一个缺点:多密度峰值的聚类可能不会被准确地分类,还能提高SORCN搜索最匹配点的准确性。
3)分割
由于数据流可能是非球状或不稳定分布的,一次性的聚类可能不能准确地将缓冲区中的节点分类。另外,不同子图可能被不恰当地融合,因为缓冲区中的节点很分散,会覆盖到多个子图。因此,本实施例提出了如图5所示的分割策略来解决这些问题。
该策略分析每个子图的内部分布并重新选择它的中心来判断该子图是否要被分割。首先,基于子图的类内聚类矩阵Dk计算该子图的截断距离其中k={1,2,…,m'}。然后可得到相应的和序列γk按照降序排列用于聚类决策。该策略并未采用聚类步骤中的中心选择方法,而是选择决策序列中前o'个值并计算其均值作为中心阈值。决策序列中满足的节点将作为中心点,选择过程直到遇到不满足条件的节点为止。
如果得到多个中心,需要被分割且剩余节点被分配到最近的中心。为了防止多密度峰值的类别被分割,该策略增加了一个分割部分间的融合测试环节来确认这次分割的合理性。假设被分割为z个部分对于和该策略从Dk中提取两个类别的类间距离矩阵Dk(k_i,k_j)。据此可得到这两个类别的最近节点ik_i和jk_j及最小距离d(ik_i,jk_j)=min(Dk(k_i,k_j))。一旦这个最小距离小于节点ik_i或jk_j的相似度阈值如公式(9)所示,和之间的分割将被取消。
3、实验结果
1)评估方法及评估标准
由于终身学习算法必须能够处理大量的数据流,本实验在一个大数据集上评估所提方法的学习效果。实验中SORCN与另外四种方法进行对比。一个是没有反思过程的SORCN,相当于SOINN,用于验证所提的改进的CFS聚类算法的效果。另一个是本实施例先前研究中的视觉样本层的学习算法DT-SOINN。最有一个是PCN中的视觉初始感知域(PSA)。每个实验重复10次且物体输入的顺序是随机选取的。
实验结果评估分为两个方面:外部评估标准包括准确率和标准化互信息(NMI)。内部评估标准包括节点数目、类别数目、均方根误差(RMSE)和执行时间。准确率和NMI越高及RMSE越低表示学习效果越好,而节点数目和执行时间越少表示网络复杂度越低。同时,合理的类别数目也是一个重要的标准。试验评估需要同时考虑以上两方面。
2)结果及分析
本实验在传统CFS算法中使用的二维人工数据集上测试所提的认知网络。该数据集由400个实例组成,可分为5个类别。由于后1000个实例主要是噪声点,本实验只用了前3000个点。SORCN的参数设为Tinitial=0.02·||xi||,Bsize=200,o'=len(γ)/6,数值由实验经验得到。首先,展示两个反思过程的例子来评估所提的CFS聚类算法。每个类别用不同的颜色表示,且所有中心用红星标记出来。
图7(a)-(e)展示了SORCN初始学习阶段结束后的一个反思过程。图7(a)表示当前学习阶段的原始数据。图7(b)表示CFS聚类步骤只将缓冲区中的节点分配到两个类别中。图7(c)表示在融合前SORCN只发育了少量的拓扑连接。图7(d)表示融合步骤没有融合类别但是在每个聚类里建立了邻近节点之间的拓扑连接。图7(e)表示分割步骤将错误的类别分割为4部分且保留了正确的聚类。
图7(b)中CFS聚类步骤不能产生正确的聚类。一个原因是低密度节点没有通过中心选择。这也暴露了传统CFS的一个缺点,该方法不适合处理分散的数据。对比图7(c)和图7(d),融合步骤能够建立合理的类内拓扑构建,从而促进SORCN的发育。同时,该反思过程没有发生融合,因为SORCN还没有发育出任何类别概念,且这两个类别也互不靠近。图7(e)表明所设计的分割策略能够改善CFS的聚类效果。
图8(a)-(e)展示了发育学习阶段间隙的一个反思过程。图8(a)表示当前学习阶段的原始数据。图8(b)表示CFS聚类不能将分散的数据正确分类。图8(c)表示融合前的新类和SORCN中的已知子图。图8(d)表示融合步骤将新类整合到一直子图中。图8(e)表示分割步骤将绿色类别分割成3个部分。
从图8(a)和8(b)中可知,SORCN能够识别许多输入数据,与初始阶段的结果相比产生了更少的新节点。一个关键原因是先前反思过程中的内类拓扑重构已经调节了每个节点的相似度阈值从而提高了SORCN的泛化能力。图8(b)中CFS聚类步骤没有选出恰当的类别数目。原因是传统CFS不能恰当地处理多密度峰值的类别以及非球形或不平衡的数据。图8(d)中融合步骤能够恰当地将新类整合到已知子图中,实现CFS的增量式聚类。图8(e)表明所提的分割策略具有稳定的分割效果,在提高CFS聚类效果中起到了重要作用。
然后,本实施例进行了与另外三种网络的对比试验。DT-SOINN和PSA的大部分参数采用原文献设置的数值。为了保证对比的公正性,DT-SOINN的两个差异率为设为εH=0.2,εL=0.02,使节点的两个相似度阈值初值为TH=TL=0.02·||xi||。PSA的视觉相似度阈值设为0.02。表1记录了平均学习结果,其中准确率和NMI是通过比较每个节点的类别和该节点表示的所有实例的标签进行对比得到的。
表1基于2D人工数据集发育后的平均结果
在外部评估中,SORCN在发育后获得最高的平均准确度和NMI,均达到1。这证明了所提方法具有出色的学习效果。在内部评估中,SORCN平均生成455个节点,并且在整个学习过程中平均需要9.6687s。这些结果优于没有反思过程的SORCN,也差于DT-SOINN和PSA。但是本实施例的方法可以实现更准确的聚类和更低的RMSE。这表明SORCN可以为原始数据发育更好的模型,而具有较高RMSE的DT-SOINN可能由于过度泛化而无法准确表示实例。
与没有反思过程的SORCN的比较表明,所提出的反思过程确实改善了学习效果,并减少了SOINN的存储和计算消耗。与DT-SOINN和PSA相比,本实施例的方法产生了更多的节点,因为采用了更严格的激活条件,即输入必须满足最佳和次佳节点的相似度阈值,而DT-SOINN和PSA仅考虑最佳节点。节点数也是导致笨方法学习时间长的原因。值得注意的是,与其他方法相比,SORCN的聚类质量不受输入序列的影响。这归因于所提出的反思过程,该过程可以自主地调整聚类结果。因此,本方法可以克服SOINN的缺点:相似性阈值受数据输入序列的影响,从而提高了学习效果和稳定性。
图9(a)-(e)展示了四个认知网络的发育结果。图9(a)表示人工数据集的原始数据。图9(b)表示SORCN正确发育了五个子图,每个子图包含多个标有红色星号的中心。图9(c)表示没有反思过程的SORCN无法将这些边界节点整合到最近的群集中。图9(d)表示PSA可以将多数节点自组织为正确的聚类,但仍然存在一些孤立的节点。图9(e)表示DT-SOINN由于具有两个动态可调整的相似性阈值,因此发育了一个更简洁的网络,但生成的聚类比实际数目要多。
从图9(a)-(e)可以看出,SORCN可以发育出最准确的聚类数量,而没有反思过程的SORCN和PSA不会将这些孤立的边界节点整合到它们的真实聚类中,DT-SOINN没有将两个紧密的子图聚集成一个全局聚类。这三个网络只是通过在节点之间建立拓扑连接来生成类别概念。但是,它们都严重依赖于节点的相似性阈值。因此,这些网络仅使用局部信息来自组织节点。相反,本实施例的方法不仅利用节点的相似性阈值进行竞争性学习,而且还在学习间隙反思了自组织的结果,从而能根据全局数据分布更精确地调整聚类,这有助于指导未来的学习。因此,所提的反思算法可以弥补SOINN相似度阈值的依赖性。
图10(a)-(b)分别表示在有、无反思过程的情况下,SORCN的每个节点的相似性阈值的比较。顶部子图表示发育后每个节点的相似性阈值。中间子图表示每个节点的初始值。底部子图表示最终相似性阈值和初始相似性阈值之间的差异。
图10(a)-(b)提供了更清晰的证据以证明所提的反思过程有助于调整每个节点的相似度阈值。SORCN中相似阈值的变化幅度要大于无反思过程时的变化幅度。相似度阈值大意味着泛化能力高。这就是为什么本实施例的方法生成更少的节点的原因。更重要的是,它比没有反思过程的SORCN得到了更高的准确度。这表明所提出的反思过程为修改节点之间的拓扑连接提供了可靠的指导,并确实改善了SOINN相似性阈值的调整。
图11(a)-(e)展示了四个网络在学习数据流期间的实时结果。其中,图11(a)表示准确度,图11(b)表示NMI,图11(c)表示节点数目,图11(d)表示类别数目,图11(e)表示每个输入的学习时间。
最终学习时间和每个指标值标记在每个曲线的端点。SORCN的反思过程在每个子图中以长虚线显示。
图11(a)-(e)显示了在相同数据序列上四个网络的实时学习结果,用于评估终身学习效果。与没有反思过程的SORCN相比,本实施例的方法可以通过定期反思来自主调整其学习结果,并提高学习速度。与PSA相比,本实施例的方法可以更早地达到高的准确率和NMI以及正确的聚类。尽管它们在接下来的学习阶段变差,但每次反思后,变化在逐渐减小。这表明反思过程可以促进SORCN迅速地发育。另外,如图11(e)所示,SORCN处理每个数据的时间消耗实际上小于PSA,只是在反思过程中花费了额外少量的时间。DT-SOINN在发育开始后可以快速建立稳定的类别,准确率和NMI。但是,它的学习效果在后续学习中不再提高,最终比其他方法差。
实施例二
在一个或多个实施方式中,公开了一种具有终身学习能力的机器人自组织-反思认知发育系统,包括:
用于构建基于单层增量式自组织神经网络的SORCN的认知发育模型的装置;所述SORCN开始是一个空网络,在学习期间随着流型数据的输入逐渐发育节点;
用于当输入的数据为所述SORCN的已知类别时,识别匹配的节点并输出相应的类别的装置;
以及用于当输入的数据为所述SORCN的未知类别时,创建一个新的节点来学习这个知识;同时,将所述新节点记录在一个缓存区中;当缓冲区满时,所述SORCN进行一次反思,执行聚类算法,产生的聚类结果用于更新SORCN的装置。
本领域技术人员应当理解,上述装置的具体工作过程采用实施例一中公开的方法实现,在此不再赘述。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种具有终身学习能力的机器人自组织-反思认知发育方法,其特征在于,包括:
构建基于单层增量式自组织神经网络的SORCN认知发育模型;所述SORCN开始是一个空网络,在学习期间随着流型数据的输入逐渐发育节点;
当输入的数据为所述SORCN的已知类别时,识别匹配的节点并输出相应的类别;
当输入的数据为所述SORCN的未知类别时,创建一个新的节点来学习这个知识;同时,将所述新节点记录在一个缓存区中;当缓冲区满时,所述SORCN进行一次反思,执行聚类算法,产生的聚类结果用于更新SORCN。
2.如权利要求1所述的一种具有终身学习能力的自组织-反思认知发育方法,其特征在于,反思过程也会在SORCN的每个类别中执行类内拓扑重构,用于调节每个节点的相似度阈值;反思过程结束后,缓冲区被清空,所述SORCN开始一个新的学习迭代。
3.如权利要求1所述的一种具有终身学习能力的自组织-反思认知发育方法,其特征在于,所述SORCN在初始学习阶段,通过遍历网络中所有的节点来为输入找最匹配的节点,具体为:
为最初的两个输入创建新节点,并存入缓冲区;
对于输入的数据,遍历所有节点并计算它们与输入之间的欧氏距离,找到最佳匹配节点和次佳匹配节点;
判断所述输入与最佳匹配节点和次佳匹配节点之间的距离是否满足设定条件,如果是,则激活最佳匹配节点,更新缓冲区、最佳匹配节点及其邻节点的权重和相似度阈值;否则,创建一个新节点来学习这个新输入并存入缓冲区;如果缓冲区已满,则进入反思阶段,产生初始聚类;然后,网络将进入发育学习阶段。
4.如权利要求1所述的一种具有终身学习能力的自组织-反思认知发育方法,其特征在于,所述SORCN在发育学习阶段,假设SORCN已经经历了t-1轮反思;在当前学习时刻,SORCN有m个已知子图,且每一个子图有l个中心;网络中剩余的未知类别节点同时也被记录在缓冲区B中;
对于输入的数据,采用如下方法匹配节点:
计算新输入与所有聚类中心之间的距离;
按照距离远近对子图进行排序;
SORCN选择距离最近的子图并从中找出与输入最近的最佳匹配节点和次佳匹配节点;
判断所述输入与最佳匹配节点和次佳匹配节点之间的距离是否满足设定条件,如果是,则激活最佳匹配节点,更新缓冲区、最佳匹配节点及其邻节点的权重和相似度阈值;否则,SORCN寻找下一个距离最近的子图,按照上述方法寻找匹配节点;
如果没有一个子图符合条件,SORCN从缓冲区中找两个匹配节点;如果最佳匹配点仍不能被激活,则输入就被认为是一个新类;网络为其创建一个新节点并存到缓冲区中;如果缓冲区已满,则进入反思阶段。
5.如权利要求1所述的一种具有终身学习能力的自组织-反思认知发育方法,其特征在于,在反思过程中,SORCN分析所学知识之间的内部关系,利用改进的CFS聚类算法产生类别概念。
7.如权利要求5所述的一种具有终身学习能力的自组织-反思认知发育方法,其特征在于,所述融合过程包括缓冲区-网络融合和网络-网络融合;
所述缓冲区-网络融合具体为:
计算整个类别的平均邻域距离;
根据类别h的平均邻域距离调整类内的拓扑结构;
8.如权利要求7所述的一种具有终身学习能力的自组织-反思认知发育方法,其特征在于,所述网络-网络融合与缓冲区-网络融合相同,区别在于网络-网络融合过程是对网络中的各个子图进行融合,所有的类内距离矩阵已经在缓冲区-网络融合过程中得到不需要计算。
10.一种具有终身学习能力的机器人自组织-反思认知发育系统,其特征在于,包括:
用于构建基于单层增量式自组织神经网络的SORCN认知发育网络的装置;所述SORCN开始是一个空网络,在学习期间随着流型数据的输入逐渐发育节点;
用于当输入的数据为所述SORCN的已知类别时,识别匹配的节点并输出相应的类别的装置;
用于当输入的数据为所述SORCN的未知类别时,创建一个新的节点来学习这个知识;同时,将所述新节点记录在一个缓存区中;当缓冲区满时,所述SORCN进行一次反思,执行聚类算法,产生的聚类结果用于更新SORCN的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911370545.0A CN111062494B (zh) | 2019-12-26 | 2019-12-26 | 具有终身学习能力的机器人自组织-反思认知发育方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911370545.0A CN111062494B (zh) | 2019-12-26 | 2019-12-26 | 具有终身学习能力的机器人自组织-反思认知发育方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062494A true CN111062494A (zh) | 2020-04-24 |
CN111062494B CN111062494B (zh) | 2023-06-16 |
Family
ID=70302758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911370545.0A Active CN111062494B (zh) | 2019-12-26 | 2019-12-26 | 具有终身学习能力的机器人自组织-反思认知发育方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062494B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112198793A (zh) * | 2020-09-16 | 2021-01-08 | 浙江理工大学 | 基于认知网络的机器人避障方法 |
CN112541905A (zh) * | 2020-12-16 | 2021-03-23 | 华中科技大学 | 一种基于终身学习卷积神经网络的产品表面缺陷识别方法 |
CN112734292A (zh) * | 2021-01-26 | 2021-04-30 | 中国人民解放军国防科技大学 | 一种基于发育型聚类的无人车智能迁移方法及系统 |
CN113344215A (zh) * | 2021-06-01 | 2021-09-03 | 山东大学 | 支持新模态在线学习的可扩展认知发育方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116766A (zh) * | 2013-03-20 | 2013-05-22 | 南京大学 | 一种基于增量神经网络和子图编码的图像分类方法 |
CN103489033A (zh) * | 2013-09-27 | 2014-01-01 | 南京理工大学 | 融合自组织映射与概率神经网络的增量式学习方法 |
CN108406767A (zh) * | 2018-02-13 | 2018-08-17 | 华南理工大学 | 面向人机协作的机器人自主学习方法 |
CN109685196A (zh) * | 2018-12-13 | 2019-04-26 | 山东大学 | 基于增量式关联神经网络和动态视听融合的自主认知发育系统及方法 |
CN110070188A (zh) * | 2019-04-30 | 2019-07-30 | 山东大学 | 一种融合交互式强化学习的增量式认知发育系统及方法 |
CN110148039A (zh) * | 2019-05-21 | 2019-08-20 | 山东大学 | 一种众智网络智能数体需求匹配策略优化方法及系统 |
KR20190101327A (ko) * | 2019-08-12 | 2019-08-30 | 엘지전자 주식회사 | 구독 제품 가격 산정 방법 및 가격 산정 장치 |
-
2019
- 2019-12-26 CN CN201911370545.0A patent/CN111062494B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116766A (zh) * | 2013-03-20 | 2013-05-22 | 南京大学 | 一种基于增量神经网络和子图编码的图像分类方法 |
CN103489033A (zh) * | 2013-09-27 | 2014-01-01 | 南京理工大学 | 融合自组织映射与概率神经网络的增量式学习方法 |
CN108406767A (zh) * | 2018-02-13 | 2018-08-17 | 华南理工大学 | 面向人机协作的机器人自主学习方法 |
CN109685196A (zh) * | 2018-12-13 | 2019-04-26 | 山东大学 | 基于增量式关联神经网络和动态视听融合的自主认知发育系统及方法 |
CN110070188A (zh) * | 2019-04-30 | 2019-07-30 | 山东大学 | 一种融合交互式强化学习的增量式认知发育系统及方法 |
CN110148039A (zh) * | 2019-05-21 | 2019-08-20 | 山东大学 | 一种众智网络智能数体需求匹配策略优化方法及系统 |
KR20190101327A (ko) * | 2019-08-12 | 2019-08-30 | 엘지전자 주식회사 | 구독 제품 가격 산정 방법 및 가격 산정 장치 |
Non-Patent Citations (3)
Title |
---|
SHEN FURAO等: "An incremental network for on-line unsupervised classification and topology learning" * |
ZILIN ZHANG等: "Adaptive Matrix Sketching and Clustering for Semisupervised Incremental Learning" * |
邱天宇等: "自组织增量学习神经网络综述" * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112198793A (zh) * | 2020-09-16 | 2021-01-08 | 浙江理工大学 | 基于认知网络的机器人避障方法 |
CN112198793B (zh) * | 2020-09-16 | 2022-07-29 | 浙江理工大学 | 基于认知网络的机器人避障方法 |
CN112541905A (zh) * | 2020-12-16 | 2021-03-23 | 华中科技大学 | 一种基于终身学习卷积神经网络的产品表面缺陷识别方法 |
CN112541905B (zh) * | 2020-12-16 | 2022-08-05 | 华中科技大学 | 一种基于终身学习卷积神经网络的产品表面缺陷识别方法 |
CN112734292A (zh) * | 2021-01-26 | 2021-04-30 | 中国人民解放军国防科技大学 | 一种基于发育型聚类的无人车智能迁移方法及系统 |
CN112734292B (zh) * | 2021-01-26 | 2023-12-29 | 中国人民解放军国防科技大学 | 一种基于发育型聚类的无人车智能迁移方法及系统 |
CN113344215A (zh) * | 2021-06-01 | 2021-09-03 | 山东大学 | 支持新模态在线学习的可扩展认知发育方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111062494B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062494A (zh) | 具有终身学习能力的机器人自组织-反思认知发育方法及系统 | |
TWI830791B (zh) | 用於最佳化一裝配線中之工作流程之方法及系統、及非暫時性電腦可讀媒體 | |
US20200293019A1 (en) | Assembly error correction for assembly lines | |
CN113361680B (zh) | 一种神经网络架构搜索方法、装置、设备及介质 | |
Zhang et al. | Artificial intelligence and its applications | |
JP7207790B2 (ja) | 組立てラインのための組立てエラー修正 | |
CN113222224A (zh) | 一种基于孪生智能工件的物联车间实时调度方法 | |
CN109034020A (zh) | 一种基于物联网与深度学习的社区风险监测和防范方法 | |
CN114611663B (zh) | 一种基于在线更新策略的定制化行人轨迹预测方法 | |
CN111210621A (zh) | 基于实时路况的信号绿波协调路线优化控制方法及系统 | |
CN105243356A (zh) | 一种建立行人检测模型的方法及装置及行人检测方法 | |
CN113807176B (zh) | 一种基于多知识融合的小样本视频行为识别方法 | |
CN115761240B (zh) | 一种混沌反向传播图神经网络的图像语义分割方法及装置 | |
Muniategui et al. | Spot welding monitoring system based on fuzzy classification and deep learning | |
EP3912003A1 (en) | Assembly error correction for assembly lines | |
KR101827124B1 (ko) | 운전자의 주행 패턴 인식 시스템 및 방법 | |
Kailkhura et al. | Ensemble learning-based approach for crack detection using CNN | |
CN114419507A (zh) | 一种基于联邦学习的互联网工厂运行诊断方法及系统 | |
CN110413682A (zh) | 一种数据的分类展示方法及系统 | |
CN114530163A (zh) | 基于密度聚类的采用声音识别设备生命周期的方法及系统 | |
CN109684471B (zh) | 一种ai智能文本处理系统在新零售领域的应用方法 | |
CN111047011A (zh) | 一种基于机器学习模型的场景变量自动化深度挖掘引擎系统 | |
Heinen et al. | Dealing with continuous-state reinforcement learning for intelligent control of traffic signals | |
Bourqui et al. | Toward automatic comparison of visualization techniques: application to graph visualization | |
CN116401451B (zh) | 一种融合多维度策略体系构建的流程分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |