CN110705689A - 可区分特征的持续学习方法及装置 - Google Patents

可区分特征的持续学习方法及装置 Download PDF

Info

Publication number
CN110705689A
CN110705689A CN201910863286.9A CN201910863286A CN110705689A CN 110705689 A CN110705689 A CN 110705689A CN 201910863286 A CN201910863286 A CN 201910863286A CN 110705689 A CN110705689 A CN 110705689A
Authority
CN
China
Prior art keywords
parameters
last layer
tasks
model
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910863286.9A
Other languages
English (en)
Other versions
CN110705689B (zh
Inventor
朱文武
姚炫容
王鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201910863286.9A priority Critical patent/CN110705689B/zh
Publication of CN110705689A publication Critical patent/CN110705689A/zh
Application granted granted Critical
Publication of CN110705689B publication Critical patent/CN110705689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种可区分特征的持续学习方法及装置,其中,方法包括以下步骤:确定当前分类任务,并将目标函数加入学习模型的angularloss项;在当前分类任务为新任务时,初始化学习模型的最后一层的参数,以使其相互正交,并在更新过程中暂时固定;训练预设时间后,将最后一层的参数参与更新,其中,最后一层的参数作为正交化的约束,以使不同的分类任务不会互相干扰。该方法可以在处理不同类型的分类任务时,都能够很好地对该任务的目标类别进行精准分类,有效解决了目前持续学习中不同任务中的类别在特征空间中会发生重叠、导致模型效果不佳的问题。

Description

可区分特征的持续学习方法及装置
技术领域
本发明涉及机器学习技术领域,特别涉及一种可区分特征的持续学习方法及装置。
背景技术
在现实世界中,信息流往往是连续的,智能系统需要从联系且动态的数据分布中学习和记住多个任务。例如,与环境交互的智能机器人需要从其自身经验中学习,并且必须能够持续地获取知识。通过保留先前学习的经验,同时适应新知识而不断学习的能力被称为持续学习或终身学习。
终身学习的需要克服的最大问题是模型会发生灾难性遗忘,即用新信息训练模型会干扰先前学到的知识。这种现象通常会导致性能突然下降,在最坏的情况下,会导致旧知识被新的知识完全覆盖。
现有的持续学习主要是在图片分类任务上进行实验。研究可分为基于正则的,基于回放的,基于增量式模型的。基于增量式模型和基于回放的方法都要求模型的体积随着任务的增多而变大。这中在实际情况下并不可取。基于正则的方法着眼于在某个任务的学习结束后,对目标函数添加一个正则项。添加该正则项的目的是保证模型在之后的学习中,对此任务依然有不错的表现。
这种方法一定程度上缓解了灾难性遗忘,但是他们忽略了另一个导致灾难性遗忘的原因:不同任务的特征空间会相互重叠。
在持续学习的类别增量设定中,模型无法对在不同任务中的不同类别做区分,这导致这些类别会一定程度上在特征空间发生重叠。由于这些重叠,模型在测试阶段将无法区分这些类别。
发明内容
本申请是基于发明人对以下问题的认识和发现做出的:
相关技术中,克服神经网络的灾难性遗忘的方案是一个典型的基于正则的模型。在学习完一个任务后,模型会计算每个参数的费雪信息量,以此为权重衡量该参数对当前任务的重要程度。之后的学习过程中,费雪信息量会作为该参数更新时的惩罚系数。本发明实施例可以直接应用在这类模型上,提升这类模型的效果。
相关技术忽略了不同任务的特征空间会相互干扰的情况。本发明实施例提出的方法则可以解决这一问题。
相关技术计算的时间复杂度高,随着任务数的增多,参数需要保存的数据也随之线性增加。本发明实施例的方法计算快、且也不需要保存其他的数据。
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种可区分特征的持续学习方法,该方法可以在处理不同类型的分类任务时,都能够很好地对该任务的目标类别进行精准分类,有效解决了目前持续学习中不同任务中的类别在特征空间中会发生重叠、导致模型效果不佳的问题。
本发明的另一个目的在于提出一种可区分特征的持续学习装置。
为达到上述目的,本发明一方面实施例提出了一种可区分特征的持续学习方法,包括以下步骤:确定当前分类任务,并将目标函数加入学习模型的angularloss项;在所述当前分类任务为新任务时,初始化学习模型的最后一层的参数,以使其相互正交,并在更新过程中暂时固定;训练预设时间后,将所述最后一层的参数参与更新,其中,所述最后一层的参数作为正交化的约束,以使不同的分类任务不会互相干扰。
本发明实施例的可区分特征的持续学习方法,在持续学习框架下,能够对不同分类任务中的目标类进行紧凑映射的模型,通过紧凑映射,大大缩小了不同目标类在特征空间上发生重叠的概率,从而使得该模型可以在处理不同类型的分类任务时,都能够很好地对该任务的目标类别进行精准分类,有效解决了目前持续学习中不同任务中的类别在特征空间中会发生重叠、导致模型效果不佳的问题。
另外,根据本发明上述实施例的可区分特征的持续学习方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,每个分类任务学习与对应特征表达相对应。
进一步地,在本发明的一个实施例中,所述目标函数为:
Figure BDA0002199504410000021
其中,N为训练样本的数量,i为样本序号,xi为第i个样本的特征,m为一系数,θj,i为Wj与xi的夹角,Wj为类别j在最后一层对应的W,y为样本类别。
进一步地,在本发明的一个实施例中,所述在所述当前分类任务为新任务时,初始化学习模型的最后一层的参数,进一步包括:使所述新任务在特征空间中与其他任务正交,以最小化不同分类任务发生干扰的概率。
进一步地,在本发明的一个实施例中,所述训练预设时间后,将所述最后一层的参数参与更新,进一步包括:在模型收敛或者达到预设时间后,停止最后一层参数的固定,并将所述最后一层的参数更新至模型梯度下降的参数更新中。
为达到上述目的,本发明另一方面实施例提出了一种可区分特征的持续学习装置,包括:确定模块,用于确定当前分类任务,并将目标函数加入学习模型的angularloss项;初始化模块,用于在所述当前分类任务为新任务时,初始化学习模型的最后一层的参数,以使其相互正交,并在更新过程中暂时固定;更新模块,用于训练预设时间后,将所述最后一层的参数参与更新,其中,所述最后一层的参数作为正交化的约束,以使不同的分类任务不会互相干扰。
本发明实施例的可区分特征的持续学习装置,在持续学习框架下,能够对不同分类任务中的目标类进行紧凑映射的模型,通过紧凑映射,大大缩小了不同目标类在特征空间上发生重叠的概率,从而使得该模型可以在处理不同类型的分类任务时,都能够很好地对该任务的目标类别进行精准分类,有效解决了目前持续学习中不同任务中的类别在特征空间中会发生重叠、导致模型效果不佳的问题。
另外,根据本发明上述实施例的可区分特征的持续学习装置还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,每个分类任务学习与对应特征表达相对应。
进一步地,在本发明的一个实施例中,所述目标函数为:
Figure BDA0002199504410000031
其中,N为训练样本的数量,i为样本序号,xi为第i个样本的特征,m为一系数,θj,i为Wj与xi的夹角,Wj为类别j在最后一层对应的W,y为样本类别。
进一步地,在本发明的一个实施例中,所述初始化模块进一步用于使所述新任务在特征空间中与其他任务正交,以最小化不同分类任务发生干扰的概率。
进一步地,在本发明的一个实施例中,所述更新模块进一步用于在模型收敛或者达到预设时间后,停止最后一层参数的固定,并将所述最后一层的参数更新至模型梯度下降的参数更新中。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的可区分特征的持续学习方法的流程图;
图2为根据本发明实施例的可区分特征的持续学习装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的可区分特征的持续学习方法及装置,首先将参照附图描述根据本发明实施例提出的可区分特征的持续学习方法。
图1是本发明一个实施例的可区分特征的持续学习方法的流程图。
如图1所示,该可区分特征的持续学习方法包括以下步骤:
在步骤S101中,确定当前分类任务,并将目标函数加入学习模型的angularloss项。
可以理解的是,对于当前任务,目标函数加入angularloss项,其中,目标函数为:
其中,N为训练样本的数量,i为样本序号,xi为第i个样本的特征,m为一系数,θj,i为Wj与xi的夹角,Wj为类别j在最后一层对应的W,y为样本类别。
具体而言,分类任务由softmax函数得到分类的概率,然后再使用交叉熵计算目标函数。以二分类为例:
Figure BDA0002199504410000042
Figure BDA0002199504410000043
p1和p2是模型得到的概率值。其中x为模型的输出,其余的W和b为模型参数,可以把公式里的指数项改写为:
Figure BDA0002199504410000044
θi为Wi与x的夹角。同时再对W和b进行约束:
||Wi||=1,bi=0
在特征空间中,两类的分类面为:
cos(θ1)-cos(θ2)=0
如果该样本分类结果是第一类,则:
cos(θ1)>cos(θ2)
而在angularloss中,如果该样本分类结果是第一类,则:
cos(m*θ1)>cos(θ2)
其中m为预设参数。整理并扩展为多分类任务,则可得:
这里所使用的学习模型通常为卷积神经网络。
进一步地,在本发明的一个实施例中,每个分类任务学习与对应特征表达相对应。
可以理解的是,本发明实施例通过为每个类别学习一种紧凑的特征表达,从而最大程度上降低了特征重叠的问题。
具体而言,在持续学习的框架下,分类任务会以序列的方式提供给模型进行学习。例如,任务1可以是对动物图片进行分类,任务2则是对交通工具的图片进行分类。模型先学习任务1,再学习任务2。同时,对于已经学习过的任务,模型将无法再获得该任务的样本。
模型需要对已经学习的任务进行记忆,同时保证新任务的学习不会导致旧任务的遗忘。
在步骤S102中,在当前分类任务为新任务时,初始化学习模型的最后一层的参数,以使其相互正交,并在更新过程中暂时固定。
可理解的是,对于新任务,初始化最后一层的参数使其相互正交,并在更新过程中暂时固定。
进一步地,在本发明的一个实施例中,在当前分类任务为新任务时,初始化学习模型的最后一层的参数,进一步包括:使新任务在特征空间中与其他任务正交,以最小化不同分类任务发生干扰的概率。
具体而言,当模型对新任务进行学习时,分类层(softmax层)中关于新类别的W是全新的,是与以前任务无关的,所以需要对其进行初始化,使其在特征空间中与其他W正交,以最小化他们发生干扰的概率。其他层的参数都是所有任务共享的,已经经过更新学习的,所以不需要进行初始化。在新任务的学习过程中,本发明实施例暂时固定最后一层新的W,在模型学习过程中,固定的参数不参与梯度下降时的更新。这将使新类别的特征往这些正交的W上对齐,如果不暂时固定,很可能经过几轮的更新,新的W就和旧的W相互重叠了。暂时固定的时间可以由预设时间的决定,也可以由目标函数决定,一旦目标函数不再下降,就可以解除固定,令其参与模型的更新了。
在步骤S103中,训练预设时间后,将最后一层的参数参与更新,其中,最后一层的参数作为正交化的约束,以使不同的分类任务不会互相干扰。
可以理解的是,训练一段时间后,使最后一层的参数参与更新,且通过对模型的最后一层的参数作正交化的约束,从而使得不同的分类任务不会互相干扰。
进一步地,在本发明的一个实施例中,训练预设时间后,将最后一层的参数参与更新,进一步包括:在模型收敛或者达到预设时间后,停止最后一层参数的固定,并将最后一层的参数更新至模型梯度下降的参数更新中。
具体而言,在模型收敛或者达到预设时间后,就无需继续固定最后一层的参数了。在后续的模型学习中,最后一层的参数将参与到模型梯度下降的参数更新中去。由于最后一层的W代表着每一类别在特征空间中的方向,如果W互相正交的话,不同类别就不会互相干扰,就能得到所有类别是同时学习的效果。
下面将通过具体示例对可区分特征的持续学习方法进行阐述。
用户使用场景1:在某app上,用户可以上传植物图片,然后识别该植物种类。该功能是通过一个输入图片,输出植物种类的深度学习模型来实现的。由于植物的品种多,部分品种的训练样本获取难度大,所以可以采用持续学习的方法:先把现有数据喂给模型进行训练,同时继续采集训练图片。在发现新品种,或者获取到新的训练图片后,可以直接用新的数据对其训练,而不用重新训练。
综上,本发明实施例解决了不同类别在特征空间的重叠问题,且具有计算复杂度低,不需要保存额外数据的优点,并且能够直接与其他持续学习的技术相结合。
根据本发明实施例提出的可区分特征的持续学习方法,在持续学习框架下,能够对不同分类任务中的目标类进行紧凑映射的模型,通过紧凑映射,大大缩小了不同目标类在特征空间上发生重叠的概率,从而使得该模型可以在处理不同类型的分类任务时,都能够很好地对该任务的目标类别进行精准分类,有效解决了目前持续学习中不同任务中的类别在特征空间中会发生重叠、导致模型效果不佳的问题。
其次参照附图描述根据本发明实施例提出的可区分特征的持续学习装置。
图2是本发明一个实施例的可区分特征的持续学习装置的结构示意图。
如图2所示,该可区分特征的持续学习装置10包括:确定模块100、初始化模块200和更新模块300。
其中,确定模块100用于确定当前分类任务,并将目标函数加入学习模型的angularloss项;初始化模块200用于在当前分类任务为新任务时,初始化学习模型的最后一层的参数,以使其相互正交,并在更新过程中暂时固定;更新模块300用于训练预设时间后,将最后一层的参数参与更新,其中,最后一层的参数作为正交化的约束,以使不同的分类任务不会互相干扰。本发明实施例的装置10可以在处理不同类型的分类任务时,都能够很好地对该任务的目标类别进行精准分类,有效解决了目前持续学习中不同任务中的类别在特征空间中会发生重叠、导致模型效果不佳的问题。
进一步地,在本发明的一个实施例中,每个分类任务学习与对应特征表达相对应。
进一步地,在本发明的一个实施例中,目标函数为:
Figure BDA0002199504410000071
其中,N为训练样本的数量,i为样本序号,xi为第i个样本的特征,m为一系数,θj,i为Wj与xi的夹角,Wj为类别j在最后一层对应的W,y为样本类别。
进一步地,在本发明的一个实施例中,初始化模块200进一步用于使新任务在特征空间中与其他任务正交,以最小化不同分类任务发生干扰的概率。
进一步地,在本发明的一个实施例中,更新模块300进一步用于在模型收敛或者达到预设时间后,停止最后一层参数的固定,并将最后一层的参数更新至模型梯度下降的参数更新中。
需要说明的是,前述对可区分特征的持续学习方法实施例的解释说明也适用于该实施例的可区分特征的持续学习装置,此处不再赘述。
根据本发明实施例提出的可区分特征的持续学习装置,在持续学习框架下,能够对不同分类任务中的目标类进行紧凑映射的模型,通过紧凑映射,大大缩小了不同目标类在特征空间上发生重叠的概率,从而使得该模型可以在处理不同类型的分类任务时,都能够很好地对该任务的目标类别进行精准分类,有效解决了目前持续学习中不同任务中的类别在特征空间中会发生重叠、导致模型效果不佳的问题。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种可区分特征的持续学习方法,其特征在于,包括以下步骤:
确定当前分类任务,并将目标函数加入学习模型的angularloss项;
在所述当前分类任务为新任务时,初始化学习模型的最后一层的参数,以使其相互正交,并在更新过程中暂时固定;以及
训练预设时间后,将所述最后一层的参数参与更新,其中,所述最后一层的参数作为正交化的约束,以使不同的分类任务不会互相干扰。
2.根据权利要求1所述的方法,其特征在于,每个分类任务学习与对应特征表达相对应。
3.根据权利要求1所述的方法,其特征在于,所述目标函数为:
Figure FDA0002199504400000011
其中,N为训练样本的数量,i为样本序号,xi为第i个样本的特征,m为一系数,θj,i为Wj与xi的夹角,Wj为类别j在最后一层对应的W,y为样本类别。
4.根据权利要求1所述的方法,其特征在于,所述在所述当前分类任务为新任务时,初始化学习模型的最后一层的参数,进一步包括:
使所述新任务在特征空间中与其他任务正交,以最小化不同分类任务发生干扰的概率。
5.根据权利要求1所述的方法,其特征在于,所述训练预设时间后,将所述最后一层的参数参与更新,进一步包括:
在模型收敛或者达到预设时间后,停止最后一层参数的固定,并将所述最后一层的参数更新至模型梯度下降的参数更新中。
6.一种可区分特征的持续学习装置,其特征在于,包括:
确定模块,用于确定当前分类任务,并将目标函数加入学习模型的angularloss项;
初始化模块,用于在所述当前分类任务为新任务时,初始化学习模型的最后一层的参数,以使其相互正交,并在更新过程中暂时固定;以及
更新模块,用于训练预设时间后,将所述最后一层的参数参与更新,其中,所述最后一层的参数作为正交化的约束,以使不同的分类任务不会互相干扰。
7.根据权利要求6所述的装置,其特征在于,每个分类任务学习与对应特征表达相对应。
8.根据权利要求6所述的装置,其特征在于,所述目标函数为:
其中,N为训练样本的数量,i为样本序号,xi为第i个样本的特征,m为一系数,θj,i为Wj与xi的夹角,Wj为类别j在最后一层对应的W,y为样本类别。
9.根据权利要求6所述的装置,其特征在于,所述初始化模块进一步用于使所述新任务在特征空间中与其他任务正交,以最小化不同分类任务发生干扰的概率。
10.根据权利要求6所述的装置,其特征在于,所述更新模块进一步用于在模型收敛或者达到预设时间后,停止最后一层参数的固定,并将所述最后一层的参数更新至模型梯度下降的参数更新中。
CN201910863286.9A 2019-09-11 2019-09-11 可区分特征的持续学习方法及装置 Active CN110705689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910863286.9A CN110705689B (zh) 2019-09-11 2019-09-11 可区分特征的持续学习方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910863286.9A CN110705689B (zh) 2019-09-11 2019-09-11 可区分特征的持续学习方法及装置

Publications (2)

Publication Number Publication Date
CN110705689A true CN110705689A (zh) 2020-01-17
CN110705689B CN110705689B (zh) 2021-09-24

Family

ID=69195049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910863286.9A Active CN110705689B (zh) 2019-09-11 2019-09-11 可区分特征的持续学习方法及装置

Country Status (1)

Country Link
CN (1) CN110705689B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257785A (zh) * 2020-10-23 2021-01-22 中科院合肥技术创新工程院 基于记忆巩固机制与gan模型的序列化任务完成方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987005689A1 (en) * 1986-03-17 1987-09-24 Plessey Overseas Limited Improvements relating to optical position sensing arrangements
CN1742294A (zh) * 2003-01-25 2006-03-01 螺旋划痕有限公司 制作包含深度信息的图像的方法和装置
US20130101201A1 (en) * 2011-10-19 2013-04-25 Lee F. Holeva Identifying and locating possible lines corresponding to pallet structure in an image
US20180321368A1 (en) * 2017-05-05 2018-11-08 Texas Instruments Incorporated Multi-mode radar systems, signal processing methods and configuration methods using pushing windows
CN109033938A (zh) * 2018-06-01 2018-12-18 上海阅面网络科技有限公司 一种基于可区分性特征融合的人脸识别方法
CN109271868A (zh) * 2018-08-21 2019-01-25 中国海洋大学 基于密集连接卷积网络超球体嵌入的目标重识别方法
CN109447146A (zh) * 2018-10-24 2019-03-08 厦门美图之家科技有限公司 分类优化方法及装置
CN109784219A (zh) * 2018-12-28 2019-05-21 广州海昇计算机科技有限公司 一种基于集中协调学习的人脸识别方法、系统及装置
CN109934343A (zh) * 2019-02-25 2019-06-25 中国科学院自动化研究所 基于正交投影矩阵的人工神经网络优化方法、系统、装置
CN110113286A (zh) * 2019-05-06 2019-08-09 厦门大学 一种基于正交匹配追踪的低复杂度水声信道估计算法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987005689A1 (en) * 1986-03-17 1987-09-24 Plessey Overseas Limited Improvements relating to optical position sensing arrangements
CN1742294A (zh) * 2003-01-25 2006-03-01 螺旋划痕有限公司 制作包含深度信息的图像的方法和装置
US20130101201A1 (en) * 2011-10-19 2013-04-25 Lee F. Holeva Identifying and locating possible lines corresponding to pallet structure in an image
US20180321368A1 (en) * 2017-05-05 2018-11-08 Texas Instruments Incorporated Multi-mode radar systems, signal processing methods and configuration methods using pushing windows
CN109033938A (zh) * 2018-06-01 2018-12-18 上海阅面网络科技有限公司 一种基于可区分性特征融合的人脸识别方法
CN109271868A (zh) * 2018-08-21 2019-01-25 中国海洋大学 基于密集连接卷积网络超球体嵌入的目标重识别方法
CN109447146A (zh) * 2018-10-24 2019-03-08 厦门美图之家科技有限公司 分类优化方法及装置
CN109784219A (zh) * 2018-12-28 2019-05-21 广州海昇计算机科技有限公司 一种基于集中协调学习的人脸识别方法、系统及装置
CN109934343A (zh) * 2019-02-25 2019-06-25 中国科学院自动化研究所 基于正交投影矩阵的人工神经网络优化方法、系统、装置
CN110113286A (zh) * 2019-05-06 2019-08-09 厦门大学 一种基于正交匹配追踪的低复杂度水声信道估计算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YAN YAN等: "High-capacity millimetre-wave communications with orbital angular momentum multiplexing", 《NATURE COMMUNICATIONS》 *
张海涛: "基于卡尔曼滤波器算法的径向基神经网络训练算法研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257785A (zh) * 2020-10-23 2021-01-22 中科院合肥技术创新工程院 基于记忆巩固机制与gan模型的序列化任务完成方法及系统

Also Published As

Publication number Publication date
CN110705689B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN110288007B (zh) 数据标注的方法、装置及电子设备
CN108804528B (zh) 一种数据融合方法及装置
CN111985458B (zh) 一种检测多目标的方法、电子设备及存储介质
CN112560974B (zh) 一种信息融合、车辆信息获取方法及装置
CN110705689B (zh) 可区分特征的持续学习方法及装置
CN112613617A (zh) 基于回归模型的不确定性估计方法和装置
CN113870304A (zh) 异常行为检测与跟踪方法、装置、可读存储介质及设备
CN112128950B (zh) 一种基于多种模型对比的机房温湿度预测方法及系统
US20140309754A1 (en) Method and device for creating a data-based function model
CN111832693A (zh) 神经网络层运算、模型训练方法、装置及设备
CN112097772B (zh) 机器人及其地图构建方法和装置
CN117370796A (zh) 风电机组故障预测模型训练和故障预测方法及装置
CN110126846B (zh) 驾驶场景的表示方法、装置、系统和存储介质
CN112613462A (zh) 一种加权交并比方法
KR102238472B1 (ko) 오차 보정 방법 및 센서 시스템
CN113095351A (zh) 借助于初始标记的改善生成经标记的数据的方法
CN111428858A (zh) 样本数量的确定方法、装置、电子设备及存储介质
CN114004143B (zh) 一种轮胎寿命的预测方法、装置、终端设备及存储介质
CN112001388B (zh) 一种基于YOLOv3改进模型的用于检测PCB中圆形目标的方法
CN112598616B (zh) 一种电子设备曝光参数的确定方法及成像方法
US11693921B2 (en) Data preparation for artificial intelligence models
CN114021619A (zh) 基于图结构演化的分类方法及装置
CN115050095A (zh) 一种基于高斯过程回归和渐进滤波的人体姿态预测方法
CN109614878B (zh) 一种模型训练、信息预测方法及装置
CN108009647B (zh) 设备记录处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant