CN111507164A

CN111507164A - 实时更新可检测类的类别的对象检测系统的方法和设备

Info

Publication number: CN111507164A
Application number: CN202010072012.0A
Authority: CN
Inventors: 金桂贤; 金镕重; 金鹤京; 南云铉; 夫硕熏; 成明哲; 申东洙; 吕东勋; 柳宇宙; 李明春; 李炯树; 张泰雄; 郑景中; 诸泓模; 赵浩辰
Original assignee: Stradvision Inc
Current assignee: Stradvision Inc
Priority date: 2019-01-30
Filing date: 2020-01-21
Publication date: 2020-08-07
Anticipated expiration: 2040-01-21
Also published as: KR20200094640A; KR102349927B1; JP6962605B2; JP2020123340A; US10621473B1; CN111507164B; EP3690710A1

Abstract

提供了一种用于实时更新对象检测系统以检测具有未训练的类别的对象的方法。该方法包括以下步骤：(a)如果获取到至少一个输入图像，则对象检测系统指示其包括的识别器生成特定特征映射之后再生成特定查询向量；(b)对象检测系统指示相似性确定单元(i)将特定查询向量与数据向量进行比较，从而计算特定查询向量与数据向量之间的第一相似度得分的每一个，并且(ii)如果特定第一相似度得分小于预定的第一阈值，则将特定局部图像追加到未知图像数据库；(c)如果获取到特定类别信息，则对象检测系统指示短期更新单元生成与特定短期更新向量，然后更新特征指纹数据库。

Description

实时更新可检测类的类别的对象检测系统的方法和设备

技术领域

本发明涉及一种用于自动驾驶车辆的方法和设备；更具体地，涉及一种用于提供能够实时更新可检测类的类别的对象检测系统的方法和设备。

背景技术

深度卷积神经网络(Deep Convolution Neural Networks，Deep CNN)是深度学习中显著发展的核心。CNN在上世纪90年代已经用于解决字符识别问题，但是由于最近的研究，它们的使用变成像现在这样广泛。在2012年ImageNet图像分类比赛中，CNN击败了其他竞争对手取得胜利。之后，卷积神经网络成为机器学习(Machine Learning)领域中非常有用的工具。

最近，CNN已广泛应用于自动驾驶。CNN可以执行各种功能以支持自动驾驶汽车的自动驾驶，例如，语义分割(Semantic Segmentation)、目标检测等，这些功能通过使用成千上万的训练数据集来学习，然后安装到自动驾驶汽车上。

同时，当自动驾驶汽车被长时间使用后，可能会出现问题。其中一个问题是，在学习期间未出现的新对象会随着时间推移而在增加到路上，因此， CNN无法正常用作目标检测器。例如，每年都会发布新车辆，并且它们的设计会发生变化，在这种情况下，目标检测器可能无法将这些新车辆检测为车辆。因此，需要定期更新安装在自动驾驶车辆上的CNN。然而，更新CNN 的参数的学习过程是昂贵的，并且将参数和相关信息传输到每个自动驾驶车辆以进行更新的过程也是昂贵的。

发明内容

本发明的一个目的是解决前面所述的问题。

本发明的另一个目的是，通过提供一种能够实时更新可检测类的类别的对象检测系统，允许已经长时间运行的自动驾驶车辆安全驾驶。

为了达到如上所述的本发明的目的，实现如下所述的本发明的特定效果，本发明的特定构成如下。

根据本发明的一实施方式，本发明提供了一种用于实时更新对象检测系统以检测具有未学习的类的对象，包括以下步骤：(a)如果获取到至少一个输入图像，对象检测系统指示其包括的识别器生成特定特征映射(Feature Map)，该特定特征映射与包括所述输入图像的特定目标的特定ROI相对应，并通过使用所述特定特征映射生成特定查询向量(Query Vector)，该特定查询向量与特定目标相对应；(b)对象检测系统指示相似性确定单元(Similarity Determining Unit)(i)将所述特定查询向量与至少一个特征指纹数据库(Feature Fingerprint DB、特征指纹DB)所包括的一个或多个数据向量进行比较，该特征指纹数据库用于检测向所述对象检测系统输入的图像目标，从而计算特定查询向量与每一个数据向量之间的一个或多个第一相似度得分 (Similarity Score)，(ii)如果特定第一相似度得分(在第一相似度得分中最高) 小于预定的第一阈值，将与特定ROI相对应的特定局部图像(Partial Image)添加到用于更新特征指纹数据库的未知图像数据库(Unknown-Image DB、未知图像DB)；(c)如果获取到与所述特定局部图像相对应的特定类别信息，则对象检测系统指示短期更新单元(Short-Term Update Unit)通过使用特定类别信息和与所述特定目标对应的、由识别器生成的特定分量向量，生成与特定目标对应的特定短期更新向量，然后使用特定短期更新向量更新特征指纹数据库。

作为一个示例，在步骤(c)中，所述对象检测系统指示所述短期更新单元(i)计算数据向量中其类别信息与所述特定短期更新向量的类别信息相同的特定数据向量与特定短期更新向量之间的各自的一个或多个第二相似度得分，(ii)在第二相似度得分中选择最大值，(iii-1)如果最大第二相似度得分大于或等于预定的第二阈值，则通过使用特定短期更新向量更新与所述最大第二相似度得分对应的目标数据向量(Target Data Vector)，(iii-2)如果最大第二相似度得分小于第二阈值，将特定短期更新向量添加到特征指纹数据库，以更新特征指纹数据库。

作为一个示例，在步骤(c)中，如果所述最大第二相似度得分大于或等于第二阈值，则所述对象检测系统(1)指示所述短期更新单元将包括在目标数据向量中的、包括第一目标分量到第N目标分量的各目标分量，与包括在特定短期更新向量中的、包括第一更新分量到第N更新分量的各更新分量进行比较，(2)指示所述短期更新单元，(i)如果第K个目标分量对应于代表数据不存在的第一符号(Notation)，而第K个更新分量对应于代表某个值的第二符号，则将所述第K目标分量替换为所述第K个更新分量，其中，K为 1到N之间的整数，(ii)如果所述第K个目标分量对应于第二符号，而第K 个更新分量对应于第一符号，则保持第K个目标分量，(iii)如果所述第K 个目标分量和所述第K个更新分量均对应于第二符号，则用第K个目标分量和第K个更新分量的加权和(Weighted Sum)来更新第K个目标分量，以及 (iv)如果所述第K个目标分量和所述第K个更新分量均对应于第一符号，则保持所述第K个目标分量。

作为一个示例，在步骤(c)中，如果在数据向量中不存在其类别信息与特定短期更新向量的类别信息相同的特定数据向量，则对象检测系统指示短期更新单元将所述特定短期更新向量添加到特征指纹数据库。

作为一个示例，该方法还包括步骤：(d)所述对象检测系统指示长期更新单元(Long-Term Update Unit)生成一个或多个长期更新向量，所述长期更新向量对应于与所述短期更新单元使用之后存储在至少一个已知图像数据库(已知图像DB)中的、包括所述特定局部图像的一个或多个局部图像以及与其相对应的类别信息，所述类别信息表示所述对象检测系统所包括的一个或多个对象类别，，通过使用长期更新向量来更新特征指纹数据库，其中，每个所述长期更新向量包括：基准部分，其包括由所述识别器使用每一个所述局部图像而生成的一个或多个值；以及类别部分，其包括表示每个所述类别信息的一个或多个值。

作为一个示例，在步骤(d)中，对象检测系统指示所述长期更新单元(i) 计算每个所述长期更新向量之间的一个或多个第三相似度得分，(ii)合并其类别信息彼此相同的所述长期更新向量的一部分，以生成一个或多个整合的长期更新向量(Integrated Long-Term Update Vector)，并将整合后的长期更新向量和未合并的剩余长期更新向量(Remaining Long-Term Update Vector)添加到特征指纹数据库，从而更新所述特征指纹数据库。

作为一个例子，在步骤(b)中，所述对象检测系统指示所述相似度确定单元通过使用以下公式来计算第一相似度得分中的一个：

S＝e^-|Q-D|

其中Q为特定查询向量，D为数据向量中的一个。

作为一个示例，在步骤(a)中，对象检测系统(i)指示与所述识别器相对应的RPN检测所述输入图像中包括的特定ROI，之后(ii)指示与所述识别器相对应的一个或多个关键点检测器(Keypoint Detector)检测在特定局部图像上与所述特定ROI相对应的一个或多个关键区域(Key Region)，(iii) 指示与所述识别器相对应的特征提取器(FeatureExtractor)通过使用所述特定局部图像来生成所述特定特征映射，之后(iv)指示所述识别器通过使用与所述特定特征映射中的关键区域相对应的值来生成所述特定查询向量。

作为一个示例，所述特征提取器包括一个或多个卷积层，其具有一个或多个卷积神经元(Convolutional Neuron)，通过指示每个卷积神经元使用其自身的参数对它们的输入值进行卷积运算并将其结果传递给下一个神经元，从而从特定的局部图像中提取所述特定的特征映射，其中，所述参数是通过在步骤(a)之前执行的训练过程确定的。

根据本发明的另一方面，提供了一种对象检测系统，其能够更新自身以实时检测具有未经训练的类别的对象，其包括：至少一个存储指令的存储器；和至少一个处理器，该处理器配置为执行指令以进行以下处理：(I)如果获取到至少一个输入图像，则指示包括在所述对象检测系统中的识别器生成与包括输入图像的特定对象的特定ROI相对应的特定特征映射，并通过使用所述特定特征映射来生成与特定对象相对应的特定查询向量；(II)指示相似性确定单元(i)将特定查询向量与至少一个特征指纹数据库中包括的一个或多个数据向量进行比较，该特征指纹数据库用于检测要输入到所述对象检测系统中的图像的对象，从而计算出每个特定查询向量和每个数据向量之间的一个或多个第一相似度得分，(ii)如果在第一相似度得分中最大的特定第一相似度得分小于预设的第一阈值，则将与特定ROI相对应的特定局部图像追加到用于更新所述特征指纹数据库的未知图像数据库；(III)如果获取到与所述特定局部图像相对应的特定类别信息，则指示短期更新单元通过使用所述特定类别信息与对应于由所述识别器生成的所述特定对象的特定分量向量，生成与所述特定对象相对应的特定短期更新向量，然后使用所述特定的短期更新向量来更新特征指纹数据库。

作为一个示例，在(III)的处理中，所述处理器指示短期更新单元(i) 计算在所述数据向量中具有与所述特定短期更新向量相同的类别信息的特定数据向量和所述特定短期更新向量之间的一个或多个第二相似度得分中的，(ii)在所述第二相似度得分中选择最大值，(iii)(iii-1)如果最大第二相似性得分大于或等于预定的第二阈值，则通过使用所述特定短期更新向量来更新与最大第二相似度得分对应的目标数据向量，以及(iii-2)如果所述最大第二相似性得分小于所述第二阈值，则将所述特定短期更新向量追加到特征指纹数据库，从而更新特征指纹数据库。

作为一个示例，在(III)的处理中，如果所述最大第二相似度得分大于或等于第二阈值，则处理器(I)指示短期更新单元将包括在目标数据向量中的、包括第一目标分量到第N目标分量的目标分量的每一个，与包括在特定短期更新向量中的、包括第一更新向量到第N更新向量的更新分量的每一个进行比较，(II)指示所述短期更新单元，(i)如果第K个目标分量对应于代表数据不存在的第一符号，而第K个更新分量对应于代表某个值的第二符号，则将第K目标分量替换为所述第K个更新分量，其中，K为1到N之间的整数，(ii)如果第K个目标分量对应于第二符号，而第K个更新分量对应于第一符号，则保持第K个目标分量，(iii)如果第K个目标分量和第 K个更新分量均对应于第二符号，则用所述第K个目标分量和所述第K个更新分量的加权和来更新第K个目标分量，以及(iv)如果所述第K个目标分量和第K个更新分量都均应于第一符号，则保持第K个目标分量。

作为一个示例，在(III)的处理中，如果在数据向量中不存在具有与所述特定短期更新向量相同的类别信息的所述特定数据向量，则所述处理器指示所述短期更新单元将所述特定短期更新向量添加到特征指纹数据库。

作为一个示例，所述处理器进一步执行以下过程：(IV)指示长期更新单元生成一个或多个长期更新向量，所述长期更新向量对应于与所述短期更新单元使用之后存储在至少一个已知图像数据库中的、包括所述特定局部图像的一个或多个局部图像以及与其相对应的类别信息，所述类别信息表示所述对象检测系统所包括的一个或多个对象类别，，通过使用长期更新向量来更新特征指纹DB，其中，每个所述长期更新向量包括：基准部分，其包括由所述识别器使用每一个所述局部图像而生成的一个或多个值；以及类别部分，其包括表示每个所述类别信息的一个或多个值。

作为一个示例，在(IV)的处理中，所述处理器指示长期更新单元(i) 计算每个所述长期更新向量之间的一个或多个第三相似度得分，(ii)合并其类别信息彼此相同的长期更新向量的一部分，以生成一个或多个整合的长期更新向量，并将整合后的长期更新向量和未合并的剩余长期更新向量添加到所述特征指纹数据库，从而更新特征指纹数据库。

作为一个示例，在(II)的处理中，所述处理器指示相似度确定单元通过使用以下公式来计算第一相似度得分中的一个：

S＝e^-|Q-D|

其中Q为特定查询向量，D为所述数据向量中的一个。

作为一个示例，在(I)的处理中，所述处理器(i)指示与所述识别器相对应的RPN检测所述输入图像中包括的特定ROI，之后(ii)指示与所述识别器相对应的一个或多个关键点检测器检测在所述特定局部图像上与所述特定ROI相对应的一个或多个关键区域，(iii)指示与所述识别器相对应的特征提取器通过使用所述特定局部图像来生成上述特定特征映射，之后(iv) 指示所述识别器通过使用与所述特定特征映射中的所述关键区域相对应的值来生成所述特定查询向量。

作为一个示例，所述特征提取器包括一个或多个卷积层，其具有一个或多个卷积神经元，通过指示每个卷积神经元使用其自身的参数对它们的输入值进行卷积运算并将其结果传递给下一个神经元，从而从所述特定的局部图像中提取所述特定的特征映射，其中，所述参数是通过在(I)处理之前执行的训练过程确定的。

另外，还提供了可由计算机读取以用于存储计算机程序以执行本发明的方法的可记录介质。

发明效果

本发明提供一种能够实时更新可检测类的类别的对象检测系统，从而具有允许长时间运行的自动驾驶车辆的安全驾驶的效果。

附图说明

以下用于解释本公开的示例性实施例的附图仅是本公开的示例性实施例的一部分，并且本领域技术人员无需进行创造性劳动即可基于这些附图获得其他附图。

图1为示意性地示出了根据本发明的一个示例实施例的对象检测系统的配置的图，该对象检测系统执行用于提供能够实时更新可检测类的类别的对象检测系统的方法。

图2为示意性地示出了根据本发明的一个示例实施例的，通过能够实时更新可检测类的类别的对象检测系统来检测至少一个图像中的每个物体的类别的过程的图。

图3为示意性地示出了根据本发明的一个示例性实施例的，执行能够实时更新可检测类的类别的对象检测系统的短期更新的过程的图。

图4为示意性地示出了根据本发明的一个示例性实施例的，执行能够实时更新可检测类的类别的对象检测系统的长期更新的过程的图。

具体实施方式

下面对本发明进行的详细说明参照作为能够实施本发明的特定实施例示例示出的附图。对这些实施例进行了足够详细的描述，以使本领域技术人员能够实施本发明。。应当理解，本发明的各种实施例是不同的，但是不必相互排斥。例如，在此记载的某些形状，结构和特性可以在不偏离一个实施例的本发明的精神和范围内，在其他实施例中体现。另外，应当理解，在不脱离本发明的精神和范围的情况下，可以改变每个公开的实施例中的各个组件的位置或布置。因此，以下详细描述不应被理解为限制性的，并且本发明的范围，如果适当地描述，仅由所附权利要求书以及这些权利要求书所享有的等同物的全部范围来限定。在各个方面，附图中相似的附图标记指代相同或相似的功能。

此外，在本发明的详细描述和权利要求中，术语“包括”及其变体并不旨在排除其他技术特征、添加物、组件或步骤。本发明的其他目的、好处和特征将部分地从说明书中并且部分地从本公开的实施中向本领域技术人员揭示。以下示例和附图将作为示例提供，但是它们并不意图限制本公开。

本公开内容中提及的任何图像都可以包括与任何已铺设或未铺设的道路有关的图像，在这种情况下，能够假设为可能出现在与道路有关的场景中的物体可能包括车辆、人员、动物、植物、物体、建筑物、飞行物体 (例如飞机或无人机)，或其他障碍物，但是本发明的范围不限于此。作为另一示例，本发明中提及的所述任何图像可以包括与任何道路都不相关的图像，诸如与土路、小巷、空地、海洋、湖泊、河流、山脉、森林、沙漠、天空或任何室内空间有关的图像，在这种情况下，能够假设为土路、小巷、空地、海洋、湖泊、河流、山脉、森林、沙漠、天空或任何室内场景中的物体(例如、车辆、人员、动物、植物、物体、建筑物、飞机或无人机等飞行物体、任何其他障碍物)，但是本发明的范围不限于此。

为了使本领域技术人员能够容易地实施本公开，将通过参考附图详细说明本发明的示例实施方式，如下所示。

通过参考图1，对象检测系统100可以包括稍后描述的识别器110、特征指纹数据库120、未知图像数据库130和已知图像数据库140。识别器 110、特征指纹数据库120、未知图像数据库130和已知图像数据库140的输入/输出处理和计算可以分别由对象检测系统100包括的通信部分和处理器来执行。此外，对象检测系统100中的存储器(未示出)可以已经存储了稍后将描述的各种指令，处理器(未示出)可以执行存储在存储器(未示出)中的指令(Instruction)，并且可以通过执行稍后将发明的指令来执行本发明的处理。对对象检测系统100的这种描述不排除包括处理器，介质、存储器或任何其他计算组件的任何组合的集成设备。

此外，对象检测系统100可以包括相似性确定单元(未示出)，短期更新单元(未示出)和长期更新单元(未示出)。

具体地，识别器110可以生成(i)在至少一个输入图像上的目标的位置信息和(ii)包括该位置信息的ROI的至少一个特征映射，然后可以通过参考每个特征映射来生成每个对象的每个查询向量。特征指纹数据库120 可以存储数据向量，以通过数据向量和查询向量之间的比较来推导与查询向量相对应的对象的类别信息。在特征指纹数据库120不具有与对应于所述对象的查询向量的相似性得分等于或大于预定的第一阈值的数据向量的情况下，未知图像数据库130可存储与所述对象相对应的输入图像的一部分，用于更新将来由对象检测系统100检测到的类的类别。已知图像数据库140可存储(i)输入到对象检测系统100中的一个或多个局部图像，其每个图像精确地包围未识别的对象，(ii)由程序员确认并输入其中的它们的相应信息，以供稍后描述的长期更新使用。

此外，对象检测系统100可包括(i)相似性确定单元(未示出)，该相似性确定单元可将查询向量与特征指纹数据库120中包括的数据向量进行比较，这将在后面说明，(ii)短期更新单元(未示出)，以及(iii)长期更新单元(未示出)。这些单元可配置为软件或硬件。

上面描述了根据本发明的一个示例实施例的能够实时更新可检测类的类别的对象检测系统100的配置，将要描述的是物体检测系统100检测输入图像中的对象的方法，以及进行短期更新以及长期更新的方法。参考图2 对此进行解释。

图2是示意性地示出了根据本发明的一个示例性实施例的，通过能够实时更新可检测类的类别的对象检测系统100来检测至少一个图像中的每个物体的类别的过程的图。

参照图2，示出了识别器110中包括的N个关键点检测器111和特征提取器112。关键点检测器111可以检测其输入图像中的至少一个关键区域。该关键区域对于检测物体来说是非常重要的部分。这是因为类别的检测是通过比较关键区域的至少一个特征和存储在特征指纹数据库120中的特征来进行的，如稍后将描述的。这样的关键点检测器111可以是预先学习的。特征提取器112可以将一个或多个卷积运算应用于输入图像，从而生成至少一个特征映射。该特征提取器也可以是预先学习的。例如，特征提取器可包括一个或多个卷积层，其包括一个或多个卷积神经元。并且特征提取器可以通过指示每个卷积神经元通过使用其自己的参数对它们的输入值应用卷积运算，将其结果传递给下一个神经元，从而从其输入图像中提取特征映射，并。参数可以在开始本发明的处理步骤之前通过训练过程来确定。

如果获取到输入图像，则对象检测网络可指示至少一个RPN生成输入图像的一个或多个ROI，并且可通过在输入图像上裁剪(Crop)与每个ROI 相对应的每个区域来生成每个局部图像。或者，输入图像本身可以是包括单个对象的图像，类似于每个局部图像。此后，识别器110可以生成与特定局部图像相对应的特定查询向量，并且为了这个目的，识别器110可指示其中包括的关键点检测器111(包括在识别器110中)检测特定局部图像上的关键区域。另外，识别器110可以指示特征提取器生成与特定局部图像相对应的至少一个特定特征映射。此后，识别器110可指示查询单元通过关键点检测器检测到的特定局部图像中的每个关键区域相对应的特定特征映射的值来生成特定查询向量。此时，与每个关键点检测器相对应的每个值可位于特定查询向量上的每个对应位置上。图2中也可以确认这种过程的一个例子。图2的查询向量中表示“不存在(Not Present)”的查询向量的示例的构成要素是指与每个构成要素相对应的每个关键点检测器111无法在输入图像上找到与每个关键点检测器相对应的每个关键区域。与除特定局部图像之外的局部图像相对应的其他查询向量可通过与如上所述的特定查询向量的生成处理步骤类似的处理步骤来生成。

此后，可将这样生成的特定查询向量发送到特征指纹数据库120，然后将其与存储在特征指纹数据库120中的数据向量进行比较。在比较的过程中，可生成每个数据向量和特定查询向量之间的每个第一相似度得分，其可以是向量之间的欧几里德距离(Euclideandistance)的绝对值的负幂的指数，即，e^{-|euclidean distance|}，或者可以是向量之间的余弦距离(Cosine Distance)。如果使用欧几里得距离生成相似度得分，则如下式所示。

S＝e^-|Q-D|

在这里，Q可以是特定查询向量，而D可以是数据向量之一。

在查询向量中，表示为“不存在”的分量不用于计算第一相似性得分，并且仅将包括与查询向量中的“不存在”对应的所有构成要素的数据向量用于计算第一相似度得分。

以图2中的示例为例，比较图2中的示例查询向量和存储在特征指纹数据库120中的与每个汽车品牌相对应的数据向量。在特征指纹数据库120中，存储了现代(Hyundai)类的重复数据向量，这些是具有从各个角度拍摄的图像的现代类中所包括的车辆的数据向量。这是因为特征指纹数据库120的这种配置在不考虑物体的角度的情况下就可以执行物体的检测。如上所述，图 2中的查询向量的示例，如上所述，与雪铁龙和奥迪的数据向量一起可用于第一相似性得分的计算。

在计算出特定查询向量的相似性得分之后，如果第一相似度得分中的最大值等于或大于预定的第一阈值，则对象检测系统100可以输出与最大值相对应的类别作为与特定查询向量相对应的特定对象的类别。如果第一相似度得分的最大值小于预定的第一阈值，则特定局部图像可以存储在未知图像数据库130中，并且对象检测系统100可以将代表输入图像的对象检测的结果不成功的日志(Log)发送给程序员。

如果如上所述在未知图像数据库130中存储与输入图像相同的局部图像，则对象检测系统可以执行短期更新。参考图3对此进行解释。

通过参考图3，程序员可确认存储在未知图像数据库130中的图像，并且可确定并输入图像的类别。这种包括存储在未知图像数据库130中的图像及其相应的附加类别信息的更新集(Update Set)可发送到已知图像数据库140，并且在稍后将描述的长期更新期间使用。另外，可以将更新集发送到识别器 110，并用于短期更新。

识别器110可以获取更新集并生成短期更新向量。具体地，识别器110 可以将附加类别信息追加在分量向量中，该分量向量通过前述生成查询向量的方式相同或相似的方式生成，从而通过使用更新集中的图像来生成短期更新向量。在一实施例中，查询向量可以一起存储在已知图像数据库140中，并且当执行短期更新时可以使用这样的查询向量。即，查询向量和分量向量基本相同。此后，可将短期更新向量传送到特征指纹数据库120。

首先，如果附加类别信息所包括的类别中不存在对应于存储在针对特定短期更新向量的特征指纹数据库120中的任何数据向量，则意味着第一次检测到与特定短期更新向量的类别相对应的特定对象，因此为了将来检测相同类别的对象，可将特定的短期更新向量作为与新类别相对应的新数据向量存储在特征指纹数据库中。

但是，如果附加类别信息中所包括的类别对应于存储在特征指纹数据库 120中的数据向量之一，则该类别属于之前已经被检测到，但是由于其不合适的数据向量而未被检测的类别，因此可以更新与该类别相对应的一组数据向量。此时，将特定短期更新向量作为与该类别相对应的新的数据向量来进行追加，还是更新现有的数据向量，此确认步骤通过下述说明的方法来决定。

对象检测系统100可以将特定短期更新向量中包括的每个值与数据向量中包括的的与其相对应值进行比较，从而以与前述方式类似的方式生成与每个数据向量相对应的每个第二相似度得分。在此，如果不存在具有等于或大于预定的第二阈值的第二相似度得分的数据向量，则可以将短期更新向量作为与该类别相对应的新数据向量来追加。然而，如果存在等于或大于预定的第二阈值的相似度得分的目标数据向量，则可以通过使用短期更新向量来更新目标数据向量。

更具体地，对象检测系统100可指示短期更新单元在第二相似性得分中选择最大值。并且，如果所选择的最大第二相似性得分大于或等于第二阈值，则对象检测系统100可以指示短期更新单元通过使用特定的短期更新向量来更新与最大的第二相似性得分相对应的目标数据向量。相反，如果最大的第二相似性得分小于第二阈值，则对象检测系统100可以指示短期更新向量将特定的短期更新向量追加到特征指纹数据库0。

将说明如何通过使用短期更新向量来更新目标数据向量。目标数据向量包括N个目标分量，特定短期更新向量包括N个更新分量的情况下，如果第K个目标分量对应于代表数据不存在的第一符号，而第K个更新分量对应于代表某个值的第二符号，则对象检测系统100可指示短期更新单元用第 K个更新分量替换第K个目标分量，其中K是1到N之间的整数。或者，如果第K个目标分量对应于第二符号，而第K个更新分量对应于第一符号，则对象检测系统100可以指示短期更新单元保持第K个目标分量。在其他情况下，例如，如果第K个目标分量和第K个更新分量都对应于第二符号，则对象检测系统100可指示短期更新单元以第K个目标分量和第K个更新分量的加权和来更新第K个目标分量，如果第K个目标分量和第K个更新分量均与第一符号相对应，则对象检测系统100可指示短期更新单元保持第 K个目标分量。

简言之，如果数据向量中表示“不存在”的分量在短期更新向量中不是“不存在”，则可以更新数据向量的分量以具有短期更新向量的对应值。如果分量都不是“不存在”，则可以通过使用两个分量的加权和来更新这些分量。尽管可以通过短期更新来检测新类别的对象和改善现有类别的对象的检测，但是为了进一步优化而进行长期更新的方法描述如下。

图4为示意性地示出了根据本发明的一实施例的，执行能够实时更新可检测类的类别的对象检测系统的长期更新的过程的图。

通过参考图4，可通过使用存储在已知图像数据库140中的图像来执行长期更新。已知图像数据库140可以具有已经用于短期更新的几个更新集。为了长期更新，对象检测系统100可指示识别器110通过使用更新集来生成至少一个长期更新向量。这里，可以以类似于生成短期更新向量的方式来生成长期更新向量。即，每个长期更新向量还可包括(i)与关键点检测器111 相对应的值和(ii)包括图像的类别信息。

这样的长期更新向量可经过整合对应于相同类别的向量的过程。即，在对应于相同类别的向量中，可通过使用它们的加权和来更新和整合它们的每个分量。例如，假设对应于特定类别的三个向量分别是(1a，0，3a，0，5a)， (1b，2b，0，0，5b)和(0，2c，0，0，5c)。类别信息的部分已省略，“不存在”显示为0。在此，例如，可以将整合向量计算为((1a+2b)/2，(2b+ 2c)/2，(3a)，0，(5a+5b+5c)/3)。可通过更新特征指纹数据库120来优化特征指纹数据库120，使得对于每个类别整合的向量存储在特征指纹数据库120中。这里，可选择一些具有相同类别信息的长期更新向量的一部分且大于预定的第三阈值的长期更新向量之间的第三相似性得分进行合并，以便优化更新过程。计算第三相似度得分的过程可以与计算第一相似度得分和第二相似度得分的过程相同或相似。

因此，可通过优化特征指纹数据库120并更新新检测到的类别来安全地运行自动驾驶车辆。

如上所述的本发明的实施例可以通过可记录到计算机可读记录介质的各种计算机装置以可执行程序命令的形式来实现。计算机可读介质可以单独地或组合地包括程序命令、数据文件和数据结构等。记录到所述计算机可读记录介质的程序命令可以是专门为本发明设计并构成的命令，可以是对计算机软件领域的技术人员公知的可用的命令。计算机可读记录介质包括磁性介质(例如硬盘、软盘和磁带)、光学介质(例如CD-ROM和DVD)、磁光介质(例如光磁软盘(floptical disk))和硬件设备(例如专门设计用于存储和执行程序命令的ROM，RAM以及闪存)。所述程序命令不仅包括由编译器生成的机器语言代码，而且包括可由计算机使用解释器等执行的高级语言代码。上述硬件设备可以作为至少一个软件模块来执行本发明的处理，反之亦然。

如上所述，本发明已通过诸如详细的构成要素等特定事项以及有限的实施例和附图来进行说明。提供它们仅仅是为了帮助对本发明的进一步整体上的理解。然而，可以在不背离如所附权利要求所限定的本发明的主旨和范围的前提下，根据说明书进行各种改变和修改。

因此，本发明的思想不应该限于所解释的实施例，并且以下权利要求书以及包括与权利要求书的范围等同或等价的变型在内的所有内容都属于本发明的思想范畴。

Claims

1.一种用于实时更新对象检测系统以检测具有未训练的类别的对象的方法，包括以下步骤：

(a)如果获取到至少一个输入图像，则所述对象检测系统指示其包括的识别器生成特定特征映射，所述特定特征映射与包括所述输入图像的特定目标的特定ROI相对应，并通过使用所述特定特征映射生成与所述特定目标相对应的特定查询向量；

(b)所述对象检测系统指示相似性确定单元(i)将特定查询向量与至少一个特征指纹数据库所包括的一个或多个数据向量进行比较，所述特征指纹数据库用于检测向所述对象检测系统输入的图像目标，从而计算所述特定查询向量与每一个所述数据向量之间的每一个一个或多个第一相似度得分，并且(ii)如果在所述第一相似度得分中最大的特定第一相似度得分小于预定的第一阈值，将与所述特定ROI相对应的特定局部图像追加到未知图像数据库，以用于更新所述特征指纹数据库；

(c)如果获取到与所述特定局部图像相对应的特定类别信息，所述对象检测系统指示短期更新单元通过使用所述特定类别信息和与所述特定目标对应的、由识别器生成的特定分量向量，生成与特定目标对应的特定短期更新向量，然后使用所述特定短期更新向量更新特征指纹数据库。

2.如权利要求1所述的方法，其特征在于，在步骤(c)中，所述对象检测系统指示所述短期更新单元(i)计算在数据向量中与特定短期更新向量的类别信息相同的特定数据向量和所述特定短期更新向量之间的一个或多个第二相似度得分的每一个，(ii)在所述第二相似度得分中选择最大值，(iii)(iii-1)如果所述最大第二相似度得分大于或等于预定的第二阈值，通过使用所述特定短期更新向量更新与所述最大第二相似度得分对应的目标数据向量，(iii-2)如果所述最大第二相似度得分小于所述第二阈值，则将所述特定短期更新向量追加到所述特征指纹数据库，从而更新所述特征指纹数据库。

3.如权利要求2所述的方法，其特征在于，在步骤(c)中，如果所述最大第二相似度得分大于或等于所述第二阈值，所述对象检测系统(1)指示所述短期更新单元将包括在所述目标数据向量中的、包括第一目标分量到第N目标分量的目标分量的每一个，与包括在特定短期更新向量中的、包括第一更新分量到第N更新分量的更新分量的每一个进行比较，(2)指示所述短期更新单元，(i)如果第K个目标分量对应于代表数据不存在的第一符号，而第K个更新分量对应于代表某个值的第二符号，则将所述第K个目标分量替换为所述第K个更新分量，其中，K为1到N之间的整数，(ii)如果所述第K个目标分量对应于所述第二符号，而所述第K个更新分量对应于所述第一符号，则保持所述第K个目标分量，(iii)如果所述第K个目标分量和所述第K个更新分量均对应于所述第二符号，则用所述第K个目标分量和所述第K个更新分量的加权和来更新第K个目标分量，(iv)如果所述第K个目标分量和所述第K个更新分量均对应于第一符号，则保持所述第K个目标分量。

4.如权利要求1所述的方法，其特征在于，在步骤(c)中，如果在数据向量中不存在与特定短期更新向量相同的类别信息的特定数据向量，则所述对象检测系统指示所述短期更新单元将所述特定短期更新向量追加到所述特征指纹数据库。

5.如权利要求1所述的方法，其特征在于，该方法还包括步骤：

(d)所述对象检测系统指示长期更新单元生成一个或多个长期更新向量，所述长期更新向量对应于与所述短期更新单元使用之后存储在至少一个已知图像数据库中的、包括所述特定局部图像的一个或多个局部图像以及与其相对应的类别信息，所述类别信息表示所述对象检测系统所包括的一个或多个对象类别，通过使用所述长期更新向量来更新所述特征指纹数据库，

其中，每个所述长期更新向量包括：基准部分，其包括由所述识别器使用每一个所述局部图像而生成的一个或多个值；以及类别部分，其包括表示每个所述类别信息的一个或多个值。

6.如权利要求5所述的方法，其特征在于，在步骤(d)中，所述对象检测系统指示所述长期更新单元(i)计算每个所述长期更新向量之间的一个或多个第三相似度得分，(ii)合并其类别信息彼此相同的所述长期更新向量的部分，以生成一个或多个整合的长期更新向量，并将所述整合的长期更新向量和未合并的剩余长期更新向量追加到所述特征指纹数据库，从而更新所述特征指纹数据库。

7.如权利要求1所述的方法，其特征在于，在步骤(b)中，所述对象检测系统指示所述相似度确定单元通过使用以下公式来计算第一相似度得分中的一个：

S＝e^-|Q-D|

其中Q为特定查询向量，D为数据向量中的一个。

8.如权利要求1所述的方法，其特征在于，在步骤(a)中，所述对象检测系统(i)指示与所述识别器相对应的RPN检测所述输入图像中包括的所述特定ROI，之后(ii)指示与所述识别器相对应的一个或多个关键点检测器检测在所述特定局部图像上与特定ROI相对应的一个或多个关键区域，(iii)指示与所述识别器相对应的特征提取器通过使用特定局部图像来生成特定特征映射，之后(iv)指示所述识别器通过使用与所述特定特征映射中的所述关键区域相对应的值来生成所述特定查询向量。

9.如权利要求1所述的方法，其特征在于，所述特征提取器包括一个或多个卷积层，所述卷积层具有一个或多个卷积神经元，通过指示每个卷积神经元使用其自身的参数对它们的输入值进行卷积运算并将其结果传递给下一个神经元，从而从所述特定局部图像中提取所述特定特征映射，

所述参数是通过在步骤(a)之前执行的训练过程确定的。

10.一种对象检测系统，该系统实时更新自身以检测具有未训练的类别的对象，其包括：

至少一个存储指令的存储器；和

至少一个处理器，其配置为执行指令以进行以下处理：(I)如果获取到至少一个输入图像，则指示包括在所述对象检测系统中的识别器生成与包括输入图像的特定对象的特定ROI相对应的特定特征映射，并通过使用所述特定特征映射来生成与特定对象相对应的特定查询向量；(II)指示相似性确定单元(i)将特定查询向量与至少一个特征指纹数据库中包括的一个或多个数据向量进行比较，该特征指纹数据库用于检测要输入到所述对象检测系统的图像的对象，从而计算出每个特定查询向量和每个数据向量之间的一个或多个第一相似度得分，(ii)如果在第一相似度得分中最大的特定第一相似度得分小于预定的第一阈值，则将与特定ROI相对应的特定局部图像追加到用于更新特征指纹数据库的未知图像数据库；以及(III)如果获取到与所述特定局部图像相对应的特定类别信息，则指示短期更新单元通过使用与所述特定类别信息和由所述识别器生成的所述特定对象相对应的特定分量向量，生成与所述特定对象相对应的特定短期更新向量，然后使用该特定的短期更新向量来更新所述特征指纹数据库。

11.如权利要求10所述的对象检测系统，其特征在于，在(III)的处理中，所述处理器指示所述短期更新单元(i)计算在所述数据向量中具有与所述特定短期更新向量相同的类别信息的特定数据向量和所述特定短期更新向量之间的一个或多个第二相似度得分中的每一个，(ii)在所述第二相似度得分中选择最大值，(iii)(iii-1)如果最大第二相似性得分大于或等于预定的第二阈值，则通过使用所述特定的短期更新向量来更新与所述最大第二相似度得分对应的目标数据向量，(iii-2)如果所述最大第二相似性得分小于第二阈值，则将特定的短期更新向量追加到特征指纹数据库，从而更新特征指纹数据库。

12.如权利要求10所述的对象检测系统，其特征在于，在(III)的处理中，如果所述最大第二相似度得分大于或等于第二阈值，则所述处理器(I)指示所述短期更新单元将包括在目标数据向量中的、包括第一目标分量到第N目标分量的目标分量的每一个，与包括在所述特定短期更新向量中的、包括第一更新分量到第N更新分量的更新分量的每一个进行比较，(II)指示短期更新单元，(i)如果第K个目标分量对应于代表数据不存在的第一符号，而第K个更新分量对应于代表某个值的第二符号，则将第K目标分量替换为第K个更新分量，其中，K为1到N之间的整数，(ii)如果第K个目标分量对应于第二符号，而第K个更新分量对应于第一符号，则保持第K个目标分量，(iii)如果第K个目标分量和第K个更新分量均对应于第二符号，则用第K个目标分量和第K个更新分量的加权和来更新第K个目标分量，以及(iv)如果第K个目标分量和第K个更新分量都对应于第一符号，则保持第K个目标分量。

13.如权利要求10所述的对象检测系统，其特征在于，在(III)的处理中，如果在所述数据向量中不存在具有与所述特定短期更新向量的类别信息相同的所述特定数据向量，则所述对象检测系统指示短期更新单元将特定短期更新向量追加到特征指纹数据库。

14.如权利要求10所述的对象检测系统，其特征在于，所述处理器被配置为进一步执行以下步骤：

(IV)指示长期更新单元生成一个或多个长期更新向量，所述长期更新向量对应于与所述短期更新单元使用之后存储在至少一个已知图像数据库中的、包括所述特定局部图像的一个或多个局部图像以及与其相对应的类别信息，所述类别信息表示所述对象检测系统所包括的一个或多个对象类别，通过使用所述长期更新向量来更新所述特征指纹数据库，

15.如权利要求14所述的对象检测系统，其特征在于，在(IV)的处理中，所述处理器指示所述长期更新单元(i)计算每个所述长期更新向量之间的一个或多个第三相似度得分，(ii)合并其类别信息彼此相同的一些长期更新向量，以生成一个或多个整合的长期更新向量，并将整合后的长期更新向量和未合并的剩余长期更新向量追加到特征指纹数据库，从而更新特征指纹数据库。

16.如权利要求10所述的对象检测系统，其特征在于，在(II)的处理中，所述处理器指示所述相似度确定单元通过使用以下公式来计算所述第一相似度得分中的一个：

S＝e^-|Q-D|

其中Q为所述特定查询向量，D为所述数据向量中的一个。

17.如权利要求10所述的对象检测系统，其特征在于，在(I)的处理中，所述处理器(i)指示与所述识别器相对应的RPN检测输入图像中包括的特定ROI，之后(ii)指示与所述识别器相对应的一个或多个关键点检测器检测在特定局部图像上与特定ROI相对应的一个或多个关键区域，(iii)指示与所述识别器相对应的特征提取器通过使用所述特定局部图像来生成所述特定特征映射，之后(iv)指示所述识别器通过使用与所述特定特征映射中的关键区域相对应的值来生成所述特定查询向量。

18.如权利要求10所述的对象检测系统，其特征在于，所述特征提取器包括一个或多个卷积层，所述卷积层具有一个或多个卷积神经元，通过指示每个所述卷积神经元使用其自身的参数对它们的输入值进行卷积运算并将其结果传递给下一个神经元，从而从特定的局部图像中提取特定的特征映射，

所述参数是通过在所述步骤(I)之前执行的训练过程确定的。