CN113011454A - 使用有噪声的标记和域适配来进行鲁棒的主动学习方法的系统和方法 - Google Patents
使用有噪声的标记和域适配来进行鲁棒的主动学习方法的系统和方法 Download PDFInfo
- Publication number
- CN113011454A CN113011454A CN202011509171.9A CN202011509171A CN113011454A CN 113011454 A CN113011454 A CN 113011454A CN 202011509171 A CN202011509171 A CN 202011509171A CN 113011454 A CN113011454 A CN 113011454A
- Authority
- CN
- China
- Prior art keywords
- learning algorithm
- classifier
- active learning
- data set
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000006978 adaptation Effects 0.000 title claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 89
- 238000010801 machine learning Methods 0.000 claims description 49
- 238000012549 training Methods 0.000 claims description 23
- 238000013135 deep learning Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 description 15
- 238000005070 sampling Methods 0.000 description 13
- 238000002372 labelling Methods 0.000 description 12
- 238000011176 pooling Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000009826 distribution Methods 0.000 description 7
- 230000003042 antagnostic effect Effects 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 101100533306 Mus musculus Setx gene Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012285 ultrasound imaging Methods 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241000532123 Setia Species 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000003707 image sharpening Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
公开了一种用于使用来自另一个域或应用的有噪声的被标记的数据集、在标记预算约束和有噪声的预言(即,由注释器提供的有噪声的标记)的情况下标记未标记的数据集的系统和方法。该系统和方法将主动学习与有噪声的标记进行组合,并且将主动学习与域适配进行组合以增强分类性能。
Description
技术领域
以下内容总体上涉及用于使用有噪声的标记(noisy label)和域适配(domainadaptation)来进行鲁棒的主动学习的系统和方法。
背景技术
通常,对数据集进行标记可能涉及人工注释器,该人工注释器根据预定义的一组所允许的标记将一个或多个标记手动分配给样本。然而,以这种方式对数据集进行手动标记可能需要大量资源和时间。而且,这种手动标记可能会降低自动化机器学习系统的性能。
发明内容
公开了一种用于主动学习算法的系统和方法,该主动学习算法接收被噪声方式标记(noisily labeled)的源数据集。该系统和方法可以应用鲁棒深度学习算法来标识用于被噪声方式标记的源数据集的源分类器。可以使用对抗性域辨别(discrimination)机器学习算法来标识经适配的分类器。该系统和方法可以使用在源分类器上操作的对抗性机器学习算法(即,对抗性网络)来确定经适配的分类器。可以基于可操作地使用目标分类器和经适配的分类器的主动学习算法,将标记分配给未标记的目标数据集内的一个或多个样本。
该系统和方法还可以使用经适配的分类器来热启动主动学习算法。主动学习算法可以可操作以提供用于目标分类器的训练数据。调度器还可以控制用于热启动主动学习算法的持续时间。
设想到的是,鲁棒深度学习算法可以包括softmax层,接着是密集线性层,该密集线性层可操作以对被噪声方式标记的源数据集实行去噪。还可以使用基于最大熵的启发式算法或批主动学习算法来设计主动学习算法。当应用批主动学习算法时,可以每批地更新目标分类器。
附图说明
图1描绘了示例性计算系统。
图2图示了示例性卷积神经网络。
图3图示了主动学习算法的流程图。
图4图示了控制至少部分自主的机器人的计算系统。
图5是一实施例,其中计算机系统可以被用来控制自动化个人助理。
图6是一实施例,其中计算系统可以被用来控制访问控制系统。
图7是一实施例,其中计算系统可以被用来控制监控系统。
图8是一实施例,其中计算系统可以被用来控制成像系统。
具体实施方式
根据需要,在本文中公开了详细的实施例;然而,要理解的是,所公开的实施例仅仅是示例性的,并且可以以各种形式和替代形式来体现。各图不一定按比例绘制;一些特征可能被放大或最小化以示出特定组件的细节。因此,本文中公开的具体结构和功能细节不应被解释为是限制性的,而仅仅是作为教导本领域技术人员以各种方式采用本实施例的代表性基础。
在计算系统中,被标记的数据通常是已经利用一个或多个标记而被加标签的样本(例如,数字图像)。标记通常会采取一组未标记的数据,并且利用提供有用信息的有意义的标签来扩充该未标记的数据中的每一条。例如,标记可能被用来:(1)指示图像是否包括给定对象(例如,狗或猫);(2)识别语音记录内的口头语;或者(3)识别x射线图像内的指示肿瘤的形状。
可以以若干种不同的方式来获得在各种计算系统中使用的标记。例如,注释器(人类或机器)可以负责查看给定的图像,并且将分类应用于任何未标记的数据。这种注释可以包括:对给定图片是否包括特定对象(例如,狗或猫)进行标记。注释器还可以负责根据预定义的一组所允许的标记将一个或多个标记分配给样本。该标记过程可能需要大量资源和时间,并且可能成为对自动化机器学习系统(例如,卷积神经网络(CNN)或其他类型的深度神经网络(DNN))的性能的限制因素。
关于被标记的数据集,要理解的是,注释过程可以包括对“噪声”进行标记,该噪声是在标记过程期间发生的错误。错误标记可能由于各种原因而发生。例如,可用信息可能不足以实行可靠的标记(例如,图像可能属于较差质量,从而导致狗被标记为猫)。替代地,注释器可能会在标记过程期间出错。分类错误(即,噪声)的另一个来源可能会由于数据集的主观性而发生。例如,两个专家可能会检查x射线图像,并且得出不同的意见或结果。
对噪声进行标记还可以影响将在该被标记的数据上训练的机器学习系统的可靠性和性能。作为结果,将注释中的可能错误的影响最小化是朝向增加依赖于机器学习模型的系统的可靠性和性能的重要步骤。
附加地,设想到的是,可以重新使用先前注释的数据集以辅助对新数据集的注释。这种重新使用通常需要把在预先存在的数据集(即,源数据集)上训练的机器学习系统适配到新的未标记的数据集(即,目标数据集)。
还设想到的是,系统和方法可以被用来从未标记的数据集(即,目标数据集)中选择要以主动标记方式来标记的样本,以在深度学习或机器学习系统中使用。可以在标记预算约束下、在假设了来自注释器的噪声标记(有噪声的预言(oracle))的情况下实现这种系统和方法。预先存在的被标记的数据集(即,源数据集)可能已经从可能不同的应用中被开发(其中也可能存在有噪声的标记)。源数据集的存在和使用可以允许主动学习过程的热启动,并且源数据集还可以提供有关查询数量(标记预算)的改进的分类器性能。
除了分类错误之外,还要理解的是,在测试时间处应用的输入可能与训练数据集不同,从而导致机器学习模型无法按期望实行。例如,自主车辆通常尝试分割由汽车的相机系统所捕获的数字图像,以解释即将到来的对象(即,建筑物、树木、其他汽车、行人和交通灯)。给定的经训练的数据集可能已经基于给定城市(例如,纽约市)周围的图像而被开发和注释。基于经训练的数据集,机器学习模型可以在用于训练的城市中按期望进行操作。然而,如果在外国城市(例如,巴黎)驾驶该自主车辆,则同一经训练的数据集可能无法按期望进行操作,这是因为该数据集可能不能够识别出:交通灯看起来不同、汽车的样式看起来不同、以及街道是被不同地设计的。换句话说,机器学习模型可能不能够按期望进行操作,这是因为输入数据的域已改变,而任务域(标记)保持相同。
设想到的是,机器学习模型可以可操作以通过并入域适配训练模型来克服因域改变所致的分类错误,在域适配训练模型中,源分布可以在不同(但相关)的目标分布上使用。域适配可以使用一个或多个源域中的被标记的数据来解决目标域中的新任务。源域与目标域之间的相关性级别通常可以确定适配的成功。
还设想到的是,所公开的系统和方法可以利用来自域适配、主动学习和鲁棒深度学习的已知技术。通过对抗性学习的域适配可以被用来使用预训练的分类器将信息从源数据集有效地传递到目标数据集,该分类器可以热启动标记过程。主动学习(即,基于最大熵的启发式方法和批主动学习)可以被用来在标记了少量目标样本的情况下快速地实现分类器性能。可以在softmax的结束处使用附加的密集线性层以实行被标记的去噪从而实现鲁棒深度学习。设想到的是,可以在深度学习算法正在被训练的同时应用鲁棒深度学习。调度器也可以被用来控制热启动的持续时间和重要性。
图1图示了示例性系统100,该系统可以用于利用有噪声的标记和域适配在数据集上实行鲁棒主动学习。系统100可以包括至少一个计算设备102。计算系统102可以包括至少一个处理器104,该处理器可操作地连接到存储器单元108。处理器104可以是实现中央处理单元(CPU)106的功能的一个或多个集成电路。CPU 106可以是实现指令集(诸如x86、ARM、Power或MIPS指令集家族之一)的商业上可获得的处理单元。
在操作期间,CPU 106可以执行从存储器单元108中检索的所存储的程序指令。所存储的程序指令可以包括控制CPU 106的操作以实行本文中描述的操作的软件。在一些示例中,处理器104可以是片上系统(SoC),其将CPU 106、存储器单元108、网络接口和输入/输出接口的功能集成到单个集成设备中。计算系统102可以实现用于管理操作的各个方面的操作系统。
存储器单元108可以包括用于存储指令和数据的易失性存储器和非易失性存储器。非易失性存储器可以包括固态存储器(诸如,NAND闪速存储器)、磁性和光学存储介质、或者当计算系统102被停用或失去电力时保留数据的任何其他合适的数据存储设备。易失性存储器可以包括存储程序指令和数据的静态和动态随机存取存储器(RAM)。例如,存储器单元108可以存储机器学习模型110或算法、用于机器学习模型110的训练数据集112和/或原始源数据115。
计算系统102可以包括被配置成提供与外部系统和设备的通信的网络接口设备122。例如,网络接口设备122可以包括由电气和电子工程师协会(IEEE)802.11标准家族所定义的有线和/或无线以太网接口。网络接口设备122可以包括用于与蜂窝网络(例如,3G、4G、5G)进行通信的蜂窝通信接口。网络接口设备122可以进一步被配置成向外部网络124或云提供通信接口。
外部网络124可以被称为万维网或互联网。外部网络124可以在计算设备之间建立标准通信协议。外部网络124可以允许信息和数据在计算设备与网络之间容易地交换。一个或多个服务器130可以与外部网络124通信。
计算系统102可以包括输入/输出(I/O)接口120,I/O接口120可以被配置成提供数字和/或模拟输入和输出。I/O接口120可以包括用于与外部设备进行通信的附加串行接口(例如,通用串行总线(USB)接口)。
计算系统102可以包括人机接口(HMI)设备118,人机接口(HMI)设备118可以包括使得系统100能够接收控制输入的任何设备。输入设备的示例可以包括人机接口输入,诸如键盘、鼠标、触摸屏、语音输入设备和其他类似设备。计算系统102可以包括显示设备132。计算系统102可以包括用于将图形和文本信息输出到显示设备132的硬件和软件。显示设备132可以包括电子显示屏、投影仪、打印机、或用于向用户或操作员显示信息的其他合适设备。计算系统102可以进一步被配置成允许经由网络接口设备122与远程HMI和远程显示设备进行交互。
可以使用一个或多个计算系统来实现系统100。尽管该示例描绘了实现所有所描述的特征的单个计算系统102,但是所意图的是,可以通过彼此通信的多个计算单元来分离并实现各种特征和功能。所选择的特定系统架构可能取决于各种各样的因素。
系统100可以实现机器学习算法110,该机器学习算法110被配置成分析原始源数据115(或数据集)。原始源数据115可以包括原始或未处理的传感器数据,该传感器数据可以表示用于机器学习系统的输入数据集。原始源数据115可以包括视频、视频片段、图像以及原始或部分经处理的传感器数据(例如,来自数字相机或LiDAR传感器的数据)。在一些示例中,机器学习算法110可以是可被设计成实行预定功能的神经网络算法(即,CNN或DNN)。
例如,图2图示了CNN 200的非限制性示例,CNN 200包括:输入数据集210;一个或多个卷积层220-240;一个或多个池化层250-270;全连接层280;以及softmax层290。
输入数据集210可以包括原始图像、语音数据或文本数据。输入数据集210还可以包括从一个或多个传感器接收到的测量结果。替代地,在将输入数据集210提供给CNN 200之前,可以对输入数据集210进行轻微处理。卷积层220-240还可以可操作以从输入数据集210中提取特征。通常要理解的是,卷积层220-240可以可操作以在将结果传递给CNN 200的另一个层之前应用过滤操作(例如,内核)。例如,针对给定的数据集(例如,彩色图像),卷积层可以执行过滤例程以实行诸如图像标识、图像的边缘检测以及图像锐化之类的操作。
还设想到的是,CNN可以包括一个或多个池化层250-270,池化层250-270从相应的卷积层220-240接收经卷积的数据。池化层250-270可以包括一个或多个池化层单元,这些池化层单元将池化函数应用于一个或多个卷积层输出,该一个或多个卷积层输出是使用池化函数在不同频带(band)处计算的。例如,池化层250可以将池化函数应用于从卷积层220接收到的内核输出。由池化层250-270实现的池化函数可以是平均值或最大值函数、或将多个值聚合成单个值的任何其他函数。
全连接层280还可以可操作以学习从卷积层220-240和池化层250-270接收到的输出数据中的高级特征的非线性组合。最后,CNN 200可以包括softmax层290,softmax层290使用softmax函数将全连接层280的输出进行组合。设想到的是,由图2所示的神经网络算法可以被配置成用于在汽车应用内进行操作,以根据从数字相机提供的图像和/或来自LiDAR传感器的深度图来标识对象(例如,行人)。
参考图1,系统100可以存储用于机器学习算法110的训练数据集112。训练数据集112可以表示用于训练机器学习算法110的一组先前构造的数据。机器学习算法110可以使用训练数据集112来学习与神经网络算法相关联的加权因子。训练数据集112可以包括如下一组源数据:其具有机器学习算法110尝试经由学习过程来重复的对应后果或结果。在该示例中,训练数据集112可以包括来自其中可以标识对象(例如,行人)的各种场景的源图像和深度图。
可以使用训练数据集112作为输入以学习模式来操作机器学习算法110。可以使用来自训练数据集112的数据通过多次迭代来执行机器学习算法110。利用每次迭代,机器学习算法110可以基于所获得的结果来更新内部加权因子。例如,机器学习算法110可以将输出结果与训练数据集112中包含的那些结果进行比较。由于训练数据集112包括预期结果,因此机器学习算法110可以确定何时性能是可接受的。在机器学习算法110达到预定的性能水平(例如,与关联于训练数据集112的结果100%一致)之后,可以使用不处于训练数据集112中的数据来执行机器学习算法110。经训练的机器学习算法110可以被应用于新的数据集以生成经注释的数据。
机器学习算法110还可以被配置成标识原始源数据115中的特定特征。原始源数据115可以包括针对其的注释结果合期望的多个实例或输入数据集。例如,机器学习算法110可以被配置成标识图像中行人的存在并且对该发生进行注释。机器学习算法110可以被编程为处理原始源数据115以标识特定特征的存在。机器学习算法110可以被配置成将原始源数据115中的特征标识为预定特征。原始源数据115可以从各种各样的源中导出。例如,原始源数据115可以是由机器学习系统收集的实际输入数据。原始源数据115可以是机器生成的,以用于测试该系统。作为示例,原始源数据115可以包括来自相机的原始数字图像。
在该示例中,机器学习算法110可以处理原始源数据115并且生成输出。机器学习算法110可以针对所生成的每个输出生成置信度水平或因子。例如,超过预定的高置信度阈值的置信度值可以指示:机器学习算法110确信所标识的特征对应于该特定特征。小于低置信度阈值的置信度值可以指示:机器学习算法110具有关于该特定特征存在的某种不确定性。
参考所公开的系统和方法,设想到的是,预先标记的源数据集可以由下面的等式(1)来表述:
如所讨论的,源数据集可能被标记噪声所破坏。标记噪声可以由下面的等式(2)来表述:
设想到的是,预先标记的源数据集(X s )之一可以被采样,并且然后该样本的标记可能被等式(2)所破坏。下面的等式(4)可以用于提供在源数据集上对分类器(ps)的鲁棒性:
然后,未标记的目标数据集可以使用下面的等式(5)来表示:
其中X T 是未标记的目标数据集;是目标数据集的第i个样本;并且y i 是目标数据集的相应标记。设想到的是,为了将用于训练源数据集(X S )的分类器(ps)应用于目标数据集(X T ),联合样本/标记分布应当对齐,如下面的等式(6)所示:
这可以通过假设源条件样本噪声和目标条件样本噪声相同来实现,如下面的等式(7)所示:
设想到的是,源数据集与目标数据集之间的差异可以是协变量移位(covariateshift)的结果(如下面的等式(8)所示),而给定的任务可以保持相同(如下面的等式(9)所示)。
还设想到的是,通过实现域适配算法,可以通过强制实施源输入边际(marginal)(p s (x))与目标输入边际(p T (x))之间的相似性来实现适配,如下面的等式(10)所示:
设想到的是,可以对抗性地学习从源到目标的变换,使得任何辨别器(discriminator)将不太可能可操作以区分样本是源自于目标分布还是该样本是从源分布中修改的。这通常被理解为一种无监督方法,该方法不需要目标-域标记,并且因此可以在对目标数据集进行主动学习之前实行该方法。
为了在给定的采样预算约束内并且基于有噪声的注释器有效地对目标数据集进行采样,所公开的系统和方法可以在有噪声的被标记的源数据集X s 、未标记的目标数据集X T 、以及通过θ参数化的分类器f上进行操作。利用这些输入参数,可以通过以下方式对目标数据集进行采样:(1)在源数据集上学习噪声鲁棒的分类器(f s );(2)使用对抗性训练将在源数据集上训练的噪声鲁棒的分类器适配到目标数据集,以产生被适配到目标域的噪声鲁棒的分类器(f s→t );以及(3)使用经适配的噪声鲁棒的分类器(f s→t )来热启动主动学习过程,从而提供用于目标分类器f t 的训练数据。
图3图示了流程图300,该流程图图示了可以在系统100上采用的方法,该方法用于在给定的采样预算约束内、并且基于有噪声的注释器来对目标数据集进行采样。设想到的是,可以使用自动化机器学习算法(例如,CNN 200)来执行流程图300。
在步骤302处,系统100可以接收一个或多个输入。例如,系统100可以接收被噪声方式标记的数据集(X s );未标记的目标数据集(X T );通过(θ s )参数化的源分类器(f s );通过(θ s→t )参数化的经适配的分类器(f s→t );通过(θ t )参数化的目标分类器(f t );适配停止条件(S),其可以被初始化为“FALSE(假)”;标记预算值(B);以及每批(per-batch)适配和目标采样时间表(λ S→T , λ T )。
设想到的是,适配停止条件可以被预定义(或初始化)成“NOT TURE(非真)”或“FALSE”条件。而且,每批采样时间表可以建立热启动序列的控制持续时间或长度。虽然设想到每批采样参数(λ S→T , λ T )可以在步骤302处作为输入值来提供,但是还设想到的是,可以从在保留数据集(hold-out dataset)上的目标分类器性能来推断出每批采样参数,其中λ S→T >>λ T 可以被用来控制序列的热启动。
一旦接收到输入,流程图300就可以进行到步骤304,在步骤304处,初始化一个或多个值。例如,标记累计(cumulative)成本(C)值可以被初始化为零(0)的起始值。而且,被标记的目标数据集()可以被初始化为空或新的数据集(例如,)。流程图300然后可以进行到步骤306以评估适配停止条件(S)是否等于FALSE值。如果否,则流程图300进行回到步骤302。
如果是,则流程图300进行到步骤308,在步骤308处,从初始化源分类器(f s )。步骤308还将基于使用域辨别技术的对抗性训练(即,对抗性机器学习算法)将源分类器适配f s→t 到未标记的目标数据集(X T )。然而,设想到的是,在步骤408处可以使用除了对抗性训练以外的其他域适配技术。例如,设想到的是,可以使用重加权算法、迭代算法或分层贝叶斯模型。步骤408还更新参数化的适配值(即,θ s→t )并且进行到步骤410。
步骤310评估累计成本(C)值是否小于或等于标记预算值(即,C≤B)。如果否(即,C>B),则流程图返回到步骤306。如果是,则流程图300进行到步骤312,在步骤312处,主动学习算法(即,注释器)可以进行操作以使用目标分类器(f T )(即,噪声鲁棒的深度网络分类器)对未标记的目标数据集(OT)样本进行排序。步骤312还使用主动学习算法,该算法还进行操作以使用经适配的分类器(f s→T )对未标记的经适配的样本(OS→T)进行排序。在步骤314处,使用未标记的目标数据集(OT)来标记最高的目标每批采样时间表(λ T )样本。而且,使用未标记的经适配的样本(OS→T)来标记最高的适配每批采样时间表(λ S→T )样本。在步骤316处,流程图300将进行操作以将新标记的样本添加到被标记的目标数据集()。然后,流程图300进行到步骤318,在步骤318处,还可以更新每批采样时间表(λ S→T , λ T )。在步骤320处,可以在被标记的目标数据集()上确定噪声鲁棒的深度网络目标分类器(f T )。设想到的是,可以使用进行操作以处理有噪声的标记的全连接线性层以及最终softmax输出层来实现噪声鲁棒的深度目标分类器(f T )。
替代地,设想到的是,可以采用批主动学习策略而不是迭代学习方法。例如,代替于标记每个个体未标记的目标数据集(XT)样本,系统100可以使用通过步骤312、314实现的主动学习方法对未标记的目标数据集(XT)样本进行批处理并且对这些样本进行排序。然后可以每批地更新噪声鲁棒的深度网络目标分类器(f T )。设想到的是,可以使用基于最大熵的启发式方法来驱动机器学习算法的主动学习过程从而实现主动学习采样策略。然而,还设想到的是,可以实现附加或替代的主动学习采样策略。
图4图示了一实施例,其中计算系统440可以被用来控制至少部分自主的机器人,例如至少部分自主的车辆400。计算系统440可以类似于图1中描述的系统100。传感器430可以包括一个或多个视频/相机传感器、和/或一个或多个雷达传感器、和/或一个或多个超声传感器、和/或一个或多个LiDAR传感器、和/或一个或多个位置传感器(如例如GPS)。这些传感器中的一些或全部是优选的,但是不一定集成在车辆400中。
替代地,传感器430可以包括用于确定致动器系统的状态的信息系统。传感器430可以收集要由计算系统440使用的传感器数据或其他信息。这种信息系统的一个示例是天气信息系统,其确定环境中的天气的当前或未来状态。例如,使用输入信号x,分类器可以例如检测在至少部分自主的机器人附近的对象。输出信号y可以包括表征对象在何处位于该至少部分自主的机器人附近的信息。然后,可以依据该信息来确定控制命令A,例如以避免与所述检测到的对象发生碰撞。
可以集成在车辆400中的致动器410可以由车辆400的制动器、推进系统、引擎、动力传动系统或转向装置而给出。可以确定致动器控制命令,使得致动器(或多个致动器)410被控制,以使得车辆400避免与所述检测到的对象发生碰撞。还可以根据分类器认为检测到的对象最可能是什么(例如,行人或树木)来对它们进行分类,并且可以取决于该分类来确定致动器控制命令A。
图5中示出了一实施例,其中计算机系统540被用于控制自动化个人助理550。传感器530可以是例如用于接收用户549的手势的视频图像的光学传感器。替代地,传感器530还可以是例如用于接收用户549的语音命令的音频传感器。
然后,控制系统540确定用于控制自动化个人助理550的致动器控制命令A。依据传感器530的传感器信号S来确定致动器控制命令A。传感器信号S被传输到控制系统540。例如,分类器可以被配置成例如执行手势识别算法以标识用户549做出的手势。然后,控制系统540可以确定致动器控制命令A以便传输到自动化个人助理550。然后,它将所述致动器控制命令A传输到自动化个人助理550。
例如,可以依据由分类器识别的所标识的用户手势来确定致动器控制命令A。然后,它可以包括以下信息:该信息使自动化个人助理550从数据库中检索信息,并且以适合于用户549接收的形式来输出该检索到的信息。
在进一步的实施例中,可以设想到的是,代替于自动化个人助理550,控制系统540控制依据所标识的用户手势来控制的家用电器(未示出)。该家用电器可以是洗衣机、火炉、烤箱、微波炉或洗碗机。
图6中示出的是其中计算系统控制访问控制系统600的实施例。访问控制系统可以被设计成物理地控制访问。例如,它可以包括门601。传感器630被配置成检测与判定访问是否被准予有关的场景。传感器630可以收集与该场景有关的图像数据或视频数据。例如,它可以是用于提供图像或视频数据以用于检测人员面部的光学传感器。分类器可以被配置成例如通过将身份与数据库中存储的已知人员进行匹配来解释该图像或视频数据,由此确定该人员的身份。然后,可以取决于分类器的解释(例如,根据所确定的身份)来确定致动器控制信号A。致动器610可以是取决于致动器控制信号A而准予访问或不准予访问的锁。非物理的逻辑访问控制也是可能的。
图7中示出的是其中计算系统740控制监控系统700的实施例。该实施例在很大程度上与图5中所示的实施例相同。因此,将仅详细描述不同的方面。传感器730被配置成检测处于监视下的场景。传感器730可以收集与该场景有关的图像数据或视频数据。计算系统不一定控制致动器710,而是控制显示器710a。例如,机器学习系统可以确定场景的分类,例如光学传感器730检测到的场景是否是可疑的。被传输到显示器710a的致动器控制信号A然后可以例如被配置成使显示器710a取决于所确定的分类来调整所显示的内容,例如以突出显示被机器学习系统认为可疑的对象。
图8中示出的是用于控制成像系统800(例如,MRI装置、x射线成像装置或超声成像装置)的计算系统840的实施例。传感器830可以例如是成像传感器。机器学习系统然后可以确定感测到的图像中的全部或部分的分类。计算系统840可以收集关于与X射线成像或超声成像有联系的图像的数据。然后,可以依据该分类来选择致动器控制信号A,从而控制显示器810a。例如,机器学习系统可以将感测到的图像中的区域解释为是潜在异常的。在这种情况下,致动器控制信号A可以被确定为使显示器810a显示该成像,并且突出显示该潜在异常区域。
本文中公开的过程、方法或算法可以递送给处理设备、控制器或计算机/可以由处理设备、控制器或计算机来实现,该处理设备、控制器或计算机可以包括任何现有的可编程电子控制单元或专用电子控制单元。类似地,可以以许多形式将这些过程、方法或算法存储为可由控制器或计算机执行的数据、逻辑和指令,包括但不限于永久地存储在不可写存储介质(诸如,ROM设备)上的信息、以及可变地存储在可写存储介质(诸如,软盘、磁带、CD、RAM设备、以及其他磁性和光学介质)上的信息。还可以以软件可执行对象来实现这些过程、方法或算法。替代地,可以使用合适的硬件组件(诸如,专用集成电路(ASIC)、现场可编程门阵列(FPGA)、状态机、控制器或其他硬件组件或设备)、或者硬件、软件和固件组件的组合来全部或部分地体现这些过程、方法或算法。
尽管上面描述了示例性实施例,但是并不意图这些实施例描述了本发明的所有可能形式。而是,说明书中使用的词语是描述性的词语而不是限制性的词语,并且要理解的是,在不脱离本发明的精神和范围的情况下,可以做出各种改变。附加地,各种实现实施例的特征可以被组合以形成本发明的进一步的实施例。
Claims (20)
1.一种包括主动学习算法的方法,其包括:
接收被噪声方式标记的源数据集;
应用鲁棒深度学习算法来标识用于被噪声方式标记的源数据集的源分类器;
使用在源分类器上操作的域辨别算法来确定经适配的分类器;以及
基于可操作地使用目标分类器和经适配的分类器的主动学习算法,将标记分配给未标记的目标数据集内的一个或多个样本。
2.根据权利要求1所述的方法,其中域辨别算法被设计为对抗性网络。
3.根据权利要求1所述的方法,进一步包括:使用经适配的分类器来热启动所述主动学习算法,其中所述主动学习算法可操作以提供用于目标分类器的训练数据。
4.根据权利要求3所述的方法,其中调度器控制用于热启动所述主动学习算法的持续时间。
5.根据权利要求1所述的方法,其中所述鲁棒深度学习算法包括softmax层,接着是密集线性层,所述密集线性层可操作以对被噪声方式标记的源数据集实行去噪。
6.根据权利要求1所述的方法,其中使用基于最大熵的启发式算法来设计所述主动学习算法。
7.根据权利要求1所述的方法,其中使用批主动学习算法来设计所述主动学习算法。
8.根据权利要求7所述的方法,其中目标分类器是每批地更新的。
9.一种包括主动学习算法的方法,其包括:
接收被噪声方式标记的源数据集;
应用鲁棒深度学习算法来标识用于被噪声方式标记的源数据集的源分类器;
使用在源分类器上操作的对抗性域适配机器学习算法来确定经适配的分类器;以及
基于可操作地使用目标分类器和经适配的分类器的主动学习算法,将标记分配给未标记的目标数据集内的一个或多个样本。
10.根据权利要求9所述的方法,进一步包括:使用经适配的分类器来热启动所述主动学习算法,其中所述主动学习算法可操作以提供用于目标分类器的训练数据。
11.根据权利要求10所述的方法,其中调度器控制用于热启动所述主动学习算法的持续时间。
12.根据权利要求9所述的方法,其中所述鲁棒深度学习算法包括softmax层,接着是密集线性层,所述密集线性层可操作以对被噪声方式标记的源数据集实行去噪。
13.一种可操作以采用主动学习算法的系统,其包括:
控制器,其可操作以:
接收被噪声方式标记的源数据集;
应用鲁棒深度学习算法来标识用于被噪声方式标记的源数据集的源分类器;
使用在源分类器上操作的域辨别机器学习算法来确定经适配的分类器;以及
基于可操作地使用目标分类器和经适配的分类器的主动学习算法,将标记分配给未标记的目标数据集内的一个或多个样本。
14.根据权利要求13所述的系统,其中使用对抗性网络来设计所述域辨别机器学习算法。
15.根据权利要求13所述的系统,其中控制器进一步可操作以:使用经适配的分类器来热启动所述主动学习算法,其中所述主动学习算法可操作以提供用于目标分类器的训练数据。
16.根据权利要求15所述的系统,其中调度器控制用于热启动所述主动学习算法的持续时间。
17.根据权利要求13所述的系统,其中所述鲁棒深度学习算法包括softmax层,接着是密集线性层,所述密集线性层可操作以对被噪声方式标记的源数据集实行去噪。
18.根据权利要求13所述的系统,其中使用基于最大熵的启发式算法来设计所述主动学习算法。
19.根据权利要求13所述的系统,其中使用批主动学习算法来设计所述主动学习算法。
20.根据权利要求19所述的系统,其中目标分类器是每批地更新的。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/724109 | 2019-12-20 | ||
US16/724,109 US11551084B2 (en) | 2019-12-20 | 2019-12-20 | System and method of robust active learning method using noisy labels and domain adaptation |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113011454A true CN113011454A (zh) | 2021-06-22 |
Family
ID=76205931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011509171.9A Pending CN113011454A (zh) | 2019-12-20 | 2020-12-18 | 使用有噪声的标记和域适配来进行鲁棒的主动学习方法的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11551084B2 (zh) |
CN (1) | CN113011454A (zh) |
DE (1) | DE102020215200A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114117056A (zh) * | 2022-01-29 | 2022-03-01 | 腾讯科技(深圳)有限公司 | 一种训练数据的处理方法、装置以及存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11301724B2 (en) * | 2020-04-30 | 2022-04-12 | Robert Bosch Gmbh | Semantic adversarial generation based function testing method in autonomous driving |
KR20240081811A (ko) * | 2022-12-01 | 2024-06-10 | 주식회사 써티웨어 | 전주기 심층 능동학습 기반 데이터 라벨링 시스템 및 방법 |
TWI844284B (zh) * | 2023-02-24 | 2024-06-01 | 國立中山大學 | 跨域分類器的訓練方法與電子裝置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160253597A1 (en) * | 2015-02-27 | 2016-09-01 | Xerox Corporation | Content-aware domain adaptation for cross-domain classification |
EP3555812B1 (en) | 2016-12-15 | 2022-07-06 | Google LLC | Transforming source domain images into target domain images |
US10776693B2 (en) | 2017-01-31 | 2020-09-15 | Xerox Corporation | Method and system for learning transferable feature representations from a source domain for a target domain |
US10402701B2 (en) | 2017-03-17 | 2019-09-03 | Nec Corporation | Face recognition system for face recognition in unlabeled videos with domain adversarial learning and knowledge distillation |
US10643602B2 (en) * | 2018-03-16 | 2020-05-05 | Microsoft Technology Licensing, Llc | Adversarial teacher-student learning for unsupervised domain adaptation |
-
2019
- 2019-12-20 US US16/724,109 patent/US11551084B2/en active Active
-
2020
- 2020-12-02 DE DE102020215200.4A patent/DE102020215200A1/de active Pending
- 2020-12-18 CN CN202011509171.9A patent/CN113011454A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114117056A (zh) * | 2022-01-29 | 2022-03-01 | 腾讯科技(深圳)有限公司 | 一种训练数据的处理方法、装置以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20210192335A1 (en) | 2021-06-24 |
US11551084B2 (en) | 2023-01-10 |
DE102020215200A1 (de) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Feng et al. | A review and comparative study on probabilistic object detection in autonomous driving | |
US11620527B2 (en) | Domain adaption learning system | |
CN113011454A (zh) | 使用有噪声的标记和域适配来进行鲁棒的主动学习方法的系统和方法 | |
JP7128022B2 (ja) | 完全教師あり学習用のデータセットの形成 | |
US20220100850A1 (en) | Method and system for breaking backdoored classifiers through adversarial examples | |
US20230386167A1 (en) | System for detection and management of uncertainty in perception systems | |
KR20210002018A (ko) | 뉴럴 네트워크의 글로벌 불확실성을 추정하기 위한 방법 | |
CN112241784A (zh) | 训练生成模型和判别模型 | |
CN113095351A (zh) | 借助于初始标记的改善生成经标记的数据的方法 | |
US11420623B2 (en) | Systems for determining object importance in on-road driving scenarios and methods thereof | |
CN113962399A (zh) | 用于机器学习中学习扰动集的方法和系统 | |
CN116523823A (zh) | 用于半监督对象检测的鲁棒伪标签生成的系统和方法 | |
CN112883991A (zh) | 对象分类方法、对象分类电路、机动车辆 | |
CN109376736A (zh) | 一种基于深度卷积神经网络的视频小目标检测方法 | |
CN112241757A (zh) | 用于操作神经网络的设备和方法 | |
CN115830399A (zh) | 分类模型训练方法、装置、设备、存储介质和程序产品 | |
JP2023138492A (ja) | ランダム化およびサンプル拒否を使用して、ディープニューラルネットワークにおける事前トレーニング済みシステムのロバストネスを向上させるためのシステムおよび方法 | |
CN117592542A (zh) | 用于机器学习模型的具有对比损失的专家引导半监督的系统和方法 | |
CN116258865A (zh) | 使用机器学习的图像量化 | |
CN118279638A (zh) | 用于利用教师和学生框架训练机器学习模型的系统和方法 | |
JP2021197184A (ja) | 分類器を訓練及びテストするためのデバイス及び方法 | |
CN113051394A (zh) | 增强神经句子分类的系统和方法 | |
JP2024035192A (ja) | ノイズ除去された拡散モデルを用いた入力摂動を汎用精製するためのシステム及び方法 | |
CN116894799A (zh) | 用于域泛化的数据增强 | |
US20230102866A1 (en) | Neural deep equilibrium solver |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |