CN108596266A - 基于半监督学习的融合决策方法、装置及存储介质 - Google Patents

基于半监督学习的融合决策方法、装置及存储介质 Download PDF

Info

Publication number
CN108596266A
CN108596266A CN201810412020.8A CN201810412020A CN108596266A CN 108596266 A CN108596266 A CN 108596266A CN 201810412020 A CN201810412020 A CN 201810412020A CN 108596266 A CN108596266 A CN 108596266A
Authority
CN
China
Prior art keywords
data
data set
label
semi
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810412020.8A
Other languages
English (en)
Inventor
刘新
宋朝忠
张新
陈安东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yicheng Automatic Driving Technology Co Ltd
Original Assignee
Shenzhen Yicheng Automatic Driving Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yicheng Automatic Driving Technology Co Ltd filed Critical Shenzhen Yicheng Automatic Driving Technology Co Ltd
Priority to CN201810412020.8A priority Critical patent/CN108596266A/zh
Publication of CN108596266A publication Critical patent/CN108596266A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于半监督学习的融合决策方法,通过获取样本数据并将其划分为两个数据集,分别称为第一数据集第二数据集,第一数据集用人工打上标签,第二数据集不打标签;然后用第一数据集对原始模型进行训练,得到有效的预测模型;之后将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有对应标签。本发明还公开了一种基于半监督学习的融合决策装置及存储介质。本发明有效解决了融合决策算法中带标签数据难于获取的弊病,能够大大的增加对大量不带标签数据的利用,增加融合决策算法的准确度,加快自动驾驶技术的发展速度。

Description

基于半监督学习的融合决策方法、装置及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于半监督学习的融合决策方法、装置及存储介质。
背景技术
随着自动驾驶技术的发展,对图像处理与计算机识别的要求也越来越高,不仅需要更快的速度,同时也需要较高的准确度。
在自动驾驶技术的实际应用中,需要获取大量的实时图片或影像资料,基于对这些图片和影像资料的分析,识别出汽车当前所处环境中的各个物体,从而做出不同的驾驶决策。传统的分类方法主要有以支持向量机SVM和神经网络为代表的监督学习方法,和以模糊聚类法为代表的无监督学习方法。监督学习方法需要使用大量有标记样本来训练分类器,以增强和优化分类器的性能。用于训练分类器的数据集是实时图像上那些已经标记了类标号的样本点,给样本点标记类标号通常都是人工来完成的。然而,请人类专家对实时图像进行人工标记是一项费时费力且代价高昂的工作;对于无监督分类方法,由于缺乏先验知识,仅凭物体的光谱特征分布规律将样本划分为若干类别,分类结果只是对不同类别达到了区分,并不能确定类别的属性,无法实现聚类后类别与实际的物体类别之间的正确对应。而在实际问题中大多是有标记样本与无标记样本并存,且无标记数据远远多于有标记数据,为了更好地利用这些数据,半监督学习技术应运而生,近年来,由于解决实际问题的需要,半监督学习技术更成为机器学习领域一个被广泛研究的热点方向。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种融合决策方法、装置及存储介质,旨在解决监督学习中的带标签数据难以获取的技术问题。
为实现上述目的,本发明提供一种基于半监督学习的融合决策方法,其特征在于,所述基于半监督学习的融合决策方法包括以下步骤:
获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集;
用第一数据集对原始模型进行训练,得到有效的预测模型;
将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签。
优选地,所述将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签的步骤包括:
按照预设方式将第二数据集分为多份,选取其中一份数据输入预测模型,得到所述预测模型输出的预测标签;
将所述预测标签对应的数据与第一数据集充分混合,得到融合后的新第一数据集;
用所述新第一数据集再次对预测模型进行训练,调整预测模型的参数;
不断重复上述步骤,直到所有数据都有一个预测标签。
优选地,所述按照预设方式将第二数据集分为多份,每一份数据的样本数据数量都要保证少于第一数据集的样本数据数量。
优选地,所述获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集的步骤包括:
在汽车处于测试场景中时,获取若干个不同时刻的周围环境信息作为样本数据,根据不同的样本数据确定对应的类别标签,建立若干组从样本数据到类别标签的映射;
在采集到测试场景中的样本数据时,按照预设比例选取一部分样本数据形成第一数据集,提示用户对所述第一数据集中的样本数据进行类别标签标记;
将其余未进行类别标签标记的样本数据整理形成第二数据集。
优选地,所述将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签的步骤之后,所述方法还包括:
在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,从而确定所述预测模型是否已经训练成熟;
在所述预测模型通过回顾性检测时,确定所述预测模型已经训练成熟,投入实际使用。
优选地,所述在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,确定所述预测模型是否已经训练成熟的步骤之后,所述方法还包括:
在所述预测模型没有通过回顾性检测时,使用带标签的数据继续进行训练。
优选地,所述用第一数据集对原始模型进行训练,得到有效的预测模型的步骤包括:
获取第一数据集中的样本数据和对应的类别标签,使得预测模型通过分析建立一个从样本数据到类别标签的映射,得到映射函数;
不断重复上述过程,直到第一数据集中的所有样本数据至少有一次被用于训练预测模型。
优选地,所述样本数据X和对应的类别标签Y之间的映射函数为f(X),类别标签与映射函数之间满足Y=f(X)+ε的关系,其中ε为误差。
此外,为实现上述目的,本发明还提供一种基于半监督学习的融合决策装置,其特征在于,所述基于半监督学习的融合决策装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于半监督学习的融合决策程序,所述基于半监督学习的融合决策程序被所述处理器执行时实现如上述任一项所述的基于半监督学习的融合决策方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,其特征在于,所述存储介质上存储有基于半监督学习的融合决策程序,所述基于半监督学习的融合决策程序被处理器执行时实现如上述任一项所述的基于半监督学习的融合决策方法的步骤。
本发明方案,通过获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集;然后用第一数据集对原始模型进行训练,得到有效的预测模型;之后将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签;本发明有效解决了融合决策算法中带标签数据难于获取的弊病,能够大大的增加对大量不带标签数据的利用,增加融合决策算法的准确度,加快自动驾驶技术的发展速度。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中基于半监督学习的融合决策装置所属终端的结构示意图;
图2为本发明基于半监督学习的融合决策方法第一实施例中的流程示意图;
图3为本发明基于半监督学习的融合决策方法第二实施例中将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签的步骤的细化流程示意图;
图4为本发明基于半监督学习的融合决策方法第三实施例中获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集的步骤的细化流程示意图;
图5为本发明基于半监督学习的融合决策方法第四实施例中的流程示意图;
图6为本发明基于半监督学习的融合决策方法第五实施例中用第一数据集对原始模型进行训练,得到有效的预测模型的步骤的细化流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的装置所属终端结构示意图。
本发明实施例终端可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面3)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于半监督学习的融合决策程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基于半监督学习的融合决策程序。
在本实施例中,基于半监督学习的融合决策装置包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的基于半监督学习的融合决策程序,其中,处理器1001调用存储器1005中存储的基于半监督学习的融合决策程序时,并执行以下操作:
获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集;
用第一数据集对原始模型进行训练,得到有效的预测模型;
将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签。
进一步地,处理器1001可以调用存储器1005中存储的基于半监督学习的融合决策程序,还执行以下操作:
按照预设方式将第二数据集分为多份,选取其中一份数据输入预测模型,得到所述预测模型输出的预测标签;
将所述预测标签对应的数据与第一数据集充分混合,得到融合后的新第一数据集;
用所述新第一数据集再次对预测模型进行训练,调整预测模型的参数;
不断重复上述步骤,直到所有数据都有一个预测标签。
进一步地,处理器1001可以调用存储器1005中存储的基于半监督学习的融合决策程序,还执行以下操作:
所述按照预设方式将第二数据集分为多份,每一份数据的样本数据数量都要保证少于第一数据集的样本数据数量。
进一步地,处理器1001可以调用存储器1005中存储的基于半监督学习的融合决策程序,还执行以下操作:
在汽车处于测试场景中时,获取若干个不同时刻的周围环境信息作为样本数据,根据不同的样本数据确定对应的类别标签,建立若干组从样本数据到类别标签的映射;
在采集到测试场景中的样本数据时,按照预设比例选取一部分样本数据形成第一数据集,提示用户对所述第一数据集中的样本数据进行类别标签标记;
将其余未进行类别标签标记的样本数据整理形成第二数据集。
进一步地,处理器1001可以调用存储器1005中存储的基于半监督学习的融合决策程序,还执行以下操作:
在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,从而确定所述预测模型是否已经训练成熟;
在所述预测模型通过回顾性检测时,确定所述预测模型已经训练成熟,投入实际使用。
进一步地,处理器1001可以调用存储器1005中存储的基于半监督学习的融合决策程序,还执行以下操作:
在所述预测模型没有通过回顾性检测时,使用带标签的数据继续进行训练。
进一步地,处理器1001可以调用存储器1005中存储的基于半监督学习的融合决策程序,还执行以下操作:
获取第一数据集中的样本数据和对应的类别标签,使得预测模型通过分析建立一个从样本数据到类别标签的映射,得到映射函数;
不断重复上述过程,直到第一数据集中的所有样本数据至少有一次被用于训练预测模型。
进一步地,处理器1001可以调用存储器1005中存储的基于半监督学习的融合决策程序,还执行以下操作:
所述样本数据X和对应的类别标签Y之间的映射函数为f(X),类别标签与映射函数之间满足Y=f(X)+ε的关系,其中ε为误差。
本发明第一实施例提供一种基于半监督学习的融合决策方法,参照图2,图2为本发明基于半监督学习的融合决策方法第一实施例的流程示意图,所述基于半监督学习的融合决策方法包括:
步骤S10,获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集;
在自动驾驶技术中,通常需要用相机等装置对周围场景拍摄图像,将周围场景图像中的样本数据作为输入对象,用模型进行分析,输出一个预测标签,也称作监督信号,并根据这个监督信号做出决策。模型也称作分类器,具有能够调节的参数,是半监督学习的主体,也是影响所做出决策的核心。
通常用于训练预测模型的样本数据是在测试场景中获得的,尽可能多的模拟汽车驾驶的各种场景,并采集不同状况的图像,作为样本数据。在汽车处于测试场景中时,获取若干个不同时刻的周围环境信息作为样本数据,根据不同的样本数据确定对应的类别标签,建立若干组从样本数据到类别标签的映射;在采集到测试场景中的样本数据时,按照预设比例选取一部分样本数据形成第一数据集,提示用户对所述第一数据集中的样本数据进行类别标签标记;将其余未进行类别标签标记的样本数据整理形成第二数据集。
步骤S20,用第一数据集对原始模型进行训练,得到有效的预测模型;
第一数据集是带有类别标签的样本数据,上述类别标签是专家通过人工的方式标记的,费时费力,所以数量很少。获取第一数据集中的样本数据和对应的类别标签,使得预测模型通过分析建立一个从样本数据到类别标签的映射,得到映射函数;不断重复上述过程,直到第一数据集中的所有样本数据至少有一次被用于训练预测模型。
用带有标签的数据去训练预测模型,可以看作是预测模型的监督学习过程。监督学习是利用一组已知类别的样本调整预测模型的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。监督学习可以从带有标签的数据中进行学习从而拥有推断出标签的能力。监督学习所用的数据不仅仅包含样本点本身,而且还包含这些样本点所对应的类别标记,一个样本点的表述形式为(x,y),其中y为样本点x的类别标记。监督学习的目标即是从这些数据中学习建立一个从样本点到标记的映射。特别地,监督学习技术当y为实数值的时候称为回归技术,否则称为分类技术。典型代表有支持向量机等。
步骤S30,将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签。
从分类上来说,这一步骤是一个半监督学习过程。半监督学习相对监督学习来说,对数据的依赖较小。基于目前数据采集方式,较难获取大量的带标签融合决策数据,但是可以较容易获得大量的不带标签融合数据。因此本方法是在有限的带标签融合数据情况下,尽可能多的利用大量不带标签的数据进行模型的训练。
其中一种实现方式是,按照预设方式将第二数据集分为多份,选取其中一份数据输入预测模型,得到所述预测模型输出的预测标签;将所述预测标签对应的数据与第一数据集充分混合,得到融合后的新第一数据集;用所述新第一数据集再次对预测模型进行训练,调整预测模型的参数;不断重复上述步骤,直到所有数据都有一个预测标签。
或者也可以按照如下方式实现,按照预设方式将第二数据集分为多份,选取其中一份与第一数据集充分混合,得到融合后的新第一数据集;将融合后的所述新第一数据集输入预测模型,得到所述预测模型输出的预测标签及对应的数据,使用所有带标签的数据对预测模型进行训练,调整预测模型的参数;再次选取一份第二数据集中不带标签的数据,与所有带标签的数据进行混合,并重复上述步骤,直到所有数据都有一个预测标签。
本实施例中提出的基于半监督学习的融合决策方法,通过获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集;然后用第一数据集对原始模型进行训练,得到有效的预测模型;之后将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签;本发明有效解决了融合决策算法中带标签数据难于获取的弊病,能够大大的增加对大量不带标签数据的利用,增加融合决策算法的准确度,加快自动驾驶技术的发展速度。
基于第一实施例,提出本发明基于半监督学习的融合决策方法的第二实施例,参照图3,步骤S30包括:
步骤S31,按照预设方式将第二数据集分为多份,选取其中一份数据输入预测模型,得到所述预测模型输出的预测标签;
预设方式可以是随机任意的,也可以是技术人员认为对训练模型有帮助的任何方式。
假设第一数据集具有带标签的数据N(x,y)条,第二数据集具有不带标签的数据M(x)条,且M远远大于N。先用N条数据训练好一个预测模型,然后将M条不带标签的数据分成若干份,任选一份输入预测模型。在按照预设方式将第二数据集分为多份时,需要保证每一份数据的样本数据数量都少于第一数据集的样本数据数量。因为在对预测模型进行训练时,只有不带标签的数据少于带标签的数据,才能相对保证训练的有效性,不至于使得模型参数偏离实际值太多。
步骤S32,将所述预测标签对应的数据与第一数据集充分混合,得到融合后的新第一数据集;
将预测出来的值作为这些数据的标签与初始的N条数据合并成另一份训练数据。
步骤S33,用所述新第一数据集再次对预测模型进行训练,调整预测模型的参数;
使用合并后的新数据对预测模型进行训练,然后继续此步骤,直到将所有数据添加进训练集。
步骤S34,不断重复上述步骤,直到所有数据都有一个预测标签。
本实施例中提出的基于半监督学习的融合决策方法,通过按照预设方式将第二数据集分为多份,选取其中一份数据输入预测模型,得到所述预测模型输出的预测标签;然后将所述预测标签对应的数据与第一数据集充分混合,得到融合后的新第一数据集;之后用所述新第一数据集再次对预测模型进行训练,调整预测模型的参数;最后不断重复上述步骤,直到所有数据都有一个预测标签;本方法能够大大减少对带标签数据的依赖。
基于第一实施例,提出本发明基于半监督学习的融合决策方法的第三实施例,参照图4,步骤S10还包括:
步骤S11,在汽车处于测试场景中时,获取若干个不同时刻的周围环境信息作为样本数据,根据不同的样本数据确定对应的类别标签,建立若干组从样本数据到类别标签的映射;
在汽车无人驾驶问题中,汽车在平地和崎岖的坑地行驶速度不一样,如果前方有行人障碍物,汽车得要刹车或者拐弯。通过传感器获得当前汽车的周围环境信息,汽车要决定行驶速度,汽车是否该刹车,方向盘拐弯的角度。
步骤S12,在采集到测试场景中的样本数据时,按照预设比例选取一部分样本数据形成第一数据集,提示用户对所述第一数据集中的样本数据进行类别标签标记;
通过在测试场景里采集数据,汽车在多个时刻的周围环境信息作为X,汽车的行驶速度,是否该刹车,方向盘转角这些信息作为标签Y,当然,这种标签信息是有利于汽车安全驾驶的。有了输入X和标签Y就可以作为训练数据来进行有监督学习的训练,在求得映射函数f以后,汽车就可以根据当前的周围环境信息,来决定行驶速度,是否该刹车,方向盘拐弯的角度。上述这些具有标签的数据就可以作为第一数据集,用于训练预测模型。
步骤S13,将其余未进行类别标签标记的样本数据整理形成第二数据集。
类别标签的标记目前是需要人工进行标记的,因此大量的数据都是未经过标签标记的,将这些不具有标签的数据整理形成第二数据集。
本实施例中提出的基于半监督学习的融合决策方法,通过在汽车处于测试场景中时,获取若干个不同时刻的周围环境信息作为样本数据,根据不同的样本数据确定对应的类别标签,建立若干组从样本数据到类别标签的映射;然后在采集到测试场景中的样本数据时,按照预设比例选取一部分样本数据形成第一数据集,提示用户对所述第一数据集中的样本数据进行类别标签标记;之后将其余未进行类别标签标记的样本数据整理形成第二数据集;本方法能够大大增加对不带标签数据的利用。
基于第一实施例,提出本发明基于半监督学习的融合决策方法的第四实施例,参照图5,步骤S30之后,所述方法还包括:
步骤S40,在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,从而确定所述预测模型是否已经训练成熟;
回顾性检查是指在所有数据都完成类别标签的标记时,通过在实际场景中检验预测模型,确定该预测模型是否能够准确预测数据的类别。
步骤S50,在所述预测模型通过回顾性检测时,确定所述预测模型已经训练成熟,投入实际使用。
预测模型通过回顾性检测的标准就是对于实际场景中获取到的任意图像,能够正确的输出预测标签,例如,在给定一个前方有人的场景中,模型能够输出刹车减速的标签。
进一步地,在一实施例中,在步骤S40之后,所述方法还包括:
在所述预测模型没有通过回顾性检测时,使用带标签的数据继续进行训练。
如果预测模型不能准确输出标签,也就是无法指导自动驾驶车辆做出正确决策,则认为该预测模型需要继续训练。可以使用经过人工标记的标签数据对该预测模型再次进行训练。
本实施例中提出的基于半监督学习的融合决策方法,通过在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,从而确定所述预测模型是否已经训练成熟;然后在所述预测模型通过回顾性检测时,确定所述预测模型已经训练成熟,投入实际使用;本方法能够有效提升融合决策算法的准确率;本方法充分利用少部分有标签融合数据,结合大量无标签融合数据训练出精准度高的决策算法。
基于第一实施例,提出本发明基于半监督学习的融合决策方法的第五实施例,参照图6,步骤S20包括:
步骤S21,获取第一数据集中的样本数据和对应的类别标签,使得预测模型通过分析建立一个从样本数据到类别标签的映射,得到映射函数;
所述样本数据X和对应的类别标签Y之间的映射函数为f(X),类别标签与映射函数之间满足Y=f(X)+ε的关系,其中ε为误差。
监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。给定输入X,标签Y,寻找一个映射函数f,使得输出f(X)尽可能的接近标签Y。它的数学模型是:Y=f(X)+ε,其中ε是误差项,为了使得输出f(X)尽可能的接近真实标签Y,问题转化为使得代价函数L最小:
L(f,(X,Y))=||f(X)-Y2
步骤S22,不断重复上述过程,直到第一数据集中的所有样本数据至少有一次被用于训练预测模型。
本实施例中提出的基于半监督学习的融合决策方法,通过获取第一数据集中的样本数据和对应的类别标签,使得预测模型通过分析建立一个从样本数据到类别标签的映射,得到映射函数;然后不断重复上述过程,直到第一数据集中的所有样本数据至少有一次被用于训练预测模型;
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于半监督学习的融合决策程序,所述基于半监督学习的融合决策程序被处理器执行时实现如下操作:
获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集;
用第一数据集对原始模型进行训练,得到有效的预测模型;
将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签。
进一步地,所述基于半监督学习的融合决策程序被处理器执行时还实现如下操作:
按照预设方式将第二数据集分为多份,选取其中一份数据输入预测模型,得到所述预测模型输出的预测标签;
将所述预测标签对应的数据与第一数据集充分混合,得到融合后的新第一数据集;
用所述新第一数据集再次对预测模型进行训练,调整预测模型的参数;
不断重复上述步骤,直到所有数据都有一个预测标签。
进一步地,所述基于半监督学习的融合决策程序被处理器执行时还实现如下操作:
所述按照预设方式将第二数据集分为多份,每一份数据的样本数据数量都要保证少于第一数据集的样本数据数量。
进一步地,所述基于半监督学习的融合决策程序被处理器执行时还实现如下操作:
在汽车处于测试场景中时,获取若干个不同时刻的周围环境信息作为样本数据,根据不同的样本数据确定对应的类别标签,建立若干组从样本数据到类别标签的映射;
在采集到测试场景中的样本数据时,按照预设比例选取一部分样本数据形成第一数据集,提示用户对所述第一数据集中的样本数据进行类别标签标记;
将其余未进行类别标签标记的样本数据整理形成第二数据集。
进一步地,所述基于半监督学习的融合决策程序被处理器执行时还实现如下操作:
在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,从而确定所述预测模型是否已经训练成熟;
在所述预测模型通过回顾性检测时,确定所述预测模型已经训练成熟,投入实际使用。
进一步地,所述基于半监督学习的融合决策程序被处理器执行时还实现如下操作:
在所述预测模型没有通过回顾性检测时,使用带标签的数据继续进行训练。
进一步地,所述基于半监督学习的融合决策程序被处理器执行时还实现如下操作:
获取第一数据集中的样本数据和对应的类别标签,使得预测模型通过分析建立一个从样本数据到类别标签的映射,得到映射函数;
不断重复上述过程,直到第一数据集中的所有样本数据至少有一次被用于训练预测模型。
进一步地,所述基于半监督学习的融合决策程序被处理器执行时还实现如下操作:
所述样本数据X和对应的类别标签Y之间的映射函数为f(X),类别标签与映射函数之间满足Y=f(X)+ε的关系,其中ε为误差。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于半监督学习的融合决策方法,其特征在于,所述基于半监督学习的融合决策方法包括以下步骤:
获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集;
用第一数据集对原始模型进行训练,得到有效的预测模型;
将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签。
2.如权利要求1所述的基于半监督学习的融合决策方法,其特征在于,所述将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签的步骤包括:
按照预设方式将第二数据集分为多份,选取其中一份数据输入预测模型,得到所述预测模型输出的预测标签;
将所述预测标签对应的数据与第一数据集充分混合,得到融合后的新第一数据集;
用所述新第一数据集再次对预测模型进行训练,调整预测模型的参数;
不断重复上述步骤,直到所有数据都有一个预测标签。
3.如权利要求2所述的基于半监督学习的融合决策方法,其特征在于,所述按照预设方式将第二数据集分为多份,每一份数据的样本数据数量都要保证少于第一数据集的样本数据数量。
4.如权利要求1所述的基于半监督学习的融合决策方法,其特征在于,所述获取样本数据并进行分类,分别得到带标签的第一数据集和不带标签的第二数据集的步骤包括:
在汽车处于测试场景中时,获取若干个不同时刻的周围环境信息作为样本数据,根据不同的样本数据确定对应的类别标签,建立若干组从样本数据到类别标签的映射;
在采集到测试场景中的样本数据时,按照预设比例选取一部分样本数据形成第一数据集,提示用户对所述第一数据集中的样本数据进行类别标签标记;
将其余未进行类别标签标记的样本数据整理形成第二数据集。
5.如权利要求1所述的基于半监督学习的融合决策方法,其特征在于,所述将第二数据集中的样本数据输入预测模型,使得第二数据集中的每一个样本数据都具有类别标签的步骤之后,所述方法还包括:
在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,从而确定所述预测模型是否已经训练成熟;
在所述预测模型通过回顾性检测时,确定所述预测模型已经训练成熟,投入实际使用。
6.如权利要求5所述的基于半监督学习的融合决策方法,其特征在于,所述在所有样本数据都具有类别标签时,对预测模型进行回顾性检测,确定所述预测模型是否已经训练成熟的步骤之后,所述方法还包括:
在所述预测模型没有通过回顾性检测时,使用带标签的数据继续进行训练。
7.如权利要求1所述的基于半监督学习的融合决策方法,其特征在于,所述用第一数据集对原始模型进行训练,得到有效的预测模型的步骤包括:
获取第一数据集中的样本数据和对应的类别标签,使得预测模型通过分析建立一个从样本数据到类别标签的映射,得到映射函数;
不断重复上述过程,直到第一数据集中的所有样本数据至少有一次被用于训练预测模型。
8.如权利要求7所述的基于半监督学习的融合决策方法,其特征在于,所述样本数据X和对应的类别标签Y之间的映射函数为f(X),类别标签与映射函数之间满足Y=f(X)+ε的关系,其中ε为误差。
9.一种基于半监督学习的融合决策装置,其特征在于,所述基于半监督学习的融合决策装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于半监督学习的融合决策程序,所述基于半监督学习的融合决策程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于半监督学习的融合决策方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有基于半监督学习的融合决策程序,所述基于半监督学习的融合决策程序被处理器执行时实现如权利要求1至8中任一项所述的基于半监督学习的融合决策方法的步骤。
CN201810412020.8A 2018-05-02 2018-05-02 基于半监督学习的融合决策方法、装置及存储介质 Pending CN108596266A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810412020.8A CN108596266A (zh) 2018-05-02 2018-05-02 基于半监督学习的融合决策方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810412020.8A CN108596266A (zh) 2018-05-02 2018-05-02 基于半监督学习的融合决策方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN108596266A true CN108596266A (zh) 2018-09-28

Family

ID=63619706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810412020.8A Pending CN108596266A (zh) 2018-05-02 2018-05-02 基于半监督学习的融合决策方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN108596266A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446049A (zh) * 2018-11-01 2019-03-08 郑州云海信息技术有限公司 一种基于监督学习的服务器错误诊断方法和装置
CN109614303A (zh) * 2018-12-05 2019-04-12 国网北京市电力公司 一种违规信息处理方法及装置
CN109816027A (zh) * 2019-01-29 2019-05-28 北京三快在线科技有限公司 无人驾驶决策模型的训练方法、装置及无人驾驶设备
CN109902832A (zh) * 2018-11-28 2019-06-18 华为技术有限公司 机器学习模型的训练方法、异常预测方法及相关装置
CN110334815A (zh) * 2019-07-10 2019-10-15 深圳前海微众银行股份有限公司 基于交叉验证的标签补全方法、终端、装置及存储介质
CN110363231A (zh) * 2019-06-27 2019-10-22 平安科技(深圳)有限公司 基于半监督深度学习的异常识别方法、装置及存储介质
CN110399984A (zh) * 2019-07-24 2019-11-01 阿里巴巴集团控股有限公司 一种信息的预测方法、系统以及电子设备
CN110633730A (zh) * 2019-08-07 2019-12-31 中山大学 一种基于课程学习的深度学习机器阅读理解训练方法
CN110732139A (zh) * 2019-10-25 2020-01-31 腾讯科技(深圳)有限公司 检测模型的训练方法和用户数据的检测方法、装置
CN111090707A (zh) * 2018-10-24 2020-05-01 中国移动通信有限公司研究院 数据处理方法及装置、电子设备及存储介质
CN111639698A (zh) * 2020-05-27 2020-09-08 东软睿驰汽车技术(沈阳)有限公司 样本融合方法和装置
CN112132179A (zh) * 2020-08-20 2020-12-25 中国人民解放军战略支援部队信息工程大学 基于少量标注样本的增量学习方法及系统
CN112465733A (zh) * 2020-08-31 2021-03-09 长沙理工大学 基于半监督学习的遥感图像融合方法、装置、介质及设备
CN112699945A (zh) * 2020-12-31 2021-04-23 青岛海尔科技有限公司 数据标注方法及装置、存储介质及电子装置
US20220051058A1 (en) * 2018-09-12 2022-02-17 Beijing Sankuai Online Technology Co., Ltd Unmanned driving behavior decision-making and model training
CN116097046A (zh) * 2020-09-04 2023-05-09 大金工业株式会社 生成方法、程序、信息处理装置、信息处理方法及学习完毕模型

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657744A (zh) * 2015-01-29 2015-05-27 中国科学院信息工程研究所 一种基于非确定主动学习的多分类器训练方法及分类方法
US20170200061A1 (en) * 2016-01-11 2017-07-13 Netradyne Inc. Driver behavior monitoring
CN107697070A (zh) * 2017-09-05 2018-02-16 百度在线网络技术(北京)有限公司 驾驶行为预测方法和装置、无人车

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657744A (zh) * 2015-01-29 2015-05-27 中国科学院信息工程研究所 一种基于非确定主动学习的多分类器训练方法及分类方法
US20170200061A1 (en) * 2016-01-11 2017-07-13 Netradyne Inc. Driver behavior monitoring
CN107697070A (zh) * 2017-09-05 2018-02-16 百度在线网络技术(北京)有限公司 驾驶行为预测方法和装置、无人车

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
本书编写组编: "《人工智能简明知识读本》", 30 November 2017 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220051058A1 (en) * 2018-09-12 2022-02-17 Beijing Sankuai Online Technology Co., Ltd Unmanned driving behavior decision-making and model training
US11983245B2 (en) * 2018-09-12 2024-05-14 Beijing Sankuai Online Technology Co., Ltd Unmanned driving behavior decision-making and model training
CN111090707A (zh) * 2018-10-24 2020-05-01 中国移动通信有限公司研究院 数据处理方法及装置、电子设备及存储介质
CN109446049A (zh) * 2018-11-01 2019-03-08 郑州云海信息技术有限公司 一种基于监督学习的服务器错误诊断方法和装置
CN109902832A (zh) * 2018-11-28 2019-06-18 华为技术有限公司 机器学习模型的训练方法、异常预测方法及相关装置
CN109902832B (zh) * 2018-11-28 2023-11-17 华为技术有限公司 机器学习模型的训练方法、异常预测方法及相关装置
CN109614303A (zh) * 2018-12-05 2019-04-12 国网北京市电力公司 一种违规信息处理方法及装置
CN109816027A (zh) * 2019-01-29 2019-05-28 北京三快在线科技有限公司 无人驾驶决策模型的训练方法、装置及无人驾驶设备
CN110363231A (zh) * 2019-06-27 2019-10-22 平安科技(深圳)有限公司 基于半监督深度学习的异常识别方法、装置及存储介质
CN110334815A (zh) * 2019-07-10 2019-10-15 深圳前海微众银行股份有限公司 基于交叉验证的标签补全方法、终端、装置及存储介质
CN110399984B (zh) * 2019-07-24 2022-12-27 创新先进技术有限公司 一种信息的预测方法、系统以及电子设备
CN110399984A (zh) * 2019-07-24 2019-11-01 阿里巴巴集团控股有限公司 一种信息的预测方法、系统以及电子设备
CN110633730A (zh) * 2019-08-07 2019-12-31 中山大学 一种基于课程学习的深度学习机器阅读理解训练方法
CN110732139A (zh) * 2019-10-25 2020-01-31 腾讯科技(深圳)有限公司 检测模型的训练方法和用户数据的检测方法、装置
CN110732139B (zh) * 2019-10-25 2024-03-05 腾讯科技(深圳)有限公司 检测模型的训练方法和用户数据的检测方法、装置
CN111639698A (zh) * 2020-05-27 2020-09-08 东软睿驰汽车技术(沈阳)有限公司 样本融合方法和装置
CN112132179A (zh) * 2020-08-20 2020-12-25 中国人民解放军战略支援部队信息工程大学 基于少量标注样本的增量学习方法及系统
CN112465733A (zh) * 2020-08-31 2021-03-09 长沙理工大学 基于半监督学习的遥感图像融合方法、装置、介质及设备
CN116097046A (zh) * 2020-09-04 2023-05-09 大金工业株式会社 生成方法、程序、信息处理装置、信息处理方法及学习完毕模型
CN116097046B (zh) * 2020-09-04 2023-12-08 大金工业株式会社 生成方法、信息处理装置、信息处理方法及学习完毕模型
CN112699945A (zh) * 2020-12-31 2021-04-23 青岛海尔科技有限公司 数据标注方法及装置、存储介质及电子装置
CN112699945B (zh) * 2020-12-31 2023-10-27 青岛海尔科技有限公司 数据标注方法及装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN108596266A (zh) 基于半监督学习的融合决策方法、装置及存储介质
Jalal et al. Students’ behavior mining in e-learning environment using cognitive processes with information technologies
CN104572804B (zh) 一种视频物体检索的方法及其系统
US11030458B2 (en) Generating synthetic digital assets for a virtual scene including a model of a real-world object
CN104573706B (zh) 一种物体图像识别方法及其系统
Peng et al. Where do emotions come from? predicting the emotion stimuli map
CN103324937B (zh) 标注目标的方法和装置
CN105590099B (zh) 一种基于改进卷积神经网络的多人行为识别方法
CN107180226A (zh) 一种基于组合神经网络的动态手势识别方法
CN109978893A (zh) 图像语义分割网络的训练方法、装置、设备及存储介质
CN108171112A (zh) 基于卷积神经网络的车辆识别与跟踪方法
CN106599789A (zh) 视频类别识别方法和装置、数据处理装置和电子设备
CN107368787A (zh) 一种面向深度智驾应用的交通标志识别算法
CN110458107A (zh) 用于图像识别的方法和装置
CN105574550A (zh) 一种车辆识别方法及装置
CN112166438A (zh) 确定性标记数据生成和人工智能训练途径
CN110168530A (zh) 电子设备和操作该电子设备的方法
CN112801146B (zh) 一种目标检测方法及系统
CN111046980A (zh) 一种图像检测方法、装置、设备及计算机可读存储介质
CN109145766A (zh) 模型训练方法、装置、识别方法、电子设备及存储介质
CN111652087B (zh) 验车方法、装置、电子设备和存储介质
CN104021381B (zh) 一种基于多层级特征的人体动作识别方法
CN110222582B (zh) 一种图像处理方法和相机
CN109948637A (zh) 对象检测装置、对象检测方法及计算机可读介质
CN113052295B (zh) 一种神经网络的训练方法、物体检测方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180928