CN111881966A - 神经网络训练方法、装置、设备和存储介质 - Google Patents
神经网络训练方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN111881966A CN111881966A CN202010701981.8A CN202010701981A CN111881966A CN 111881966 A CN111881966 A CN 111881966A CN 202010701981 A CN202010701981 A CN 202010701981A CN 111881966 A CN111881966 A CN 111881966A
- Authority
- CN
- China
- Prior art keywords
- network
- trained
- image set
- description information
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 162
- 238000000034 method Methods 0.000 title claims abstract description 120
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 70
- 238000001514 detection method Methods 0.000 claims description 123
- 238000011156 evaluation Methods 0.000 claims description 52
- 230000008569 process Effects 0.000 claims description 47
- 238000002372 labelling Methods 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 9
- 238000013473 artificial intelligence Methods 0.000 description 32
- 241000282472 Canis lupus familiaris Species 0.000 description 21
- 238000004519 manufacturing process Methods 0.000 description 18
- 241000282326 Felis catus Species 0.000 description 16
- 230000006870 function Effects 0.000 description 12
- 230000008676 import Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000003068 static effect Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供一种神经网络训练方法、装置、设备和存储介质,其中,所述方法包括:根据获取的待处理任务,确定待训练网络;根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集;根据所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络;采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
Description
技术领域
本申请实施例涉及机器学习领域,涉及但不限于神经网络训练方法、装置、设备和存储介质。
背景技术
随着人工智能的发展,越来越多行业开始利用人工智能技术来提升企业和组织运营的效率,降低运营的成本。但是,大多数行业对于人工智能技术的应用,仍然存在单点化,典型化,定制化的特点。即仍然使用人工智能技术解决单点的业务问题,没有实现全流程的改造和人工智能(Artificial Intelligence,AI)升级。大多数行业使用人工智能技术,仍然要依托于人工智能公司为其定制人工智能模型,制约了人工智能的规模化应用。
发明内容
本申请实施例提供一种神经网络训练方法、装置、设备和存储介质。
本申请实施例提供一种神经网络训练方法,所述方法包括:
根据获取的待处理任务,确定待训练网络;
根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集;
根据所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络;
采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
在一些可能的实现方式中,所述根据获取的待处理任务,确定待训练网络,包括:根据所述待处理任务的模型需求,确定处理所述待处理任务的网络模型的描述信息;响应于网络模型库中不存在与所述描述信息相匹配的网络模型,根据所述描述信息创建所述待训练网络。如此,在网络模型库中不存在当前可用模型的情况下,能够根据用户的需求创建能够处理待处理任务的待训练网络。
在一些可能的实现方式中,在所述采用所述已训练网络对所述待处理任务进行处理,得到处理结果之前,所述方法还包括:确定所述已训练网络的检测指标的检测结果;对应地,响应于所述检测结果满足预设条件,采用所述已训练网络对所述待处理任务进行处理,得到处理结果。如此,对待训练网络进行训练之后,对已训练网络的检测指标进行检测,使得发布的已训练网络的性能较佳。
在一些可能的实现方式中,所述确定所述已训练网络的检测指标的检测结果,包括:从所述至少一个已标注图像集中,确定与所述训练集的类型相匹配的测评集;采用所述测评集对所述已训练网络的检测指标进行测评,得到所述检测结果。如此,能够从已标注图像集中选择与训练集类型相同的测评集,对已训练网络的检测指标进行测评,从而能够准确的检测出训练后的已训练网络的检测指标是否达标。
在一些可能的实现方式中,所述方法还包括:如果所述检测结果不满足预设条件,确定不满足预设条件的检测指标;根据所述不满足预设条件的检测指标,更换所述训练集;采用更换后的训练集对所述已训练网络进行训练,得到更新的已训练网络。如此,对已训练网络的检测指标进行测评之后,如果检测结果不满足条件,可以通过更好训练集,重新对已训练网络进行训练,从而使得更新的已训练网络的检测指标能够达标。
在一些可能的实现方式中,在所述根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集之前,所述方法还包括:确定与所述描述信息相匹配的图像集类别;如果预设图像集库中未包含满足所述图像集类别的目标图像集,获取至少两个图像;根据所述至少两个图像,创建至少一个图像集。如此,创建待训练网络之后,为该待训练网络创建至少一个图像集,从而能够更好的采用创建的图像集对待训练网络进行训练。
在一些可能的实现方式中,所述如果预设图像集库中未包含所述目标图像集,获取至少两个图像,包括:如果所述至少两个图像占据的数据流大于预设阈值,对所述至少两个图像进行压缩;按照预设批量,逐批次的获取压缩后的图像。如此,通过逐批次的将压缩打包后的图像进行上传,能够提高图像上传的流畅性。
在一些可能的实现方式中,在所述根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集之前,所述方法还包括:如果所述预设图像集库中包含满足所述所述图像集类别的目标图像集,根据所述待训练网络的描述信息,对所述目标图像集中的图像进行标注,得到已标注图像集。如此,在预设图像集库中包含目标图像集的情况下,建立图像的标签与待训练网络的描述信息之间的关联关系,从而减少了标签和待训练网络分离而使得待训练网络训练时使用错误标签。
在一些可能的实现方式中,所述根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集,包括:根据所述待训练网络的描述信息,确定至少一个图像标注类型;采用所述至少一个图像标注类型,对所述至少一个图像集中的图像进行标注,得到所述至少一个已标注图像集。如此,进一步的按照待训练网络的描述信息,确定需要标注的图像的标签,对图像集中的图像进行标注,已建立待训练网络与图像标签之间的关联关系。
在一些可能的实现方式中,所述采用所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络,包括:从所述至少一个已标注图像集中,确定与所述描述信息相匹配的训练集;采用所述训练集对待训练网络进行训练,得到已训练网络。如此,对图像集进行标注之后,从中选择合适的训练集对待训练网络进行训练,从而在网络训练系统中自动完成对待训练网络的训练过程。
在一些可能的实现方式中,所述方法还包括:如果所述网络模型库中存在与所述描述信息相匹配的模型,将所述与所述描述信息相匹配的模型作为所述待训练网络。如此,能够自动对网络模型库中满足描述信息的模型进行自动训练,从而满足用户需求。
在一些可能的实现方式中,所述方法还包括:如果所述网络模型库中与所述描述信息相匹配的模型的数量大于1,采用所述训练集对多个与所述描述信息相匹配的模型进行训练,得到多个已训练网络;确定所述多个已训练网络中每一已训练网络的检测指标的检测结果;对所述多个已训练网络的检测结果排序;采用排列在预设位置的已训练网络对所述待处理任务进行处理,得到所述处理结果。如此,在网络模型库中包括多个满足描述信息的模型的情况下,通过对多个已训练网络的检测指标进行检测,并对检测结果进行排序,从而能够为用户提供性能最佳的已训练网络。
本申请实施例提供一种神经网络训练装置,所述装置包括:
第一确定模块,用于根据获取的待处理任务,确定待训练网络;
第一标注模块,用于根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集;
第一训练模块,用于根据所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络;
第一处理模块,用于采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
在一些可能的实现方式中,所述第一确定模块,包括:
第一确定子模块,用于根据所述待处理任务的模型需求,确定处理所述待处理任务的网络模型的描述信息;
第一创建子模块,用于响应于网络模型库中不存在与所述描述信息相匹配的网络模型,根据所述描述信息创建待训练网络。
在一些可能的实现方式中,所述装置还包括:
第二确定模块,用于确定所述已训练网络的检测指标的检测结果;
对应地,第二处理模块,用于响应于所述检测结果满足预设条件,采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
在一些可能的实现方式中,所述第二确定模块,包括:
第四确定子模块,用于从所述至少一个已标注图像集中,确定与所述训练集的类型相匹配的测评集;
第一测评子模块,用于采用所述测评集对所述已训练网络的检测指标进行测评,得到所述检测结果。
在一些可能的实现方式中,所述装置还包括:
第四确定模块,用于如果所述检测结果不满足预设条件,确定不满足预设条件的检测指标;
第一更换模块,用于根据所述不满足预设条件的检测指标,更换所述训练集;
第二训练模块,用于采用更换后的训练集对所述已训练网络进行训练,得到更新的已训练网络。
在一些可能的实现方式中,所述装置还包括:
第三确定模块,用于确定与所述描述信息相匹配的图像集类别;
第一获取模块,用于如果预设图像集库中未包含满足所述图像集类别的目标图像集,获取至少两个图像;
第一创建模块,用于根据所述至少两个图像,创建至少一个图像集。
在一些可能的实现方式中,所述第一获取模块,包括:
第一压缩子模块,用于如果所述至少两个图像占据的数据流大于预设阈值,对所述至少两个图像进行压缩;
第一获取子模块,用于按照预设批量,逐批次的获取压缩后的图像。
在一些可能的实现方式中,所述装置还包括:
第二标注模块,用于如果所述预设图像集库中包含满足所述所述图像集类别的目标图像集,根据所述待训练网络的描述信息,对所述目标图像集中的图像进行标注,得到已标注图像集。
在一些可能的实现方式中,所述第一标注模块,包括:
第二确定子模块,用于根据所述待训练网络的描述信息,确定至少一个图像标注类型;
第一标注子模块,用于采用所述至少一个图像标注类型,对所述至少一个图像集中的图像进行标注,得到所述至少一个已标注图像集。
在一些可能的实现方式中,所述第一训练模块,包括:
第三确定子模块,用于从所述至少一个已标注图像集中,确定与所述描述信息相匹配的训练集;
第一训练子模块,用于采用所述训练集对待训练网络进行训练,得到已训练网络。
在一些可能的实现方式中,所述装置还包括:
第五确定模块,用于如果所述网络模型库中存在与所述描述信息相匹配的模型,将所述与所述描述信息相匹配的模型作为所述待训练网络。
在一些可能的实现方式中,所述装置还包括:
第三训练模块,用于如果所述网络模型库中与所述描述信息相匹配的模型的数量大于1,采用所述训练集对多个与所述描述信息相匹配的模型进行训练,得到多个已训练网络;
第一评测模块,用于确定所述多个已训练网络中每一已训练网络的检测指标的检测结果;
第一排序模块,用于对所述多个已训练网络的检测结果排序;
第三处理模块,用于采用排列在预设位置的已训练网络对所述待处理任务进行处理,得到所述处理结果。
本申请实施例提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令被执行后,能够实现上述的方法步骤。
本申请实施例提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时可实现上述的方法步骤。
本申请实施例提供一种计算机程序,包括用于实现上述的方法步骤的计算机指令。
本申请实施例提供的技术方案,响应于获取的待处理任务,首先确定用于处理该待处理任务的待训练网络;然后,获取与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集;这样,就建立了获取的图像集中的图像与待训练网络之间的关联关系,从而能够避免已标注图像的标签和待训练网络分离而使得网络训练时使用错误的标签;然后,根据至少一个已标注图像集对待训练网络进行训练,得到已训练网络;最后,采用所述已训练网络对所述待处理任务进行处理,得到处理结果。这样,可以根据获取的待处理任务的需求,从而能够自动训练得到可用于各类场景下的神经网络,摆脱人工智能模型定制化的限制,进而提升自身运营效率。
附图说明
图1A是本发明实施例提供的神经网络训练系统的一个可选的架构示意图;
图1B为本申请实施例神经网络训练方法的流程示意图;
图2A为本申请实施例神经网络训练方法的又一流程示意图;
图2B为本申请实施例神经网络训练方法的另一流程示意图;
图3为本申请实施例神经网络训练方法的实现流程示意图;
图4为本申请实施例神经网络训练装置的组成结构示意图;
图5为本申请实施例计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对发明的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)长尾场景:主要指种类繁多、发生概率较低或者突发的场景,比如闯红灯的车辆,横穿马路的行人,红绿灯损坏的路口,路边违章停靠的车辆等。
2)深度学习:是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
3)人工神经网络(Artificial Neural Networks,ANNs):也简称为神经网络(NNs)或称作连接模型(Connection Model),是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
本申请实施例提供的技术方案可以对处理各类场景下的待处理任务的神经网络,进行训练,即可以根据待处理任务所需模型的需求,创建待训练网络,然后通过建立待训练网络与图像集之间的关联关系,避免了在训练过程中使用错误的训练集总图像的标签对待训练网络进行训练,从而提高了得到的已训练网络的网络参数的准确度;然后,通过采用这样与待训练网络具有关联关系的已标注图像集,能够自动对待训练网络进行训练,从而摆脱人工智能模型定制化的限制,提升自身运营效率,降低运营成本,完成向AI化转型。
下面说明本申请实施例提供的神经网络训练的设备的示例性应用,本申请实施例提供的设备可以实施为笔记本电脑,平板电脑,台式计算机,机顶盒,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的用户终端,也可以实施为服务器。下面,将说明设备实施为终端或服务器时示例性应用。
参见图1A,图1A是本发明实施例提供的神经网络训练系统的一个可选的架构示意图,为实现支撑一个示例性应用,神经网络训练系统11中,当获取到待处理任务101时,基于该待处理任务101确定出所需的模型需求;然后,基于模型需求创建用于处理该待处理任务101的待训练网络12;然后,建立待训练网络12与图像的标签之间的绑定关系,比如,根据待训练网络12的描述信息,对获取的至少一个图像集中的图像进行标注,得到至少一个已标注图像集102;这样,就建立了获取的图像集中的图像与待训练网络12之间的关联关系,从而能够避免已标注图像的标签和待训练网络12分离而使得网络训练时使用具有错误标签的数据集;然后,从至少一个已标注图像集102中选择一个图像集作为训练集13,用该训练集13对待训练网络12进行训练,得到已训练网络14;接下来,从至少一个已标注图像集102中选择一个图像集作为测评集15,对已训练网络14的检测指标进行评测,得到评测结果;最后,如果评测结果满足预设条件,即检测指标均达标,采用所述已训练网络14对所述待处理任务101进行处理,得到处理结果103。这样,可以根据获取的待处理任务的需求,从而能够训练得到可用于各类场景下的神经网络,摆脱人工智能模型定制化的限制,进而提升自身运营效率。
该方法可以应用于计算机设备,在一些实施例中,该方法所实现的功能可以通过计算机设备中的处理器调用程序代码来实现,其中,程序代码可以保存在计算机存储介质中。
本申请实施例提供一种神经网络训练方法,下面结合图1B进行详细描述。
步骤S101,根据获取的待处理任务101,确定待训练网络12。
在一些可能的实现方式中,待处理任务可以任意场景下的处理请求,比如,长尾场景下的物体检测任务和图像分类任务等。当获取到待处理任务之后,确定该待处理任务所需要的模型需求,然后基于该模型需求,从网络模型库中确定与模型需求相匹配的网络模型作为待训练网络,或者如果网络模型库中没有与模型需求相匹配的网络模型,那么基于该模型需求,创建待训练网络。在一个具体例子中,如果待处理任务是长尾场景下的物体检测任务,那么可以确定该任务的模型需求中应该包括的是制定检测类模型的一些属性信息(比如,网络模型的网络参数,权重等),那么基于该模型需求,确定检测类模型作为待训练网络。比如,从网络模型库中查找是否已经存在检测类模型,例如网络模型库中存在之前训练好的检测障碍物的模型,那么可以把该模型作为待训练网络;如果网络模型库中不存在检测类模型,那么可以基于该模型需求搭建一个检测类的待训练网络。
在一些实施例中,获取到待处理任务之后,还需要确定登陆系统发起该任务的用户是否为图像标注员,如果待处理任务对应的用户信息未包含于标注员信息库中,且处理所述待处理任务所需网络模型的未包含于网络模型库中,根据所述描述信息创建待训练网络。即,如果用户不是图像标注员,说明该用户登陆系统的目的不是或者不只是为了对图像集进行标注,是希望得到能够处理该任务的网络模型,基于此,根据描述信息创建待训练网络。反之,如果用户是图像标注员,那么可以是先基于描述信息创建待训练网络,然后再对图像集中的图像标签进行标识,以建立图像标签与待训练网络之间的关联关系。
步骤S102,根据所述待训练网络12的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集102。
在一些实施例中,待训练网络的描述信息至少包括:待训练网络的名称、功能和所属类别等。确定待训练网络之后,为该待训练网络创建图像集,并且将图像集的标签与待训练网络进行绑定。在一些可能的实现方式中,根据待训练网络的名称、功能和所属类别等描述信息,对一个或多个图像集中的图像的标签进行标注,这样得到已标注图像集。步骤S102中,确定与所述描述信息具有绑定关系的至少一个已标注图像,可以是从当前已经存在的图像库中,获取与描述信息具有绑定关系的一些已标注图像;如果图像库中不存在与描述信息具有绑定关系的已标注图像,那么可以是根据描述信息,对至少一个图像集中的图像进行标注,得到至少一个已标注图像。在一个具体例子中,待训练网络的名称是分类网络,功能是实现猫狗分类,类别是分类型网络,那么基于此,对图像集中的图像的标签进行标注,即将图像集中的图像的标签标注为猫或狗。如此,在本申请实施例中,根据待训练网络的描述信息,来标注图像集中的图像,从而建立了图像集中的图像的标签与待训练网络之间的关联关系,这样,当采用该图像集作为训练集对待训练网络进行训练时,能够减少标签和待训练网络分离而使得待训练网络训练时使用错误标签的情况。
步骤S103,根据所述至少一个已标注图像集102对所述待训练网络12进行训练,得到已训练网络14。
采用与待训练网络之间建立了关联关系的已标注图像集作为训练集,对所述待训练网络进行训练,既能够自动对待训练网络进行训练,还能够保证训练后的网络的准确度。在一些可能的实现方式中,可以是采用至少一个已标注图像集中的一个图像集或多个图像集作为训练集,对待训练网络进行自动训练,如此,用户可以根据自身需求,训练得到各类长尾场景下的物体检测和图像分类模型,摆脱人工智能模型定制化的限制,提升自身运营效率,降低运营成本。
步骤S104,采用已训练网络14对待处理任务进行处理,得到处理结果103。
在一些可能的实现方式中,得到已训练网络之后,还可以采用已标注图像集对已训练网络的检测指标进行评测,如果评测结果表征该已训练网络的准确度较高,那么可以发布该已训练网络,并采用已训练网络对待处理任务进行处理,得到处理结果。
在本申请实施例中,当获取到待处理任务时,首先用户可以根据自身的需求,创建待训练网络;然后,为该待训练网络绑定图像集,从而,得到至少一个与待训练网络之间具有关联关系的已标注图像集;从而能够避免已标注图像的标签和待训练网络分离而使得网络训练时使用错误的标签;然后,根据至少一个已标注图像集对待训练网络进行训练,得到已训练网络;最后,采用所述已训练网络对所述待处理任务进行处理,得到处理结果。如此,可以根据获取的待处理任务的需求,从而能够训练得到可用于各类场景下的神经网络,并摆脱人工智能模型定制化的限制,进而提升自身运营效率。
在一些实施例中,对于获取的待处理任务,首先确定该待处理任务的模型需求,可以根据模型需求,自动训练得到能够应用在该待处理任务所属场景下的神经网络模型,即步骤S101可以通过以下步骤实现:
步骤S111,根据所述待处理任务101的模型需求,确定能够处理所述待处理任务101的网络模型的描述信息。
在一些可能的实现方式中,获取到待处理任务之后,先确定该待处理任务所需模型的模型需求,然后根据该模型需求,确定该模型的描述信息。比如,确定该待处理任务所需模型的网络参数等,然后根据这些网络参数确定该网络模型的描述信息。
步骤S112,响应于网络模型库中不存在与所述描述信息相匹配的模型,根据所述描述信息创建待训练网络12。
确定处理待处理任务所需网络模型的描述信息之后,首先从网络模型库中查找是否当前有可用的网络模型,其中,可用的网络模型可以理解为是与处理待处理任务所需网络模型属于同一类型的模型,比如,处理待处理任务所需网络模型是对猫狗进行分类,与该处理待处理任务所需网络模型属于同一类型的模型可以是对各品种的猫或各品种的狗进行分类的模型。如果在网络模型库中不存在与所述描述信息相匹配的模型,即网络模型库中不存在与该处理待处理任务所需网络模型属于同一类型的模型,那么基于该描述信息,创建待训练网络,在创建待训练网络的过程中,将网络名称、用途和类型均进行指定,即创建好的待训练网络中携带该网络的名称、用途和类型。
在一些可能的实现方式中,根据所述描述信息创建待训练网络的过程可以是,首先,确定处理待处理任务所需模型的模型需求,然后,确定用于实现模型需求的模型的描述信息;最后,根据所述描述信息,创建所述待训练网络。也就是说,可以先确定出待处理任务所需模型的模型需求,然后,基于该需求编辑描述信息,最后创建能够满足模型需求的待训练网络,这样,用户就可以根据自身需求搭建待训练网络,进行自动训练,无需依赖于人工智能公司为其定制人工智能模型。
在一些实施例中,如果网络模型库中已存在当前可用的网络模型,那么可以将该模型作为待训练网络,这样,可以实现对网络模型中的旧模型进行再次迭代训练,过程如下:
如果所述网络模型库中存在与所述描述信息相匹配的模型,将所述与所述描述信息相匹配的模型作为所述待训练网络。
这里可用采用实现步骤S112的方式,确定待训练网络。这样,在本申请实施例中,能够对已经存在的旧的神经网络进行迭代训练,得到最终符合条件的已训练网络。
在一些实施例中,在网络模型库中存在多个旧模型的情况下,通过对多个就模型进行训练之后,对得到的多个已训练网络的性能进行评测,将性能最佳的网络模型作为最终的已训练网络对待处理任务进行处理,即,如果是多个旧模型可以对训练后的多个旧模型进行比对,将性能最佳的网络模型进行发布,过程如下:
首先,如果所述网络模型库中与所述描述信息相匹配的模型的数量大于1,采用所述训练集对多个与所述描述信息相匹配的模型进行训练,得到多个已训练网络。
比如,网络模型库中包括两个或者两个以上的与所述描述信息相匹配的模型,那么可以采用同样或者同一类型的训练集对这些网络模型进行训练,得到多个已训练网络。
其次,确定所述多个已训练网络中每一已训练网络的检测指标的检测结果。
比如,采用同样的测评集15,对这些已训练网络的网络指标进行检测,得到每一已训练网络的检测指标的检测结果;实现,多多个已训练网络的检测指标的横向比较。
再次,对所述多个已训练网络的检测结果排序。
在一些可能的实现方式中,按照检测结果的值的大小,对多个已训练网络的检测结果排序。比如,检测指标是召回率,那么可以按照检测结果中召回率的大小,对多个已训练网络的检测结果排序。
最后,采用排列在预设位置的已训练网络对所述待处理任务进行处理,得到所述处理结果。
比如,如果检测指标是召回率,而且是按照检测结果中召回率的由大到小的顺序对检测结果进行排序的,那么说明排列在第一个的已训练网络的性能最好;即可以将排列在第一个的已训练网络作为能够发布的网络模型,并采用该排列在第一个的已训练网络对待处理任务进行处理,得到所述处理结果。如此,通过对网络模型库中的多个旧模型进行训练,并对多个已训练网络的检测指标进行比对,将性能最佳的已训练网络进行发布,能够为用户提供较佳的网络模型,进而提升网络模型生产效率,降低网络模型的生产成本。
在一些实施例中,对待训练网络进行训练完成之后,需要对已训练网络的检测指标进行测评,以确定该已训练网络是否具有较高的处理准确率,即在步骤S104之前,所述方法还包括以下步骤:
步骤S151,确定所述已训练网络14的检测指标的检测结果。
可以采用与训练集属于同一类型的图像集对已训练网络的检测指标进行测评,得到检测结果。其中,检测指标随着已训练网络的功能的变化而变化,检测指标能够表征已训练网络实现该功能的准确度。比如,针对物体检测的模型,会主要评测平均的平均精确度(mean Average Precision,mAP)指标,针对图像分类的模型,则主要评测召回率和精确率指标;对于人脸识别模型,则主要评测动态布控下的指标,如误识率和通过率,以及静态检索下的指标,如前N个(TopN)的命中率。如果精度达到预期,用户可以将此模型进行发布,全流程结束。
在一些可能的实现方式中,首先,从所述至少一个已标注图像集中,确定与所述训练集的类型相匹配的测评集15;比如,训练集是已标注猫狗两类标签的图像集,那么测评集15应该是从至少一个已标注图像集中确定出的猫狗类图像集。然后,采用所述测评集15对所述已训练网络的检测指标进行测评,得到所述检测结果。这样,能够准确的测评出采用该训练集训练之后得到的已训练网络的准确度。在其他实施例中,也可以采用与训练集属于同一类型,但是不属于同一子集的图像集作为测评集(比如,对建筑物的类型进行分类,训练集可以采用真实场景中的各种结构的建筑物,测评集中可以包括动画中的建筑物),以检测已训练网络的泛化能力。
在其他实施例中,在检测结果不满足预设条件的情况下,可以通过重新选择训练集,以再次对待训练网络进行训练,过程如下:
首先,如果所述检测结果不满足预设条件,确定不满足预设条件的检测指标。
预设条件是与检测指标相匹配的,如果检测指标是误识率和通过率,那么预设条件是一个误识率阈值和通过率阈值;如果检测指标是命中率,那么预设条件就是命中率阈值。在一些可能的实现方式中,检测指标可以是多个或者一个,如果检测指标为多个,检测结果中任一检测指标的检测结果不满足预设条件,即视为已训练网络的检测结果不满足预设条件,并确定出不满足预设条件的检测指标。在一个具体例子中,如果待训练网络是对猫狗进行分类的网络,采用的是具有猫狗标签的训练集对待训练网络进行训练,而采用的是具有道路障碍物标签的测评集对已训练网络进行测评,那么检测指标是召回率和精确率,如果召回率太低或者精确率太低,即检测结果不满足预设条件,那么确定出不满足条件的检测指标,比如,召回率低于召回率阈值,那么确定召回率为不满足预设条件的检测指标。
其次,根据所述不满足预设条件的检测指标,更换训练集。
按照不满足预设条件的检测指标,从至少一个已标注图像集中,选择一个能够匹配该检测指标的图像集,比如,不满足预设条件的检测指标是召回率,从至少一个已标注图像集中,选择一个能够提升召回率的图像集对待已训练网络进行再次训练,从而使得再次训练后的已训练网络的检测指标能够达标。
最后,采用更换后的训练集对所述已训练网络进行训练,得到所述更新的已训练网络。
比如,在系统平台上,自动采用更换后的训练集对已训练网络进行再次训练,以更新已训练网络,得到更新的已训练网络。
步骤S152,响应于所述检测结果满足预设条件,采用所述已训练网络14对所述待处理任务进行处理,得到处理结果。
在一些可能的实现方式中,如果检测结果满足条件,说明该已训练网络的准确度较高,可以作为可发布的网络模型,并将该已训练网络进行发布,以使用户能够采用已训练网络对待处理任务进行处理,得到处理结果。
在一些实施例中,在确定待训练网络之后,为该待训练网络创建图像集,即建立图像集与待训练网络之间的绑定关系,可以通过以下过程实现:
第一步,确定与所述描述信息相匹配的图像集类别。
在确定待训练网络之后,为该待训练网络创建图像集,首先,要确定与描述信息相匹配的图像集类别,然后,判断预设图像集库中是否包含该类别的目标图像集。在一些可能的实现方式中,与描述信息相匹配的图像集类别,可以理解为是,图像集类别与描述信息中包含的待训练网络的类型相同,即确定与所述描述信息中包含的待训练网络的类型相同的图像集类别,比如,描述信息中包含的待训练网络的类型是对猫狗进行分类,那么图像集类别应该为标注的标签为猫狗类的图像集。
第二步,如果预设图像集库中未包含满足所述图像集类别的目标图像集,获取至少两个图像。
确定出与描述信息相匹配的图像集类别之后,首先判断预设图像集库中是否包含满足图像集类别的目标图像集,如果不包含,那么可以直接获取多个图像,比如,可以是从用户本地直接上传图像,也可以是从生产环境导入图像集。当用户从生产环境中直接导入图像集时,可以通过对图像进行压缩打包,逐批次的导入系统,还可以将生产环境中的真实场景的实时数据,导入到数据平台。
在一些可能的实现方式中,首先,如果所述占据的数据流大于预设阈值,对所述至少两个图像进行压缩;比如,当数据流转引擎中累计的真实场景的实时数据超过一个预先设置的阈值(例如,超过1000张)时,对这些图像进行压缩打包。这样,在图像数据量较大的情况下,通过将图像压缩后传输,能够减少占据的传输带宽。然后,按照预设批量,逐批次的加载压缩后的图像,以得到所述至少两个图像。比如,将打包好的图像,分批导入到系统,从系统中逐批次的加载压缩后的图像,以得到批量图像;从而以供从中选择训练集和测评集。这样,通过逐批次的将压缩打包后的图像进行上传,能够提高图像上传的流畅性。
第三步,根据所述至少两个图像,创建至少一个图像集。
获取到多个图像之后,基于该多个图像创建一个或多个图像集。
在一些实施例中,创建待训练网络之后,在构建该待训练网络的图像集时,首先判断预设图像集库中是否包含当前可用的目标图像集,如果所述预设图像集库中包含满足图像集类别的目标图像集,根据待训练网络的描述信息,对目标图像集中的图像进行标注,得到已标注图像集。也就是说,如果预设图像集库中包含当前可用的目标图像集,那么可以将该目标图像集作为需要与待训练网络建立关联关系的图像集,比如,待训练网络是一个猫狗分类的网络,之前已经训练过一个狗狗种类检测的网络,那么训练狗狗种类检测的网络时候使用的图像集,可看作是训练猫狗分类的网络的可用图像集。即,如果预设图像集库中包含训练狗狗种类检测的网络时候使用的图像集,那么可以将该图像集作为目标图像集,从而对该目标图像集中的图像进行标注,以建立目标图像集中的图像标签与待训练网络之间的关联关系。
在一些实施例中,创建待训练网络之后,建立图像集和待训练模型之间的关联关系,即步骤S102可以通过以下步骤实现,参见图2A,图2A为本申请实施例神经网络训练方法的又一流程示意图,结合图1B进行以下说明:
步骤S201,根据所述待训练网络12的描述信息,确定至少一个图像标注类型。
在一些可能的实现方式中,可以是根据描述信息中的待训练网络的功能和类型确定需要标注的标签类型。在一个具体例子中,待训练网络的功能是进行猫狗分类,类型是分类型网络,那么图像标注类型,即需要为图像标注的标签类型为猫和狗。
步骤S202,采用所述至少一个图像标注类型,对所述至少一个图像集中的图像进行标注,得到所述至少一个已标注图像集102。
采用步骤S201中确定的需要标注的标签类型,对图像集中的图像进行标注,得到已标注图像集。比如,需要为图像标注的标签类型为猫和狗,那么将图像集中图像的标签标注为猫或狗。
在一些实施例中,在图像集与待训练网络之间建立关联关系之后,可以采用已标注图像集中的一个或多个图像集作为训练集,对待训练网络完成自动训练,从而摆脱了人工智能模型定制化的限制,即步骤S103可以通过以下步骤实现,参见图2B,图2B为本申请实施例神经网络训练方法的另一流程示意图,结合图1B进行以下说明:
步骤S221,从所述至少一个已标注图像集102中,确定与描述信息相匹配的训练集13。
与所述描述信息相匹配的训练集,可以理解为是与描述信息中的待训练网络的功能相匹配的训练集。在一些可能的实现方式中,首先,根据描述信息中的待训练网络的功能,确定与之相匹配的图像标签,然后,从至少一个已标注图像集中选择具有图像标签的图像集作为训练集。比如,描述信息中待训练网络的功能为对道路障碍物进行检测,那么与之匹配的标签为道路障碍物标签;然后,从至少一个已标注图像集中选择图像标签为道路障碍物的图像集作为训练集。
步骤S222,采用所述训练集13对待训练网络12进行训练,得到已训练网络14。
在一些可能的实现方式中,为待训练网络选择合适的训练集之后,系统自动采用该训练集对待训练网络进行训练,得到已训练网络。如此,用户可以根据自身需求,采用合适的训练集训练得到能够处理待处理任务的网络模型,从而摆脱人工智能模型定制化的限制,提升自身运营效率。
在相关技术中,随着人工智能的发展,越来越多行业开始利用人工智能技术来提升企业和组织运营的效率,降低运营的成本。但是,大多数行业对于人工智能技术的应用,仍然存在单点化,典型化,定制化的特点。所谓单点化,即仍然使用人工智能技术解决单点的业务问题,没有实现全流程的改造和AI升级。所谓典型化,即大多数行业对人工智能技术的使用,仍然局限在典型技术上,例如人脸识别、语音识别、自然语言理解等,还有更多更长尾的场景的没有使用人工智能技术。所谓定制化是指,大多数行业使用人工智能技术,仍然要依托于人工智能公司为其定制人工智能模型。这三个方面的问题,制约着人工智能的规模化应用趋势。
基于此,本申请实施例提出一种神经网络模型自动训练的方法,通过此方法,用户可以根据自身需求,训练得到各类长尾场景下的物体检测和图像分类模型,摆脱人工智能模型定制化的限制,提升自身运营效率,降低运营成本,完成向AI化转型。
图3为本申请实施例神经网络训练方法的实现流程示意图,如图3所示,所述方法可以通过以下步骤实现:
步骤S301,判断登陆的用户是否为图像标注员。
在一些可能的实现方式中,判断用户的登陆信息是否为图像标注员信息,如果是进入步骤S321;否则,进入步骤S302。
步骤S302,判断是否已有可用模型。
也就是说,如果登陆的用户不是图像标注员,判断是否已有可用模型。如果当前没有可用模型,则进入步骤S303。
步骤S303,创建待训练网络。
在一些可能的实现方式中,在生产待训练网络的流程中,用户需要首先创建一个模型。在创建模型时,要指定模型的类型,填写模型的名称和描述。
步骤S304,为待训练网络设置标签。
在一些可能的实现方式中,用户需要在创建模型的同时,创建模型的标签,即这个模型可以检测什么样的物体,或者可以对什么样的场景/物体进行分类。
上述步骤S301至步骤S304完成了待训练网络创建的过程。
步骤S305,为待训练网络创建图像集。
步骤S306,判断待训练网络是否已有可用图像集。
如果待训练网络已有可用图像集,进入步骤S307;否则,进入步骤S308。
步骤S307,选择已有的图像集,作为待训练网络的数据源。
步骤S308,导入图像。
如果待训练网络没有当前可用图像集,则导入图像。在一些实施例中,创建图像集时,支持从用户本地直接上传图像,也支持从生产环境导入图像集。当用户从生产环境中直接导入图像集时,会使用数据流转引擎。该引擎可以将生产环境中的真实场景的实时数据,导入到数据平台。当数据流转引擎中累计的真实场景的实时数据超过一个预先设置的阈值(例如1000张)时,数据流转引擎会将这些图像进行压缩打包,并将打包好的图像,分批导入到系统。
步骤S309,选择标注员群组。
步骤S310,将图像集与待训练网络进行关联。
步骤S311,发起图像标注任务。
步骤S305至步骤S311完成了待训练网络的图像集的创建过程。
步骤S321,判断是否已有待标注图像集。
也就是说,如果用户的登陆信息是图像标注员信息,判断该待训练网络是否已有待标注图像集。如果已有待标注图像集,进入步骤S322,否则,结束整个流程。
步骤S322,图像标注员开始手动标注图像。
步骤S323,发布标注结果。
在一些实施例中,发布标注结构之后进入步骤S331。
上述步骤S321至步骤S323完成了对图像集中的图像进行标注的过程。
步骤S331,接收标注结果。
步骤S332,从已标注图像集中,选择训练集。
比如,从已标注图像集中,选择指定的,经过标注的训练集。
步骤S333,自动完成对待训练网络的训练。
在一些实施例中,系统接收到用户输入的发起训练的指令之后,在系统内自动完成对待训练网络的训练。图像集标注完成后,用户需要选择指定的,经过标注的图像集,发起模型训练。模型训练将在系统内自动完成。
上述步骤S331至步骤S333完成了待训练网络的训练过程。
步骤S334,选择测评集,以评测该待训练网络的精度。
在一些实施例中,完成模型训练后,用户可以指定一个图像集作为评测模型的测评集,查看模型在此测评集上的精度。
步骤S335,查看待训练网络在此测评集上的评测指标。
步骤S336,判断评测指标是否达标。
如果评测指标达标,进入步骤S336;如果评测指标未达标,那么进入步骤S332重新选择训练集,对待训练网络进行重新训练。
步骤S337,如果评测指标达标,则发布该待训练网络。
在一些可能的实现方式中,模型评测时,系统会根据模型的类型,自动匹配最适合的评测指标,例如针对物体检测的模型,会主要评测mAP指标,针对图像分类的模型,则主要评测召回率和精确率指标,对于人脸识别模型,则主要评测动态布控下的指标,如误识率和通过率,以及静态检索下的指标,如TopN的命中率。如果精度达到预期,用户可以将此模型进行发布,全流程结束。
上述步骤S334至步骤S337完成了对训练好的待训练网络的评测过程,至此步骤S301至步骤S334完成了待训练网络的生产过程,即得到了训练好的待训练网络。
下面将完成迭代旧模型的流程,与上述步骤S301至步骤S334的过程类似,过程如下:
首先,用户需要选择一个系统内已经存在的模型。
其次,模型选定后,用户需要为这个模型创建图像集。
在一些实施例中,创建图像集时,支持从用户本地直接上传图像,也支持从生产环境导入图像集。当用户从生产环境中直接导入图像集时,会使用数据流转引擎。该引擎可以将生产环境中的真实场景的实时数据,导入到数据平台。当数据流转引擎中累计的真实场景的实时数据超过一个预先设置的阈值(例如1000张)时,数据流转引擎会将这些图像进行压缩打包,并将打包好的图像,分批导入到系统。
再次,创建完图像集后,用户需要对图像集中的图像进行标注。
在一些实施例中,标注的标签来自于图像集关联的模型对应的标签。系统提供了可扩展的标注平台,用户可以利用标注平台中自带的数据标注工具,如拉框、打标签等,对数据进行标注,也可以自行开发满足自己需求的标注工具。
再次,图像集标注完成后,用户需要选择指定的,经过标注的图像集,对选定的模型发起训练。模型训练将在系统内自动完成。
再次,完成模型训练后,用户可以指定一个图像集作为评测模型的测评集,查看模型在此测评集上的精度。
在一些实施例中,模型评测时,系统会根据模型的类型,自动匹配最适合的评测指标,例如针对物体检测的模型,会主要评测mAP指标,针对图像分类的模型,则主要评测召回率和精确率指标,对于人脸识别模型,则主要评测动态布控下的指标,如误识率和通过率,以及静态检索下的指标,如TopN的命中率。
最后,如果精度达到预期,用户可以将此旧模型进行发布,全流程结束。
接下来,在步骤S331之后,还可以实现多个已训练网络进行对比的流程,过程如下:
步骤S341,选择测评集。
步骤S342,采用该测评集对多个已训练网络进行测评。
在本申请实施例中,将该测评集对多个已训练网络进行测评,以对比该多个已训练网络的性能。当采用测评集对多个已训练网络进行测评完成时,可进入步骤S335,即查看多个已训练网络的测评指标,并对比多个已训练网络的测评指标。比如,用户可以对比多个已训练网络在同一个或多个测评集中的指标,确认模型的精度是否达到预期。如果精度达到预期,用户可以将此模型进行发布,全流程结束。
在一些可能的实现方式中,对于多个进行对比的模型的创建过程如下:
首先,用户需要选择多个系统内已经存在的模型。
其次,模型选定后,用户需要为这个模型创建图像集。
在一些实施例中,创建图像集时,支持从用户本地直接上传图像,也支持从生产环境导入图像集。当用户从生产环境中直接导入图像集时,会使用数据流转引擎。该引擎可以将生产环境中的真实场景的实时数据,导入到数据平台。当数据流转引擎中累计的真实场景的实时数据超过一个预先设置的阈值(例如1000张)时,数据流转引擎会将这些图像进行压缩打包,并将打包好的图像,分批导入到系统。
再次,创建完图像集后,用户需要对图像集中的图像进行标注。
在一些实施例中,标注的标签来自于图像集关联的模型对应的标签。系统提供了可扩展的标注平台,用户可以利用标注平台中自带的数据标注工具,如拉框、打标签等,对数据进行标注,也可以自行开发满足自己需求的标注工具。
再次,图像集标注完成后,用户需要选择指定的,经过标注的图像集作为测评集,对选定的多个已训练网络进行评测。
在一些实施例中,模型评测时,系统会根据模型的类型,自动匹配最适合的评测指标,例如针对物体检测的模型,会主要评测mAP指标,针对图像分类的模型,则主要评测召回率和精确率指标,对于人脸识别模型,则主要评测动态布控下的指标,如误识率和通过率,以及静态检索下的指标,如TopN的命中率。用户可以对比多个已训练网络在同一个或多个测评集中的指标,确认模型的精度是否达到预期。
最后,如果精度达到预期,用户可以将此性能最佳的网络模型进行发布,全流程结束
在本申请实施例中,构建一种神经网络模型自动训练的方法,包括生产待训练网络流程,迭代旧模型流程,对比模型流程;其中,在生产待训练网络流程,包含创建模型,创建图像集,标注图像,训练网络,评测模型,发布模型等步骤;在迭代旧模型流程,包含选择旧模型,创建图像集,标注图像,训练网络,评测模型,发布模型等步骤;在对比模型流程,包含选择旧模型,创建图像集,标注图像,评测模型等步骤。这样,通过包括图像集,训练网络,评测模型,发布模型等流程,完成人工智能模型的生产。在创建模型时,选择场景和模型类型,并绑定模型对应的标签,实现模型的快速创建。在创建图像集时,需要将图像集绑定到对应的模型上,以绑定图像集的标注标签,并确保图像集和模型一一对应,避免使用错误图像集训练网络的情况发生。即,确保创建模型时即创建标签,实现标签与模型的绑定,避免标签和模型分离而使得模型训练时使用错误标签。由于支持对比多个已训练网络,所以能够实现快速判断多个已训练网络在同一个测评集上的表现。如此,本申请实施例能够自动完成模型的训练,评测和发布,提升模型生产效率,降低模型生产成本。
本申请实施例提供一种神经网络训练装置,图4为本申请实施例神经网络训练装置的组成结构示意图,如图4所示,所述装置400包括:
第一确定模块401,用于根据获取的待处理任务,确定待训练网络;
第一标注模块402,用于根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集;
第一训练模块403,用于根据所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络;
第一处理模块404,用于采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
在一些可能的实现方式中,所述第一确定模块401,包括:
第一确定子模块,用于根据所述待处理任务的模型需求,确定处理所述待处理任务的网络模型的描述信息;
第一创建子模块,用于响应于网络模型库中不存在与所述描述信息相匹配的网络模型,根据所述描述信息创建待训练网络。
在一些可能的实现方式中,所述装置还包括:
第二确定模块,用于确定所述已训练网络的检测指标的检测结果;
对应地,第二处理模块,用于响应于所述检测结果满足预设条件,采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
在一些可能的实现方式中,所述第二确定模块,包括:
第四确定子模块,用于从所述至少一个已标注图像集中,确定与所述训练集的类型相匹配的测评集;
第一测评子模块,用于采用所述测评集对所述已训练网络的检测指标进行测评,得到所述检测结果。
在一些可能的实现方式中,所述装置还包括:
第四确定模块,用于如果所述检测结果不满足预设条件,确定不满足预设条件的检测指标;
第一更换模块,用于根据所述不满足预设条件的检测指标,更换所述训练集;
第二训练模块,用于采用更换后的训练集对所述已训练网络进行训练,得到更新的已训练网络。
在一些可能的实现方式中,所述装置还包括:
第三确定模块,用于确定与所述描述信息相匹配的图像集类别;
第一获取模块,用于如果预设图像集库中未包含满足所述图像集类别的目标图像集,获取至少两个图像;
第一创建模块,用于根据所述至少两个图像,创建至少一个图像集。
在一些可能的实现方式中,所述第一获取模块,包括:
第一压缩子模块,用于如果所述至少两个图像占据的数据流大于预设阈值,对所述至少两个图像进行压缩;
第一获取子模块,用于按照预设批量,逐批次的获取压缩后的图像。
在一些可能的实现方式中,所述装置还包括:
第二标注模块,用于如果所述预设图像集库中包含满足所述所述图像集类别的目标图像集,根据所述待训练网络的描述信息,对所述目标图像集中的图像进行标注,得到已标注图像集。
在一些可能的实现方式中,所述第一标注模块402,包括:
第二确定子模块,用于根据所述待训练网络的描述信息,确定至少一个图像标注类型;
第一标注子模块,用于采用所述至少一个图像标注类型,对所述至少一个图像集中的图像进行标注,得到所述至少一个已标注图像集。
在一些可能的实现方式中,所述第一训练模块403,包括:
第三确定子模块,用于从所述至少一个已标注图像集中,确定与所述描述信息相匹配的训练集;
第一训练子模块,用于采用所述训练集对待训练网络进行训练,得到已训练网络。
在一些可能的实现方式中,所述装置还包括:
第五确定模块,用于如果所述网络模型库中存在与所述描述信息相匹配的模型,将所述与所述描述信息相匹配的模型作为所述待训练网络。
在一些可能的实现方式中,所述装置还包括:
第三训练模块,用于如果所述网络模型库中与所述描述信息相匹配的模型的数量大于1,采用所述训练集对多个与所述描述信息相匹配的模型进行训练,得到多个已训练网络;
第一评测模块,用于确定所述多个已训练网络中每一已训练网络的检测指标的检测结果;
第一排序模块,用于对所述多个已训练网络的检测结果排序;
第三处理模块,用于采用排列在预设位置的已训练网络对所述待处理任务进行处理,得到所述处理结果。
需要说明的是,以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的神经网络训练方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是终端、服务器等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
对应地,本申请实施例再提供一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,该计算机可执行指令用于实现本申请实施例提供的神经网络训练方法中的步骤。
相应的,本申请实施例再提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令用于实现上述实施例提供的神经网络训练方法的步骤。
相应的,本申请实施例提供一种计算机设备,图5为本申请实施例计算机设备的结构示意图,如图5所示,所述设备500包括:一个处理器501、至少一个通信总线、用户接口、至少一个外部的通信接口502和存储器503。其中,通信总线配置为实现这些组件之间的连接通信。其中,用户接口可以包括显示屏,通信接口502可以包括标准的有线接口和无线接口。其中所述处理器501,配置为执行存储器中图像处理程序,以实现上述实施例提供的神经网络训练方法的步骤。
以上计算机设备和存储介质实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请计算机设备和存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本申请实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (15)
1.一种神经网络训练方法,其特征在于,所述方法包括:
根据获取的待处理任务,确定待训练网络;
根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集;
根据所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络;
采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
2.根据权利要求1所述的方法,其特征在于,所述根据获取的待处理任务,确定待训练网络,包括:
根据所述待处理任务的模型需求,确定处理所述待处理任务的网络模型的描述信息;
响应于网络模型库中不存在与所述描述信息相匹配的网络模型,根据所述描述信息创建所述待训练网络。
3.根据权利要求1所述的方法,其特征在于,在所述采用所述已训练网络对所述待处理任务进行处理,得到处理结果之前,所述方法还包括:
确定所述已训练网络的检测指标的检测结果;
对应地,响应于所述检测结果满足预设条件,采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
4.根据权利要求3所述的方法,其特征在于,所述确定所述已训练网络的检测指标的检测结果,包括:
从所述至少一个已标注图像集中,确定与所述训练集的类型相匹配的测评集;
采用所述测评集对所述已训练网络的检测指标进行测评,得到所述检测结果。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
如果所述检测结果不满足预设条件,确定不满足预设条件的检测指标;
根据所述不满足预设条件的检测指标,更换所述训练集;
采用更换后的训练集对所述已训练网络进行训练,得到更新的已训练网络。
6.根据权利要求1至3任一项所述的方法,其特征在于,在所述根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集之前,所述方法还包括:
确定与所述描述信息相匹配的图像集类别;
如果预设图像集库中未包含满足所述图像集类别的目标图像集,获取至少两个图像;
根据所述至少两个图像,创建至少一个图像集。
7.根据权利要求6所述的方法,其特征在于,所述如果预设图像集库中未包含所述目标图像集,获取至少两个图像,包括:
如果所述至少两个图像占据的数据流大于预设阈值,对所述至少两个图像进行压缩;
按照预设批量,逐批次的加载压缩后的图像,以得到所述至少两个图像。
8.根据权利要求7所述的方法,其特征在于,在所述根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集之前,所述方法还包括:
如果所述预设图像集库中包含满足所述所述图像集类别的目标图像集,根据所述待训练网络的描述信息,对所述目标图像集中的图像进行标注,得到已标注图像集。
9.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集,包括:
根据所述待训练网络的描述信息,确定至少一个图像标注类型;
采用所述至少一个图像标注类型,对所述至少一个图像集中的图像进行标注,得到所述至少一个已标注图像集。
10.根据权利要求1至3任一项所述的方法,其特征在于,所述采用所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络,包括:
从所述至少一个已标注图像集中,确定与所述描述信息相匹配的训练集;
采用所述训练集对待训练网络进行训练,得到已训练网络。
11.根据权利要求1或2所述的方法,其特征在于,所述根据获取的待处理任务,确定待训练网络,包括:
如果网络模型库中存在与所述描述信息相匹配的模型,将所述与所述描述信息相匹配的模型作为所述待训练网络。
12.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果所述网络模型库中与所述描述信息相匹配的模型的数量大于1,采用所述训练集对多个与所述描述信息相匹配的模型进行训练,得到多个已训练网络;
确定所述多个已训练网络中每一已训练网络的检测指标的检测结果;
对所述多个已训练网络的检测结果排序;
采用排列在预设位置的已训练网络对所述待处理任务进行处理,得到所述处理结果。
13.一种神经网络训练装置,其特征在于,所述装置包括:
第一确定模块,用于根据获取的待处理任务,确定待训练网络;
第一标注模块,用于根据所述待训练网络的描述信息,确定与所述描述信息具有绑定关系的至少一个已标注图像,得到至少一个已标注图像集;
第一训练模块,用于根据所述至少一个已标注图像集对所述待训练网络进行训练,得到已训练网络;
第一处理模块,用于采用所述已训练网络对所述待处理任务进行处理,得到处理结果。
14.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令被执行后,能够实现权利要求1至12任一项所述的方法步骤。
15.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时可实现权利要求1至12任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010701981.8A CN111881966A (zh) | 2020-07-20 | 2020-07-20 | 神经网络训练方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010701981.8A CN111881966A (zh) | 2020-07-20 | 2020-07-20 | 神经网络训练方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111881966A true CN111881966A (zh) | 2020-11-03 |
Family
ID=73155131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010701981.8A Pending CN111881966A (zh) | 2020-07-20 | 2020-07-20 | 神经网络训练方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111881966A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112836801A (zh) * | 2021-02-03 | 2021-05-25 | 上海商汤智能科技有限公司 | 深度学习网络确定方法、装置、电子设备及存储介质 |
CN113377998A (zh) * | 2021-06-28 | 2021-09-10 | 北京百度网讯科技有限公司 | 数据加载的方法、装置、电子设备及存储介质 |
CN113435597A (zh) * | 2021-07-07 | 2021-09-24 | 杭州海康威视数字技术股份有限公司 | 一种模型生成、调度方法、系统及装置 |
CN113947185A (zh) * | 2021-09-30 | 2022-01-18 | 北京达佳互联信息技术有限公司 | 任务处理网络生成、任务处理方法、装置、电子设备及存储介质 |
CN114118413A (zh) * | 2021-11-30 | 2022-03-01 | 上海商汤临港智能科技有限公司 | 网络训练及设备的控制方法、装置、设备及存储介质 |
CN114694009A (zh) * | 2022-03-31 | 2022-07-01 | 上海深至信息科技有限公司 | 一种人工智能模型的训练系统 |
WO2022262141A1 (zh) * | 2021-06-16 | 2022-12-22 | 深圳市商汤科技有限公司 | 人机回圈方法、装置、系统、电子设备和存储介质 |
CN116883950A (zh) * | 2023-08-15 | 2023-10-13 | 广东省科学院广州地理研究所 | 基于遥感卫星数据的乡村人居环境动态监测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341237A (zh) * | 2017-07-04 | 2017-11-10 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
CN110414624A (zh) * | 2019-08-06 | 2019-11-05 | 广东工业大学 | 基于多任务学习的分类模型构建方法及装置 |
CN110442457A (zh) * | 2019-08-12 | 2019-11-12 | 北京大学深圳研究生院 | 基于联邦学习的模型训练方法、装置及服务器 |
WO2020134532A1 (zh) * | 2018-12-29 | 2020-07-02 | 北京市商汤科技开发有限公司 | 深度模型训练方法及装置、电子设备及存储介质 |
-
2020
- 2020-07-20 CN CN202010701981.8A patent/CN111881966A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341237A (zh) * | 2017-07-04 | 2017-11-10 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
WO2020134532A1 (zh) * | 2018-12-29 | 2020-07-02 | 北京市商汤科技开发有限公司 | 深度模型训练方法及装置、电子设备及存储介质 |
CN110414624A (zh) * | 2019-08-06 | 2019-11-05 | 广东工业大学 | 基于多任务学习的分类模型构建方法及装置 |
CN110442457A (zh) * | 2019-08-12 | 2019-11-12 | 北京大学深圳研究生院 | 基于联邦学习的模型训练方法、装置及服务器 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112836801A (zh) * | 2021-02-03 | 2021-05-25 | 上海商汤智能科技有限公司 | 深度学习网络确定方法、装置、电子设备及存储介质 |
WO2022262141A1 (zh) * | 2021-06-16 | 2022-12-22 | 深圳市商汤科技有限公司 | 人机回圈方法、装置、系统、电子设备和存储介质 |
CN113377998A (zh) * | 2021-06-28 | 2021-09-10 | 北京百度网讯科技有限公司 | 数据加载的方法、装置、电子设备及存储介质 |
CN113435597A (zh) * | 2021-07-07 | 2021-09-24 | 杭州海康威视数字技术股份有限公司 | 一种模型生成、调度方法、系统及装置 |
CN113947185A (zh) * | 2021-09-30 | 2022-01-18 | 北京达佳互联信息技术有限公司 | 任务处理网络生成、任务处理方法、装置、电子设备及存储介质 |
CN113947185B (zh) * | 2021-09-30 | 2022-11-18 | 北京达佳互联信息技术有限公司 | 任务处理网络生成、任务处理方法、装置、电子设备及存储介质 |
CN114118413A (zh) * | 2021-11-30 | 2022-03-01 | 上海商汤临港智能科技有限公司 | 网络训练及设备的控制方法、装置、设备及存储介质 |
CN114694009A (zh) * | 2022-03-31 | 2022-07-01 | 上海深至信息科技有限公司 | 一种人工智能模型的训练系统 |
CN116883950A (zh) * | 2023-08-15 | 2023-10-13 | 广东省科学院广州地理研究所 | 基于遥感卫星数据的乡村人居环境动态监测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111881966A (zh) | 神经网络训练方法、装置、设备和存储介质 | |
CN1801151B (zh) | 对象模型树图表 | |
KR20200047306A (ko) | 다른 라벨 세트를 가지는 복수의 라벨링된 데이터베이스를 이용하여 학습하는 방법 및 장치 그리고 이를 이용한 테스트 방법 및 장치 | |
CN113240125B (zh) | 模型训练方法及装置、标注方法及装置、设备及存储介质 | |
CN110163647A (zh) | 一种数据处理方法及装置 | |
CN114372532B (zh) | 标签标注质量的确定方法、装置、设备、介质及产品 | |
CN112529020A (zh) | 基于神经网络的动物识别方法、系统、设备及存储介质 | |
CN112949620B (zh) | 基于人工智能的场景分类方法、装置及电子设备 | |
CN102591920B (zh) | 对文档管理系统中的文档集合进行分类的方法以及系统 | |
CN115564469A (zh) | 广告创意选取和模型训练方法、装置、设备及存储介质 | |
KR20130038889A (ko) | 오브젝트 커스터마이제이션 및 관리 시스템 | |
CN110334720A (zh) | 业务数据的特征提取方法、装置、服务器和存储介质 | |
CN116958320A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN117973949B (zh) | 一种基于大模型的评价生成方法、装置、设备及存储介质 | |
CN116342945A (zh) | 图像分类方法和装置、电子设备及存储介质 | |
Merino Recalde | pykanto: A python library to accelerate research on wild bird song | |
CN113177644A (zh) | 一种基于词嵌入和深度时序模型的自动建模系统 | |
KR102582593B1 (ko) | 인공지능 모델을 이용한 블랙박스 영상 기반의 교통사고 정보 제공 서버 및 방법 | |
CN111797258A (zh) | 基于美感评价的图像推送方法、系统、设备及存储介质 | |
CN105512976A (zh) | 一种数据采集系统 | |
Baker | Research methods using R: Advanced data analysis in the Behavioural and biological sciences | |
CN113255563B (zh) | 一种景区人流控制系统及方法 | |
CN116402334A (zh) | 一种多模态数据合规分析与智能评估方法及装置 | |
CN113377951A (zh) | 智能客服机器人的语料构建方法及装置 | |
US20230362681A1 (en) | Method and electronic device for building digital twin based on data of base station in commercial networ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201103 |