CN111738197B

CN111738197B - 一种训练图像信息处理的方法和装置

Info

Publication number: CN111738197B
Application number: CN202010613904.7A
Authority: CN
Inventors: 姜琳; 赵鑫; 鲁笛
Original assignee: China United Network Communications Group Co Ltd
Current assignee: China United Network Communications Group Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2023-09-05
Anticipated expiration: 2040-06-30
Also published as: CN111738197A

Abstract

本发明公开了一种训练图像信息处理的方法和装置。该方法获取初始训练图像信息；所述初始训练图像信息包含源训练图像和所述源训练图像的图像名称；基于初始训练模型和所述初始训练图像信息获得一级标定图像信息；所述初始训练模型是用于识别所述源训练图像并对所述源训练图像的图像名称进行标记的模型；基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息；所述图像类别识别库是包含有多个不同类型图像库的图像识别库。该方法能够获得数量多、种类丰富的第一成熟训练图像信息，促进自动驾驶的发展。

Description

一种训练图像信息处理的方法和装置

技术领域

本发明涉及通信技术领域，具体涉及一种训练图像信息处理的方法和装置。

背景技术

当前机器学习算法已经被广泛应用于自动驾驶领域。自动驾驶系统利用机器学习算法训练模型的过程中，最重要的就是其训练数据的数量要充足、种类要多样。如果训练数据的数量和种类不充足，自动驾驶系统训练出来的模型就可能存在缺陷。如果一辆自动驾驶汽车中的模型存在缺陷，不能准确识别目标、感应车辆周围环境，就有可能引发车祸，导致人员伤亡。因此，在训练自动驾驶领域的识别模型时，需要提供数量充足且种类多样的训练图像信息。

但是，目前训练图像信息需要由人工进行处理后获得，可供自动驾驶系统进行模型训练的训练图像数量少、种类有限。

发明内容

为此，本发明提供一种训练图像信息处理的方法和装置，以解决现有技术中由于自动驾驶的训练图像信息需要人工处理后获得而导致的可供自动驾驶进行训练的训练图像信息数量少、种类有限问题。

为了实现上述目的，本发明第一方面提供一种训练图像信息处理的方法，该方法包括：

获取初始训练图像信息；所述初始训练图像信息包含源训练图像和所述源训练图像的图像名称；

基于初始训练模型和所述初始训练图像信息获得一级标定图像信息；所述初始训练模型是用于识别所述源训练图像并对所述源训练图像的图像名称进行标记的模型；

基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息；所述图像类别识别库是包含有多个不同类型图像库的图像识别库。

优选地，上述基于初始训练模型和所述初始训练图像信息获得一级标定图像信息的步骤，包括：

利用所述初始训练模型识别所述源训练图像，并对所述源训练图像的图像名称进行标记，生成第一标定图像名称；所述第一标定图像名称包含模型识别标签；

基于所述第一标定图像名称和所述源训练图像生成一级标定图像信息；其中，所述一级标定图像信息包含所述第一标定图像名称。

优选地，上述基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息的步骤，包括：

利用所述图像类别识别库识别所述源训练图像，生成所述源训练图像的库识别标签；

从所述第一标定图像名称中提取所述源训练图像的模型识别标签；

当所述库识别标签包含所述模型识别标签时，利用所述库识别标签替换所述第一标定图像名称中的模型识别标签，生成第二标定图像名称；

基于所述第二标定图像名称和所述源训练图像获得第一成熟训练图像信息。

优选地，上述从所述第一标定图像名称中提取所述源训练图像的模型识别标签之后，还包括：

当所述库识别标签不包含所述模型识别标签时，生成待识别特征标签；

将所述待识别特征标签写入所述第一标定图像名称，生成第三标定图像名称；

基于所述第三标定图像名称和所述源训练图像获得待识别图像信息；

基于所述待识别图像信息获得第二成熟训练图像信息。

优选地是，上述基于所述待识别图像信息获得第二成熟训练图像信息之后，还包括：

基于所述第二成熟训练图像信息训练所述初始训练模型。

优选地，上述基于初始训练模型和所述初始训练图像信息获得一级标定图像信息的步骤之前，还包括：

基于预存训练图像信息获得初始训练模型；所述预存训练图像信息是通过人工添加识别标签的图像信息。

优选地，上述基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息之后，还包括：

基于所述第一成熟训练图像信息训练所述初始训练模型。

本发明第二方面提供一种训练图像信息处理的装置，该装置包括：

第一获取模块，用于获取初始训练图像信息；所述初始训练图像信息包含源训练图像和所述源训练图像的图像名称；

第一信息处理模块，用于基于初始训练模型和所述初始训练图像信息获得一级标定图像信息；所述初始训练模型是用于识别所述源训练图像并对所述源训练图像的图像名称进行标记的模型；

第二信息处理模块，用于基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息；所述图像类别识别库是包含有多个不同类型图像库的图像识别库。

优选地，上述第一信息处理模块，包括：

第一识别子模块，用于利用所述初始训练模型识别所述源训练图像，并对所述源训练图像的图像名称进行标记，生成第一标定图像名称；所述第一标定图像名称包含模型识别标签；

第一生成子模块，基于所述第一标定图像名称和所述源训练图像生成一级标定图像信息；其中，所述一级标定图像信息包含所述第一标定图像名称。

优选地，上述第二信息处理模块，包括：

第二识别子模块，用于利用所述图像类别识别库识别所述源训练图像，生成所述源训练图像的库识别标签；

第二提取子模块，从所述第一标定图像名称中提取所述源训练图像的模型识别标签；

第二生成子模块，当所述库识别标签包含所述模型识别标签时，利用所述库识别标签替换所述第一标定图像名称中的模型识别标签，生成第二标定图像名称；

第二获得子模块，基于所述第二标定图像名称和所述源训练图像获得第一成熟训练图像信息。

本发明具有如下优点：

本发明提供一种训练图像信息处理的方法，该方法首先获取初始训练图像信息，其中，初始训练图像信息包含源训练图像和源训练图像的图像名称。其次，基于初始训练模型和初始训练图像信息获得一级标定图像信息，减少了人工参与训练图像信息处理，实现大量处理初始训练图像信息。其中，初始训练模型是用于识别源训练图像并对源训练图像的图像名称进行标记的模型。然后，基于图像类别识别库和一级标定图像信息获得第一成熟训练图像信息。需要说明的是，由于该图像类别识别库是包含有多个不同类型图像库的图像识别库，因此，基于图像类别识别库和一级标定图像信息获得的第一成熟训练图像信息数量多、种类丰富，能够促进自动驾驶的发展。

附图说明

附图是用来提供对本发明的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明，但并不构成对本发明的限制。

图1为本发明实施例提供的一种训练图像信息处理的方法的流程图；

图2为本发明实施例提供的一种获得第一成熟训练图像信息的方法的流程图；

图3为本发明实施例提供的一种训练图像信息处理的装置的结构示意图；

图4为本发明实施例提供的一种第一信息处理模块32的结构示意图。

在附图中：

31：第一获取模块 32：第一信息处理模块

33：第二信息处理模块 41：第二识别子模块

42：第二提取子模块 43：第二生成子模块

44：第二获得子模块

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

当前机器学习算法已经被广泛应用于自动驾驶领域。自动驾驶系统利用机器学习算法训练模型的过程中，最重要的就是其训练数据的数量要充足、种类要多样。如果训练数据的数量和种类不充足，自动驾驶系统训练出来的模型就可能存在缺陷。如果一辆自动驾驶汽车中的模型存在缺陷，不能准确识别目标、感应车辆周围环境，就有可能引发车祸，导致人员伤亡。因此，在训练自动驾驶领域的识别模型时，需要提供数量充足且种类多样的训练图像。

但是，目前训练图像需要由人工进行处理后获得，可供自动驾驶系统进行模型训练的训练图像数量少、种类有限。

为了解决上述难题，本实施例提供一种训练图像信息处理的方法，如图1所示，该方法包括以下步骤：

步骤S101，获取初始训练图像信息。

其中，初始训练图像信息包含源训练图像和源训练图像的图像名称。

步骤S102，基于初始训练模型和初始训练图像信息获得一级标定图像信息。

其中，初始训练模型是用于识别源训练图像并对源训练图像的图像名称进行标记的模型。在一个实施方式中，自动驾驶系统基于预存训练图像信息获得初始训练模型，其中，预存训练图像信息是通过人工添加识别标签的图像信息。需要说明的是，虽然初始训练模型基于预存训练图像信息训练获得，但是训练所需预存训练图像信息数量少，不需要大量人工参与。自动驾驶系统在获得初始训练模型后，存储该初始训练模型。

在另一个实施方式中，自动驾驶系统基于初始训练模型和初始训练图像信息获得一级标定图像信息的步骤，包括：首先，自动驾驶系统利用初始训练模型识别源训练图像，并对源训练图像的图像名称进行标记，生成第一标定图像名称，其中，第一标定图像名称包含模型识别标签。该模型识别标签是初始训练模型对源训练图像的图像名称进行标记时，写入图像名称的识别标签。其次，自动驾驶系统基于第一标定图像名称和源训练图像生成一级标定图像信息；其中，一级标定图像信息包含第一标定图像名称。

本实施方式中，自动驾驶系统基于初始训练模型和初始训练图像信息获得一级标定图像信息，能够减少人工参与训练图像信息处理，实现大量处理初始训练图像信息。但是，由于本实施方式中初始训练模型仅通过少量的预存训练图像信息训练获得，因此，自动驾驶系统基于该初始训练模型和初始训练图像信息获得的一级标定图像信息中，第一标定图像名称包含的模型识别标签可能存在误差。为了校准误差，自动驾驶系统需要利用图像类别识别库继续对源训练图像进行识别，并基于一级标定图像信息获得质量高、种类多样的第一成熟训练图像。

步骤S103，基于图像类别识别库和一级标定图像信息获得第一成熟训练图像信息。

其中，图像类别识别库是包含有多个不同类型图像库的图像识别库。例如，该图像类别识别库包含人类图像库、自行车图像库、交通标识图像库、摩托车图像库、动物图像库、桥梁图像库和树木图像库等。由于该图像类别识别库中包含有多个不同类型图像库，因此，自动驾驶系统基于图像类别识别库和一级标定图像信息获得的第一成熟训练图像信息数量多、种类丰富，能够为自动驾驶提供足够的训练数据，促进自动驾驶的发展。

在一些实施例中，如图2所示，自动驾驶系统基于图像类别识别库和一级标定图像信息获得第一成熟训练图像信息的方法包括以下步骤：

步骤S201，利用图像类别识别库识别源训练图像，生成源训练图像的库识别标签。

在一个实施方式中，自动驾驶系统利用图像类别识别库识别源训练图像，当识别到源训练图像中包含人类时，生成人类识别标签。在另一个实施方式中，自动驾驶系统利用图像类别识别库识别到源训练图像中包含人类后，还识别到源训练图像中包含动物和树木，则自动驾驶系统生成人类识别标签之后，还生成动物识别标签和树木识别标签。

需要说明的是，由于图像类别识别库中包含有多个不同类型图像库，因此，自动驾驶系统利用图像类别识别库识别源训练图像，识别错误的概率小，且生成的源训练图像的库识别标签种类多。

步骤S202，从第一标定图像名称中提取源训练图像的模型识别标签。

其中，模型识别标签包括人类识别标签、自行车识别标签、交通标识识别标签、摩托车识别标签、动物识别标签、桥梁识别标签和/或树木识别标签等。

步骤S203，当库识别标签包含模型识别标签时，利用库识别标签替换第一标定图像名称中的模型识别标签，生成第二标定图像名称。

在一个实施方式中，库识别标签包含人类识别标签、动物识别标签和树木识别标签；模型识别标签包含人类识别标签和树木识别标签时，则库识别标签包含模型识别标签。此时，自动驾驶系统利用库识别标签替换第一标定图像名称中的模型识别标签，生成第二标定图像名称。该第二标定图像名称中包含库识别标签。

步骤S204，基于第二标定图像名称和源训练图像获得第一成熟训练图像信息。

其中，第一成熟训练图像信息包含源训练图像和第二标定图像名称。

从上述实施方式可知，由于自动驾驶系统利用图像类别识别库识别源训练图像并生成的源训练图像的库识别标签种类多，因此，当库识别标签包含模型识别标签时，自动驾驶系统利用库识别标签替换第一标定图像名称中的模型识别标签，生成第二标定图像名称，并基于第二标定图像名称和源训练图像获得第一成熟训练图像信息，能够使获得的第一成熟训练图像信息的种类多样。

需要说明的是，自动驾驶系统从初始训练图像信息获得第一成熟训练图像信息的过程，需要人工参与的部分少，自动驾驶系统能够大量处理初始训练图像信息，获得数量多、种类丰富的第一成熟训练图像信息，促进自动驾驶的发展。

在另一个实施方式中，当库识别标签不包含模型识别标签时，自动驾驶系统首先生成待识别特征标签，并将待识别特征标签写入第一标定图像名称，生成第三标定图像名称。需要说明的是，当库识别标签不包含模型识别标签时，说明自动驾驶系统利用图像类别识别库识别源训练图像识别到的特征，与利用初始训练模型识别源训练图像识别到的特征存在冲突，因此，自动驾驶系统生成待识别特征标签以并将该待识别特征标签写入第一标定图像名称，生成第三标定图像名称，以表示该第三标定图像名称对应的源训练图像需要人工识别。

然后，自动驾驶系统基于第三标定图像名称和源训练图像获得待识别图像信息。

最后，自动驾驶系统基于待识别图像信息获得第二成熟训练图像信息。其中，第二成熟训练图像信息中包含源训练图像和人工识别标签。在一些实施例中，自动驾驶系统接收人工识别标签，并利用人工识别标签替换第三标定图像名称中的待识别特征标签，获得第二成熟训练图像信息。该人工识别标签是相关技术人员人工识别待识别图像信息后，在自动驾驶系统中输入的识别标签。需要说明的是，自动驾驶系统还可以利用该人工识别标签获得新图像类别识别库，以提高图像类别识别库的识别能力。该新图像类别识别库相比于原来的图像类别识别库增加了人工识别标签对应的新类型图像库。

在一些实施例中，为了提高初始训练模型的识别能力，自动驾驶系统在获得第一成熟训练图像信息和/或第二成熟训练图像信息之后，基于该第一成熟训练图像信息和/或第二成熟训练图像信息训练初始训练模型。

在另一些实施例中，自动驾驶系统在基于该第一成熟训练图像信息和/或第二成熟训练图像信息训练初始训练模型之后，重复步骤101-步骤103，由于初始训练模型和图像类别识别库的识别能力不断提升，库识别标签不包含模型识别标签的情况会不断减少，即需要人工参与的部分不断减少，直至实现训练图像信息处理完全自动化。

本实施例提供一种训练图像信息处理的方法，该方法首先获取初始训练图像信息，其中，初始训练图像信息包含源训练图像和源训练图像的图像名称。其次，基于初始训练模型和初始训练图像信息获得一级标定图像信息，减少了人工参与训练图像信息处理，实现大量处理初始训练图像信息。其中，初始训练模型是用于识别源训练图像并对源训练图像的图像名称进行标记的模型。然后，基于图像类别识别库和一级标定图像信息获得第一成熟训练图像信息。需要说明的是，由于该图像类别识别库是包含有多个不同类型图像库的图像识别库，因此，基于图像类别识别库和一级标定图像信息获得的第一成熟训练图像信息数量多、种类丰富，能够促进自动驾驶的发展。

本实施例还提供一种训练图像信息处理的装置，如图3所示，该装置包括：第一获取模块31、第一信息处理模块32和第二信息处理模块33。

其中，第一获取模块31用于获取初始训练图像信息。该初始训练图像信息包含源训练图像和源训练图像的图像名称。

在一个实施方式中，第一获取模块31从车载终端系统中获取该初始训练图像信息。该车载终端系统包括行车记录仪。

第一信息处理模块32，用于基于初始训练模型和初始训练图像信息获得一级标定图像信息。

其中，初始训练模型是用于识别源训练图像并对源训练图像的图像名称进行标记的模型。在一个实施方式中，训练图像信息处理的装置还包括训练模块和存储模块。该训练模块基于预存训练图像信息获得初始训练模型，其中，预存训练图像信息是通过人工添加识别标签的图像信息。需要说明的是，虽然初始训练模型是训练模块基于预存训练图像信息训练获得，但是训练模块训练时所需预存训练图像信息数量少，不需要大量人工参与。自动驾驶系统在通过训练模块获得初始训练模型后，利用存储模块存储该初始训练模型。

在另一个实施方式中，第一信息处理模块32包括第一识别子模块和第一生成子模块。第一信息处理模块32基于初始训练模型和初始训练图像信息获得一级标定图像信息包括：首先，第一识别子模块利用初始训练模型识别源训练图像，并对源训练图像的图像名称进行标记，生成第一标定图像名称，其中，第一标定图像名称包含模型识别标签。该模型识别标签是初始训练模型对源训练图像的图像名称进行标记时，写入图像名称的识别标签。其次，第一生成子模块基于第一标定图像名称和源训练图像生成一级标定图像信息；其中，一级标定图像信息包含第一标定图像名称。

本实施方式中，第一信息处理模块32基于初始训练模型和初始训练图像信息获得一级标定图像信息，能够减少人工参与训练图像信息处理，实现大量处理初始训练图像信息。

第二信息处理模块33，用于基于图像类别识别库和一级标定图像信息获得第一成熟训练图像信息。

其中，图像类别识别库是包含有多个不同类型图像库的图像识别库。例如，该图像类别识别库包含人类图像库、自行车图像库、交通标识图像库、摩托车图像库、动物图像库、桥梁图像库和树木图像库等。由于该图像类别识别库中包含有多个不同类型图像库，因此，第二信息处理模块33基于图像类别识别库和一级标定图像信息获得的第一成熟训练图像信息数量多、种类丰富，能够为自动驾驶提供足够的训练数据，促进自动驾驶的发展。

在一些实施例中，如图4所示，第二信息处理模块33包括第二识别子模块41、第二提取子模块42、第二生成子模块43和第二获得子模块44。

其中，第二识别子模块41用于利用图像类别识别库识别源训练图像，生成源训练图像的库识别标签。

在一个实施方式中，第二识别子模块41利用图像类别识别库识别源训练图像，当识别到源训练图像中包含人类时，生成人类识别标签。在另一个实施方式中，第二识别子模块41利用图像类别识别库识别到源训练图像中包含人类后，还识别到源训练图像中包含动物和树木，则第二识别子模块41生成人类识别标签之后，还生成动物识别标签和树木识别标签。

需要说明的是，由于图像类别识别库中包含有多个不同类型图像库，因此，第二识别子模块41利用图像类别识别库识别源训练图像，识别错误的概率小，且生成的源训练图像的库识别标签种类多。

第二提取子模块42用于从第一标定图像名称中提取源训练图像的模型识别标签。

第二生成子模块43用于当库识别标签包含模型识别标签时，利用库识别标签替换第一标定图像名称中的模型识别标签，生成第二标定图像名称。

在一个实施方式中，库识别标签包含人类识别标签、动物识别标签和树木识别标签；模型识别标签包含人类识别标签和树木识别标签时，则库识别标签包含模型识别标签。此时，第二生成子模块43利用库识别标签替换第一标定图像名称中的模型识别标签，生成第二标定图像名称。该第二标定图像名称中包含库识别标签。

第二获得子模块44用于基于第二标定图像名称和源训练图像获得第一成熟训练图像信息。

在另一个实施方式中，训练图像信息处理的装置还包括第一生成模块、第二生成模块、第三信息处理模块和第四信息处理模块。当库识别标签不包含模型识别标签时，第一生成模块首先生成待识别特征标签，第二生成模块将待识别特征标签写入第一标定图像名称，生成第三标定图像名称。然后，第三信息处理模块基于第三标定图像名称和源训练图像获得待识别图像信息。最后，第四信息处理模块基于待识别图像信息获得第二成熟训练图像信息。其中，第二成熟训练图像信息中包含源训练图像和人工识别标签。

在一些实施例中，为了提高初始训练模型的识别能力，训练模块还基于第一成熟训练图像信息和/或第二成熟训练图像信息训练初始训练模型。

本实施例提供的训练图像信息处理的装置中各模块的工作方式与训练图像信息处理的方法中各步骤对应，因此，训练图像信息处理的装置中各模块的详细工作方式可参见本实施例提供的训练图像信息处理的方法。

本实施例提供一种训练图像信息处理的装置，该装置首先由第一获取模块31获取初始训练图像信息，其中，初始训练图像信息包含源训练图像和源训练图像的图像名称。其次，第一信息处理模块32基于初始训练模型和初始训练图像信息获得一级标定图像信息，减少了人工参与训练图像信息处理，实现大量处理初始训练图像信息。其中，初始训练模型是用于识别源训练图像并对源训练图像的图像名称进行标记的模型。然后，第二信息处理模块33基于图像类别识别库和一级标定图像信息获得第一成熟训练图像信息。需要说明的是，由于该图像类别识别库是包含有多个不同类型图像库的图像识别库，因此，第二信息处理模块33基于图像类别识别库和一级标定图像信息获得的第一成熟训练图像信息数量多、种类丰富，能够促进自动驾驶的发展。

可以理解的是，以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式，然而本发明并不局限于此。对于本领域内的普通技术人员而言，在不脱离本发明的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本发明的保护范围。

Claims

1.一种训练图像信息处理的方法，其特征在于，所述方法包括：

基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息；所述图像类别识别库是包含有多个不同类型图像库的图像识别库；

所述基于初始训练模型和所述初始训练图像信息获得一级标定图像信息的步骤，包括：

基于所述第一标定图像名称和所述源训练图像生成一级标定图像信息；其中，所述一级标定图像信息包含所述第一标定图像名称；

所述基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息的步骤，包括：

2.根据权利要求1所述方法，其特征在于，所述从所述第一标定图像名称中提取所述源训练图像的模型识别标签之后，还包括：

基于所述待识别图像信息获得第二成熟训练图像信息。

3.根据权利要求2所述方法，其特征在于，所述基于所述待识别图像信息获得第二成熟训练图像信息之后，还包括：

基于所述第二成熟训练图像信息训练所述初始训练模型。

4.根据权利要求1所述方法，其特征在于，所述基于初始训练模型和所述初始训练图像信息获得一级标定图像信息的步骤之前，还包括：

5.根据权利要求1所述方法，其特征在于，所述基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息之后，还包括：

基于所述第一成熟训练图像信息训练所述初始训练模型。

6.一种训练图像信息处理的装置，其特征在于，所述装置包括：

第二信息处理模块，用于基于图像类别识别库和所述一级标定图像信息获得第一成熟训练图像信息；所述图像类别识别库是包含有多个不同类型图像库的图像识别库；

所述第一信息处理模块，包括：

第一生成子模块，基于所述第一标定图像名称和所述源训练图像生成一级标定图像信息；其中，所述一级标定图像信息包含所述第一标定图像名称；

所述第二信息处理模块，包括：