CN113191430A

CN113191430A - 一种用于图片训练集构建的方法与设备

Info

Publication number: CN113191430A
Application number: CN202110475978.3A
Authority: CN
Inventors: 孔欧; 刘益东; 王君
Original assignee: Shanghai Mdata Information Technology Co ltd
Current assignee: Shanghai Mdata Information Technology Co ltd
Priority date: 2021-04-29
Filing date: 2021-04-29
Publication date: 2021-07-30

Abstract

本申请的目的是提供一种用于图片训练集构建的方法与设备。与现有技术相比，本申请通过获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片，并按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片，然后将生成的多个用以训练的图片作为图片训练集中的图片。通过这种方式进行训练集的构建，能够使训练集在训练后更适用于对特定图片的识别，例如，提高对微博图片的识别效率。

Description

一种用于图片训练集构建的方法与设备

技术领域

本申请涉及计算机技术领域，尤其涉及一种用于图片训练集构建的技术。

背景技术

对于微博图片的识别，例如，对于微博火灾图片的识别，一般不采用数据增强的方式，或者使用传统的数据增强方式，而在传统的数据增强方面一般采用：去均值，加入噪声，旋转等操作，并没有考虑到微博图片的特殊性，从而对于微博中出现的特殊形式的图片，无法分类或者分类效果极差。

发明内容

本申请的目的是提供一种用于图片训练集构建的方法与设备。

根据本申请的一个方面，提供了一种用于图片训练集构建的方法，其中，所述方法包括：

获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片；

按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片；

将生成的多个用以训练的图片作为图片训练集。

可选地，其中，所述第一原始图片为，所述第二原始图片为白色图片。

可选地，其中，所述第二原始图片为包含文字的图片，所述第一原始图片为不包含文字的图片。

可选地，其中，所述第一原始图片之间的间隙为预设像素。

可选地，其中，所述第一原始图片的宽与所述第二原始图片相同，所述第二原始图片的高为所述第一原始图片的预设倍数。

可选地，其中，所述方法还包括：

将所述图片训练集输入神经网络模型进行训练，直至所述神经网络模型的识别图片上文字的准确率达到预设阈值

根据本申请的另一方面，还提供了一种用于图片训练集构建的设备，其中，所述设备包括：

第一装置，用于获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片；

第二装置，用于按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片；

第三装置，用于将生成的多个用以训练的图片作为图片训练集中的图片。

根据本申请的再一方面，还提供了一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现如前述方法的操作。

与现有技术相比，本申请通过获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片，并按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片，然后将生成的多个用以训练的图片作为图片训练集中的图片。通过这种方式进行训练集的构建，能够使训练集在训练后更适用于对特定图片的识别，例如，提高对微博图片的识别效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出根据本申请一个方面的一种用于图片训练集构建的方法流程图；

图2示出根据本申请另一个方面的一种用于图片训练集构建的设备示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

在本申请一个典型的配置中，终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

为更进一步阐述本申请所采取的技术手段及取得的效果，下面结合附图及较佳实施例，对本申请的技术方案，进行清楚和完整的描述。

图1示出根据本申请一个方面提供的一种用于图片训练集构建的方法，该方法在设备1上执行，该方法包括以下步骤：

S11获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片；

S12按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片；

S13将生成的多个用以训练的图片作为图片训练集。

在本申请中，所述设备1包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云；在此，云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个虚拟超级计算机。上述设备1仅为举例其他现有的或者今后可能出现的能应用于本申请的设备1都应包含在本申请的保护范围内，在此，以引用的方式包含于此。

在该实施例中，在所述步骤S11中，设备1获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片。在此，所述第一原始图片和第二原始图片包括直接从网络上收集的图片，或者，从某些平台获取的图片，例如，直接从微博上获取的图片等。在此，对于所述第一原始图片和第二原始图片的获取方式在此不做任何限定。

优选地，其中，所述第二原始图片为白色图片。在该实施例中，第一原始图片可包括从网络平台上实时获取的图片或者从本地获取的图片，而第二原始图片可为裁剪的白色图片，也即第二原始图片为空白图片。优选地，其中，所述第一原始图片的宽与所述第二原始图片相同，所述第二原始图片的高为所述第一原始图片的预设倍数。例如，第一原始图片的宽为500像素，高为300像素，第二原始图片的宽为500像素，高为5*300像素点等，在此，所述第一原始图片及第二原始图片的尺寸仅为举例，不做具体限定。

优选地，其中，所述第二原始图片为包含文字的图片，所述第一原始图片为不包含文字的图片。其中，所述第一原始图片的宽与所述第二原始图片相同，所述第二原始图片的高为所述第一原始图片的预设倍数。

继续在该实施例中，在所述步骤S12中，设备1按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片。在此，可将多个第一原始图片依次覆盖第二原始图片，其中，两个相邻的第一原始图片之间可紧密相连或者有一定的间隙，优选地，其中，所述第一原始图片之间的间隙为预设像素，例如，相邻第一原始图片之间的间隙为100像素。在此，所述多个第一原始图片可为相同的第一原始图片或者不同的第一原始图片，在此，不做限定。

继续在该实施例中，在所述步骤S13中，设备1将生成的多个用以训练的图片作为图片训练集中的图片。在此，对于图片训练集可包括多张通过第一原始图片及第二原始图片生成的图片以及图片，优选地，通过第一原始图片及第二原始图片生成的图片可占据整个图片训练集的百分之二十，在此，所述百分比仅为举例，可基于实际需求进行设置。

优选地，其中，所述方法还包括：S14(未示出)将所述图片训练集输入神经网络模型进行训练，直至所述神经网络模型的识别图片上文字的准确率达到预设阈值。在该实施例中，图片训练集构建好了之后，可用于神经网络模型的训练，在此，所述神经网络模型包括但不限于任何可对图片进行识别的网络模型，在本方案中，对于具体的神经网络模型不做任何具体限定。优选地，本申请特别适用于微博火灾图片的识别。

根据本申请另一个方面，还提供了一种用于图片训练集构建的设备1，该设备包括以下装置：

在该实施例中，设备1的第一装置获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片。在此，所述第一原始图片和第二原始图片包括直接从网络上收集的图片，或者，从某些平台获取的图片，例如，直接从微博上获取的图片等。在此，对于所述第一原始图片和第二原始图片的获取方式在此不做任何限定。

继续在该实施例中，设备1的第二装置按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片。在此，可将多个第一原始图片依次覆盖第二原始图片，其中，两个相邻的第一原始图片之间可紧密相连或者有一定的间隙，优选地，其中，所述第一原始图片之间的间隙为预设像素，例如，相邻第一原始图片之间的间隙为100像素。在此，所述多个第一原始图片可为相同的第一原始图片或者不同的第一原始图片，在此，不做限定。

继续在该实施例中，设备1的第三装置将生成的多个用以训练的图片作为图片训练集中的图片。在此，对于图片训练集可包括多张通过第一原始图片及第二原始图片生成的图片以及图片，优选地，通过第一原始图片及第二原始图片生成的图片可占据整个图片训练集的百分之二十，在此，所述百分比仅为举例，可基于实际需求进行设置。

优选地，其中，所述设备还包括：第四装置(未示出)将所述图片训练集输入神经网络模型进行训练，直至所述神经网络模型的识别图片上文字的准确率达到预设阈值。在该实施例中，图片训练集构建好了之后，可用于神经网络模型的训练，在此，所述神经网络模型包括但不限于任何可对图片进行识别的网络模型，在本方案中，对于具体的神经网络模型不做任何具体限定。

此外，本申请实施例还提供了一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现前述方法。

本申请实施例还提供了一种用于图片训练集构建的设备，其中，该设备包括：

一个或多个处理器；以及

存储有计算机可读指令的存储器，所述计算机可读指令在被执行时使所述处理器执行前述方法的操作。

例如，计算机可读指令在被执行时使所述一个或多个处理器：获取第一原始图片及第二原始图片，其中，所述第二原始图片的高大于第一原始图片；按照从上到下的顺序将第一原始图片依次覆盖第二原始图片，生成用以训练的图片；将生成的多个用以训练的图片作为图片训练集。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种用于图片训练集构建的方法，其中，所述方法包括：

将生成的多个用以训练的图片作为图片训练集中的图片。

2.根据权利要求1所述的方法，其中，所述第二原始图片为白色图片。

3.根据权利要求1所述的方法，其中，所述第二原始图片为包含文字的图片，所述第一原始图片为不包含文字的图片。

4.根据权利要求3所述的方法，其中，所述第一原始图片之间的间隙为预设像素。

5.根据权利要求1至4中任一项所述的方法，其中，所述第一原始图片的宽与所述第二原始图片相同，所述第二原始图片的高为所述第一原始图片的预设倍数。

6.根据权利要求1至5中任一项所述的方法，其中，所述方法还包括：

将所述图片训练集输入神经网络模型进行训练，直至所述神经网络模型的识别图片上文字的准确率达到预设阈值。

7.一种用于图片训练集构建的设备，其中，所述设备包括：

8.一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现如权利要求1至6中任一项所述的方法。

9.一种用于图片训练集构建的设备，其中，该设备包括：

一个或多个处理器；以及

存储有计算机可读指令的存储器，所述计算机可读指令在被执行时使所述处理器执行如权利要求1至6中任一项所述方法的操作。