具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
图1示出本申请实施例提供的一种基于深度学习的影像样本数据的获取方法的一种流程示意图,该方法可以由电子设备执行,例如终端设备和/或服务器。换言之,所述方法可以由安装在终端设备和/或服务器的软件或硬件来执行。如图所示,该方法可以包括以下步骤。
S110:对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片。
图2a示出本申请实施例提供的瓦片的示意图,如图所示,在本步骤中可以对输入的影像数据21中的可用区域22进行瓦片栅格化,获得多个初始瓦片,例如瓦片23和24,与将原始样本图片剪裁而成的单个样本图片,例如瓦片23,作为输入数据的方式相比,本将申请实施例完整的影像数据作为输入,由此能够在增广时应用到原始样本图片中相邻空间位置的数据信息,例如在对一个瓦片23进行增广时可以应用到其他瓦片,例如瓦片24的数据信息。
S120:从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合。
S130:对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片。
在一种实现方式中,所述增广处理包括:平移、翻转、旋转、缩放或颜色变化中的至少一者。
S140:对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据。
由此,在增广的同时实现了训练数据集合与验证数据集合的自动划分。
本申请实施例提供的一种基于深度学习的影像样本数据的获取方法,通过对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片;从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合;对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片;对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据,将完整的影像数据作为输入,由此在增广时应用到原始样本图片中相邻空间位置的数据信息,并且在增广的同时实现了训练数据集合与验证数据集合的自动划分。
图3示出本申请实施例提供的一种基于深度学习的影像样本数据的获取方法的一种流程示意图,该方法可以由电子设备执行,例如终端设备和/或服务器。换言之,所述方法可以由安装在终端设备和/或服务器的软件或硬件来执行。如图所示,该方法可以包括以下步骤。
S310:对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片。
图2a-2c示出本申请实施例提供的瓦片的示意图,如图2a所示,在本步骤中可以对输入的影像数据21中的可用区域22进行瓦片栅格化,获得多个初始瓦片23,与将原始样本图片剪裁而成的单个样本图片,例如瓦片23,作为输入数据的方式相比,本将申请实施例完整的影像数据作为输入,由此能够在增广时应用到原始样本图片中相邻空间位置的数据信息,例如在对一个瓦片23进行增广时可以应用到其他瓦片,例如瓦片24的数据信息。
在一种实现方式中,所述初始瓦片为边长为T+2*P的正方形,其中,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。在一种实现方式中,在所述增广处理不包括旋转的情况下,所述P可以为0。
如图2b所示,在所述增广处理包括旋转而所述P为0的情况下,例如,旋转45°的情况下,若P为0,则增广处理后图片四角或溢出边界或无法被旋转后的图片覆盖,导致产生了无效数据27,为避免无效数据,在所述增广处理包括旋转的情况下,所述P应满足以使得在所述增广处理包括旋转的情况下,增广处理不产生无效数据,如图2c所示。
S320:从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合。
S330:对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片。
在一种实现方式中,所述增广处理包括:平移、翻转、旋转、缩放或颜色变化中的至少一者。
S340:对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据。
由此,在增广的同时实现了训练数据集合与验证数据集合的自动划分。
本申请实施例提供的一种基于深度学习的影像样本数据的获取方法,通过对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片;从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合;对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片;对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据,将完整的影像数据作为输入,由此在增广时应用到原始样本图片中相邻空间位置的数据信息,并且在增广的同时实现了训练数据集合与验证数据集合的自动划分。
本申请实施例提供的一种基于深度学习的影像样本数据的获取方法,通过所述初始瓦片为边长为T+2*P的正方形,其中,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离,在所述增广处理包括旋转的情况下,所述P满足使得增广处理可以任意组合而不产生无效数据。
图4示出本申请实施例提供的一种基于深度学习的影像样本数据的获取方法的一种流程示意图,该方法可以由电子设备执行,例如终端设备和/或服务器。换言之,所述方法可以由安装在终端设备和/或服务器的软件或硬件来执行。如图所示,该方法可以包括以下步骤。
S410:对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片。
本步骤可以采用图1实施例步骤S110、图3实施例步骤S310类似的表述,在此不再赘述。
S420:从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合。
S430:从所述验证瓦片对应的网格内确定验证瓦片索引。
图2d示出本申请实施例提供的瓦片的示意图,如图2d所示,所述验证瓦片为边长为T-2*P的正方形,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
与步骤S310介绍的类似,在所述增广处理包括旋转的情况下,所述P满足在所述增广处理不包括旋转的情况下,所述P可以为0。
S440:在所述可用区域发生位移的情况下,基于发生位移后的所述可用区域和所述验证瓦片索引重新确定验证样本数据集合。
图2e示出本申请实施例提供的瓦片的示意图,所述增广处理可以包括平移,如图2e所示,所述可用区域向右向下分别平移了WS与HS的距离,基于发生位移后的所述可用区域和所述验证瓦片索引,确定发生位移后所述验证瓦片a与瓦片23、24、25、26均发生重叠,则将瓦片23、24、25、26确定为验证瓦片,属于验证样本数据集合。
S450:对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片。
如图2e所示,标记为OK的瓦片为所述多个初始瓦片中非验证样本数据集合中的瓦片,在随后的步骤中可以对其进行增广处理,例如,翻转、旋转、缩放或颜色变化中的至少一者,以获得增广瓦片。
S460:对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据。
由此,在增广的同时实现了训练数据集合与验证数据集合的自动划分。
举一个实例进行说明。输入的影像数据,例如10420*20420像素,设定T=500像素;计算可划分网格为(10210-105*2)/500*(20210-105*2)/500=800个;按照预定义要求选择一定数量的验证数据瓦片,按照大小为T-2*P(若后续进行旋转操作则/> 否则P=0)裁剪生成验证瓦片,构成验证样本数据集合;可用区域向右平移X像素,向下平移Y像素,重新划分网格并生成验证瓦片;对验证瓦片进行剔除,对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片,例如,基于上述步骤生成的710*710大小的瓦片进行旋转与翻转等的组合操作,每一次操作生成一张新的瓦片图片;生成的新的瓦片图片以中心裁剪为T=500像素大小,获得训练样本数据。
本申请实施例提供的一种基于深度学习的影像样本数据的获取方法,通过对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片;从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合;对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片;对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据,将完整的影像数据作为输入,由此在增广时应用到原始样本图片中相邻空间位置的数据信息,并且在增广的同时实现了训练数据集合与验证数据集合的自动划分。
本申请实施例提供的一种基于深度学习的影像样本数据的获取方法,通过从所述验证瓦片对应的网格内确定验证瓦片索引,在所述可用区域发生位移的情况下,基于发生位移后的所述可用区域和所述验证瓦片索引重新确定验证样本数据集合,能够在可用区域发生位移的情况下,自动划分训练数据集合与验证数据集合。
图5示出本申请实施例提供的一种基于深度学习的影像样本数据的获取装置的结构示意图,该装置500包括:获取模块510、确定模块520、处理模块530和训练模块540。
获取模块510用于对影响数据中的可用区域进行瓦片栅格化,获得多个初始瓦片。确定模块520用于从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合。处理模块530用于对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片。训练模块540用于对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据。
在一种实现方式中,所述初始瓦片为边长为T+2*P的正方形,其中,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,在所述增广处理包括旋转的情况下,所述P满足
在一种实现方式中,所述确定模块520还用于:在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,从所述验证瓦片对应的网格内确定验证瓦片索引,其中,所述验证瓦片为边长为T-2*P的正方形,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,所述确定模块520还用于:在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,在所述可用区域发生位移的情况下,基于发生位移后的所述可用区域和所述验证瓦片索引重新确定验证样本数据集合。
在一种实现方式中,所述处理模块530用于:翻转、旋转、缩放或颜色变化中的至少一者。
在一种实现方式中,所述训练模块540用于:基于边长T,对所述初始瓦片和所述增广瓦片进行剪裁以获得所述训练样本数据,其中,T为预设值。
本申请实施例提供的该装置500,可执行前文方法实施例中所述的各方法,并实现前文方法实施例中所述的各方法的功能和有益效果,在此不再赘述。
图6示出执行本申请实施例提供的基于深度学习的影像样本数据的获取方法的电子设备的硬件结构示意图。如图所示,该电子设备600包括但不限于:存储器610、处理器620、电源630、输入/输出装置640等部件。本领域技术人员可以理解,图中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备等。
其中,处理器620用于执行:对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片;从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合;对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片;对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据。
在一种实现方式中,所述初始瓦片为边长为T+2*P的正方形,其中,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,在所述增广处理包括旋转的情况下,所述P满足
在一种实现方式中,在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,从所述验证瓦片对应的网格内确定验证瓦片索引,其中,所述验证瓦片为边长为T-2*P的正方形,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,在所述可用区域发生位移的情况下,基于发生位移后的所述可用区域和所述验证瓦片索引重新确定验证样本数据集合。
在一种实现方式中,所述增广处理包括:平移、翻转、旋转、缩放或颜色变化中的至少一者。
在一种实现方式中,对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据,包括:基于边长T,对所述初始瓦片和所述增广瓦片进行剪裁以获得所述训练样本数据,其中,T为预设值。
本申请实施例提供的执行本发明实施例所述的电子设备,可执行前文方法实施例中所述的各方法,并实现前文方法实施例中所述的各方法的功能和有益效果,在此不再赘述。
存储器610可用于存储软件程序以及各种数据。存储器610可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器610可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器620是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器610内的软件程序和/或模块,以及调用存储在存储器610内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器620可包括一个或多个处理单元;优选的,处理器620可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器620中。
电子设备还可以包括给各个部件供电的电源711(比如电池),优选的,电源711可以通过电源管理系统与处理器620逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备包括一些未示出的功能模块,在此不再赘述。
可选地,本发明实施例还提供一种电子设备,包括处理器620,存储器610,存储在存储器610上并可在所述处理器620上运行的计算机程序,该计算机程序被处理器620执行时实现上述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提出了一种计算机可读存储介质,所述计算机可读介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的终端执行时,使得所述终端执行以下操作:对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片;从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合;对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片;对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据。
在一种实现方式中,所述初始瓦片为边长为T+2*P的正方形,其中,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,在所述增广处理包括旋转的情况下,所述P满足
在一种实现方式中,在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,从所述验证瓦片对应的网格内确定验证瓦片索引,其中,所述验证瓦片为边长为T-2*P的正方形,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,在所述可用区域发生位移的情况下,基于发生位移后的所述可用区域和所述验证瓦片索引重新确定验证样本数据集合。
在一种实现方式中,所述增广处理包括:平移、翻转、旋转、缩放或颜色变化中的至少一者。
在一种实现方式中,对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据,包括:基于边长T,对所述初始瓦片和所述增广瓦片进行剪裁以获得所述训练样本数据,其中,T为预设值。
其中,所述的计算机可读存储介质包括只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
该计算机程序被处理器执行时实现上述方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
进一步地,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,实现以下流程:对输入的影像数据中的可用区域进行瓦片栅格化,获得多个初始瓦片;从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合;对所述多个初始瓦片中非验证样本数据集合中的瓦片进行增广处理,以获得增广瓦片;对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据。
在一种实现方式中,所述初始瓦片为边长为T+2*P的正方形,其中,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,在所述增广处理包括旋转的情况下,所述P满足
在一种实现方式中,在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,从所述验证瓦片对应的网格内确定验证瓦片索引,其中,所述验证瓦片为边长为T-2*P的正方形,T为预设值,P为所述可用区域的边缘与所述影响数据的边缘之间的距离。
在一种实现方式中,在从所述多个初始瓦片中确定验证瓦片构成验证样本数据集合之后,在所述可用区域发生位移的情况下,基于发生位移后的所述可用区域和所述验证瓦片索引重新确定验证样本数据集合。
在一种实现方式中,所述增广处理包括:平移、翻转、旋转、缩放或颜色变化中的至少一者。
在一种实现方式中,对所述初始瓦片和所述增广瓦片进行处理以获得训练样本数据,包括:基于边长T,对所述初始瓦片和所述增广瓦片进行剪裁以获得所述训练样本数据,其中,T为预设值。
该计算机程序被处理器执行时实现上述方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。