CN111985565A - 图片分析方法和装置、存储介质及电子设备 - Google Patents
图片分析方法和装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN111985565A CN111985565A CN202010844920.7A CN202010844920A CN111985565A CN 111985565 A CN111985565 A CN 111985565A CN 202010844920 A CN202010844920 A CN 202010844920A CN 111985565 A CN111985565 A CN 111985565A
- Authority
- CN
- China
- Prior art keywords
- target
- picture
- target picture
- pictures
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 23
- 238000003062 neural network model Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 28
- 230000015654 memory Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010191 image analysis Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 6
- 208000025174 PANDAS Diseases 0.000 description 17
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 17
- 240000004718 Panda Species 0.000 description 17
- 235000016496 Panda oleosa Nutrition 0.000 description 17
- 238000010586 diagram Methods 0.000 description 9
- 230000003993 interaction Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000002860 competitive effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 241000482268 Zea mays subsp. mays Species 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003703 image analysis method Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/09—Recognition of logos
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图片分析方法和装置、存储介质及电子设备。其中,该方法包括:获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素;将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;从第三目标图片中确定第一目标图片中目标元素的相关信息,进而解决了现有技术中,无法快速的从图片中确定目标元素的相关信息的技术问题。
Description
技术领域
本发明涉及图片处理领域,具体而言,涉及一种图片分析方法和装置、存储介质及电子设备。
背景技术
随着电商行业在互联网营销领域的发展,越来越多的创作素材,包括图像、视频、文字等在例如微信、淘宝等平台中出现。对于设计人员而言,需要思考的一个问题是:如何在海量的素材中,分析竞品对手或者自身历史的素材。其中,在海报图像的设计中,对于布局(Layout)的探索发现也十分的重要。
这种类似的布局发现,(1)可以使的运营设计人员对竞品爆品的布局进行分析,例如一个优秀海报的产品布局在整体的占比。同时,(2)布局发现可以为端到端图像生成提供基础的素材。
在现有技术中,对于第(1)点,通常采取人工分析的方式,即设计人员对优秀的海报图像进行分析或者信息提取,为今后的创作提供积累。对于第(2)点,通常使用大量的人工进行图像中位置或者像素的标记,例如这个像素属于产品还是人物等这样的标注手段。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图片分析方法和装置、存储介质及电子设备,以至少解决现有技术中,无法快速的从图片中确定目标元素的相关信息的技术问题。
根据本发明实施例的一个方面,提供了一种图片分析方法,包括:获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,所述目标图片中包括所述目标元素;将所述第一目标图片和所述第二目标图片输入是目标神经网络模型中,输出与所述第一目标图片对应的第三目标图片,其中,所述第三目标图片中携带所述目标元素的标识信息,所述目标神经网络模型是通过样本图片集合训练得到,所述样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注所述样本元素的第二样本图片,M、N为正整数;从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息。
可选的,所述相关信息包括所述目标元素在所述第一目标图片中的尺寸大小和/或位置信息。
可选的,在所述第一目标图片包括多张的情况下,从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息之后,所述方法还包括:获取所述目标元素的相关信息满足第一预设条件的第四目标图片的数量;在所述第四目标图片的数量大于预定阈值的情况下,确定所述目标元素的相关信息为第五目标图片中的布局信息。
可选的,获取待分析的第一目标图片以及标注目标元素的第二目标图片之前,所述方法还包括:从多个目标平台上获取图片集合;对所述图片集合中的图片进行分类,将满足第二预设条件的图片确定为目标图片集合,所述目标图片集合中包括所述第一目标图片。
可选的,所述获取待分析的第一目标图片以及标注目标元素的第二目标图片,包括:在所述第一目标图片为多张的情况下,选择一张或多张第一目标图片进行所述目标元素标注,得到所述第二目标图片。
根据本发明实施例的另一方面,还提供了一种图片分析装置,包括:第一获取单元,用于获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,所述目标图片中包括所述目标元素;输出单元,用于将所述第一目标图片和所述第二目标图片输入是目标神经网络模型中,输出与所述第一目标图片对应的第三目标图片,其中,所述第三目标图片中携带所述目标元素的标识信息,所述目标神经网络模型是通过样本图片集合训练得到,所述样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注所述样本元素的第二样本图片,M、N为正整数;第一确定单元,用于从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息。
可选的,所述相关信息包括所述目标元素在所述第一目标图片中的尺寸大小和/或位置信息。
可选的,在所述第一目标图片包括多张的情况下,所述装置还包括:第二获取单元,用于从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息之后,获取所述目标元素的相关信息满足第一预设条件的第四目标图片的数量;第二确定单元,用于在所述第四目标图片的数量大于预定阈值的情况下,确定所述目标元素的相关信息为第五目标图片中的布局信息。
可选的,所述装置还包括:第三获取单元,用于获取待分析的第一目标图片以及标注目标元素的第二目标图片之前,从多个目标平台上获取图片集合;第三确定单元,用于对所述图片集合中的图片进行分类,将满足第二预设条件的图片确定为目标图片集合,所述目标图片集合中包括所述第一目标图片。
可选的,所述第一获取单元,包括:得到模块,用于在所述第一目标图片为多张的情况下,选择一张或多张第一目标图片进行所述目标元素标注,得到所述第二目标图片。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述图片分析方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的图片分析方法。
在本发明实施例中,通过获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素;将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;从第三目标图片中确定第一目标图片中目标元素的相关信息,达到了将待分析的图片与标注有目标元素的图片输出目标神经网络模型中,便可以确定待分析图片中目标元素的相关信息(目标元素的尺寸大小和/或位置信息)的目的,从而实现了用户可以快速根据目标元素在众多图片中的相关信息确定目标元素在新的图片中的布局的技术效果,进而解决了现有技术中,无法快速的从图片中确定目标元素的相关信息的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的图片分析方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的图片分析方法的流程图;
图3是根据本发明实施例的一种可选的基于小样本学习海报布局分析方法流程图;
图4是根据本发明实施例的一种可选的图片中标注目标元素的示意图;
图5是根据本发明实施例的一种可选的原始图像;
图6是根据本发明实施例的一种可选的标注图像;
图7是根据本发明实施例的一种可选的模型训练过程示意图;
图8是根据本发明实施例的一种可选的模型输出的图片示意图;
图9是根据本发明实施例的一种可选的图片分析装置的结构示意图;
图10是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种图片分析方法,可选地,作为一种可选的实施方式,上述图片分析方法可以但不限于应用于如图1所示的环境中。其中,可以包括但不限于终端设备102、网络110及服务器112。其中,该终端设备102中运行有客户端,用于显示目标图片。
其中,上述终端设备102中可以包括但不限于:人机交互屏幕104,处理器106及存储器108。人机交互屏幕104用于通过人机交互接口获取人机交互指令,还用于显示第一目标图片、第二目标图片;处理器106用于响应上述人机交互指令,确定目标图片中目标元素的相关信息。存储器108用于存储第一目标图片和第二目标图片,以及第一目标图像中的目标元素的相关信息。这里服务器可以包括但不限于:数据库114及处理引擎116,处理引擎116用于调用数据库114中存储的第二目标图片,将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;从第三目标图片中确定第一目标图片中目标元素的相关信息,达到了将待分析的图片与标注有目标元素的图片输出目标神经网络模型中,便可以确定待分析图片中目标元素的相关信息(目标元素的尺寸大小和/或位置信息)的目的,从而实现了用户可以快速根据目标元素在众多图片中的相关信息确定目标元素在新的图片中的布局的技术效果,进而解决了现有技术中,无法快速的从图片中确定目标元素的相关信息的技术问题。
具体过程如以下步骤:在终端设备102中的人机交互屏幕104显示第一目标图片。如步骤S102-S108,获取该第一目标图片,并将该第一目标图片通过网络110发送服务器112。在服务器112将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;从第三目标图片中确定第一目标图片中目标元素的相关信息。然后将上述确定出的结果返回终端设备102。
然后,如步骤S102-S108,终端设备102将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;从第三目标图片中确定第一目标图片中目标元素的相关信息,达到了将待分析的图片与标注有目标元素的图片输出目标神经网络模型中,便可以确定待分析图片中目标元素的相关信息(目标元素的尺寸大小和/或位置信息)的目的,从而实现了用户可以快速根据目标元素在众多图片中的相关信息确定目标元素在新的图片中的布局的技术效果,进而解决了现有技术中,无法快速的从图片中确定目标元素的相关信息的技术问题。
可选地,在本实施例中,上述终端设备102可以是配置有目标客户端的终端设备,可以包括但不限于以下至少之一:手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices,移动互联网设备)、PAD、台式电脑、智能电视等。目标客户端可以是视频客户端。上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
可选地,作为一种可选的实施方式,如图2所示,上述图片分析方法包括:
步骤S202,获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素。
步骤S204,将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数。
步骤S206,从第三目标图片中确定第一目标图片中目标元素的相关信息。
可选的,上述图片分析方法可以包括但不限于应用于对海报图像进行分析,进而确定目标元素在海报图像中所在的位置信息和/或在海报图像中的尺寸大小。进而方便运营人员分析竞争对手在目标产品海报图像中目标元素的布局信息。
需要说明的是,上述第一目标图片可以是对竞品或者自身历史图像素材资源进行收集得到的第一目标图片,第二目标图片可以包括但不限于从第一目标图片中抽样选择的P张图片,并对该P张图片中的目标元素进行标注得到P张第二目标图片。例如,从第一目标图片中随机选择5张图片,并对5张图片中的熊猫元素进行标注得到第二目标图片,其中熊猫为目标元素,标注的信息可以包括该熊猫在第一目标图片中所处的位置信息和/或熊猫的轮廓信息(尺寸大小信息)。从而分析出,图片中出现熊猫元素,以及该熊猫元素在图片中的相关信息,运营人员可以根据相关信息确定海报中熊猫元素的布局。
可选的,相关信息包括目标元素在第一目标图片中的尺寸大小和/或位置信息。
可选的,在第一目标图片包括多张的情况下,从第三目标图片中确定第一目标图片中目标元素的相关信息之后,还可以包括:获取目标元素的相关信息满足第一预设条件的第四目标图片的数量;在第四目标图片的数量大于预定阈值的情况下,确定目标元素的相关信息为第五目标图片中的布局信息。
在本实施例中,可以知晓在多张图片中熊猫元素的相关信息满足第一预设条件的出现的多,表示相关信息对应的熊猫元素是人们在进行图片布局中常用的信息。例如,在10张图片中出现熊猫元素,且熊猫的出现的位置都是位于图片的右下角,则运营人员可以根据该位置信息,确定设计的图片中出现熊猫的位置,可以根据观看者的习惯将熊猫布局在图片的右下角位置,也可以为了突出显示熊猫将该熊猫布局在除右下角之外的位置。
可选的,获取待分析的第一目标图片以及标注目标元素的第二目标图片之前,方法还包括:从多个目标平台上获取图片集合;对图片集合中的图片进行分类,将满足第二预设条件的图片确定为目标图片集合,目标图片集合中包括第一目标图片。
可选的,获取待分析的第一目标图片以及标注目标元素的第二目标图片,包括:在第一目标图片为多张的情况下,选择一张或多张第一目标图片进行目标元素标注,得到第二目标图片。
通过本申请提供的实施例,获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素;将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;从第三目标图片中确定第一目标图片中目标元素的相关信息,达到了将待分析的图片与标注有目标元素的图片输出目标神经网络模型中,便可以确定待分析图片中目标元素的相关信息(目标元素的尺寸大小和/或位置信息)的目的,从而实现了用户可以快速根据目标元素在众多图片中的相关信息确定目标元素在新的图片中的布局的技术效果,进而解决了现有技术中,无法快速的从图片中确定目标元素的相关信息的技术问题。
作为一种可选的实施例,本申请还提供了一种基于小样本学习海报布局分析方法。如图3所示,基于小样本学习海报布局分析方法流程图。
步骤一,图片信息收集;对竞品或者自身历史图像素材资源进行收集。
需要说明的是,本实施例中的方案可以包括但不限于对微信生态平台的图片分析技术。可以使用爬虫等技术,对竞品或者其他需要收集品牌的公众号,小程序进行图片收集。举例可以存储10,000张图片,存储于服务器中。
步骤二,感兴趣类别标记;对需要标注的类别进行标记。
针对有监督学习而言,需要预先收集图片中的物体类别信息。以美妆行业为例,类别可以为:化妆品、人物等。这些预先定义的类别,可以由运营设计人员进行人为的预先定义,也可以通过步骤一获得的数据进行大体观察,确认哪些物体(object)对运营分析是有帮助的,进行标记。
步骤三,对图片标注;对步骤S32中确认的物体进行图片抽样标注。
针对运营设计人员感兴趣的物体(object),需要在步骤一中进行对应有该物体的图片进行抽样。例如,对人物这个物体,从步骤一中的10,000张图片,抽取5张作为标注图片。
对于每张标注图片,需要对感兴趣的物体(object)进行逐像素标注。
如图4所示,图片中标注目标元素的示意图,以“埃菲尔铁塔”这个物体(object)类别进行举例,其中,透亮部分为逐个像素标记的图片结果。
步骤四,数据训练。
对于小样本学习而言,需要一个外部训练数据进行辅助训练。其中,外部训练数据的物体类别(object)和步骤三阐明的训练数据可以是不同的。因此,一个完善的外部训练数据是解决标注人力和模型训练结果的保证。
在实施例中,使用coco数据集作为外部训练数据。Coco是微软发布的数据集,包括82,783个训练图像,是一个拥有完善图像分割(就是逐像素类别)标注的数据集。例如,如图5所示,原始图像,图6所示,标注图像。
步骤五,数据训练模型;使用数据集搭建端到端深度学习网络进行。
如图7所示,模型训练过程示意图。训练过程是端到端网络。
其中,Support Set(支持集)是外部数据中,预先采样的每个类别的五个固定图片。Query Set(验证集)是该类别下的其它图片。
Encoder(编码)Relation(关系)Decoder(解码)分别为深度学习网络。Encoder输入Support Set和Query Set中各一副图,Relation将Encoder对于两幅图的输出作为连接。Decoder输入Relation的连接输出,并生成Query Set这幅图逐像素的判断(上图中,白色为熊猫像素,黑色为其他)。
其中,Output predictor是Decoder的输出,GT是外部数据标注的真实输出。
步骤六,使用模型输出图片结果;
使用步骤三的标注,对运营人员感兴趣的物体,通过步骤五的模型,输入步骤一的图片,得到每个图片感兴趣物体的像素级别分割。(即在步骤五的模型中,步骤三的标注是Support Set,步骤一的大量原始图片是Query Set),如图8所示,模型输出的图片示意图。
步骤七,对结果进行再操作;
即可以对步骤六的输出结果进行再操作。该操作可以包括但不限于:
方便运营人员进行海报图像分析,可以直接输出优秀图片的物体占比等统计信息或者每个图片的占比供其参考。
可以直接输出模型对图片的结果,作为图片布局信息。
需要说明的是,布局通常是:类别-(x,y,w,h),其中,x,y为物体相对于图片的起始位置,w,h为物体的长宽。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述图片分析方法的图片分析装置。如图9所示,该图片分析装置包括:第一获取单元91、输出单元93以及第一确定单元95。
第一获取单元91,用于获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素。
输出单元93,用于将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数。
第一确定单元95,用于从第三目标图片中确定第一目标图片中目标元素的相关信息。
可选的,相关信息包括目标元素在第一目标图片中的尺寸大小和/或位置信息。
可选的,上述装置还可以包括:在第一目标图片包括多张的情况下,第二获取单元,用于从第三目标图片中确定第一目标图片中目标元素的相关信息之后,获取目标元素的相关信息满足第一预设条件的第四目标图片的数量;第二确定单元,用于在第四目标图片的数量大于预定阈值的情况下,确定目标元素的相关信息为第五目标图片中的布局信息。
可选的,上述装置还可以包括:第三获取单元,用于获取待分析的第一目标图片以及标注目标元素的第二目标图片之前,从多个目标平台上获取图片集合;第三确定单元,用于对图片集合中的图片进行分类,将满足第二预设条件的图片确定为目标图片集合,目标图片集合中包括第一目标图片。
可选的,上述第一获取单元91,可以包括:得到模块,用于在第一目标图片为多张的情况下,选择一张或多张第一目标图片进行目标元素标注,得到第二目标图片。
通过本申请提供的实施例,第一获取单元91获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素;输出单元93将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;第一确定单元95从第三目标图片中确定第一目标图片中目标元素的相关信息。达到了将待分析的图片与标注有目标元素的图片输出目标神经网络模型中,便可以确定待分析图片中目标元素的相关信息(目标元素的尺寸大小和/或位置信息)的目的,从而实现了用户可以快速根据目标元素在众多图片中的相关信息确定目标元素在新的图片中的布局的技术效果,进而解决了现有技术中,无法快速的从图片中确定目标元素的相关信息的技术问题。
根据本发明实施例的又一个方面,还提供了一种用于实施上述图片分析方法的电子设备,该电子设备可以是图1所示的终端设备或服务器。本实施例以该电子设备为服务器为例来说明。如图10所示,该电子设备包括存储器1002和处理器1004,该存储器1002中存储有计算机程序,该处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素;
S2,将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;
S3,从第三目标图片中确定第一目标图片中目标元素的相关信息。
可选地,本领域普通技术人员可以理解,图10所示的结构仅为示意,电子装置电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图10中所示更多或者更少的组件(如网络接口等),或者具有与图10所示不同的配置。
其中,存储器1002可用于存储软件程序以及模块,如本发明实施例中的图片分析方法和装置对应的程序指令/模块,处理器1004通过运行存储在存储器1002内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图片分析方法。存储器1002可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1002可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1002具体可以但不限于用于存储第一目标图片、第二目标图片、目标元素的相关信息。作为一种示例,如图10所示,上述存储器1002中可以但不限于包括上述图片分析装置中的第一获取单元91、输出单元93以及第一确定单元95。此外,还可以包括但不限于上述图片分析装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1006为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器1008,用于显示上述目标元素的相关信息;和连接总线1010,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本发明的实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,目标图片中包括目标元素;
S2,将第一目标图片和第二目标图片输入是目标神经网络模型中,输出与第一目标图片对应的第三目标图片,其中,第三目标图片中携带目标元素的标识信息,目标神经网络模型是通过样本图片集合训练得到,样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注样本元素的第二样本图片,M、N为正整数;
S3,从第三目标图片中确定第一目标图片中目标元素的相关信息。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种图片分析方法,其特征在于,包括:
获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,所述目标图片中包括所述目标元素;
将所述第一目标图片和所述第二目标图片输入是目标神经网络模型中,输出与所述第一目标图片对应的第三目标图片,其中,所述第三目标图片中携带所述目标元素的标识信息,所述目标神经网络模型是通过样本图片集合训练得到,所述样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注所述样本元素的第二样本图片,M、N为正整数;
从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息。
2.根据权利要求1所述的方法,其特征在于,所述相关信息包括所述目标元素在所述第一目标图片中的尺寸大小和/或位置信息。
3.根据权利要求1所述的方法,其特征在于,在所述第一目标图片包括多张的情况下,从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息之后,所述方法还包括:
获取所述目标元素的相关信息满足第一预设条件的第四目标图片的数量;
在所述第四目标图片的数量大于预定阈值的情况下,确定所述目标元素的相关信息为第五目标图片中的布局信息。
4.根据权利要求1所述的方法,其特征在于,获取待分析的第一目标图片以及标注目标元素的第二目标图片之前,所述方法还包括:
从多个目标平台上获取图片集合;
对所述图片集合中的图片进行分类,将满足第二预设条件的图片确定为目标图片集合,所述目标图片集合中包括所述第一目标图片。
5.根据权利要求1所述的方法,其特征在于,所述获取待分析的第一目标图片以及标注目标元素的第二目标图片,包括:
在所述第一目标图片为多张的情况下,选择一张或多张第一目标图片进行所述目标元素标注,得到所述第二目标图片。
6.一种图片分析装置,其特征在于,包括:
第一获取单元,用于获取待分析的第一目标图片以及标注目标元素的第二目标图片,其中,所述目标图片中包括所述目标元素;
输出单元,用于将所述第一目标图片和所述第二目标图片输入是目标神经网络模型中,输出与所述第一目标图片对应的第三目标图片,其中,所述第三目标图片中携带所述目标元素的标识信息,所述目标神经网络模型是通过样本图片集合训练得到,所述样本图片集合中包括N张具有标注样本元素的第一样本图片和M张未标注所述样本元素的第二样本图片,M、N为正整数;
第一确定单元,用于从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息。
7.根据权利要求6所述的装置,其特征在于,所述相关信息包括所述目标元素在所述第一目标图片中的尺寸大小和/或位置信息。
8.根据权利要求6所述的装置,其特征在于,在所述第一目标图片包括多张的情况下,所述装置还包括:
第二获取单元,用于从所述第三目标图片中确定所述第一目标图片中所述目标元素的相关信息之后,获取所述目标元素的相关信息满足第一预设条件的第四目标图片的数量;
第二确定单元,用于在所述第四目标图片的数量大于预定阈值的情况下,确定所述目标元素的相关信息为第五目标图片中的布局信息。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第三获取单元,用于获取待分析的第一目标图片以及标注目标元素的第二目标图片之前,从多个目标平台上获取图片集合;
第三确定单元,用于对所述图片集合中的图片进行分类,将满足第二预设条件的图片确定为目标图片集合,所述目标图片集合中包括所述第一目标图片。
10.根据权利要求6所述的装置,其特征在于,所述第一获取单元,包括:
得到模块,用于在所述第一目标图片为多张的情况下,选择一张或多张第一目标图片进行所述目标元素标注,得到所述第二目标图片。
11.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至5任一项中所述的方法。
12.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至5任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010844920.7A CN111985565B (zh) | 2020-08-20 | 2020-08-20 | 图片分析方法和装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010844920.7A CN111985565B (zh) | 2020-08-20 | 2020-08-20 | 图片分析方法和装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985565A true CN111985565A (zh) | 2020-11-24 |
CN111985565B CN111985565B (zh) | 2023-01-10 |
Family
ID=73442679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010844920.7A Active CN111985565B (zh) | 2020-08-20 | 2020-08-20 | 图片分析方法和装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985565B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629743A (zh) * | 2018-04-04 | 2018-10-09 | 腾讯科技(深圳)有限公司 | 图像的处理方法、装置、存储介质和电子装置 |
CN109241998A (zh) * | 2018-08-06 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 模型训练方法、装置、设备及存储介质 |
CN109635833A (zh) * | 2018-10-30 | 2019-04-16 | 银河水滴科技(北京)有限公司 | 一种基于云平台和模型智能推荐的图像识别方法及系统 |
CN110110811A (zh) * | 2019-05-17 | 2019-08-09 | 北京字节跳动网络技术有限公司 | 用于训练模型的方法和装置、用于预测信息的方法和装置 |
CN110110189A (zh) * | 2018-02-01 | 2019-08-09 | 北京京东尚科信息技术有限公司 | 用于生成信息的方法和装置 |
CN110163236A (zh) * | 2018-10-15 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 模型的训练方法和装置、存储介质、电子装置 |
CN110276283A (zh) * | 2019-06-10 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 图片识别方法、目标识别模型训练方法及装置 |
CN110414581A (zh) * | 2019-07-19 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 图片检测方法和装置、存储介质及电子装置 |
CN110569721A (zh) * | 2019-08-01 | 2019-12-13 | 平安科技(深圳)有限公司 | 识别模型训练方法、图像识别方法、装置、设备及介质 |
CN110610169A (zh) * | 2019-09-20 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 图片标注方法和装置、存储介质及电子装置 |
CN111124902A (zh) * | 2019-12-12 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 对象操作方法和装置、计算机可读的存储介质及电子装置 |
CN111210024A (zh) * | 2020-01-14 | 2020-05-29 | 深圳供电局有限公司 | 模型训练方法、装置、计算机设备和存储介质 |
CN111368943A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 图像中对象的识别方法和装置、存储介质及电子装置 |
CN111553335A (zh) * | 2020-04-23 | 2020-08-18 | 上海风秩科技有限公司 | 图像生成方法和装置及存储介质 |
-
2020
- 2020-08-20 CN CN202010844920.7A patent/CN111985565B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110189A (zh) * | 2018-02-01 | 2019-08-09 | 北京京东尚科信息技术有限公司 | 用于生成信息的方法和装置 |
CN108629743A (zh) * | 2018-04-04 | 2018-10-09 | 腾讯科技(深圳)有限公司 | 图像的处理方法、装置、存储介质和电子装置 |
CN109241998A (zh) * | 2018-08-06 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 模型训练方法、装置、设备及存储介质 |
CN110163236A (zh) * | 2018-10-15 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 模型的训练方法和装置、存储介质、电子装置 |
CN109635833A (zh) * | 2018-10-30 | 2019-04-16 | 银河水滴科技(北京)有限公司 | 一种基于云平台和模型智能推荐的图像识别方法及系统 |
CN110110811A (zh) * | 2019-05-17 | 2019-08-09 | 北京字节跳动网络技术有限公司 | 用于训练模型的方法和装置、用于预测信息的方法和装置 |
CN110276283A (zh) * | 2019-06-10 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 图片识别方法、目标识别模型训练方法及装置 |
CN110414581A (zh) * | 2019-07-19 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 图片检测方法和装置、存储介质及电子装置 |
CN110569721A (zh) * | 2019-08-01 | 2019-12-13 | 平安科技(深圳)有限公司 | 识别模型训练方法、图像识别方法、装置、设备及介质 |
CN110610169A (zh) * | 2019-09-20 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 图片标注方法和装置、存储介质及电子装置 |
CN111124902A (zh) * | 2019-12-12 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 对象操作方法和装置、计算机可读的存储介质及电子装置 |
CN111210024A (zh) * | 2020-01-14 | 2020-05-29 | 深圳供电局有限公司 | 模型训练方法、装置、计算机设备和存储介质 |
CN111553335A (zh) * | 2020-04-23 | 2020-08-18 | 上海风秩科技有限公司 | 图像生成方法和装置及存储介质 |
CN111368943A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 图像中对象的识别方法和装置、存储介质及电子装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111985565B (zh) | 2023-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10628136B2 (en) | Internet of things (IoT) application development | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
CN104765746B (zh) | 用于移动通讯终端浏览器的数据处理方法和装置 | |
CN111832447B (zh) | 建筑图纸构件识别方法、电子设备及相关产品 | |
CN107368550B (zh) | 信息获取方法、装置、介质、电子设备、服务器及系统 | |
KR102002024B1 (ko) | 객체 라벨링 처리 방법 및 객체 관리 서버 | |
CN110149551B (zh) | 媒体文件播放方法和装置、存储介质及电子装置 | |
CN108334895B (zh) | 目标数据的分类方法、装置、存储介质及电子装置 | |
CN113159091A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN112307352A (zh) | 内容推荐方法、系统、装置和存储介质 | |
CN110598705B (zh) | 图像的语义标注方法及装置 | |
CN111355628A (zh) | 一种模型训练方法、业务识别方法、装置和电子装置 | |
CN108062401B (zh) | 应用推荐方法、装置及存储介质 | |
CN110929057A (zh) | 图像处理方法、装置和系统、存储介质及电子装置 | |
Schade | Big Data breaking barriers-first steps on a long trail | |
CN111985565B (zh) | 图片分析方法和装置、存储介质及电子设备 | |
CN116069436B (zh) | 遥感图像的处理方法、电子设备以及存储介质 | |
CN111488887A (zh) | 基于人工智能的图像处理方法、装置 | |
CN110895555A (zh) | 数据检索方法和装置、存储介质及电子装置 | |
CN105095404A (zh) | 网页信息的处理方法、网页信息的推荐方法及装置 | |
CN114061593A (zh) | 基于建筑信息模型的导航方法及相关装置 | |
CN113568735A (zh) | 数据处理方法及系统 | |
CN108632370B (zh) | 任务推送方法和装置、存储介质及电子装置 | |
CN111831863A (zh) | 数据可视化方法和装置、计算机可读的存储介质 | |
CN110929059A (zh) | 图片处理方法和装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231201 Address after: Unit 5B03, 5th Floor, Building 2, No. 277 Longlan Road, Xuhui District, Shanghai, 200000 Patentee after: SHANGHAI SECOND PICKET NETWORK TECHNOLOGY CO.,LTD. Address before: Floors 4, 5 and 6, No. 3, Lane 1473, Zhenguang Road, Putuo District, Shanghai, 200333 Patentee before: Shanghai Fengzhi Technology Co.,Ltd. |
|
TR01 | Transfer of patent right |