CN115359261A - 图像识别方法、计算机可读存储介质以及电子设备 - Google Patents
图像识别方法、计算机可读存储介质以及电子设备 Download PDFInfo
- Publication number
- CN115359261A CN115359261A CN202211290054.7A CN202211290054A CN115359261A CN 115359261 A CN115359261 A CN 115359261A CN 202211290054 A CN202211290054 A CN 202211290054A CN 115359261 A CN115359261 A CN 115359261A
- Authority
- CN
- China
- Prior art keywords
- features
- image
- remote sensing
- sensing image
- semantic segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 119
- 230000011218 segmentation Effects 0.000 claims abstract description 246
- 238000012545 processing Methods 0.000 claims abstract description 197
- 238000000605 extraction Methods 0.000 claims abstract description 59
- 239000013598 vector Substances 0.000 claims description 59
- 230000015654 memory Effects 0.000 claims description 29
- 238000001914 filtration Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 16
- 230000003190 augmentative effect Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 26
- 230000005540 biological transmission Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 210000003128 head Anatomy 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004138 cluster model Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/176—Urban or other man-made structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像识别方法、计算机可读存储介质以及电子设备。其中,该方法包括:获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。本申请解决了相关技术中语义分割的效率较低的技术问题。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种图像识别方法、计算机可读存储介质以及电子设备。
背景技术
目前,在对图像进行语义分割的领域,由于需要对输入图像进行逐像素的分类,因此会使得图像识别的运算量很大,从而会导致语义分割的效率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种图像识别方法、计算机可读存储介质以及电子设备,以至少解决相关技术中语义分割的效率较低的技术问题。
根据本申请实施例的一个方面,提供了一种图像识别方法,包括:获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
根据本申请实施例的另一方面,还提供了一种图像识别方法,包括:获取建筑物图像;对建筑物图像进行特征提取,得到建筑物图像的图像特征;对图像特征进行特征处理,得到建筑物图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对建筑物图像进行语义分割,得到建筑物图像的语义分割结果,其中,语义分割结果用于表征建筑物图像中每个像素所属建筑物的类型。
根据本申请实施例的另一方面,还提供了一种图像识别方法,包括:获取交通工具图像;对交通工具图像进行特征提取,得到交通工具图像的图像特征;对图像特征进行特征处理,得到交通工具图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对交通工具图像进行语义分割,得到交通工具图像的语义分割结果,其中,语义分割结果用于表征交通工具图像中每个像素所属交通工具的类型。
根据本申请实施例的另一方面,还提供了一种图像识别方法,包括:响应作用于操作界面上的输入指令,在操作界面上显示监测到的遥感图像;响应作用于操作界面上的识别指令,在操作界面上显示遥感图像的语义分割结果,其中,语义分割结果是利用遥感图像的目标特征对遥感图像进行语义分割得到的,目标特征是对遥感图像的图像特征进行特征处理得到的,图像特征是对遥感图像进行特征提取得到的,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
根据本申请实施例的另一方面,还提供了一种图像识别方法,包括:在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;驱动VR设备或AR设备渲染展示语义分割结果。
根据本申请实施例的另一方面,还提供了一种图像识别方法,包括:通过调用第一接口获取遥感图像,其中,第一接口包括第一参数,第一参数的参数值为遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;通过调用第二接口输出语义分割结果,其中,第二接口包括第二参数,第二参数的参数值为语义分割结果。
根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述实施例中任意一项的图像识别方法。
根据本申请实施例的另一方面,还提供了一种电子设备,包括:处理器;存储器,与处理器相连接,用于为处理器提供处理上述实施例中任意一项的图像识别方法的指令。
通过上述步骤,首先获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型,实现了提高对遥感图像进行语义分割的效率。容易注意到的是,可以先对图像特征进行聚类以得到局部特征,节省计算资源,提高计算效率,然后基于图像特征和局部特征进行恢复以得到目标特征,以便保留目标特征的高分辨率语义,提高后续对遥感图像进行语义分割的精确度,从而可以实现在提高计算效率的基础上保持语义分割的精确度,进而解决了相关技术中语义分割的效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种图像识别方法的虚拟现实设备的硬件环境的示意图;
图2是根据本申请实施例的一种图像识别方法的计算环境的结构框图;
图3是根据本申请实施例1的图像识别方法的流程图;
图4是根据本申请实施例的一种图像识别方法的结构图;
图5是根据本申请实施例的一种聚类模型过程的示意图;
图6是根据本申请实施例的一种聚类模型的示意图;
图7是根据本申请实施例的一种测试样例结果的示意图;
图8是根据本申请实施例2的一种图像识别方法的流程图;
图9是根据本申请实施例3的一种图像识别方法的流程图;
图10是根据本申请实施例4的一种图像识别方法的流程图;
图11a是根据本申请实施例5的一种图像识别方法的流程图;
图11b是根据本申请实施例的一种VR设备或AR设备的示意图;
图12是根据本申请实施例6的一种图像识别方法的流程图;
图13是根据本申请实施例7的一种图像识别装置的示意图;
图14是根据本申请实施例8的一种图像识别装置的示意图;
图15是根据本申请实施例9的一种图像识别装置的示意图;
图16是根据本申请实施例10的一种图像识别装置的示意图;
图17是根据本申请实施例11的一种图像识别装置的示意图;
图18是根据本申请实施例12的一种图像识别装置的示意图;
图19是根据本申请实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在语义分割领域,由于需要对输入图像进行逐像素的分类,运算量很大,通常,为了减少语义分割所产生的计算量,一般会减小图片大小和降低模型复杂度,减小图片大小可以最直接地减少运算量,但是图像会丢失掉大量的细节从而影响精度,降低模型复杂度则会导致模型的特征提取能力减弱,从而影响分割精度,因此,如何在语义分割任务中应用轻量级模型,兼顾实时性和精度性能具有相当大的挑战性。
实施例1
根据本申请实施例,还提供了一种图像识别方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的一种图像识别方法的虚拟现实设备的硬件环境的示意图。如图1所示,虚拟现实设备104与终端106相连接,终端106与服务器102通过网络进行连接,上述虚拟现实设备104并不限定于:虚拟现实头盔、虚拟现实眼镜、虚拟现实一体机等,上述终端104并不限定于PC、手机、平板电脑等,服务器102可以为媒体文件运营商对应的服务器,上述网络包括但不限于:广域网、城域网或局域网。
可选地,该实施例的虚拟现实设备104包括:存储器、处理器和传输装置。存储器用于存储应用程序,该应用程序可以用于执行:获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型,从而解决了相关技术中语义分割的效率较低的技术问题。
该实施例的终端可以用于执行在虚拟现实(Virtual Reality,简称为VR)设备或增强现实(Augmented Reality,简称为AR)设备的呈现画面上展示遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型,并向虚拟现实设备104发送语义分割结果,虚拟现实设备104在接收到语义分割结果之后在目标投放位置显示出来。
可选地,该实施例的虚拟现实设备104带有的眼球追踪的HMD(Head MountDisplay,头戴式显示器)头显与眼球追踪模块与上述实施例中的作用相同,也即,HMD头显中的屏幕,用于显示实时的画面,HMD中的眼球追踪模块,用于获取用户眼球的实时运动轨迹。该实施例的终端通过跟踪系统获取用户在真实三维空间的位置信息与运动信息,并计算出用户头部在虚拟三维空间中的三维坐标,以及用户在虚拟三维空间中的视野朝向。
图1示出的硬件结构框图,不仅可以作为上述AR/VR设备(或移动设备)的示例性框图,还可以作为上述服务器的示例性框图,一种可选实施例中,图2以框图示出了使用上述图1所示的AR/VR设备(或移动设备)作为计算环境201中计算节点的一种实施例。图2是根据本申请实施例的一种图像识别方法的计算环境的结构框图,如图2所示,计算环境201包括运行在分布式网络上的多个(图中采用210-1,210-2,…,来示出)计算节点(如服务器)。每个计算节点都包含本地处理和内存资源,终端用户202可以在计算环境201中远程运行应用程序或存储数据。应用程序可以作为计算环境301中的多个服务220-1,220-2,220-3和220-4进行提供,分别代表服务“A”,“D”,“E”和“H”。
终端用户202可以通过客户端上的web浏览器或其他软件应用程序提供和访问服务,在一些实施例中,可以将终端用户202的供应和/或请求提供给入口网关230。入口网关230可以包括一个相应的代理来处理针对服务220(计算环境201中提供的一个或多个服务)的供应和/或请求。
服务220是根据计算环境201支持的各种虚拟化技术来提供或部署的。在一些实施例中,可以根据基于虚拟机(VM)的虚拟化、基于容器的虚拟化和/或类似的方式提供服务220。基于虚拟机的虚拟化可以是通过初始化虚拟机来模拟真实的计算机,在不直接接触任何实际硬件资源的情况下执行程序和应用程序。在虚拟机虚拟化机器的同时,根据基于容器的虚拟化,可以启动容器来虚拟化整个操作系统(OS),以便多个工作负载可以在单个操作系统实例上运行。
在基于容器虚拟化的一个实施例中,服务220的若干容器可以被组装成一个Pod(例如,Kubernetes Pod)。举例来说,如图2所示,服务220-2可以配备一个或多个Pod 240-1,240-2,…,240-N(统称为Pod 240)。每个Pod 240可以包括代理245和一个或多个容器242-1,242-2,…,242-M(统称为容器242)。Pod 240中一个或多个容器242处理与服务的一个或多个相应功能相关的请求,代理245通常控制与服务相关的网络功能,如路由、负载均衡等。其他服务220也可以为类似于Pod 240的Pod。
在操作过程中,执行来自终端用户202的用户请求可能需要调用计算环境201中的一个或多个服务220,执行一个服务220的一个或多个功能需要调用另一个服务220的一个或多个功能。如图2所示,服务“A”220-1从入口网关230接收终端用户202的用户请求,服务“A”220-1可以调用服务“D”220-2,服务“D”220-2可以请求服务“E”220-3执行一个或多个功能。
上述的计算环境可以是云计算环境,资源的分配由云服务提供上管理,允许功能的开发无需考虑实现、调整或扩展服务器。该计算环境允许开发人员在不构建或维护复杂基础设施的情况下执行响应事件的代码。服务可以被分割完成一组可以自动独立伸缩的功能,而不是扩展单个硬件设备来处理潜在的负载。
在上述运行环境下,本申请提供了如图3所示的图像识别方法。需要说明的是,该实施例的图像识别方法可以由图1所示实施例的移动终端执行。图3是根据本申请实施例1的图像识别方法的流程图。如图3所示,该方法可以包括如下步骤:
步骤S302,获取遥感图像。
上述的遥感图像可以是通过无人机、雷达或者卫星通过拍摄得到的遥感图像,上述的遥感图像可以是从本地图库或者网络上获取到的遥感图像。
上述的遥感图像可以是待进行处理的遥感图像,可选的,可以是待进行语义分割的遥感图像,以便于后续对该遥感图像进行识别。
上述的遥感图像可以是建筑物场景下的遥感图像、交通工具场景下的遥感图像、农业场景下的遥感图像等,此处不做限定。
步骤S304,对遥感图像进行特征提取,得到遥感图像的图像特征。
在一种可选的实施例中,可以利用特征提取网络对遥感图像进行特征提取,得到遥感图像的图像特征。
步骤S306,对图像特征进行特征处理,得到遥感图像的目标特征。
其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
在一种可选的实施例中,可以对图像特征进行聚类以得到局部特征,这个过程可以节省计算资源,在得到局部特征之后,为了提高特征的精确度,可以将局部特征恢复为完整的像素特征,以便提高后续对遥感图像的语义分割准确度,在恢复的过程中,为了能够恢复的更加精确,可以结合遥感图像的图像特征进行恢复,由于图像特征中的信息较为完善,因此,可以将局部特征恢复为准确度较高的目标特征,从而提高后续语义分割的准确度。
在另一种可选的实施例中,可以使用一种频率自适应的语义分割模型(AdaptiveFrequency Transformer for Semantic segmentation,简称为AFFormer)采用异构并行架构对图像特征进行特征处理,得到遥感图像的目标特征,使用异构并行架构可以取代解码器,以便提高处理的效率,并且可以在高分辨率特征上保留丰富的图像语义,可选的,可以利用异构并行架构中的聚类模型对图像特征进行聚类,得到聚类中心集合,可以利用原型学习模型根据聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征,可以将局部特征嵌入到图像特征的投影特征中,以便将局部特征中的信息进行补全,从而得到目标特征。
尽管去除解码器压缩了大部分的计算,但是异构并行结构的准确性仍然受到了计算资源低的限制,因此,本申请中采用了异构算子在图像特征中进行像素嵌入,得到目标特征,在金字塔中进行局部描述,以进一步节省计算资源。
在又一种可选的实施例中,在对图像特征进行聚类以后可以得到多个局部特征,可以使用多个特征处理模型对多个局部特征进行处理,从而提高处理的效率,其中,多个特征处理模型与多个局部特征一一对应。
步骤S308,利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果。
其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
在一种可选的实施例中,目标特征相比于图像特征其资源的占用量较少,并且该目标特征具有了语义分割的重要信息,因此,利用目标特征对遥感图像进行语义分割,可以在提高计算效率的同时保证语义分割的准确性,对于显存较大的遥感图像可以具有明显的效果。在得到语义分割结果之后,可以根据语义分割结果对遥感图像中的对象进行分类,若遥感图像为建筑物图像,则可以对遥感图像中的建筑物分类输出,若遥感图像为交通工具图像,则可以对遥感图像中的交通工具分类输出。
遥感图像中的地理空间对象分割作为一种特殊的语义分割任务,其图像具有高分辨率的特点,一般模型难以对遥感图像直接进行处理。目前的做法是将遥感图像剪切为低分辨率的遥感图像输入模型中处理,但是这种方式的代价是速度较慢,且模型会缺乏全局的语义导致对遥感图像的处理效果较差。现有的模型又难以直接将高分辨率的遥感图像作为输入,若是将高分辨率的遥感图像直接作为输入,也就意味着在训练和推理的过程中会有高显存的占用,硬件难以支撑如此高的计算量,并且速度极慢。本申请中可以采用异构并行结构设计模型,去除了极其复杂的语义解码器,同时设计了一个线性的高性能算子,允许在高分辨率输入的条件下保持极低的计算复杂度,同时具有稳定准确的分割能力,从而提高对遥感图像进行语义分割的效果。
在遥感图像为建筑物图像的情况下,可以对建筑物图像进行特征提取,得到建筑物图像的图像特征;对图像特征进行聚类以得到包含建筑物的局部特征,这样在聚焦于建筑物特征的同时减少运算资源,可以根据图像特征和局部特征进行恢复以得到目标特征,以便将局部特征中缺失的信息补全;利用目标特征对建筑物图像进行语义分割,得到建筑物图像的语义分割结果,语义分割结果中可以显示建筑物图像中每个像素所属对象的类型,对于不同的建筑物可以采用不同的颜色区分类别,或者对于建筑物图像中的建筑物和其他景观通过不同的颜色进行区分,此处不限于通过颜色区分类别,还可以通过其他方式区分类别。
在遥感图像为交通工具图像的情况下,可以对交通工具图像进行特征提取,得到交通工具图像的图像特征;可以对图像特征进行聚类以得到包含交通工具的局部特征,这样在聚焦于交通工具特征的同时可以减少运算资源,可以根据图像特征和局部特征进行恢复以得到目标特征,以便将局部特征中缺失的信息补全;利用目标特征对交通工具进行语义分割,得到交通工具的语义分割结果,语义分割结果中可以显示交通工具图像中每个像素所属对象的类型,对于不同的交通工具可以采用不同的颜色区分类别,或者对于交通工具图像中的交通工具和其他对象可以通过不同的颜色进行区分,此处不限于通过颜色区分类别,还可以通过其他方式区分类别。
通过上述步骤,首先获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型,实现了提高对遥感图像进行语义分割的效率。容易注意到的是,可以先对图像特征进行聚类以得到局部特征,节省计算资源,提高计算效率,然后基于图像特征和局部特征进行恢复以得到目标特征,以便保留目标特征的高分辨率语义,提高后续对遥感图像进行语义分割的精确度,从而可以实现在提高计算效率的基础上保持语义分割的精确度,进而解决了相关技术中语义分割的效率较低的技术问题。
本申请上述实施例中,对图像特征进行特征处理,得到遥感图像的目标特征,包括:利用多个特征处理模型对图像特征进行多次特征处理,得到目标特征,其中,每个特征处理模型包括:聚类模型和像素描述符,聚类模型的输入端与每个特征处理模型的输入端连接,像素描述符的输入端与每个特征处理模型的输入端和聚类模型的输出端连接。
上述的多个特征处理模型可以依次连接,每个特征处理模型包括聚类模型和像素描述符,其中,聚类模型用于对聚集输入特征周围像素的语义,但是该过程一般会导致局部细节的丢失,像素描述符用于根据输入特征对聚集后得到的特征进行恢复,得到输出特征,并将该输出特征作为后一个特征处理模型的输入特征,直至将最后一个特征处理模型的输出特征作为目标特征。
图4是根据本申请实施例的一种特征处理结构图,首先给定一个遥感图像,与传统的模型利用主干网络获取多尺度特征,然后利用解码器对多尺度特征解码以及融合方式不同,这里去掉了解码器,仅仅利用特征提取器以及一个分类头完成语义分割,可以做到像分类任务一样简单,节省了大量的算力开支,首先使用下采样模块(stemblock)将遥感图像降采样到步长(stride)为4,并将通道数目转换为32,接着同样采用阶段的方式,对于每个阶段,可以在高分辨率特征上提取特征,但是在高分辨率上提取特征会导致大量的计算开支,为了结果这个问题,提出了并行异构结构,在每一个阶段,对于输入的特征×1,可以提出一种用原型语义描述像素语义信息的新策略,其中,每个特征提取模型中都包含有原型学习模型(Prototype Learning,简称为PL)和像素描述符(Pixel Descriptor,简称为PD),在进行多次处理之后,可以得到目标特征,根据该目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果。
本申请上述实施例中,利用多个特征处理模型对图像特征进行多次特征处理,得到目标特征,包括:确定输入至每个特征处理模型的输入特征,其中,输入特征为图像特征,或前一个特征处理模型的输出特征;利用聚类模型对输入特征进行聚类,得到局部特征;利用像素描述符对输入特征和局部特征进行恢复,得到每个特征处理模型的输出特征,其中,输出特征为目标特征,或后一个特征处理模型的输入特征。
在一种可选的实施例中,可以确定输入至每个特征处理模型的输入特征,利用聚类模型先对输入特征进行聚类,以便于将聚集周围像素的语义,得到局部特征,但是这个过程会导致局部细节的丢失,因此,需要利用像素描述符对输入特征和局部特征进行恢复,得到每个特征处理模型的输出特征。可选的,可以先使用像素语义建模局部细节,特别地,可以将局部特征投影到低维空间中,在像素之间建立局部关系,使得每个局部面片保持不同的边界,然后通过插值嵌入的方式将投影的结果返回到图像特征中进行恢复,从而得到输出特征,以便将该输出特征作为后一个特征处理模型的输入特征或者目标特征。
图5是根据本申请实施例的一种聚类模型过程的示意图,如图5所示,为图像特征,为聚类中心集合,为局部特征,为目标特征。其中,箭头指向的特征为局部特征,箭头另一端的特征为图像特征,图5中表格的横向表示为频率(Frequency),纵向表示振幅(amplitude)。
本申请上述实施例中,聚类模型包括:聚类模块和原型学习模型,其中,利用聚类模型对输入特征进行聚类,得到局部特征,包括:利用聚类模块对输入特征进行聚类,得到聚类中心集合;利用原型学习模型基于聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征。
上述的频率信息可以是高频信息、低频信息。
在一种可选的实施例中,可以给定一个特征F∈,为遥感图像的输入特征。首先初始化一个网格在G∈,其中,G中的每个点充当本地群集中心,初始状态仅包含有关周围区域的信息,这里可以使用1×C向量来表示每个点的局部语义信息,对于每个特定像素,由于周围像素的语义不一致,每个聚类中心集合之间存在重叠语义,初始化每个聚类中心集合时,其对应区域中的像素不会被同等对待,因此,每个集群中心集合的初始化表示为:
语义分割与场景理解一样,是一项极为复杂的像素级分类任务,容易产生类别混淆。频率表示可以作为学习类别间差异的新范式,可以挖掘人类视觉忽略的信息。除非过滤掉绝大多数频率,否则人类很容易在视觉上忽略图像之间的差异,并去除大量频率信息。然而,该模型对去除频率信息的方式非常敏感,去除痕量会导致性能显著下降。结果表明,对于该模型,挖掘更多的频率信息可以增强类别之间的差异,使每个类别之间的边界更加明显,从而提高语义分割的效果。
由于特征F包含丰富的频率特征,网格G中的每个群集中心也收集这些频率信息。基于上述分析,在网格G中提取更有利的频率有助于区分每个聚类的属性。对于不同频率特征的提取,直接的方法是通过傅里叶变换将空间域特征变换为频谱特征,并在频域中使用简单的掩模滤波器来增强或衰减频谱的每个频率分量的强度。
其中,AFF(X)表示每个频率分量的强度,、、分别表示具有实现频率分量相关增强的H组的频率相似性核、具有M组合具有N的动态高通滤波器表示拼接。需要说明的是,这些算法采用并行结构,可以通过共享权重进一步降低计算成本。
本申请上述实施例中,原型学习模型包括:采用并行结构的频率相似核、低通滤波器和高通滤波器,其中,利用原型学习模型基于聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征,包括:确定聚类中心集合的频率分量的查询向量、键向量和值向量;利用频率相似核对频率分量进行筛选,得到第一频率分量,其中,频率相似核用于表征不同频率分量之间的对应关系;利用低通滤波器对值向量进行滤波,得到第二频率分量,其中,低通滤波器包含多组内核,不同组内核用于处理不同值向量;利用高通滤波器对值向量进行滤波以得到滤波向量,并获取滤波向量和查询向量的乘积以得到第三频率分量;对第一频率分量、第二频率分量和第三频率分量进行加权和处理,得到局部特征。
上述的低通滤波器可以从重要频率的角度捕捉有利于语义分割的频率信息。
上述的高通滤波器可以从动态频率滤波的角度捕捉有利于语义分割的频率信息。
在一种可选的实施例中,可以先在通道维度计算频带的相关性,以实现频率分布增强。然后,在空间维度上使用高通滤波器和低通滤波器来分别保留高频和低频。最后,通过在高频和低频提取和增强部分共享权重以及在前馈网络(Feedforwardneuralnetwork,简称为FFN)层中嵌入简化的高通算子以减小两个矩阵变换的大小,进一步降低了计算成本。FFN有助于融合捕获的频率信息,但是计算量大在轻量级设计中经常被忽略。在这里可以引入卷积层来减少隐藏层的维数,以弥补由于维数压缩而丢失的能力。
在一种可选的实施例中,可以确定聚类中心集合的频率分量的查询向量、键向量和值向量,可以利用频率相似和对频率分量进行筛选,得到重要的频率分量,也即上述的第一频率分量;由于低频分量占据了图像中的而大部分能量,并代表了大部分的语义信息,因此可以利用低通滤波器对值向量进行滤波,得到第二频率分量;由于高频分量对于在分割中保留细节至关重要,因此,可以利用高通滤波器对值向量进行滤波以得到滤波向量,并通过获取滤波向量和查询向量的乘积得到查询向量对应的第三频率分量,可以对第一频率分量、第二频率分量和第三频率分量进行加权和处理,得到局部特征。
对于频率相似核,不同的频率分量分布在网格中,可以选择和增强有助于语义解析的重要分量,为此,本申请设计了一个频率相似性核心模块,该模块可以由视觉转换器(Vision Transformer,简称为ViT)实现,给定特征X∈来表示不同频率分量之间的对应关系,并通过查询相似性核来选择重要的频率分量,也即,得到上述的第一频率分量。
对于上述的低通滤波器,其可以是动态低通滤波器,低频分量占据了绝对图像中的大部分能量,并代表了大部分语义信息。低通滤波器允许截止频率以下的信号通过,而截止频率以上的信号被阻挡。因此,我们使用典型的平均池作为低通滤波器。然而,不同图像的截止频率不同。为此,我们在多组中控制不同的内核和步长,以生成动态低通滤波器。对于第m组,可以有:
对于上述的高频滤波器,其可以是动态高频滤波器,高频信息对于在分割中保留细节至关重要。作为一种典型的高通算子,卷积可以滤除不相关的低频冗余分量,以保留有利的高频分量。高频分量在很大程度上决定了图像质量,因此每个图像中高通的截止频率非常不同。因此,因此,我们将值V分为N组,得到。对于每组,可以使用具有不同核的卷积层来模拟不同高通滤波器中的截止频率。对于第n组,可以有:
本申请上述实施例中,利用像素描述符对输入特征和局部特征进行恢复,得到每个特征处理模型的输出特征,包括:将输入特征从原始空间投影到预设空间,得到投影特征,其中,预设空间的维度低于原始空间;将局部特征插入嵌入到投影特征中,得到输出特征。
上述的原始空间可以是输入特征目前所在的维度空间。
上述的预设空间可以为低维空间,但不限于此。
在一种可选的实施例中,可以将输入特征从原始空间投影到低维空间,得到投影特征,可以根据投影特征在像素之间建立局部关系,使得每个局部面片保持不同的边界,然后通过插值嵌入返回原始空间中,最终得到输出特征,其中,输出特征所在的维度空间与输入特征所在的维度空间的维度相同。
本申请上述实施例中,该方法还包括:基于语义分割结果,确定遥感图像中每个像素的输出方式;按照每个像素的输出方式,输出遥感图像。
在一种可选的实施例中,语义分割结果为对图像在像素级别上进行分类的方法,在一张图像中,属于同一类的像素点要被预测为相同的类,因此语义分割结果是从像素级别来理解图像,因此,可以根据语义分割结果,确定出遥感图像中每个像素的输出方式,其中,属于不同类的像素点可以通过不同的颜色或者纹理进行输出,按照每个像素的输出方式,输出遥感图像,以便在遥感图像中对于相同类的像素可以通过相同的输出方式进行输出,便于对遥感图像中的区域或者物体进行分类。
示例性的,属于人物的像素点可以通过红色的方式进行输出,属于建筑物的像素点可以通过蓝色的方式进行输出,此处仅作示例说明,不做具体限定。
在另一种可选的实施例中,在得到语义分割结果后,可以根据预设展示方式,将语义分割结果展示给用户,以便用户可以查看到语义分割结果,其中预设展示方式可以由用户进行选择,预设展示方式还可以是用户常用的展示方式。
在用户能够选择像素的情况下,可以选择需要展示遥感图像对应的像素,并且根据该像素的输出方式,输出对应的遥感图像,可以根据输出的遥感图像修改语义分割结果,从而得到准确度更高的。需要说明的是,可以根据用户需求同时输出语义分割结果和遥感图像。
本申请上述实施例中,该方法还包括:接收遥感图像对应的反馈信息,其中,反馈信息用于对遥感图像中任意一个像素所属对象的类型进行修改;基于反馈信息对多个特征处理模型的参数进行调整。
在一种可选的实施例中,可以在显示界面显示遥感图像,以便用户对遥感图像中任意一个像素所属对象的类型进行修改,生成反馈信息,在接收到遥感图像对应的反馈信息之后,可以根据反馈信息对特征处理模型的参数进行调整,以便特征处理模型可以更加精确的对遥感图像进行处理,从而提高对遥感图像进行语义分割的准确度。
图6是根据本申请实施例的一种聚类模型的示意图,如图6所示,聚类模型包括:聚类模块(Clustering)和原型学习模型(Prototype Learning),可以利用聚类模块对输入特征进行聚类,得到聚类中心集合,可以利用原型学习模型基于聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征,图6中包含有自适应频率滤波器(AdaptiveFrequency Filter),通过该自适应频率滤波器可以捕捉有利于语义分割的频率信息,得到聚类中心集合的频率信息,该自适应滤波器的前后连接有残差结构(Add&Norm),通过原型学习模型可以基于聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征;可以利用聚类模型对输入特征进行聚类,得到局部特征,可以利用像素描述符对输入特征和局部特征进行恢复,得到每个特征处理模型的输出特征,也即目标特征。
图7是根据本申请实施例的一种测试样例结果的示意图,如图7所示,遥感图像中的地理空间对象分割作为一种特殊的语义分割任务,其图像具有高分辨率的特点,这对于模型而言几乎是致命的。传统的做法是将图像剪切为低分辨率的图像输入模型中处理,但这种方式的代价是速度较慢,且模型缺乏全局的语义导致效果低。直接的思路是将高分辨率的图像作为输入,但现有的模型不允许高分辨输入,意味着在训练和推理过程中的高显存占用,硬件无法支撑如此高的计算量,且速度极慢。我们的模型采用异构并行结构设计,去除了极度复杂的语义解码器。同时设计了一个线性的高性能算子,因此允许在高分辨率输入条件下保持着极低的计算复杂度,同时具有稳定准确的分割能力。图7中上面的四个图像为遥感图像,上面的遥感图像中不仅包含有交通工具,还包含有其他的建筑物等,下面的四个图像为遥感图像对应的语义分割结果,其是将交通工具提取出来,这样便于对交通工具进行识别。
本申请中的语义分割模型(SegFormer)使用一种分层特征表示的方法,每个利用注意力机制来提高模型训练速度的模型(Transformer)的输出特征尺寸逐层递减,通过这种方式捕获不同尺度的特征信息。并且舍弃了ViT中的位置特征的操作,避免了测试图像与训练图像尺寸不同而导致模型性能下降的问题。在解码部分采用简单的多层感知机(MultilayerPerceptron,简称为MLP)结构,聚合Transformer不同尺度的特征,可以同时融合局部注意力和全局注意力。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
实施例2
根据本申请实施例,还提供了一种图像识别方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图8是根据本申请实施例2的一种图像识别方法的流程图,如图8所示,该方法可以包括如下步骤:
步骤S802,获取建筑物图像。
步骤S804,对建筑物图像进行特征提取,得到建筑物图像的图像特征。
步骤S806,对图像特征进行特征处理,得到建筑物图像的目标特征。
其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
步骤S808,利用目标特征对建筑物图像进行语义分割,得到建筑物图像的语义分割结果。
其中,语义分割结果用于表征建筑物图像中每个像素所属建筑物的类型。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例3
根据本申请实施例,还提供了一种图像识别方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图9是根据本申请实施例3的一种图像识别方法的流程图,如图9所示,该方法可以包括如下步骤:
步骤S902,获取交通工具图像。
步骤S904,对交通工具图像进行特征提取,得到交通工具图像的图像特征。
步骤S906,对图像特征进行特征处理,得到交通工具图像的目标特征。
其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
步骤S908,利用目标特征对交通工具图像进行语义分割,得到交通工具图像的语义分割结果。
其中,语义分割结果用于表征交通工具图像中每个像素所属交通工具的类型。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例4
根据本申请实施例,还提供了一种图像识别方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图10是根据本申请实施例4的一种图像识别方法的流程图,如图10所示,该方法可以包括如下步骤:
步骤S1002,响应作用于操作界面上的输入指令,在操作界面上显示监测到的遥感图像。
步骤S1004,响应作用于操作界面上的识别指令,在操作界面上显示遥感图像的语义分割结果。
其中,语义分割结果是利用遥感图像的目标特征对遥感图像进行语义分割得到的,目标特征是对遥感图像的图像特征进行特征处理得到的,图像特征是对遥感图像进行特征提取得到的,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例5
根据本申请实施例,还提供了一种图像识别方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图11a是根据本申请实施例5的一种图像识别方法的流程图,如图11a所示,该方法可以包括如下步骤:
步骤S1102,在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像。
步骤S1104,对遥感图像进行特征提取,得到遥感图像的图像特征。
步骤S1106,对图像特征进行特征处理,得到遥感图像的目标特征。
其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
步骤S1108,利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果。
其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
步骤S1110,驱动VR设备或AR设备渲染展示语义分割结果。
可选地,在本实施例中,上述图像识别方法可以应用于由服务器、虚拟现实设备所构成的硬件环境中。在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像,服务器可以为媒体文件运营商对应的服务器,上述网络包括但不限于:广域网、城域网或局域网,上述虚拟现实设备并不限定于:虚拟现实头盔、虚拟现实眼镜、虚拟现实一体机等。
可选地,虚拟现实设备包括:存储器、处理器和传输装置。存储其用于存储应用程序,该应用程序可以用于执行:对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果。
需要说明的是,该实施例的上述应用在VR设备或AR设备中的图像识别方法可以包括图11a所示实施例的方法,以实现驱动VR设备或AR设备展示语义分割结果的目的。
可选地,该实施例的处理其可以通过传输装置调用上述存储器存储的应用程序以执行上述步骤。传输装置可以通过网络接收服务器发送的媒体文件,也可以用于上述处理器与存储器之间的数据传输。
可选地,在虚拟现实设备中,带有眼球追踪的头戴式显示器,该HMD头显中的屏幕,用于显示展示的视频画面,HMD中的眼球追踪模块,用于获取用户眼球的实时运动轨迹,跟踪系统,用于追踪用户在真实三维空间的位置信息与运动信息,计算处理单元,用于从跟踪系统中获取用户的实时位置与运动信息,并计算出用户头部在虚拟三维空间中的三维坐标,以及用户在虚拟三维空间中的视野朝向等。
在本申请实施例中,虚拟现实设备可以与终端相连接,终端与服务器通过网络进行连接,上述虚拟现实设备并不限定于:虚拟现实头盔、虚拟现实眼镜、虚拟现实一体机等,上述终端并不限定于PC、手机、平板电脑等,服务器可以为媒体文件运营商对应的服务器,上述网络包括但不限于:广域网、城域网或局域网。
图11b是根据本申请实施例的一种VR设备或AR设备的示意图,如图11b所示,在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像,可以对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,并驱动VR设备或AR设备渲染展示语义分割结果。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例6
根据本申请实施例,还提供了一种图像识别方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图12是根据本申请实施例6的一种图像识别方法的流程图,如图12所示,该方法可以包括如下步骤:
步骤S1202,通过调用第一接口获取遥感图像。
其中,第一接口包括第一参数,第一参数的参数值为遥感图像。
步骤S1204,对遥感图像进行特征提取,得到遥感图像的图像特征。
步骤S1206,对图像特征进行特征处理,得到遥感图像的目标特征。
其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
步骤S1208,利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果。
其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
步骤S1210,通过调用第二接口输出语义分割结果。
其中,第二接口包括第二参数,第二参数的参数值为语义分割结果。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例7
根据本申请实施例,还提供了一种用于实施上述图像识别方法的图像识别装置,图13是根据本申请实施例7的一种图像识别装置的示意图,如图13所示,该装置1300包括:获取模块1302、特征提取模块1304、特征处理模块1306、语义分割模块1308。
其中,获取模块用于获取遥感图像;特征提取模块用于对遥感图像进行特征提取,得到遥感图像的图像特征;特征处理模块用于对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;语义分割模块用于利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
此处需要说明的是,上述获取模块1302、特征提取模块1304、特征处理模块1306、语义分割模块1308对应于实施例1中的步骤S302至步骤S308,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。
本申请上述实施例中,特征处理模块用于利用多个特征处理模型对图像特征进行多次特征处理,得到目标特征,其中,每个特征处理模型包括:聚类模型和像素描述符,聚类模型的输入端与每个特征处理模型的输入端连接,像素描述符的输入端与每个特征处理模型的输入端和聚类模型的输出端连接。
本申请上述实施例中,特征处理模块,包括:确定单元、聚类单元、恢复单元。
其中,确定单元用于确定输入至每个特征处理模型的输入特征,其中,输入特征为图像特征,或前一个特征处理模型的输出特征;聚类单元用于利用聚类模型对输入特征进行聚类,得到局部特征;恢复单元用于利用像素描述符对输入特征和局部特征进行恢复,得到每个特征处理模型的输出特征,其中,输出特征为目标特征,或后一个特征处理模型的输入特征。
本申请上述实施例中,聚类模型包括:聚类模块和原型学习模型,聚类单元,包括:聚类子单元、更新子单元。
其中,聚类子单元用于利用聚类模块对输入特征进行聚类,得到聚类中心集合;更新子单元用于利用原型学习模型基于聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征。
本申请上述实施例中,原型学习模型包括:采用并行结构的频率相似核、低通滤波器和高通滤波器,其中,更新子单元用于确定聚类中心集合的频率分量的查询向量、键向量和值向量;更新子单元用于利用频率相似核对频率分量进行筛选,得到第一频率分量,其中,频率相似核用于表征不同频率分量之间的对应关系;更新子单元用于利用低通滤波器对值向量进行滤波,得到第二频率分量,其中,低通滤波器包含多组内核,不同组内核用于处理不同值向量;更新子单元用于利用高通滤波器对值向量进行滤波以得到滤波向量,并获取滤波向量和查询向量的乘积以得到第三频率分量;更新子单元用于对第一频率分量、第二频率分量和第三频率分量进行加权和处理,得到局部特征。
本申请上述实施例中,恢复单元,包括:投影子单元、插入子单元。
其中,投影子单元用于将输入特征从原始空间投影到预设空间,得到投影特征,其中,预设空间的维度低于原始空间;插入子单元用于将局部特征插入嵌入到投影特征中,得到输出特征。
本申请上述实施例中,该装置还包括:确定模块、输出模块。
其中,确定模块用于基于语义分割结果,确定遥感图像中每个像素的输出方式;输出模块用于按照每个像素的输出方式,输出遥感图像。
本申请上述实施例中,该装置还包括:接收模块、调整模块。
其中,接收模块用于接收遥感图像对应的反馈信息,其中,反馈信息用于对遥感图像中任意一个像素所属对象的类型进行修改;调整模块用于基于反馈信息对多个特征处理模型的参数进行调整。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例8
根据本申请实施例,还提供了一种用于实施上述图像识别方法的图像识别装置,图14是根据本申请实施例8的一种图像识别装置的示意图,如图14所示,该装置1400包括:获取模块1402、特征提取模块1404、特征处理模块1406、语义分割模块1408。
其中,获取模块用于获取建筑物图像;特征提取模块用于对建筑物图像进行特征提取,得到建筑物图像的图像特征;特征处理模块用于对图像特征进行特征处理,得到建筑物图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;语义分割模块用于利用目标特征对建筑物图像进行语义分割,得到建筑物图像的语义分割结果,其中,语义分割结果用于表征建筑物图像中每个像素所属建筑物的类型。
此处需要说明的是,上述获取模块1402、特征提取模块1404、特征处理模块1406、语义分割模块1408对应于实施例2中的步骤S802至步骤S808,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例9
根据本申请实施例,还提供了一种用于实施上述图像识别方法的图像识别装置,图15是根据本申请实施例9的一种图像识别装置的示意图,如图15所示,该装置1500包括:获取模块1502、特征提取模块1504、特征处理模块1506、语义分割模块1508。
其中,获取模块用于获取交通工具图像;特征提取模块用于对交通工具图像进行特征提取,得到交通工具图像的图像特征;特征处理模块用于对图像特征进行特征处理,得到交通工具图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;语义分割模块用于利用目标特征对交通工具图像进行语义分割,得到交通工具图像的语义分割结果,其中,语义分割结果用于表征交通工具图像中每个像素所属交通工具的类型。
此处需要说明的是,上述获取模块1502、特征提取模块1504、特征处理模块1506、语义分割模块1508对应于实施例3中的步骤S902至步骤S908,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例10
根据本申请实施例,还提供了一种用于实施上述图像识别方法的图像识别装置,图16是根据本申请实施例10的一种图像识别装置的示意图,如图16所示,该装置1600包括:第一显示模块1602、第二显示模块1604。
其中,第一显示模块用于响应作用于操作界面上的输入指令,在操作界面上显示监测到的遥感图像;第二显示模块用于响应作用于操作界面上的识别指令,在操作界面上显示遥感图像的语义分割结果,其中,语义分割结果是利用遥感图像的目标特征对遥感图像进行语义分割得到的,目标特征是对遥感图像的图像特征进行特征处理得到的,图像特征是对遥感图像进行特征提取得到的,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
此处需要说明的是,上述第一显示模块1602、第二显示模块1604对应于实施例4中的步骤S1002至步骤S1004,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例11
根据本申请实施例,还提供了一种用于实施上述图像识别方法的图像识别装置,图17是根据本申请实施例11的一种图像识别装置的示意图,如图17所示,该装置1700包括:展示模块1702、特征提取模块1704、特征处理模块1706、语义分割模块1708、驱动模块1710。
其中,展示模块用于在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像;特征提取模块用于对遥感图像进行特征提取,得到遥感图像的图像特征;特征处理模块用于对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;语义分割模块用于利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;驱动模块用于驱动VR设备或AR设备渲染展示语义分割结果。
此处需要说明的是,上述展示模块1702、特征提取模块1704、特征处理模块1706、语义分割模块1708、驱动模块1710对应于实施例5中的步骤S1102至步骤S1110,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例12
根据本申请实施例,还提供了一种用于实施上述图像识别方法的图像识别装置,图18是根据本申请实施例12的一种图像识别装置的示意图,如图18所示,该装置包括:调用模块1802、特征提取模块1804、特征处理模块1806、语义分割模块1808、输出模块1810。
其中,调用模块用于通过调用第一接口获取遥感图像,其中,第一接口包括第一参数,第一参数的参数值为遥感图像;特征提取模块用于对遥感图像进行特征提取,得到遥感图像的图像特征;特征处理模块用于对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;语义分割模块用于利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;输出模块用于通过调用第二接口输出语义分割结果,其中,第二接口包括第二参数,第二参数的参数值为语义分割结果。
此处需要说明的是,上述调用模块1802、特征提取模块1804、特征处理模块1806、语义分割模块1808、输出模块1810对应于实施例6中的步骤S1202至步骤S1210,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例13
本申请的实施例可以提供一种电子设备,该电子设备可以是电子设备群中的任意一个电子设备。可选地,在本实施例中,上述电子设备也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述电子设备可以执行图像识别方法中以下步骤的程序代码:获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
可选地,图19是根据本申请实施例的一种计算机终端的结构框图。如图19所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器、存储器。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的图像识别方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像识别方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
可选的,上述处理器还可以执行如下步骤的程序代码:利用多个特征处理模型对图像特征进行多次特征处理,得到目标特征,其中,每个特征处理模型包括:聚类模型和像素描述符,聚类模型的输入端与每个特征处理模型的输入端连接,像素描述符的输入端与每个特征处理模型的输入端和聚类模型的输出端连接。
可选的,上述处理器还可以执行如下步骤的程序代码:确定输入至每个特征处理模型的输入特征,其中,输入特征为图像特征,或前一个特征处理模型的输出特征;利用聚类模型对输入特征进行聚类,得到局部特征;利用像素描述符对输入特征和局部特征进行恢复,得到每个特征处理模型的输出特征,其中,输出特征为目标特征,或后一个特征处理模型的输入特征。
可选的,上述处理器还可以执行如下步骤的程序代码:利用聚类模块对输入特征进行聚类,得到聚类中心集合;利用原型学习模型基于聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征。
可选的,上述处理器还可以执行如下步骤的程序代码:确定聚类中心集合的频率分量的查询向量、键向量和值向量;利用频率相似核对频率分量进行筛选,得到第一频率分量,其中,频率相似核用于表征不同频率分量之间的对应关系;利用低通滤波器对值向量进行滤波,得到第二频率分量,其中,低通滤波器包含多组内核,不同组内核用于处理不同值向量;利用高通滤波器对值向量进行滤波以得到滤波向量,并获取滤波向量和查询向量的乘积以得到第三频率分量;对第一频率分量、第二频率分量和第三频率分量进行加权和处理,得到局部特征。
可选的,上述处理器还可以执行如下步骤的程序代码:将输入特征从原始空间投影到预设空间,得到投影特征,其中,预设空间的维度低于原始空间;将局部特征插入嵌入到投影特征中,得到输出特征。
可选的,上述处理器还可以执行如下步骤的程序代码:基于语义分割结果,确定遥感图像中每个像素的输出方式;按照每个像素的输出方式,输出遥感图像。
可选的,上述处理器还可以执行如下步骤的程序代码:接收遥感图像对应的反馈信息,其中,反馈信息用于对遥感图像中任意一个像素所属对象的类型进行修改;基于反馈信息对多个特征处理模型的参数进行调整。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取建筑物图像;对建筑物图像进行特征提取,得到建筑物图像的图像特征;对图像特征进行特征处理,得到建筑物图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对建筑物图像进行语义分割,得到建筑物图像的语义分割结果,其中,语义分割结果用于表征建筑物图像中每个像素所属建筑物的类型。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取交通工具图像;对交通工具图像进行特征提取,得到交通工具图像的图像特征;对图像特征进行特征处理,得到交通工具图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对交通工具图像进行语义分割,得到交通工具图像的语义分割结果,其中,语义分割结果用于表征交通工具图像中每个像素所属交通工具的类型。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:响应作用于操作界面上的输入指令,在操作界面上显示监测到的遥感图像;响应作用于操作界面上的识别指令,在操作界面上显示遥感图像的语义分割结果,其中,语义分割结果是利用遥感图像的目标特征对遥感图像进行语义分割得到的,目标特征是对遥感图像的图像特征进行特征处理得到的,图像特征是对遥感图像进行特征提取得到的,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;驱动VR设备或AR设备渲染展示语义分割结果。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:通过调用第一接口获取遥感图像,其中,第一接口包括第一参数,第一参数的参数值为遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;通过调用第二接口输出语义分割结果,其中,第二接口包括第二参数,第二参数的参数值为语义分割结果。
采用本申请实施例,首先获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型,实现了提高对遥感图像进行语义分割的效率。容易注意到的是,可以先对图像特征进行聚类以得到局部特征,节省计算资源,提高计算效率,然后基于图像特征和局部特征进行恢复以得到目标特征,以便保留目标特征的高分辨率语义,提高后续对遥感图像进行语义分割的精确度,从而可以实现在提高计算效率的基础上保持语义分割的精确度,进而解决了相关技术中语义分割的效率较低的技术问题。
本领域普通技术人员可以理解,图19所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternetDevices,MID)、PAD等终端设备。图19其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图19中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图19所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例14
本申请的实施例还提供了一种计算机可读存储介质。可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例1所提供的图像识别方法所执行的程序代码。
可选地,在本实施例中,上述计算机可读存储介质可以位于电子设备网络中电子设备终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用多个特征处理模型对图像特征进行多次特征处理,得到目标特征,其中,每个特征处理模型包括:聚类模型和像素描述符,聚类模型的输入端与每个特征处理模型的输入端连接,像素描述符的输入端与每个特征处理模型的输入端和聚类模型的输出端连接。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:确定输入至每个特征处理模型的输入特征,其中,输入特征为图像特征,或前一个特征处理模型的输出特征;利用聚类模型对输入特征进行聚类,得到局部特征;利用像素描述符对输入特征和局部特征进行恢复,得到每个特征处理模型的输出特征,其中,输出特征为目标特征,或后一个特征处理模型的输入特征。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用聚类模块对输入特征进行聚类,得到聚类中心集合;利用原型学习模型基于聚类中心集合的频率信息对聚类中心集合进行更新,得到局部特征。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:确定聚类中心集合的频率分量的查询向量、键向量和值向量;利用频率相似核对频率分量进行筛选,得到第一频率分量,其中,频率相似核用于表征不同频率分量之间的对应关系;利用低通滤波器对值向量进行滤波,得到第二频率分量,其中,低通滤波器包含多组内核,不同组内核用于处理不同值向量;利用高通滤波器对值向量进行滤波以得到滤波向量,并获取滤波向量和查询向量的乘积以得到第三频率分量;对第一频率分量、第二频率分量和第三频率分量进行加权和处理,得到局部特征。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:将输入特征从原始空间投影到预设空间,得到投影特征,其中,预设空间的维度低于原始空间;将局部特征插入嵌入到投影特征中,得到输出特征。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:基于语义分割结果,确定遥感图像中每个像素的输出方式;按照每个像素的输出方式,输出遥感图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:接收遥感图像对应的反馈信息,其中,反馈信息用于对遥感图像中任意一个像素所属对象的类型进行修改;基于反馈信息对多个特征处理模型的参数进行调整。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取建筑物图像;对建筑物图像进行特征提取,得到建筑物图像的图像特征;对图像特征进行特征处理,得到建筑物图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对建筑物图像进行语义分割,得到建筑物图像的语义分割结果,其中,语义分割结果用于表征建筑物图像中每个像素所属建筑物的类型。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取交通工具图像;对交通工具图像进行特征提取,得到交通工具图像的图像特征;对图像特征进行特征处理,得到交通工具图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对交通工具图像进行语义分割,得到交通工具图像的语义分割结果,其中,语义分割结果用于表征交通工具图像中每个像素所属交通工具的类型。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:响应作用于操作界面上的输入指令,在操作界面上显示监测到的遥感图像;响应作用于操作界面上的识别指令,在操作界面上显示遥感图像的语义分割结果,其中,语义分割结果是利用遥感图像的目标特征对遥感图像进行语义分割得到的,目标特征是对遥感图像的图像特征进行特征处理得到的,图像特征是对遥感图像进行特征提取得到的,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;驱动VR设备或AR设备渲染展示语义分割结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过调用第一接口获取遥感图像,其中,第一接口包括第一参数,第一参数的参数值为遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型;通过调用第二接口输出语义分割结果,其中,第二接口包括第二参数,第二参数的参数值为语义分割结果。
采用本申请实施例,首先获取遥感图像;对遥感图像进行特征提取,得到遥感图像的图像特征;对图像特征进行特征处理,得到遥感图像的目标特征,其中,特征处理用于对图像特征进行聚类以得到局部特征,并基于图像特征和局部特征进行恢复以得到目标特征;利用目标特征对遥感图像进行语义分割,得到遥感图像的语义分割结果,其中,语义分割结果用于表征遥感图像中每个像素所属对象的类型,实现了提高对遥感图像进行语义分割的效率。容易注意到的是,可以先对图像特征进行聚类以得到局部特征,节省计算资源,提高计算效率,然后基于图像特征和局部特征进行恢复以得到目标特征,以便保留目标特征的高分辨率语义,提高后续对遥感图像进行语义分割的精确度,从而可以实现在提高计算效率的基础上保持语义分割的精确度,进而解决了相关技术中语义分割的效率较低的技术问题。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (14)
1.一种图像识别方法,其特征在于,包括:
获取遥感图像;
对所述遥感图像进行特征提取,得到所述遥感图像的图像特征;
对所述图像特征进行特征处理,得到所述遥感图像的目标特征,其中,所述特征处理用于对所述图像特征进行聚类以得到局部特征,并基于所述图像特征和所述局部特征进行恢复以得到所述目标特征;
利用所述目标特征对所述遥感图像进行语义分割,得到所述遥感图像的语义分割结果,其中,所述语义分割结果用于表征所述遥感图像中每个像素所属对象的类型。
2.根据权利要求1所述的方法,其特征在于,对所述图像特征进行特征处理,得到所述遥感图像的目标特征,包括:
利用多个特征处理模型对所述图像特征进行多次所述特征处理,得到所述目标特征,其中,每个特征处理模型包括:聚类模型和像素描述符,所述聚类模型的输入端与所述每个特征处理模型的输入端连接,所述像素描述符的输入端与所述每个特征处理模型的输入端和所述聚类模型的输出端连接。
3.根据权利要求2所述的方法,其特征在于,利用多个特征处理模型对所述图像特征进行多次所述特征处理,得到所述目标特征,包括:
确定输入至所述每个特征处理模型的输入特征,其中,所述输入特征为所述图像特征,或前一个特征处理模型的输出特征;
利用所述聚类模型对所述输入特征进行聚类,得到所述局部特征;
利用所述像素描述符对所述输入特征和所述局部特征进行恢复,得到所述每个特征处理模型的输出特征,其中,所述输出特征为所述目标特征,或后一个特征处理模型的输入特征。
4.根据权利要求3所述的方法,其特征在于,所述聚类模型包括:聚类模块和原型学习模型,其中,利用所述聚类模型对所述输入特征进行聚类,得到所述局部特征,包括:
利用所述聚类模块对所述输入特征进行聚类,得到聚类中心集合;
利用所述原型学习模型基于所述聚类中心集合的频率信息对所述聚类中心集合进行更新,得到所述局部特征。
5.根据权利要求4所述的方法,其特征在于,所述原型学习模型包括:采用并行结构的频率相似核、低通滤波器和高通滤波器,其中,利用所述原型学习模型基于所述聚类中心集合的频率信息对所述聚类中心集合进行更新,得到所述局部特征,包括:
确定所述聚类中心集合的频率分量的查询向量、键向量和值向量;
利用所述频率相似核对所述频率分量进行筛选,得到第一频率分量,其中,所述频率相似核用于表征不同频率分量之间的对应关系;
利用所述低通滤波器对所述值向量进行滤波,得到第二频率分量,其中,所述低通滤波器包含多组内核,不同组内核用于处理不同值向量;
利用所述高通滤波器对所述值向量进行滤波以得到滤波向量,并获取所述滤波向量和所述查询向量的乘积以得到第三频率分量;
对所述第一频率分量、所述第二频率分量和所述第三频率分量进行加权和处理,得到所述局部特征。
6.根据权利要求3所述的方法,其特征在于,利用所述像素描述符对所述输入特征和所述局部特征进行恢复,得到所述每个特征处理模型的输出特征,包括:
将所述输入特征从原始空间投影到预设空间,得到投影特征,其中,所述预设空间的维度低于所述原始空间;
将所述局部特征插入嵌入到所述投影特征中,得到所述输出特征。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述语义分割结果,确定所述遥感图像中每个像素的输出方式;
按照所述每个像素的输出方式,输出所述遥感图像。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
接收所述遥感图像对应的反馈信息,其中,所述反馈信息用于对所述遥感图像中任意一个像素所属对象的类型进行修改;
基于所述反馈信息对多个特征处理模型的参数进行调整。
9.一种图像识别方法,其特征在于,包括:
获取建筑物图像;
对所述建筑物图像进行特征提取,得到所述建筑物图像的图像特征;
对所述图像特征进行特征处理,得到所述建筑物图像的目标特征,其中,所述特征处理用于对所述图像特征进行聚类以得到局部特征,并基于所述图像特征和所述局部特征进行恢复以得到所述目标特征;
利用所述目标特征对所述建筑物图像进行语义分割,得到所述建筑物图像的语义分割结果,其中,所述语义分割结果用于表征所述建筑物图像中每个像素所属建筑物的类型。
10.一种图像识别方法,其特征在于,包括:
响应作用于操作界面上的输入指令,在所述操作界面上显示监测到的遥感图像;
响应作用于所述操作界面上的识别指令,在所述操作界面上显示所述遥感图像的语义分割结果,其中,所述语义分割结果是利用所述遥感图像的目标特征对所述遥感图像进行语义分割得到的,所述目标特征是对所述遥感图像的图像特征进行特征处理得到的,所述图像特征是对所述遥感图像进行特征提取得到的,所述特征处理用于对所述图像特征进行聚类以得到局部特征,并基于所述图像特征和所述局部特征进行恢复以得到所述目标特征。
11.一种图像识别方法,其特征在于,包括:
在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像;
对所述遥感图像进行特征提取,得到所述遥感图像的图像特征;
对所述图像特征进行特征处理,得到所述遥感图像的目标特征,其中,所述特征处理用于对所述图像特征进行聚类以得到局部特征,并基于所述图像特征和所述局部特征进行恢复以得到所述目标特征;
利用所述目标特征对所述遥感图像进行语义分割,得到所述遥感图像的语义分割结果,其中,所述语义分割结果用于表征所述遥感图像中每个像素所属对象的类型;
驱动所述VR设备或所述AR设备渲染展示所述语义分割结果。
12.一种图像识别方法,其特征在于,包括:
通过调用第一接口获取遥感图像,其中,所述第一接口包括第一参数,所述第一参数的参数值为所述遥感图像;
对所述遥感图像进行特征提取,得到所述遥感图像的图像特征;
对所述图像特征进行特征处理,得到所述遥感图像的目标特征,其中,所述特征处理用于对所述图像特征进行聚类以得到局部特征,并基于所述图像特征和所述局部特征进行恢复以得到所述目标特征;
利用所述目标特征对所述遥感图像进行语义分割,得到所述遥感图像的语义分割结果,其中,所述语义分割结果用于表征所述遥感图像中每个像素所属对象的类型;
通过调用第二接口输出所述语义分割结果,其中,所述第二接口包括第二参数,所述第二参数的参数值为所述语义分割结果。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至12中任意一项所述的图像识别方法。
14.一种电子设备,其特征在于,包括:
处理器;
存储器,与所述处理器相连接,用于为所述处理器提供处理权利要求1至12中任意一项所述的图像识别方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211290054.7A CN115359261B (zh) | 2022-10-21 | 2022-10-21 | 图像识别方法、计算机可读存储介质以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211290054.7A CN115359261B (zh) | 2022-10-21 | 2022-10-21 | 图像识别方法、计算机可读存储介质以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115359261A true CN115359261A (zh) | 2022-11-18 |
CN115359261B CN115359261B (zh) | 2023-03-24 |
Family
ID=84008820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211290054.7A Active CN115359261B (zh) | 2022-10-21 | 2022-10-21 | 图像识别方法、计算机可读存储介质以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115359261B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116012586A (zh) * | 2023-01-06 | 2023-04-25 | 阿里巴巴(中国)有限公司 | 图像处理方法、存储介质及计算机终端 |
CN116051549A (zh) * | 2023-03-29 | 2023-05-02 | 山东建筑大学 | 一种太阳能电池片缺陷分割方法、系统、介质及设备 |
CN116206331A (zh) * | 2023-01-29 | 2023-06-02 | 阿里巴巴(中国)有限公司 | 图像处理方法、计算机可读存储介质以及计算机设备 |
CN116229277A (zh) * | 2023-05-08 | 2023-06-06 | 中国海洋大学 | 基于语义相关性的强抗干扰海洋遥感图像语义分割方法 |
CN116778330A (zh) * | 2023-06-21 | 2023-09-19 | 阿里巴巴达摩院(杭州)科技有限公司 | 遥感目标提取方法、电子设备以及计算机可读存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980754A1 (en) * | 2014-07-28 | 2016-02-03 | Thomson Licensing | Method and apparatus for generating temporally consistent superpixels |
CN107886491A (zh) * | 2017-11-27 | 2018-04-06 | 深圳市唯特视科技有限公司 | 一种基于像素最近邻的图像合成方法 |
CN110163294A (zh) * | 2019-05-29 | 2019-08-23 | 广东工业大学 | 基于降维操作和卷积网络的遥感图像变化区域检测方法 |
CN111696123A (zh) * | 2020-06-15 | 2020-09-22 | 荆门汇易佳信息科技有限公司 | 超像素分类识别的遥感图像水域分割提取方法 |
CN112053358A (zh) * | 2020-09-28 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 图像中像素的实例类别确定方法、装置、设备及存储介质 |
CN112580654A (zh) * | 2020-12-25 | 2021-03-30 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 遥感图像地物语义分割方法 |
CN113239954A (zh) * | 2021-04-01 | 2021-08-10 | 河海大学 | 基于注意力机制的图像语义分割特征融合方法 |
CN113449594A (zh) * | 2021-05-25 | 2021-09-28 | 湖南省国土资源规划院 | 一种多层网络组合的遥感影像地类语义分割与面积计算方法 |
CN113673530A (zh) * | 2021-08-18 | 2021-11-19 | 中国人民解放军国防科技大学 | 遥感图像语义分割方法、装置、计算机设备和存储介质 |
CN113743300A (zh) * | 2021-09-03 | 2021-12-03 | 中化现代农业有限公司 | 基于语义分割的高分遥感图像云检测方法和装置 |
KR102335702B1 (ko) * | 2020-11-24 | 2021-12-06 | 연세대학교 산학협력단 | 도메인 적응형 의미론적 영상 분할 장치 및 방법 |
CN113792742A (zh) * | 2021-09-17 | 2021-12-14 | 北京百度网讯科技有限公司 | 遥感图像的语义分割方法和语义分割模型的训练方法 |
CN114022785A (zh) * | 2021-11-15 | 2022-02-08 | 中国华能集团清洁能源技术研究院有限公司 | 一种遥感影像语义分割方法、系统、设备及存储介质 |
CN114299073A (zh) * | 2021-09-30 | 2022-04-08 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像分割方法、装置、存储介质以及计算机程序 |
CN114898216A (zh) * | 2022-06-14 | 2022-08-12 | 湖南省农林工业勘察设计研究总院 | 基于超像素与分水岭的遥感图像深度学习分割方法及系统 |
CN115049603A (zh) * | 2022-06-07 | 2022-09-13 | 安徽大学 | 一种基于小样本学习的肠息肉分割方法及系统 |
-
2022
- 2022-10-21 CN CN202211290054.7A patent/CN115359261B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980754A1 (en) * | 2014-07-28 | 2016-02-03 | Thomson Licensing | Method and apparatus for generating temporally consistent superpixels |
CN107886491A (zh) * | 2017-11-27 | 2018-04-06 | 深圳市唯特视科技有限公司 | 一种基于像素最近邻的图像合成方法 |
CN110163294A (zh) * | 2019-05-29 | 2019-08-23 | 广东工业大学 | 基于降维操作和卷积网络的遥感图像变化区域检测方法 |
CN111696123A (zh) * | 2020-06-15 | 2020-09-22 | 荆门汇易佳信息科技有限公司 | 超像素分类识别的遥感图像水域分割提取方法 |
CN112053358A (zh) * | 2020-09-28 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 图像中像素的实例类别确定方法、装置、设备及存储介质 |
KR102335702B1 (ko) * | 2020-11-24 | 2021-12-06 | 연세대학교 산학협력단 | 도메인 적응형 의미론적 영상 분할 장치 및 방법 |
CN112580654A (zh) * | 2020-12-25 | 2021-03-30 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 遥感图像地物语义分割方法 |
CN113239954A (zh) * | 2021-04-01 | 2021-08-10 | 河海大学 | 基于注意力机制的图像语义分割特征融合方法 |
CN113449594A (zh) * | 2021-05-25 | 2021-09-28 | 湖南省国土资源规划院 | 一种多层网络组合的遥感影像地类语义分割与面积计算方法 |
CN113673530A (zh) * | 2021-08-18 | 2021-11-19 | 中国人民解放军国防科技大学 | 遥感图像语义分割方法、装置、计算机设备和存储介质 |
CN113743300A (zh) * | 2021-09-03 | 2021-12-03 | 中化现代农业有限公司 | 基于语义分割的高分遥感图像云检测方法和装置 |
CN113792742A (zh) * | 2021-09-17 | 2021-12-14 | 北京百度网讯科技有限公司 | 遥感图像的语义分割方法和语义分割模型的训练方法 |
CN114299073A (zh) * | 2021-09-30 | 2022-04-08 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像分割方法、装置、存储介质以及计算机程序 |
CN114022785A (zh) * | 2021-11-15 | 2022-02-08 | 中国华能集团清洁能源技术研究院有限公司 | 一种遥感影像语义分割方法、系统、设备及存储介质 |
CN115049603A (zh) * | 2022-06-07 | 2022-09-13 | 安徽大学 | 一种基于小样本学习的肠息肉分割方法及系统 |
CN114898216A (zh) * | 2022-06-14 | 2022-08-12 | 湖南省农林工业勘察设计研究总院 | 基于超像素与分水岭的遥感图像深度学习分割方法及系统 |
Non-Patent Citations (4)
Title |
---|
TIANFEI ZHOU ET AL: "Rethinking Semantic Segmentation: A Prototype View", 《2022 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
WEITAO LI ET AL: "Unsupervised Domain Adaptation for Remote Sensing Semantic Segmentation with Transformer", 《REMOTE SENSING》 * |
昌宏哲 等: "基于ED-DNN 的农村公路遥感图像信息提取方法", 《勘察科学技术》 * |
滕文秀 等: "基于深度迁移学习的无人机高分影像树种分类与制图", 《激光与光电子学进展》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116012586A (zh) * | 2023-01-06 | 2023-04-25 | 阿里巴巴(中国)有限公司 | 图像处理方法、存储介质及计算机终端 |
WO2024146649A1 (zh) * | 2023-01-06 | 2024-07-11 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像处理方法、存储介质及计算机终端 |
CN116206331A (zh) * | 2023-01-29 | 2023-06-02 | 阿里巴巴(中国)有限公司 | 图像处理方法、计算机可读存储介质以及计算机设备 |
CN116206331B (zh) * | 2023-01-29 | 2024-05-31 | 阿里巴巴(中国)有限公司 | 图像处理方法、计算机可读存储介质以及计算机设备 |
CN116051549A (zh) * | 2023-03-29 | 2023-05-02 | 山东建筑大学 | 一种太阳能电池片缺陷分割方法、系统、介质及设备 |
CN116051549B (zh) * | 2023-03-29 | 2023-12-12 | 山东建筑大学 | 一种太阳能电池片缺陷分割方法、系统、介质及设备 |
CN116229277A (zh) * | 2023-05-08 | 2023-06-06 | 中国海洋大学 | 基于语义相关性的强抗干扰海洋遥感图像语义分割方法 |
CN116229277B (zh) * | 2023-05-08 | 2023-08-08 | 中国海洋大学 | 基于语义相关性的强抗干扰海洋遥感图像语义分割方法 |
CN116778330A (zh) * | 2023-06-21 | 2023-09-19 | 阿里巴巴达摩院(杭州)科技有限公司 | 遥感目标提取方法、电子设备以及计算机可读存储介质 |
CN116778330B (zh) * | 2023-06-21 | 2024-09-10 | 阿里巴巴达摩院(杭州)科技有限公司 | 遥感目标提取方法、电子设备以及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115359261B (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115359261B (zh) | 图像识别方法、计算机可读存储介质以及电子设备 | |
JP2022518322A (ja) | ソフトクロスエントロピー損失を用いたセマンティックセグメンテーション | |
CN108062780A (zh) | 图像压缩方法和装置 | |
AU2022215283B2 (en) | A method of training a machine learning algorithm to identify objects or activities in video surveillance data | |
CN112037142B (zh) | 一种图像去噪方法、装置、计算机及可读存储介质 | |
CN111901604A (zh) | 视频压缩、重构方法及对应装置、摄像头及视频处理设备 | |
CN115205150A (zh) | 图像的去模糊方法、装置、设备、介质及计算机程序产品 | |
WO2022216521A1 (en) | Dual-flattening transformer through decomposed row and column queries for semantic segmentation | |
CN114549369A (zh) | 数据修复方法、装置、计算机及可读存储介质 | |
CN111738972B (zh) | 建筑检测系统、方法和装置 | |
CN116206331B (zh) | 图像处理方法、计算机可读存储介质以及计算机设备 | |
CN114639076A (zh) | 目标对象检测方法、装置、存储介质以及电子装置 | |
CN116071551A (zh) | 图像处理方法、计算机可读存储介质及电子设备 | |
CN114119428B (zh) | 一种图像去模糊方法和装置 | |
CN113569824B (zh) | 模型处理方法、相关设备、存储介质及计算机程序产品 | |
CN114745516A (zh) | 全景视频的生成方法、装置、存储介质及电子设备 | |
CN116883770A (zh) | 深度估计模型的训练方法、装置、电子设备及存储介质 | |
CN114299105A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN112749660A (zh) | 一种视频内容描述信息的生成方法和设备 | |
CN116188698B (zh) | 对象的处理方法和电子设备 | |
CN116543105B (zh) | 三维物体的处理方法、系统、电子设备及存储介质 | |
CN116484967A (zh) | 图像识别模型的训练方法、图像识别方法以及电子设备 | |
CN116189061A (zh) | 行为识别方法、电子设备及存储介质 | |
CN118469801A (zh) | 图像处理方法、计算机可读存储介质以及计算机终端 | |
CN116895092A (zh) | 人脸识别方法、计算机可读存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |