CN113591804B

CN113591804B - 图像特征提取方法、计算机可读存储介质以及计算机终端

Info

Publication number: CN113591804B
Application number: CN202111132655.0A
Authority: CN
Inventors: 周强; 于超辉; 王志斌; 李�昊
Original assignee: Alibaba Damo Institute Hangzhou Technology Co Ltd
Current assignee: Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority date: 2021-09-27
Filing date: 2021-09-27
Publication date: 2022-02-22
Anticipated expiration: 2041-09-27
Also published as: CN113591804A

Abstract

本申请公开了一种图像特征提取方法、计算机可读存储介质以及计算机终端。其中，该方法包括：获取目标图像；利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。本申请解决了相关技术中对于存在角度多变的目标对应的目标图像进行特征提取的精确度较低的技术问题。

Description

图像特征提取方法、计算机可读存储介质以及计算机终端

技术领域

本申请涉及图像特征提取领域，具体而言，涉及一种图像特征提取方法、计算机可读存储介质以及计算机终端。

背景技术

在遥感图像处理中，由于遥感图像中没有固定的参考角度，通常目标的角度会存在多变的情况。目前的特征提取模型对于存在角度多变的目标对象的目标图像进行特征提取时，难以对得到的目标特征进行旋转等变，从而导致提取到特征精度较低。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种图像特征提取方法、计算机可读存储介质以及计算机终端，以至少解决相关技术中对于存在角度多变的目标对应的目标图像进行特征提取的精确度较低的技术问题。

根据本申请实施例的一个方面，提供了一种图像特征提取方法，包括：获取目标图像；利用特征提取模型对所述目标图像进行特征提取，得到所述目标图像的目标特征，其中，所述目标特征与所述目标图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

根据本申请实施例的另一个方面，提供了一种图像特征提取方法，包括：获取建筑物图像；利用特征提取模型对所述建筑物图像进行特征提取，得到所述建筑物图像的建筑物特征，其中，所述建筑物特征与所述建筑物图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

根据本申请实施例的另一个方面，提供了一种图像特征提取方法，包括：获取地块图像；利用特征提取模型对所述地块图像进行特征提取，得到所述地块图像的地块特征，其中，所述地块特征与所述地块图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

根据本申请实施例的另一个方面，提供了一种图像特征提取方法，包括：云服务器接收客户端上传的目标图像；所述云服务器利用特征提取模型对所述目标图像进行特征提取，得到所述目标图像的目标特征，其中，所述目标特征与所述目标图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；所述云服务器将所述目标特征反馈至所述客户端。

根据本申请实施例的另一个方面，提供了一种图像特征提取方法，包括：获取目标图像；利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；基于目标特征对目标图像中包含的目标进行检测，得到目标的检测结果。

根据本申请实施例的另一个方面，提供了另一种图像特征提取装置，包括：第一获取模块，用于获取目标图像；第一提取模块，用于利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

根据本申请实施例的另一个方面，提供了另一种图像特征提取装置，包括：第三获取模块，用于获取建筑物图像；第二提取模块，用于利用特征提取模型对建筑物图像进行特征提取，得到建筑物图像的建筑物特征，其中，建筑物特征与建筑物图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

根据本申请实施例的另一个方面，提供了另一种图像特征提取装置，包括：第五获取模块，用于获取地块图像；第三提取模块，用于利用特征提取模型对地块图像进行特征提取，得到地块图像的地块特征，其中，地块特征与地块图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

根据本申请实施例的另一个方面，提供了另一种图像特征提取装置，包括：接收模块，用于接收客户端上传的目标图像；第四提取模块，用于利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；反馈模块用于将目标特征反馈至客户端。

根据本申请实施例的另一个方面，提供了一种图像特征提取装置，包括：第六获取模块，用于获取目标图像；第五提取模块，用于利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；检测模块，用于基于目标特征对目标图像中包含的目标进行检测，得到目标的检测结果。

根据本申请实施例的另一个方面，还提供了一种计算机可读存储介质，计算机可读存储介质包括存储的程序，其中，在程序运行时控制计算机可读存储介质所在设备执行上述任意一个实施例中的图像特征提取方法。

根据本申请实施例的另一个方面，还提供了一种计算机终端，包括：处理器和存储器，处理器用于运行存储器中存储的程序，其中，程序运行时执行上述任意一个实施例中的图像特征提取方法。

在本申请实施例中，首先获取目标图像，然后利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，实现针对存在角度多变的目标对应的目标图像进行特征提取的目的。容易注意到的是，由于特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，每个特征融合层包括：旋转等变子层和多个融合子层，而且特征旋转等变层采用旋转等变算法对输入图像进行处理，旋转等变子层采用旋转等变算法对输入特征进行处理，因此，特征提取模型在对目标图像进行特征提取的时候，考虑了目标图像中目标的角度，通过旋转等边卷积可以得到目标图像中目标的特征对应的角度，并基于该角度对目标的特征进行处理，使得到的目标特征与目标图像具备旋转等变性，达到了提高特征提取精度的技术效果，进而解决了相关技术中对于存在角度多变的目标对应的目标图像进行特征提取的精确度较低的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种用于实现图像特征提取方法的计算机终端（或移动设备）的硬件结构框图；

图2是根据本申请实施例1的一种图像特征提取方法的流程图；

图3是根据本申请实施例的一种交互界面的示意图；

图4是根据本申请实施例的一种特征提取模型的示意图；

图5是根据本申请实施例的一种多个融合分支的示意图；

图6是根据本申请实施例的一种利用标记框对停机场中的飞机进行标记的示意图；

图7是根据本申请实施例的一种利用标记框对运输图像中的集装箱进行标记的示意图；

图8是根据本申请实施例的另一种特征提取方法的流程图；

图9是根据本申请实施例2的一种图像特征提取方法的流程图；

图10是根据本申请实施例3的一种图像特征提取方法的流程图；

图11是根据本申请实施例4的一种图像特征提取方法的流程图；

图12是根据本申请实施例5的一种图像特征提取装置的示意图；

图13是根据本申请实施例6的一种图像特征提取装置的示意图；

图14是根据本申请实施例7的一种图像特征提取装置的示意图；

图15是根据本申请实施例8的一种图像特征提取装置的示意图；

图16是根据本申请实施例9的一种图像特征提取方法的流程图；

图17是根据本申请实施例10的一种图像特征提取装置的示意图；

图18是根据本申请实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释：

旋转等变：可以是指输入影响X发生角度变化后g(X)，对应的深度特征f(X）也相应发生角度的变化，即f(g(X))=g(f(X))。

Swin-Transformer（视觉骨干网络）：可以利用注意力机制实现并行化捕捉序列依赖，并且同时处理序列的每个位置的指令，从而在减少训练时间的同时保持性能良好。

目前的Swin-Transformer中的卷积层不具有旋转等变性，因此，利用Swin-Transformer对目标图像进行特征提取，得到的目标特征与目标图像不具有旋转等变性。目前还通过旋转等变检测器（ReDet）利用旋转等变算子重写视觉骨干网络中的残差网络（RestNet-50），并利用图像数据集（ImageNet）对重写后的视觉骨干网络进行训练，使得主干网络在一定程度上学到具有旋转不变形的特征，然而，RestNet-50指示对传统的网络进行了修改，无法直接应用于性能更强大的Transformer网络。

为了解决上述问题，本申请提供了一种图像分割方案，通过将卷积层替换为旋转等变算法，可以使得目标图像与目标特征具有旋转等变性，从而提高特征提取模型的精确度。

实施例1

根据本申请实施例，还提供了一种图像特征提取方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现图像特征提取方法的计算机终端（或移动设备）的硬件结构框图。如图1所示，计算机终端10（或移动设备）可以包括一个或多个（图中采用102a、102b，……，102n来示出）处理器102（处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置）、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外，还可以包括：显示器、输入/输出接口（I/O接口）、通用串行总线（USB）端口（可以作为BUS总线的端口中的一个端口被包括）、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算机终端10（或移动设备）中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制（例如与接口连接的可变电阻终端路径的选择）。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的图像特征提取方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的图像特征提取方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器（Network Interface Controller，NIC），其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频（Radio Frequency，RF）模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器（LCD），该液晶显示器可使得用户能够与计算机终端10（或移动设备）的用户界面进行交互。

图1示出的硬件结构框图，不仅可以作为上述计算机终端10（或移动设备）的示例性框图，还可以作为上述服务器的示例性框图，一种可选实施例中，一种可选实施例中，上述计算机终端10（或移动设备）可以是本地部署的服务器或云端服务器，经由数据网络连接或电子连接到一个或多个客户端。数据网络连接可以是局域网连接、广域网连接、因特网连接，或其他类型的数据网络连接。

在上述运行环境下，本申请提供了如图2所示的图像特征提取方法。图2是根据本申请实施例1的一种图像特征提取方法的流程图。如图2所示，该方法可以包括如下步骤：

步骤S202，获取目标图像。

上述步骤中的目标图像可以是包含有一个或多个目标的目标图像。可选的，目标图像可以为遥感图像，也可以是无人机拍摄的航拍图像，还可以是雷达图像，但不仅限于此。在不同应用场景中，该目标图像中包含的目标的类型不同，例如，在城市规划应用场景中，目标图像包含的目标可以是路网、地块、建筑物等；在农林业应用场景中，目标图像包含的目标可以为地块、大棚等；在交通运输场景中，目标图像包含的目标可以为货车、飞机、货物等；在气象应用场景中，目标图像包含的目标可以是云层；在水利应用场景中，目标图像包含的目标可以是地块、大棚等；在灾害应用场景中，目标图像包含的目标可以是山体、堤坝等。

在一种可选的实施例中，目标图像可以由卫星或无人机拍摄，并通过网络传输给服务器，由服务器处理，同时可以将目标图像展示给用户，如图3所示，目标图像可以显示在图像采集区域内；在另一种可选的实施例中，目标图像可以由卫星或无人机拍摄，并由用户主动上传至服务器，由服务器处理，如图3所示，用户可以通过点击交互界面中的“上传图像”按钮，或将目标图像直接拖入虚线框的方式完成目标图像上传服务器的目的，而且，用户上传的图像可以显示在图像采集区域内。此处的服务器可以是部署在本地的服务器，也可以是部署在云端的服务器。

步骤S204，利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征。

其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

上述的旋转等变性是指输入的目标图像的角度发生变化之后，对应的输出的目标特征的角度也相应发生变化。若目标特征与目标图像具有旋转等变性，则可以在特征中保持目标图像中目标的角度，在后续的任务中，由于目标特征中保留了目标图像中目标的角度，因此，在后续在利用目标特征对目标图像处理时，相对于不具备旋转等变性的特征，其可以结合目标特征中的角度来对目标图像进行处理，进而其处理的结果的精确度也更高。

可选的，特征旋转等变层采用旋转等变算法对输入图像进行处理，旋转等变子层采用旋转等变算法对输入特征进行处理。

在一种可选的实施例中，特征提取模型的特征旋转等变层可以先提取目标图像的多个群特征，然后将多个群特征输入到第一个特征融合层的旋转等变子层中，利用旋转等变子层对多个群特征进行下采样处理，然后利用多个融合子层提取进行下采样处理后的多个群特征的注意力特征，然后将得到的多个群特征的注意力特征继续输入到下一个特征融合层的旋转等变子层中进行相同处理，直至最后一个特征融合层输出最终的目标特征。

进一步地，每个融合子层可以包括：并行连接的多个融合分支，多个融合分支的结构相同，每个融合分支采用注意力机制对输入特征进行融合处理。

上述的特征提取模型可以为视觉骨干网络（ESwin Transformer），具体可以包括：依次连接的旋转等变卷积层和多个下采样层，多个下采样层的输出结果的分辨率不同，每个下采样层包括：依次连接的旋转等变卷积层和多个注意力子层，每个注意力子层包括：多个注意力分支。在一种可选的实施例中，可以将通用的视觉骨干网络（Swin Transformer）中的卷积层更改为旋转等变算法层，并且在视觉骨干块中构建多个分支，每个分支均可以采用通用的结构，从而构建出特征提取模型。

在一种可选的实施例中，服务器在对目标图像进行特征提取，得到目标图像的目标特征之后，可以直接展示给用户查看；在另一种可选的实施例中，服务器在对目标图像进行特征提取，得到目标特征之后，可以通过网络将目标特征反馈至用户的客户端，由客户端展示给用户查看。进一步地，目标特征展示给用户之后，可以通过用户反馈来验证目标特征是否正确，如果用户认为目标特征不正确，则可以反馈正确的目标特征，并将其上传至服务器，从而服务器可以根据用户反馈对特征提取模型进行再次训练，达到提升服务器性能的效果。

例如，以城市规划应用场景中的建筑物为例进行说明，卫星、无人机或雷达采集到建筑物图像之后，可以将建筑物图像直接发送至服务器进行特征提取，也可以传输给客户端，由用户进行选择，并上传需要进行特征提取的建筑物图像至服务器。服务器在获取到建筑物图像之后，可以采用由旋转等变算法构建的特征提取模型对建筑物图像进行特征提取，得到与建筑物图像具有旋转等变性的建筑物特征。在得到建筑物特征之后，服务器可以直接将建筑物特征展示给用户查看，或者，服务器将建筑物特征下发至客户端，由客户端展示给用户查看，从而用户可以看到建筑物特征，并且可以通过用户的反馈结果对特征提取模型进行优化，提升服务器的性能。

又例如，以农业场景中的地块分割为例进行说明，卫星、无人机或雷达采集到建筑物图像之后，可以将地块图像直接发送至服务器进行特征提取，也可以传输给客户端，由用户进行选择，并上传需要进行特征提取的地块图像至服务器。服务器在获取到地块图像之后，可以采用由旋转等变算法构建的特征提取模型对地块图像进行特征提取，得到与地块图像具有旋转等变性的地块特征。在得到地块特征之后，服务器可以直接将地块特征展示给用户查看，或者，服务器将地块特征下发至客户端，由客户端展示给用户查看，从而用户可以看到地块特征，并且可以通过用户的反馈结果对特征提取模型进行优化，提升服务器的性能。

又例如，以交通运输场景中的交通工具为例进行说明，卫星、无人机或雷达采集到交通工具图像之后，可以将交通工具图像直接发送至服务器进行特征提取，也可以传输给客户端，由用户进行选择，并上传需要进行特征提取的交通工具图像至服务器。服务器在获取到交通工具图像之后，可以采用由旋转等变算法构建的特征提取模型对交通工具图像进行特征提取，得到与交通工具图像具有旋转等变性的交通工具特征。在得到交通工具特征之后，服务器可以直接将交通工具特征展示给用户查看，或者，服务器将交通工具特征下发至客户端，由客户端展示给用户查看，从而用户可以看到交通工具特征，并且可以通过用户的反馈结果对特征提取模型进行优化，提升服务器的性能。

在一种可选的实施例中，可以获取在交互界面中选中的飞机检测任务，基于飞机检测任务对飞机图像中的飞机特征进行处理，得到飞机检测任务对应的处理结果，在交互界面上展示处理结果。具体的，在利用卫星、无人机或雷达采集到飞机图像之后，可以将飞机图像直接发送到服务器进行特征提取，得到飞机特征，在对飞机图像进行特征提取之后，服务器可以根据飞机特征对飞机图像中的飞机进行检测，并将检测结果展示给用户查看，或者，服务器将检测结果下发至客户端，由客户端展示给用户查看，从而用户可以看到检测结果，并且可以通过用户的反馈结果对检测的过程进行优化，提高服务器的性能。

在一种可选的实施例中，可以获取在交互界面中选中的船舶检测任务，基于船舶检测任务对船舶图像中的船舶特征进行处理，得到船舶检测任务对应的处理结果，在交互界面上展示处理结果。具体的，在利用卫星、无人机或雷达采集到船舶图像之后，可以将船舶图像直接发送到服务器进行特征提取，得到船舶特征，在对船舶图像进行特征提取之后，服务器可以根据船舶特征对船舶图像中的船舶进行检测，并将检测结果展示给用户查看，或者，服务器将检测结果下发至客户端，由客户端展示给用户查看，从而用户可以看到检测结果，并且可以通过用户的反馈结果对检测的过程进行优化，提高服务器的性能。

通过本申请上述实施例提供的方案，首先获取目标图像，然后利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，实现针对存在角度多变的目标对应的目标图像进行特征提取的目的。容易注意到的是，由于特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，每个特征融合层包括：旋转等变子层和多个融合子层，而且特征旋转等变层采用旋转等变算法对输入图像进行处理，旋转等变子层采用旋转等变算法对输入特征进行处理，因此，特征提取模型在对目标图像进行特征提取的时候，考虑了目标图像中目标的角度，通过旋转等边卷积可以得到目标图像中目标的特征对应的角度，并基于该角度对目标的特征进行处理，使得到的目标特征与目标图像具备旋转等变性，达到了提高特征提取精度的技术效果，进而解决了相关技术中对于存在角度多变的目标对应的目标图像进行特征提取的精确度较低的技术问题。

本申请上述实施例中，利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征包括：利用特征旋转等变层对目标图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；利用至少一个特征融合层对多个群特征进行特征融合处理，得到目标特征。

上述的特征融合层也称为池化层，可以压缩输入的群特征的特征图像，通过压缩特征图像可以减少特征图像的分辨率，进而简化了卷积网络计算时的复杂度。

上述的多个特征融合层的输出结果的分辨率可以依次降低。

在一种可选的实施例中，可以利用旋转等变算法对目标图像按照旋转角度进行特征提取，从而得到具有不同的旋转角度的群特征，利用多个特征融合层可以对多个群特征进行下采样处理，实现对多个群特征的压缩，从而得到与目标图像具有旋转等变性的目标特征。可选的，可以在一个特征融合层对多个群特征处理完之后，将处理后的多个群特征输入到与该特征融合层相邻的特征融合层中，利用相邻的特征融合层对处理后的多个群特征继续进行处理，直至串联的最后一个特征融合层处理完毕，得到目标特征。

如图4所示为多个下采样层的示意图，可以利用旋转等变卷积层（ConvEmbedding）对目标图像（Images）进行处理，得到多个群特征，然后将得到的多个群特征输入到下采样层1（stage1），其中，下采样层1由旋转等变卷积层和两个注意力子层组成，下采样层2（stage2）由融合卷积层（Conv merging）和两个注意力子层（ESwin TransformerBlock）组成，下采样层3（stage3）由融合卷积层（Conv merging）和两个注意力子层组成，下采样层4（stage4）由融合卷积层（Conv merging）和两个注意力子层组成，利用多个下采样层对多个群特征进行处理后可以得到目标特征，在得到目标特征之后，可以根据目标特征对目标图像进行分类，还可以根据目标特征对目标图像进行检测，还可以根据目标特征对目标图像进行分割。

本申请上述实施例中，利用至少一个特征融合层中的目标特征融合层对输入至目标特征融合层的多个第一特征进行特征融合处理包括：利用旋转等变子层对多个第一特征进行下采样处理，得到多个第二特征；利用多个融合子层对多个第二特征进行处理，得到融合后的特征。

上述的目标特征融合层可以为多个特征融合层中的待处理特征的特征融合层。上述的多个第一特征可以为输入至目标特征融合层的群特征。

上述的注意力层可以关注于多个第一特征中重要的特征，而忽略于不相关的特征，通过注意力层可以筛选出重要程度较高的特征，也即融合后的特征。上述的多个注意力子层输出的特征数量可以依次减少。

在一种可选的实施例中，目标特征融合层可以为至少一个特征融合层中的第一个特征融合层，多个第一特征可以为上述的多个群特征，利用第一个特征融合层中的旋转等变子层对多个群特征进行下采样处理，得到多个第二特征，其中，多个第二特征可以为第一个特征融合层对多个群特征进行处理之后得到的特征，为了保证特征的旋转等变性，在计算局部注意力时，可以按照旋转角度分别对每个第二特征计算注意力，从而得到多个第二特征的注意力特征，进而得到融合后的特征。

进一步地，目标特征融合层还可以为至少一个特征融合层中的第二个特征融合层，第二个特征融合层与第一个特征融合层相邻，多个第一特征可以为第一个特征融合层输出的多个群特征的注意力特征，利用第二个特征融合层中的旋转等变子层对多个第一特征进行下采样处理，得到多个第二特征，其中，多个第二特征可以为第二个特征融合层对多个群特征的注意力特征进行处理之后得到的特征，为了保证特征的旋转等变性，在计算局部注意力时，可以按照旋转角度分别对每个第二特征计算注意力，从而得到多个第二特征的注意力特征，进而得到融合后的特征。

需要说明的是，上述的目标特征融合层可以为至少一个特征融合层中的任意一个特征融合层，此处不做任何限定。

本申请上述实施例中，利用多个融合子层中的目标融合子层对输入至目标融合子层的多个第三特征进行处理包括：利用多个融合分支分别对多个第三特征进行处理，得到每个第三特征的局部注意力特征，其中，多个融合分支与多个第三特征一一对应。

在一种可选的实施例中，目标融合子层可以为多个融合子层中的第一个融合子层，多个第三特征可以为经过下采样处理之后的群特征，利用第一个融合子层中的多个融合分支采用注意力机制分别对具有不同旋转角度的多个群特征进行处理，得到每个群特征的局部注意力特征。

进一步地，目标融合子层还可以为多个融合子层中的第二个融合子层，多个第三特征可以为经过第一个融合子层进行处理之后的局部注意力特征，利用第二个融合子层中的多个融合分支采用注意力机制分别对具有不同旋转角度的多个第三特征进行处理，得到每个第三特征的局部注意力特征。

需要说明的是，上述的目标融合子层可以为多个融合子层中的任意一个融合子层，此处不做任何限定。

如图5所示为多个融合分支的示意图，多个融合分支可以为

…

，其中，可以将多个第三特征输入到对应的融合分支中，先将每个第三特征输入到归一化层（LayerNorm，简称LN）中进行归一化，将归一化结果输入到窗口自注意力（SwinWindowMulti-head Seif Attention，简称SW-MSA）中，得到输出结果，可以将输出结果再输入到LN中进行归一化，并将归一化的结果输入至多层感知机（Multilayer Perceptron，简称MLP）中，得到第三特征的局部注意力特征。

本申请上述实施例中，该方法还包括：获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：目标检测任务、目标分割任务、目标识别任务和目标分类任务；基于目标任务对目标特征进行处理，得到目标任务对应的处理结果；在交互界面上展示处理结果。

在一种可选的实施例中，用户可以在当前界面中选择当前需要执行的目标任务，在选择完目标任务之后，可以根据选择的目标任务对目标特征进行处理，得到目标任务对应的处理结果，之后可以在交互界面上展示处理结果。进一步地，在用户选择完目标任务之后，可以弹出提示框，提醒用户执行该任务前需要先进行特征提取，并显示可以选择的特征提取方法，其中，特征提取方法可以包括：采用利用旋转等变算法构建的特征提取模型进行特征提取，采用利用普通卷积构建的特征提取模型进行特征提取，在特征提取结束之后，可以提醒用户，特征已提取完毕，请确认执行其他后续任务。

可选地，基于目标检测任务对目标特征进行处理，得到目标检测任务对应的处理结果；在交互界面上展示处理结果。

在一种可选的实施例中，可以基于目标特征对目标图像中的目标进行检测，得到目标的检测结果，在得到目标检测结果之后，可以在交互界面上展示目标的检测结果。其中，可以利用现有的检测模型对目标进行检测。

可选地，基于目标识别任务对目标特征进行处理，得到目标识别任务对应的处理结果；在交互界面上展示处理结果。

在一种可选的实施例中，可以基于目标特征对目标图像中的目标进行识别，得到目标的识别结果；在得到目标的识别结果之后，可以在交互界面上展示目标的识别结果。其中，可以利用现有的识别模型对目标进行检测。

可选地，基于目标分类任务对目标特征进行处理，得到目标分类任务对应的处理结果；在交互界面上展示处理结果。

在一种可选的实施例中，可以基于目标特征对目标图像中的目标进行分类，得到目标的分类结果，在得到目标的分类结果之后，可以在交互界面上展示目标的分类结果。其中，可以利用现有的分类模型对目标进行检测。

可选地，基于目标分割任务对目标特征进行处理，得到目标分割任务对应的处理结果；在交互界面上展示处理结果。

在一种可选的实施例中，用户可以对交互界面上展示的处理结果进行修改、拖拽、着色等操作。

在另一种可选的实施例中，可以基于目标特征，确定目标图像包含的目标的位置信息；基于目标的位置信息对目标进行分割，得到目标的分割结果；在交互界面上展示目标的分割结果。

在另一种可选的实施例中，在得到目标特征之后，可以根据目标特征来确定出目标图像中目标的位置信息，并基于目标的位置信息对目标进行分割，得到目标的分割结果，例如，可以利用现有的分割模型对目标进行分割。

例如，以城市规划应用场景中的建筑物分割为例进行说明，卫星、无人机或雷达采集到建筑物图像之后，可以利用特征提取模型提取建筑物图像中建筑物的特征，根据建筑物的特征确定建筑物图像包含的建筑物的位置信息，并基于建筑物的位置信息对建筑物图像中的建筑物进行分割，得到建筑物的分割结果，分割结果中包含有建筑物图像中至少一个建筑物的图像。

又例如，以农业场景中的地块分割为例进行说明，卫星、无人机或雷达采集到地块图像之后，可以利用特征提取模型提取地块图像中的地块的特征，根据地块的特征确定地块图像包含的地块的位置信息，并基于地块的位置信息对地块图像中的地块进行分割，得到地块的分割结果，分割结果中包含有地块图像中至少一个地块的图像。

又例如，以交通运输场景中的交通工具分割为例进行说明，卫星、无人机或雷达采集到运输图像之后，可以利用特征提取模型提取运输图像中的交通工具的特征，根据交通工具的特征确定运输图像包含的交通工具的位置信息，并基于交通工具的位置信息对运输图像中的交通工具进行分割，得到交通工具的分割结果，分割结果中包含有运输图像中至少一个交通工具的图像。

在另一种可选的实施例中，在得到目标特征之后，可以根据目标特征来确定出目标图像中目标的位置信息，并根据目标的位置信息对目标进行标记，得到目标的标记结果。可选的，可以通过预设的标记框对目标进行标记。可选的，可以通过色块对目标图像中目标所在的区域进行标记。

例如，以城市规划应用场景中的建筑物标记为例进行说明，卫星、无人机或雷达采集到建筑物图像之后，可以利用特征提取模型提取建筑物图像中建筑物的特征，根据建筑物的特征确定建筑物图像包含的建筑物的位置信息，并基于建筑物的位置信息利用预设的标记框或者色块对建筑物图像中的建筑物进行标记。

又例如，以农业场景中的地块标记为例进行说明，卫星、无人机或雷达采集到地块图像之后，可以利用特征提取模型提取地块图像中的地块的特征，根据地块的特征确定地块图像包含的地块的位置信息，并基于地块的位置信息利用预设的标记框或者色块对地块图像中的地块进行标记。

又例如，以交通运输场景中的交通工具标记为例进行说明，卫星、无人机或雷达采集到运输图像之后，可以利用特征提取模型提取运输图像中的交通工具的特征，根据交通工具的特征确定运输图像包含的交通工具的位置信息，并基于交通工具的位置信息利用预设的标记框或者色块对运输图像中的交通工具进行标记。如图6所示为利用标记框对停机场中的飞机进行标记的示意图，如图7所示为利用标记框对运输图像中的集装箱进行标记的示意图。

本申请上述实施例中，在交互界面上展示处理结果之后，该方法还包括：获取处理结果对应的反馈结果，其中，反馈结果通过对处理结果进行修改得到；基于反馈结果对特征提取模型进行训练。

上述的交互界面可以为如图3所示的界面，用户可以通过该界面查看处理结果对应的反馈结果，并且可以在界面上对上述结果进行调整，并反馈给服务器。

为了确保处理结果的准确度，在一种可选的实施例中，服务器可以直接将处理结果展示给用户查看，也即，将处理结果展示在交互界面上，在另一种可选的实施例中，服务器可以通过网络将处理结果下发给客户端，由客户端展示给用户查看，也即，将处理结果展示在交互界面上。进一步地，处理结果可以由用户进行确认，如果确认无误，则可以直接基于该处理结果来对目标图像中的目标进行分割，如果用户确认有误，则用户可以在交互界面上对处理结果进行调整，得到相应的调整结果，并将调整结果反馈给服务器，服务器可以根据调整结果对目标特征进行处理，而且，可以根据调整结果对特征提取模型进行优化，提升服务器的性能。

下面结合图8对本申请一种优选的实施例进行详细说明，该方法可以由计算机终端或服务器执行。如图8所示，该方法包括如下步骤：

步骤S801，获取遥感图像。

步骤S802，对遥感图像进行切分，得到大小合适的目标图像。

上述目标图像的大小可以为1024×1024。

步骤S803，利用ESwin-Transforme对目标图像进行特征提取，得到目标图像的目标特征。

可选的，可以利用旋转等变卷积层对目标图像提取群特征，然后利用注意力层提取注意力特征，并计算得到注意力特征中的区域注意力（local attention）。在提取多个旋转角度的特征时，可以使用融合卷积层进行下采样处理。

步骤S804，基于目标特征对目标图像中的目标进行分割处理，得到分割结果。

可选的，可以基于目标特征对目标图像中的目标进行检测，例如，可以对运输图像中的船舶、飞机、车辆等进行检测；还可以基于目标特征对目标图像中的目标进行分割，例如，可以对运输图像中的船舶、飞机、车辆等进行分割。

实施例2

根据本申请实施例，还提供一种图像特征提取方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图9是根据本申请实施例2的一种图像特征提取方法的流程图。如图9所示，该方法可以包括如下步骤：

步骤S902，获取建筑物图像。

步骤S904，利用特征提取模型对建筑物图像进行特征提取，得到建筑物图像的建筑物特征。

其中，建筑物特征与建筑物图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

本申请上述实施例中，该方法还包括：基于建筑物特征，确定建筑物图像包含的建筑物的位置信息；基于建筑物的位置信息对建筑物进行分割，得到建筑物的分割结果。

本申请上述实施例中，该方法还包括：获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：建筑物检测任务、建筑物分割任务、建筑物识别任务和建筑物分类任务；基于目标任务对建筑物特征进行处理，得到目标任务对应的处理结果；在交互界面上展示处理结果。

可选地，基于建筑物检测任务对建筑物特征进行处理，得到建筑物检测任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以基于建筑物特征对建筑物图像中的建筑物进行检测，得到建筑物的检测结果。其中，建筑物的检测结果可以为建筑物的施工状态，建筑物的检测结果还可以为建筑物的类别。

上述的建筑物的类别可以为建筑物的具体类型，如商业楼、高层住宅、图书馆、体育中心等。

可选地，基于建筑物识别任务对建筑物特征进行处理，得到建筑物识别任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以基于建筑物特征对建筑物图像中的建筑物进行识别，得到建筑物的识别结果。其中，建筑物的识别结果可以为建筑物的施工状态，建筑物的识别结果还可以为建筑物的类别。

可选地，基于建筑物分类任务对建筑物特征进行处理，得到建筑物分类任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以基于建筑物特征对建筑物图像中的建筑物进行分类，得到建筑物的分类结果。其中，建筑物的分类结果中可以采用不同的方式对不同施工状态的建筑物进行标记。

可选地，基于建筑物分割任务对建筑物特征进行处理，得到建筑物分割任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以根据建筑物特征确定建筑物图中建筑物的类别；基于建筑物的类别，确定建筑物对应的目标展示方式；按照目标展示方式，在交互界面上显示分割结果。

上述步骤中的目标展示方式可以是指展示地物所在区域的颜色、边界线的粗细、边界线的线形等，但不仅限于此，在本申请中以区域颜色为例进行说明。

在另一种可选的实施例中，为了方便用户更加清楚、直观地查看到地物所在区域，可以采用现有目标识别方案对目标分割结果中包含的不同地物的具体类别，进而确定相应的目标展示方式，最终按照目标展示方式展示给用户查看，目标分割结果可以展示在交互界面中。可选的，为了方便用户更加直观地确定不同地物的类别，还可以在交互界面中将地物的类别名称显示出来。

本申请上述实施例中，利用特征提取模型对建筑物图像进行特征提取，得到建筑物图像的建筑物特征包括：利用特征旋转等变层对建筑物图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；利用至少一个特征融合层对多个群特征进行特征融合处理，得到建筑物特征。

本申请上述实施例中，每个融合子层可以包括：并行连接的多个融合分支，多个融合分支的结构相同，每个融合分支采用注意力机制对输入特征进行融合处理。

本申请上述实施例中，该方法还包括：获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：目标检测任务、目标分割任务、目标识别任务和目标分类任务；基于目标任务对建筑物特征进行处理，得到目标任务对应的处理结果；在交互界面上展示处理结果。

需要说明的是，本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同，但不仅限于实施例1所提供的方案。

实施例3

图10是根据本申请实施例3的一种图像特征提取方法的流程图。如图10所示，该方法可以包括如下步骤：

步骤S1002，获取地块图像。

步骤S1004，利用特征提取模型对地块图像进行特征提取，得到地块图像的地块特征。

其中，地块特征与地块图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

可选地，基于地块检测任务对地块特征进行处理，得到地块检测任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以基于地块特征对地块图像中的地块进行检测，得到目标的检测结果。其中，地块的检测结果可以为地块的类别。

可选地，基于地块识别任务对地块特征进行处理，得到地块识别任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以基于地块特征对地块图像中的地块进行识别，得到地块的识别结果。其中，地块的识别结果可以为地块的耕作状态，地块的识别结果还可以为地块的类别。

上述的地块的类别可以为地块的高度，如平原、丘陵等。

可选地，基于地块分类任务对地块特征进行处理，得到地块分类任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以基于地块特征对地块图像中的地块进行分类，得到地块的分类结果。其中，地块的分类结果中可以采用不同的方式对不同耕作状态的地块进行标记。

可选地，基于地块分割任务对地块特征进行处理，得到地块分割任务对应的处理结果，在交互界面上展示处理结果。

在一种可选的实施例中，可以根据地块特征确定地块图中地块的类别；基于地块的类别，确定地块对应的目标展示方式；按照目标展示方式，在交互界面上显示分割结果。

本申请上述实施例中，利用特征提取模型对地块图像进行特征提取，得到地块图像的地块特征包括：利用特征旋转等变层对地块图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；利用至少一个特征融合层对多个群特征进行特征融合处理，得到地块特征。

实施例4

根据本申请实施例，还提供了一种图像特征提取方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图11是根据本申请实施例4的一种图像特征提取方法的流程图。如图11所示，该方法可以包括如下步骤：

步骤S1102，云服务器接收客户端上传的目标图像。

在一种可选的实施例中，目标图像可以由卫星或无人机拍摄，并由用户主动上传至云服务器，由云服务器处理，如图3所示，用户可以通过点击交互界面中的“上传图像”按钮，或将目标图像直接拖入虚线框的方式完成目标图像上传云服务器的目的，而且，用户上传的图像可以显示在图像采集区域内。

步骤S1104，云服务器利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征。

步骤S1106，云服务器将目标特征反馈至客户端。

在一种可选的实施例中，云服务器在对目标图像进行图像分割，得到目标分割结果之后，可以通过网络将目标分割结果反馈用户的客户端，由客户端展示给用户查看，如图3所示，目标分割结果可以显示在结果反馈区域内。进一步地，目标分割结果展示给用户之后，可以通过用户反馈来验证目标分割结果是否正确，如果用户认为目标分割结果不正确，则可以反馈正确的分割结果，用户可以在结果反馈区域内反馈正确的分割结果，并将其上传至云服务器，从而云服务器可以根据用户反馈对模型进行再次训练，达到提升云服务器性能的效果。

本申请上述实施例中，云服务器利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征包括：云服务器利用特征旋转等变层对建筑物图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；云服务器利用至少一个特征融合层对多个群特征进行特征融合处理，得到建筑物特征。

本申请上述实施例中，云服务器利用至少一个特征融合层中的目标特征融合层对输入至目标特征融合层的多个第一特征进行特征融合处理包括：云服务器利用旋转等变子层对多个第一特征进行下采样处理，得到多个第二特征；云服务器利用多个融合子层对多个第二特征进行处理，得到融合后的特征。

本申请上述实施例中，云服务器利用多个融合子层中的目标融合子层对输入至目标融合子层的多个第三特征进行处理包括：云服务器利用多个融合分支分别对多个第三特征进行处理，得到每个第三特征的局部注意力特征，其中，多个融合分支与多个第三特征一一对应。

本申请上述实施例中，该方法还包括：云服务器获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：目标检测任务、目标分割任务、目标识别任务和目标分类任务；云服务器基于目标任务对目标特征进行处理，得到目标任务对应的处理结果；云服务器在交互界面上展示处理结果。

本申请上述实施例中，在交互界面上展示处理结果之后，该方法还包括：云服务器获取处理结果对应的反馈结果，其中，反馈结果通过对处理结果进行修改得到；云服务器基于反馈结果对特征提取模型进行训练。

实施例5

根据本申请实施例，还提供了一种用于实施上述图像特征提取方法的图像特征提取装置，如图12所示，该装置1200包括：第一获取模块1202、第一提取模块1204。

其中，第一获取模块用于获取目标图像；第一提取模块用于利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

此处需要说明的是，上述第一获取模块1202、第一提取模块1204对应于实施例1的步骤S202至步骤S204，两个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

本申请上述实施例中，第一提取模块包括：第一处理单元、第二处理单元。

其中，第一处理单元用于利用特征旋转等变层对建筑物图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；第二处理单元用于利用至少一个特征融合层对多个群特征进行特征融合处理，得到建筑物特征。

本申请上述实施例中，第二处理单元还用于利用旋转等变子层对多个第一特征进行下采样处理，得到多个第二特征；利用多个融合子层对多个第二特征进行处理，得到融合后的特征。

本申请上述实施例中，第二处理单元还用于利用多个融合分支分别对多个第三特征进行处理，得到每个第三特征的局部注意力特征，其中，多个融合分支与多个第三特征一一对应。

本申请上述实施例中，该装置还包括：第二获取模块、第一处理模块、第一显示模块。

其中，第二获取模块用于获取在交互界面中选中的目标任务，其中，所述目标任务包括如下至少之一：目标检测任务、目标分割任务、目标识别任务和目标分类任务；第一处理模块用于基于所述目标任务对所述目标特征进行处理，得到所述目标任务对应的处理结果；第一显示模块用于在所述交互界面上展示所述处理结果。

实施例6

根据本申请实施例，还提供了一种用于实施上述图像特征提取方法的图像特征提取装置，如图13所示，该装置1300包括：第三获取模块1302、第二提取模块1304。

其中，第三获取模块用于获取建筑物图像；第二提取模块用于利用特征提取模型对建筑物图像进行特征提取，得到建筑物图像的建筑物特征，其中，建筑物特征与建筑物图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

此处需要说明的是，上述第三获取模块1302、第二提取模块1304对应于实施例2中的步骤S902至步骤S904，两个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例2所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

本申请上述实施例中，该装置还包括：第一确定模块、第一分割模块。

其中，第一确定模块用于基于建筑物特征，确定建筑物图像包含的建筑物的位置信息；第一分割模块用于基于建筑物的位置信息对建筑物进行分割，得到建筑物的分割结果。

本申请上述实施例中，该装置还包括：第四获取模块、第二处理模块、第二显示模块。

其中，第四获取模块用于获取在交互界面中选中的目标任务，其中，所述目标任务包括如下至少之一：建筑物检测任务、建筑物分割任务、建筑物识别任务和建筑物分类任务；第二处理模块用于基于所述目标任务对所述建筑物特征进行处理，得到所述目标任务对应的处理结果；第二显示模块用于在所述交互界面上展示所述处理结果。

实施例7

根据本申请实施例，还提供了一种用于实施上述图像特征提取方法的图像特征提取装置，如图14所示，该装置1400包括：第五获取模块1402、第三提取模块1404。

其中，第五获取模块用于获取地块图像；第三提取模块用于利用特征提取模型对地块图像进行特征提取，得到地块图像的地块特征，其中，地块特征与地块图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

此处需要说明的是，上述第五获取模块1402、第三提取模块1404对应于实施例3中的步骤S1002至步骤S1004，两个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例3所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

实施例8

根据本申请实施例，还提供了一种用于实施上述图像特征提取方法的图像特征提取装置，如图15所示，该装置1500包括：接收模块1502、第四提取模块1504、反馈模块1506。

其中，接收模块用于接收客户端上传的目标图像；第四提取模块用于利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；反馈模块用于将目标特征反馈至客户端。

此处需要说明的是，上述接收模块1502、第四提取模块1504、反馈模块1506对应于实施例4中的步骤S1102至步骤S1106，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例4所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

实施例9

图16是根据本申请实施例2的一种图像特征提取方法的流程图。如图16所示，该方法可以包括如下步骤：

步骤S1602，获取目标图像。

步骤S1604，利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征。

步骤S1606，基于目标特征对目标图像中包含的目标进行检测，得到目标的检测结果。

实施例10

根据本申请实施例，还提供了一种用于实施上述图像特征提取方法的图像特征提取装置，如图17所示，该装置1700包括：第六获取模块1702、第五提取模块1704、检测模块1706。

其中，第六获取模块用于获取目标图像；第五提取模块用于利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；检测模块用于基于目标特征对目标图像中包含的目标进行检测，得到目标的检测结果。

此处需要说明的是，上述第六获取模块1702、第五提取模块1704、检测模块1706对应于实施例9中的步骤S1602至步骤S1606，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例9所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

实施例11

本申请的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述计算机终端可以执行图像特征提取方法中以下步骤的程序代码：获取目标图像；利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

可选地，图18为根据本申请实施例的一种计算机终端的结构框图。如图18所示，该计算终端A可以包括：一个或多个（图中仅示出一个）处理器1802、以及存储器1804。

其中，存储器可用于存储软件程序以及模块，如本申请实施例中的图像特征提取方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的图像特征提取方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取目标图像；利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

可选的，上述处理器还可以执行如下步骤的程序代码：利用特征旋转等变层对地块图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；利用至少一个特征融合层对多个群特征进行特征融合处理，得到地块特征。

可选的，上述处理器还可以执行如下步骤的程序代码：利用旋转等变子层对多个第一特征进行下采样处理，得到多个第二特征；利用多个融合子层对多个第二特征进行处理，得到融合后的特征。

可选的，每个融合子层可以包括：并行连接的多个融合分支，多个融合分支的结构相同，每个融合分支采用注意力机制对输入特征进行融合处理。

可选的，上述处理器还可以执行如下步骤的程序代码：利用多个融合分支分别对多个第三特征进行处理，得到每个第三特征的局部注意力特征，其中，多个融合分支与多个第三特征一一对应。

可选的，上述处理器还可以执行如下步骤的程序代码：获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：目标检测任务、目标分割任务、目标识别任务和目标分类任务；基于目标任务对目标特征进行处理，得到目标任务对应的处理结果；在交互界面上展示处理结果。

可选的，上述处理器还可以执行如下步骤的程序代码：获取处理结果对应的反馈结果，其中，反馈结果通过对处理结果进行修改得到；基于反馈结果对特征提取模型进行训练。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取目标图像；利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；基于目标特征对目标图像中包含的目标进行检测，得到目标的检测结果。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取建筑物图像；利用特征提取模型对建筑物图像进行特征提取，得到建筑物图像的建筑物特征，其中，建筑物特征与建筑物图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

可选的，上述处理器还可以执行如下步骤的程序代码：获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：建筑物检测任务、建筑物分割任务、建筑物识别任务和建筑物分类任务；基于目标任务对建筑物特征进行处理，得到目标任务对应的处理结果；在交互界面上展示处理结果。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：云服务器接收客户端上传的目标图像；云服务器利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；云服务器将目标特征反馈至客户端。

本领域普通技术人员可以理解，图18所示的结构仅为示意，计算机终端也可以是智能手机（如Android手机、iOS手机等）、平板电脑、掌上电脑以及移动互联网设备（MobileInternet Devices，MID）、PAD等终端设备。图18其并不对上述电子装置的结构造成限定。例如，计算机终端A还可包括比图18中所示更多或者更少的组件（如网络接口、显示装置等），或者具有与图18所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器（Read-Only Memory，ROM）、随机存取器（RandomAccess Memory，RAM）、磁盘或光盘等。

实施例12

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例所提供的图像分割方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取目标图像；利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

可选的，上述存储介质还被设置为存储用于执行以下步骤的程序代码：利用特征旋转等变层对地块图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；利用至少一个特征融合层对多个群特征进行特征融合处理，得到地块特征。

可选的，上述存储介质还被设置为存储用于执行以下步骤的程序代码：利用旋转等变子层对多个第一特征进行下采样处理，得到多个第二特征；利用多个融合子层对多个第二特征进行处理，得到融合后的特征。

可选的，上述存储介质还被设置为存储每个融合子层可以包括：并行连接的多个融合分支，多个融合分支的结构相同，每个融合分支采用注意力机制对输入特征进行融合处理。

可选的，上述存储介质还被设置为存储用于执行以下步骤的程序代码：利用多个融合分支分别对多个第三特征进行处理，得到每个第三特征的局部注意力特征，其中，多个融合分支与多个第三特征一一对应。

可选的，上述存储介质还被设置为存储用于执行以下步骤的程序代码：获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：目标检测任务、目标分割任务、目标识别任务和目标分类任务；基于目标任务对目标特征进行处理，得到目标任务对应的处理结果；在交互界面上展示处理结果。

可选的，上述存储介质还被设置为存储用于执行以下步骤的程序代码：获取处理结果对应的反馈结果，其中，反馈结果通过对处理结果进行修改得到；基于反馈结果对特征提取模型进行训练。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取目标图像；利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；基于目标特征对目标图像中包含的目标进行检测，得到目标的检测结果。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取建筑物图像；利用特征提取模型对建筑物图像进行特征提取，得到建筑物图像的建筑物特征，其中，建筑物特征与建筑物图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同。

可选的，上述存储介质还被设置为存储用于执行以下步骤的程序代码：获取在交互界面中选中的目标任务，其中，目标任务包括如下至少之一：建筑物检测任务、建筑物分割任务、建筑物识别任务和建筑物分类任务；基于目标任务对建筑物特征进行处理，得到目标任务对应的处理结果；在交互界面上展示处理结果。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：云服务器接收客户端上传的目标图像；云服务器利用特征提取模型对目标图像进行特征提取，得到目标图像的目标特征，其中，目标特征与目标图像具备旋转等变性，特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，至少一个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，多个融合子层的结构相同；云服务器将目标特征反馈至客户端。

需要说明的是，本申请上述实施例中所涉及的图像的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可为个人计算机、服务器或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种图像特征提取方法，其特征在于，包括：

获取目标图像；

利用特征提取模型对所述目标图像进行特征提取，得到所述目标图像的目标特征，其中，所述目标特征与所述目标图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，在所述特征提取模型包括：多个特征融合层的情况下，所述多个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，所述多个融合子层的结构相同，所述旋转等变子层用于对输入的特征进行下采样处理，每个融合子层用于采用注意力机制对输入特征进行融合。

2.根据权利要求1所述的方法，其特征在于，利用特征提取模型对所述目标图像进行特征提取，得到所述目标图像的目标特征包括：

利用所述特征旋转等变层采用旋转等变算法对所述目标图像进行处理，得到多个群特征，其中，不同群特征对应不同的旋转角度；

利用所述至少一个特征融合层对所述多个群特征进行特征融合处理，得到所述目标特征。

3.根据权利要求2所述的方法，其特征在于，利用所述至少一个特征融合层中的目标特征融合层对输入至所述目标特征融合层的多个第一特征进行特征融合处理包括：

利用所述旋转等变子层采用旋转等变算法对所述多个第一特征进行下采样处理，得到多个第二特征；

利用所述多个融合子层对所述多个第二特征进行处理，得到融合后的特征。

4.根据权利要求3所述的方法，其特征在于，每个融合子层包括：并行连接的多个融合分支，所述多个融合分支的结构相同，每个融合分支采用注意力机制对输入特征进行融合处理。

5.根据权利要求4所述的方法，其特征在于，利用所述多个融合子层中的目标融合子层对输入至所述目标融合子层的多个第三特征进行处理包括：

利用所述多个融合分支分别对所述多个第三特征进行处理，得到每个第三特征的局部注意力特征，其中，所述多个融合分支与所述多个第三特征一一对应。

6.根据权利要求1至5中任意一项所述的方法，其特征在于，所述方法还包括：

获取在交互界面中选中的目标任务，其中，所述目标任务包括如下至少之一：目标检测任务、目标分割任务、目标识别任务和目标分类任务；

基于所述目标任务对所述目标特征进行处理，得到所述目标任务对应的处理结果；

在所述交互界面上展示所述处理结果。

7.一种图像特征提取方法，其特征在于，包括：

获取目标图像；

利用特征提取模型对所述目标图像进行特征提取，得到所述目标图像的目标特征，其中，所述目标特征与所述目标图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，在所述特征提取模型包括：多个特征融合层的情况下，所述多个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，所述多个融合子层的结构相同，所述旋转等变子层用于对输入的特征进行下采样处理，每个融合子层用于采用注意力机制对输入特征进行融合；

基于所述目标特征对所述目标图像中包含的目标进行检测，得到所述目标的检测结果。

8.一种图像特征提取方法，其特征在于，包括：

获取建筑物图像；

利用特征提取模型对所述建筑物图像进行特征提取，得到所述建筑物图像的建筑物特征，其中，所述建筑物特征与所述建筑物图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，在所述特征提取模型包括：多个特征融合层的情况下，所述多个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，所述多个融合子层的结构相同，所述旋转等变子层用于对输入的特征进行下采样处理，每个融合子层用于采用注意力机制对输入特征进行融合。

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：

获取在交互界面中选中的目标任务，其中，所述目标任务包括如下至少之一：建筑物检测任务、建筑物分割任务、建筑物识别任务和建筑物分类任务；

基于所述目标任务对所述建筑物特征进行处理，得到所述目标任务对应的处理结果；

在所述交互界面上展示所述处理结果。

10.一种图像特征提取方法，其特征在于，包括：

云服务器接收客户端上传的目标图像；

所述云服务器利用特征提取模型对所述目标图像进行特征提取，得到所述目标图像的目标特征，其中，所述目标特征与所述目标图像具备旋转等变性，所述特征提取模型包括：依次连接的特征旋转等变层和至少一个特征融合层，在所述特征提取模型包括：多个特征融合层的情况下，所述多个特征融合层的输出结果的分辨率不同，每个特征融合层包括：旋转等变子层和多个融合子层，所述多个融合子层的结构相同，所述旋转等变子层用于对输入的特征进行下采样处理，每个融合子层用于采用注意力机制对输入特征进行融合；

所述云服务器将所述目标特征反馈至所述客户端。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至10中任意一项所述的图像特征提取方法。

12.一种计算机终端，其特征在于，包括：处理器和存储器，所述处理器用于运行所述存储器中存储的程序，其中，所述程序运行时执行权利要求1至10中任意一项所述的图像特征提取方法。