CN116503420B - 一种基于联邦学习的图像分割方法及相关设备 - Google Patents

一种基于联邦学习的图像分割方法及相关设备 Download PDF

Info

Publication number
CN116503420B
CN116503420B CN202310464790.8A CN202310464790A CN116503420B CN 116503420 B CN116503420 B CN 116503420B CN 202310464790 A CN202310464790 A CN 202310464790A CN 116503420 B CN116503420 B CN 116503420B
Authority
CN
China
Prior art keywords
image segmentation
feature
local
model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310464790.8A
Other languages
English (en)
Other versions
CN116503420A (zh
Inventor
王金海
张宗印
罗陆锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN202310464790.8A priority Critical patent/CN116503420B/zh
Publication of CN116503420A publication Critical patent/CN116503420A/zh
Application granted granted Critical
Publication of CN116503420B publication Critical patent/CN116503420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30181Earth observation
    • G06T2207/30188Vegetation; Agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种基于联邦学习的图像分割方法及相关设备。方法用于服务器,包括:将经初始化的图像分割模型下发至至少两个客户端;自至少两个客户端接收客户端本地模型参数,客户端本地模型参数是客户端基于所接收到的经初始化的图像分割模型以及自身本地数据经过训练后获得的;对客户端本地模型参数进行参数聚合,以获取全局模型参数;基于全局模型参数对图像分割模型进行参数更新;将经更新的图像分割模型下发至至少两个客户端,以使至少两个客户端基于经更新的图像分割模型进行图像分割。保证了各方数据的隐私性,有效降低了通信负载。充分挖掘数据之间的特征信息,寻找数据之间的联系,同时改进图像分割模型结构,达到提升分割准确性的效果。

Description

一种基于联邦学习的图像分割方法及相关设备
技术领域
本发明涉及农业图像处理技术领域,更具体地,涉及一种基于联邦学习的图像分割方法、一种电子设备以及一种存储介质。
背景技术
葡萄是我国重要的水果产品,2020年其产量达到14.314万吨,随着劳动力短缺和成本的上升,葡萄果园采摘的机械自动化引起了更多的关注。推进农业生产的机械化与智能化是解决该问题的重要途径。针对葡萄果梗的精准分割是确定采摘点的前提,是实现在果园环境中机器人进行无损采摘的重要环节,在野外葡萄采摘作业中,因光照情况不同、存在多种不同的遮挡情境,使得葡萄采摘环境十分复杂。且葡萄品种繁多,不同品种之间颜色纹理和形状之间存在较大差异。采摘点位于葡萄果梗,但果梗与叶子、背景之间相似度很高,难以进行准确区分。这些非结构、不确定因素使得精准分割获得采摘点具有很高的难度。
随着技术的迅速发展,人们对葡萄采摘的准确率要求越来越高,由于数据持有方拥有的数据量较少,且各方数据无法聚合在一起形成数据孤岛,无法充分挖掘其中丰富的语义信息和通用特征,不足以满足图像分割的高精度要求。
由此,亟需一种新的技术方案以解决上述技术问题。
发明内容
在发明内容部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明。本发明的发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
第一方面,本发明提出一种基于联邦学习的图像分割方法,用于服务器,包括:
将经初始化的图像分割模型下发至至少两个客户端;
自至少两个客户端接收客户端本地模型参数,其中,客户端本地模型参数是客户端基于所接收到的经初始化的图像分割模型以及自身本地数据经过训练后获得的;
对客户端本地模型参数进行参数聚合,以获取全局模型参数;
基于全局模型参数对图像分割模型进行参数更新;
将经更新的图像分割模型下发至至少两个客户端,以使至少两个客户端基于经更新的图像分割模型进行图像分割。
可选地,基于全局模型参数对图像分割模型进行参数更新,包括:
在经更新的图像分割模型收敛后,停止参数更新。
可选地,所接收到的客户端本地模型参数是经过加密的,在对客户端本地模型参数进行参数聚合之前,方法还包括:
对客户端本地模型参数进行解密操作,以获得解密参数。
第二方面,还提出了一种基于联邦学习的图像分割方法,用于客户端,包括:
自服务器接收初始化的图像分割模型;
基于本地数据对初始化的图像分割模型进行训练,以获得客户端本地模型参数;
将客户端本地模型参数发送至服务器;
自服务器接收更新后的图像分割模型,其中,更新后的图像分割模型是利用对来自至少两个客户端的客户端本地模型参数进行聚合后获得全局模型参数对图像分割模型进行参数更新后得到的;
利用更新后的图像分割模型进行图像分割。
可选地,图像分割模型包括编码模块和解码模块,编码模块包括卷积神经网络分支、转换器分支和多个特征融合模块,卷积神经网络分支包括多个卷积神经网络层,转换器分支包括与卷积神经网络的层数相等的多个转换器层,
基于本地数据对初始化的图像分割模型进行训练,包括:
将待分割图像分别输入卷积神经网络分支和转换器分支,以对应输出局部特征和全局特征;
利用特征融合模块对局部特征和全局特征进行特征融合,以通过卷积神经网络分支或转换器分支输出特征融合结果。
可选地,方法还包括:
将待分割图像分别输入卷积神经网络分支的第一卷积神经网络层和转换器分支的第一转换器层,以输出第一局部特征和第一全局特征;
利用第一特征融合模块对第一局部特征和第一全局特征进行特征融合,以输出第一融合特征;
对第一融合特征进行下采样,以获取下采样数据;
将下采样数据分别输入卷积神经网络分支的第二卷积神经网络层和转换器分支的第二转换器层,以输出第二局部特征和第二全局特征;
利用第二特征融合模块对第二局部特征和第二全局特征进行特征融合,以获取第二融合特征;
将第二融合特征输入到解码模块,以输出图像分割结果。
可选地,方法还包括:
将第一融合特征输入到解码模块;
对第二融合特征进行上采样,以获取上采样数据;
对上采样数据和第一融合特征进行特征融合,以输出图像分割结果。
可选地,每个卷积神经网络层包括两个残差模块,方法还包括:
对局部特征依序进行第一卷积处理、下采样处理和第一正则化处理,以输出第一处理数据;
对全局特征依序进行上采样处理、第二卷积处理和第二正则化处理,以输出第二处理数据,其中,特征融合结果包括第一处理数据和第二处理数据。
第三方面,还提出了一种电子设备,包括处理器和存储器,其中,存储器中存储有计算机程序指令,计算机程序指令被处理器运行时用于执行如上所述的基于联邦学习的图像分割方法。
第四方面,还提出了一种存储介质,在存储介质上存储了程序指令,程序指令在运行时用于执行如上所述的基于联邦学习的图像分割方法。
根据上述技术方案,服务器首先对图像分割模型进行初始化并下发到至少两个客户端,接着自至少两个客户端接收利用自身本地数据对图像分割模型训练后获得的客户端本地模型参数,对所接收到的多个客户端本地模型参数进行聚合操作以获得全局模型参数,之后利用全局模型参数对图像分割模型进行更新,最后再次将更新后的图像分割模型下发至前述至少两个客户端,以使客户端利用接收到的更新后的图像分割模型执行图像分割。由此,可以在各客户端持有的本地数据不出本地的情况下,在服务器将各方的数据进行融合,保证了各方数据的隐私性,同时还有效降低了通信负载。进一步地,上述技术方案能够充分挖掘数据之间的特征信息,寻找数据之间的联系,同时改进图像分割模型结构,达到提升分割准确性的效果,能够获取更加准确的例如果梗、葡萄串、葡萄叶、枝干的分割效果,通过对葡萄果梗位置的确定,可以更准确的确定采摘点,在复杂环境下实现精准采摘,保证采摘果实的完整性,保证收益。
本发明的基于联邦学习的图像分割方法,本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本说明书的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种基于联邦学习的图像分割方法的示意性流程图;
图2示出了根据本发明另一个实施例的一种基于联邦学习的图像分割方法的示意性流程图;
图3示出了根据本发明一个实施例的对图像分割模型训练的示意性流程图;
图4示出了根据本发明一个实施例的利用特征融合模块进行特征融合的示意性流程图;以及
图5示出了根据本发明一个实施例的电子设备的示意性框图。
具体实施方式
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
根据本发明的第一方面,提出了一种基于联邦学习的图像分割方法,用于服务器。图1示出了根据本发明一个实施例的基于联邦学习的图像分割方法100的示意性流程图。如图1所示,方法100可以包括以下步骤。
步骤S110,将经初始化的图像分割模型下发至至少两个客户端。
示例性地,图像分割模型可以是任何现有的或未来的可以实现图像分割的模型。对图像分割模型进行初始化操作,例如清空模型中数据等,之后将经初始化的图像分割模型下发至至少两个客户端,可选地,客户端可以是各个采摘园等。为了便于描述和理解,在下文中,以至少两个客户端是两个为例进行相关描述。
步骤S120,自至少两个客户端接收客户端本地模型参数,其中,客户端本地模型参数是客户端基于所接收到的经初始化的图像分割模型以及自身本地数据经过训练后获得的。
在步骤S110后,客户端在接收到经初始化的图像分割模型之后可以基于自身本地数据对该经初始化的图像分割模型进行训练,训练结果即为客户端本地模型参数。可以理解,对于每个客户端而言,由于自身本地数据不同,其获得的客户端本地模型参数也不同。其中,自身本地数据可以包括待分割图像以及针对待分割图像的标注结果等,在此不做限定。服务器可以在客户端执行训练操作之后,由两个客户端分别接收对应的客户端本地模型参数。
步骤S130,对客户端本地模型参数进行参数聚合,以获取全局模型参数。
在接收到两个客户端本地模型参数之后,可以对所接收到的本地模型参数进行聚合操作,可以理解,聚合操作可以表示对数据进行进一步整理筛选等操作,以生成两个客户端本地模型参数的集合,即全局模型参数的过程。其中,可以利用任何现有的或未来的参数聚合方式对客户端本地模型参数进行参数聚合,在此不做限定。
具体地,服务器可以根据测试数据对各个客户端的图像分割模型进行测试,以得到不同的分割准确率mIoU值,具体地,可以通过以下公式计算mIoU值:
其中,k+1表示进行分割的类别和背景的数量和,pii表示像素类别预测正确,pij表示像素预测错误,即类别i预测成类别j,同理,pij也表示像素预测错误,类别j预测成类别i。在获得多个准确率mIoU值之后,可以对不同的准确率值进行归一化处理,作为相应本地模型参数的权重,之后对所有本地模型进行权重求和,可以获得全局模型参数。
在前述计算mIoU值的过程中,如果某个客户端的mIoU值连续低于预设阈值超过指定次数,则可以将该客户端丢弃。可选地,指定次数可以根据经验或实际需求进行任意合理设置例如设置为2次或更多次等。
步骤S140,基于全局模型参数对图像分割模型进行参数更新。
可以理解,可以将全局模型参数视为一个大的集合,在这个集合里包括来自至少两个客户端的、对图像分割模型进行训练的中间参数,即客户端本地模型参数,将其中的每个客户端本地模型参数视为这个大集合的一个子集,换言之,上述聚合操作实现了对至少两个客户端的模型训练操作的汇总,由此,在该步骤中,基于汇总后得到的全局模型参数对图像分割模型进行参数更新相当于将更多的参数更新到图像分割模型中,以增加图像分割模型能够学习的数据集中的数据量。可以理解,上述训练过程可以重复多次执行,对应地,在训练过程执行多次的情况下,可以产生多个训练结果,即能够获得多个聚合后的全局模型参数,因此能够利用多个全局模型参数对图像分割模型进行持续更新,换言之,上述训练过程不中断,图像分割模型的参数就会持续更新。
步骤S150,将经更新的图像分割模型下发至至少两个客户端,以使至少两个客户端基于经更新的图像分割模型进行图像分割。
在对图像分割模型更新后,将经更新的图像分割模型下发至前述的两个客户端里,可以使得客户端利用经更新的图像分割模型对农作物例如葡萄进行图像分割,具体检测方法在此不做限定,例如可以将待分割图像输入到图像分割模型中,进而可以输出图像分割结果。
根据上述技术方案,服务器首先对图像分割模型进行初始化并下发到至少两个客户端,接着自至少两个客户端接收利用自身本地数据对图像分割模型训练后获得的客户端本地模型参数,对所接收到的多个客户端本地模型参数进行聚合操作以获得全局模型参数,之后利用全局模型参数对图像分割模型进行更新,最后再次将更新后的图像分割模型下发至前述至少两个客户端,以使客户端利用接收到的更新后的图像分割模型执行图像分割。由此,可以在各客户端持有的本地数据不出本地的情况下,在服务器将各方的数据进行融合,保证了各方数据的隐私性,同时还有效降低了通信负载。进一步地,上述技术方案能够充分挖掘数据之间的特征信息,寻找数据之间的联系,同时改进图像分割模型结构,达到提升分割准确性的效果,能够获取更加准确的例如果梗、葡萄串、葡萄叶、枝干的分割效果,通过对葡萄果梗位置的确定,可以更准确的确定采摘点,在复杂环境下实现精准采摘,保证采摘果实的完整性,保证收益。
可选地,步骤S140基于全局模型参数对图像分割模型进行参数更新可以包括:在经更新的图像分割模型收敛后,停止参数更新。
如前所述,对图像分割模型的训练过程是不断进行的,为了节约系统运行成本,避免资源浪费,可以在图像分割模型收敛后停止训练,即停止后续的参数更新,反之,在图像分割模型未收敛的情况下,持续对图像分割模型的训练操作,直至图像分割模型收敛为止。可以利用任何现有的或未来的判断方法对图像分割模型是否收敛进行判断,在此不做限定。
可选地,所接收到的客户端本地模型参数是经过加密的,在对客户端本地模型参数进行参数聚合之前,方法还可以包括:对客户端本地模型参数进行解密操作,以获得解密参数。
可以理解,客户端可以利用任何加密技术对所发送的客户端本地模型参数进行加密,对应地,服务器与客户端达成解密协议,能够对所接收到的经加密的客户端本地模型参数进行解密操作,进而获得解密参数。其中,解密参数可以包括各个客户端更新模型的权重。
由此,有效保证了数据传输的安全性及私密性。
根据本发明的第二方面,还提出了一种基于联邦学习的图像分割方法,用于客户端。图2示出了根据本发明另一个实施例的基于联邦学习的图像分割方法200。如图2所示,方法200可以包括以下步骤。
步骤S210,自服务器接收初始化的图像分割模型。
如前所述,图像分割模型可以是任何能够执行图像分割功能的卷积神经网络,在此不做限定。可以理解,下文所述的服务器均为前述技术方案所述的服务器。
步骤S220,基于本地数据对初始化的图像分割模型进行训练,以获得客户端本地模型参数。
示例性地,客户端首先获取待分割图像,用户利用输入装置针对待分割图像制作分割区域标签,具体地,对于葡萄图像而言,用户可以利用输入装置在图像上标注果梗、叶片、果粒等以获取分割结果。在获取待分割图像之后,可以将其输入至初始化的图像分割模型中,以对该图像分割模型进行训练,可以获得训练结果——客户端本地模型参数。如前所述,对于每一个客户端而言,可以分别获得各自的客户端本地模型参数。
步骤S230,将客户端本地模型参数发送至服务器。
在根据上述步骤对图像分割模型进行训练后可以获得客户端本地模型参数,之后,每个客户端将其获取的客户端本地模型参数分别上传至服务器。
步骤S240,自服务器接收更新后的图像分割模型,其中,更新后的图像分割模型是利用对来自至少两个客户端的客户端本地模型参数进行聚合后获得全局模型参数对图像分割模型进行参数更新后得到的。
在每个客户端将各自的客户端本地模型参数发送至服务器后,如前所述,服务器可以对多个客户端本地模型参数进行聚合,以获得全局模型参数,之后利用该全局模型参数对初始化的图像分割模型进行参数更新,同理可知,在后续服务器接收到新的客户端本地模型参数之后,又可以聚合获得新的全局模型参数,利用该新的全局模型参数可以对前面已经更新的图像分割模型再次进行参数更新,可以理解,这种更新过程在训练停止后可以同步停止。进一步地,客户端可以自服务器接收到更新后的图像分割模型。同样地,上述更新过程不断进行,对应地,客户端也能够不断接收到持续更新的图像分割模型。
步骤S250,利用更新后的图像分割模型进行图像分割。
客户端可以利用更新后的图像分割模型对待分割图像进行图像分割,具体分割方法在此不做限定,例如可以将待分割图像输入到图像分割模型中,进而可以输出对应的图像分割结果。
由此,客户端无需向服务器发送各自的本地数据,即不需要将各自数据传输到集中的节点,一方面极大的减轻了数据的传输量,对传输要求的性能大大降低,在一定程度上保证了数据的安全,另一方面,仅向其发送对图像分割模型进行训练的中间参数,即客户端本地模型参数即可,利用多个遮挡葡萄图像数据持有方的数据,即不同品种、不同栽种场景的图像进行训练,充分利用其中的信息,通过不断在客户端与服务器之间进行模型参数交互的方式实现共享模型,从而保证通信数据的安全性,在提高数据的利用率的同时还能够很好地保障客户端数据的隐私性。换言之,能使服务器能够充分利用不同客户端的数据对图像分割模型进行更新,进而使得客户端能够利用其他客户端的数据实现图像分割,极大程度上扩充了图像分割的数据集,使得图像分割模型能够基于足够大的数据集学习到更多的特征以提升图像分割结果的准确性。
图3示出了根据本发明一个实施例的对图像分割模型训练的示意性流程图。如图3所示,图像分割模型包括编码模块(Encoder)和解码模块(Decoder),编码模块包括卷积神经网络分支、转换器分支和多个特征融合模块(FFM),卷积神经网络分支包括多个卷积神经网络层,转换器分支包括与卷积神经网络的层数相等的多个转换器层。
在该实施例中,步骤S220基于本地数据对初始化的图像分割模型进行训练可以包括以下步骤。
步骤S221,将待分割图像分别输入卷积神经网络分支和转换器分支,以对应输出局部特征和全局特征。
如图3所示,可以将同一张待分割图像同时输入到卷积神经网络分支和转换器分支,具体地,编码模块中最左侧的分支为卷积神经网络分支,最右侧分支为转换器分支,在图像输入到上述分支后,可以理解的是,对应分支能够分别输出各自的特征提取结果,即卷积神经网络分支能够输出提取到的局部特征,转换器分支能够输出提取到的全局特征。具体地,转换器分支可以包括LayerNorm(LN)层、多头注意力模块(MSA)、残差连接和具有GELU非线性的两个全连接层MLP。其目标函数可以表示为:
zl=MLP(LN(MSA(LN(zl―1))+zl―1))+zl,其中,zl表示为第l层。
步骤S222,利用特征融合模块对局部特征和全局特征进行特征融合,以通过卷积神经网络分支或转换器分支输出特征融合结果。
FFM模块可以将卷积神经网络分支与转换器分支在不同层之间的参数进行特征融合,进而输出特征融合结果。
根据上述技术方案,可以利用卷积神经网络所擅长的提取局部特征,利用转换器分支所擅长的提取全局特征,进而利用特征融合模块协调两个分支之间参数传递的不一致,保证整个编码模块可以正常执行,由此可以有效提升图像分割模型的性能,提升分割结果的准确性。
可选地,方法还可以包括以下步骤。
步骤S410,将待分割图像分别输入卷积神经网络分支的第一卷积神经网络层和转换器分支的第一转换器层,以输出第一局部特征和第一全局特征。
示例性地,可以将卷积神经网络分支中最上面的卷积神经网络层视为第一卷积神经网络层,对应地,将转换器分支中最上面的转换器层视为第一转换器层。在将待分割图像分别输入到第一卷积神经网络层和第一转换器层之后,可以对应输出第一局部特征和第一全局特征。
步骤S420,利用第一特征融合模块对第一局部特征和第一全局特征进行特征融合,以输出第一融合特征。
示例性地,以特征融合模块最先接收到第一卷积神经网络层所输出的第一局部特征为例进行以下描述。特征融合模块所接收到的第一局部特征的特征映射维度为C*H*W,其中,C表示特征图的通道,H表示特征图的高度,W表示特征图的宽度,若想与第一全局特征进行特征融合,需要保证二者传递的形式一致,即将第一局部特征的特征映射维度C*H*W转换为转换器层对应的特征映射维度K*E,其中,K表示PatchEmbedding的大小,E表示PatchEmbedding的维度。具体地,可以将C转换为E,将H*W转换为K,进而将格式转换后的特征与第一全局特征相融合以生成第一融合特征到第一转换器层。类似地,第一转换器在提取到第一全局特征后,也可以向特征融合模块输入第一全局特征,特征融合模块在接收到第一全局特征之后,可以将其特征映射维度由K*E转换为C*H*W,进而将格式转换后的特征与第一局部特征相融合同样可以生成第一融合特征到第一卷积神经网络层。具体地,所获得的第一融合特征可以是尺度为原图的1/4的特征图。
步骤S430,对第一融合特征进行下采样,以获取下采样数据。
在获得第一融合特征之后,可以对第一融合特征进行下采样,其中,下采样可以表示对特征图进行缩放处理,例如可以将其缩小为原图的1/8、1/16、1/32等,对应地,特征图的维度分别为256、512、1024。在进行下采样操作之后可以获取下采样数据。在该实施例中,对第一融合特征进行下采样,以使特征图缩小为原图的1/8。
步骤S440,将下采样数据分别输入卷积神经网络分支的第二卷积神经网络层和转换器分支的第二转换器层,以输出第二局部特征和第二全局特征。
之后,将下采样数据分别输入到第二卷积神经网络层和第二转换器层,进而可以输出第二局部特征和第二全局特征。可以理解,第二卷积神经网络层可以包括除第一卷积神经网络层的任意卷积神经网络层。同理,第二转换器层可以包括除第一转换器层的任意转换器层。
步骤S450,利用第二特征融合模块对第二局部特征和第二全局特征进行特征融合,以获取第二融合特征。
上文已经对第一局部特征、第一全局特征以及第一特征融合模块之间的数据处理、传递进行了相关描述,本领域普通技术人员可以理解如何利用第二特征融合模块对第二局部特征和第二全局特征进行特征融合,以获取第二融合特征,为了简洁在此不再赘述。由此,可以分别获得尺度分别为原图的1/8、1/16以及1/32的特征图的第二融合特征。
替代地,还可以将最下面一层卷积神经网络层视为第二卷积神经网络层,将最下面一层转换器层视为第二转换器层。对应地,可以确定其余层均为第一卷积神经网络层和第一转换器层,对应地,在该实施例中,第一融合特征为原图的1/4、1/8、1/16的特征图,第二融合特征为原图的1/32的特征图。
步骤S460,将第二融合特征输入到解码模块,以输出图像分割结果。
以最下面一层卷积神经网络层为第二卷积神经网络层,最下面一层转换器层为第二转换器层为例进行以下说明。在获取第二融合特征之后可以将其输入到解码模块,进而可以输出图像分割结果,此处为现有技术,不做过多说明。
由此,可以通过不同分支之间参数的连续交互,在最大程度上保留全局特征和局部特征,有效提升了图像分割模型的性能。
可选地,方法还可以包括以下步骤。
步骤S510,将第一融合特征输入到解码模块。
如前所述可以获得第一融合特征,在一个实施例中,第一融合特征为原图的1/4、1/8、1/16的特征图,第二融合特征为原图的1/32的特征图。
步骤S520,对第二融合特征进行上采样,以获取上采样数据。
对尺度为原图的1/32的特征图进行上采样,可以获取上采样数据。可以理解,所获取到的上采样数据为尺度是原图的1/4的特征图。
步骤S530,对上采样数据和第一融合特征进行特征融合,以输出图像分割结果。
示例性地,利用图3所示的Fuse模块可以对上采样数据与第一融合特征进行特征融合,进而输出图像分割结果,本领域普通技术人员可以理解此处的具体实施方式,在此不做具体展开。
由此,通过上述技术方案有效利用多尺度特征图进行上采样进行数据缺失弥补,保证了图像分割过程中的有效数据量,为图像分割结果的准确性提供另一层保障。同时,采用特征金字塔模型将不同层提取到的特征进行融合,可以充分获得全局信息。
可选地,每个卷积神经网络层包括两个残差模块。图4示出了根据本发明一个实施例的利用特征融合模块进行特征融合的示意性流程图。如图4所示,特征融合模块可以包括1*1卷积神经网络、下采样操作模块、正则化模块等。其中,图4的最左侧的两个ResidualBlock即为残差模块。在该实施例中,方法还可以包括:
对局部特征依序进行第一卷积处理、下采样处理和第一正则化处理,以输出第一处理数据。
具体地,参见图4,自图4的左上方起,可以首先利用第一1*1卷积神经网络模块(1*1Conv)对局部特征进行卷积处理,之后进行下采样处理,其中,下采样模块中可以包括Reshape操作模块、Avgpooling操作模块,再接着,利用第一正则化模块LayerNorm进行第一正则化处理,具体模块处理过程在此不做限定。通过上述操作可以输出第一处理数据到转换器层(Transformer Block)。
对全局特征依序进行上采样处理、第二卷积处理和第二正则化处理,以输出第二处理数据,其中,特征融合结果包括第一处理数据和第二处理数据。
示例性地,转换器层输出自身提取到的全局特征,到特征融合模块,首先利用上采样模块对全局特征进行上采样处理,其中,上采样模块包括Reshape操作模块、Interpolating操作模块。接着利用第二1*1卷积神经网络模块(1*1Conv)进行卷及处理,最后利用第二正则化模块BatchNorm进行第二正则化处理。
由此,上述特征融合模型算法简单,并且能够在最大程度上保留全局特征和局部特征,有效提升了图像分割模型的性能。
根据本发明的第三方面,还提供了一种电子设备。图5示出了根据本发明一个实施例的电子设备500的示意性框图。如图5所示,电子设备500包括处理器510和存储器520,其中,存储器520中存储有计算机程序指令,计算机程序指令被处理器510运行时用于执行如上所述的基于联邦学习的图像分割方法。
根据本发明的第四方面,还提供了一种存储介质,在存储介质上存储了程序指令,程序指令在运行时用于执行如上所述的基于联邦学习的图像分割方法。存储介质例如可以包括平板电脑的存储部件、计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。
本领域普通技术人员通过阅读上述有关基于联邦学习的图像分割方法的相关描述可以理解电子设备以及存储介质的具体细节以及有益效果,为了简洁在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和/或设备,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (8)

1.一种基于联邦学习的图像分割方法,其特征在于,用于客户端,包括:
自服务器接收初始化的图像分割模型,其中,所述图像分割模型包括编码模块和解码模块,所述编码模块包括卷积神经网络分支、转换器分支和多个特征融合模块,所述卷积神经网络分支包括多个卷积神经网络层,所述转换器分支包括与所述卷积神经网络的层数相等的多个转换器层;
基于本地数据对所述初始化的图像分割模型进行训练,以获得客户端本地模型参数,包括:
将待分割图像分别输入所述卷积神经网络分支和所述转换器分支,以对应输出局部特征和全局特征;
利用所述特征融合模块对所述局部特征和所述全局特征进行特征融合,以通过所述卷积神经网络分支或所述转换器分支输出特征融合结果;
将所述客户端本地模型参数发送至所述服务器;
自所述服务器接收更新后的图像分割模型,其中,所述更新后的图像分割模型是利用对来自至少两个所述客户端的客户端本地模型参数进行聚合后获得全局模型参数对所述图像分割模型进行参数更新后得到的;
利用所述更新后的图像分割模型进行图像分割,包括:
将所述待分割图像分别输入所述卷积神经网络分支的第一卷积神经网络层和所述转换器分支的第一转换器层,以输出第一局部特征和第一全局特征;
利用第一特征融合模块对所述第一局部特征和所述第一全局特征进行特征融合,以输出第一融合特征;
对第一融合特征进行下采样,以获取下采样数据;
将所述下采样数据分别输入所述卷积神经网络分支的第二卷积神经网络层和所述转换器分支的第二转换器层,以输出第二局部特征和第二全局特征;
利用第二特征融合模块对所述第二局部特征和所述第二全局特征进行特征融合,以获取第二融合特征;
将所述第二融合特征输入到所述解码模块,以输出图像分割结果。
2.如权利要求1所述的基于联邦学习的图像分割方法,其特征在于,所述方法还包括:
将所述第一融合特征输入到所述解码模块;
对所述第二融合特征进行上采样,以获取上采样数据;
对所述上采样数据和所述第一融合特征进行特征融合,以输出图像分割结果。
3.如权利要求1或2所述的基于联邦学习的图像分割方法,其特征在于,每个所述卷积神经网络层包括两个残差模块,所述方法还包括:
对所述局部特征依序进行第一卷积处理、下采样处理和第一正则化处理,以输出第一处理数据;
对所述全局特征依序进行上采样处理、第二卷积处理和第二正则化处理,以输出第二处理数据,其中,所述特征融合结果包括所述第一处理数据和所述第二处理数据。
4.一种基于联邦学习的图像分割方法,其特征在于,用于服务器,包括:
将经初始化的图像分割模型下发至如权利要求1至3任一项所述的至少两个客户端;
自所述至少两个客户端接收客户端本地模型参数,其中,所述客户端本地模型参数是所述客户端基于所接收到的所述经初始化的图像分割模型以及自身本地数据经过训练后获得的;
对所述客户端本地模型参数进行参数聚合,以获取全局模型参数;
基于所述全局模型参数对所述图像分割模型进行参数更新;
将经更新的图像分割模型下发至所述至少两个客户端,以使所述至少两个客户端基于所述经更新的图像分割模型进行图像分割。
5.如权利要求4所述的基于联邦学习的图像分割方法,其特征在于,所述基于所述全局模型参数对所述图像分割模型进行参数更新,包括:
在所述经更新的图像分割模型收敛后,停止所述参数更新。
6.如权利要求4所述的基于联邦学习的图像分割方法,其特征在于,所接收到的所述客户端本地模型参数是经过加密的,在所述对所述客户端本地模型参数进行参数聚合之前,所述方法还包括:
对所述客户端本地模型参数进行解密操作,以获得解密参数。
7.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器运行时用于执行如权利要求1至6任一项所述的基于联邦学习的图像分割方法。
8.一种存储介质,在所述存储介质上存储了程序指令,所述程序指令在运行时用于执行如权利要求1至6任一项所述的基于联邦学习的图像分割方法。
CN202310464790.8A 2023-04-26 2023-04-26 一种基于联邦学习的图像分割方法及相关设备 Active CN116503420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310464790.8A CN116503420B (zh) 2023-04-26 2023-04-26 一种基于联邦学习的图像分割方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310464790.8A CN116503420B (zh) 2023-04-26 2023-04-26 一种基于联邦学习的图像分割方法及相关设备

Publications (2)

Publication Number Publication Date
CN116503420A CN116503420A (zh) 2023-07-28
CN116503420B true CN116503420B (zh) 2024-05-14

Family

ID=87329714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310464790.8A Active CN116503420B (zh) 2023-04-26 2023-04-26 一种基于联邦学习的图像分割方法及相关设备

Country Status (1)

Country Link
CN (1) CN116503420B (zh)

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872306A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 医学图像分割方法、装置和存储介质
CN109903292A (zh) * 2019-01-24 2019-06-18 西安交通大学 一种基于全卷积神经网络的三维图像分割方法及系统
CN111145170A (zh) * 2019-12-31 2020-05-12 电子科技大学 一种基于深度学习的医学影像分割方法
AU2020102091A4 (en) * 2019-10-17 2020-10-08 Wuhan University Of Science And Technology Intelligent steel slag detection method and system based on convolutional neural network
CN112348825A (zh) * 2020-10-16 2021-02-09 佛山科学技术学院 一种用于视网膜血流图像分割的DR-U-net网络方法及装置
CN112767369A (zh) * 2021-01-25 2021-05-07 佛山科学技术学院 小五金的缺陷识别检测方法、装置及计算机可读存储介质
CN113240129A (zh) * 2021-05-07 2021-08-10 大连理工大学 一种面向多类型任务图像分析的联邦学习系统
WO2021179205A1 (zh) * 2020-03-11 2021-09-16 深圳先进技术研究院 医学图像分割方法、医学图像分割装置及终端设备
WO2021189906A1 (zh) * 2020-10-20 2021-09-30 平安科技(深圳)有限公司 基于联邦学习的目标检测方法、装置、设备及存储介质
CN113744275A (zh) * 2021-07-26 2021-12-03 重庆邮电大学 一种基于特征变换的三维cbct牙齿图像的分割方法
WO2021244621A1 (zh) * 2020-06-04 2021-12-09 华为技术有限公司 基于全局引导选择性上下文网络的场景语义解析方法
WO2022116502A1 (zh) * 2020-12-01 2022-06-09 平安科技(深圳)有限公司 模型训练方法、数据处理方法、装置、客户端及存储介质
CN114612408A (zh) * 2022-03-04 2022-06-10 拓微摹心数据科技(南京)有限公司 一种基于联邦深度学习的心脏图像处理方法
CN114742802A (zh) * 2022-04-19 2022-07-12 江南大学 基于3Dtransformer混合卷积神经网络的胰腺CT图像分割方法
CN114897837A (zh) * 2022-05-16 2022-08-12 华北电力大学(保定) 基于联邦学习与自适应差分的电力巡检图像缺陷检测方法
CN114998251A (zh) * 2022-05-30 2022-09-02 天津理工大学 一种基于联邦学习的空中多视觉平台地面异常检测方法
CN115018824A (zh) * 2022-07-21 2022-09-06 湘潭大学 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法
CN115120238A (zh) * 2022-06-02 2022-09-30 南京邮电大学 基于联邦学习多中心首发精神分裂症患者的识别方法、装置及系统
CN115510727A (zh) * 2022-11-15 2022-12-23 佛山科学技术学院 一种抓取机构稳定抓持力阈值计算及其控制方法
CN115908421A (zh) * 2023-01-10 2023-04-04 西安电子科技大学 一种基于超像素和多样性的主动学习医学图像分割方法

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109903292A (zh) * 2019-01-24 2019-06-18 西安交通大学 一种基于全卷积神经网络的三维图像分割方法及系统
CN109872306A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 医学图像分割方法、装置和存储介质
AU2020102091A4 (en) * 2019-10-17 2020-10-08 Wuhan University Of Science And Technology Intelligent steel slag detection method and system based on convolutional neural network
CN111145170A (zh) * 2019-12-31 2020-05-12 电子科技大学 一种基于深度学习的医学影像分割方法
WO2021179205A1 (zh) * 2020-03-11 2021-09-16 深圳先进技术研究院 医学图像分割方法、医学图像分割装置及终端设备
WO2021244621A1 (zh) * 2020-06-04 2021-12-09 华为技术有限公司 基于全局引导选择性上下文网络的场景语义解析方法
CN112348825A (zh) * 2020-10-16 2021-02-09 佛山科学技术学院 一种用于视网膜血流图像分割的DR-U-net网络方法及装置
WO2021189906A1 (zh) * 2020-10-20 2021-09-30 平安科技(深圳)有限公司 基于联邦学习的目标检测方法、装置、设备及存储介质
WO2022116502A1 (zh) * 2020-12-01 2022-06-09 平安科技(深圳)有限公司 模型训练方法、数据处理方法、装置、客户端及存储介质
CN112767369A (zh) * 2021-01-25 2021-05-07 佛山科学技术学院 小五金的缺陷识别检测方法、装置及计算机可读存储介质
CN113240129A (zh) * 2021-05-07 2021-08-10 大连理工大学 一种面向多类型任务图像分析的联邦学习系统
CN113744275A (zh) * 2021-07-26 2021-12-03 重庆邮电大学 一种基于特征变换的三维cbct牙齿图像的分割方法
CN114612408A (zh) * 2022-03-04 2022-06-10 拓微摹心数据科技(南京)有限公司 一种基于联邦深度学习的心脏图像处理方法
CN114742802A (zh) * 2022-04-19 2022-07-12 江南大学 基于3Dtransformer混合卷积神经网络的胰腺CT图像分割方法
CN114897837A (zh) * 2022-05-16 2022-08-12 华北电力大学(保定) 基于联邦学习与自适应差分的电力巡检图像缺陷检测方法
CN114998251A (zh) * 2022-05-30 2022-09-02 天津理工大学 一种基于联邦学习的空中多视觉平台地面异常检测方法
CN115120238A (zh) * 2022-06-02 2022-09-30 南京邮电大学 基于联邦学习多中心首发精神分裂症患者的识别方法、装置及系统
CN115018824A (zh) * 2022-07-21 2022-09-06 湘潭大学 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法
CN115510727A (zh) * 2022-11-15 2022-12-23 佛山科学技术学院 一种抓取机构稳定抓持力阈值计算及其控制方法
CN115908421A (zh) * 2023-01-10 2023-04-04 西安电子科技大学 一种基于超像素和多样性的主动学习医学图像分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Lufeng Luo ; Wei Yin ; Zhengtong Ning ; Jinhai Wang ; Huiling Wei ; Weilin Chen ; Qinghua Lu.In-field pose estimation of grape clusters with combined point cloud segmentation and geometric analysis.《COMPUTERS AND ELECTRONICS IN AGRICULTURE 》.2023,全文. *
刘浩 ; 沈雷 ; 牟家乐 ; 郑鹏 .基于局部特征融合Transformer的牛身识别算法.《 杭州电子科技大学学报(自然科学版)。.2023,全文. *
基于场景模态深度理解网络的单目图像深度理解;陈扬;李大威;《计算机工程》;第47卷(第02期);全文 *

Also Published As

Publication number Publication date
CN116503420A (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN111339306B (zh) 分类模型训练方法、分类方法及装置、设备和介质
CN111444966B (zh) 媒体信息分类方法及装置
CN107861938B (zh) 一种poi文案生成方法及装置,电子设备
US9558268B2 (en) Method for semantically labeling an image of a scene using recursive context propagation
CN111898696A (zh) 伪标签及标签预测模型的生成方法、装置、介质及设备
CN108108743B (zh) 异常用户识别方法和用于识别异常用户的装置
CN110929622A (zh) 视频分类方法、模型训练方法、装置、设备及存储介质
CN112418292B (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
US11983903B2 (en) Processing images using self-attention based neural networks
CN111310041B (zh) 图文发布的方法、模型的训练方法、装置及存储介质
CN114283350B (zh) 视觉模型训练和视频处理方法、装置、设备及存储介质
CN116978011B (zh) 一种用于智能目标识别的图像语义通信方法及系统
CN116797787B (zh) 基于跨模态融合与图神经网络的遥感影像语义分割方法
US11804043B2 (en) Detecting objects in a video using attention models
CN113469289A (zh) 视频自监督表征学习方法、装置、计算机设备和介质
CN112132232A (zh) 医学图像的分类标注方法和系统、服务器
CN110248195B (zh) 用于输出信息的方法和装置
CN113837492B (zh) 物品供应量的预测方法、设备、存储介质及程序产品
Venkatesvara Rao et al. Real-time video object detection and classification using hybrid texture feature extraction
CN115082306A (zh) 一种基于蓝图可分离残差网络的图像超分辨率方法
CN116503420B (zh) 一种基于联邦学习的图像分割方法及相关设备
CN116992396A (zh) 冗余自适应的多模态鲁棒融合学习方法及系统
CN115994239A (zh) 一种基于原型对比学习的半监督遥感图像检索方法及系统
CN111768214A (zh) 产品属性的预测方法、系统、设备和存储介质
CN115168609A (zh) 一种文本匹配方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant