CN113284074A - 全景图像的目标对象去除方法、装置、服务器及存储介质 - Google Patents

全景图像的目标对象去除方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN113284074A
CN113284074A CN202110783586.3A CN202110783586A CN113284074A CN 113284074 A CN113284074 A CN 113284074A CN 202110783586 A CN202110783586 A CN 202110783586A CN 113284074 A CN113284074 A CN 113284074A
Authority
CN
China
Prior art keywords
image
target
panoramic
plane
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110783586.3A
Other languages
English (en)
Other versions
CN113284074B (zh
Inventor
崔岩
揭英达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Germany Zhuhai Artificial Intelligence Institute Co ltd
4Dage Co Ltd
Original Assignee
China Germany Zhuhai Artificial Intelligence Institute Co ltd
4Dage Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Germany Zhuhai Artificial Intelligence Institute Co ltd, 4Dage Co Ltd filed Critical China Germany Zhuhai Artificial Intelligence Institute Co ltd
Priority to CN202110783586.3A priority Critical patent/CN113284074B/zh
Publication of CN113284074A publication Critical patent/CN113284074A/zh
Application granted granted Critical
Publication of CN113284074B publication Critical patent/CN113284074B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本申请适用于图像处理技术领域,提供了一种全景图像的目标对象去除方法、装置、服务器及存储介质,该方法包括:获取待处理全景图像;确定出待处理全景图像中目标对象所对应的目标区域图像;去除待处理全景图像中的目标区域图像,得到全景图像。可见,本申请可以自动对全景相机拍摄的全景图像进行目标对象去除,不需要用户手动通过图像编辑工具去除全景图像中的目标对象对应的区域。

Description

全景图像的目标对象去除方法、装置、服务器及存储介质
技术领域
本申请属于图像处理技术领域,尤其涉及一种全景图像的目标对象去除方法、装置、服务器及存储介质。
背景技术
全景图像是由用户通过专业的全景相机(例如球幕相机)捕捉整个场景的图像信息拍摄得到的图像,但是由于全景图像拍摄范围覆盖较大,导致拍摄得到的全景图像中存在不必要的目标对象,影响用户的视觉体验。现有技术中, 往往需要用户手动通过图像编辑工具去除全景图像中的目标对象对应的区域,十分不方便,给用户造成使用困扰。
发明内容
本申请实施例提供了一种全景图像的目标对象去除方法、装置、服务器及存储介质,可以解决现有技术中需要用户手动通过图像编辑工具去除全景图像中的目标区域, 造成用户使用困扰。
第一方面,本申请实施例提供了一种全景图像的目标对象去除方法,包括:
获取待处理全景图像;
确定出所述待处理全景图像中目标对象所对应的目标区域图像;
去除所述待处理全景图像中的目标区域图像,得到全景图像。
在第一方面的一种可能的实现方式中,确定出所述待处理全景图像中目标对象所对应的目标区域图像,包括:
提取所述待处理全景图像中的目标平面图像;
将所述目标平面图像输入至预先训练的分割网络中,得到目标区域图像。
在第一方面的一种可能的实现方式中,所述预先训练的分割网络包括缩小路径网络模块、扩展路径网络模块以及转换层网络模块;
将所述目标平面图像输入至预先训练的分割网络中,得到目标区域图像,包括:
根据所述缩小路径网络模块确定出所述目标平面图像的全局信息以及局部信息;
基于所述所述目标平面图像的全局信息以及局部信息,根据所述扩展路径网络模块,对所述目标平面图像的像素点类别进行预测,得到像素点类别预测结果;
基于所述目标平面图像的像素点类别预测结果,根据所述转换层网络模块对所述目标平面图像进行划分,得到目标对象对应的掩码图像,将所述掩码图像作为所述目标区域图像。
在第一方面的一种可能的实现方式中,去除所述待处理全景图像中的目标区域图像,得到全景图像,包括:
将所述目标区域图像添加至所述目标平面图像,得到模糊平面图像;
将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像;
将所述清晰平面图像映射至所述待处理全景图像,根据所述清晰平面图像对所述待处理全景图像中所述目标区域图像的像素点进行采样填充,得到全景图像。
在第一方面的一种可能的实现方式中,预先训练的图像修复神经网络包括粗糙网络模块和加强网络模块;
将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像,包括:
根据所述粗糙网络模块推断所述模糊平面图像中存在缺失的部分,生成补全平面图像;
基于所述目标区域图像,根据所述加强网络模块对所述补全平面图像中的未知区域进行加强,得到清晰平面图像。
在第一方面的一种可能的实现方式中,将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像之后,还包括:
截取所述清晰平面图像的中心图像;
将所述中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像;
对所述清晰平面图像进行第一预设插值处理,将所述高清晰度中心图像添加至第一预设插值处理后的清晰平面图像,得到第一预设像素数量的清晰平面图像;
对所述目标区域图像进行第二预设插值处理,得到第二预设像素数量的目标区域图像;
将所述第一预设像素数量的清晰平面图像映射至所述待处理全景图像,根据所述第一预设像素数量的清晰平面图像对所述待处理全景图像中所述第二预设像素数量的目标区域图像的像素点进行采样填充,得到全景图像。
在第一方面的一种可能的实现方式中,所述预先训练的强化神经网络包括生成网络模块和判别网络模块;
将所述中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像,包括:
将噪声图像输入至所述生成网络模板,生成仿真图像;
将所述中心图像和仿真图像输入至所述判别网络模块,得到高清晰度中心图像。
第二方面,本申请实施例提供了一种全景图像的目标对象去除装置,包括:
获取模块,用于获取待处理全景图像;
确定模块,用于确定出所述待处理全景图像中所述目标对象所在的目标区域图像;
去除模块,用于去除所述待处理全景图像中的目标区域图像,得到全景图像。
在一种可能实现的方式中,确定模块包括:
提取子模块,用于提取所述待处理全景图像中的目标平面图像;
分割子模块,用于将所述目标平面图像输入至预先训练的分割网络中,得到目标区域图像。
在一种可能实现的方式中,所述预先训练的分割网络包括缩小路径网络模块、扩展路径网络模块以及转换层网络模块;所述分割子模块包括:
信息确定单元,用于根据所述缩小路径网络模块确定出所述目标平面图像的全局信息以及局部信息;
信息预测单元,用于基于所述所述目标平面图像的全局信息以及局部信息,根据所述扩展路径网络模块,对所述目标平面图像的像素点类别进行预测,得到像素点类别预测结果;
划分单元,用于基于所述目标平面图像的像素点类别预测结果,根据所述转换层网络模块对所述目标平面图像进行划分,得到目标对象对应的掩码图像,将所述掩码图像作为所述目标区域图像。
在一种可能实现的方式中,所述去除模块包括:
模糊处理子模块,用于将所述目标区域图像添加至所述目标平面图像,得到模糊平面图像;
清晰处理子模块,用于将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像;
采样填充子模块,用于将所述清晰平面图像映射至所述待处理全景图像,根据所述清晰平面图像对所述待处理全景图像中所述目标区域图像的像素点进行采样填充,得到全景图像。
在一种可能实现的方式中,预先训练的图像修复神经网络包括粗糙网络模块和加强网络模块;所述清晰处理子模块,包括:
补全单元,用于根据所述粗糙网络模块推断所述模糊平面图像中存在缺失的部分,生成补全平面图像;
加强单元,用于基于所述目标区域图像,根据所述加强网络模块对所述补全平面图像中的未知区域进行加强,得到清晰平面图像。
在一种可能实现的方式中,所述去除模块还包括:
截取子模块,用于截取所述清晰平面图像的中心图像;
强化子模块,用于将所述中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像;
第一数值处理子模块,用于对所述清晰平面图像进行第一预设插值处理,将所述高清晰度中心图像添加至第一预设插值处理后的清晰平面图像,得到第一预设像素数量的清晰平面图像;
第二数值处理子模块,用于对所述目标区域图像进行第二预设插值处理,得到第二预设像素数量的目标区域图像;
采用填充模块,用于将所述第一预设像素数量的清晰平面图像映射至所述待处理全景图像,根据所述第一预设像素数量的清晰平面图像对所述待处理全景图像中所述第二预设像素数量的目标区域图像的像素点进行采样填充,得到全景图像。
在一种可能实现的方式中,所述预先训练的强化神经网络包括生成网络模块和判别网络模块;所述强化子模块,包括:
生成子模块,用于将噪声图像输入至所述生成网络模板,生成仿真图像;
判别子模块,用于将所述中心图像和仿真图像输入至所述判别网络模块,得到高清晰度中心图像。
第三方面,本申请实施例提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
本申请实施例与现有技术相比存在的有益效果是:
本申请实施例,通过获取待处理全景图像,确定出待处理全景图像中目标对象所对应的目标区域图像,去除待处理全景图像中的目标区域图像,得到全景图像。可见,本申请可以自动通过服务器对全景相机拍摄的全景图像进行目标对象去除,不需要用户手动通过图像编辑工具去除全景图像中的目标对象对应的区域。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的全景图像的目标对象去除方法的流程示意图;
图2是本申请实施例提供的全景图像的目标对象去除方法的图1中步骤S104的具体实现流程示意图;
图3是本申请实施例提供的全景图像的目标对象去除方法的图2中步骤S204的具体实现流程示意图;
图4是本申请实施例提供的全景图像的目标对象去除方法的图1中步骤S106的具体实现流程示意图;
图5是本申请实施例提供的全景图像的目标对象去除方法的图4中步骤S404的具体实现流程示意图;
图6是本申请实施例提供的全景图像的目标对象去除方法的图5中步骤S504之后的流程示意图;
图7是本申请实施例提供的全景图像的目标对象去除方法的图6中步骤S604的具体实现流程示意图;
图8是本申请实施例提供的全景相机目标去除装置的结构示意图;
图9是本申请实施例提供的服务器的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
下面将通过具体实施例对本申请实施例提供的技术方案进行介绍。
参见图1,为本申请实施例提供的全景图像的目标对象去除方法的流程示意图,作为示例而非限定,该方法可以应用于服务器,该服务器与全景相机连接,该方法可以包括以下步骤:
步骤S102、获取待处理全景图像。
其中,待处理全景图像是指全景相机拍摄的图像捕捉整个场景的图像信息拍摄得到的图像,优选地,全景相机可以是八目相机,八目相机由上下两组,每组四个鱼眼镜头组成,四个镜头分别采集四组镜头图像拼接成一个360°全景图像。
步骤S104、确定出待处理全景图像中目标对象所对应的目标区域图像。
其中,目标对象是指三脚架,待处理全景图像中目标对象所对应的目标区域图像是指待处理全景图像中的表征三脚架所对应的区域图像。
可以理解的是,用户通过全景相机(例如球幕相机)捕捉整个场景的图像信息拍摄得到的全景图像,由于全景图像拍摄范围覆盖较大,导致拍摄得到的全景图像中存在不必要的三脚架,影响用户的视觉体验。
具体应用中,如图2所示,为本申请实施例提供的全景图像的目标对象去除方法的图1中步骤S104的具体实现流程示意图,确定出待处理全景图像中目标对象所对应的目标区域图像,包括:
步骤S202、提取待处理全景图像中的目标平面图像。
示例性地,以目标对象为三脚架为例,那么将待处理全景图像转换成可以组成一个立方体的6张512*512的平面图像,并从中提取出在立方体中的俯视方位对应的平面图像作为目标平面图像。可以理解的是,三脚架在全景图像的固定位置,一般地,将待处理全景图像转换成可以组成一个立方体的6张512*512的平面图像之后,立方体中的俯视方位对应的平面图像包含三角架对应的全部图像信息。
步骤S204、将目标平面图像输入至预先训练的分割网络中,得到目标区域图像。
其中,预先训练的分割网络包括缩小路径网络模块、扩展路径网络模块以及转换层网络模块。
可以理解的是,本申请实施例中将目标平面图像输入至预先训练的分割网络中,得到目标区域图像,实施上是图像分割的过程,将目标平面图像中表征的对象轮廓通过不同的掩码方式显示出来。
需说明的是,本申请实施例中,预先训练的分割网络是根据开源的数据集进行训练得到的。
具体应用中,如图3所示,为本申请实施例提供的全景图像的目标对象去除方法的图2中步骤S204的具体实现流程示意图,将目标平面图像输入至预先训练的分割网络中,得到目标区域图像,包括:
步骤S302、根据缩小路径网络模块确定出目标平面图像的全局信息以及局部信息。
其中,全局信息是指能够表征目标平面图像整体像素特征的信息,例如目标平面图像中整个对象的轮廓信息;局部信息是指能够表征目标平面图像局部像素特征的信息,例如,局部轮廓信息。
示例性地,缩小路径网络模包括多个卷积层和多个池化层,卷积层和池化层配合对目标平面图像进行降采样操作,具体地,每两个3*3的卷积层连接一个2*2的最大池化层,卷积层之间的采用relu激活函数来对目标平面图像进行降采样操作,来确定出目标平面图像的全局信息以及局部信息。
步骤S304、基于目标平面图像的全局信息以及局部信息,根据扩展路径网络模块,对目标平面图像的像素点类别进行预测,得到像素点类别预测结果。
示例性地,扩展路径网络模块包括括多个卷积层和多个池化层,卷积层和池化层配合对降采样后的目标平面图像和特征图像进行升采样的操作。具体地,每一个2*2的卷积层连接一个连接两个3*3的卷积层,卷积层之间的采用relu激活函数来对降采样后的目标平面图像和特征图像进行升采样,来预测目标平面图像的像素点类别,得到像素点类别预测结果。
步骤S306、基于目标平面图像的像素点类别预测结果,根据转换层网络模块对目标平面图像进行划分,得到目标对象对应的掩码图像,将掩码图像作为目标区域图像。
示例性地,转换层网络模块可以是1*1的卷积层,可以将像素点类别预测结果对应的特征向量转换为图像分类结果,其中,图像分类结果包括目标对象对应的掩码图像。
步骤S106、去除待处理全景图像中的目标区域图像,得到全景图像。
本申请实施例中,去除目标对象的核心思想是先确定出全景图像中目标对象对应的掩码图像即区域图像,然后利用图像修复技术去除掩码图像(即去除全景图像中目标对象),相对于现有技术直接利用神经网络模型进行全景图像的目标对象去除来说,去除全景图像中目标对象的同时还保证了图像显示效果。
具体应用中,如图4所示,为本申请实施例提供的全景图像的目标对象去除方法的图1中步骤S106的具体实现流程示意图,去除待处理全景图像中的目标区域图像,得到全景图像,包括:
步骤S402、将目标区域图像添加至目标平面图像,得到模糊平面图像。
可以理解的是,将目标区域图像即掩码图像添加至目标平面图像中对应的目标对象的区域,得到模糊平面图像。其中,模糊平面图像中的掩码部分即目标区域图像部分的像素值为255。
步骤S404、将模糊平面图像以及目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像。
其中,预先训练的图像修复神经网络包括粗糙网络模块和加强网络模块。
具体应用中,如图5所示,为本申请实施例提供的全景图像的目标对象去除方法的图4中步骤S404的具体实现流程示意图,将模糊平面图像以及目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像,包括:
步骤S502、根据粗糙网络模块推断模糊平面图像中存在缺失的部分,生成补全平面图像。
示例性地,粗糙网络模块包括编码层、空洞卷积层以及解码层,其中,编码层对模糊平面图像进行编码处理,空洞卷积层对编码处理后的模糊平码图像进行特征提取,推断模糊平面图像中存在缺失的部分,然后解码层根据推断模糊平面图像中存在缺失的部分生成补全平面图像。其中,补全平面图像包括已知区域以及未知区域(即模糊平面图像中存在缺失的部分补缺后的区域)。
步骤S504、基于目标区域图像,根据加强网络模块对补全平面图像中的未知区域进行加强,得到清晰平面图像。
其中,清晰平面图像的大小为512*512。示例性地,加强网络模块包括注意力模块以及提取模块,其中,注意力模块利用补全平面图像的已知区域对补全平面图像中的未知区域进行卷积计算,提取模块对提取出经过卷积计算后的补全平面图像作为清晰平面图像。
在其它一些实施方式中,如图6所示,为本申请实施例提供的全景图像的目标对象去除方法的图5中步骤S504之后的流程示意图,将模糊平面图像以及目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像之后,还包括:
步骤S602、截取清晰平面图像的中心图像。
步骤S604、将中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像。
其中,预先训练的强化神经网络包括生成网络模块和判别网络模块。
需说明的是,预先训练的强化神经网络可以根据开源数据集进行训练得到。
具体应用中,如图7所示,为本申请实施例提供的全景图像的目标对象去除方法的图6中步骤S604的具体实现流程示意图,将中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像,包括:
步骤S702、将噪声图像输入至生成网络模板,生成仿真图像。
其中,噪声图像是随机产生的。
步骤S704、将中心图像和仿真图像输入至判别网络模块,得到高清晰度中心图像。
可以理解的是,本申请实施例中的强化神经网络是基于对抗学习网络进行构成的,具体可以是SRGAN超分辨率神经网络,达到提升图像分辨率的同时,减少计算资源消耗的效果。
步骤S606、对清晰平面图像进行第一预设插值处理,将高清晰度中心图像添加至第一预设插值处理后的清晰平面图像,得到第一预设像素数量的清晰平面图像。
其中,第一预设插值可以是双线性插值,第一预设像素数量为2048*2048。
步骤S608、对目标区域图像进行第二预设插值处理,得到预设像素数量的目标区域图像。
其中,第二预设插值可以是双线性插值,第二预设像素数量为2048*2048。
步骤S610、将第一预设像素数量的清晰平面图像映射至待处理全景图像,根据第一预设像素数量的清晰平面图像对待处理全景图像中第二预设像素数量的目标区域图像的像素点进行采样填充,得到全景图像。
可以理解的是,预设像素数量的清晰平面图像和预设像素数量的目标区域图像的像素大小一致才可以达到完整的采样填充效果。
具体应用中,根据第一预设像素数量的清晰平面图像的各个像素点的像素值填充待处理全景图像中第二预设像素数量的目标区域图像的各个像素点的像素值。
本申请实施例中,还可以借助强化神经网络提高填充至待处理全景图像中目标区域图像的图像的像素分辨率。
步骤S506、将清晰平面图像映射至待处理全景图像,根据清晰平面图像对待处理全景图像中目标区域图像的像素点进行采样填充,得到全景图像。
其中,清晰平面图像和目标区域图像的像素数量一致。
具体应用中,根据清晰平面图像的各个像素点的像素值填充待处理全景图像中目标区域图像的各个像素点的像素值。
本申请实施例,通过获取待处理全景图像,确定出待处理全景图像中目标对象所对应的目标区域图像,去除待处理全景图像中的目标区域图像,得到全景图像。可见,本申请可以自动通过服务器对全景相机拍摄的全景图像进行目标对象去除,不需要用户手动通过图像编辑工具去除全景图像中的目标对象对应的区域。
为了进一步理解本申请实施例,在目标对象为三脚架时,下面通过一个具体应用流程步骤对本申请实施例的步骤S102-步骤S106的进行说明:
S1、输入一张全景图像,记为全景图像sphere。
S2、将全景图像sphere转成6个512*512的图像cube,取其中的俯视图,记为俯视图图像cube_0。
S3、将俯视图图像cube_0送入unet网络,预测出三脚架掩码图像,记为三脚架掩码图像mask。
S4、将三脚架掩码图像mask加到俯视图图像cube_0中,生成加掩码后的俯视图(掩码部分的像素值为255),记为俯视图图像masked。
S5、将俯视图图像masked、三脚架掩码图像mask送入inpainting网络,生成修复后的图像,记为图像inpainited,大小为512*512。
S6、取图像inpainited的中心图像,大小为256*256,记为中心图像sr_in。
S7、将中心图像sr_in送入超分辨网络fast_srgan,生成1024*1024图像,记为图像sr_out。
S8、将S5的图像inpainited进行双线性插值,变为2048*2048大小图像,并将s7中的sr_out图像补回到该图像inpainited,得到的图像记为图像net_out。
S9、将s3中的三脚架掩码图像mask进行双线性插值,变为2048*2048大小图像,记为图像mask_n。
S10、结合s9中的图像mask_n,将s8中的图像net_out映射回全景图像,mask_n掩码对应全景图像sphere的像素从图像net_out中采样填充。
可见,本申请去除三脚架的核心思想是先确定出全景图像中三脚架对应的掩码图像,然后利用图像修复技术去除掩码图像,相对于现有技术直接利用神经网络模型进行全景图像的目标对象去除来说,去除全景图像中目标对象的同时还保证了图像显示效果。另外,还通过超分辨网络提高图像分辨率,进一步保证了图像显示效果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的全景图像的目标对象去除方法,图8示出了本申请实施例提供的全景图像的目标对象去除装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图8,该装置包括:
获取模块81,用于获取待处理全景图像;
确定模块82,用于确定出所述待处理全景图像中所述目标对象所在的目标区域图像;
去除模块83,用于去除所述待处理全景图像中的目标区域图像,得到全景图像。
在一种可能实现的方式中,确定模块包括:
提取子模块,用于提取所述待处理全景图像中的目标平面图像;
分割子模块,用于将所述目标平面图像输入至预先训练的分割网络中,得到目标区域图像。
在一种可能实现的方式中,所述预先训练的分割网络包括缩小路径网络模块、扩展路径网络模块以及转换层网络模块;所述分割子模块包括:
信息确定单元,用于根据所述缩小路径网络模块确定出所述目标平面图像的全局信息以及局部信息;
信息预测单元,用于基于所述所述目标平面图像的全局信息以及局部信息,根据所述扩展路径网络模块,对所述目标平面图像的像素点类别进行预测,得到像素点类别预测结果;
划分单元,用于基于所述目标平面图像的像素点类别预测结果,根据所述转换层网络模块对所述目标平面图像进行划分,得到目标对象对应的掩码图像,将所述掩码图像作为所述目标区域图像。
在一种可能实现的方式中,所述去除模块包括:
模糊处理子模块,用于将所述目标区域图像添加至所述目标平面图像,得到模糊平面图像;
清晰处理子模块,用于将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像;
采样填充子模块,用于将所述清晰平面图像映射至所述待处理全景图像,根据所述清晰平面图像对所述待处理全景图像中所述目标区域图像的像素点进行采样填充,得到全景图像。
在一种可能实现的方式中,预先训练的图像修复神经网络包括粗糙网络模块和加强网络模块;所述清晰处理子模块,包括:
补全单元,用于根据所述粗糙网络模块推断所述模糊平面图像中存在缺失的部分,生成补全平面图像;
加强单元,用于基于所述目标区域图像,根据所述加强网络模块对所述补全平面图像中的未知区域进行加强,得到清晰平面图像。
在一种可能实现的方式中,所述去除模块还包括:
截取子模块,用于截取所述清晰平面图像的中心图像;
强化子模块,用于将所述中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像;
第一数值处理子模块,用于对所述清晰平面图像进行第一预设插值处理,将所述高清晰度中心图像添加至第一预设插值处理后的清晰平面图像,得到第一预设像素数量的清晰平面图像;
第二数值处理子模块,用于对所述目标区域图像进行第二预设插值处理,得到第二预设像素数量的目标区域图像;
采用填充模块,用于将所述第一预设像素数量的清晰平面图像映射至所述待处理全景图像,根据所述第一预设像素数量的清晰平面图像对所述待处理全景图像中所述第二预设像素数量的目标区域图像的像素点进行采样填充,得到全景图像。
在一种可能实现的方式中,所述预先训练的强化神经网络包括生成网络模块和判别网络模块;所述强化子模块,包括:
生成子模块,用于将噪声图像输入至所述生成网络模板,生成仿真图像;
判别子模块,用于将所述中心图像和仿真图像输入至所述判别网络模块,得到高清晰度中心图像。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图9为本申请一实施例提供的服务器的结构示意图。如图9所示,该实施例的服务器9包括:至少一个处理器90、存储器91以及存储在所述存储器91中并可在所述至少一个处理器90上运行的计算机程序92,所述处理器90执行所述计算机程序92时实现上述任意方法实施例中的步骤。
所述服务器9可以是云端服务器等计算设备。该服务器可包括,但不仅限于,处理器90、存储器91。本领域技术人员可以理解,图9仅仅是服务器9的举例,并不构成对服务器9的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器90可以是中央处理单元(Central Processing Unit,CPU),该处理器90还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器91在一些实施例中可以是所述服务器9的内部存储单元,例如服务器9的硬盘或内存。所述存储器91在另一些实施例中也可以是所述服务器9的外部存储设备,例如所述服务器9上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器91还可以既包括所述服务器9的内部存储单元也包括外部存储设备。所述存储器91用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种存储介质,具体可以是计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到服务器的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (8)

1.一种全景图像的目标对象去除方法,其特征在于,包括:
获取待处理全景图像;
确定出所述待处理全景图像中目标对象所对应的目标区域图像;
去除所述待处理全景图像中的目标区域图像,得到全景图像;
确定出所述待处理全景图像中目标对象所对应的目标区域图像,包括:
提取所述待处理全景图像中的目标平面图像;
将所述目标平面图像输入至预先训练的分割网络中,得到目标区域图像;
所述预先训练的分割网络包括缩小路径网络模块、扩展路径网络模块以及转换层网络模块;
将所述目标平面图像输入至预先训练的分割网络中,得到目标区域图像,包括:
根据所述缩小路径网络模块确定出所述目标平面图像的全局信息以及局部信息;
基于所述目标平面图像的全局信息以及局部信息,根据所述扩展路径网络模块,对所述目标平面图像的像素点类别进行预测,得到像素点类别预测结果;
基于所述目标平面图像的像素点类别预测结果,根据所述转换层网络模块对所述目标平面图像进行划分,得到目标对象对应的掩码图像,将所述掩码图像作为所述目标区域图像。
2.如权利要求1所述的全景图像的目标对象去除方法,其特征在于,去除所述待处理全景图像中的目标区域图像,得到全景图像,包括:
将所述目标区域图像添加至所述目标平面图像,得到模糊平面图像;
将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像;
将所述清晰平面图像映射至所述待处理全景图像,根据所述清晰平面图像对所述待处理全景图像中所述目标区域图像的像素点进行采样填充,得到全景图像。
3.如权利要求2所述的全景图像的目标对象去除方法,其特征在于,预先训练的图像修复神经网络包括粗糙网络模块和加强网络模块;
将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像,包括:
根据所述粗糙网络模块推断所述模糊平面图像中存在缺失的部分,生成补全平面图像;
基于所述目标区域图像,根据所述加强网络模块对所述补全平面图像中的未知区域进行加强,得到清晰平面图像。
4.如权利要求2所述的全景图像的目标对象去除方法,其特征在于,将所述模糊平面图像以及所述目标区域图像输入至预先训练的图像修复神经网络,得到清晰平面图像之后,还包括:
截取所述清晰平面图像的中心图像;
将所述中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像;
对所述清晰平面图像进行第一预设插值处理,将所述高清晰度中心图像添加至第一预设插值处理后的清晰平面图像,得到第一预设像素数量的清晰平面图像;
对所述目标区域图像进行第二预设插值处理,得到第二预设像素数量的目标区域图像;
将所述第一预设像素数量的清晰平面图像映射至所述待处理全景图像,根据所述第一预设像素数量的清晰平面图像对所述待处理全景图像中所述第二预设像素数量的目标区域图像的像素点进行采样填充,得到全景图像。
5.如权利要求4所述的全景图像的目标对象去除方法,其特征在于,所述预先训练的强化神经网络包括生成网络模块和判别网络模块;
将所述中心图像输入至预先训练的强化神经网络,得到高清晰度中心图像,包括:
将噪声图像输入至所述生成网络模块,生成仿真图像;
将所述中心图像和仿真图像输入至所述判别网络模块,得到高清晰度中心图像。
6.一种全景图像的目标对象去除装置,其特征在于,包括:
获取模块,用于获取待处理全景图像;
确定模块,用于确定出所述待处理全景图像中所述目标对象所在的目标区域图像;
去除模块,用于去除所述待处理全景图像中的目标区域图像,得到全景图像;
所述确定模块包括:
提取子模块,用于提取所述待处理全景图像中的目标平面图像;
分割子模块,用于将所述目标平面图像输入至预先训练的分割网络中,得到目标区域图像;
所述预先训练的分割网络包括缩小路径网络模块、扩展路径网络模块以及转换层网络模块;所述分割子模块包括:
信息确定单元,用于根据所述缩小路径网络模块确定出所述目标平面图像的全局信息以及局部信息;
信息预测单元,用于基于所述目标平面图像的全局信息以及局部信息,根据所述扩展路径网络模块,对所述目标平面图像的像素点类别进行预测,得到像素点类别预测结果;
划分单元,用于基于所述目标平面图像的像素点类别预测结果,根据所述转换层网络模块对所述目标平面图像进行划分,得到目标对象对应的掩码图像,将所述掩码图像作为所述目标区域图像。
7.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的方法。
CN202110783586.3A 2021-07-12 2021-07-12 全景图像的目标对象去除方法、装置、服务器及存储介质 Active CN113284074B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110783586.3A CN113284074B (zh) 2021-07-12 2021-07-12 全景图像的目标对象去除方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110783586.3A CN113284074B (zh) 2021-07-12 2021-07-12 全景图像的目标对象去除方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN113284074A true CN113284074A (zh) 2021-08-20
CN113284074B CN113284074B (zh) 2021-12-07

Family

ID=77286599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110783586.3A Active CN113284074B (zh) 2021-07-12 2021-07-12 全景图像的目标对象去除方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113284074B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180218502A1 (en) * 2017-01-27 2018-08-02 Arterys Inc. Automated segmentation utilizing fully convolutional networks
CN109035147A (zh) * 2018-08-10 2018-12-18 Oppo广东移动通信有限公司 图像处理方法及装置、电子装置、存储介质和计算机设备
CN110728270A (zh) * 2019-12-17 2020-01-24 北京影谱科技股份有限公司 视频人物的去除方法、装置及设备及计算机可读存储介质
CN110942465A (zh) * 2019-11-08 2020-03-31 浙江工业大学 一种基于ResUnet的3视图PET图像分割方法
US20200380695A1 (en) * 2019-05-28 2020-12-03 Zongwei Zhou Methods, systems, and media for segmenting images
CN112581567A (zh) * 2020-12-25 2021-03-30 腾讯科技(深圳)有限公司 图像处理方法、装置、电子设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180218502A1 (en) * 2017-01-27 2018-08-02 Arterys Inc. Automated segmentation utilizing fully convolutional networks
CN109035147A (zh) * 2018-08-10 2018-12-18 Oppo广东移动通信有限公司 图像处理方法及装置、电子装置、存储介质和计算机设备
US20200380695A1 (en) * 2019-05-28 2020-12-03 Zongwei Zhou Methods, systems, and media for segmenting images
CN110942465A (zh) * 2019-11-08 2020-03-31 浙江工业大学 一种基于ResUnet的3视图PET图像分割方法
CN110728270A (zh) * 2019-12-17 2020-01-24 北京影谱科技股份有限公司 视频人物的去除方法、装置及设备及计算机可读存储介质
CN112581567A (zh) * 2020-12-25 2021-03-30 腾讯科技(深圳)有限公司 图像处理方法、装置、电子设备及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIAHUI YU 等: "Generative Image Inpainting with Contextual Attention", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
张博洋 等: "基于U-Net网络的林木图像分割研究", 《森林工程》 *

Also Published As

Publication number Publication date
CN113284074B (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN110136066B (zh) 面向视频的超分辨率方法、装置、设备和存储介质
CN111476737B (zh) 一种图像处理方法、智能设备及计算机可读存储介质
CN112330574B (zh) 人像修复方法、装置、电子设备及计算机存储介质
CN111583097A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
WO2022000862A1 (zh) 鱼眼图像中的对象检测方法、装置及存储介质
US20130128069A1 (en) Methods and Apparatus for Rendering Output Images with Simulated Artistic Effects from Focused Plenoptic Camera Data
CN112184585B (zh) 一种基于语义边缘融合的图像补全方法及系统
CN110782424B (zh) 图像融合方法、装置、电子设备及计算机可读存储介质
CN111444365A (zh) 图像分类方法、装置、电子设备及存储介质
CN115937794A (zh) 小目标对象检测方法、装置、电子设备及存储介质
CN114758145A (zh) 一种图像脱敏方法、装置、电子设备及存储介质
CN113744142B (zh) 图像修复方法、电子设备及存储介质
CN116760937B (zh) 一种基于多机位的视频拼接方法、装置、设备及存储介质
CN113570725A (zh) 基于聚类的三维表面重建方法、装置、服务器及存储介质
CN113284074B (zh) 全景图像的目标对象去除方法、装置、服务器及存储介质
CN115861922A (zh) 一种稀疏烟火检测方法、装置、计算机设备及存储介质
CN116071279A (zh) 图像处理方法、装置、计算机设备和存储介质
CN115423697A (zh) 图像修复方法、终端及计算机存储介质
CN114913105A (zh) 激光点云融合方法、装置、服务器及计算机可读存储介质
CN113724153A (zh) 一种基于机器学习的图像多余人物消除方法
EP1227436A2 (en) Method for zooming digital images
CN117745595B (zh) 图像处理方法、装置、电子设备及存储介质
CN117422855B (zh) 面向机器视觉的图像预处理方法、装置、设备及存储介质
CN115526775A (zh) 图像数据处理方法及装置
CN116824129A (zh) 人像抠图方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 2-101-1 / 2-201 / 2-501, building 2, science and Technology Innovation Park, No.1 harbor, No.1 Jintang Road, high tech Zone, Zhuhai City, Guangdong Province

Applicant after: CHINA-GERMANY (ZHUHAI) ARTIFICIAL INTELLIGENCE INSTITUTE Co.,Ltd.

Applicant after: ZHUHAI 4DAGE NETWORK TECHNOLOGY Co.,Ltd.

Address before: 519080 2-101-1 / 2-201 / 2-501, building 2, science and Innovation Park, No. 1, Gangwan, Tangjiawan Town, high tech Zone, Zhuhai, Guangdong

Applicant before: CHINA-GERMANY (ZHUHAI) ARTIFICIAL INTELLIGENCE INSTITUTE Co.,Ltd.

Applicant before: ZHUHAI 4DAGE NETWORK TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant