CN115937010B - 一种图像处理方法、装置、设备及介质 - Google Patents

一种图像处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN115937010B
CN115937010B CN202210986783.XA CN202210986783A CN115937010B CN 115937010 B CN115937010 B CN 115937010B CN 202210986783 A CN202210986783 A CN 202210986783A CN 115937010 B CN115937010 B CN 115937010B
Authority
CN
China
Prior art keywords
image
target
processing
pixel point
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210986783.XA
Other languages
English (en)
Other versions
CN115937010A (zh
Inventor
王光伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202210986783.XA priority Critical patent/CN115937010B/zh
Priority to US18/005,926 priority patent/US20240249399A1/en
Priority to PCT/CN2022/130049 priority patent/WO2024036764A1/zh
Priority to EP22838626.4A priority patent/EP4350605A4/en
Publication of CN115937010A publication Critical patent/CN115937010A/zh
Application granted granted Critical
Publication of CN115937010B publication Critical patent/CN115937010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

本公开实施例涉及一种图像处理方法、装置、设备及介质,其中该方法包括:获取待处理的原始图像,其中,原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;响应于对原始图像的目标处理请求,确定原始图像中的目标检测框;对原始图像中目标检测框对应的第一图像进行畸变校正处理,得到第二图像;基于第二图像确定第一图像中的待处理像素点,并对待处理像素点进行目标处理,得到目标图像。本公开实施例避免了畸变校正后再畸变的过程导致的消耗时长较长以及多次采样导致图像清晰度降低的问题,有效提升了畸变校正的处理效率,并且保证了图像较高的清晰度,提升了图像的处理效果。

Description

一种图像处理方法、装置、设备及介质
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、设备及介质。
背景技术
随着图像处理技术的不断发展,在图像/视频拍摄或直播中对人的脸部或身体部位进行美化功能的应用越来越广泛。
而在虚拟现实技术(Virtual Reality,VR)应用中,视频或图像通常是全景或半全景,人在图像的边缘会发生畸变,导致美化处理的效果不佳。
发明内容
为了解决上述技术问题,本公开提供了一种图像处理方法、装置、设备及介质。
本公开实施例提供了一种图像处理方法,所述方法包括:
获取待处理的原始图像,其中,所述原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;
响应于对所述原始图像的目标处理请求,确定所述原始图像中的目标检测框;
对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像;
基于所述第二图像确定所述第一图像中的待处理像素点,并对所述待处理像素点进行目标处理,得到目标图像。
本公开实施例还提供了一种图像处理装置,所述装置包括:
获取模块,用于获取待处理的原始图像,其中,所述原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;
检测框模块,用于响应于对所述原始图像的目标处理请求,确定所述原始图像中的目标检测框;
畸变校正模块,用于对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像;
处理模块,用于基于所述第二图像确定所述第一图像中的待处理像素点,并对所述待处理像素点进行目标处理,得到目标图像。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的图像处理方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的图像处理方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的图像处理方案,获取待处理的原始图像,其中,原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;响应于对原始图像的目标处理请求,确定原始图像中的目标检测框;对原始图像中目标检测框对应的第一图像进行畸变校正处理,得到第二图像;基于第二图像确定第一图像中的待处理像素点,并对待处理像素点进行目标处理,得到目标图像。采用上述技术方案,通过对图像中检测框对应的局部区域图像进行畸变校正,基于畸变校正后的图像确定畸变校正前的图像的待处理像素点,并对其进行目标处理,进而实现对原始图像的目标处理,由于基于无畸变的图像确定原始图像中需要处理的部分,处理过程中需要再映射回原始图像的仅为需要处理的像素点,避免了对原始图像畸变校正后再畸变的过程导致的消耗时长较长,以及多次采样导致图像清晰度降低的问题,有效提升了图像处理效率,并且保证了较高的图像清晰度,提升了图像的处理效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种图像处理方法的流程示意图;
图2为本公开实施例提供的另一种图像处理方法的流程示意图;
图3为本公开实施例提供的一种检测框的示意图;
图4为本公开实施例提供的一种图像处理装置的结构示意图;
图5为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
相关技术中,对图像或视频进行美化处理时,首先检测需要进行美化的部位的关键点,然后根据关键点进行美化特效处理,然而当人在图像或视频的边缘时往往会发生畸变,导致关键点失效或美化特效的算法效果出错,进而导致美化处理的效果不佳。相关技术中针对普通图像可以通过对视频或图像中需要处理的局部区域进行畸变校正处理来解决上述问题,但是针对全景或半全景图像类的图像,在对畸变校正之后的图像进行美化处理之后需要再畸变回来,在此过程中对图像的多次采样导致图像的清晰度降低,并且图像处理效率较低,难以满足高分辨率下图像处理的实时性要求。
为了解决上述问题,本公开实施例提供了一种图像处理方法,下面结合具体的实施例对该方法进行介绍。
图1为本公开实施例提供的一种图像处理方法的流程示意图,该方法可以由图像处理装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:
步骤101、获取待处理的原始图像,其中,原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种。
其中,原始图像可以是需要进行处理的图像,该原始图像可以为单独的图像也可以为一个视频中的图像帧,并且原始图像可以为具有较大视场角的图像,本公开实施例的原始图像可以包括全景图像、半全景图像和鱼眼图像等中的至少一种,具体不限。原始图像中可以包括目标对象,目标对象可以为正在进行图像或视频拍摄的主体,目标对象的种类的数量不限,例如目标对象可以为人或动物等。
具体的,图像处理装置可以获取待处理的原始图像,获取来源不限,例如可以实时拍摄得到,也可以从互联网或本地获取。
步骤102、响应于对原始图像的目标处理请求,确定原始图像中的目标检测框。
目标处理请求可以是对图像进行特殊处理的请求,本公开实施例的特殊处理以美化处理为例进行说明,美化处理可以包括美妆、瘦脸和长腿等对图像中包括的对象的脸部或身体部位的特殊处理,具体不限。
目标检测框可以是包括需要进行目标处理请求对应的目标处理的部位的一个矩形框,也即包括待处理部位的检测框,例如当待处理部位为脸部,则目标检测框为脸部的最小外接矩形。
具体地,图像处理装置可以检测当前用户的触发操作,当检测到对原始图像的预设触发操作之后,可以确定接收到对原始图像的目标处理请求,预设触发操作可以包括对目标处理请求对应的控件的手势控制操作(如点击、长按、双击等)、语音控制操作或表情控制操作等等,具体不限。之后可以使用预设算法实时检测原始图像并提取包括待处理部位的目标检测框,预设算法可以根据实际情况确定,例如预设算法可以包括聚合通道特征(Aggregate Channel Features,ACF)算法等,仅为示例。
步骤103、对原始图像中目标检测框对应的第一图像进行畸变校正处理,得到第二图像。
其中,第一图像可以是根据目标检测框在原始图像中提取得到的一个尺寸较小的图像,第二图像可以是对第一图像进行畸变校正处理之后的图像。畸变校正,又称反畸变,可以是对图像中因在边缘而发生畸变的现象进行校正的处理过程,校正之后图像可以视为无畸变图像。
在一些实施例中,对原始图像中目标检测框对应的第一图像进行畸变校正处理,得到第二图像,可以包括:提取原始图像中目标检测框对应的第一图像,并采用多线程处理工具对第一图像进行畸变校正处理,得到第二图像。
其中,多线程处理工具可以是用于进行畸变校正处理的工具,通过多线程处理能够提升处理效率,具体的多线程处理工具可以根据实际情况确定,例如多线程处理工具可以包括着色器(Shader)、并行计算平台(Compute Unified Device Architecture,CUDA)等。
上述方案中,通过多线程处理工具仅仅对目标检测框的区域图像进行畸变校正处理,能够有效提升算法处理速度,进而提升后续图像处理的效率。
步骤104、基于第二图像确定第一图像中的待处理像素点,并对待处理像素点进行目标处理,得到目标图像。
其中,目标处理可以是对图像进行的某种特殊处理,本公开实施例的目标处理以美化处理为例进行说明,美化处理可以包括美妆、瘦脸和长腿等对图像中包括的对象的脸部或身体部位的特殊处理,具体不限。目标图像可以是对原始图像进行目标处理之后的图像,例如目标图像可以是对原始图像进行美妆处理之后的图像。
示例性的,图2为本公开实施例提供的另一种图像处理方法的流程示意图,如图2所示,一种可行的实施方式中,基于第二图像确定第一图像中的待处理像素点,可以包括如下步骤:
步骤201、确定第一图像中各第一像素点坐标与第二图像中各第二像素点坐标之间的映射关系。
其中,第一图像可以包括多个第一像素点,各第一像素点在第一图像中的坐标即为第一像素点坐标;第二图像包括多个第二像素点,各第二像素点在第二图像中的坐标即为第二像素点坐标。映射关系可以是第一图像和第二图像中表征同一空间位置点分别在两个图像中的两个像素点坐标之间的对应关系,也即针对各第一图像的每个第一像素点坐标分别确定在畸变校正处理后得到的第二图像中对应的第二像素点坐标,该映射关系中每个第一像素点坐标对应一个第二像素点坐标。
由于上述步骤102中对第一图像进行畸变校正处理是以像素点为单位进行处理,图像处理装置在步骤102之后可以确定第一图像中各第一像素点坐标与第二图像中各第二像素点坐标之间的映射关系。
步骤202、确定第二图像中的目标像素点坐标,并基于映射关系确定目标像素点坐标在第一图像中对应的待处理像素点坐标。
图像处理装置在对原始图像中目标检测框对应的第一图像进行畸变校正处理,得到第二图像之后,可以对第二图像进行关键点检测确定关键点信息,之后可以根据该关键点信息中各关键点与第二图像中各第二像素点坐标之间的位置关系,确定需要进行目标处理的目标像素点坐标,具体的位置关系根据目标处理的部位、处理类型以及处理范围等确定,例如假设目标处理为添加假睫毛,可以将睫毛关键点附近预设范围内的第二像素点坐标确定为需要添加假睫毛的目标像素点坐标,仅为示例。
之后,图像处理装置可以在映射关系中进行查找,确定目标像素点坐标对应的第一像素点坐标,也即得到待处理像素点坐标。
步骤203、将第一图像中的位于待处理像素点坐标的像素点确定为待处理像素点。
其中,待处理像素点可以为第一图像中在后续过程中真正需要进行目标处理的像素点。图像处理装置在确定第一图像的待处理像素点坐标之后,可以将位于该待处理像素点坐标的像素点确定为待处理像素点。之后对该待处理像素点进行目标处理,将目标处理后的第一图像替换原始图像中处理前的第一图像,得到目标图像。
在一些实施例中,当目标处理为添加特效元素,对待处理像素点进行目标处理,得到目标图像,可以包括:在第一图像中待处理像素点上添加特效元素的属性信息,得到目标图像。
其中,特效元素可以理解为用于对目标对象的某一部位添加额外内容的元素,例如特效元素可以包括假睫毛、腮红、帽子等,具体不限。特效元素的属性信息可以是表征特效元素表面的纹理或颜色等属性的信息。
当目标处理为添加特效元素,图像处理装置可以在第一图像中的待处理像素点上添加特效元素的属性信息,即可对待处理像素点实现特效元素的添加,得到目标图像。例如假设目标处理为添加假睫毛,可以将假睫毛纹理的像素值赋予待处理像素点,也即将假睫毛的颜色赋予待处理像素点。
在另一些实施例中,当目标处理为调整特定区域的尺寸,对待处理像素点进行目标处理,得到目标图像,包括:确定第一图像中待处理像素点的关联像素点;将关联像素点对应的像素信息赋值给待处理像素点,得到目标图像。
其中,调整特定区域的尺寸可以是对目标对象的某一部位所在的特定区域的尺寸进行缩小或放大的处理,例如可以对脸部或腿部所在区域进行缩小尺寸处理达到瘦的美化效果。
当目标处理为调整特定区域的尺寸,图像处理装置以像素点为单位进行处理,此时需要针对每个待处理像素点先确定其关联像素点,关联像素点可以是处理实现后的像素点,之后可以将关联像素点的像素信息赋值给待处理像素点,即可实现对特定区域的尺寸调整,得到目标图像。
示例性的,假设目标处理为缩小目标对象的腿部的区域的尺寸,针对第二图像中的一个第二像素点坐标,可以基于其与相应关键点的位置关系判断是否需要进行处理,若需要,则确定该第二像素点坐标在第一图像中对应的第一像素点坐标所在像素点为待处理像素点;确定第二像素点坐标的关联像素点坐标,并将该关联像素点坐标在第一图像中对应的第一像素点坐标所在像素点确定为关联像素点,将关联像素点的像素信息赋值给待处理像素点,即可实现对腿部的缩小尺寸,也即瘦腿。又如:假设目标处理为放大目标对象的眼睛的区域的尺寸,则处理方式与上述示例类似,不同的是确定关联像素点时的目的相反,此时将关联像素点的像素信息赋值给待处理像素点,即可实现对眼睛的放大。
本公开实施例提供的图像处理方案,获取待处理的原始图像,其中,原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;响应于对原始图像的目标处理请求,确定原始图像中的目标检测框;对原始图像中目标检测框对应的第一图像进行畸变校正处理,得到第二图像;基于第二图像确定第一图像中的待处理像素点,并对待处理像素点进行目标处理,得到目标图像。采用上述技术方案,针对所有存在畸变的图像,包括普通图像以及上述视场角较大的图像(包括全景图像、半全景图像和鱼眼图像中的至少一种),可以确保图像的处理效果,例如针对图像中目标对象的美化处理效果。而且,针对上述视场角较大的图像,通过对图像中检测框对应的区域图像进行畸变校正之后,基于畸变校正后的图像确定畸变校正前的图像的待处理像素点并进行目标处理,以实现对原始图像的目标处理,由于基于无畸变的图像确定原始图像中需要处理的部分,处理过程中需要再映射回原始图像的仅为需要处理的像素点,不用对畸变校正后的整个图像进行再次畸变,避免了再次畸变过程中多次采样导致的图像清晰度下降的问题,从而保证了图像较高的清晰度,提升了图像的处理效果。同时,本公开实施例提供的图像处理方案将畸变校正和目标处理结合在一起,目标处理在无畸变的图像坐标空间中进行且直接作用在原始图像上,提升了图像处理速度,避免了对原始图像畸变校正后再畸变的过程导致的耗时长问题,有效提升了图像处理效率,特别是对于高分辨率的视频图像处理,例如对于VR视频图像处理而言,既能确保图像清晰度还能满足视频的实时性要求。
在一些实施例中,当原始图像为视频中的一个图像帧,确定原始图像中的目标检测框,可以包括:获取原始图像的前一图像的初始检测框;将初始检测框扩大预设倍数得到目标检测框。
此时图像处理的对象为多帧图像构成的图像序列,例如可以为视频。其中,原始图像可以为图像序列中的某一图像帧,前一图像可以是图像序列中位于原始图像所在时刻的前一时刻的图像帧,本公开实施例在确定原始图像的目标检测框时还可以基于前一图像的初始检测框来确定,具体可以将初始检测框的尺寸扩大预设倍数得到目标检测框,并且扩大时可以初始检测框的中心点或者一个边界为基准进行扩大,具体不限。初始检测框可以是前一图像对应的检测框。预设倍数可以根据实际情况确定,例如预设倍数可以为2。
示例性的,图3为本公开实施例提供的一种目标检测框的示意图,如图3所示,图中展示了一个原始图像300,该原始图像300中包括前一图像的初始检测框301,假设预设倍数为2,通过对初始检测框301以其中心点为基准扩大两倍可以得到图中的目标检测框302,图中仅为示例,而非限定。
可选的,预设倍数可以与目标对象的移动速度成正比。目标对象的移动速度可以根据视频中在原始图像之前的几个图像帧中目标对应的一个像素点的位置移动距离和时间计算确定。目标对象的移动速度越大,预设倍数可以越大。
可选的,当原始图像为视频中的图像帧,还可以根据目标对象的移动速度确定预测检测框的四个顶点的预测位置,得到预测检测框,并将预测检测框扩大预设倍数得到目标检测框。
上述方案中,当原始图像为视频中的图像帧时,可以直接使用原始图像的前一图像的检测框来确定目标检测框,考虑到目标对象在原始图像的位置相较于前一图像可能具有偏移,因此需要对前一图像的检测框进行扩大,以确保原始图像中的目标对象的待处理部位位于目标检测框内;并且扩大的倍数还可以根据目标对象的移动速度动态调整,进一步提升了检测框确定的准确性。
在一些实施例中,对原始图像中目标检测框对应的第一图像进行畸变校正处理,得到第二图像之后,图像处理方法还可以包括:对第二图像进行关键点检测,得到关键点信息;基于关键点信息优化目标检测框。
其中,关键点信息可以包括第二图像中包括的目标对象的部位的多个关键点的坐标。图像处理装置在得到第二图像之后,可以采用预设关键点检测算法对第二图像进行实时的关键点检测,得到关键点信息,预设关键点检测算法可以根据实际情况确定,例如预设关键点检测算法可以包括主动外观模型(Active Appearance Models,AAM)算法或者其他深度学习算法等,具体不限。之后可以基于关键点信息中各关键点的坐标确定目标对象的待处理部位的最小外接矩形,将该最小外接矩形确定为优化后的目标检测框,该优化后的目标检测框可以作为下一图像进行目标处理时的初始检测框,从而可基于该初始检测框确定下一图像的目标检测框。
上述方案中,基于目标检测框对应的畸变校正处理后的图像进行关键点检测,保证了关键点检测的准确性,并且当处理的图像为视频中的图像帧时,可以利用视频的时间连续性,基于一个图像帧中确定的检测框来确定其后的另一图像帧的检测框,相较于对每一帧图像都实时确定检测框的方式,可以有效提高检测框确定的效率,进而提高后续图像处理的整体效率;并且通过关键点信息对检测框的位置进行不断优化,保证了检测框确定的准确性,进而提升后续图像处理的精确度。
图4为本公开实施例提供的一种图像处理装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图4所示,该装置包括:
获取模块401,用于获取待处理的原始图像,其中,所述原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;
检测框模块402,用于响应于对所述原始图像的目标处理请求,确定所述原始图像中的目标检测框;
畸变校正模块403,用于对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像;
处理模块404,用于基于所述第二图像确定所述第一图像中的待处理像素点,并对所述待处理像素点进行目标处理,得到目标图像。
可选的,当所述原始图像为视频中的一个图像帧,检测框模块402用于:
获取所述原始图像的前一图像的初始检测框;
将所述初始检测框扩大预设倍数得到所述目标检测框。
可选的,所述预设倍数与目标对象的移动速度成正比。
可选的,畸变校正模块403用于:
提取所述原始图像中所述目标检测框对应的第一图像,并采用多线程处理工具对所述第一图像进行畸变校正处理,得到所述第二图像。
可选的,处理模块404包括第一单元,用于:
确定所述第一图像中各第一像素点坐标与所述第二图像中各第二像素点坐标之间的映射关系,每个所述第一像素点坐标对应一个所述第二像素点坐标;
确定所述第二图像中的目标像素点坐标,并基于所述映射关系确定所述目标像素点坐标在所述第一图像中对应的待处理像素点坐标;
将所述第一图像中的位于所述待处理像素点坐标的像素点确定为所述待处理像素点。
可选的,当所述目标处理为添加特效元素,处理模块404包括第二单元,用于:
在所述第一图像中所述待处理像素点上添加所述特效元素的属性信息,得到所述目标图像。
可选的,当所述目标处理为调整特定区域的尺寸,处理模块404包括第三单元,用于:
确定所述第一图像中所述待处理像素点的关联像素点;
将所述关联像素点对应的像素信息赋值给所述待处理像素点,得到所述目标图像。
可选的,所述装置还包括优化模块,用于:对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像之后,
对所述第二图像进行关键点检测,得到关键点信息;
基于所述关键点信息优化所述目标检测框。
本公开实施例所提供的图像处理装置可执行本公开任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。
本公开实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本公开任意实施例所提供的图像处理方法。
图5为本公开实施例提供的一种电子设备的结构示意图。下面具体参考图5,其示出了适于用来实现本公开实施例中的电子设备500的结构示意图。本公开实施例中的电子设备500可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的图像处理方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取待处理的原始图像,其中,所述原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;响应于对所述原始图像的目标处理请求,确定所述原始图像中的目标检测框;对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像;基于所述第二图像确定所述第一图像中的待处理像素点,并对所述待处理像素点进行目标处理,得到目标图像。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
可以理解的是,在使用本公开各实施例公开的技术方案之前,应当依据相关法律法规通过恰当的方式对本公开所涉及的信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (11)

1.一种图像处理方法,其特征在于,包括:
获取待处理的原始图像,其中,所述原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;
响应于对所述原始图像的目标处理请求,确定所述原始图像中的目标检测框;
对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像;
基于所述第二图像确定所述第一图像中的待处理像素点,并对所述待处理像素点进行目标处理,得到目标图像;
基于所述第二图像确定所述第一图像中的待处理像素点,包括:
确定所述第一图像中各第一像素点坐标与所述第二图像中各第二像素点坐标之间的映射关系;
确定所述第二图像中的目标像素点坐标,并基于所述映射关系确定所述目标像素点坐标在所述第一图像中对应的待处理像素点坐标;
将所述第一图像中的位于所述待处理像素点坐标的像素点确定为所述待处理像素点。
2.根据权利要求1所述的方法,其特征在于,当所述原始图像为视频中的一个图像帧,确定所述原始图像中的目标检测框,包括:
获取所述原始图像的前一图像的初始检测框;
将所述初始检测框扩大预设倍数得到所述目标检测框。
3.根据权利要求2所述的方法,其特征在于,所述预设倍数与目标对象的移动速度成正比。
4.根据权利要求1所述的方法,其特征在于,对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像,包括:
提取所述原始图像中所述目标检测框对应的第一图像,并采用多线程处理工具对所述第一图像进行畸变校正处理,得到所述第二图像。
5.根据权利要求1所述的方法,其特征在于,每个所述第一像素点坐标对应一个所述第二像素点坐标。
6.根据权利要求1所述的方法,其特征在于,当所述目标处理为添加特效元素,对所述待处理像素点进行目标处理,得到目标图像,包括:
在所述第一图像中所述待处理像素点上添加所述特效元素的属性信息,得到所述目标图像。
7.根据权利要求1所述的方法,其特征在于,当所述目标处理为调整特定区域的尺寸,对所述待处理像素点进行目标处理,得到目标图像,包括:
确定所述第一图像中所述待处理像素点的关联像素点;
将所述关联像素点对应的像素信息赋值给所述待处理像素点,得到所述目标图像。
8.根据权利要求1所述的方法,其特征在于,对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像之后,所述方法还包括:
对所述第二图像进行关键点检测,得到关键点信息;
基于所述关键点信息优化所述目标检测框。
9.一种图像处理装置,其特征在于,包括:
获取模块,用于获取待处理的原始图像,其中,所述原始图像包括全景图像、半全景图像和鱼眼图像中的至少一种;
检测框模块,用于响应于对所述原始图像的目标处理请求,确定所述原始图像中的目标检测框;
畸变校正模块,用于对所述原始图像中所述目标检测框对应的第一图像进行畸变校正处理,得到第二图像;
处理模块,用于基于所述第二图像确定所述第一图像中的待处理像素点,并对所述待处理像素点进行目标处理,得到目标图像;
处理模块包括第一单元,用于:
确定所述第一图像中各第一像素点坐标与所述第二图像中各第二像素点坐标之间的映射关系;
确定所述第二图像中的目标像素点坐标,并基于所述映射关系确定所述目标像素点坐标在所述第一图像中对应的待处理像素点坐标;
将所述第一图像中的位于所述待处理像素点坐标的像素点确定为所述待处理像素点。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-8中任一所述的图像处理方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-8中任一所述的图像处理方法。
CN202210986783.XA 2022-08-17 2022-08-17 一种图像处理方法、装置、设备及介质 Active CN115937010B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202210986783.XA CN115937010B (zh) 2022-08-17 2022-08-17 一种图像处理方法、装置、设备及介质
US18/005,926 US20240249399A1 (en) 2022-08-17 2022-11-04 Image processing method, device, and medium
PCT/CN2022/130049 WO2024036764A1 (zh) 2022-08-17 2022-11-04 一种图像处理方法、装置、设备及介质
EP22838626.4A EP4350605A4 (en) 2022-08-17 2022-11-04 IMAGE PROCESSING METHOD AND APPARATUS, APPARATUS AND MEDIUM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210986783.XA CN115937010B (zh) 2022-08-17 2022-08-17 一种图像处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN115937010A CN115937010A (zh) 2023-04-07
CN115937010B true CN115937010B (zh) 2023-10-27

Family

ID=86554566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210986783.XA Active CN115937010B (zh) 2022-08-17 2022-08-17 一种图像处理方法、装置、设备及介质

Country Status (4)

Country Link
US (1) US20240249399A1 (zh)
EP (1) EP4350605A4 (zh)
CN (1) CN115937010B (zh)
WO (1) WO2024036764A1 (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107424126A (zh) * 2017-05-26 2017-12-01 广州视源电子科技股份有限公司 图像校正方法、装置、设备、系统及摄像设备和显示设备
CN110232667A (zh) * 2019-06-17 2019-09-13 厦门美图之家科技有限公司 图像畸变修正方法、装置、电子设备及可读存储介质
CN110675433A (zh) * 2019-10-31 2020-01-10 北京达佳互联信息技术有限公司 视频处理方法、装置、电子设备及存储介质
CN110971827A (zh) * 2019-12-09 2020-04-07 Oppo广东移动通信有限公司 人像模式拍摄方法、装置、终端设备和存储介质
CN111242881A (zh) * 2020-01-07 2020-06-05 北京字节跳动网络技术有限公司 显示特效的方法、装置、存储介质及电子设备
CN111667398A (zh) * 2019-03-07 2020-09-15 株式会社理光 图像处理方法、装置和计算机可读存储介质
CN113537207A (zh) * 2020-12-22 2021-10-22 腾讯科技(深圳)有限公司 视频处理方法、模型的训练方法、装置以及电子设备
CN113610864A (zh) * 2021-07-23 2021-11-05 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN114119410A (zh) * 2021-11-19 2022-03-01 航天宏康智能科技(北京)有限公司 校正畸变表格图像中的单元格的方法及装置
CN114445301A (zh) * 2022-01-30 2022-05-06 北京字跳网络技术有限公司 图像处理方法、装置、电子设备及存储介质
CN114758027A (zh) * 2022-04-12 2022-07-15 北京字跳网络技术有限公司 图像处理方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6156665B1 (ja) * 2016-04-08 2017-07-05 パナソニックIpマネジメント株式会社 施設内活動分析装置、施設内活動分析システムおよび施設内活動分析方法
CN109214389B (zh) * 2018-09-21 2021-09-28 上海小萌科技有限公司 一种目标识别方法、计算机装置及可读存储介质
CN110197466B (zh) * 2019-05-30 2022-09-16 河海大学常州校区 一种广角鱼眼图像矫正方法
CN110728622B (zh) * 2019-10-22 2023-04-25 珠海研果科技有限公司 鱼眼图像处理方法、装置、电子设备及计算机可读介质
CN112330576A (zh) * 2020-12-03 2021-02-05 中国第一汽车股份有限公司 车载鱼眼摄像头畸变矫正方法、装置、设备及存储介质
CN112712037A (zh) * 2020-12-31 2021-04-27 苏州清研微视电子科技有限公司 基于全景图像和目标检测的车载环境感知方法和系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107424126A (zh) * 2017-05-26 2017-12-01 广州视源电子科技股份有限公司 图像校正方法、装置、设备、系统及摄像设备和显示设备
CN111667398A (zh) * 2019-03-07 2020-09-15 株式会社理光 图像处理方法、装置和计算机可读存储介质
CN110232667A (zh) * 2019-06-17 2019-09-13 厦门美图之家科技有限公司 图像畸变修正方法、装置、电子设备及可读存储介质
CN110675433A (zh) * 2019-10-31 2020-01-10 北京达佳互联信息技术有限公司 视频处理方法、装置、电子设备及存储介质
CN110971827A (zh) * 2019-12-09 2020-04-07 Oppo广东移动通信有限公司 人像模式拍摄方法、装置、终端设备和存储介质
CN111242881A (zh) * 2020-01-07 2020-06-05 北京字节跳动网络技术有限公司 显示特效的方法、装置、存储介质及电子设备
CN113537207A (zh) * 2020-12-22 2021-10-22 腾讯科技(深圳)有限公司 视频处理方法、模型的训练方法、装置以及电子设备
CN113610864A (zh) * 2021-07-23 2021-11-05 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN114119410A (zh) * 2021-11-19 2022-03-01 航天宏康智能科技(北京)有限公司 校正畸变表格图像中的单元格的方法及装置
CN114445301A (zh) * 2022-01-30 2022-05-06 北京字跳网络技术有限公司 图像处理方法、装置、电子设备及存储介质
CN114758027A (zh) * 2022-04-12 2022-07-15 北京字跳网络技术有限公司 图像处理方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A detection and recognition system of pointer meters in substations based on computer vision;Yang Liu 等;《ELSEVIER》;第152卷;1-10 *
基于坐标逆映射的增强型车辆三维全景影像;谭兆一 等;《计算机应用》;第41卷(第4期);1165-1171 *
基于深度学习的人脸属性识别;刘三元;《中国优秀硕士学位论文全文数据库信息科技辑》(第12期);I138-633 *

Also Published As

Publication number Publication date
US20240249399A1 (en) 2024-07-25
EP4350605A1 (en) 2024-04-10
EP4350605A4 (en) 2024-07-03
CN115937010A (zh) 2023-04-07
WO2024036764A1 (zh) 2024-02-22

Similar Documents

Publication Publication Date Title
CN111242881B (zh) 显示特效的方法、装置、存储介质及电子设备
CN110728622B (zh) 鱼眼图像处理方法、装置、电子设备及计算机可读介质
CN111833461A (zh) 一种图像特效的实现方法、装置、电子设备及存储介质
CN114842120B (zh) 一种图像渲染处理方法、装置、设备及介质
US11494961B2 (en) Sticker generating method and apparatus, and medium and electronic device
CN110717467A (zh) 头部姿势的估计方法、装置、设备及存储介质
CN112258622B (zh) 图像处理方法、装置、可读介质及电子设备
CN111833459B (zh) 一种图像处理方法、装置、电子设备及存储介质
CN111583329B (zh) 增强现实眼镜显示方法、装置、电子设备和存储介质
WO2023193613A1 (zh) 高光渲染方法、装置、介质及电子设备
CN110047126B (zh) 渲染图像的方法、装置、电子设备和计算机可读存储介质
CN116360661A (zh) 特效处理方法、装置、电子设备及存储介质
CN113963000B (zh) 图像分割方法、装置、电子设备及程序产品
CN114866706B (zh) 图像处理方法、装置、电子设备及存储介质
CN115937010B (zh) 一种图像处理方法、装置、设备及介质
CN110288552A (zh) 视频美化方法、装置及电子设备
CN110264431A (zh) 视频美化方法、装置及电子设备
CN113744379B (zh) 图像生成方法、装置和电子设备
CN116311409A (zh) 三维人脸关键点检测方法、装置、电子设备及存储介质
CN116527993A (zh) 视频的处理方法、装置、电子设备、存储介质和程序产品
CN114841984A (zh) 图像处理方法、装置、电子设备及存储介质
CN111353929A (zh) 图像处理方法、装置和电子设备
CN113808050B (zh) 3d点云的去噪方法、装置、设备及存储介质
WO2023020283A1 (zh) 图像处理方法、装置、设备、介质及程序产品
US20240096023A1 (en) Information processing method and device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant