CN113160365A - 图像处理方法、装置、设备和计算机可读存储介质 - Google Patents

图像处理方法、装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN113160365A
CN113160365A CN202110156173.2A CN202110156173A CN113160365A CN 113160365 A CN113160365 A CN 113160365A CN 202110156173 A CN202110156173 A CN 202110156173A CN 113160365 A CN113160365 A CN 113160365A
Authority
CN
China
Prior art keywords
image
landmark
parameter
person
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110156173.2A
Other languages
English (en)
Inventor
陈志立
罗琳捷
王国晖
杨建朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lemon Inc Cayman Island
Original Assignee
Lemon Inc Cayman Island
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lemon Inc Cayman Island filed Critical Lemon Inc Cayman Island
Priority to CN202110156173.2A priority Critical patent/CN113160365A/zh
Publication of CN113160365A publication Critical patent/CN113160365A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/08Projecting images onto non-planar surfaces, e.g. geodetic screens
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本公开提供了一种图像处理方法、装置、设备和计算机可读存储介质。该图像处理方法包括:分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像;从所述第一图像中识别并提取人物图像;以及将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。

Description

图像处理方法、装置、设备和计算机可读存储介质
技术领域
本公开涉及图像处理领域,更具体地,本公开涉及一种图像处理方法、装置、设备和计算机可读存储介质。
背景技术
短视频具有社交属性强、易创作、时长短的特点,更符合移动互联网时代用户的碎片化内容消费习惯。增强现实(Augmented Reality)技术是一种将虚拟信息与真实世界巧妙融合的技术,广泛运用了多媒体、三维建模、实时跟踪及注册、智能交互、传感等多种技术手段,将计算机生成的文字、图像、三维模型、音乐、视频等虚拟信息模拟仿真后,应用到真实世界中,两种信息互为补充,从而实现对真实世界的“增强”。AR独特的虚实融合特效,决定了其在短视频领域具有无限的拓展空间。
当前,地标AR特效是短视频领域的热点之一。地标AR特效可以增加拍摄的趣味性,促使用户更加主动地去拍摄和记录。
发明内容
鉴于上述问题而提出了本公开。本公开提供了一种图像处理方法、装置、设备和计算机可读存储介质。
根据本公开的一个方面,提供了一种图像处理方法,所述方法包括:分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;从所述第一图像中识别并提取人物图像;将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
根据本公开的一个示例,所述将所述人物图像映射到所述第二图像的地标图像中以生成目标图像包括:确定所述人物图像在所述地标图像中的映射位置;以及将所述人物图像映射到所述映射位置以生成目标图像。
根据本公开的一个示例,在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,所述方法还包括:获取所述人物图像的第一图像参数和所述第二图像的第二图像参数;判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值;在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
根据本公开的一个示例,所述第一图像参数和所述第二图像参数包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
根据本公开的一个示例,在所述第一图像参数和所述第二图像参数包括分辨率的情况下,利用图像超分辨率重建技术对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
根据本公开的一个示例,所述地标图像是基于地标模型从所述第二图像中识别的。
根据本公开的一个示例,所述地标模型为利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
根据本公开的一个示例,所述人物图像包括人脸轮廓、或肢体轮廓、或人脸图像或身体姿势图像。
根据本公开的一个方面,提供了一种图像处理装置,包括:第一图像获取单元,用于获取第一图像;第二图像获取单元,用于在所述第一图向获取单元获取所述第一图像的同时,获取第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;识别单元,用于从所述第一图像中识别并提取人物图像;映射单元,用于将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
根据本公开的一个示例,所述映射单元用于:确定所述人物图像在所述地标图像中的映射位置;以及将所述人物图像映射到所述映射位置以生成目标图像。
根据本公开的一个示例,所述映射单元在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,还用于:获取所述人物图像的第一图像参数和所述第二图像的第二图像参数;判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值;在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
根据本公开的一个示例,所述第一图像参数和所述第二图像参数包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
根据本公开的一个示例,在所述第一图像参数和所述第二图像参数包括分辨率的情况下,利用图像超分辨率重建技术对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
根据本公开的一个示例,所述地标图像是基于地标模型从所述第二图像中识别的。
根据本公开的一个示例,所述地标模型为利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
根据本公开的一个示例,所述人物图像包括人脸轮廓、或肢体轮廓、或人脸图像或身体姿势图像。
根据本公开的一个方面,提供了一种图像处理设备,包括:处理器;以及存储器,其中存储计算机可读指令,其中,在所述计算机可读指令被所述处理器运行时执行图像处理方法,所述方法包括:分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像;从所述第一图像中识别并提取人物图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
根据本公开的一个方面,提供了一种用于存储计算机可读程序的计算机可读存储介质,所述程序使得计算机执行上述图像处理方法。
如以下将详细描述的,根据本公开的图像处理方法、装置、设备和计算机可读存储介质,同时利用前置摄像头和后置摄像头拍摄人物图像和地标图像,然后把拍摄到的人物图像映射到地标图像中,可以让用户获得与众不同的拍摄体验,增强用户与拍摄地标之间的交互、增加拍摄的趣味性,从而促使用户更加主动地去拍摄和记录。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是概述根据本公开实施例的图像处理方法的流程图;
图2是根据本公开实施例的另一图像处理方法的流程图;
图3是根据本公开实施例的图像处理装置的功能框图;
图4是根据本公开实施例的电子设备的硬件框图;
图5是根据本公开实施例的计算机可读存储介质的示意图。
具体实施方式
为了使得本公开的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
随着数码产品特别是智能手机等的普及,人们可以方便地拍摄和记录各种图像和影像(例如短视频等)。一些应用软件(APP)可以在人们拍摄地标建筑时,基于应用软件内置的三维模型对地标建筑进行检测与追踪,同时结合轻量级渲染引擎,轻快便捷的实现各种AR特效。
本公开提供了一种图像处理方法,该方法同时利用前置摄像头和后置摄像头拍摄人物图像和地标图像,然后把人物图像映射到地标图像中,可以让用户获得与众不同的拍摄体验。
下面结合附图对本公开的实施例及其示例进行详细说明。
首先,参照图1来描述用于实现本公开实施例的基于地标的增强现实的图像处理方法100。该方法可以应用于手机、平板电脑、相机等具有前置和后置摄像头的终端设备中。
如图1所示,该图像处理方法包括以下步骤S101-S103。
在步骤S101中,分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像。
在步骤S102中,从所述第一图像中识别并提取人物图像。
在步骤S103中,将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
对于步骤S101,例如,所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反。例如,第一图像获取单元和第二图像获取单元可以分别是拍摄设备的前置摄像头和后置摄像头。可替代地,第一图像获取单元和第二图像获取单元可以分别是拍摄设备的后置摄像头和前置摄像头,这里不做限制。例如,可以同时开启前置摄像头和后置摄像头,以同时采集第一图像和第二图像。例如,可以用前置摄像头拍摄人物图像,用后置摄像头拍摄地标图像,或者用前置摄像头拍摄地标图像,用后置摄像头拍摄人物图像,这里不做限制。
例如,所述地标图像可以是基于地标模型从所述第二图像中识别的。例如,地标模型可以是利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
这里,“地标”是指具有特色的建筑物、自然景观、人工景观等。例如,上海的东方明珠塔、北京的中央电视台总部大楼、广州的广州塔、尼亚加拉大瀑布、阿尔卑斯山的少女峰等,都可以称之为地标。需要说明的是,本公开的实施例包括但不限于此,地标可以为任意的具有特色的人工建造物或自然物。
例如,该三维建模及动画软件可以为Maya软件。Maya软件是Autodesk 旗下的三维建模及动画软件,Maya软件可以大大提高电影、电视、游戏、视频等领域开发、设计、创作的工作效率,同时改善了多边形建模,通过新的运算法则提高了性能,多线程支持功能可以充分利用多核心处理器的优势,在角色建立和动画方面也更具弹性。当然,本公开的实施例包括但不限于此,用于建立地标的三维模型的软件也可以为其他任意适用的软件,这可以根据实际需求而定。
例如,在一些示例中,可以在执行本公开实施例提供的基于地标的增强现实方法之前,利用三维建模及动画软件建立多个地标的地标模型,这些地标模型为三维模型。然后,基于这些地标模型建立模型数据库,并存储在数据库服务器、云服务器或其他存储设备中。在执行本公开实施例提供的基于地标的增强现实方法时,可以根据需要在该模型数据库中检索某一地标并从模型数据库中获取对应于该地标的地标模型。通过这种方式,可以提高地标模型的获取效率,并且提升该方法的系统性。当然,本公开的实施例包括但不限于此,可以利用其它合适的方法获得地标模型。
对于步骤S102,例如,所述人物图像可以包括人脸轮廓、或肢体轮廓、或人脸图像、或身体姿势图像。
例如,可以基于现有的图像识别模型自动识别并提取人物图像。例如,可以采用STFT特征提取、HOG特征提取等方法或神经网络(如卷积神经网络)提取人物图像中的特征数据,然后将特征数据组成的人物图像提取出来,本公开的实施例对特征提取方法不作限制。
例如,人脸图像中的特征数据可以为脸部的一些表征能力强的关键点的位置坐标,例如,眼睛、眼角、眉毛、颧骨最高点、鼻子、嘴巴、下巴以及人脸外轮廓等关键点的位置坐标。例如,定位人脸的关键点可以采用传统的人脸关键点定位方法,其基于参数形状模型,根据关键点附近的表观特征,学习出一个参数模型,在使用时迭代地优化关键点的位置,最后得到关键点的位置坐标。或者,定位人脸的特征点也可以采用基于级联回归的方法定位关键点,其能够根据输入的人物图像,实时定位出精准的人脸关键点。又例如,定位人脸的关键点还可以采用级基于深度学习相关算法、主动形状模型相关算法等方法实现。又例如,人脸图像中的特征数据还可以为表征脸部表情或姿态的数据。本公开的实施例对此不作限定。
可替代地,可以通过触控指令手动在第一图像中画出人物图像区域。该人物图像区域可以包括至少一个人物内容(头像、身体部位等)。
对于步骤S103,例如,所述将所述人物图像映射到所述第二图像的地标图像中以生成目标图像可以包括:确定所述人物图像在所述地标图像中的映射位置;以及将所述人物图像合成和/或覆盖到所述映射位置以生成目标图像。
例如,可以根据人物的姿势特征或者脸部特征,确定映射位置。例如,在所述人物图像是人物站立图像时,可以相应地调整人物图像相对于地标图像的比例,将人物图像以合理的比例合成和/或覆盖到地标图像的正前方。
例如,在所述人物图像是人物的脸部轮廓时,可以将人物图像合成和/ 或覆盖在地标图像上,而不是简单地拼接到地标图像上。
例如,可以采用诸如信号级、像素级、决策级以及特征级的图像融合技术将人物图像融合到地标图像中。
例如,可以先从第一图像中识别并提取人物图像,然后根据人物图像与地标图像的分辨率差别以及对人物图像或地标图像的缩放需求对人物图像进行上采样或者下采样。例如,在人物图像分辨率高于地标图像时,可以对人物图像进行下采样;而在人物图像分辨率低于地标图像时,可以对人物图像进行上采样,以使得最终得到的目标图像看起来比较协调。接下来,可以对上采样或者下采样之后的人物图像进行平滑滤波,以消除噪音。最后,将处理过的人物图像融合到地标图像的相应位置,以生成目标图像。应当认识到,将人物图像合成和/或覆盖在地标图像的方法不限于此,还可以采用其他合适的图像处理方法,这里不做限制。
例如,可以将从第一图像中识别并提取人物图像直接映射到地标图像中。
例如,可以根据已经训练好的神经网络模型基于人物的姿势特征或者脸部特征自动识别映射位置。例如,该神经网络模型可以包括各种神经网络模型,例如但不限于:卷积神经网络(CNN)(包括GoogLeNet、AlexNet、VGG 网络等)、具有卷积神经网络的区域(R-CNN)、区域提议网络(RPN)、循环神经网络(RNN)、基于堆栈的深度神经网络(S-DNN)、深度信念网络(DBN)、受限玻尔兹曼机(RBM)、完全卷积网络、长短期记忆(LSTM)网络和分类网络。另外,执行一项任务的神经网络模型可以包括子神经网络,并且该子神经网络可以包括异构神经网络,并且可以用异构神经网络模型来实现。
可替代地,可以通过触控指令手动确定期望的映射位置,这里不做限制。
此外,由于前置摄像头和后置摄像头的配置参数(例如,分辨率、色彩、感光度等)可能不同,造成拍摄的第一图像和第二图像的参数也不相同,如果直接将从第一图像提取的人物图像映射到所述第二图像的地标图像中生成目标图像,可能会导致目标图像不协调。针对此情况,本申请提出了另一种图像处理方法。
图2示出了根据本公开实施例的另一图像处理方法的流程图200。如图2 所示,在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,还包括:获取所述人物图像的第一图像参数和所述第二图像的第二图像参数(S201);判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值(S202);在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值(S203)。
例如,所述第一图像参数和所述第二图像参数可以包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
例如,由于前置摄像头的分辨率一般低于后置摄像头的分辨率,当分辨率差别较大时,会造成目标图像中的人物图像画质粗糙或模糊,从而导致最终的目标图像不协调。在用前置摄像头拍摄第一图像,用后置摄像头拍摄第二图像时,需要对例如前置摄像头拍摄的第一图像或后置摄像头拍摄的第二图像进行处理,以使得目标图像自然协调。
例如,可以通过前置摄像头拍摄多组第一图像,然后利用图像合成技术将多组第一图像合成以得到像素更大的第一图像。
又例如,可以利用图像超分辨率重建技术对所述人物图像的第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
又例如,由于前第二像头拍摄到的景物的亮度或风格等可能不同,使得映射后的目标图像不协调。例如,可以采用图像风格迁移等技术对人物图像或者第二图像进行调整,以使得目标图像看起来比较协调。
再例如,可以由用户手动对第一图像的第一图像参数进行调整,由此获得更加自然协调的目标图像。
此外,在对第一参数图像的参数调整受限时,可以调整第二图像的参数,这里不做限制。
应当认识到,调整图像参数的方法不限于此,可以根据任何合适的方式调整图像参数,以得到更加自然满意的目标图像。
根据本公开的上述方法,可以同时利用前置摄像头和后置摄像头拍摄人物图像和地标图像,然后把人物图像映射到地标图像中,可以让用户获得与众不同的拍摄体验,增强用户与拍摄地标之间的交互、增加拍摄的趣味性,从而促使用户更加主动地去拍摄和记录。
以上,参照附图1-2描述了根据本公开实施例的图像处理方法。以下,将描述根据本公开实施例的图像处理装置。
图3是图示根据本公开实施例的图像处理装置的功能框图。如图3所示,根据本公开实施例的图像处理装置1000包括第一图像获取单元1010、第二图像获取单元1040、识别单元1020和映射单元1030。上述各模块可以分别执行如上参照图1到图2描述的根据本公开的实施例的图像处理方法的各个步骤。本领域的技术人员理解:这些单元模块可以单独由硬件、单独由软件或者由其组合以各种方式实现,并且本公开不限于它们的任何一个。例如,可以通过中央处理单元(CPU)、图像处理器(GPU)、张量处理器(TPU)、现场可编程逻辑门阵列(FPGA)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元以及相应计算机指令来实现这些单元。
例如,第一图像获取单元1010可以用于获取第一图像。
例如,第二图像获取单元1040可以用于在所述第一图向获取单元获取所述第一图像的同时,获取第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元1010和所述第二图像获取单元1040的图像获取方向相反。
例如,第一图像获取单元和第二图像获取单元可以分别是拍摄设备的前置摄像头和后置摄像头。可替代地,第一图像获取单元和第二图像获取单元可以分别是拍摄设备的后置摄像头和前置摄像头,这里不做限制。例如,可以同时开启前置摄像头和后置摄像头,以同时采集第一图像和第二图像。例如,可以用前置摄像头拍摄人物图像,用后置摄像头拍摄地标图像,或者用前置摄像头拍摄地标图像,用后置摄像头拍摄人物图像,这里不做限制。
例如,识别单元1020可以用于从所述第一图像中识别并提取人物图像。
例如,所述人物图像可以包括人脸轮廓、或肢体轮廓、或人脸图像、或身体姿势图像。
例如,映射单元1030可以用于确定所述人物图像在所述地标图像中的映射位置;以及将所述人物图像映射到所述映射位置以生成目标图像。
例如,所述映射单元1030可以在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,还用于:获取所述人物图像的第一图像参数和所述第二图像的第二图像参数;判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值;在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
例如,所述第一图像参数和所述第二图像参数包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
例如,在所述第一图像参数和所述第二图像参数包括分辨率的情况下,利用图像超分辨率重建技术对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
例如,所述地标图像是基于地标模型从所述第二图像中识别的。
例如,所述地标模型为利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
例如,所述人物图像包括人脸轮廓、或肢体轮廓、或人脸图像或身体姿势图像。
下面,参照图4描述根据本公开实施例的电子设备600。图4是根据本公开实施例的电子设备600的示意图。根据本公开实施例的电子设备至少包括处理器;以及存储器,用于存储计算机程序指令。当计算机程序指令由处理器加载并运行时,所述处理器执行如上所述的图像处理方法。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备(例如图1中的终端设备或服务器)600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置606加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置606;以及通信装置609。通信装置609可以允许电子设备 600与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置606被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
图5是根据本公开实施例的计算机可读存储介质的示意图。如图5所示,本公开还包括一种计算机可读存储介质400,其上存储非暂时性计算机可读指令410,当该计算机可读指令由计算机执行时,计算机执行图像处理方法,包括:分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;从所述第一图像中识别并提取人物图像;以及将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
需要说明的是,本公开上述的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机 (例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
鉴于上述问题而提出了本公开。本公开提供了用于图像处理的方法和装置、电子设备以及计算机可读存储介质。
现在以基于解决方案的格式公开优选地由一些实施例实现的一些特征。
A1.一种图像处理方法,包括:
分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;
从所述第一图像中识别并提取人物图像;以及
将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
A2.根据解决方案A1所述的方法,其中,所述将所述人物图像映射到所述第二图像的地标图像中以生成目标图像包括:
确定所述人物图像在所述地标图像中的映射位置;以及
将所述人物图像映射到所述映射位置以生成目标图像。
A3.根据解决方案A1所述的方法,其中,在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,所述方法还包括:
获取所述人物图像的第一图像参数和所述第二图像的第二图像参数;
判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值;
在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
A4.根据解决方案A3所述的方法,其中,所述第一图像参数和所述第二图像参数包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
A5.根据解决方案A4所述的方法,其中,在所述第一图像参数和所述第二图像参数包括分辨率的情况下,利用图像超分辨率重建技术对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
A6.根据解决方案A1-A5任一项所述的方法,其中,所述地标图像是基于地标模型从所述第二图像中识别的。
A7.根据解决方案求A6所述的方法,其中,所述地标模型为利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
A8.根据解决方案A1-A5任一项所述的方法,其中,所述人物图像包括人脸轮廓、或肢体轮廓、或人脸图像或身体姿势图像。
现在以基于解决方案的格式公开优选地由一些实施例实现的一些特征。
B1.一种图像处理装置,包括:
第一图像获取单元,用于获取第一图像;
第二图像获取单元,用于在所述第一图向获取单元获取所述第一图像的同时,获取第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;
识别单元,用于从所述第一图像中识别并提取人物图像;以及
映射单元,用于将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
B2.根据解决方案B1所述的装置,其中,所述映射单元用于:
确定所述人物图像在所述地标图像中的映射位置;以及
将所述人物图像映射到所述映射位置以生成目标图像。
B3.根据解决方案B1所述的装置,其中,所述映射单元在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,还用于:
获取所述人物图像的第一图像参数和所述第二图像的第二图像参数;
判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值;
在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
B4.根据解决方案B3所述的装置,其中,所述第一图像参数和所述第二图像参数包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
B5.根据解决方案B4所述的装置,其中,在所述第一图像参数和所述第二图像参数包括分辨率的情况下,利用图像超分辨率重建技术对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
B6.根据解决方案B1-B5任一项所述的装置,其中,所述地标图像是基于地标模型从所述第二图像中识别的。
B7.根据解决方案B6所述的装置,其中,所述地标模型为利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
B8.根据解决方案B1-B5任一项所述的装置,其中,所述人物图像包括人脸轮廓、或肢体轮廓、或人脸图像或身体姿势图像。
现在以基于解决方案的格式公开优选地由一些实施例实现的一些特征。
C1.一种电子设备,包括:
处理器;以及
存储器,其中存储计算机可读指令,
其中,在所述计算机可读指令被所述处理器运行时执行图像处理方法,所述方法包括:
分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;
从所述第一图像中识别并提取人物图像;以及
将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
现在以基于解决方案的格式公开优选地由一些实施例实现的一些特征。
D1.一种用于存储计算机可读程序的计算机可读存储介质,所述程序使得计算机执行如解决方案1-8任一项所述的图像处理方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (18)

1.一种图像处理方法,包括:
分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;
从所述第一图像中识别并提取人物图像;以及
将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
2.根据权利要求1所述的方法,其中,所述将所述人物图像映射到所述第二图像的地标图像中以生成目标图像包括:
确定所述人物图像在所述地标图像中的映射位置;以及
将所述人物图像映射到所述映射位置以生成目标图像。
3.根据权利要求1所述的方法,其中,在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,所述方法还包括:
获取所述人物图像的第一图像参数和所述第二图像的第二图像参数;
判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值;
在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
4.根据权利要求3所述的方法,其中,所述第一图像参数和所述第二图像参数包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
5.根据权利要求4所述的方法,其中,在所述第一图像参数和所述第二图像参数包括分辨率的情况下,利用图像超分辨率重建技术对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
6.根据权利要求1-5任一项所述的方法,其中,所述地标图像是基于地标模型从所述第二图像中识别的。
7.根据权利要求6所述的方法,其中,所述地标模型为利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
8.根据权利要求1-5任一项所述的方法,其中,所述人物图像包括人脸轮廓、或肢体轮廓、或人脸图像或身体姿势图像。
9.一种图像处理装置,包括:
第一图像获取单元,用于获取第一图像;
第二图像获取单元,用于在所述第一图向获取单元获取所述第一图像的同时,获取第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;
识别单元,用于从所述第一图像中识别并提取人物图像;以及
映射单元,用于将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
10.根据权利要求9所述的装置,其中,所述映射单元用于:
确定所述人物图像在所述地标图像中的映射位置;以及
将所述人物图像映射到所述映射位置以生成目标图像。
11.根据权利要求9所述的装置,其中,所述映射单元在将所述人物图像映射到所述第二图像的地标图像中以生成目标图像之前,还用于:
获取所述人物图像的第一图像参数和所述第二图像的第二图像参数;
判断所述第一图像参数和所述第二图像参数之间的第一比值或第一差值是否大于预定的第一阈值;
在所述第一比值或第一差值大于所述预定的第一阈值的情况下,对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
12.根据权利要求11所述的装置,其中,所述第一图像参数和所述第二图像参数包括分辨率、视角、大小、比例、色彩、感光度、曝光时间和/或锐度中的一个或多个。
13.根据权利要求12所述的装置,其中,在所述第一图像参数和所述第二图像参数包括分辨率的情况下,利用图像超分辨率重建技术对所述第一图像参数进行调整,以使得调整后的第一图像参数和所述第二图像参数之间的第一比值或第一差值小于或等于预定的第一阈值。
14.根据权利要求9-13任一项所述的装置,其中,所述地标图像是基于地标模型从所述第二图像中识别的。
15.根据权利要求14所述的装置,其中,所述地标模型为利用三维建模及动画软件建立的、地标在虚拟空间中的三维模型。
16.根据权利要求9-13任一项所述的装置,其中,所述人物图像包括人脸轮廓、或肢体轮廓、或人脸图像或身体姿势图像。
17.一种电子设备,包括:
处理器;以及
存储器,其中存储计算机可读指令,
其中,在所述计算机可读指令被所述处理器运行时执行图像处理方法,所述方法包括:
分别通过第一图像获取单元和第二图像获取单元同时获取第一图像和第二图像,所述第二图像包含地标图像,其中所述第一图像获取单元和所述第二图像获取单元的图像获取方向相反;
从所述第一图像中识别并提取人物图像;以及
将所述人物图像映射到所述第二图像的地标图像中以生成目标图像。
18.一种用于存储非暂时性计算机可读指令的计算机可读存储介质,所述程序使得计算机执行如权利要求1-8任一项所述的图像处理方法。
CN202110156173.2A 2021-02-04 2021-02-04 图像处理方法、装置、设备和计算机可读存储介质 Pending CN113160365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110156173.2A CN113160365A (zh) 2021-02-04 2021-02-04 图像处理方法、装置、设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110156173.2A CN113160365A (zh) 2021-02-04 2021-02-04 图像处理方法、装置、设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN113160365A true CN113160365A (zh) 2021-07-23

Family

ID=76882757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110156173.2A Pending CN113160365A (zh) 2021-02-04 2021-02-04 图像处理方法、装置、设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113160365A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104580910A (zh) * 2015-01-09 2015-04-29 宇龙计算机通信科技(深圳)有限公司 基于前、后摄像头的图像合成方法及系统
CN106462995A (zh) * 2014-06-20 2017-02-22 英特尔公司 3d面部模型重建装置和方法
CN111292276A (zh) * 2018-12-07 2020-06-16 北京字节跳动网络技术有限公司 图像处理方法和装置
CN112288878A (zh) * 2020-10-29 2021-01-29 字节跳动有限公司 增强现实预览方法及预览装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106462995A (zh) * 2014-06-20 2017-02-22 英特尔公司 3d面部模型重建装置和方法
CN104580910A (zh) * 2015-01-09 2015-04-29 宇龙计算机通信科技(深圳)有限公司 基于前、后摄像头的图像合成方法及系统
CN111292276A (zh) * 2018-12-07 2020-06-16 北京字节跳动网络技术有限公司 图像处理方法和装置
CN112288878A (zh) * 2020-10-29 2021-01-29 字节跳动有限公司 增强现实预览方法及预览装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US11748957B2 (en) Generating 3D data in a messaging system
US11961189B2 (en) Providing 3D data for messages in a messaging system
KR102697772B1 (ko) 메시징 시스템 내의 3d 데이터를 포함하는 증강 현실 콘텐츠 생성기들
KR102624635B1 (ko) 메시징 시스템에서의 3d 데이터 생성
US11410401B2 (en) Beautification techniques for 3D data in a messaging system
US11825065B2 (en) Effects for 3D data in a messaging system
CN110766777A (zh) 虚拟形象的生成方法、装置、电子设备及存储介质
CN111833461B (zh) 一种图像特效的实现方法、装置、电子设备及存储介质
CN110827379A (zh) 虚拟形象的生成方法、装置、终端及存储介质
CN113205568A (zh) 图像处理方法、装置、电子设备及存储介质
CN112766215B (zh) 人脸图像处理方法、装置、电子设备及存储介质
CN107959798B (zh) 视频数据实时处理方法及装置、计算设备
CN112308977B (zh) 视频处理方法、视频处理装置和存储介质
JP7574400B2 (ja) 文字の表示方法、装置、電子機器及び記憶媒体
CN113160365A (zh) 图像处理方法、装置、设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210723

RJ01 Rejection of invention patent application after publication