CN113902747A - 图像处理方法、计算机可读存储介质以及计算设备 - Google Patents

图像处理方法、计算机可读存储介质以及计算设备 Download PDF

Info

Publication number
CN113902747A
CN113902747A CN202110932639.3A CN202110932639A CN113902747A CN 113902747 A CN113902747 A CN 113902747A CN 202110932639 A CN202110932639 A CN 202110932639A CN 113902747 A CN113902747 A CN 113902747A
Authority
CN
China
Prior art keywords
image
target
target object
images
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110932639.3A
Other languages
English (en)
Inventor
刘金林
付非凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Damo Institute Hangzhou Technology Co Ltd
Original Assignee
Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Damo Institute Hangzhou Technology Co Ltd filed Critical Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority to CN202110932639.3A priority Critical patent/CN113902747A/zh
Publication of CN113902747A publication Critical patent/CN113902747A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了一种图像处理方法、计算机可读存储介质以及计算设备。其中,该方法包括:获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;基于第二图像对第一图像进行抠图操作,得到目标对象的图像。本申请解决了相关技术中的抠图方案由于屏幕播放内容的干扰,导致分割目标对象的图像准确度较低的技术问题。

Description

图像处理方法、计算机可读存储介质以及计算设备
技术领域
本申请涉及图像处理领域,具体而言,涉及一种图像处理方法、计算机可读存储介质以及计算设备。
背景技术
目前,直播场景的背景为大屏幕,受限于相机设备清晰度,拍摄的屏幕会存在不清晰的问题,因而需要把屏幕前的目标对象分割出来,再和屏幕进行合成,达到高清直播的目的,由于屏幕播放内容的干扰,现有的抠图方式不能准确的分割出目标对象的图像。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种图像处理方法、计算机可读存储介质以及计算设备,以至少解决相关技术中的抠图方案由于屏幕播放内容的干扰,导致分割目标对象的图像准确度较低的技术问题。
根据本申请实施例的一个方面,提供了一种图像处理方法,包括:获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
根据本申请实施例的另一方面,还提供了一种图像处理方法,包括:在交互界面上显示第一图像;响应交互界面上感应到的抠图指令,在交互界面上显示目标对象的图像,其中,抠图指令用于获取第二图像,并基于第二图像对第一图像进行抠图操作,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像。
根据本申请实施例的另一方面,还提供了一种图像处理方法,包括:获取教学图像和截图图像,其中,教学图像为对教师和目标屏幕进行拍摄得到的图像,截图图像为对目标屏幕显示的教学内容进行截屏操作得到的图像;基于截图图像对教学图像进行抠图操作,得到目标对象的图像。
根据本申请实施例的另一方面,还提供了一种图像处理方法,包括:对目标对象和目标屏幕进行拍摄,得到第一图像;对目标屏幕进行截屏操作,得到第二图像;基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
根据本申请实施例的另一方面,还提供了一种图像处理方法,包括:服务器接收客户端发送的第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;服务器基于第二图像对第一图像进行抠图操作,得到目标对象的图像;服务器发送目标对象的图像至客户端。
根据本申请实施例的另一方面,还提供了一种图像处理方法,包括:服务器通过第一接口接收客户端发送的第一图像和第二图像,其中,第一接口包括:第一参数和第二参数,第一参数的参数值为第一图像,第二参数的参数值为第二图像,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;服务器基于第二图像对第一图像进行抠图操作,得到目标对象的图像;服务器通过第二接口发送目标对象的图像至客户端,其中,第二接口包括:第二参数,第二参数的参数值为输出图像。
在本申请实施例中,首先获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像,基于第二图像对第一图像进行抠图操作,得到目标对象的图像,实现了以第二图像作为对照图像以提高对第一图像进行抠图操作的准确度。
容易想到是,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像是对屏幕显示内容进行截屏操作得到的图像,因此,第二图像的清晰度相对于第一图像的清晰度较高,通过匹配到与第一图像中目标屏幕显示内容相同的第二图像,并基于清晰度较高的第二图像作为参照图像对第一图像进行抠图,可以提高对第一图像进行抠图操作的准确度。
本申请实施例解决了相关技术中的抠图方案由于屏幕播放内容的干扰,导致分割目标对象的图像准确度较低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种图像处理方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本申请实施例的一种图像处理方法的流程图;
图3是根据本申请实施例的另一种图像处理方法的流程图;
图4是根据本申请实施例的另一种图像处理方法的流程图;
图5是根据本申请实施例的另一种图像处理方法的流程图;
图6是根据本申请实施例的另一种图像处理方法的流程图;
图7是根据本申请实施例的另一种图像处理方法的流程图;
图8是根据本申请实施例的另一种图像处理方法的流程图;
图9是根据本申请实施例的一种图像处理装置的示意图;
图10是根据本申请实施例的另一种图像处理装置的示意图;
图11是根据本申请实施例的另一种图像处理装置的示意图;
图12是根据本申请实施例的另一种图像处理装置的示意图;
图13是根据本申请实施例的另一种图像处理装置的示意图;
图14是根据本申请实施例的另一种图像处理装置的示意图;
图15是根据本申请实施例的一种计算设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
抠图:可以是指将高精度的图像进行分割;
屏幕截图:可以是指使用软件直接获取屏幕画面。
实施例1
根据本申请实施例,还提供了一种图像处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现图像处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的图像处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
在上述运行环境下,本申请提供了如图2所示的图像处理方法。图2是根据本申请实施例的图像处理方法的流程图。如图2所示,该方法可以包括以下步骤:
步骤S202,获取第一图像和第二图像。
其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像。
上述的第一图像可以是通过拍摄设备拍摄得到的图像,此处的拍摄设备可以是摄像头、照相机、录像机等设备,本申请对此不做具体限定。
上述的第二图像可以是通过截屏程序或截屏软件对屏幕进行截屏所得到的图像,其中,第二图像为具有高清画面的图像。
在教学视频的场景中,上述的目标对象可以包括教师、教师的手持物,上述的目标屏幕可以是显示教学内容的屏幕,上述的第一图像可以是通过拍摄设备对教师、教师的手持物以及显示教学内容的目标屏幕进行拍摄得到的图像,上述的第二图像可以是对目标屏幕显示的教学内容进行截屏操作得到的图像,该图像为高清图像。其中,教师的手持物可以是对屏幕进行控制的设备,也可以是教师授课过程中使用的教学用具,如板擦、教鞭等,但不仅限于此。
在直播会议的场景中,上述的目标对象可以包括主讲人、主讲人的手持物,上述的目标屏幕可以是显示会议内容的屏幕,上述的第一图像可以是通过拍摄设备对主讲人、主讲人的手持物以及显示会议内容的目标屏幕进行拍摄得到的图像,上述的第二图像可以是对目标屏幕显示的会议内容进行截屏操作得到的图像,该图像为高清图像。其中,主讲人的手持物可以是对屏幕进行控制的设备,也可以是会议过程中展示的物品,但不仅限于此。
步骤S204,基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
上述的抠图操作可以把第一图像的某一部分从第一图像中分离出来成为单独的图像。需要说明的是,目标对象的图像中不仅仅可以包含目标对象本身,还可以包含目标对象的手持物。
在一种可选的实施例中,第二图像是直接对目标屏幕进行截图所得到的图像,因此,第二图像相对于第一图像的清晰度较高,可以从第一图像中确定出与第二图像不同的某一部分,通过对该部分进行抠图操作,可以得到目标对象的图像,通过将该第二图像与目标对象的图像进行合成,可以在目标屏幕中显示清晰内容的同时显示目标对象的图像。
在另一种可选的实施例中,可以通过抠图网络基于第二图像对第一图像进行抠图操作,从而得到目标对象的图像,其中,抠图网络可以是预先训练的多层卷积神经网络。
在教学视频的场景中,可以基于教学内容的屏幕截图对拍摄的教师以及教学内容的屏幕进行抠图操作,得到主讲老师以及主讲老师的手持物的图像。
在直播会议的场景中,可以基于会议内容的屏幕截图对拍摄的主讲人的以及会议内容的屏幕进行抠图操作,得到主讲人以及主讲人的手持物的图像。
可选地,在基于第二图像对第一图像进行抠图操作,得到目标对象的图像之后,对目标对象的图像和第二图像进行合成,得到输出图像。
在一种可选的实施例中,可以获取目标对象在第一图像中的目标位置,并基于目标位置对目标对象的图像和第二图像进行合成,得到背景高清的输出图像。
在另一种可选的实施例中,可以以第一图像的左下角为原点,以第一图像的底边为x轴,以经过原点与x轴垂直的边作为y轴建立第一直角坐标系,可以以第二图像的左下角为原点,以第二图像的底边为x轴,以经过原点与x轴垂直的边作为y轴建立第二直角坐标系。可以获取目标对象在第一图像中第一直角坐标系的第一坐标点集合,基于该第一坐标点集合确定目标对象的图像在第二图像的第二直角坐标系中的对应的第二坐标点集合,基于该第二坐标点集合对目标对象的图像和第二图像进行合成,得到输出图像。
在教学视频的场景中,可以将教师的图像和截图的教学内容进行合成,得到背景的教学内容高清的直播教学图像,以便学生可以观看到能够清晰显示教学内容的教学直播课或者教学录播课。
在直播会议的场景中,可以将主讲人的图像和截图的会议内容进行合成,得到背景的会议内容高清的直播会议图像,以便远程参会人员可以观看到能够清晰显示会议内容的直播会议。
通过上述实施例,首先获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像,基于第二图像对第一图像进行抠图操作,得到目标对象的图像,实现了以第二图像作为对照图像以提高对第一图像进行抠图操作的准确度。容易想到是,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像是对屏幕显示内容进行截屏操作得到的图像,因此,第二图像的清晰度相对于第一图像的清晰度较高,通过匹配到与第一图像中目标屏幕显示内容相同的第二图像,并基于清晰度较高的第二图像作为参照图像对第一图像进行抠图,可以提高对第一图像进行抠图操作的准确度。本申请实施例解决了相关技术中的抠图方案由于屏幕播放内容的干扰,导致分割目标对象的图像准确度较低的技术问题。
可选地,在连续多次获取到第二图像的情况下,该方法包括:确定获取到的多张第二图像中的目标图像,其中,目标图像与第一图像的相似度大于其他图像与第一图像的相似度,其他图像为多张第二图像中除目标图像之外的任意一张第二图像;基于目标图像对第一图像进行抠图操作,得到目标对象的图像。
需要说明的是,由于目标屏幕中播放的内容在实时变化,拍摄设备仅能拍摄到某一帧画面,为了确保第一图像中目标屏幕的显示内容与第二图像相同,可以目标屏幕显示的内容进行连续多次的截屏操作,从而得到多张第二图像,进一步从多张第二图像中筛选出与第一图像中目标屏幕的显示内容相同的目标图像。
在一种可选的实施例中,目标屏幕中可以实时播放不同的内容,此时,可以通过对目标屏幕进行截屏,连续多次的获取到具有不同内容的多个第二图像,并从多个第二图像中获取到与第一图像相似度较高的第二图像,并确定该第二图像为目标图像,由于目标图像与第一图像背景中显示的图像相似度较高,因此,基于目标图像对第一图像进行抠图操作,可以得到一个准确度较高的目标对象的图像。
在另一种可选的实施例中,可以连续多次的获取到具有不同内容的多个第二图像,并从多个第二图像中获取到与第一图像相似度较高的预设数量的第二图像,从预设数量的第二图像中随机选取一个第二图像作为目标图像,并基于目标图像对第一图像进行抠图操作。进一步地,在得到预设数量的第二图像之后,可以将预设数量的第二图像反馈至客户端,使得用户可以通过客户端从预设数量的第二图像中选取一个第二图像作为目标图像,并基于目标图像对第一图像进行抠图操作,得到准确度较高的目标对象的图像。
可选地,确定获取到的多张第二图像中的目标图像包括:获取每张第二图像与第一图像的相似度;确定最大相似度对应的第二图像为目标图像。
在一种可选的实施例中,可以通过相似度算法获取每张第二图像与第一图像的相似度,并对每张第二图像与第一图像的相似度从大到小进行排序,确定出与第一图像最大相似度对应的第二图像,并确定该第二图像为目标图像。
上述的相似度算法可以为欧几里得距离、皮尔逊相关系数、余弦相似度、谷本系数等,此处对所采用的相似度算法不做任何限定。
可选地,利用相似度估计网络多张第二图像和第一图像进行处理,得到目标图像。
上述的相似度估计网络可以为多层卷积神经网络。
在一种可选的实施例中,可以将多张第二图像和第一图像输入到相似度估计网络中,相似度估计网络可以获取多张第二图像和第一图像之间的相似度,然后根据多张第二图像和第一图像背景之间的相似度从多张第二图像中选取相似度最高的第二图像作为目标图像,最后相似度估计网络输出该目标图像。
可选地,在确定获取到的多张第二图像中的目标图像之前,该方法还包括:基于第一图像对多张第二图像进行对齐操作,得到对齐后的多张第二图像;确定对齐后的多张第二图像中的目标图像。
上述的对齐操作是指通过旋转、缩放以及平移等方式对第二图像进行处理,使得第二图像与第一图像的角度、大小以及位移等相同。
在一种可选的实施例中,由于拍摄得到的第一图像和截图得到的第二图像会存在角度、大小以及位移等差异,因此,为了确保能够准确从多张第二图像中筛选出目标图像,需要基于第一图像来对多张第二图像进行对齐操作,得到对齐后的多张第二图像,其中,对齐后的多张第二图像与第一图像的位移、大小等相同,可以从对齐后的多张第二图像中选取与第一图像相似度最高的第二图像为目标图像。
可选地,基于第一图像对多张第二图像进行对齐操作,得到对齐后的多张第二图像包括:利用对齐网络对第一图像和多张第二图像进行处理,得到对齐系数,其中,对齐系数包括如下至少之一:旋转系数、缩放系数和平移系数;基于对齐系数对多张第二图像进行对齐操作,得到对齐后的多张第二图像。
上述的对齐网络可以为多层卷积神经网络。
在一种可选的实施例中,可以利用对齐网络对第一图像和多张第二图像进行处理,可以获取到第一图像与多张第二图像之间的角度、大小以及位移的差异,通过获取到的第一图像与多张第二图像之间的角度、大小以及位移的差异,能够确定出多张第二图像的旋转系数、缩放系数以及平移系数。
具体的,通过旋转系数对多张第二图像进行对齐操作,可以使对齐后的多张第二图像与第一图像之间的角度相同,通过缩放系数对多张第二图像进行对齐操作,可以使对齐后的多张第二图像与第一图像之间的大小相同,通过平移系数对多张第二图像进行对齐操作,可以使对齐后的多张第二图像与第一图像之间的位移相同。
可选地,基于目标图像对第一图像进行抠图操作,得到目标对象的图像包括:利用抠图网络对目标图像和第一图像进行处理,得到目标对象的掩码矩阵;利用目标对象的掩码矩阵对第一图像进行处理,得到目标对象的图像。
上述的抠图网络可以为多层卷积神经网络。
上述的掩码矩阵用于对处理的图像进行全局或者局部的遮挡,以便控制图像处理的区域或者处理的过程。
在一种可选的实施例中,可以利用抠图网络对目标图像和第一图像进行处理,具体的,可以根据目标图像对第一图像中相似的部分进行截取,剩余的部分则是目标对象的区域,此时,可以获取到目标对象的区域对应的掩码矩阵,并利用该掩码矩阵将第一图像中除该掩码矩阵对应的区域进行裁剪并丢弃,其剩余的图像为目标对象的图像。将目标对象的图像与清晰的第二图像进行合成,可以输出背景高清的图像。
下面结合图3对本申请一种优选的实施例进行详细说明,该方法可以由移动终端或服务器执行,在本申请实施例中,以该方法由服务器执行为例进行说明。
如图3所示,可以先获取多张第二图像的对齐系数,然后利用对齐系数对多张第二图像进行对齐操作,得到对齐后的多张第二图像,将第一图像与对齐后的多张第二图像输入到相似度估计网络中,可以得到对齐后的多张第二图像中与第一图像相似度较高的第二图像,并将该第二图像作为目标图像;在获取到目标图像后,可以将第一图像和目标图像输入到抠图网络中,利用目标图像对第一图像进行抠图操作,得到目标对象的掩码矩阵,然后将目标对象的掩码矩阵与第一图像以及目标图像进行合成,具体的,可以先利用目标对象的掩码矩阵对第一图像进行处理,得到目标对象的图像,然后将目标对象的图像与目标图像进行合成,可以输出背景高清的图像。
如图3所示,上述的对齐系数可以是将第一图像和第二图像输入到对齐网络中得到的。利用对齐系数可以对第二图像进行处理,得到对齐后的第二图像,以消除第一图像与第二图像之间的角度、位移以及大小等差异。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
根据本申请实施例,还提供了一种图像处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图4是根据本发明实施例的一种图像处理方法的流程图。如图4所示,该方法可以包括以下步骤:
步骤S402,在交互界面上显示第一图像。
上述的交互界面可以是移动终端或者计算机终端的显示界面。
步骤S404,响应交互界面上感应到的抠图指令,在交互界面上显示生成目标对象的图像。
其中,抠图指令用于获取第二图像,并基于第二图像对第一图像进行抠图操作,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像。
上述的抠图指令可以是用户通过点击显示界面上的预设空间生成的。
可选地,在交互界面上显示目标对象的图像之后,还可以在交互界面上显示输出图像。
其中,输出图像为对目标对象的图像和第二图像进行合成得到的图像。
本申请上述实施例中,在连续多次获取到第二图像的情况下,生成目标对象的图像包括:确定获取到的多张第二图像中的目标图像,其中,目标图像与第一图像的相似度大于其他图像与第一图像的相似度,其他图像为多张第二图像中除目标图像之外的任意一张第二图像;基于目标图像对第一图像进行抠图操作,得到目标对象的图像。
本申请上述实施例中,在基于目标图像对第一图像进行抠图操作,得到目标对象的图像之前,该方法还包括:基于第一图像对多张第二图像进行对齐操作,得到对齐后的多张第二图像;确定对齐后的多张第二图像中的目标图像。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例3
根据本申请实施例,还提供了一种图像处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图5是根据本发明实施例的一种图像处理方法的流程图。如图5所示,该方法可以包括以下步骤:
步骤S502,获取教学图像和截图图像。
其中,教学图像为对教师和目标屏幕进行拍摄得到的图像,截图图像为对目标屏幕显示的教学内容进行截屏操作得到的图像。
步骤S504,基于截图图像对教学图像进行抠图操作,得到教师的图像。
可选地,在得到教师的图像之后,还可以对教师的图像和截图图像进行合成,得到输出图像。
可选地,可以在得到输出图像之后,在直播界面中显示输出图像。
本申请上述实施例中,在连续多次获取到截图图像的情况下,该方法包括:确定获取到的多张截图图像中的目标图像,其中,目标图像与教学图像的相似度大于其他图像与教学图像的相似度,其他图像为多张截图图像中除目标图像之外的任意一张截图图像;基于目标图像对教学图像进行抠图操作,得到目标对象的图像。
本申请上述实施例中,在确定获取到的多张截图图像中的目标图像之前,方法还包括:基于教学图像对多张截图图像进行对齐操作,得到对齐后的多张截图图像;确定对齐后的多张截图图像中的目标图像。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例4
根据本申请实施例,还提供了一种图像处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图6是根据本发明实施例的一种图像处理方法的流程图。如图6所示,该方法可以包括以下步骤:
步骤S602,对目标对象和目标屏幕进行拍摄,得到第一图像。
步骤S604,对目标屏幕进行截屏操作,得到第二图像。
步骤S606,基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
可选地,在得到目标对象的图像之后,还可以对目标对象的图像和第二图像进行合成,得到输出图像。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例5
根据本申请实施例,还提供了一种图像处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图7是根据本发明实施例的一种图像处理方法的流程图。如图7所示,该方法可以包括以下步骤:
步骤S702,服务器接收客户端发送的第一图像和第二图像。
其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像。
上述的服务器可以为云服务器。
步骤S704,服务器基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
步骤S706,服务器发送目标对象的图像至客户端。
可选地,在得到目标对象的图像之后,服务器可以对目标对象的图像和第二图像进行合成,得到输出图像。
可选地,在得到输出图像之后,服务器可以发送输出图像至客户端。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例6
根据本申请实施例,还提供了一种图像处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图8是根据本发明实施例的一种图像处理方法的流程图。如图8所示,该方法可以包括以下步骤:
步骤S802,服务器通过第一接口接收客户端发送的第一图像和第二图像。
其中,第一接口包括:第一参数和第二参数,第一参数的参数值为第一图像,第二参数的参数值为第二图像,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像。
上述步骤中的第一接口可以是云服务器与客户端之间进行数据交互的接口,客户端可以第一图像和第二图像传入接口函数,并作为接口函数的第一参数和第二参数,实现将第一图像和第二图像上传至云服务器的目的。
步骤S804,服务器基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
步骤S806,服务器通过第二接口发送目标对象的图像至客户端。
其中,第二接口包括:第三参数,第三参数的参数值为目标对象的图像。
上述步骤中的第二接口可以是云服务器与客户端之间进行数据交互的接口,云服务器可以将目标对象的图像传入接口函数,作为接口函数的第三参数,实现将目标对象的图像下发至客户端的目的。
可选地,在得到目标对象的图像之后,服务器可以对目标对象的图像和第二图像进行合成,得到输出图像。
可选地,在得到输出图像之后,服务器通过第二接口发送输出图像至客户端。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例7
根据本申请实施例,还提供了一种用于实施上述图像处理方法的图像处理装置,如图9所示,该装置900包括:第一获取模块902、第一操作模块904。
其中,第一获取模块用于获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;第一操作模块用于基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
此处需要说明的是,上述第一获取模块902、第一操作模块904对应于实施例1中的步骤S202至步骤S204,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
本申请上述实施例中,该装置还包括:第一确定模块、第二操作模块。
其中,第一确定模块用于确定获取到的多张第二图像中的目标图像,其中,目标图像与第一图像的相似度大于其他图像与第一图像的相似度,其他图像为多张第二图像中除目标图像之外的任意一张第二图像;第二操作模块用于基于目标图像对第一图像进行抠图操作,得到目标对象的图像。
本申请上述实施例中,第一确定模块包括:第一获取单元、第一确定单元。
其中,第一获取单元用于获取每张第二图像与第一图像的相似度;第一确定单元用于确定最大相似度对应的第二图像为目标图像。
本申请上述实施例中,利用相似度估计网络多张第二图像和第一图像进行处理,得到目标图像。
本申请上述实施例中,该装置还包括:第三操作模块、第二确定模块。
其中,第三操作模块用于基于第一图像对多张第二图像进行对齐操作,得到对齐后的多张第二图像;第二确定模块用于确定对齐后的多张第二图像中的目标图像。
本申请上述实施例中,第三操作模块包括:第一处理单元、第一操作单元。
其中,第一处理单元用于利用对齐网络对第一图像和多张第二图像进行处理,得到对齐系数,其中,对齐系数包括如下至少之一:旋转系数、缩放系数和平移系数;第一操作单元用于基于对齐系数对多张第二图像进行对齐操作,得到对齐后的多张第二图像。
本申请上述实施例中,第一操作模块包括:第二处理单元、第三处理单元。
其中,第二处理单元用于利用抠图网络对目标图像和第一图像进行处理,得到目标对象的掩码矩阵;第三处理单元用于利用目标对象的掩码矩阵对第一图像进行处理,得到目标对象的图像。
本申请上述实施例中,该装置还包括:第一合成模块。
其中,第一合成模块用于对目标对象的图像和第二图像进行合成,得到输出图像
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例8
根据本申请实施例,还提供了一种用于实施上述图像处理方法的图像处理装置,如图10所示,该装置1000包括:第一显示模块1002、第一生成模块1004。
其中,第一显示模块用于在交互界面上显示第一图像;第一生成模块用于在响应到交互界面上感应到的抠图指令时,在交互界面上显示生成目标对象的图像,其中,抠图指令用于获取第二图像,并基于第二图像对第一图像进行抠图操作,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像。
此处需要说明的是,上述第一显示模块1002、第一生成模块1004对应于实施例2中的步骤S402至步骤S404,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
本申请上述实施例中,第一生成模块包括:第二确定单元、第二操作单元。
其中,第二确定单元用于确定获取到的多张第二图像中的目标图像,其中,目标图像与第一图像的相似度大于其他图像与第一图像的相似度,其他图像为多张第二图像中除目标图像之外的任意一张第二图像;第二操作单元用于基于目标图像对第一图像进行抠图操作,得到目标对象的图像。
本申请上述实施例中,该装置还包括:第四操作模块、第三确定模块。
其中,第四操作模块用于基于第一图像对多张第二图像进行对齐操作,得到对齐后的多张第二图像;第三确定模块用于确定对齐后的多张第二图像中的目标图像。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例9
根据本申请实施例,还提供了一种用于实施上述图像处理方法的图像处理装置,如图11所示,该装置1100包括:第二获取模块1102、第五操作模块1104、第二合成模块1106。
其中,第二获取模块用于获取教学图像和截图图像,其中,教学图像为对教师和目标屏幕进行拍摄得到的图像,截图图像为对目标屏幕显示的教学内容进行截屏操作得到的图像;第五操作模块用于基于截图图像对教学图像进行抠图操作,得到目标对象的图像;第二合成模块用于对目标对象的图像和截图图像进行合成,得到输出图像。
此处需要说明的是,上述第二获取模块1102、第五操作模块1104、第二合成模块1106对应于实施例3中的步骤S502至步骤S506,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
本申请上述实施例中,该装置还包括:第四确定模块、第六操作模块。
其中,第四确定模块用于确定获取到的多张截图图像中的目标图像,其中,目标图像与教学图像的相似度大于其他图像与教学图像的相似度,其他图像为多张截图图像中除目标图像之外的任意一张截图图像;第六操作模块用于基于目标图像对教学图像进行抠图操作,得到目标对象的图像。
本申请上述实施例中,该装置还包括:第七操作模块、第五确定模块。
其中,第七操作模块用于基于教学图像对多张截图图像进行对齐操作,得到对齐后的多张截图图像;第五操作模块用于确定对齐后的多张截图图像中的目标图像。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例10
根据本申请实施例,还提供了一种用于实施上述图像处理方法的图像处理装置,如图12所示,该装置1200包括:拍摄模块1202、截屏模块1204、第八操作模块1206。
其中,拍摄模块用于对目标对象和目标屏幕进行拍摄,得到第一图像;截屏模块用于对目标屏幕进行截屏操作,得到第二图像;第八操作模块用于基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
此处需要说明的是,上述拍摄模块1202、截屏模块1204、第八操作模块1206、对应于实施例4中的步骤S602至步骤S606,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例11
根据本申请实施例,还提供了一种用于实施上述图像处理方法的图像处理装置,如图13所示,该装置1300包括:第一接收模块1302、第九操作模块1304、第一发送模块1306。
其中,第一接收模块用于接收客户端发送的第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;第九操作模块用于基于第二图像对第一图像进行抠图操作,得到目标对象的图像;第一发送模块用于发送输出图像至客户端。
此处需要说明的是,上述第一接收模块1302、第九操作模块1304、第一发送模块1306对应于实施例5中的步骤S702至步骤S706,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例12
根据本申请实施例,还提供了一种用于实施上述图像处理方法的图像处理装置,如图14所示,该装置1400包括:第二接收模块1402、第十操作模块1404、第二发送模块1406。
其中,第二接收模块用于通过第一接口接收客户端发送的第一图像和第二图像,其中,第一接口包括:第一参数和第二参数,第一参数的参数值为第一图像,第二参数的参数值为第二图像,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;第十操作模块用于基于第二图像对第一图像进行抠图操作,得到目标对象的图像;第二发送模块用于通过第二接口发送输出图像至客户端,其中,第二接口包括:第二参数,第二参数的参数值为输出图像。
此处需要说明的是,上述第二接收模块1402、第十操作模块1404、第二发送模块1406对应于实施例6中的步骤S802至步骤S806,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例13
根据本申请实施例,还提供了一种计算设备,包括:
拍摄设备,用于对目标对象和目标屏幕进行拍摄,得到第一图像;
处理器,处理器运行程序,其中,程序运行时对于从拍摄设备输出的第一图像执行如下处理步骤:对目标屏幕进行截屏操作,得到第二图像;基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
可选地,处理器还用于对目标对象的图像和第二图像进行合成,得到输出图像。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例14
本申请实施例还提供了一种计算机可读存储介质,可选地,在本实施例中,上述存储介质可以用于保存上述实施例所提供的图像处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:确定获取到的多张第二图像中的目标图像,其中,目标图像与第一图像的相似度大于其他图像与第一图像的相似度,其他图像为多张第二图像中除目标图像之外的任意一张第二图像;基于目标图像对第一图像进行抠图操作,得到目标对象的图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:获取每张第二图像与第一图像的相似度;确定最大相似度对应的第二图像为目标图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用相似度估计网络多张第二图像和第一图像进行处理,得到目标图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:基于第一图像对多张第二图像进行对齐操作,得到对齐后的多张第二图像;确定对齐后的多张第二图像中的目标图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用对齐网络对第一图像和多张第二图像进行处理,得到对齐系数,其中,对齐系数包括如下至少之一:旋转系数、缩放系数和平移系数;基于对齐系数对多张第二图像进行对齐操作,得到对齐后的多张第二图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:在基于所述第二图像对所述第一图像进行抠图操作,得到所述目标对象的图像之后,对所述目标对象的图像和所述第二图像进行合成,得到输出图像。
可选地,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用抠图网络对目标图像和第一图像进行处理,得到目标对象的掩码矩阵;利用目标对象的掩码矩阵对第一图像进行处理,得到目标对象的图像。
实施例15
本申请实施例还提供了一种计算设备,该计算设备可以是计算设备群中的任意一个计算设备。可选地,在本实施例中,上述计算设备也可以替换为移动设备等终端设备。
可选地,在本实施例中,上述计算设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算设备可以执行图像处理方法中以下步骤的程序代码:获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
可选地,图15是根据本申请实施例15的一种计算设备的结构框图,如图15所示,该计算设备可以包括:一个或多个(图中仅示出一个)处理器1502、存储器1504。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的图像处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取第一图像和第二图像,其中,第一图像为对目标对象和目标屏幕进行拍摄得到的图像,第二图像为对目标屏幕显示的内容进行截屏操作得到的图像;基于第二图像对第一图像进行抠图操作,得到目标对象的图像。
可选地,上述处理器还可以执行如下步骤的程序代码:确定获取到的多张第二图像中的目标图像,其中,目标图像与第一图像的相似度大于其他图像与第一图像的相似度,其他图像为多张第二图像中除目标图像之外的任意一张第二图像;基于目标图像对第一图像进行抠图操作,得到目标对象的图像。
可选地,上述处理器还可以执行如下步骤的程序代码:获取每张第二图像与第一图像的相似度;确定最大相似度对应的第二图像为目标图像。
可选地,上述处理器还可以执行如下步骤的程序代码:利用相似度估计网络多张第二图像和第一图像进行处理,得到目标图像。
可选地,上述处理器还可以执行如下步骤的程序代码:基于第一图像对多张第二图像进行对齐操作,得到对齐后的多张第二图像;确定对齐后的多张第二图像中的目标图像。
可选地,上述处理器还可以执行如下步骤的程序代码:利用对齐网络对第一图像和多张第二图像进行处理,得到对齐系数,其中,对齐系数包括如下至少之一:旋转系数、缩放系数和平移系数;基于对齐系数对多张第二图像进行对齐操作,得到对齐后的多张第二图像。
可选地,上述处理器还可以执行如下步骤的程序代码:利用抠图网络对目标图像和第一图像进行处理,得到目标对象的掩码矩阵;利用目标对象的掩码矩阵对第一图像进行处理,得到目标对象的图像。
可选地,上述处理器还可以执行如下步骤的程序代码:在基于所述第二图像对所述第一图像进行抠图操作,得到所述目标对象的图像之后,对所述目标对象的图像和所述第二图像进行合成,得到输出图像。
本领域普通技术人员可以理解,图15所示的结构仅为示意,计算设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图15其并不对上述电子装置的结构造成限定。例如,计算设备A还可包括比图15中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图15所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (14)

1.一种图像处理方法,其特征在于,包括:
获取第一图像和第二图像,其中,所述第一图像为对目标对象和目标屏幕进行拍摄得到的图像,所述第二图像为对所述目标屏幕显示的内容进行截屏操作得到的图像;
基于所述第二图像对所述第一图像进行抠图操作,得到所述目标对象的图像。
2.根据权利要求1所述的方法,其特征在于,在连续多次获取到所述第二图像的情况下,所述方法包括:
确定获取到的多张第二图像中的目标图像,其中,所述目标图像与所述第一图像的相似度大于其他图像与所述第一图像的相似度,所述其他图像为所述多张第二图像中除所述目标图像之外的任意一张第二图像;
基于所述目标图像对所述第一图像进行抠图操作,得到所述目标对象的图像。
3.根据权利要求2所述的方法,其特征在于,利用相似度估计网络所述多张第二图像和所述第一图像进行处理,得到所述目标图像。
4.根据权利要求2所述的方法,其特征在于,在确定获取到的多张第二图像中的目标图像之前,所述方法还包括:
基于所述第一图像对所述多张第二图像进行对齐操作,得到对齐后的多张第二图像;
确定所述对齐后的多张第二图像中的所述目标图像。
5.根据权利要求4所述的方法,其特征在于,基于所述第一图像对所述多张第二图像进行对齐操作,得到对齐后的多张第二图像包括:
利用对齐网络对所述第一图像和所述多张第二图像进行处理,得到对齐系数,其中,所述对齐系数包括如下至少之一:旋转系数、缩放系数和平移系数;
基于所述对齐系数对所述多张第二图像进行对齐操作,得到所述对齐后的多张第二图像。
6.根据权利要求2至5中任意一项所述的方法,其特征在于,基于所述目标图像对所述第一图像进行抠图操作,得到所述目标对象的图像包括:
利用抠图网络对所述目标图像和所述第一图像进行处理,得到所述目标对象的掩码矩阵;
利用所述目标对象的掩码矩阵对所述第一图像进行处理,得到所述目标对象的图像。
7.一种图像处理方法,其特征在于,包括:
在交互界面上显示第一图像;
响应所述交互界面上感应到的抠图指令,在所述交互界面上显示目标对象的图像,其中,所述抠图指令用于获取第二图像,并基于第二图像对所述第一图像进行抠图操作,所述第二图像为对目标屏幕显示的内容进行截屏操作得到的图像。
8.一种图像处理方法,其特征在于,包括:
获取教学图像和截图图像,其中,所述教学图像为对教师和目标屏幕进行拍摄得到的图像,所述截图图像为对所述目标屏幕显示的教学内容进行截屏操作得到的图像;
基于所述截图图像对所述教学图像进行抠图操作,得到所述教师的图像。
9.一种图像处理方法,其特征在于,包括:
对目标对象和目标屏幕进行拍摄,得到第一图像;
对所述目标屏幕进行截屏操作,得到第二图像;
基于所述第二图像对所述第一图像进行抠图操作,得到所述目标对象的图像。
10.一种图像处理方法,其特征在于,包括:
服务器接收客户端发送的第一图像和第二图像,其中,所述第一图像为对目标对象和目标屏幕进行拍摄得到的图像,所述第二图像为对所述目标屏幕显示的内容进行截屏操作得到的图像;
所述服务器基于所述第二图像对所述第一图像进行抠图操作,得到所述目标对象的图像;
所述服务器发送所述目标对象的图像至所述客户端。
11.一种图像处理方法,其特征在于,包括:
服务器通过第一接口接收客户端发送的第一图像和第二图像,其中,所述第一接口包括:第一参数和第二参数,所述第一参数的参数值为所述第一图像,所述第二参数的参数值为所述第二图像,所述第一图像为对目标对象和目标屏幕进行拍摄得到的图像,所述第二图像为对所述目标屏幕显示的内容进行截屏操作得到的图像;
所述服务器基于所述第二图像对所述第一图像进行抠图操作,得到所述目标对象的图像;
所述服务器通过第二接口发送所述目标对象的图像至所述客户端,其中,所述第二接口包括:第二参数,所述第二参数的参数值为所述目标对象的图像。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至11中任意一项所述的图像处理方法。
13.一种计算设备,其特征在于,所述计算设备包括:处理器和存储器,所述处理器用于运行所述存储器中存储的程序,其中,所述程序运行时执行权利要求1至11中任意一项所述的图像处理方法。
14.一种计算设备,其特征在于,包括:
拍摄设备,用于对目标对象和目标屏幕进行拍摄,得到第一图像;
处理器,所述处理器运行程序,其中,所述程序运行时对于从所述拍摄设备输出的所述第一图像执行如下处理步骤:对所述目标屏幕进行截屏操作,得到第二图像;基于所述第二图像对所述第一图像进行抠图操作,得到所述目标对象的图像。
CN202110932639.3A 2021-08-13 2021-08-13 图像处理方法、计算机可读存储介质以及计算设备 Pending CN113902747A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110932639.3A CN113902747A (zh) 2021-08-13 2021-08-13 图像处理方法、计算机可读存储介质以及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110932639.3A CN113902747A (zh) 2021-08-13 2021-08-13 图像处理方法、计算机可读存储介质以及计算设备

Publications (1)

Publication Number Publication Date
CN113902747A true CN113902747A (zh) 2022-01-07

Family

ID=79187758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110932639.3A Pending CN113902747A (zh) 2021-08-13 2021-08-13 图像处理方法、计算机可读存储介质以及计算设备

Country Status (1)

Country Link
CN (1) CN113902747A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116703691A (zh) * 2022-11-17 2023-09-05 荣耀终端有限公司 图像处理方法、电子设备及计算机存储介质
CN116703691B (zh) * 2022-11-17 2024-05-14 荣耀终端有限公司 图像处理方法、电子设备及计算机存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116703691A (zh) * 2022-11-17 2023-09-05 荣耀终端有限公司 图像处理方法、电子设备及计算机存储介质
CN116703691B (zh) * 2022-11-17 2024-05-14 荣耀终端有限公司 图像处理方法、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
US11605214B2 (en) Method, device and storage medium for determining camera posture information
CN110012209B (zh) 全景图像生成方法、装置、存储介质及电子设备
US9607394B2 (en) Information processing method and electronic device
CN112381003B (zh) 动作捕捉方法、装置、设备及存储介质
CN110941332A (zh) 表情驱动方法、装置、电子设备及存储介质
US11636779B2 (en) Method, apparatus and terminal device for constructing parts together
CN110378250B (zh) 用于场景认知的神经网络的训练方法、装置及终端设备
CN113011403B (zh) 手势识别方法、系统、介质及设备
CN105791390A (zh) 数据传输方法、装置及系统
CN112085775A (zh) 图像处理的方法、装置、终端和存储介质
KR101586071B1 (ko) 마커리스 증강현실 서비스 제공 장치 및 이를 위한 촬영 위치 추정 방법
CN113838151A (zh) 相机标定方法、装置、设备及介质
CN110619670A (zh) 人脸互换方法、装置、计算机设备及存储介质
CN106657600B (zh) 一种图像处理方法和移动终端
CN109726613B (zh) 一种用于检测的方法和装置
CN109842791B (zh) 一种图像处理方法及装置
CN113902747A (zh) 图像处理方法、计算机可读存储介质以及计算设备
CN111489433A (zh) 车辆损伤定位的方法、装置、电子设备以及可读存储介质
CN113724176A (zh) 一种多摄像头动作捕捉无缝衔接方法、装置、终端及介质
CN114764930A (zh) 图像处理方法、装置、存储介质及计算机设备
CN112948735A (zh) 图像处理方法、装置、电子设备、计算机可读存储介质
CN109509162B (zh) 图像采集方法、终端、存储介质及处理器
CN112887611A (zh) 图像处理方法、装置、设备和存储介质
CN112672057A (zh) 拍摄方法及装置
CN113673278A (zh) 数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination