CN114222181B - 一种图像处理方法、装置、设备及介质 - Google Patents

一种图像处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN114222181B
CN114222181B CN202111333912.7A CN202111333912A CN114222181B CN 114222181 B CN114222181 B CN 114222181B CN 202111333912 A CN202111333912 A CN 202111333912A CN 114222181 B CN114222181 B CN 114222181B
Authority
CN
China
Prior art keywords
image
matting
scratched
coding data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111333912.7A
Other languages
English (en)
Other versions
CN114222181A (zh
Inventor
崇洋铭
李程
边红昌
万鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202111333912.7A priority Critical patent/CN114222181B/zh
Publication of CN114222181A publication Critical patent/CN114222181A/zh
Application granted granted Critical
Publication of CN114222181B publication Critical patent/CN114222181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开关于一种图像处理方法、装置、设备及介质,包括:获取原始视频,所述原始视频中的视频帧图像包括待抠取对象;基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,所述初始对象编码数据表征所述视频帧图像中所述待抠取对象的初始轮廓信息;响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述视频帧图像,生成所述待抠取对象对应的对象抠像图像;基于所述对象抠像图像,播放所述抠像视频,本公开的实施能够保证播放对象抠像图像更加的流畅,减少对播放对象抠像图像的等待时长,提升用户体验。

Description

一种图像处理方法、装置、设备及介质
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、设备及介质。
背景技术
随着计算机技术的发展,手机终端的普及,手机终端中关于短视频的应用越来越多,为视频换背景是常见的视频编辑需求,例如,用户拍了一段视频后,背景换上指定的某些宣传海报,在视频传播的同时也进行了宣传。再例如,用户在小区里拍的短视频,可以换上大海或高山的背景,能够增加视频的趣味性。
相关技术中,在对视频等图像更换背景之前,需要依赖抠像算法依次对视频中的各个视频帧中的目标人物进行抠像并展示,抠像完成后得到的目标人物的抠像结果(目标人物的抠像图像或目标人物的遮罩信息),并播放上述抠像结果。但是,在对视频等图像进行抠像展示时,当前视频帧图像的抠像处理是在上一个视频帧图像的抠像处理完成后才能够进行,在播放当前视频帧图像对应的抠像结果时,将会造成播放当前视频帧图像对应的抠像结果处理速度慢,播放不流畅的技术问题。
因此,在对图像进行抠像处理场景下,亟需提供一种能够减少在抠像过程中抠像的等待时长的技术方案。
发明内容
本公开提供一种图像处理方法、装置、设备及介质,以至少解决相关技术中播放对象抠像图像的等待时长、播放抠像视频的卡顿、过多占用存储空间的技术问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图像处理方法,包括:
获取原始视频,所述原始视频中的视频帧图像包括待抠取对象;
基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,所述初始对象编码数据表征所述视频帧图像中所述待抠取对象的初始轮廓信息;
响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述视频帧图像,生成所述待抠取对象对应的对象抠像图像;
基于所述对象抠像图像,播放所述抠像视频。
作为一个可选的实施例,所述目标抠像模型包括第一子抠像模型和第二子抠像模型;所述基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,包括:
将所述视频帧图像输入所述第一子抠像模型中进行轮廓抠取处理,得到所述初始对象编码数据;
所述根据所述初始对象编码数据和所述视频帧图像,生成所述待抠取对象对应的对象抠像图像,包括:
将所述初始对象编码数据输入所述第二子抠像模型中进行轮廓优化处理,得到所述待抠取对象对应的目标对象编码数据,所述目标对象编码数据表征所述视频帧图像中所述待抠取对象的目标轮廓信息;
根据所述目标对象编码数据和所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
作为一个可选的实施例,所述基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据之后,所述方法还包括:
将所述初始对象编码数据存入缓存中;
相应的,所述响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述视频帧图像,生成所述待抠取对象对应的对象抠像图像,包括:
响应于所述原始视频对应的抠像视频的播放请求,从所述缓存中获取所述初始对象编码数据;
根据所述初始对象编码数据和所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
作为一个可选的实施例,所述基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据之前,所述方法还包括:
获取当前终端的目标性能配置参数;
根据所述目标性能配置参数和所述待抠取对象,在预先配置的抠像模型数据库中确定所述目标抠像模型,所述抠像模型数据库中存储有多个不同待抠取对象在多个不同的性能配置参数下对应的抠像模型。
作为一个可选的实施例,所述目标抠像模型包括第一子抠像模型和第二子抠像模型;所述方法还包括:
获取当前终端的存储配置参数;
根据所述当前终端的存储配置参数,对所述目标抠像模型进行拆分,得到所述第一子抠像模型和所述第二子抠像模型,其中,所述第一子抠像模型用于对所述视频帧图像进行轮廓抠取处理,得到所述初始对象编码数据;所述第二子抠像模型用于在接收到所述播放请求的情况下,对所述初始对象编码数据进行轮廓优化处理,得到所述目标对象编码数据。
作为一个可选的实施例,所述将所述初始对象编码数据存入缓存中,包括:
根据所述目标性能配置参数,在预先配置的压缩参数数据库中选取目标压缩参数,所述压缩参数数据库中存储有多个不同性能配置参数对应的压缩参数;
基于所述目标压缩参数对所述初始对象编码数据进行压缩,得到压缩后对象编码数据;
将所述压缩后对象编码数据存入所述缓存中。
作为一个可选的实施例,所述从所述缓存中获取所述初始对象编码数据,包括:
从所述缓存中读取所述压缩后对象编码数据;
对所述压缩后对象编码数据进行数据格式校验,得到校验结果;
在所述校验结果指示数据格式校验通过的情况下,对所述压缩后对象编码数据进行解析,得到解析后对象编码数据;
在所述解析后对象编码数据满足预设轮廓信息的情况下,将所述解析后对象编码数据,作为所述初始对象编码数据。
作为一个可选的实施例,所述从所述缓存中获取所述初始对象编码数据,还包括:
在所述解析后对象编码数据不满足所述预设轮廓信息的情况下,基于所述目标抠像模型对所述视频帧图像进行抠像处理,得到所述待抠取对象对应的初始对象编码数据。
根据本公开实施例的第二方面,提供一种图像处理装置,包括:
图像获取模块,被配置为执行获取原始视频,所述原始视频中的视频帧图像包括待抠取对象;
图像处理模块,被配置为执行基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,所述初始对象编码数据表征所述视频帧图像中所述待抠取对象的初始轮廓信息;
抠像图像生成模块,被配置为执行响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述视频帧图像,生成所述待抠取对象对应的对象抠像图像;
播放模块,被配置为执行基于所述对象抠像图像,播放所述抠像视频。
作为一个可选的实施例,所述目标抠像模型包括第一子抠像模型和第二子抠像模型;所述图像处理模块包括:
轮廓抠取单元,被配置为执行将所述视频帧图像输入所述第一子抠像模型中进行轮廓抠取处理,得到所述初始对象编码数据;
所述抠像图像生成模块,包括:
轮廓优化单元,被配置为执行将所述初始对象编码数据输入所述第二子抠像模型中进行轮廓优化处理,得到所述待抠取对象对应的目标对象编码数据,所述目标对象编码数据表征所述视频帧图像中所述待抠取对象的目标轮廓信息;
抠像图像生成单元,被配置为执行根据所述目标对象编码数据和所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
作为一个可选的实施例,所述装置还包括:
存储模块,被配置为执行将所述初始对象编码数据存入缓存中;
相应的,所述抠像图像生成模块,还包括:
编码数据获取单元,响应于所述原始视频对应的抠像视频的播放请求,从所述缓存中获取所述初始对象编码数据;
抠像图像生成单元,被配置为执行根据所述初始对象编码数据和所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
作为一个可选的实施例,所述装置还包括:
性能配置参数获取模块,被配置为执行获取当前终端的目标性能配置参数;
模型选取模块,被配置为执行根据所述目标性能配置参数和所述待抠取对象,在预先配置的抠像模型数据库中确定所述目标抠像模型,所述抠像模型数据库中存储有多个不同待抠取对象在多个不同的性能配置参数下对应的抠像模型。
作为一个可选的实施例,所述目标抠像模型包括第一子抠像模型和第二子抠像模型;所述装置还包括:
存储配置参数获取模块,被配置为执行获取当前终端的存储配置参数;
模型拆分模块,被配置为执行根据所述当前终端的存储配置参数,对所述目标抠像模型进行拆分,得到所述第一子抠像模型和所述第二子抠像模型,其中,所述第一子抠像模型用于对所述视频帧图像进行轮廓抠取处理,得到所述初始对象编码数据;所述第二子抠像模型用于在接收到所述播放请求的情况下,对所述初始对象编码数据进行轮廓优化处理,得到所述目标对象编码数据。
作为一个可选的实施例,所述存储模块,包括:
压缩参数选取单元,被配置为执行根据所述目标性能配置参数,在预先配置的压缩参数数据库中选取目标压缩参数,所述压缩参数数据库中存储有多个不同性能配置参数对应的压缩参数;
压缩单元,被配置为执行基于所述目标压缩参数对所述初始对象编码数据进行压缩,得到压缩后对象编码数据;
存储单元将所述压缩后对象编码数据存入所述缓存中。
作为一个可选的实施例,所述编码数据获取单元,包括:
数据读取子单元,被配置为执行从所述缓存中读取所述压缩后对象编码数据;
格式校验子单元,被配置为执行对所述压缩后对象编码数据进行数据格式校验,得到校验结果;
解析子单元,被配置为执行在所述校验结果指示数据格式校验通过的情况下,对所述压缩后对象编码数据进行解析,得到解析后对象编码数据;
编码数据指定子单元,被配置为执行在所述解析后对象编码数据满足预设轮廓信息的情况下,将所述解析后对象编码数据,作为所述初始对象编码数据。
作为一个可选的实施例,所述装置还包括:
返回模块,被配置为执行在所述解析后对象编码数据不满足所述预设轮廓信息的情况下,基于所述目标抠像模型对所述视频帧图像进行抠像处理,得到所述待抠取对象对应的初始对象编码数据。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述所述的图像处理方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由图像处理装置/电子设备的处理器执行时,使得所述图像处理装置/电子设备能够执行如上述所述的图像处理方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述所述的图像处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本说明书实施例的图像处理方法,通过预先对原始视频中的视频帧图像进行轮廓抠取处理,得到对应的初始对象编码数据,在接收到原始视频对应的抠像视频的播放请求时,才对初始对象编码数据进行轮廓优化处理,相对于采用在获取到原始视频后直接对视频帧图像进行抠像得到对象抠像图像的方式播放指定的对象抠像图像更加的流畅,减少对播放对象抠像图像的等待时长,提升用户粘度和体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用环境的示意图。
图2是根据一示例性实施例示出的一种图像处理方法的流程图。
图3是根据一示例性实施例示出的一种确定目标抠像模型的方法的流程图。
图4是根据一示例性实施例示出的一种确定子抠像模型的方法的流程图。
图5是根据一示例性实施例示出的一种抠像图像抠取的方法的流程图。
图6是根据一示例性实施例示出的一种编码数据存入缓存的方法的流程图。
图7是根据一示例性实施例示出的一种从缓存中获取初始对象编码数据的方法的流程图。
图8是根据一示例性实施例示出的另一种从缓存中获取初始对象编码数据的方法的流程图。
图9是根据一示例性实施例示出的一种图像处理装置框图。
图10是根据一示例性实施例示出的一种用于图像处理的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
请参阅图1,其所示为根据一示例性实施例示出的一种应用环境的示意图,该应用环境可以包括终端110和服务器120,该终端110和服务器120之间可以通过有线网络或者无线网络连接。可以理解的,图1仅为应用环境的一个示例,实际应用中还可以是其它的应用环境如只有终端,而没有服务器的场景。
终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。终端110中可以安装有提供图像处理功能的客户端软件,如应用程序(Application,简称为App),该应用程序可以是专门提供图像处理的应用程序,也可以是具有图像处理功能的其他应用程序,例如具有图像处理功能的视频类应用程序等。终端110的用户可以通过预先注册的用户信息登录应用程序,该用户信息可以包括账号和密码。
服务器120可以是为终端110中的应用程序提供后台服务的服务器,具体的,服务器120提供的服务可以是图像处理服务。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
具体的实施中,上述图像处理功能或者图像处理服务可以是抠取视频或图像中的指定对象,如人物图像、头部图像、景物图像等。
在一个示例性的应用场景中,服务器120中可以存储有训练好的抠像模型,服务器120可以按照预定周期对该抠像模型进行训练更新,其中,该抠像模型是基于样本图像和该样本图像对应的第一标注信息进行机器学习确定的,该第一标注信息包括样本图像对应的初始轮廓信息、目标轮廓信息和/或对象抠像图像。终端110在需要对图像进行处理以得到该图像对应的对象抠像图像时,可以将相应图像发送给服务器120,由服务器120调用对应的抠像模型对该图像进行抠像处理,并将抠像图像返回给终端110。
在另一个示例性的应用场景中,终端110也可以从服务器120下载抠像模型,并在本地存储,当需要进行图像处理以得到该图像的抠像图像时,终端110可以直接调用本地存储的抠像模型对该图像进行抠像处理并得到抠像图像。
本公开实施例的图像处理方法可以由电子设备来执行,该电子设备可以是终端或者服务器,可以由终端或者服务器单独执行,也可以是终端和服务器相互配合执行。
图2是根据一示例性实施例示出的一种图像处理方法的流程图,如图2所示,该图像处理方法,包括以下步骤:
在步骤S201中,获取原始视频,原始视频中的视频帧图像包括待抠取对象。
其中,原始视频中可以包括多帧视频帧图像,视频帧图像中可以包括待抠取对象,多帧视频帧图像中可以包括至少一个相同的待抠取对象,待抠取对象可以是视频帧图像中用户指定的图像,例如可以是人像、天空、背景图像、头像等。
可以理解的,如果视频帧图像中不包含待抠取对象,则后续在利用抠像模型进行抠像处理时,将检测不到待抠取对象对应的初始对象编码数据。原始视频是在视频编辑应用中进行的,如用户需要对原始视频进行抠像时,可以在视频编辑应用输入需要编辑的原始视频。
具体的实施中,原始视频可以是从本地图像库中选取的一段视频图像,也可以是实时拍摄的一段视频图像。
在步骤S203中,基于目标抠像模型,从视频帧图像中抠取待抠取对象,得到待抠取对象对应的初始对象编码数据,初始对象编码数据表征视频帧图像中待抠取对象的初始轮廓信息。
其中,目标抠像模型可以是基于样本图像和样本图像对应的第一标注信息进行机器学习确定的,第一标注信息包括样本图像对应的初始轮廓信息,初始轮廓信息可以采用初始对象编码数据的形式传输或保存,如初始轮廓信息可以是待抠取对象的包围盒的位置信息。其中,包围盒是一种求解离散点集最优包围空间的算法,基本思想是用体积稍大且特性简单的几何体(称为包围盒)来近似地代替复杂的几何对象,即包围盒的位置信息是用简单的方式表示待抠取对象的初始轮廓信息。
其中,初始对象编码数据可以是结构化数据,结构化数据表征的是通过固有键值获取相应信息,且数据的格式固定,本文中的初始轮廓信息采用结构化数据的格式,具有传输或存储方便,且不能够直接用于显示的特性。
可以理解的,目标抠像模型可以是本地存储的,也可以是在获取原始视频后,基于原始视频从服务器中下载的预先训练好的抠像模型。目标抠像模型是与待抠取对象对应的抠像模型,不同的待抠取对象对应的抠像模型是不同的,不同的抠像模型是基于包含不同的待抠取对象的视频帧图像训练的。
在上述实施例基础上,本说明书一个实施例中,目标抠像模型可以包括第一子抠像模型和第二子抠像模型。
其中,第一子抠像模型的输入可以是样本图像,第一子抠像模型的输出可以是用于表征样本图像中待抠取对象初始轮廓信息的初始对象编码数据。第二子抠像模型的输入可以是初始对象编码数据和/或样本图像,第二子抠像模型的输出可以是待抠取对象对应的对象抠像图像或用于表征待抠取对象目标轮廓信息的目标对象编码数据。即,第一子抠像模型的输出是第二子抠像模型的输入。第一子抠像模型和第二子抠像模型共同组成目标抠像模型。
在步骤S205中,响应于原始视频对应的抠像视频的播放请求,根据初始对象编码数据和视频帧图像,生成待抠取对象对应的对象抠像图像。
在一个的具体实施例中,原始视频对应的抠像视频的播放请求用于表征抠像视频的播放或暂停,在播放请求表征播放时,可以根据初始对象编码数据和视频帧图像,生成待抠取对象对应的对象抠像图像。
其中,原始视频对应的抠像视频的播放请求可以是直接播放全部的抠像视频,即按照抠像视频的对象抠像图像的顺序依次播放,也可以是播放抠像视频中指定的对象抠像图像。需要说明的是,在播放抠像视频中指定的对象抠像图像时,指定的对象抠像图像对应视频帧图像之前的视频帧图像可以是还未进行轮廓优化处理,即,原始视频中包括视频帧图像y1、视频帧图像y2…视频帧图像yn,在指定播放抠像视频中视频帧图像y3对应的对象抠像图像时,视频帧图像y3之前的对视频帧图像y1和y2的处理得到的是对应待抠取对象对应的初始对象编码数据,而未得到对应的对象抠像图像。
可以理解的是,初始对象编码数据是在获取到原始视频后对原始视频中的视频帧图像进行轮廓抠取处理得到的数据,在响应于原始视频对应的抠像视频的播放请求时,根据之前得到的初始对象编码数据对视频帧图像进行抠像处理得到待抠取对象对应的对象抠像图像。
在步骤S207中,基于对象抠像图像,播放抠像视频。
示例地,原始视频中包括视频帧图像y1、视频帧图像y2…视频帧图像yn,其中,n为大于2的正整数,采用在获取到原始视频后直接对视频帧图像进行抠像的模型与本说明书实施例提供的目标抠像模型相同。采用在获取到原始视频后直接对视频帧图像进行抠像,是依次对视频帧图像y1,视频帧图像y2…视频帧图像yn进行完整的抠像处理,在播放视频帧图像yn时,需要视频帧图像y1至视频帧图像yn都进行抠像完成后才能够播放。采用本说明书实施例的方式,仅需要对视频帧图像y1,视频帧图像y2…视频帧图像yn进行轮廓抠取处理,得到对应的初始对象编码数据,之后再对视频帧图像yn进行轮廓优化处理,即可完成视频帧图像yn对应的对象抠像图像的播放。
可以理解的是,原始视频中包括对象抠像图像和对应的原始背景,对象抠像视频和原始背景分别在原始视频中不同的位置。原始背景为拍摄该原始视频中携带的背景或合成该原始视频的合成背景。
在实际应用中,在播放抠像视频时,抠像视频的背景与原始视频中的原始背景是不同,抠像视频的背景可以是单一颜色,如白色、黑色或无色。
或,播放的抠像视频的背景可以是录入的,如将全部对象抠像图像分别置于录入背景的上层,在播放抠像视频时,该抠像视频可以在录入背景的上层进行展示。
在一些可选的实施例中,抠像视频也可以是无背景的,在播放抠像视频时,可以按照抠像视频的大小以及展示页面的大小,对播放的抠像视频进行比例调节,使得抠像视频可以填满上述展示页面并播放展示,或者按照合适的展示比例进行播放。
在一些可选地实施例中,还可以对对象抠像图像的轮廓进行例如描边、羽化、发光处理等至少一种处理,使得对象抠像图像与对应的图像背景相区分。接着,对经过处理的对象抠像图像对应的抠像视频进行播放。
在另一些可选地实施例中,在对抠像视频进行播放之前,还可对对象抠像图像包括但不限于亮度调节、美化、装饰、风格化等处理,以提高抠像视频的展示效果,进而提高用户粘度和体验。
本说明书实施例的图像处理方法,通过预先对原始视频中的视频帧图像进行轮廓抠取处理,得到对应的初始对象编码数据,在播接收到原始视频对应的抠像视频的播放请求时,才对初始对象编码数据进行轮廓优化处理,相对于采用直接对原始视频进行抠像得到对象抠像图像的方式更加的流畅,减少对播放对象抠像图像的等待时长,提升用户粘度和体验。
在一个可选的实施例中,图3是根据一示例性实施例示出的一种确定目标抠像模型的方法的流程图,如图3所示,在基于目标抠像模型,从视频帧图像中抠取待抠取对象,得到待抠取对象对应的初始对象编码数据步骤之前,方法还可以包括步骤301和步骤303:
在步骤S301中,获取当前终端的目标性能配置参数。
在一个具体的实施例中,性能配置参数可以用于表征对图像的处理速度。示例的,以图像处理方法应用在终端为例,性能配置参数可以是终端的系统硬件参数或终端型号,系统硬件参数可以终端的内存参数、中央处理器型号、图像处理器型号、屏幕分辨率、基带版本号等,终端型号为终端厂商用于区分不同的终端用于表示终端系统硬件参数的标注信息,即不同的终端型号对应有不同的系统硬件参数。
性能配置参数可以是根据终端的型号或终端的系统配置情况确定的,不同的终端型号对应有不同的性能配置参数,或不同的终端系统配置对应不同的性能配置参数。
在步骤S303中,根据目标性能配置参数和待抠取对象,在预先配置的抠像模型数据库中确定目标抠像模型,抠像模型数据库中存储有多个不同待抠取对象在多个不同的性能配置参数下对应的抠像模型。
其中,抠像模型数据库可以是存储在服务器或云端中,也可以是存储在终端中,本公开对此不作具体限定。
在本说明书的一个实施例中,以抠像模型数据库存储在服务器中为例进行说明,抠像模型数据库中存储有多个抠像模型,每个抠像模型均是基于不同的待抠像对象对应的类别及不同的性能配置参数构建的。待抠像对象对应的类别可以是人像、天空、背景图像、头像等。
在获取到当前终端的目标性能配置参数后,当前终端可以将目标性能配置参数和待抠取对象发送至抠像模型数据库中所在的服务器中。服务器可以将根据目标性能配置参数确定对应的分级结果,根据待抠取对象对应的类别以及分级结果在抠像模型数据库确定的抠像模型作为目标抠像模型。
其中,分级结果可以根据预设的评分标准确定出的,分级结果可以按照高、中、低的方式分级,也可以按照具体量化的分数值进行分级,即不同的分数值区间对应不同的性能配置参数。性能配置分级模型可以存储在服务器中。
在一个可能的实施例中,分级结果可以与终端型号对应,即不同的终端型号对应不同的分级结果。如,服务器中存储有多个终端型号和终端型号对应的分级结果,在接收到目标性能配置参数为终端型号时,可将目标性能配置参数对应的终端型号与服务器中的终端型号进行比对,进而确定出目标性能配置参数对应的分级结果,基于确定出的分级结果可以确定与分级结果对应的抠像模型。同样的,再根据待抠取对象的类别在分级结果对应的抠像模型中选取与待抠取对象的类别对应的抠像模型,并将选定的抠像模型作为目标抠像模型,再将目标抠像模型对应的下载地址发送给当前终端,使得当前终端可以根据下载地址下载目标抠像模型。
在一个可能的实施例中,分级结果可以与系统硬件参数对应,即不同的系统硬件参数对应相同或不同的分级结果。如,服务器中存储有多个与系统硬件设备对应的分数值,在接收到目标性能配置参数为系统硬件参数时,可将系统硬件参数与服务器中的系统硬件参数进行比对,进而确定出系统硬件参数对应的分数值以及分数值对应的分级结果,基于确定出的分级结果可以确定与分级结果对应的抠像模型。同样的,再根据待抠取对象的类别在分级结果对应的抠像模型中选取与待抠取对象的类别对应的抠像模型,并将选定的抠像模型作为目标抠像模型,再将目标抠像模型对应的下载地址发送给当前终端,使得当前终端可以根据下载地址下载目标抠像模型。
可以理解的是,系统硬件参数中包括多种表征不同系统硬件设备的参数或型号,如目标性能配置参数包括中央处理器型号A、图像处理器型号B。服务器中的中央处理器型号A对应的分数值是10,图像处理器型号B对应的分数值是5,进而可以确定出目标性能配置参数对应的分数值是15及15分数值对应的分级结果为F,服务器中存储有与分级结果F对应的抠像模型有2个,分别为用于抠取人像的抠像模型M1,用于抠取头像的抠像模型M2,当接收到的待抠取对象对应的类别为人像时,可以确定目标抠像模型为抠像模型M1。
需要说明的是,抠像模型数据库中存储的抠像模型均是通过不同的样本图像训练好的,不同性能配置参数对应的相同待抠取对象类别的模型也是不同的,相比较而言,相同待抠取对象类别下性能配置参数对应的分级结果高的抠像模型抠取的对象抠像图像更清晰。
本说明书实施例提供的图像处理方法,在对原始视频进行抠取待抠取对象之前,可以根据目标性能配置参数及待抠取对象对应的类别选定目标抠取图像,由于目标抠像模型是基于不同的待抠取对象类别及不同的目标性能配置参数建立的。本说明书实施例的实施能够保证当前终端更流畅的执行目标抠像模型,避免抠像模型与当前终端不匹配造成当前终端卡顿,播放抠像视频不流畅等用户体验差的问题发生,在播放抠像视频时能够更加流畅,避免在抠像过程中用户等待过长的问题发生。
在上述实施例基础上,本说明书一个实施例中,图4是根据一示例性实施例示出的一种确定子抠像模型的方法的流程图,如图4所示,方法还可以包括:
在步骤401中,获取当前终端的存储配置参数;
在步骤403中,根据当前终端的存储配置参数,对目标抠像模型进行拆分,得到第一子抠像模型和第二子抠像模型,其中,第一子抠像模型用于对视频帧图像进行轮廓抠取处理,得到初始对象编码数据;第二子抠像模型用于在接收到播放请求的情况下,对初始对象编码数据进行轮廓优化处理,得到目标对象编码数据。
具体的,存储配置参数用于表征当前终端中的可用存储空间,存储配置参数可以是终端的安全数码卡(SD卡,Secure Digital Memory Card)的剩余存储空间、内存的剩余存储空间、随机存取存储器(RAM)的剩余存储空间、只读存储器(ROM)的剩余存储空间和/或缓存的剩余存储空间等。
具体的,第一子抠像模型用于可以用于在接收到播放请求之前,对视频帧图像进行轮廓抠取处理,得到初始对象编码数据。即,获取到原始视频后,第一子抠像模型可以对视频帧图像进行轮廓抠取处理,得到初始对象编码数据。
其中,安全数码卡是一种基于半导体闪存工艺的存储卡,内存是与中央处理器(CPU,英语:Central Processing Unit/Processor)进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,内存(Memory)也被称为内存储器,其作用是用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。
具体的,存储配置参数与第一子抠像模型的输出的初始对象编码数据呈正比,即,当前终端的存储配置参数越大,初始对象编码数据可以越大。
需要说明的是,目标抠像模型在训练时可以拆分成多个子模型进行训练,即上一个字模型的输出是下一个子模型的输入,每个子模型的输出表征不同含义的运算结果,每个运算结果的数据格式、数据内容及数据大小是不同的且已知的,按照子模型的数量设置不同的预设阈值,即不同的存储配置参数可以对应有不同的预设阈值,不同的预设阈值对应不同的目标抠像模型拆分方式。
本说明书实例中对目标抠像模型进行拆分的方式即可按照目标抠像模型训练时拆分的多个子模型的方式进行拆分。如,目标抠像模型在训练时,采用4个连续的子模型进行训练,分别为子模型z1、子模型z2、子模型z3和子模型z4。子模型z1的输入是视频帧图像,子模型z1的输出是第一运算结果;子模型z2的输入是第一运算结果,子模型z2的输出是第二运算结果;子模型z3的输入是第二运算结果,子模型z2的输出是第三运算结果;子模型z4的输入是第三运算结果,子模型z2的输出是第四运算结果;在训练时即可确定不同运算结果的数据大小,依次为第一运算结果<第二运算结果<第三运算结果<第四运算结果,因此在确定出存储配置参数为第一预设阈值时,可以选取第一运算结果,即根据存储配置参数可以确定出第一子抠像模型为子模型z1,初始对象编码数据为第一运算结果,第二子抠像模型为子模型z2、子模型z3及子模型z4,目标对象编码数据为第四运算结果。
其中,第一子抠像模型可以用于在接收到播放请求之前,对视频帧图像进行轮廓抠取处理,得到初始对象编码数据;第二子抠像模型用于在接收到播放请求的情况下,对初始对象编码数据进行轮廓优化处理,得到目标对象编码数据。
本说明书实施例提供的图像处理方法,通过当前终端的存储配置参数,将目标抠像模型拆分成第一子抠像模型和第二子抠像模型,使得第一子抠像模型输出的初始对象编码数据与存储配置参数对应,提供弹性的存储空间占用,避免缓存的数据占用更多当前终端的存储空间,提升用户好感度。
在一个可能的实施例中,在目标抠像模型包括第一子抠像模型和第二子抠像模型的情况下,上述步骤203:基于目标抠像模型,从视频帧图像中抠取待抠取对象,得到待抠取对象对应的初始对象编码数据,包括:
将视频帧图像输入第一子抠像模型中进行轮廓抠取处理,得到初始对象编码数据。
具体的,第一子抠像模型可以是训练好的模型,第一子抠像模型可以基于如下方式进行训练,第一子抠像模型中可以包括多个第一模型参数,第一模型参数可以表示约束条件。在训练时,可以利用历史视频帧图像,对第一子抠像模型进行模型训练,视频帧图像中可以包括待抠取对象、待抠取对象对应的表征待抠取对象初始轮廓信息的初始对象编码数据等,其中,初始对象编码数据可以由数学拟合等方式进行确定。将视频帧图像中的待抠取对象作为第一子抠像模型的输入,将初始对象编码数据作为输出,对第一子抠像模型中的第一模型参数进行不断的调整,直至第一子抠像模型达到例如:满足预设精度、模型参数调整次数满足预设次数要求等收敛条件,则完成第一子抠像模型训练。
在实际使用时,可以将视频帧图像输入训练完成的第一子抠像模型中进行轮廓抠取处理,进而得到初始对象编码数据。
在一些可能的实施例中,图5是根据一示例性实施例示出的一种抠像图像抠取的方法的流程图,如图5所示,上述步骤205:根据初始对象编码数据和视频帧图像,生成待抠取对象对应的对象抠像图像,可以包括:
在步骤501中,将初始对象编码数据输入第二子抠像模型中进行轮廓优化处理,得到待抠取对象对应的目标对象编码数据,目标对象编码数据表征视频帧图像中待抠取对象的目标轮廓信息。
其中,目标抠像模型的具体运算过程可以包括:图像格式转换,例如将视频帧图像从RGBA转换到YUV,即将视频帧图像中的像素点由定点类型转换到浮点类型。人脸检测,检测出视频帧图像中的人脸轮廓(待抠取对象),即人脸关键点计算,通过人脸关键点,在人脸外扩出一个矩形范围的人脸框(或称包围盒),将人脸框的图像裁剪出来。接着,基于分割算法对人脸框部分进行处理,得到人脸框的分割结果(遮罩图像)。接着,对分割结果做形态学的开闭操作,去除分割结果中的噪点区域;对分割结果对应的图像做平滑处理,例如引导滤波或基于相邻帧之间的分割结果对应的图像做时序平滑,输出遮罩(目标对象编码数据),其中,浮点类型对应的数据、人脸框(包围盒)或遮罩图像均可以是初始对象编码数据。
在具体的实施过程中,在第一子抠像模型训练完成后,以第一子抠像模型的输出作为第二子抠像模型的输入,以待抠取对象对应的目标对象编码数据作为第二子抠像模型的输出,之后对第二子抠像模型进行训练,由于第二子抠像模型的训练过程与第一子抠像模型的训练过程相似,不再累述。
在一些可能的实施例中,第二子抠像模型的输出还可以是待抠取对象对应的对象抠像图像,即,视频帧图像经过第一子抠像模型和第二子抠像模型处理后得到待抠取对象对应的对象抠像图像。
可以理解的是,目标轮廓信息可以是第二子抠像模型识别出的用于表征待抠取对象的准确轮廓的信息,目标轮廓信息相对于初始轮廓信息更能准确的表征待抠取对象在视频帧图像轮廓。即目标轮廓信息是优化后的初始轮廓信息。其中,第二子抠像模型对初始轮廓信息可以采用例如去噪、平滑处理(引导滤波)或基于相邻视频帧图像的待抠取对象做时序平滑处理等方式进行轮廓优化。
在实际应用时,可以在原始视频对应的抠像视频的播放时,将初始对象编码数据输入至训练好的第二子抠像模型中进行轮廓优化处理,得到待抠取对象对应的目标对象编码数据。
可以理解的是,原始视频中有多个连续的视频帧图像,在获取到原始视频时,可以预先对各个视频帧图像进行预处理,得到原始视频中部分或全部视频帧图像对应的初始对象编码数据,在原始视频对应的抠像视频的播放,可以基于预处理后得到的初始对象编码数据和对应的视频帧图像得到对应的对象抠像图像。
在一些可能的实施例中,对原始视频中多个连续的视频帧图像进行轮廓抠取处理得到对应的初始对象编码数据,可以是按照各个视频帧图像所在的位置或原始视频中视频帧图像的播放顺序进行轮廓抠取处理,如,原始视频中包括视频帧图像y1、视频帧图像y2…视频帧图像yn,可以先对视频帧图像y1进行轮廓抠取处理,在得到视频帧图像y1对应的初始对象编码数据后,对视频帧图像y2进行抠像处理,以此类推。当然,轮廓抠取处理不限于此,本公开对此不作具体限定。
需要说明的是,第二子抠像模型对视频帧图像y1对应的初始对象编码数据进行轮廓优化处理时机与其他视频帧图像是否得到对应的初始对象编码数据并不直接关系,即在第二子抠像模型对视频帧图像y1对应的初始对象编码数据进行轮廓优化处理时,第一子抠像模型可以对其他视频帧图像中的部分或全部视频帧图处理得到对应的初始对象编码数据,也可以未对其他视频帧图像中的部分或全部处理得到对应的初始对象编码数据。
在步骤503中,根据目标对象编码数据和视频帧图像,得到待抠取对象对应的对象抠像图像。
在具体的实施过程中,由于目标对象编码数据仅表征视频帧图像中待抠取对象的目标轮廓信息,在实际应用时,可以基于目标对象编码数据将视频帧图像中的待抠取对象进行抠取出,得到待抠取对象对应的对象抠像图像。
本说明书实施例提供的图像处理方法,可以针对不同的待抠取对象训练对应的第一子抠像模型和第二子抠像模型,满足不同待抠取对象的抠像的准确性,避免使用同一种模型对不同的待抠取对象进行处理,造成抠取的图像清晰度差的问题。
在上实施例基础上,本说明书一个实施例中,在基于目标抠像模型,从视频帧图像中抠取待抠取对象,得到待抠取对象对应的初始对象编码数据步骤之后,方法还可以包括:
将初始对象编码数据存入缓存中。
在本说明书实施例中,在得到视频帧图像对应的初始对象编码数据后,可以将初始对象编码数据存入缓存中,缓存可以是数据交换的缓冲区(又称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,找到了则直接执行,找不到的话则从内存中查找。缓存往往使用的是RAM(断电即掉的非永久性储存),所以在用完后还是会把文件送到硬盘等存储器里永久存储。缓存可以设置在终端中,缓存可以是终端中的内存条、中央处理器上镶的缓存、图像处理器的显存或硬盘上的缓存。
在一些可能的实施例中,上述步骤205:响应于原始视频对应的抠像视频的播放请求,根据初始对象编码数据和视频帧图像,生成待抠取对象对应的对象抠像图像,可以包括:
响应于原始视频对应的抠像视频的播放请求,从缓存中获取初始对象编码数据;
根据初始对象编码数据和视频帧图像,得到待抠取对象对应的对象抠像图像。
具体的,初始对象编码数据可以使用对应的编码标识的形式存储在缓存中,即初始对象编码数据中携带有与对应视频帧图像对应的编码标识,在响应于原始视频对应的抠像视频的播放请求时,抠像视频的播放请求中可以有与对应视频帧图像对应的编码标识,从缓存中获取对应的初始对象编码数据时,可以通过比对编码标识的方式获取初始对象编码数据,并根据初始对象编码数据和视频帧图像,得到待抠取对象对应的对象抠像图像。
示例地、原始视频中包括视频帧图像y1、视频帧图像y2…视频帧图像yn,可以依次视频帧图像y1、视频帧图像y2…视频帧图像yn进行轮廓抠取处理,得到对应的初始对象编码数据c1,初始对象编码数据c2…初始对象编码数据cn,将初始对象编码数据c1,初始对象编码数据c2…初始对象编码数据cn存入缓存中。
响应于原始视频对应的抠像视频的播放请求,在缓存中依次调取初始对象编码数据c1,初始对象编码数据c2…初始对象编码数据cn,并根据初始对象编码数据c1,初始对象编码数据c2…初始对象编码数据cn和对应视频帧图像y1、视频帧图像y2…视频帧图像yn得到视频帧图像y1、视频帧图像y2…视频帧图像yn对应的对象抠像图像d1,对象抠像图像d1对象抠像图像d2…对象抠像图像dn。
或,响应于原始视频中指定视频帧图像(例如ym,其中m为正整数)对应的播放请求,在缓存中依次调取初始对象编码数据cm,并根据初始对象编码数据cm和视频帧图像ym得到视频帧图像ym对应的对象抠像图像dm。
由于缓存的运行速度比内存快得多,故本说明书实施例采用缓存的方式存储初始对象编码数据,可以帮助第二子抠像模型更快地运行,提高图像处理速率,提升对象抠像图像的播放速度,提升用户体验,并且缓存的数据仅仅是初始对象编码数据,相对于将现有技术中将全部处理后的目标对象编码数据或对象抠像图像存入缓存的方式,占用的缓存空间更小,节约存储空间。
在上述实施例基础上,本说明书一个实施例中,图6是根据一示例性实施例示出的一种编码数据存入缓存的方法的流程图,如图6所示,上述步骤将初始对象编码数据存入缓存中,可以包括:
在步骤601中,根据目标性能配置参数,在预先配置的压缩参数数据库中选取目标压缩参数,压缩参数数据库中存储有多个不同性能配置参数对应的压缩参数。
具体的,压缩参数数据库可以是存储在服务器,也可以存储在当前终端中。当压缩参数数据库存储在服务器中时,当前终端在下载目标抠像模型的同时可以一并下载目标压缩参数。其中,压缩参数数据库中存储有多个不同性能配置参数对应的压缩参数,不同的压缩参数对数据的压缩率或压缩时间是不同的,不同的压缩参数能够灵活的提供不同精细粒度的数据存入缓存中,满足不同抠像模型和不同终端的使用需求。目标性能配置参数对应的分级结果与对应的标压缩参数正相关。如,目标性能配置参数对应的分级结果处于低级,对应的压缩参数可以是压缩率低或压缩时间短。
其中,压缩率(Compression ratio),描述压缩文件的效果名,是文件压缩后的大小与压缩前的大小之比,例如:把100MB的文件压缩后是90MB,压缩率为90/100*100%=90%,压缩率一般是越小越好,但是压得越小,解压时间越长。
在步骤603中,基于目标压缩参数对初始对象编码数据进行压缩,得到压缩后对象编码数据。
在具体的实施过程中,基于目标压缩参数可以将初始对象编码数据进行压缩,得到与目标压缩参数对应压缩率的压缩后对象编码数据。
在步骤605中,将压缩后对象编码数据存入缓存中。
具体的,压缩后对象编码数据可以通过标记编码标识的形式存储在缓存中,编码标识的具体形式在本说明书实施例中不做具体限定,可以根据实际需要进行设置。编码标识可以是压缩后对象编码数据在缓存中存储的名称。
具体的,在对同一个原始视频中的视频帧图像进行轮廓抠取处理,得到的压缩后对象编码数据的编码标识,应该具有部分相同的第一子编码标识和部分不相同的第二子编码标识,其中,第一子编码标识用于区别不同的原始视频,第二子编码标识用于区分不同的视频帧图像。
本说明书实施例提供的图像处理方法,通过目标性能配置参数确定对应的目标压缩参数,目标压缩参数对应不同的压缩率或压缩时间,在目标性能配置参数表征当前终端处理速度较低时,可以采用压缩率高对应的目标压缩参数,可以提高当前终端对图像处理的处理速度,同时,降低当前终端的缓存的占用空间。
在上述实施例基础上,本说明书一个实施例中,图7是根据一示例性实施例示出的一种从缓存中获取初始对象编码数据的方法的流程图,如图7所示,从缓存中获取初始对象编码数据,可以包括:
在步骤701中,从缓存中读取压缩后对象编码数据。
具体的,压缩后对象编码数据可以通过标记的编码标识的形式在缓存中读取。
在步骤703中,对压缩后对象编码数据进行数据格式校验,得到校验结果。
具体的,压缩后对象编码数据可以有与目标压缩参数对应的数据格式,即数据格式可以根据目标压缩参数进行设置。与目标压缩参数对应的数据格式可以用于校验压缩后对象编码数据是否被恶意篡改、是否被错误读取或存储是否失败。
其中,恶意篡改可以理解为存储在缓存中的压缩后对象编码数据,被替换,如,压缩后对象编码数据长度与目标压缩参数压缩后的数据的长度不同,或,压缩后对象编码数据中头信息与目标压缩参数压缩后的数据的头信息不相同,则可以确定压缩后对象编码数据被恶意篡改。当压缩后对象编码数据被恶意篡改时,可以将恶意篡改的压缩后对象编码数据发送给服务器,服务器可以根据恶意篡改的压缩后对象编码数据更新目标抠像模型,并将更新后的目标抠像模型发送给对应的终端,避免压缩后对象编码数据被恶意篡改。
其中,错误读取可以理解为当前终端中用于抠像的应用从缓存中读取压缩后对象编码数据时,读取的地址位错误,从而导致读取错误的数据当做压缩后对象编码数据。当压缩后对象编码数据被错误读取时,可以基于编码数据重新更新读取的地址位,确保准确的读取到压缩后对象编码数据,当更新读取的地址位后仍不能够准确的读取到压缩后对象编码数据时,可以将读取错误的地址位发送给服务器,服务器可以根据读取错误的地址位更新目标抠像模型,并将更新后的目标抠像模型发送给对应的终端,避免压缩后对象编码数据被读取错误。
存储失败可以理解为当前终端的缓存空间不足以将压缩后对象编码数据存储至缓存中,即缓存中未找到压缩后对象编码数据,当缓存空间不足时,可以通过打开预先设置的提示页面的方式提示当前终端的缓存空间不足,其中,预先设置的提示页面中可以通过展示文字、图像、视频等内容提示缓存空间不足。
在步骤705中,在校验结果指示数据格式校验通过的情况下,对压缩后对象编码数据进行解析,得到解析后对象编码数据。
具体的,在校验结果指示数据格式校验通过的情况下,可以理解为压缩后对象编码数据未被恶意篡改、未被错误读取及未存储失败。
可以理解的是,压缩参数对应有解析参数,在校验结果指示数据格式校验通过的情况下。可以基于目标压缩参数对应的解析参数对压缩后对象编码数据进行解析,即解析参数可以将压缩后对象编码数据进行解压缩,得到解析后对象编码数据。
在步骤707中,在解析后对象编码数据满足预设轮廓信息的情况下,将解析后对象编码数据,作为初始对象编码数据。
具体的,预设轮廓信息用于表征解析后对象编码数据是否符合预设使用要求,预设使用要求可以是根据专家经验进行设定的。
示例地,如解析后对象编码数据表示的是待抠取对象的包围盒的位置,包围盒的位置包括待抠取对象在对应视频帧图像中的左侧位置信息int_left为-80、顶部位置信息int_top为40,宽度位置信息int_width为39以及高度位置信息int_height为78,预设使用要求为左侧位置信息、顶部位置信息,宽度位置信息以及高度位置信息用于表示待抠取对象在视频帧图像中的坐标,均为正数,由于解析后对象编码数据中的左侧位置信息int_left为-80,可以确定解析后对象编码数据为错误的,不能够使用的,即解析后对象编码数据不能够满足预设轮廓信息的情况。在解析后对象编码数据满足预设轮廓信息时,可以将解析后对象编码数据,作为初始对象编码数据。
本说明书实施例提供的图像处理方法,通过对读取的压缩后对象编码数据进行数据格式校验,避免压缩后对象编码数据被恶意篡改、错误读取或存储失败的情况发生,提高数据的安全性,同时在数据格式校验成功后对压缩后对象编码数据进行内容校验,避免基于错误的压缩后对象编码数据得到错误的对象抠像图像,提高抠取对象抠像图像的准确性。
在上述实施例基础上,本说明书一个实施例中,图8是根据一示例性实施例示出的另一种从缓存中获取初始对象编码数据的方法的流程图,如图8所示,从缓存中获取初始对象编码数据,还可以包括:
在步骤709中,在解析后对象编码数据不满足预设轮廓信息的情况下,基于目标抠像模型对视频帧图像进行抠像处理,得到待抠取对象对应的初始对象编码数据。
具体的,在解析后对象编码数据不满足预设轮廓信息时,可以将不满足预设轮廓信息的解析后对象编码数据从缓存中删除,并可以执行基于目标抠像模型,从视频帧图像中抠取待抠取对象,得到待抠取对象对应的初始对象编码数据,根据初始对象编码数据和视频帧图像,生成待抠取对象对应的对象抠像图像,播放对象抠像图像的步骤。可以理解的是,在解析后对象编码数据不满足预设轮廓信息时,可以直接基于目标抠像模型对视频帧图像进行抠像处理,得到对应的对象抠像图像并播放,无需从缓存中获取,提高播放速度。
本说明书实施例提供的图像处理方法,在解析后对象编码数据不满足预设轮廓信息的情况下,可以直接基于目标抠像模型和视频帧图像生成对应的对象抠像图像,无需将得到的初始对象编码数据存入缓存中,节约在解析后对象编码数据不满足预设轮廓信息的情况下对视频帧图像进行抠像处理的时间,同时保证了对视频帧图像抠像处理的鲁棒性。
图9是根据一示例性实施例示出的一种图像处理装置框图,参照图9,该装置包括:图像获取模块91,图像处理模块92、抠像图像生成模块93和播放模块94。
该图像获取模块91,被配置为执行获取原始视频,原始视频中的视频帧图像包括待抠取对象;
该图像处理模块92,被配置为执行基于目标抠像模型,从视频帧图像中抠取待抠取对象,得到待抠取对象对应的初始对象编码数据,初始对象编码数据表征视频帧图像中待抠取对象的初始轮廓信息;
该抠像图像生成模块93,被配置为执行响应于原始视频对应的抠像视频的播放请求,根据初始对象编码数据和视频帧图像,生成待抠取对象对应的对象抠像图像;
该播放模块94,被配置为执行基于对象抠像图像,播放抠像视频。
作为一个可选的实施例,目标抠像模型包括第一子抠像模型和第二子抠像模型;图像处理模块92包括:
轮廓抠取单元,被配置为执行将视频帧图像输入第一子抠像模型中进行轮廓抠取处理,得到初始对象编码数据;
抠像图像生成模块93,包括:
轮廓优化单元,被配置为执行将初始对象编码数据输入第二子抠像模型中进行轮廓优化处理,得到待抠取对象对应的目标对象编码数据,目标对象编码数据表征视频帧图像中待抠取对象的目标轮廓信息;
抠像图像生成单元,被配置为执行根据目标对象编码数据和视频帧图像,得到待抠取对象对应的对象抠像图像。
作为一个可选的实施例,装置还包括:
存储模块,被配置为执行将初始对象编码数据存入缓存中;
相应的,抠像图像生成模块93,还包括:
编码数据获取单元,响应于原始视频对应的抠像视频的播放请求,从缓存中获取初始对象编码数据;
抠像图像生成单元,被配置为执行根据初始对象编码数据和视频帧图像,得到待抠取对象对应的对象抠像图像。
作为一个可选的实施例,装置还包括:
性能配置参数获取模块,被配置为执行获取当前终端的目标性能配置参数;
模型选取模块,被配置为执行根据目标性能配置参数和待抠取对象,在预先配置的抠像模型数据库中确定目标抠像模型,抠像模型数据库中存储有多个不同待抠取对象在多个不同的性能配置参数下对应的抠像模型。
作为一个可选的实施例,目标抠像模型包括第一子抠像模型和第二子抠像模型;装置还包括:
模型拆分模块,被配置为执行根据当前终端的存储配置参数,对目标抠像模型进行拆分,得到第一子抠像模型和第二子抠像模型,其中,第一子抠像模型用于对视频帧图像进行轮廓抠取处理,得到初始对象编码数据;第二子抠像模型用于在接收到播放请求的情况下,对初始对象编码数据进行轮廓优化处理,得到目标对象编码数据。
作为一个可选的实施例,存储模块,包括:
压缩参数选取单元,被配置为执行根据目标性能配置参数,在预先配置的压缩参数数据库中选取目标压缩参数,压缩参数数据库中存储有多个不同性能配置参数对应的压缩参数;
压缩单元,被配置为执行基于目标压缩参数对初始对象编码数据进行压缩,得到压缩后对象编码数据;
存储单元将压缩后对象编码数据存入缓存中。
作为一个可选的实施例,编码数据获取单元,包括:
数据读取子单元,被配置为执行从缓存中读取压缩后对象编码数据;
格式校验子单元,被配置为执行对压缩后对象编码数据进行数据格式校验,得到校验结果;
解析子单元,被配置为执行在校验结果指示数据格式校验通过的情况下,对压缩后对象编码数据进行解析,得到解析后对象编码数据;
编码数据指定子单元,被配置为执行在解析后对象编码数据满足预设轮廓信息的情况下,将解析后对象编码数据,作为初始对象编码数据。
作为一个可选的实施例,编码数据获取单元,还包括:
返回子单元,被配置为执行在解析后对象编码数据不满足预设轮廓信息的情况下,基于目标抠像模型对视频帧图像进行抠像处理,得到待抠取对象对应的初始对象编码数据。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图10是根据一示例性实施例示出的一种用于图像处理的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像处理的方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的图像处理方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的图像处理方法。计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的图像处理的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (18)

1.一种图像处理方法,其特征在于,所述方法包括:
获取原始视频,所述原始视频中的视频帧图像包括待抠取对象;
基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,所述初始对象编码数据表征所述视频帧图像中所述待抠取对象的初始轮廓信息;
响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述原始视频中的所述视频帧图像,生成所述待抠取对象对应的对象抠像图像;
基于所述对象抠像图像,播放所述抠像视频。
2.根据权利要求1所述图像处理方法,其特征在于,所述目标抠像模型包括第一子抠像模型和第二子抠像模型;所述基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,包括:
将所述视频帧图像输入所述第一子抠像模型中进行轮廓抠取处理,得到所述初始对象编码数据;
所述根据所述初始对象编码数据和所述原始视频中的所述视频帧图像,生成所述待抠取对象对应的对象抠像图像,包括:
将所述初始对象编码数据输入所述第二子抠像模型中进行轮廓优化处理,得到所述待抠取对象对应的目标对象编码数据,所述目标对象编码数据表征所述视频帧图像中所述待抠取对象的目标轮廓信息;
根据所述目标对象编码数据和所述原始视频中的所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
3.根据权利要求1或2所述图像处理方法,其特征在于,所述基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据之后,所述方法还包括:
将所述初始对象编码数据存入缓存中;
相应的,所述响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述原始视频中的所述视频帧图像,生成所述待抠取对象对应的对象抠像图像,包括:
响应于所述原始视频对应的抠像视频的播放请求,从所述缓存中获取所述初始对象编码数据;
根据所述初始对象编码数据和所述原始视频中的所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
4.根据权利要求3所述图像处理方法,其特征在于,所述基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据之前,所述方法还包括:
获取当前终端的目标性能配置参数;
根据所述目标性能配置参数和所述待抠取对象,在预先配置的抠像模型数据库中确定所述目标抠像模型,所述抠像模型数据库中存储有多个不同待抠取对象在多个不同的性能配置参数下对应的抠像模型。
5.根据权利要求2所述图像处理方法,其特征在于,所述方法还包括:
获取当前终端的存储配置参数;
根据所述当前终端的存储配置参数,对所述目标抠像模型进行拆分,得到所述第一子抠像模型和所述第二子抠像模型,其中,所述第一子抠像模型用于对所述视频帧图像进行轮廓抠取处理,得到所述初始对象编码数据;所述第二子抠像模型用于在接收到所述播放请求的情况下,对所述初始对象编码数据进行轮廓优化处理,得到所述目标对象编码数据。
6.根据权利要求5所述图像处理方法,其特征在于,所述将所述初始对象编码数据存入缓存中,包括:
根据目标性能配置参数,在预先配置的压缩参数数据库中选取目标压缩参数,所述压缩参数数据库中存储有多个不同性能配置参数对应的压缩参数;
基于所述目标压缩参数对所述初始对象编码数据进行压缩,得到压缩后对象编码数据;
将所述压缩后对象编码数据存入所述缓存中。
7.根据权利要求6所述图像处理方法,其特征在于,所述从所述缓存中获取所述初始对象编码数据,包括:
从所述缓存中读取所述压缩后对象编码数据;
对所述压缩后对象编码数据进行数据格式校验,得到校验结果;
在所述校验结果指示数据格式校验通过的情况下,对所述压缩后对象编码数据进行解析,得到解析后对象编码数据;
在所述解析后对象编码数据满足预设轮廓信息的情况下 , 将所述解析后对象编码数据,作为所述初始对象编码数据。
8.根据权利要求7所述图像处理方法,其特征在于,所述从所述缓存中获取所述初始对象编码数据,还包括:
在所述解析后对象编码数据不满足所述预设轮廓信息的情况下,基于所述目标抠像模型对所述视频帧图像进行抠像处理,得到所述待抠取对象对应的初始对象编码数据。
9.一种图像处理装置,其特征在于,所述装置包括:
图像获取模块,被配置为执行获取原始视频,所述原始视频中的视频帧图像包括待抠取对象;
图像处理模块,被配置为执行基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,所述初始对象编码数据表征所述视频帧图像中所述待抠取对象的初始轮廓信息;
抠像图像生成模块,被配置为执行响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述原始视频中的所述视频帧图像,生成所述待抠取对象对应的对象抠像图像;
播放模块,被配置为执行基于所述对象抠像图像,播放所述抠像视频。
10.根据权利要求9所述图像处理装置,其特征在于,所述目标抠像模型包括第一子抠像模型和第二子抠像模型;所述图像处理模块包括:
轮廓抠取单元,被配置为执行将所述视频帧图像输入所述第一子抠像模型中进行轮廓抠取处理,得到所述初始对象编码数据;
所述抠像图像生成模块,包括:
轮廓优化单元,被配置为执行将所述初始对象编码数据输入所述第二子抠像模型中进行轮廓优化处理,得到所述待抠取对象对应的目标对象编码数据,所述目标对象编码数据表征所述视频帧图像中所述待抠取对象的目标轮廓信息;
抠像图像生成单元,被配置为执行根据所述目标对象编码数据和所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
11.根据权利要求9或10所述图像处理装置,其特征在于,所述装置还包括:
存储模块,被配置为执行将所述初始对象编码数据存入缓存中;
相应的,所述抠像图像生成模块,还包括:
编码数据获取单元,响应于所述原始视频对应的抠像视频的播放请求,从所述缓存中获取所述初始对象编码数据;
抠像图像生成单元,被配置为执行根据所述初始对象编码数据和所述视频帧图像,得到所述待抠取对象对应的对象抠像图像。
12.根据权利要求11所述图像处理装置,其特征在于,所述装置还包括:
性能配置参数获取模块,被配置为执行获取当前终端的目标性能配置参数;
模型选取模块,被配置为执行根据所述目标性能配置参数和所述待抠取对象,在预先配置的抠像模型数据库中确定所述目标抠像模型,所述抠像模型数据库中存储有多个不同待抠取对象在多个不同的性能配置参数下对应的抠像模型。
13.根据权利要求10所述图像处理装置,其特征在于,所述装置还包括:
存储配置参数获取模块,被配置为执行获取当前终端的存储配置参数;
模型拆分模块,被配置为执行根据所述当前终端的存储配置参数,对所述目标抠像模型进行拆分,得到所述第一子抠像模型和所述第二子抠像模型,其中,所述第一子抠像模型用于对所述视频帧图像进行轮廓抠取处理,得到所述初始对象编码数据;所述第二子抠像模型用于在接收到所述播放请求的情况下,对所述初始对象编码数据进行轮廓优化处理,得到所述目标对象编码数据。
14.根据权利要求11所述图像处理装置,其特征在于,所述存储模块,包括:
压缩参数选取单元,被配置为执行根据目标性能配置参数,在预先配置的压缩参数数据库中选取目标压缩参数,所述压缩参数数据库中存储有多个不同性能配置参数对应的压缩参数;
压缩单元,被配置为执行基于所述目标压缩参数对所述初始对象编码数据进行压缩,得到压缩后对象编码数据;
存储单元将所述压缩后对象编码数据存入所述缓存中。
15.根据权利要求14所述图像处理装置,其特征在于,所述编码数据获取单元,包括:
数据读取子单元,被配置为执行从所述缓存中读取所述压缩后对象编码数据;
格式校验子单元,被配置为执行对所述压缩后对象编码数据进行数据格式校验,得到校验结果;
解析子单元,被配置为执行在所述校验结果指示数据格式校验通过的情况下,对所述压缩后对象编码数据进行解析,得到解析后对象编码数据;
编码数据指定子单元,被配置为执行在所述解析后对象编码数据满足预设轮廓信息的情况下,将所述解析后对象编码数据,作为所述初始对象编码数据。
16.根据权利要求15所述图像处理装置,其特征在于,所述装置还包括:
返回模块,被配置为执行在所述解析后对象编码数据不满足所述预设轮廓信息的情况下,基于所述目标抠像模型对所述视频帧图像进行抠像处理,得到所述待抠取对象对应的初始对象编码数据。
17.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至8中任一项所述的图像处理方法。
18.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由图像处理装置/电子设备的处理器执行时,使得所述图像处理装置/电子设备能够执行如权利要求1至8中任一项所述的图像处理方法。
CN202111333912.7A 2021-11-11 2021-11-11 一种图像处理方法、装置、设备及介质 Active CN114222181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111333912.7A CN114222181B (zh) 2021-11-11 2021-11-11 一种图像处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111333912.7A CN114222181B (zh) 2021-11-11 2021-11-11 一种图像处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN114222181A CN114222181A (zh) 2022-03-22
CN114222181B true CN114222181B (zh) 2024-03-12

Family

ID=80696923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111333912.7A Active CN114222181B (zh) 2021-11-11 2021-11-11 一种图像处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114222181B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117221504B (zh) * 2023-11-07 2024-01-23 北京医百科技有限公司 一种视频抠像方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075350A (zh) * 2007-06-20 2007-11-21 中国科学院长春光学精密机械与物理研究所 利用动态轮廓技术实现二维动画到三维动画转换的组件
CN101676953A (zh) * 2008-08-22 2010-03-24 奥多比公司 自动视频图像分割
CN106803959A (zh) * 2017-02-28 2017-06-06 腾讯科技(深圳)有限公司 视频图像编码、解码方法及装置
CN108307163A (zh) * 2018-02-07 2018-07-20 重庆虚拟实境科技有限公司 图像数据处理方法及装置、计算机装置及可读存储介质
CN109040780A (zh) * 2018-08-07 2018-12-18 北京优酷科技有限公司 一种视频处理方法及服务器
CN109388725A (zh) * 2018-10-30 2019-02-26 百度在线网络技术(北京)有限公司 通过视频内容进行搜索的方法及装置
CN110717914A (zh) * 2019-09-11 2020-01-21 北京迈格威科技有限公司 人体抠像的方法和装置
CN111724400A (zh) * 2020-06-29 2020-09-29 北京高思博乐教育科技股份有限公司 视频自动抠像方法及系统
CN111832557A (zh) * 2020-06-04 2020-10-27 北京百度网讯科技有限公司 电网巡检方法、装置、电子设备及存储介质
CN112434620A (zh) * 2020-11-26 2021-03-02 新智数字科技有限公司 场景文字识别方法、装置、设备和计算机可读介质
CN112464691A (zh) * 2019-09-06 2021-03-09 北京字节跳动网络技术有限公司 图像处理方法及装置
CN113516674A (zh) * 2020-12-17 2021-10-19 腾讯科技(深圳)有限公司 一种图像数据检测方法、装置、计算机设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011065960A1 (en) * 2009-11-30 2011-06-03 Hewlett-Packard Development Company, L.P. Stabilizing a subject of interest in captured video
US10824915B2 (en) * 2018-12-04 2020-11-03 Capital One Services, Llc Artificial intelligence system for inspecting image reliability

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075350A (zh) * 2007-06-20 2007-11-21 中国科学院长春光学精密机械与物理研究所 利用动态轮廓技术实现二维动画到三维动画转换的组件
CN101676953A (zh) * 2008-08-22 2010-03-24 奥多比公司 自动视频图像分割
CN106803959A (zh) * 2017-02-28 2017-06-06 腾讯科技(深圳)有限公司 视频图像编码、解码方法及装置
CN108307163A (zh) * 2018-02-07 2018-07-20 重庆虚拟实境科技有限公司 图像数据处理方法及装置、计算机装置及可读存储介质
CN109040780A (zh) * 2018-08-07 2018-12-18 北京优酷科技有限公司 一种视频处理方法及服务器
CN109388725A (zh) * 2018-10-30 2019-02-26 百度在线网络技术(北京)有限公司 通过视频内容进行搜索的方法及装置
CN112464691A (zh) * 2019-09-06 2021-03-09 北京字节跳动网络技术有限公司 图像处理方法及装置
CN110717914A (zh) * 2019-09-11 2020-01-21 北京迈格威科技有限公司 人体抠像的方法和装置
CN111832557A (zh) * 2020-06-04 2020-10-27 北京百度网讯科技有限公司 电网巡检方法、装置、电子设备及存储介质
CN111724400A (zh) * 2020-06-29 2020-09-29 北京高思博乐教育科技股份有限公司 视频自动抠像方法及系统
CN112434620A (zh) * 2020-11-26 2021-03-02 新智数字科技有限公司 场景文字识别方法、装置、设备和计算机可读介质
CN113516674A (zh) * 2020-12-17 2021-10-19 腾讯科技(深圳)有限公司 一种图像数据检测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN114222181A (zh) 2022-03-22

Similar Documents

Publication Publication Date Title
US20180260479A1 (en) Method, apparatus, system and electronic device for picture book recognition
EP4092623A1 (en) Image processing method and apparatus, and device and storage medium
EP4137991A1 (en) Pedestrian re-identification method and device
CN111738280A (zh) 一种图像识别方法、装置、设备及可读存储介质
CN111429554A (zh) 运动视频数据处理方法、装置、计算机设备和存储介质
CN112839223B (zh) 图像压缩方法、装置、存储介质及电子设备
CN111832449A (zh) 工程图纸的显示方法及相关装置
CN113221983B (zh) 迁移学习模型的训练方法及装置、图像处理方法及装置
CN113205047B (zh) 药名识别方法、装置、计算机设备和存储介质
CN113204659B (zh) 多媒体资源的标签分类方法、装置、电子设备及存储介质
US20120005564A1 (en) Content distribution system and method
CN114222181B (zh) 一种图像处理方法、装置、设备及介质
CN114596566A (zh) 文本识别方法及相关装置
CN110619334A (zh) 基于深度学习的人像分割方法、架构及相关装置
CN109829475B (zh) 一种基于深度学习的图像暗水印处理方法及装置
CN115392937A (zh) 一种用户欺诈风险识别方法、装置、电子设备及存储介质
CN113537184A (zh) Ocr模型训练方法、装置、计算机设备、存储介质
CN117095019A (zh) 一种图像分割方法及相关装置
CN113011254A (zh) 一种视频数据处理方法、计算机设备及可读存储介质
CN111741329A (zh) 一种视频处理方法、装置、设备及存储介质
CN108256611B (zh) 二维码影像生成方法、装置、计算设备及存储介质
CN115880400A (zh) 卡通数字人的形象生成方法、装置、电子设备及介质
CN110929767B (zh) 一种字形处理方法、系统、设备和介质
CN113065619A (zh) 数据处理方法、装置、计算机可读存储介质及设备
CN111914850B (zh) 图片特征提取方法、装置、服务器和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant