CN107105310B - 一种视频直播中人物形象替换方法、装置和一种录播系统 - Google Patents

一种视频直播中人物形象替换方法、装置和一种录播系统 Download PDF

Info

Publication number
CN107105310B
CN107105310B CN201710307420.8A CN201710307420A CN107105310B CN 107105310 B CN107105310 B CN 107105310B CN 201710307420 A CN201710307420 A CN 201710307420A CN 107105310 B CN107105310 B CN 107105310B
Authority
CN
China
Prior art keywords
frame image
video frame
human body
face
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710307420.8A
Other languages
English (en)
Other versions
CN107105310A (zh
Inventor
叶荣华
刘志聪
孙石平
江振钱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ncast Electronics Co ltd
Original Assignee
Guangzhou Ncast Electronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Ncast Electronics Co ltd filed Critical Guangzhou Ncast Electronics Co ltd
Priority to CN201710307420.8A priority Critical patent/CN107105310B/zh
Publication of CN107105310A publication Critical patent/CN107105310A/zh
Application granted granted Critical
Publication of CN107105310B publication Critical patent/CN107105310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/14Transformations for image registration, e.g. adjusting or mapping for alignment of images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种视频直播中人物形象替换方法,用于解决如何在直播中进行人物形象的替换的问题。本发明实施例方法包括:实时获取正在直播的目标视频当前的视频帧图像;检测所述视频帧图像中是否存在人脸;若所述视频帧图像中存在人脸,则根据所述人脸在所述视频帧图像中的位置识别所述人脸对应的人体轮廓;确定所述人体轮廓在所述视频帧图像中的人体坐标位置;从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;输出所述新的视频帧图像至网络进行直播。本发明实施例还提供一种视频直播中人物形象替换装置和一种录播系统。

Description

一种视频直播中人物形象替换方法、装置和一种录播系统
技术领域
本发明涉及视频处理技术领域,尤其涉及一种视频直播中人物形象替换方法、装置和一种录播系统。
背景技术
随着互联网的普及,远程视频教学已经成为了当前教育的重要手段之一。目前,在进行远程视频教学直播授课时,一般是老师在摄像头前像往常一样上课,将老师的当前授课的视频实时上传到网络上,同时将老师当前授课对应的讲义上传至网络,学生可以通过网络远程看到老师授课时的形象以及当前授课的讲义,让学生感觉好像老师正在面对面授课一样,从而克服距离的限制并进行实时授课。
然而,在某些应用场景下,直播授课时采用老师的形象并非最佳选择。例如,在老师为幼儿园的学生授课时,若直播中采用可爱的卡通人物形象给学生们授课,往往可以引起学生更大的学习乐趣和更高的学习热情。可是目前对视频中人物形象的替换方法,一般是通过在后期进行视频加工处理、手动合成视频来实现,这种替换方法难以在直播时实现。
因此,如何在直播中进行人物形象的替换成为了本领域技术人员亟需解决的问题。
发明内容
本发明实施例提供了一种视频直播中人物形象替换方法、装置和一种录播系统,能够在直播中进行人物形象的替换,处理效率高,为直播授课的方式提供了更多的选择。
本发明实施例提供的一种视频直播中人物形象替换方法,包括:
实时获取正在直播的目标视频当前的视频帧图像;
检测所述视频帧图像中是否存在人脸;
若所述视频帧图像中存在人脸,则根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓;
确定所述人体轮廓在所述视频帧图像中的人体坐标位置;
从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;
采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;
输出所述新的视频帧图像至网络进行直播。
可选地,所述根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓包括:
确定所述人脸在所述视频帧图像中的人脸坐标位置;
以所述人脸坐标位置作为判断边缘的起点,采用边缘检测算子识别所述视频帧图像中的人体轮廓。
可选地,在从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型之前,还包括:
判断历史视频帧图像是否存在对应的历史目标模型,所述历史视频帧图像为在获取所述当前的视频帧图像之前从所述目标视频中获取的视频帧图像;
若历史视频帧图像存在对应的历史目标模型,则将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型,然后执行所述采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像的步骤;
若历史视频帧图像不存在对应的历史目标模型,则执行所述从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型的步骤。
可选地,在将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型之前,还包括:
判断所述当前的视频帧图像中人脸的人脸特征是否与所述历史视频帧图像中人脸的人脸特征相同;
若所述当前的视频帧图像中人脸的人脸特征与所述历史视频帧图像中人脸的人脸特征相同,则执行将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型的步骤;
若所述当前的视频帧图像中人脸的人脸特征与所述历史视频帧图像中人脸的人脸特征不相同,则执行所述从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型的步骤。
可选地,所述从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型包括:
根据所述人体轮廓的信息确定所述人体轮廓对应人体的高度;
将所述人体的高度与所述人物模型集合中各个人物模型的高度进行比对,选取高度最接近且大于所述人体的高度的一个人物模型作为目标模型。
本发明实施例提供的一种视频直播中人物形象替换装置,包括:
帧图像获取模块,用于实时获取正在直播的目标视频当前的视频帧图像;
人脸检测模块,用于检测所述视频帧图像中是否存在人脸;
人体轮廓识别模块,用于若所述人脸检测模块的检测结果为是,则根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓;
人体位置确定模块,用于确定所述人体轮廓在所述视频帧图像中的人体坐标位置;
目标模型选取模块,用于从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;
替换模块,用于采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;
帧图像输出模块,用于输出所述新的视频帧图像至网络进行直播。
可选地,所述人体轮廓识别模块包括:
人脸位置确定单元,用于确定所述人脸在所述视频帧图像中的人脸坐标位置;
边缘检测单元,用于以所述人脸坐标位置作为判断边缘的起点,采用边缘检测算子识别所述视频帧图像中的人体轮廓。
可选地,所述视频直播中人物形象替换装置还包括:
模型判断模块,用于判断历史视频帧图像是否存在对应的历史目标模型,所述历史视频帧图像为在获取所述当前的视频帧图像之前从所述目标视频中获取的视频帧图像;
目标模型确定模块,用于若所述模型判断模块的判断结果为是,则将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型,然后触发所述替换模块;
第一触发模块,用于若所述模型判断模块的判断结果为否,则触发所述目标模型选取模块。
可选地,所述视频直播中人物形象替换装置还包括:
图像人脸判断模块,用于判断所述当前的视频帧图像中人脸的人脸特征是否与所述历史视频帧图像中人脸的人脸特征相同;
第二触发模块,用于若所述图像人脸判断模块的判断结果为是,则触发所述目标模型确定模块;
第三触发模块,用于若所述图像人脸判断模块的判断结果为否,则触发所述目标模型选取模块。
本发明实施例提供的一种录播系统,包括上述的视频直播中人物形象替换装置。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,首先,实时获取正在直播的目标视频当前的视频帧图像;然后,检测所述视频帧图像中是否存在人脸;若所述视频帧图像中存在人脸,则根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓;接着,确定所述人体轮廓在所述视频帧图像中的人体坐标位置;从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;再之,采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;最后,输出所述新的视频帧图像至网络进行直播。这样,可以实时地将直播中目标视频的人物形象采用预设的人物模型进行替换,替换后合成新的视频帧图像并输出至网路进行直播,无需等待视频的后期加工处理,处理效率高,为直播授课的方式提供了更多的选择。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种视频直播中人物形象替换方法一个实施例流程图;
图2为本发明实施例中一种视频直播中人物形象替换方法步骤103在一个应用场景下的流程示意图;
图3为本发明实施例中一种视频直播中人物形象替换方法步骤105在一个应用场景下的流程示意图;
图4为本发明实施例中一种视频直播中人物形象替换方法在一个应用场景下判断历史视频帧图像是否存在对应的历史目标模型的流程示意图;
图5为本发明实施例中一种视频直播中人物形象替换装置一个实施例结构图。
具体实施方式
本发明实施例提供了一种视频直播中人物形象替换方法、装置和一种录播系统,用于解决如何在直播中进行人物形象的替换的问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种视频直播中人物形象替换方法一个实施例包括:
101、实时获取正在直播的目标视频当前的视频帧图像;
本实施例中,上述所说的目标视频可以是指从录播系统中获取的直播中的视频。录播系统直播时,摄像头一般安装在教室的尾端或中部,向教室讲台的方向拍摄,以采集老师上课时的视频影像,摄像机接入到录播系统,录播系统可从网络或者线路对摄像机采集的数据进行获取和处理,从而生成所述目标视频。可以理解的是,在直播时,目标视频的视频帧图像是一边采集、一边处理,然后一边实时地上传至网络上的,因此步骤101所说的“当前的视频帧图像”是指目标视频最新的、准备上传至网络进行直播的视频帧图像。
关于“视频帧图像”,从摄像机中采集到的视频数据为以特定格式封装的数据,录播系统将数据解封装及解码操作后,可以获得视频数据的帧序列。视频的数据一般由帧序列组成,帧是指视频当中某一时刻的画面,然后录播系统对帧序列中的每个帧进行处理,可以将连续几个或几十个帧的帧序列作为一段视频处理序列,此处所说的视频处理序列即为上述的“视频帧图像”。例如,可以将连续10帧的帧序列看作一个(或一段)视频帧图像,假设在25帧每秒的视频当中,连续10帧的视频帧图像即为视频正常播放的10/25秒。
可以理解的是,本实施例中在获取视频帧图像时,可以获取单个帧的视频帧图像,也可以获取连续几个帧或几十个帧的视频帧图像,具体可以根据实际使用情况进行选择,此处不作限定。
102、检测所述视频帧图像中是否存在人脸,若是,则执行步骤103,若否,则返回执行步骤101;
在获取到该视频帧图像之后,可以通过对该视频帧图像进行人脸识别,从而判断视频帧图像中是否存在人脸。可以理解的是,若视频帧图像中存在人脸,则说明视频帧图像中存在可替换的人体(例如老师),此时可以执行步骤103。反之,若不存在人脸,则无需执行后续步骤进行人物形象替换处理,可以返回执行步骤101,获取目标视频的下一个视频帧图像。
103、根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓;
在检测到视频帧图像中存在人脸之后,可以从人脸识别中获知人脸在视频帧图像中的位置及大小,从而可以根据标准的人体参数按照人脸的位置和大小识别出人体对应的大致位置和大小,进而识别出人脸对应的人体轮廓。可以理解的是,若视频帧图像中老师的人体影像不完整,比如只录入了老师的上半身,则步骤103中识别出的人体轮廓为上半身的轮廓;若视频帧图像中老师的人体影像完整,也即录入了老师的全身,则步骤103中识别出的人体轮廓为全身的人体轮廓。
进一步地,如图2所示,步骤103可以包括:
201、确定所述人脸在所述视频帧图像中的人脸坐标位置;
202、以所述人脸坐标位置作为判断边缘的起点,采用边缘检测算子识别所述视频帧图像中的人体轮廓。
对于上述步骤201和202,可以理解的是,在确定出人脸在视频帧图像中的人脸坐标位置之后,例如该人脸的位置的左上角坐标为(Xmp,Ymp),人脸的最长宽度及最大高度为(Wmp,Hmp),则可以根据人脸的这些信息作为判断边缘的起点,使用roberts边缘检测算子识别出视频帧图像中的人体轮廓。也即,以人脸作为起点,沿着视频帧图像中的人体影像作边缘检测,逐步检测和分析出人体影像的轮廓边缘,当轮廓边缘检测完成且闭合之后,则可得到该人体影像的人体轮廓。
104、确定所述人体轮廓在所述视频帧图像中的人体坐标位置;
可以理解的是,在获得人体轮廓之后,可以从人体轮廓中提取出每个人体轮廓在视频帧图像中的边缘像素点坐标,由这一连串的边缘像素点坐标组成人体影像在视频帧图像中的位置,也即所述“人体坐标位置”。
105、从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;
可以理解的是,人物模型集合中预先设置有多个人物模型,这些人物模型各不相同,例如可以包括不同的人物形象(海绵宝宝、叮当、比卡丘、柯南等卡通形象)、可以设置不同的人物体形(高矮胖瘦),等等。从而可以从人物模型集合中选取与人体轮廓匹配的一个人物模型作为目标模型,例如要求选取的人物模型与人体轮廓在身高、胖瘦上匹配。
具体地,可以使用3DMax制作三维立体卡通人物,塑造体型较胖三维立体卡通人物,可以设置人物高度为130厘米,手臂张开长度为150厘米(人体基本常识:人伸开两臂的长度约等于身高)。然后,继续制作三维立体卡通人物,每次的人物高度递增25厘米,直到有高度为200厘米的三维立体卡通人物为止。也即,该三维立体卡通人物包括身高为130厘米、155厘米、180厘米、205厘米等四个身高尺寸的人物模型,从而可以大致覆盖人体高度1米3至2米范围的人物形象。
进一步地,如图3所示,上述步骤105可以包括:
301、根据所述人体轮廓的信息确定所述人体轮廓对应人体的高度;
302、将所述人体的高度与所述人物模型集合中各个人物模型的高度进行比对,选取高度最接近且大于所述人体的高度的一个人物模型作为目标模型。
对于步骤301,由于可能存在不完整的人体轮廓,例如只有上半身的人体轮廓。因此人体轮廓的高度不一定等于人体的高度。步骤301中,需要根据人体轮廓的信息,例如人体轮廓中人脸的高度和大小、肩宽等信息分析、估算出人体的高度。
对于步骤302,可以理解的是,在进行人物形象替换时,最关心的因素是人物形象与人体轮廓的高度是否匹配,而胖瘦方面则可以通过变形、拉伸的方式进行人物形象的修改。因此,在选取人物模型时,可以选取高度最接近且身高数值偏大的人物模型作为用于填充该人体轮廓的目标模型,避免由于人物模型等于或稍矮于人体的高度导致替换时出现人物模型无法完全覆盖人体轮廓的情况。
需要说明的是,本实施例中,在确定出目标模型之后,可以标识该目标模型,并将目标模型的信息存入内存中等待后续步骤处理。
在一个目标视频中,常见的授课老师一般只有一位,特殊情况下2~3位,因此,对于同一个目标视频来说,频繁地确定目标模型不仅没有意义,而且容易造成系统运算资源的浪费,甚至可能出现目标模型误判,导致替换后的人物形象频繁更换的问题。例如,在10秒内,目标视频直播中的人物形象前一秒是柯南,后一秒又变成了“孙悟空”,容易造成学生的混乱,会降低用户体验。因此,进一步地,如图4所示,在步骤105之前,本实施例的人物形象替换方法还可以包括:
401、判断历史视频帧图像是否存在对应的历史目标模型,若是,则执行步骤402,若否,则执行步骤105;
402、将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型,然后执行步骤106。
对于步骤401和402,所述历史视频帧图像是指在获取所述当前的视频帧图像之前从所述目标视频中获取的视频帧图像。可以理解的是,若历史视频帧图像存在对应的历史目标模型,则可以将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型,然后执行步骤106,合成新的视频帧图像,无需执行步骤105选取目标模型。反之,若历史视频帧图像不存在对应的历史目标模型,则表示对目标视频来说,尚未确定出视频帧图像中与人体轮廓匹配的目标模型,因此执行步骤105。
更进一步地,在判断得知历史视频帧图像存在对应的历史目标模型之后,在上述步骤402之前,还可以判断所述当前的视频帧图像中人脸的人脸特征是否与所述历史视频帧图像中人脸的人脸特征相同,若是,则执行步骤402,若否,则执行步骤105。可以理解的是,在某些应用场景下,目标视频中可能会录入多位老师的影像,由于不同老师之间身高可能存在差异,因此不同老师的人体轮廓对应替换的人物模型的高度也有所不同。这样,本实施例中的人物形象替换方法针对不同的人体轮廓采用不同的人物模型进行替换,既可以避免出现模型替换时不适用的问题,还可以让观看直播的用户(学生)能清晰地通过替换后不同的人物形象区分出哪部分直播内容是这位老师的,哪部分直播内容是另一位老师的。因此,若所述当前的视频帧图像中人脸的人脸特征与所述历史视频帧图像中人脸的人脸特征相同,则表示对于该人脸对应的用户(老师)已经匹配过人物模型(即历史目标模型)了,直接采取之前匹配的人物模型即可,执行步骤402;若所述当前的视频帧图像中人脸的人脸特征与所述历史视频帧图像中人脸的人脸特征不相同,则表示对于该人脸对应的用户(老师)还未匹配过人物模型,此时需要执行步骤105进行目标模型的选取。
106、采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;
在选取或确定出人体轮廓对应的目标模型之后,可以采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像。
具体可以是,根据人体轮廓的边缘,取出待替换人体影像的最高点、中心点、最左点、最右点,以及身体位置的最左点和最右点,以及手臂与身体位置的起始点与终止位置点等;再将目标模型对应该人体轮廓边缘的最高点、中心点、最左点、最右点置入,将目标模型的造型(动作)根据所述的身体位置的最左点和最右点、以及手臂与身体位置的起始点与终止位置点进行提取变型置入。这里所说的置入,是指将目标模型转换为二维图像,随后以人体轮廓对应的人体影像为基准,将每个像素点的值替换到原图对应位置上,从而得出新产生的每帧的图像,也即得到新的视频帧图像。
107、输出所述新的视频帧图像至网络进行直播。
在合成出所述当前的视频帧图像对应的新的视频帧图像之后,输出该新的视频帧图像至网络,从而通过网络进行直播这部分视频帧图像。可知,对于目标视频来说,直播中是将一个又一个的新的视频帧图像上传至网络,在处理环境和网络环境较好的情况下,直播的双方(本地的老师以及远程的学生)无法察觉到较大的时延,具有较好的直播体验。
由上述内容可知,本实施例的人物形象替换方法相比现有技术来说,可以将视频合成后,实现实时直播,丰富了视频的应用场景,提高观看视频的实时性;另外,可以支持现场拍摄并实时分析处理,应用范围更广,可以适应到各种应用场景下,尤其适用于直播授课的场景。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上面主要描述了一种视频直播中人物形象替换方法,下面将对一种视频直播中人物形象替换装置进行详细描述。
图5示出了本发明实施例中一种视频直播中人物形象替换装置一个实施例结构图。
本实施例中,一种视频直播中人物形象替换装置包括:
帧图像获取模块501,用于实时获取正在直播的目标视频当前的视频帧图像;
人脸检测模块502,用于检测所述视频帧图像中是否存在人脸;
人体轮廓识别模块503,用于若所述人脸检测模块502的检测结果为是,则根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓;
人体位置确定模块504,用于确定所述人体轮廓在所述视频帧图像中的人体坐标位置;
目标模型选取模块505,用于从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;
替换模块506,用于采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;
帧图像输出模块507,用于输出所述新的视频帧图像至网络进行直播。
进一步地,所述人体轮廓识别模块可以包括:
人脸位置确定单元,用于确定所述人脸在所述视频帧图像中的人脸坐标位置;
边缘检测单元,用于以所述人脸坐标位置作为判断边缘的起点,采用边缘检测算子识别所述视频帧图像中的人体轮廓。
进一步地,所述视频直播中人物形象替换装置还可以包括:
模型判断模块,用于判断历史视频帧图像是否存在对应的历史目标模型,所述历史视频帧图像为在获取所述当前的视频帧图像之前从所述目标视频中获取的视频帧图像;
目标模型确定模块,用于若所述模型判断模块的判断结果为是,则将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型,然后触发所述替换模块;
第一触发模块,用于若所述模型判断模块的判断结果为否,则触发所述目标模型选取模块。
进一步地,所述视频直播中人物形象替换装置还可以包括:
图像人脸判断模块,用于判断所述当前的视频帧图像中人脸的人脸特征是否与所述历史视频帧图像中人脸的人脸特征相同;
第二触发模块,用于若所述图像人脸判断模块的判断结果为是,则触发所述目标模型确定模块;
第三触发模块,用于若所述图像人脸判断模块的判断结果为否,则触发所述目标模型选取模块。
进一步地,所述目标模型选取模块可以包括:
人体高度确定单元,用于根据所述人体轮廓的信息确定所述人体轮廓对应人体的高度;
比对选取单元,用于将所述人体的高度与所述人物模型集合中各个人物模型的高度进行比对,选取高度最接近且大于所述人体的高度的一个人物模型作为目标模型。
本发明还提供了一种录播系统,其包括图5对应实施例中描述的任意一种视频直播中人物形象替换装置。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实施例的模块、单元和/或方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种视频直播中人物形象替换方法,其特征在于,包括:
实时获取正在直播的目标视频当前的视频帧图像;
检测所述视频帧图像中是否存在人脸;
若所述视频帧图像中存在人脸,则根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓;
确定所述人体轮廓在所述视频帧图像中的人体坐标位置;
从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;
采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;
输出所述新的视频帧图像至网络进行直播。
2.根据权利要求1所述的视频直播中人物形象替换方法,其特征在于,所述根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓包括:
确定所述人脸在所述视频帧图像中的人脸坐标位置;
以所述人脸坐标位置作为判断边缘的起点,采用边缘检测算子识别所述视频帧图像中的人体轮廓。
3.根据权利要求1所述的视频直播中人物形象替换方法,其特征在于,在从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型之前,还包括:
判断历史视频帧图像是否存在对应的历史目标模型,所述历史视频帧图像为在获取所述当前的视频帧图像之前从所述目标视频中获取的视频帧图像;
若历史视频帧图像存在对应的历史目标模型,则将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型,然后执行所述采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像的步骤;
若历史视频帧图像不存在对应的历史目标模型,则执行所述从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型的步骤。
4.根据权利要求3所述的视频直播中人物形象替换方法,其特征在于,在将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型之前,还包括:
判断所述当前的视频帧图像中人脸的人脸特征是否与所述历史视频帧图像中人脸的人脸特征相同;
若所述当前的视频帧图像中人脸的人脸特征与所述历史视频帧图像中人脸的人脸特征相同,则执行将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型的步骤;
若所述当前的视频帧图像中人脸的人脸特征与所述历史视频帧图像中人脸的人脸特征不相同,则执行所述从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型的步骤。
5.根据权利要求1至4中任一项所述的视频直播中人物形象替换方法,其特征在于,所述从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型包括:
根据所述人体轮廓的信息确定所述人体轮廓对应人体的高度;
将所述人体的高度与所述人物模型集合中各个人物模型的高度进行比对,选取高度最接近且大于所述人体的高度的一个人物模型作为目标模型。
6.一种视频直播中人物形象替换装置,其特征在于,包括:
帧图像获取模块,用于实时获取正在直播的目标视频当前的视频帧图像;
人脸检测模块,用于检测所述视频帧图像中是否存在人脸;
人体轮廓识别模块,用于若所述人脸检测模块的检测结果为是,则根据标准的人体参数按照人脸的位置和大小识别所述人脸对应的人体轮廓;
人体位置确定模块,用于确定所述人体轮廓在所述视频帧图像中的人体坐标位置;
目标模型选取模块,用于从预设的人物模型集合中选取与所述人体轮廓匹配的一个人物模型作为目标模型;
替换模块,用于采用所述目标模型替换所述人体轮廓至所述人体坐标位置上,合成新的视频帧图像;
帧图像输出模块,用于输出所述新的视频帧图像至网络进行直播。
7.根据权利要求6所述的视频直播中人物形象替换装置,其特征在于,所述人体轮廓识别模块包括:
人脸位置确定单元,用于确定所述人脸在所述视频帧图像中的人脸坐标位置;
边缘检测单元,用于以所述人脸坐标位置作为判断边缘的起点,采用边缘检测算子识别所述视频帧图像中的人体轮廓。
8.根据权利要求6所述的视频直播中人物形象替换装置,其特征在于,所述视频直播中人物形象替换装置还包括:
模型判断模块,用于判断历史视频帧图像是否存在对应的历史目标模型,所述历史视频帧图像为在获取所述当前的视频帧图像之前从所述目标视频中获取的视频帧图像;
目标模型确定模块,用于若所述模型判断模块的判断结果为是,则将所述历史视频帧图像对应的历史目标模型确定为当前的视频帧图像对应的目标模型,然后触发所述替换模块;
第一触发模块,用于若所述模型判断模块的判断结果为否,则触发所述目标模型选取模块。
9.根据权利要求8所述的视频直播中人物形象替换装置,其特征在于,所述视频直播中人物形象替换装置还包括:
图像人脸判断模块,用于判断所述当前的视频帧图像中人脸的人脸特征是否与所述历史视频帧图像中人脸的人脸特征相同;
第二触发模块,用于若所述图像人脸判断模块的判断结果为是,则触发所述目标模型确定模块;
第三触发模块,用于若所述图像人脸判断模块的判断结果为否,则触发所述目标模型选取模块。
10.一种录播系统,其特征在于,包括如权利要求6至9中任一项所述的视频直播中人物形象替换装置。
CN201710307420.8A 2017-05-05 2017-05-05 一种视频直播中人物形象替换方法、装置和一种录播系统 Active CN107105310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710307420.8A CN107105310B (zh) 2017-05-05 2017-05-05 一种视频直播中人物形象替换方法、装置和一种录播系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710307420.8A CN107105310B (zh) 2017-05-05 2017-05-05 一种视频直播中人物形象替换方法、装置和一种录播系统

Publications (2)

Publication Number Publication Date
CN107105310A CN107105310A (zh) 2017-08-29
CN107105310B true CN107105310B (zh) 2020-07-10

Family

ID=59658107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710307420.8A Active CN107105310B (zh) 2017-05-05 2017-05-05 一种视频直播中人物形象替换方法、装置和一种录播系统

Country Status (1)

Country Link
CN (1) CN107105310B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563962A (zh) * 2017-09-08 2018-01-09 北京奇虎科技有限公司 视频数据实时处理方法及装置、计算设备
CN109558773B (zh) * 2017-09-26 2023-04-07 阿里巴巴集团控股有限公司 信息识别方法、装置及电子设备
CN107820027A (zh) * 2017-11-02 2018-03-20 北京奇虎科技有限公司 视频人物装扮方法、装置、计算设备及计算机存储介质
CN108111779A (zh) * 2017-11-21 2018-06-01 深圳市朗形数字科技有限公司 一种视频处理的方法及终端设备
CN108174237A (zh) * 2017-12-28 2018-06-15 北京奇虎科技有限公司 图像合成方法及装置
CN107977657A (zh) * 2017-12-29 2018-05-01 佛山市幻云科技有限公司 远程监护方法、终端及系统
CN108521597B (zh) * 2018-03-21 2020-12-25 浙江口碑网络技术有限公司 直播信息动态展示方法及装置
CN110662048A (zh) * 2018-06-28 2020-01-07 华为技术有限公司 一种图像编码方法以及设备
CN109345447A (zh) * 2018-09-20 2019-02-15 广州酷狗计算机科技有限公司 面部替换处理的方法和装置
CN110969673B (zh) * 2018-09-30 2023-12-15 西藏博今文化传媒有限公司 一种直播换脸交互实现方法、存储介质、设备及系统
US20210383579A1 (en) * 2018-10-30 2021-12-09 Pak Kit Lam Systems and methods for enhancing live audience experience on electronic device
CN109474850B (zh) * 2018-11-29 2021-07-20 北京字节跳动网络技术有限公司 运动像素视频特效添加方法、装置、终端设备及存储介质
CN109788312B (zh) * 2019-01-28 2022-10-21 北京易捷胜科技有限公司 一种视频中人物的替换方法
CN110349081B (zh) * 2019-06-17 2023-04-07 达闼科技(北京)有限公司 图像的生成方法、装置、存储介质和电子设备
CN110266973B (zh) * 2019-07-19 2020-08-25 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机可读存储介质和计算机设备
US11145334B2 (en) 2019-08-29 2021-10-12 International Business Machines Corporation Composite video frame replacement
CN111107264A (zh) * 2019-11-11 2020-05-05 宇龙计算机通信科技(深圳)有限公司 图像处理方法、装置、存储介质以及终端
CN112755533B (zh) * 2021-02-02 2022-12-13 腾讯科技(深圳)有限公司 虚拟载具涂装方法、装置、设备及存储介质
CN113207038B (zh) * 2021-04-21 2023-04-28 维沃移动通信(杭州)有限公司 视频处理方法、视频处理装置和电子设备
CN113538490B (zh) * 2021-07-20 2022-10-28 刘斌 视频流处理方法及装置
CN113784077B (zh) * 2021-09-24 2023-03-21 联想(北京)有限公司 一种信息处理方法、装置和电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1710611A (zh) * 2005-07-14 2005-12-21 中国科学院计算技术研究所 一种基于优化思想的人体姿态变形方法
CN101098241A (zh) * 2006-06-26 2008-01-02 腾讯科技(深圳)有限公司 虚拟形象实现方法及其系统
CN103218773A (zh) * 2011-11-09 2013-07-24 索尼公司 信息处理设备、显示控制方法和程序
CN103971394A (zh) * 2014-05-21 2014-08-06 中国科学院苏州纳米技术与纳米仿生研究所 人脸动画合成方法
CN104637035A (zh) * 2015-02-15 2015-05-20 百度在线网络技术(北京)有限公司 生成卡通人脸图片的方法、装置及系统
CN104935860A (zh) * 2014-03-18 2015-09-23 北京三星通信技术研究有限公司 视频通话实现方法及装置
CN105556508A (zh) * 2013-08-04 2016-05-04 艾斯适配有限公司 虚拟镜子的装置、系统和方法
CN106599817A (zh) * 2016-12-07 2017-04-26 腾讯科技(深圳)有限公司 一种人脸替换方法及装置
CN106582005A (zh) * 2016-11-14 2017-04-26 深圳市豆娱科技有限公司 一种虚拟游戏中数据同步交互方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1710611A (zh) * 2005-07-14 2005-12-21 中国科学院计算技术研究所 一种基于优化思想的人体姿态变形方法
CN101098241A (zh) * 2006-06-26 2008-01-02 腾讯科技(深圳)有限公司 虚拟形象实现方法及其系统
CN103218773A (zh) * 2011-11-09 2013-07-24 索尼公司 信息处理设备、显示控制方法和程序
CN105556508A (zh) * 2013-08-04 2016-05-04 艾斯适配有限公司 虚拟镜子的装置、系统和方法
CN104935860A (zh) * 2014-03-18 2015-09-23 北京三星通信技术研究有限公司 视频通话实现方法及装置
CN103971394A (zh) * 2014-05-21 2014-08-06 中国科学院苏州纳米技术与纳米仿生研究所 人脸动画合成方法
CN104637035A (zh) * 2015-02-15 2015-05-20 百度在线网络技术(北京)有限公司 生成卡通人脸图片的方法、装置及系统
CN106582005A (zh) * 2016-11-14 2017-04-26 深圳市豆娱科技有限公司 一种虚拟游戏中数据同步交互方法及装置
CN106599817A (zh) * 2016-12-07 2017-04-26 腾讯科技(深圳)有限公司 一种人脸替换方法及装置

Also Published As

Publication number Publication date
CN107105310A (zh) 2017-08-29

Similar Documents

Publication Publication Date Title
CN107105310B (zh) 一种视频直播中人物形象替换方法、装置和一种录播系统
CN108805047B (zh) 一种活体检测方法、装置、电子设备和计算机可读介质
US20210279971A1 (en) Method, storage medium and apparatus for converting 2d picture set to 3d model
CN108463823B (zh) 一种用户头发模型的重建方法、装置及终端
CN110956138B (zh) 一种基于家教设备的辅助学习方法及家教设备
US8948533B2 (en) Increased quality of image objects based on depth in scene
CN109559362B (zh) 一种图像主体脸部替换方法及装置
CN112101123B (zh) 一种注意力检测方法及装置
KR20150039252A (ko) 행동 인식 기반의 응용 서비스 제공 장치 및 그 방법
CN105357519B (zh) 基于自相似度特征的无参考立体图像质量客观评价方法
CN109035415B (zh) 虚拟模型的处理方法、装置、设备和计算机可读存储介质
CN110889824A (zh) 一种样本生成方法、装置、电子设备及计算机可读存储介质
CN110287848A (zh) 视频的生成方法及装置
CN111985281A (zh) 图像生成模型的生成方法、装置及图像生成方法、装置
CN112001944A (zh) 课堂教学质量评价数据的获取方法、计算机设备和介质
CN113160231A (zh) 一种样本生成方法、样本生成装置及电子设备
CN110213605B (zh) 图像纠正方法、装置及设备
CN111353439A (zh) 一种教学行为的分析方法、装置、系统及设备
CN108764248B (zh) 图像特征点的提取方法和装置
CN104574434B (zh) 物体检测方法和装置
CN109299777B (zh) 一种基于人工智能的数据处理方法及其系统
CN112580584A (zh) 起立行为检测方法、装置、系统及存储介质
CN112070181A (zh) 一种基于图像流的协同检测方法及装置、存储介质
CN111314665A (zh) 一种视频事后评分的关键视频段提取系统及方法
CN110751163B (zh) 目标定位方法及其装置、计算机可读存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant