CN109922354A - 直播互动方法、装置、直播系统及电子设备 - Google Patents

直播互动方法、装置、直播系统及电子设备 Download PDF

Info

Publication number
CN109922354A
CN109922354A CN201910251306.7A CN201910251306A CN109922354A CN 109922354 A CN109922354 A CN 109922354A CN 201910251306 A CN201910251306 A CN 201910251306A CN 109922354 A CN109922354 A CN 109922354A
Authority
CN
China
Prior art keywords
main broadcaster
interaction
movement
virtual image
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910251306.7A
Other languages
English (en)
Other versions
CN109922354B9 (zh
CN109922354B (zh
Inventor
徐子豪
吴昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201910251306.7A priority Critical patent/CN109922354B9/zh
Priority to CN202010555373.0A priority patent/CN111641844B/zh
Publication of CN109922354A publication Critical patent/CN109922354A/zh
Priority to US17/598,733 priority patent/US20220103891A1/en
Priority to SG11202111323RA priority patent/SG11202111323RA/en
Priority to PCT/CN2020/081627 priority patent/WO2020200082A1/zh
Application granted granted Critical
Publication of CN109922354B publication Critical patent/CN109922354B/zh
Publication of CN109922354B9 publication Critical patent/CN109922354B9/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration

Abstract

本申请实施例提供了一种直播互动方法、装置、直播系统及电子设备,当从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测主播互动动作的动作姿态和动作类型,其中,主播互动动作包括佩戴目标道具和/或目标肢体动作。而后,根据主播互动动作的动作姿态和动作类型生成主播对应的虚拟形象的互动视频流,并通过直播服务器将虚拟形象的互动视频流发送给直播接收终端进行播放。如此,通过将主播的虚拟形象的互动内容与主播互动动作的动作姿态和动作类型产生关联,可以提高直播过程中的互动效果,减少主播发起虚拟形象互动时的人为操作,实现虚拟形象的自动互动。

Description

直播互动方法、装置、直播系统及电子设备
技术领域
本申请涉及互联网直播领域,具体而言,涉及一种直播互动方法、装置、直播系统及电子设备。
背景技术
为了丰富主播和观众之间的互动,在网络直播过程中,在一些实施方式中,可以在直播界面展示虚拟形象,以通过该虚拟形象与观众进行互动。然而,该方案中虚拟形象仅仅只是单纯地演示某个互动动作,难以与主播产生动作关联,导致实际互动效果不佳。
发明内容
有鉴于此,本申请实施例的目的在于提供一种直播互动方法、装置、直播系统及电子设备,以解决或者改善上述问题。
根据本申请实施例的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可执行指令。当电子设备运行时,处理器执行所述机器可执行指令,以执行直播互动方法。
根据本申请实施例的另一方面,提供一种直播互动方法,应用于直播提供终端,所述方法包括:
当从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测所述主播互动动作的动作姿态和动作类型;
其中,所述主播互动动作包括佩戴目标道具和/或目标肢体动作;
根据所述主播互动动作的动作姿态和动作类型生成所述主播对应的虚拟形象的互动视频流,并通过所述直播服务器将所述虚拟形象的互动视频流发送给所述直播接收终端进行播放。
根据本申请实施例的另一方面,提供一种直播互动装置,应用于直播提供终端,所述装置包括:
检测模块,用于当从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测所述主播互动动作的动作姿态和动作类型,其中,所述主播互动动作包括佩戴目标道具和/或目标肢体动作;
生成模块,用于根据所述主播互动动作的动作姿态和动作类型生成所述主播对应的虚拟形象的互动视频流,并通过所述直播服务器将所述虚拟形象的互动视频流发送给所述直播接收终端进行播放。
根据本申请实施例的另一方面,提供一种直播系统,所述直播系统包括直播提供终端、直播接收终端以及分别与所述直播提供终端和所述直播接收终端通信连接的直播服务器;
所述直播提供终端用于当从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测所述主播互动动作的动作姿态和动作类型,其中,所述主播互动动作包括佩戴目标道具和/或目标肢体动作;
所述直播服务器用于将所述虚拟形象的互动视频流发送给所述直播接收终端;
所述直播接收终端用于在直播界面中播放所述虚拟形象的互动视频流。
根据本申请实施例的另一方面,提供一种可读存储介质,该可读存储介质上存储有机器可执行指令,该计算机程序被处理器运行时可以执行上述的直播互动方法的步骤。
基于上述任一方面,本申请实施例在从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测主播互动动作的动作姿态和动作类型,其中,主播互动动作包括佩戴目标道具和/或目标肢体动作。而后,根据主播互动动作的动作姿态和动作类型生成主播对应的虚拟形象的互动视频流,并通过直播服务器将虚拟形象的互动视频流发送给直播接收终端进行播放。如此,通过将主播的虚拟形象的互动内容与主播互动动作的动作姿态和动作类型产生关联,可以提高直播过程中的互动效果,减少主播发起虚拟形象互动时的人为操作,实现虚拟形象的自动互动。
为使本申请实施例的上述目的、特征和优点能更明显易懂,下面将结合实施例,并配合所附附图,作详细说明。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的直播系统的应用场景示意框图;
图2示出了本申请实施例所提供的直播互动方法的流程示意图;
图3示出了本申请实施例所提供的直播提供终端的直播界面示意图;
图4示出了本申请实施例所提供的图1所示的直播提供终端的示例性组件示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请实施例的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1是本申请实施例提供的直播系统10的应用场景示意图。例如,直播系统10可以是用于诸如互联网直播之类的服务平台。参照图1所示,直播系统10可以包括直播服务器200、直播提供终端100以及直播接收终端300,直播服务器200分别与直播提供终端100以及直播接收终端300通信连接,用于为直播提供终端100以及直播接收终端300提供直播服务。例如,直播提供终端100可以将直播间的直播视频流发送给直播服务器200,观众可以通过直播接收终端300访问直播服务器200以观看直播间的直播视频。又例如,主播服务器也可以在观众订阅的直播间开播时向该观众的直播接收终端300发送通知消息。直播视频流可以是当前正在直播平台中直播的视频流或者直播完成后形成的完整视频流。
可以理解,图1所示的直播系统10仅为一种可行的示例,在其它可行的实施例中,该直播系统10也可以仅包括图1所示组成部分的其中一部分或者还可以包括其它的组成部分。
在一些实施场景中,直播提供终端100和直播接收终端300可以互换使用。例如,直播提供终端100的主播可以使用直播提供终端100来为观众提供直播视频服务,或者作为观众查看其它主播提供的直播视频。又例如,直播接收终端300的观众也可以使用直播接收终端300观看所关注的主播提供的直播视频,或者作为主播为其它观众提供直播视频服务。
本实施例中,直播系统10还可以包括用于采集主播的主播视频帧的视频采集装置400,视频采集装置400直接安装或者集成于直播提供终端100,也可以独立于直播提供终端100并与直播提供终端100连接。
图2示出了本申请实施例提供的直播互动方法的流程示意图,该直播互动方法可由图1中所示的直播提供终端100执行。应当理解,在其它实施例中,本实施例的直播互动方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。该直播互动方法的详细步骤介绍如下。
步骤S110,当从视频采集装置400实时采集的主播视频帧中检测到主播发起主播互动动作时,检测主播互动动作的动作姿态和动作类型。
作为一种可能的实施方式,视频采集装置400可以根据预设的实时主播视频帧采集速率,采集主播的主播视频帧。前述实时主播视频帧采集速率可以根据实际网络带宽、直播提供终端100的处理性能以及网络传输协议而设定。通常三维引擎可提供60/s或者30/s等不同的渲染速率,本实施例可以根据实际网络带宽、播提供终端的处理性能以及目标传输协议等客观因素来确定所需的实时主播视频帧采集速率,由此可以确保后续渲染虚拟形象的视频流的实时性及流畅性。
本实施例中,主播互动动作可包括佩戴目标道具和/或目标肢体动作。例如,在从主播视频帧中检测到主播佩戴目标道具时,可检测目标道具的道具属性和参考点位置向量,并根据道具属性查找目标肢体动作的动作类型,而后根据参考点位置向量采用逆向运动学算法预测主播互动动作的动作姿态。
其中,目标道具可以是直播平台为主播提供的用于指示主播互动动作的动作类型的各种互动道具,这些互动道具的属性可以包括形状信息,在此情况下,互动道具可以依据具体主播互动动作的动作类型进行设计。例如,若互动道具A用于指示“剪刀手的卖萌动作”,则该互动道具A可以设计为剪刀手的形状。又例如,若互动道具B用于指示“手比爱心的温馨动作”,则该互动道具B可以设计为手比爱心的形状。
或者,这些互动道具的道具属性还可以包括颜色信息,在此情况下,互动道具的颜色可以依据具体主播互动动作的动作类型进行设计,例如,若互动道具A用于指示“剪刀手的卖萌动作”,则该互动道具A可以设计为红色,又例如,若互动道具A用于指示“手比爱心的温馨动作”,则该互动道具B可以设计为蓝色。如此设计,主播提供终端可以通过识别互动道具的属性快速识别到目标肢体动作的动作类型,无需进行深度神经网络算法识别,从而大大减少计算量,提高识别速度和识别精度。
除此之外,在另一种实施方式中,在从主播视频帧中检测到主播发起目标肢体动作时,可以检测目标肢体动作的参考点位置向量,并采用深度神经网络模型识别目标肢体动作的动作类型。而后,根据参考点位置向量采用逆向运动学(Inverse Kinematic,IK)算法预测主播互动动作的动作姿态。
可选地,目标肢体动作可包括但并不限于起立、坐下、转圈、倒立、身体晃动、挥手、剪刀手、握拳、手比爱心、托手、鼓掌、手掌张开、手掌闭合、竖大拇指、手枪姿势、V手势和OK手势等直播常用的肢体动作。
作为一种可能的实施方式,采用深度神经网络模型识别目标肢体动作的动作类型的具体过程可以是:将主播视频帧输入到深度神经网络模型,得到识别结果图,并根据识别结果图确定主播视频帧中包含的目标肢体动作的动作类型。
其中,上述识别结果图中包含至少一个目标框,目标框为标记识别结果图中的目标肢体动作的动作类型的几何框。下面对具体识别过程进行详细阐述。
第一、通过深度神经网络模型将主播视频帧分割为多个网格。
第二、为了适应直播场景的多样性,针对每个网格,会在该网格内生成多个不同属性参数的几何预测框,其中,每个几何预测框对应一个基准框,每个几何预测框的属性参数包括相对于基准框的中心点坐标、宽度、高度以及类别。
第三、计算每个几何预测框的置信度得分,并根据计算结果剔除置信度得分低于预设得分阈值的几何预测框。
例如,可以针对每个几何预测框,判断该几何预测框的区域内是否存在目标肢体动作:若不存在目标肢体动作,则判定该几何预测框的置信度得分为0;若存在目标肢体动作,则计算该几何预测框的区域属于目标肢体动作的后验概率,并计算该几何预测框的检测评价函数值,其中,检测评价函数值用于表征目标肢体动作与该几何预测框的交集与目标肢体动作与该几何预测框的并集之间的比值。最后,可以根据后验概率与检测评价函数值的乘积得到该几何预测框的置信度得分。
在此基础上,可以预先设定一个预设得分阈值,若该几何预测框的置信度得分低于该预设得分阈值的几何预测框,表示该几何预测框中的目标不可能是直播互动动作的预测目标,若该几何预测框的置信度得分大于等于该预设得分阈值的几何预测框,表示该几何预测框中的目标有可能是直播互动动作的预测目标。由此,可以剔除所有置信度得分低于该预设得分阈值的几何预测框,从而一次性剔除大量的不可能存在直播互动动作的目标的几何预测框,只对有可能存在直播互动动作的目标的几何预测框进行后续的处理,从而大大减少后续计算量,进一步提高识别速度。
第四、按照置信度得分由大到小的顺序对该网格内剩余的几何框进行排序,并根据排序结果将置信度得分最大的几何框确定为目标框,以得到识别结果图。
由此,通过直播图像的识别结果图,若存在标记有目标肢体动作的目标框,则确定主播视频帧中包含目标肢体动作,并可以确定该目标肢体动作的互动动作类型。
在前述基础上,为了实现后续虚拟形象与主播之间的整体动作同步,还需要根据目标肢体动作的参考点位置向量或者目标道具的参考点位置向量,采用逆向运动学算法预测主播互动动作的动作姿态。
例如,可以根据参考点位置向量计算主播的互动肢体的中心点高度以及主播的互动肢体相对于视频采集装置400的姿态旋转矩阵。接着,根据姿态旋转矩阵、参考点位置向量和中心点高度,计算主播的互动肢体的各个肢体关节的位置向量,其中,位置向量包括主播的互动肢体在各个参考轴方向上的分量。最后,根据计算得到的各个肢体关节的位置向量得到主播互动动作的动作姿态。
其中,参考轴方向可以预先进行配置,以二维空间为例,参考轴方向可以包括相互垂直的X轴方向和Y轴方向;以三维空间为例,参考轴方向可以包括相互垂直的X轴方向、Y轴方向以及Z轴方向。
主播的互动肢体相对于视频采集装置400的姿态旋转矩阵主要是指互动肢体相对于视频采集装置400在二维空间或者三维空间的位置和姿态。以三维空间为例,该位置可以用一个位置矩阵来描述,该姿态可以用坐标系三个坐标轴两两夹角的余弦值组成的姿态矩阵来表示。
步骤S120,根据主播互动动作的动作姿态和动作类型生成主播对应的虚拟形象的互动视频流,并通过直播服务器200将虚拟形象的互动视频流发送给直播接收终端300进行播放。
其中,虚拟形象可以采用与主播的外貌、体态、气质等相符的虚拟人物形象,并可以以二维虚拟形象、三维虚拟形象、VR虚拟形象、AR虚拟形象等显示在直播界面中,从而与观众进行直播互动。
本实施例中,直播提供终端100中预先存储有预设互动内容库,预设互动内容库包括各个动作类型对应的虚拟形象互动内容,虚拟形象互动内容包括对话互动内容、特效互动内容以及肢体互动内容中的一种或者多种组合。可选地,主播可以在直播提供终端100本地配置预设互动内容库,也可以通过直播提供终端100从直播服务器200中下载预设互动内容库,本实施例对此不作具体限制。
可选地,对话互动内容可以可以包括字幕图片、字幕特效等互动信息,特效互动内容可以包括静态特效图片、动态特效图片等图像信息,肢体互动内容可以包括面部表情(诸如开心、愤怒、激动、痛苦和悲伤等)特效图片等图像信息。
由此,在主播互动动作的动作姿态和动作类型后,可以从预设互动内容库中获取动作类型对应的虚拟形象互动内容,然后根据动作姿态和虚拟形象互动内容生成虚拟形象的互动视频流。详细地,可以按照动作姿态关联的各个目标关节点的位移坐标,控制虚拟形象的各个目标关节点沿对应的位移坐标移动,并按照虚拟形象互动内容控制虚拟形象执行对应的互动动作,以生成对应的互动视频流。
作为一种可能的实施方式,在上述过程中,可以通过使用的图形图像绘制或渲染方法等生成虚拟形象的互动视频流。可选地,可以基于OpenGL图形绘制引擎或Unity 3D渲染引擎等进行2D图形形象或3D图形形象的绘制生成虚拟形象的互动视频流,以使带有虚拟形象的互动效果的互动视频流得到展现。OpenGL定义了一个跨编程语言、跨平台的编程接口规格的专业的图形程序接口,其与硬件无关,可以方便地进行2D或3D图形图像的绘制。通过OpenGL和/或Unity 3D渲染引擎等,不仅可以实现2D效果如2D贴纸或特效的绘制,还可以实现3D特效的绘制及粒子特效的绘制等等。
仅作为示例,请参阅图3,示出了直播提供终端100的一种直播界面示例图,在该直播界面中,可以包括直播界面显示框、主播视频帧显示框以及虚拟形象区域。其中,直播界面显示框用于显示当前正在直播平台中直播的视频流或者直播完成后形成的完整视频流,主播视频帧显示框用于显示视频采集装置400实时采集到的主播视频帧,虚拟形象区域用于展示主播的虚拟形象。
当主播发起主播互动动作时,该主播视频帧显示框中会显示主播的发起的主播互动动作,同时可以检测到主播互动动作的动作姿态和动作类型,然后获取动作类型对应的虚拟形象互动内容,并控制虚拟形象区域中的虚拟形象执行对应的互动动作。例如,若识别到的主播互动动作为手比爱心的温馨动作,此时控制虚拟形象执行对应的手比爱心的温馨动作,并且显示对话互动内容“比心”以及特效互动内容“比心”的特效,然后生成虚拟形象的互动视频流,并通过直播服务器200将互动视频流发送给直播接收终端300进行播放。
如此,本实施例通过将主播的虚拟形象的互动内容与主播互动动作的动作姿态和动作类型产生关联,可以提高直播过程中的互动效果,减少主播发起虚拟形象互动时的人为操作,实现虚拟形象的自动互动。
图4示出了本申请实施例提供的图1中所示的直播提供终端100的示例性组件示意图,直播提供终端100可包括存储介质110、处理器120以及直播互动装置500。本实施例中,存储介质110与处理器120均位于直播提供终端100中且二者分离设置。然而,应当理解的是,存储介质110也可以是独立于直播提供终端100之外,且可以由处理器120通过总线接口来访问。可替换地,存储介质110也可以集成到处理器120中,例如,可以是高速缓存和/或通用寄存器。
直播互动装置500可以理解为上述直播提供终端100,或直播提供终端100的处理器120,也可以理解为独立于上述直播提供终端100或处理器120之外的在直播提供终端100控制下实现上述直播互动方法的软件功能模块。如图4所示,该直播互动装置500可以包括检测模块510以及生成模块520,下面分别对该直播互动装置500的各个功能模块的功能进行详细阐述。
检测模块510,用于当从视频采集装置400实时采集的主播视频帧中检测到主播发起主播互动动作时,检测主播互动动作的动作姿态和动作类型,其中,主播互动动作包括佩戴目标道具和/或目标肢体动作。可以理解,该检测模块510可以用于执行上述步骤S110,关于该检测模块510的详细实现方式可以参照上述对步骤S110有关的内容。
生成模块520,用于根据主播互动动作的动作姿态和动作类型生成主播对应的虚拟形象的互动视频流,并通过直播服务器200将虚拟形象的互动视频流发送给直播接收终端300进行播放。可以理解,该生成模块520可以用于执行上述步骤S120,关于该生成模块520的详细实现方式可以参照上述对步骤S120有关的内容。
进一步地,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有机器可执行指令,机器可执行指令被执行时实现上述实施例提供的直播互动方法。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种直播互动方法,其特征在于,应用于直播提供终端,所述方法包括:
当从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测所述主播互动动作的动作姿态和动作类型;
其中,所述主播互动动作包括佩戴目标道具和/或目标肢体动作;
根据所述主播互动动作的动作姿态和动作类型生成所述主播对应的虚拟形象的互动视频流,并通过直播服务器将所述虚拟形象的互动视频流发送给直播接收终端进行播放。
2.根据权利要求1所述的直播互动方法,其特征在于,所述检测所述主播互动动作的动作姿态和动作类型的步骤,包括:
在检测到所述主播佩戴目标道具时,检测所述目标道具的道具属性和参考点位置向量,并根据所述道具属性查找所述目标肢体动作的动作类型;
根据所述参考点位置向量采用逆向运动学算法预测所述主播互动动作的动作姿态。
3.根据权利要求1所述的直播互动方法,其特征在于,所述检测所述主播互动动作的动作姿态和动作类型的步骤,包括:
在检测到所述主播发起目标肢体动作时,检测所述目标肢体动作的参考点位置向量,并采用深度神经网络模型识别所述目标肢体动作的动作类型;
根据所述参考点位置向量采用逆向运动学算法预测所述主播互动动作的动作姿态。
4.根据权利要求2或3所述的直播互动方法,其特征在于,所述根据所述参考点位置向量,采用逆向运动学算法预测所述主播互动动作的动作姿态的步骤,包括:
根据所述参考点位置向量计算所述主播的互动肢体的中心点高度以及所述主播的互动肢体相对于所述视频采集装置的姿态旋转矩阵;
根据所述姿态旋转矩阵、所述参考点位置向量和所述中心点高度,计算所述主播的互动肢体的各个肢体关节的位置向量,所述位置向量包括所述主播的互动肢体在各个参考轴方向上的分量;
根据计算得到的所述各个肢体关节的位置向量得到所述主播互动动作的动作姿态。
5.根据权利要求1所述的直播互动方法,其特征在于,所述直播提供终端中预先存储有预设互动内容库,所述预设互动内容库包括各个动作类型对应的虚拟形象互动内容,所述虚拟形象互动内容包括对话互动内容、特效互动内容以及肢体互动内容中的一种或者多种组合;
所述根据所述主播互动动作的动作姿态和动作类型生成所述虚拟形象的互动视频流的步骤,包括:
从所述预设互动内容库中获取所述动作类型对应的虚拟形象互动内容;
根据所述动作姿态和所述虚拟形象互动内容生成所述虚拟形象的互动视频流。
6.根据权利要求5所述的直播互动方法,其特征在于,所述根据所述动作姿态和所述虚拟形象互动内容生成所述虚拟形象的互动视频流的步骤,包括:
按照所述动作姿态关联的各个目标关节点的位移坐标,控制所述虚拟形象的各个目标关节点沿对应的位移坐标移动,并按照所述虚拟形象互动内容控制所述虚拟形象执行对应的互动动作,以生成对应的互动视频流。
7.一种直播互动装置,其特征在于,应用于直播提供终端,所述装置包括:
检测模块,用于当从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测所述主播互动动作的动作姿态和动作类型,其中,所述主播互动动作包括佩戴目标道具和/或目标肢体动作;
生成模块,用于根据所述主播互动动作的动作姿态和动作类型生成所述主播对应的虚拟形象的互动视频流,并通过直播服务器将所述虚拟形象的互动视频流发送给直播接收终端进行播放。
8.一种直播系统,其特征在于,所述直播系统包括直播提供终端、直播接收终端以及分别与所述直播提供终端和所述直播接收终端通信连接的直播服务器;
所述直播提供终端用于当从视频采集装置实时采集的主播视频帧中检测到主播发起主播互动动作时,检测所述主播互动动作的动作姿态和动作类型,并根据所述主播互动动作的动作姿态和动作类型生成所述主播对应的虚拟形象的互动视频流,将所述虚拟形象的互动视频流发送给直播服务器,其中,所述主播互动动作包括佩戴目标道具和/或目标肢体动作;
所述直播服务器用于将所述虚拟形象的互动视频流发送给所述直播接收终端;
所述直播接收终端用于在直播界面中播放所述虚拟形象的互动视频流。
9.一种电子设备,其特征在于,所述电子设备包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行权利要求1-6中任意一项所述的直播互动方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可执行指令,所述机器可执行指令被执行时实现权利要求1-6中任意一项所述的直播互动方法。
CN201910251306.7A 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备 Active CN109922354B9 (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201910251306.7A CN109922354B9 (zh) 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备
CN202010555373.0A CN111641844B (zh) 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备
US17/598,733 US20220103891A1 (en) 2019-03-29 2020-03-27 Live broadcast interaction method and apparatus, live broadcast system and electronic device
SG11202111323RA SG11202111323RA (en) 2019-03-29 2020-03-27 Live broadcast interaction method and apparatus, live broadcast system and electronic device
PCT/CN2020/081627 WO2020200082A1 (zh) 2019-03-29 2020-03-27 直播互动方法、装置、直播系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910251306.7A CN109922354B9 (zh) 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010555373.0A Division CN111641844B (zh) 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备

Publications (3)

Publication Number Publication Date
CN109922354A true CN109922354A (zh) 2019-06-21
CN109922354B CN109922354B (zh) 2020-07-03
CN109922354B9 CN109922354B9 (zh) 2020-08-21

Family

ID=66967746

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010555373.0A Active CN111641844B (zh) 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备
CN201910251306.7A Active CN109922354B9 (zh) 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010555373.0A Active CN111641844B (zh) 2019-03-29 2019-03-29 直播互动方法、装置、直播系统及电子设备

Country Status (1)

Country Link
CN (2) CN111641844B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110557625A (zh) * 2019-09-17 2019-12-10 北京达佳互联信息技术有限公司 虚拟形象直播方法、终端、计算机设备及存储介质
CN110662083A (zh) * 2019-09-30 2020-01-07 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN110856032A (zh) * 2019-11-27 2020-02-28 广州虎牙科技有限公司 一种直播方法、装置、设备及存储介质
CN111263178A (zh) * 2020-02-20 2020-06-09 广州虎牙科技有限公司 直播方法、装置、用户端及存储介质
CN111556332A (zh) * 2020-05-22 2020-08-18 咪咕文化科技有限公司 直播方法、电子设备和可读存储介质
WO2020200082A1 (zh) * 2019-03-29 2020-10-08 广州虎牙信息科技有限公司 直播互动方法、装置、直播系统及电子设备
CN112188114A (zh) * 2019-07-05 2021-01-05 北京小米移动软件有限公司 一种显示粒子特效的拍摄方法及装置
CN112511853A (zh) * 2020-11-26 2021-03-16 北京乐学帮网络技术有限公司 一种视频处理方法、装置、电子设备及存储介质
CN112732152A (zh) * 2021-01-27 2021-04-30 腾讯科技(深圳)有限公司 直播处理方法、装置、电子设备及存储介质
WO2022134556A1 (zh) * 2020-12-25 2022-06-30 北京达佳互联信息技术有限公司 线上互动方法及服务器
WO2023279705A1 (zh) * 2021-07-07 2023-01-12 上海商汤智能科技有限公司 直播方法、装置、系统、计算机设备、存储介质及程序
WO2023279713A1 (zh) * 2021-07-07 2023-01-12 上海商汤智能科技有限公司 特效展示方法、装置、计算机设备、存储介质、计算机程序和计算机程序产品
WO2023024442A1 (zh) * 2021-08-27 2023-03-02 上海商汤智能科技有限公司 检测方法、训练方法、装置、设备、存储介质和程序产品
WO2023035897A1 (zh) * 2021-09-09 2023-03-16 北京字跳网络技术有限公司 视频数据生成方法、装置、电子设备及可读存储介质
WO2023151554A1 (zh) * 2022-02-10 2023-08-17 北京字跳网络技术有限公司 视频图像处理方法、装置、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112218107B (zh) * 2020-09-18 2022-07-08 广州虎牙科技有限公司 直播渲染方法和装置、电子设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016168110A (ja) * 2015-03-11 2016-09-23 敏広 川口 効果音発生装置
CN106804007A (zh) * 2017-03-20 2017-06-06 合网络技术(北京)有限公司 一种网络直播中自动匹配特效的方法、系统及设备
CN106878820A (zh) * 2016-12-09 2017-06-20 北京小米移动软件有限公司 直播互动方法及装置
CN107291232A (zh) * 2017-06-20 2017-10-24 深圳市泽科科技有限公司 一种基于深度学习与大数据的体感游戏交互方法及系统
CN107423721A (zh) * 2017-08-08 2017-12-01 珠海习悦信息技术有限公司 人机交互动作检测方法、装置、存储介质及处理器
CN107592575A (zh) * 2017-09-08 2018-01-16 广州华多网络科技有限公司 一种直播方法、装置、系统及电子设备
CN107613310A (zh) * 2017-09-08 2018-01-19 广州华多网络科技有限公司 一种直播方法、装置及电子设备
CN107750014A (zh) * 2017-09-25 2018-03-02 迈吉客科技(北京)有限公司 一种连麦直播方法和系统
CN108632632A (zh) * 2018-04-28 2018-10-09 网易(杭州)网络有限公司 一种网络直播的数据处理方法和装置
CN108681263A (zh) * 2018-07-23 2018-10-19 上海恒润申启多媒体有限公司 三自由度运动平台的逆向运动学的求解方法与求解系统
CN109523017A (zh) * 2018-11-27 2019-03-26 广州市百果园信息技术有限公司 深度神经网络的压缩方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10086286B2 (en) * 2016-01-27 2018-10-02 Electronic Arts Inc. Systems and methods for capturing participant likeness for a video game character
CN106937154A (zh) * 2017-03-17 2017-07-07 北京蜜枝科技有限公司 处理虚拟形象的方法及装置
CN106993195A (zh) * 2017-03-24 2017-07-28 广州创幻数码科技有限公司 虚拟人物角色直播方法及系统
CN109271553A (zh) * 2018-08-31 2019-01-25 乐蜜有限公司 一种虚拟形象视频播放方法、装置、电子设备及存储介质
CN109120985B (zh) * 2018-10-11 2021-07-23 广州虎牙信息科技有限公司 直播中的形象展示方法、装置和存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016168110A (ja) * 2015-03-11 2016-09-23 敏広 川口 効果音発生装置
CN106878820A (zh) * 2016-12-09 2017-06-20 北京小米移动软件有限公司 直播互动方法及装置
CN106804007A (zh) * 2017-03-20 2017-06-06 合网络技术(北京)有限公司 一种网络直播中自动匹配特效的方法、系统及设备
CN107291232A (zh) * 2017-06-20 2017-10-24 深圳市泽科科技有限公司 一种基于深度学习与大数据的体感游戏交互方法及系统
CN107423721A (zh) * 2017-08-08 2017-12-01 珠海习悦信息技术有限公司 人机交互动作检测方法、装置、存储介质及处理器
CN107592575A (zh) * 2017-09-08 2018-01-16 广州华多网络科技有限公司 一种直播方法、装置、系统及电子设备
CN107613310A (zh) * 2017-09-08 2018-01-19 广州华多网络科技有限公司 一种直播方法、装置及电子设备
CN107750014A (zh) * 2017-09-25 2018-03-02 迈吉客科技(北京)有限公司 一种连麦直播方法和系统
CN108632632A (zh) * 2018-04-28 2018-10-09 网易(杭州)网络有限公司 一种网络直播的数据处理方法和装置
CN108681263A (zh) * 2018-07-23 2018-10-19 上海恒润申启多媒体有限公司 三自由度运动平台的逆向运动学的求解方法与求解系统
CN109523017A (zh) * 2018-11-27 2019-03-26 广州市百果园信息技术有限公司 深度神经网络的压缩方法、装置、设备及存储介质

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020200082A1 (zh) * 2019-03-29 2020-10-08 广州虎牙信息科技有限公司 直播互动方法、装置、直播系统及电子设备
CN112188114A (zh) * 2019-07-05 2021-01-05 北京小米移动软件有限公司 一种显示粒子特效的拍摄方法及装置
CN110557625A (zh) * 2019-09-17 2019-12-10 北京达佳互联信息技术有限公司 虚拟形象直播方法、终端、计算机设备及存储介质
CN110662083B (zh) * 2019-09-30 2022-04-22 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN110662083A (zh) * 2019-09-30 2020-01-07 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
US11503377B2 (en) 2019-09-30 2022-11-15 Beijing Dajia Internet Information Technology Co., Ltd. Method and electronic device for processing data
CN110856032A (zh) * 2019-11-27 2020-02-28 广州虎牙科技有限公司 一种直播方法、装置、设备及存储介质
CN110856032B (zh) * 2019-11-27 2022-10-04 广州虎牙科技有限公司 一种直播方法、装置、设备及存储介质
CN111263178A (zh) * 2020-02-20 2020-06-09 广州虎牙科技有限公司 直播方法、装置、用户端及存储介质
CN111556332B (zh) * 2020-05-22 2022-05-10 咪咕文化科技有限公司 直播方法、电子设备和可读存储介质
CN111556332A (zh) * 2020-05-22 2020-08-18 咪咕文化科技有限公司 直播方法、电子设备和可读存储介质
CN112511853A (zh) * 2020-11-26 2021-03-16 北京乐学帮网络技术有限公司 一种视频处理方法、装置、电子设备及存储介质
CN112511853B (zh) * 2020-11-26 2023-10-27 北京乐学帮网络技术有限公司 一种视频处理方法、装置、电子设备及存储介质
WO2022134556A1 (zh) * 2020-12-25 2022-06-30 北京达佳互联信息技术有限公司 线上互动方法及服务器
CN112732152A (zh) * 2021-01-27 2021-04-30 腾讯科技(深圳)有限公司 直播处理方法、装置、电子设备及存储介质
WO2023279705A1 (zh) * 2021-07-07 2023-01-12 上海商汤智能科技有限公司 直播方法、装置、系统、计算机设备、存储介质及程序
WO2023279713A1 (zh) * 2021-07-07 2023-01-12 上海商汤智能科技有限公司 特效展示方法、装置、计算机设备、存储介质、计算机程序和计算机程序产品
WO2023024442A1 (zh) * 2021-08-27 2023-03-02 上海商汤智能科技有限公司 检测方法、训练方法、装置、设备、存储介质和程序产品
WO2023035897A1 (zh) * 2021-09-09 2023-03-16 北京字跳网络技术有限公司 视频数据生成方法、装置、电子设备及可读存储介质
WO2023151554A1 (zh) * 2022-02-10 2023-08-17 北京字跳网络技术有限公司 视频图像处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111641844A (zh) 2020-09-08
CN109922354B9 (zh) 2020-08-21
CN111641844B (zh) 2022-08-19
CN109922354B (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
CN109922354A (zh) 直播互动方法、装置、直播系统及电子设备
US10469829B2 (en) Information processor and information processing method
CN110119700B (zh) 虚拟形象控制方法、虚拟形象控制装置和电子设备
CN105279795B (zh) 基于3d标记的增强现实系统
US20100194863A1 (en) Systems and methods for simulating three-dimensional virtual interactions from two-dimensional camera images
US20170085964A1 (en) Interactive Object Placement in Virtual Reality Videos
JP7042561B2 (ja) 情報処理装置、情報処理方法
JP2012525643A5 (zh)
KR20120051659A (ko) 비주얼 형상의 자동 생성 방법
CN102576463A (zh) 用于移除图像的背景的系统和方法
WO2020221186A1 (zh) 一种虚拟形象控制方法、装置、电子设备及存储介质
US20080068386A1 (en) Real-Time Rendering of Realistic Rain
CN113223130B (zh) 一种路径漫游方法、终端设备以及计算机存储介质
US20210158565A1 (en) Pose selection and animation of characters using video data and training techniques
CN116785683A (zh) 一种ar多人交互系统、头显设备、方法和存储介质
WO2024027063A1 (zh) 直播方法、装置、存储介质、电子设备及产品
Rajan et al. A realistic video avatar system for networked virtual environments
WO2020200082A1 (zh) 直播互动方法、装置、直播系统及电子设备
CN113515187B (zh) 一种虚拟现实场景的生成方法和网络侧设备
Daemen et al. Markerless actor tracking for virtual (tv) studio applications
JP7442107B2 (ja) 動画再生装置、動画再生方法、及び動画配信システム
JP6731532B1 (ja) 動画再生装置、動画再生方法、及び動画配信システム
JP6945693B2 (ja) 動画再生装置、動画再生方法、及び動画配信システム
US20240048780A1 (en) Live broadcast method, device, storage medium, electronic equipment and product
CN116112716B (zh) 基于单指令流多数据流的虚拟人直播方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CI03 Correction of invention patent
CI03 Correction of invention patent

Correction item: Claims|Description

Correct: Claims 1-9 submitted on June 10, 2020|Correct

False: Claims 1-9 submitted on May 13, 2020|error

Number: 27-02

Page: ??

Volume: 36