发明内容
有鉴于此,本申请实施例提供一种直播交互方法、装置、电子设备及计算机程序产品,以至少部分解决上述问题。
根据本申请实施例的第一方面,提供了一种直播交互方法,包括:
提供一直播界面,所述直播界面包括主播画面显示区域和物件信息显示区域,所述物件信息显示区域用于显示与当前讲解的第一直播物件相关的物件信息;
获取直播界面中所述主播画面显示区域对应的主播视频帧;
对所述主播视频帧进行手势动作识别,得到目标手势动作;
确定预先配置的与所述目标手势动作对应的目标控制指令;
根据所述目标控制指令和所述直播物件的讲解顺序,更新所述直播界面的所述物件信息显示区域中的内容。
根据本申请实施例的第二方面,提供了一种直播交互装置,包括:
直播界面提供模块,用于提供一直播界面,所述直播界面包括主播画面显示区域和物件信息显示区域,所述物件信息显示区域用于显示与当前讲解的第一直播物件相关的物件信息;
主播视频帧获取模块,用于获取直播界面中所述主播画面显示区域对应的主播视频帧;
目标手势动作得到模块,用于对所述主播视频帧进行手势动作识别,得到目标手势动作;
目标控制指令确定模块,用于确定预先配置的与所述目标手势动作对应的目标控制指令;
内容更新模块,用于根据所述目标控制指令和所述直播物件的讲解顺序,更新所述直播界面的所述物件信息显示区域中的内容。
根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述的直播交互方法对应的操作。
根据本申请实施例的第四方面,提供了一种存储有用于直播交互的计算机程序的计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的直播交互方法。
根据本申请实施例的第五方面,提供了一种用于直播交互的计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如第一方面所述的直播交互方法对应的操作。
根据本申请实施例提供的直播交互方法、装置、电子设备及计算机程序产品,直播界面中包括主播画面显示区域,以及,用于显示与当前讲解的第一直播物件相关的物件信息的物件信息显示区域;在对主播视频帧进行手势动作识别,得到目标手势动作之后,则定出与目标手势动作对应的目标控制指令,以根据上述目标控制指令以及直播物件讲解顺序,对物件信息显示区域中的内容进行更新。本申请实施例,可以基于主播的手势动作,自动实现物件信息显示区域中物件信息的更新,无需人工参与,因此,提升了直播交互效率,且降低了直播成本。
具体实施方式
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
下面结合本申请实施例附图进一步说明本申请实施例具体实现。
实施例一、
参见图1,图1为根据本申请实施例一的一种直播交互方法的场景示意图,为便于理解,首先结合图1对本申请实施例一提供的直播交互方法的应用场景进行解释说明。
在针对一个或多个直播物件进行讲解的直播过程中,可以提供一直播界面,该直播界面中可以包括如下两个区域:主播画面显示区域和物件信息显示区域,其中,主播画面显示区域用于显示主播视频帧,物件信息显示区域用于显示与当前讲解的第一直播物件相关的物件信息;通过对主播视频帧进行手势识别,得到主播所作出的目标手势动作;进而确定出目标手势动作对应的目标控制指令;以基于目标控制指令对物件信息显示区域中显示的物件信息进行更新。具体地,例如:可以将物件信息显示区域中原本显示的与第一直播物件相关的物件信息替换为第二直播物件相关的物件信息,其中,第一直播物件和第二物件为两个不同的直播物件。
参见图2,图2为根据本申请实施例一的一种直播交互方法的步骤流程图;具体地,本实施例提供的直播交互方法包括以下步骤:
步骤202,提供一直播界面,直播界面包括主播画面显示区域和物件信息显示区域,物件信息显示区域用于显示与当前讲解的第一直播物件相关的物件信息。
具体地,直播界面中的主播画面显示区域可以为用于主播视频帧的区域,主播视频帧可以是通过主播端直播设备中的图像采集单元采集的包含有主播手势动作的视频帧。
本申请实施例中的直播物件可以为商品,也可以为用于进行直播教学的教学内容,还可以为新闻等等。
与直播物件相关的物件信息可以包括:该直播物件的图片,直播物件的名称,或者,直播物件的信息链接等。例如:当直播物件为商品时,可以在直播界面的物件信息显示区域内对应显示主播当前正在讲解的商品的图片、购买链接等等;当直播物件为教学内容时,可以在物件信息显示区域内对应显示主播当前正在讲解的教学内容的课件图片、教学内容相关书籍的购买链接等等;当直播物件为新闻时,可以在物件信息显示区域内对应显示主播当前正在讲解的新闻所涉及到的图片、新闻对应的简短摘要信息等等。
进一步地,在其中一些实施例中,物件信息在直播界面的物件信息显示区域中以悬浮窗口的形式显示。
步骤204,获取直播界面中主播画面显示区域对应的主播视频帧。
步骤206,对主播视频帧进行手势动作识别,得到目标手势动作。
可以采用传统的手势识别算法,进行手势动作识别;也可以采用机器学习模型完成第一视频帧的手势动作识别,本申请实施例中,对于采用何种方式进行手势动作识别不做限定。
以采用机器学习模型进行手势动作识别为例,识别过程可以分为两部分:第一部分:训练过程;第二部分:推理过程。具体地,训练过程包括:预先基于包含手势动作的样本图片(视频帧),以及,各样本图片对应的标签信息(样本图片中包含的手势动作信息)进行手势动作识别模型的训练,得到训练完成的手势动作识别模型。推理过程包括:将步骤204中获取到的包含主播手势动作的主播视频帧输入预先训练完成的手势动作识别模型中,通过手势动作识别模型对主播视频帧进行特征提取,得到主播视频帧对应的目标手势动作。
本申请实施例中,对于具体的手势动作不做限定,可以为静态手势动作,也可以为动态手势动作。静态手势动作,例如:比心手势、点赞手势、数字手势(通过手指比出不同的数字)、爱心手势、手枪手势、拳头、手掌、托手手势、抱拳手势、作揖手势、剪刀手势等等。静态手势动作,例如:向左滑动、向右滑动、向上滑动以及向下滑动等等。
步骤208,确定预先配置的与目标手势动作对应的目标控制指令。
进一步地,在其中一些实施例中,手势动作与控制指令间对应关系的建立过程可以包括:响应于对手势动作与控制指令间的对应关系的配置触发操作,显示对应关系配置界面;确定待配置的手势动作;响应于对对应关系配置界面中预置的控制指令选项的触发操作,将控制指令选项对应的控制指令确定为与待配置的手势动作对应的控制指令。
例如:可以在界面中显示手势动作与控制指令间对应关系的配置图标,当检测到对配置图标的点击等操作时,显示对应关系配置界面;在确定了待配置的手势动作之后,当检测到对配置界面中预置的控制指令选项的点击等操作,则将控制指令选项对应的控制指令确定为与待配置的手势动作对应的控制指令。
具体地,在确定待配置的手势动作时,可以采用如下两种方式中的任一种方式进行:
第一种,可以预先在配置界面中预置多个手势动作选项,每个手势动作选项对应一种具体的手势动作;当检测到某个手势动作选项被触发时,则确定该手势动作选项对应的手势动作为待配置手势动作。
第二种,也可以通过图像采集设备实时采集配置人员的手势动作,并对采集到的手势动作进行手势识别,从而得到待配置的手势动作。
上述两种方式相比,第一种方式,通过对配置界面中预置手势动作选项的触发操作,即可确定出待配置的手势动作,因此,配置过程操作简单,效率较高;第二种方式,通过对配置人员实时手势动作的识别,从而确定出待配置的手势动作,因此,配置人员可以根据自身需要,方便地增加可用于直播交互的手势动作,而不仅仅局限于第一种方式中配置界面预置的几种手势动作选项所对应的手势动作,因此,可以更好地满足用户体验。
步骤210,根据目标控制指令和直播物件的讲解顺序,更新直播界面的物件信息显示区域中的内容。
可选地,在其中一些实施例中,可以通过下述方式对物件信息显示区域中的内容进行更新:在直播界面的物件信息显示区域中,显示与第二直播物件相关的物件信息,其中,第二直播物件为与第一直播物件的讲解顺序相邻预设间隔的直播物件。
进一步地,上述预设间隔可以是由步骤206中识别出的目标手势动作确定的。具体的:可以确定出目标手势动作所表示(所对应)的目标数字,然后从一个或多个直播物件中确定讲解顺序与目标数字对应第二直播物件,进而将物件信息显示区域中的内容由原来的第一直播物件相关的物件信息更新为第二直播物件相关的物件信息。其中,上述目标数字可以为一位数字,也可以为多位数字。例如:当识别出主播的目标手势动作为3时,则可以确定目标数字为3,进而可以将物件信息显示区域中的内容更新为讲解顺序为第三位的直播物件相关的物件信息;也可以根据手势执行过程中的不同速度、不同方向、不同移动距离等等来判断目标数字,如:当手势速度较快或是移动距离较长时,则可以确定对应一个较大的目标数字,当速度较慢或是移动距离较短时,则可以确定对应一个较小的目标数字。
下面结合具体场景,对步骤210进行进一步解释说明。例如:在电商直播中,直播物件则可以为商品列表中的多个不同商品,上述多个不同商品可以按照一定的顺序排列,在直播过程中,主播可以按照各商品在商品列表中的排列顺序,进行商品讲解;直播物件对应的物件信息则可以为各商品的商品购买链接。参见图3,图3为商品列表中多个不同商品的示意图,图3所示商品列表内共包含4件商品,分别为:位于第一位的运动鞋、位于第二位的小浣熊饰品、位于第三位的瑜伽垫,以及,位于第四位的绘画铅笔。参见图4,假设当前时刻(更新前)物件信息显示区域中显示的是位于第一位的运动鞋的购买链接,在对主播视频帧中的主播手势动作进行识别之后,若基于目标手势动作确定下一待展示商品为位于第三位的瑜伽垫(例如:主播作出数字3的手势动作),则直播界面中物件信息显示区域内显示的内容将从原来的运动鞋的购买链接,更新为瑜伽垫购买链接。再例如,当前时刻的展示商品是位于第三位的瑜伽垫,目标手势动作是连续向上滑动二次,则直播界面中物件信息显示区域内显示的内容将从瑜伽垫购买链接更新为运动鞋的购买链接。
又如,商品也可以为旅游套餐产品,对应的,物件信息则可以为旅游套餐产品对应的目的地图片。参见图5,假设直播过程中待讲解的产品有5件,其中,第一件为:某雪乡的旅游套餐产品,第二件为某热带地区的旅游套餐产品,当前时刻(更新前)物件信息显示区域中显示的是上述雪乡的旅游套餐产品。在对主播视频帧中的主播手势动作进行识别之后,若基于目标手势动作确定下一待展示产品为位于第二位的热带地区旅游套餐产品(例如:主播作出向下滑动的手势动作),则直播界面中物件信息显示区域内显示的内容将从原来的位于雪乡中的雪屋图片,更新为上述热带地区酒店的图片。
可选的,在其中一些实施例中,直播交互方法还包括:根据步骤208中确定出的目标控制指令,移动物件信息显示区域在直播界面中的位置。
具体地,可以对目标手势动作进行动作解析,得到目标手势动作中包含的特征,具体地,可以包括:第一特征和第二特征,其中,第一特征用于确定上述第一直播物件与第二直播物件之前的间隔;第二特征用于确定物件信息显示区域在直播界面中的移动位移。也就是说,第二直播物件与第一直播物件之间的预设间隔可以是根据目标手势动作的第一特征确定的,物件信息显示区域在直播界面中的位移可以是根据目标手势动作的第二特征确定的。
上述第一特征和第二特征用于表征目标手势动作的不同属性信息。例如:第一特征可以为目标手势动作表征的目标数字,第二特征则可以为主播执行目标手势时的速度、方向等信息。又如,第一特征和第二特征也可以为目标手势动作涉及的两个不同的方向,等等。如:假设步骤206中识别出的目标手势动作为向右下方向滑动,则第一特征可以为向下,第二特征可以为向右。对应地,第一特征可以表征按照商品列表中各商品的排序,在物件信息显示区域中更新显示下一商品的商品链接,第二特征可以表征将物件信息显示区域向右移动预设距离,等等。
本申请实施例中,直播界面中包括主播画面显示区域以及用于显示与当前讲解的第一直播物件相关的物件信息的物件信息显示区域;在对主播视频帧进行手势动作识别,得到目标手势动作之后,则定出与目标手势动作对应的目标控制指令,以根据上述目标控制指令以及直播物件讲解顺序,对物件信息显示区域中的内容进行更新。本申请实施例,可以基于主播的手势动作,自动实现物件信息显示区域中物件信息的更新,无需人工参与,因此提升了直播交互效率,且降低了直播成本。
实施例二、
参见图6,图6为根据本申请实施例二的一种直播交互装置的结构框图,本实施例的直播交互装置可以实施在云端直播服务平台或是本地直播服务设备。本申请实施例提供的直播交互装置包括:
直播界面提供模块602,用于提供一直播界面,直播界面包括主播画面显示区域和物件信息显示区域,物件信息显示区域用于显示与当前讲解的第一直播物件相关的物件信息;
主播视频帧获取模块604,用于获取直播界面中主播画面显示区域对应的主播视频帧;
目标手势动作得到模块606,用于对主播视频帧进行手势动作识别,得到目标手势动作;
目标控制指令确定模块608,用于确定预先配置的与目标手势动作对应的目标控制指令;
内容更新模块610,用于根据目标控制指令和直播物件的讲解顺序,更新直播界面的物件信息显示区域中的内容。
可选地,在其中一些实施例中,内容更新模块610在执行根据更新直播界面的物件信息显示区域中的内容的步骤时,具体用于:在直播界面的物件信息显示区域中,显示与第二直播物件相关的物件信息,其中,第二直播物件为与第一直播物件的讲解顺序相邻预设间隔的直播物件。
可选地,在其中一些实施例中,预设间隔是根据目标手势动作确定的。
可选地,在其中一些实施例中,直播交互装置还包括:第二直播物件确定模块,用于在更新直播界面的物件信息显示区域中的内容之前,确定目标手势动作对应的目标数字;从一个或多个直播物件中确定讲解顺序与目标数字对应第二直播物件。
可选地,在其中一些实施例中,目标数字为一位数字或多位数字。
可选地,在其中一些实施例中,物件信息包括如下至少一项:直播物件图片、直播物件名称、直播物件的信息链接。
可选地,在其中一些实施例中,物件信息在直播界面的物件信息显示区域中以悬浮窗口的形式显示。
可选地,在其中一些实施例中,内容更新模块610还用于根据目标控制指令,移动物件信息显示区域在直播界面中的位置。
可选地,在其中一些实施例中,目标手势动作包括第一特征和第二特征;其中,预设间隔是根据目标手势动作的第一特征确定的;物件信息显示区域在直播界面中的位移信息是根据目标手势动作的第二特征确定的。
可选地,在其中一些实施例中,直播物件包括:商品、教学内容和/或新闻。
可选地,在其中一些实施例中,目标手势动作得到模块606,具体用于:将主播视频帧输入预先训练完成的手势动作识别模型中,通过手势动作识别模型对主播视频帧进行特征提取,得到主播视频帧对应的目标手势动作。
可选地,在其中一些实施例中,直播交互装置还包括:对应关系建立模块,用于:响应于对手势动作与控制指令间的对应关系的配置触发操作,显示对应关系配置界面;确定待配置的手势动作;响应于对对应关系配置界面中预置的控制指令选项的触发操作,将控制指令选项对应的控制指令确定为与待配置的手势动作对应的控制指令。
可选地,在其中一些实施例中,对应关系建立模块在执行确定待配置的手势动作的步骤时,具体用于:响应于对对应关系配置界面中预置的手势动作选项的触发操作,将手势动作选项对应的手势动作确定为待配置的手势动作。
可选地,在其中一些实施例中,对应关系建立模块在执行确定待配置的手势动作的步骤时,具体用于:采集配置人员的手势动作图像;对手势动作图像进行手势识别,得到待配置的手势动作。
本实施例的直播交互装置用于实现前述多个方法实施例中相应的直播交互方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的直播交互装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例三、
参照图7,示出了根据本申请实施例五的一种电子设备的结构示意图,本申请具体实施例并不对电子设备的具体实现做限定。
如图7所示,该电子设备可以包括:处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。
处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。通信接口704用于与其它电子设备或服务器进行通信。处理器702用于执行程序710,具体可以执行上述直播交互方法实施例中的相关步骤。
具体地,程序710可以包括程序代码,该程序代码包括计算机操作指令。
处理器702可能是CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器706,用于存放程序710。存储器706可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序710具体可以用于使得处理器702执行以下操作:提供一直播界面,直播界面包括主播画面显示区域和物件信息显示区域,物件信息显示区域用于显示与当前讲解的第一直播物件相关的物件信息;获取直播界面中主播画面显示区域对应的主播视频帧;对主播视频帧进行手势动作识别,得到目标手势动作;确定预先配置的与目标手势动作对应的目标控制指令;根据目标控制指令和直播物件的讲解顺序,更新直播界面的物件信息显示区域中的内容。
程序710中各步骤的具体实现可以参见上述直播交互方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例的电子设备,直播界面中包括主播画面显示区域,以及,用于显示与当前讲解的第一直播物件相关的物件信息;在对主播视频帧进行手势动作识别,得到目标手势动作之后,则定出与目标手势动作对应的目标控制指令,以根据上述目标控制指令以及直播物件讲解顺序,对物件信息显示区域中的内容进行更新。本申请实施例,可以基于主播的手势动作,自动实现物件信息显示区域中物件信息的更新,无需人工参与,因此,提升了直播交互效率,且降低了直播成本。
本申请实施例还提供了一种用于直播交互的计算机程序产品,包括计算机指令,该计算机指令指示计算设备执行上述多个方法实施例中的任一直播交互方法对应的操作。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的直播交互方法。此外,当通用计算机访问用于实现在此示出的直播交互方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的直播交互方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
以上实施方式仅用于说明本申请实施例,而并非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专利保护范围应由权利要求限定。