CN114679591A - 直播间的视频比例切换方法、装置、介质以及计算机设备 - Google Patents

直播间的视频比例切换方法、装置、介质以及计算机设备 Download PDF

Info

Publication number
CN114679591A
CN114679591A CN202111658519.5A CN202111658519A CN114679591A CN 114679591 A CN114679591 A CN 114679591A CN 202111658519 A CN202111658519 A CN 202111658519A CN 114679591 A CN114679591 A CN 114679591A
Authority
CN
China
Prior art keywords
video
live
target
live broadcast
image frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111658519.5A
Other languages
English (en)
Inventor
曾家乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Cubesili Information Technology Co Ltd
Original Assignee
Guangzhou Cubesili Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Cubesili Information Technology Co Ltd filed Critical Guangzhou Cubesili Information Technology Co Ltd
Priority to CN202111658519.5A priority Critical patent/CN114679591A/zh
Publication of CN114679591A publication Critical patent/CN114679591A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • H04N21/440272Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA for performing aspect ratio conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请实施例涉及网络直播领域,提供一种直播间的视频比例切换方法、装置、介质以及计算机设备,方法包括:根据视频比例调整指令获得目标视频比例;获取直播视频流的每一帧直播视频图像帧,若直播视频图像帧包括人脸和/或躯干,获得人脸位置信息和/或躯干位置信息,根据人脸位置信息和/或躯干位置信息确定目标视频中心点;在直播视频图像帧中,根据目标视频中心点以及目标视频比例,获得目标直播视频图像帧,以获得目标直播视频流,进而在直播间界面显示目标直播视频流,从而可以根据人脸位置信息和/或躯干位置信息自适应进行视频比例切换,从而可以使切换后的目标直播视频流可以尽可能显示主播人脸和/或躯干。

Description

直播间的视频比例切换方法、装置、介质以及计算机设备
技术领域
本申请实施例涉及网络直播技术领域,特别是涉及一种直播间的视频比例切换方法、装置、介质以及计算机设备。
背景技术
随着网络通信技术的进步,用户可参与的线上娱乐项目越来越多,其中,网络直播由于实时性强且交互性强的特点,更是受到越来越多用户的喜爱。在网络直播中,尤其是视频直播,作为一种丰富互联网移动用户生活的娱乐方式,用户可以实时的观看主播的才艺展示,或者和主播语音聊天,而受到广泛使用。
在视频直播中,通常只能根据主播客户端设置的长宽比例进行直播视频调整,而且在对直播视频进行调整时,只能机械地按照长宽比例对直播视频进行调整,无法结合直播视频的主播位置进行视频比例调整,进而常常使得调整比例后的直播视频并不能完全显示主播,需要主播不断调整位置来匹配调整比例后的直播视频。
发明内容
为克服相关技术中存在的问题,本申请提供一种直播间的视频比例切换方法、装置、介质以及计算机设备,其可以使得调整比例后的直播视频尽可能显示主播,无需主播频繁移动调整位置来匹配调整比例后的直播视频。
根据本申请实施例的第一方面,提供一种直播间的视频比例切换方法,包括如下步骤:
接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;
获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;
在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;
根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流。
根据本申请实施例的第二方面,提供一种直播间的视频比例切换装置,包括:
目标视频比例接收模块,用于接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;
目标视频中心点获取模块,用于获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;
目标直播视频图像帧获取模块,用于在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;
目标直播视频流获取模块,用于根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流。
根据本申请实施例的第三方面,提供一种计算机设备,包括处理器和存储器;所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如上述所述的直播间的视频比例切换方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上储存有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上述所述的直播间的视频比例切换方法。
本申请实施例接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流,从而可以根据人脸位置信息和/或躯干位置信息自适应进行视频比例切换,从而可以使切换后的目标直播视频流可以尽可能显示主播人脸和/或躯干,无需主播频繁移动调整位置来匹配调整比例后的直播视频。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的直播间的视频比例切换方法的应用环境的示意框图;
图2为本申请第一实施例提供的直播间的视频比例切换方法的流程图;
图3为本申请一个实施例提供的直播间界面的视频比例调整控件的显示示意图;
图4为本申请另一个实施例提供的直播间界面的视频比例调整控件的显示示意图;
图5为本申请一个实施例提供的获取目标视频中心点的方法的流程图;
图6为本申请另一个实施例提供的获取目标视频中心点的方法的流程图;
图7为本申请第二实施例提供的直播间的视频比例切换方法的流程图;
图8为本申请第三实施例提供的直播间的视频比例切换方法的流程图;
图9为本申请第四实施例提供的直播间的视频比例切换装置的示意框图;
图10为本申请第五实施例提供的计算机设备的结构示意框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
应当明确,所描述的实施例仅仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请实施例保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在 A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域技术人员可以理解,本申请所使用的“客户端”、“终端”、“终端设备”既包括无线信号发射器的设备,其仅具备发射能力的无线信号发射器的设备,又包括无线信号接收射器的设备,其仅具备接收能力的无线信号接收器的设备,还可以包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunicationsService,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和 /或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的计算机设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
请参阅图1,图1为本申请实施例提供的直播间的视频比例切换方法的应用场景示意图,该应用场景包括主播客户端110、观众客户端120和服务器端130。
所述主播客户端110与所述观众客户端120通过所述服务器端130进行交互。具体的,所述主播客户端110和所述观众客户端120均可以通过网络接入方式接入互联网,与所述服务器端130建立数据通信链路。其中,网络可以是能够在所述分享发布终端与所述分享接收终端之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路、无线通信链路或者光纤电缆等等,本申请在此不做限制。
所述主播客户端110是指发送网络直播视频的一端,通常来说是网络直播中主播用户所采用的客户端。所述主播客户端110所指向的硬件,本质上是指计算机设备,具体地,如图 1所示,其可以是智能手机、智能交互平板和个人计算机等类型的计算机设备。
所述观众客户端120是指接收和观看网络直播视频的一端,通常来说是网络直播中观看视频的观众用户所采用的客户端。所述观众客户端120所指向的硬件,本质上是指计算机设备,具体地,如图1所示,其可以是智能手机、智能交互平板和个人计算机等类型的计算机设备。
应当说明,所述观众客户端120与所述主播客户端110只是从功能上进行划分,在实际应用中,可以由同一个客户端在不同时间分别执行所述观众客户端120与所述主播客户端110 的功能。因此,同一个客户端在观看网络直播时,可以作为所述观众客户端120,在发布直播视频时,可以作为所述主播客户端110。
所述服务器端130可作为一个业务服务器,其可以负责进一步连接起相关音频数据服务器、视频流服务器以及其他提供相关支持的服务器等,以此构成逻辑上相关联的服务机群,来为相关的终端设备,例如图1中所示的主播客户端110和观众客户端120提供服务。
本申请实施例中,所述主播客户端110与所述观众客户端120可以加入同一个直播间(即直播频道),上述的直播间是指依靠互联网技术和所述服务器端130实现的一种聊天室,通常具备音视频播控功能。主播用户通过所述主播客户端110在直播间内进行直播,所述观众客户端120的观众用户可以登录所述服务器端130进入直播间观看直播。
在直播间内,主播用户与观众用户之间可通过语音、视频、文字等公知的线上交互方式来实现互动,一般是主播用户以音视频流的形式为观众用户表演节目,同时,观众用户可以文字或者赠送虚拟礼物的方式与主播用户进行互动,而在互动过程中还可产生经济交易行为,当然,直播间的应用形态并不局限于在线娱乐,也可推广到其他相关场景中。
具体地,观众用户观看直播的过程如下:观众用户可以点击访问安装在观众客户端120 上的直播应用程序,并选择进入任意一个直播间,触发所述观众客户端120为该观众用户加载直播间界面,该直播间界面内包括若干交互组件,例如:视频组件、虚拟礼物栏组件以及公屏组件等,通过加载这些交互组件可以使观众用户在直播间内观看直播,并进行多种线上互动,线上互动的方式包括但不限于赠送虚拟礼物、参加直播活动以及公屏发言聊天等。
值得一提的是,图1中的应用场景只是一种示例性应用场景,并非用于限定本发明的方案。本发明的方案还可以应用于其他形式的网络直播应用场景中,对此不再一一说明。
在视频直播中,通常只能根据主播客户端设置的长宽比例进行直播视频调整,而且在对直播视频进行调整时,只能机械地按照长宽比例对直播视频进行调整,无法结合直播视频的主播位置进行视频比例调整,进而常常使得调整比例后的直播视频并不能完全显示主播,需要主播不断调整位置来匹配调整比例后的直播视频。
请参阅图2,其是本申请第一实施例提供的直播间的视频比例切换方法的流程图。本申请第一实施例提供的直播间的视频比例切换方法,由观众客户端作为执行主体执行,具体的,所述方法包括如下步骤:
步骤S101:接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例。
视频比例是指直播视频流对应的直播画面的长和宽的比例,可选的,本申请实施例的视频比例可以是4:3,16:9,1:1或者其他比例。
在一个实施例中,视频比例调整指令可以是由观众客户端发出。具体地,观众用户在进入主播用户所创建的直播间后,可以点击直播间界面中的视频比例调整控件,触发生成视频比例栏显示指令,观众客户端响应于视频比例栏显示指令,显示预设的视频比例列表,之后,若观众用户选中了视频比例列表中的某一视频比例,则会触发观众客户端将被选中的视频比例作为目标视频比例,根据目标视频比例生成视频比例调整指令。可选的,观众客户端响应于视频比例栏显示指令之后,还可以在预设的视频比例列表之后显示视频比例输入控件和视频比例确定控件,若观众用户在该比例输入控件上输入了某一视频比例,且点击了视频比例确定控件后,则会触发观众客户端将输入的视频比例作为目标视频比例,根据目标视频比例生成视频比例调整指令。
在另一个实施例中,视频比例调整指令也可以是由主播客户端发出。主播用户在自己所创建的直播间内点击直播间界面中的视频比例调整控件,触发生成视频比例栏显示指令,直播客户端响应于视频比例栏显示指令,显示预设的视频比例列表,之后,若主播用户选中了视频比例列表中的某一视频比例,则会触发主播客户端将被选中的视频比例作为目标视频比例,根据目标视频比例生成视频比例调整指令,再将视频比例调整指令发送至服务器,由服务器发送至加入直播间的所有观众客户端。可选的,主播客户端响应于视频比例栏显示指令之后,还可以在预设的视频比例列表之后显示视频比例输入控件和视频比例确定控件,若主播用户在该比例输入控件上输入了某一视频比例,且点击了视频比例确定控件后,则会触发主播客户端将输入的视频比例作为目标视频比例,根据目标视频比例生成视频比例调整指令,再将视频比例调整指令发送至服务器,再由服务器发送至加入直播间的所有观众客户端。
应当理解的是,若视频比例调整指令是由观众客户端发出,则对观众客户端的直播视频流进行视频比例切换;若视频比例调整指令是由主播客户端发出,则对主播客户端以及主播用户创建的直播间中的所有观众客户端的直播视频流进行视频比例切换。
其中,可以设置视频比例调整指令仅仅只能由观众客户端发出,也可以设置视频比例调整指令仅仅由主播客户端发出,当然也可以设置,视频比例调整指令由观众客户端发出和主播客户端均可以发出。但是,在视频比例调整指令由观众客户端发出和主播客户端均可以发出时,当主播客户端发出了视频比例调整指令之后,观众客户端又发出视频比例调整指令时,观众客户端发出的视频调整指令是基于主播客户端调整后的直播视频流进行调整的。而且,当主播客户端再次发次视频比例调整指令后,将撤销观众客户端发出的视频调整指令,按照主播客户端再次发出的视频比例调整指令进行直播视频流调整,且显示主播客户端再次发出的视频比例调整指令调整后的直播视频流。也即,主播客户端可以控制进入直播间的所有观众客户端的直播间界面视频比例,而直播间的观众客户端只能调整自己的直播间界面的视频比例,而且直播间的观众客户端优先按照主播客户端发送的视频调整指令调整视频比例调整。
可以理解的是,可以在创建直播间时,接收对直播视频流的视频比例调整指令,同时,还可以在显示直播视频流时,实时接收对直播视频流的视频比例调整指令。
步骤S102:获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点。
在一个可选的实施例中,可以基于预设的人脸识别算法和/或躯干识别算法对直播视频图像帧进行人脸和/或躯干识别,进而获得人脸位置信息和/或躯干位置信息。需要说明的是,所述人脸识别算法和/或躯干识别算法可以包括人脸识别算法和躯干识别算法,进而通过人脸识别算法和躯干识别算法识别人脸和躯干;所述人脸识别算法和/或躯干识别算法也可以包括人脸躯干识别算法,通过人脸躯干识别算法同时识别人脸和躯干。其中,所述人脸识别算法和/或躯干识别算法为任意一种现有的人脸识别算法和/或躯干识别算法,在此不对其进行详细限定。
在另一个可选的实施例中,也可以将直播视频图像帧输入已训练的人脸识别和/或躯干识别模型中,通过已训练的已训练的人脸识别和/或躯干识别模型对该直播视频图像帧进行人脸和/或躯干识别,进而获得人脸位置信息和/或躯干位置信息。已训练的人脸识别和/或躯干识别模型可以是采用标注有已训练的人脸和/或躯干的图像样本集,对神经网络进行训练获得的模型。
可选的,若所述直播视频图像帧不包括人脸也不包括躯干,获取所述直播视频图像帧的中心点,以所述直播视频图像帧的中心点作为目标视频中心点,从而快速进行视频比例切换。
步骤S103:在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧。
可选的,可以对每一帧所述直播视频图像帧,根据所述目标视频中心点,按照所述目标视频比例,对所述直播视频图像帧进行裁剪,进而获得每一帧目标直播视频图像帧。
步骤S104:根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流。
可选的,可以将每一帧的目标直播视频图像帧进行拼接,获得目标视频直播流,进而在观众客户端的直播间界面显示所述目标直播视频流。
本申请实施例的观众客户端接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流,从而可以根据人脸位置信息和/或躯干位置信息自适应进行视频比例切换,从而可以使切换后的目标直播视频流可以尽可能显示主播人脸和/或躯干,无需主播频繁移动调整位置来匹配调整比例后的直播视频。
在一个实施例中,步骤S101所述接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例的步骤之前,还包括步骤S1011-S1012:
步骤S1011:响应于视频比例调整控件的触发操作,在所述直播间界面显示视频比例列表,所述视频比例列表包括若干个预设的视频比例。
可选的,请参阅图3,可以在直播间界面显示视频比例调整控件10,进而响应于视频比例调整控件10的触发操作,在直播间界面显示视频比例列表,例如,在当前采用小窗口视频播放时,可以在直播间界面显示视频比例调整控件10,以提示用户可以进行视频比例调整,同时也可以方便用户触发视频比例调整。
可选的,可以在直播间的功能工具栏中,查找到视频比例调整控件,进而点击该视频比例调整控件,在视频比例调整控件一侧可显示视频比例列表,以供用户选择视频比例。例如,在当前采用全屏或者横屏播放直播视频流时,可以在直播间的功能工具栏中,查找到视频比例调整控件,进而可以点击该视频比例调整控件,在视频比例调整控件一侧显示视频比例列表。
可选的,响应于视频比例调整控件的触发操作,在所述直播间界面显示视频比例列表的之后,还可以在预设的视频比例列表之后显示视频比例输入控件和视频比例确定控件,在该比例输入控件上输入某一视频比例,且点击了视频比例确定控件后,则会触发将输入的视频比例作为目标视频比例,根据目标视频比例生成视频比例调整指令。
可选的,响应于视频比例调整控件的触发操作,在所述直播间界面显示视频比例列表的之后,还可以在预设的视频比例列表之后显示可以还原默认视频比例控件,在触发该默认视频比例控件后,则可将调整后的视频还原到观众客户端未接收到视频比例调整指令时的未调整的视频进行显示。
步骤S1012:接收根据触发的预设的所述视频比例生成的视频比例调整指令。
可选的,响应于视频比例调整控件的触发操作,在所述直播间界面显示视频比例列表,且在用户触发预设的所述视频比例之后,在预设时间内才使所述视频比例列表消失,以使用户方便切换预设的视频比例,直至触发的视频比例调整指令对应的目标视频流后为需求比例的视频流后。
本申请实施例通过响应于视频比例调整控件的触发操作,在所述直播间界面显示视频比例列表,所述视频比例列表包括若干个预设的视频比例,进而接收根据触发的预设的所述视频比例生成的视频比例调整指令,从而使用户可以快捷方便地触发视频比例调整。
在一个实施例中,步骤S101所述接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例的步骤之前,还包括如下步骤:在所述直播间界面显示有所述视频比例调整控件。步骤S104中所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括步骤S105-S106:
步骤S105:按照预设时间间隔对所述直播间界面所在的直播屏幕进行截图,获得直播屏幕截图。
步骤S106:若在所述直播屏幕截图中未识别到所述视频比例调整控件,将所述视频比例调整控件移动到所述直播间界面中若干个预设位置中的一个位置,以在所述直播屏幕截图中识别获得所述视频比例调整控件。
可以理解的是,当打开其他应用或者其他业务页面导致所述视频比例调整控件被遮挡时,所述直播屏幕截图中将无法识别到所述视频比例调整控件,此时,需要将所述视频比例调整控件移动到不被遮挡的位置,从而方便用户使用该视频比例调整控件。
可选的,请参阅图3,可将直播间界面上的视频比例调整控件10默认显示在直播间界面的右下角,而且可以预设若干个预设位置,例如左上角、左下角、右上角等边角位置或者尽量不遮挡直播间界面播放直播视频流的位置,在检测到所述直播屏幕截图中的右下角未识别到所述视频比例调整控件,请参阅图4,可将所述视频比例调整控件10移动到所述直播间界面中若干个预设位置中的一个位置,例如,将所述视频比例调整控件10移动到所述直播间界面的左下角,以在所述直播屏幕截图中识别获得所述视频比例调整控件10。
可选的,可以通过对相邻时间间隔获取的直播屏幕截图进行比较,若在当前相邻时间时间间隔的直播间界面的右下角存在视频比例调整控件的贴图,在下一时间时间间隔的直播间界面的右下角不存在视频比例调整控件的贴图,则判断在所述直播屏幕截图中未识别到所述视频比例调整控件。
请参阅图5,其为本申请一个实施例提供的获取目标视频中心点的方法的流程图。在一个实施例中,步骤S102中获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点的步骤,包括步骤S1021-S1023:
步骤S1021:获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸识别。
步骤S1022:若所述直播视频图像帧包括人脸,获取人脸位置信息,根据所述人脸位置信息获取所述人脸尺寸;若所述人脸尺寸大于预设尺寸,根据所述人脸位置信息确定目标视频中心点;若所述人脸尺寸小于所述预设尺寸,对所述直播视频图像帧进行躯干识别,若所述直播视频图像帧包括躯干,获取躯干位置信息,根据所述人脸位置信息和所述躯干位置信息确定目标视频中心点。
其中,预设尺寸可以根据实际需要进行设置,若所述人脸尺寸大于预设尺寸,说明人脸在直播视频图像帧中占据了较大的范围,例如,主播人脸在直播视频图像帧中占据了较大的范围,此时,则可以以主播人脸中心作为目标视频中心点,进而获得目标视频图像帧;若所述人脸尺寸小于预设尺寸,说明人脸在直播视频图像帧中占据的范围不大,而为了尽可能显示人的特征,例如,为了尽可能显示主播的特征,则需要根据主播人脸和主播躯干来进一步地获得目标视频中心点。
步骤S1023:若所述直播视频图像帧不包括人脸,对所述直播视频图像帧进行躯干识别,若所述直播视频图像帧包括躯干,获取躯干位置信息,根据所述躯干位置信息确定目标视频中心点。
若所述直播视频图像帧不包括人脸,则可以对所述直播视频图像帧进行躯干识别,若所述直播视频图像帧包括躯干,获取躯干位置信息,进而可以根据所述躯干位置信息获得躯干中心,从而将躯干中心作为目标视频中心点。
本申请实施例优先通过人脸来确定目标视频中心点,从而可以使按照目标视频比例调整后的目标视频图像帧可以尽可能地显示人脸,而通过结合人脸和躯干来确定目标视频中心点,从而可以使按照目标视频比例调整后的目标视频图像帧尽可能地显示人特征,以在进行视频比例调整后,视频图像帧中的人例如主播通过尽可能少的移动或者不移动,进能尽可能地显示人脸和人特征。
请参阅图6,其为本申请另一个实施例提供的获取目标视频中心点的方法的流程图。在一个实施例中,步骤S1022中所述若所述人脸尺寸小于所述预设尺寸,对所述直播视频图像帧进行躯干识别,若所述直播视频图像帧包括躯干,获取躯干位置信息,根据所述人脸位置信息和所述躯干位置信息确定目标视频中心点的步骤,包括:
步骤S10221:根据所述人脸位置信息获得人脸中心,根据所述躯干位置信息获取躯干中心,将所述人脸中心以及所述躯干中心连线的中点作为目标视频中心点。
步骤S10222:若根据所述目标视频中心点确定的目标直播视频图像帧未完全显示所述人脸位置信息对应的人脸,以所述人脸中心以及所述躯干中心连线的中点为起点,在所述人脸中心以及所述躯干中心连线上,将向所述人脸中心方向移动预设步长后的点作为调整后的中心点,以使根据调整后的中心点确定的目标直播视频图像帧完全显示所述人脸位置信息对应的人脸为止,将调整后的中心点作为目标视频中心点。
可以理解的是,在以所述人脸中心以及所述躯干中心连线的中点为起点,在所述人脸中心以及所述躯干中心连线上,将向所述人脸中心方向每移动一个预设步长后的点均作为调整后的中心点,再根据调整后的中心点确定的目标直播视频图像帧判断是否完全显示所述人脸位置信息对应的人脸,若已经完全显示所述人脸位置信息对应的人脸,则停止移动,将调整后的中心点作为目标视频中心点;若仍然未完全显示所述人脸位置信息对应的人脸,则继续向所述人脸中心方向移动一个预设步长,根据调整后的中心点确定的目标直播视频图像帧判断是否完全显示所述人脸位置信息对应的人脸,根据调整后的中心点确定的目标直播视频图像帧完全显示所述人脸位置信息对应的人脸为止,才将调整后的中心点作为目标视频中心点,从而区别人脸完全显示在目标直播视频图像帧中。
在一个实施例中,步骤S102中所述获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点步骤,包括:根据上一帧的人脸和/或躯干位置信息,采用人脸和/或躯干跟踪方法跟踪获得下一帧的人脸和/或躯干位置信息;根据下一帧的人脸和/ 或躯干位置信息,获得下一帧目标视频中心点。可选的,可以通过人脸和/或躯干跟踪算法对人脸和/或躯干进行跟踪,以快捷准确地定位出每一帧的目标视频中心点。
在一个实施例中,步骤S104中所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括步骤S107-S109:
步骤S107:接收在所述直播间界面上对所述目标直播视频流的观看位置调整指令,根据所述观看位置调整指令获得调整距离以及调整方向。
可选的,所述直播间界面设置有直播视频显示区;所述直播视频显示区用于根据所述目标直播视频对应调整显示比例,可以预设观看位置调整动作,若监听到在所述直播视频显示区发生了观看位置调整动作时,则根据观看位置调整动作生成对所述目标视频流的观看位置调整指令。例如,可以预设两个手指长按直播视频显示区作为观看位置调整动作,进而在监听到两个手指长按直播视频显示区时,可进一步获取两个手指的拖动距离以及拖动方向,且将拖动距离以及拖动方向分别作为调整距离以及调整方向,生成观看位置调整指令。可选的,在监听到在所述直播视频显示区发生了观看位置调整动作时,还可以显示观看位置调整特效,以提示用户当前正在触发观看位置调整指令。例如,当监听到两个手指长按直播视频显示区时,还可以设置一个直播视频显示区的震动响应,进而提示用户当前正在触发观看位置调整指令。
可选的,也可以预设观看位置调整控件,将通过该观看位置调整控件输入的距离以及输入分别作为调整距离以及调整方向,生成观看位置调整指令。
可选的,观看位置调整指令可以是由观众客户端发出,从而对发出观看客户端的直播界面上显示的目标视频流进行位置调整。
可选的,观看位置调整指令可以是由主播客户端发出,从而对主播客户端的直播界面以及加入主播客户端所在的直播间的所有观众客户端的直播界面上显示的目标视频流进行位置调整。
步骤S106:在所述直播视频图像帧中,根据所述调整距离、所述调整方向、所述视频中心点以及所述目标视频比例,获得调整后的直播视频图像帧。
可以理解的是,将所述视频中心点向所述调整方向移动所述调整距离作为调整后的视频中心点,在所述直播视频图像帧中,获得以调整后的视频中心点为中心的目标视频比例的直播视频图像帧。
步骤S107:根据所述调整后的直播视频图像帧,获得调整后的直播视频流,以在直播间界面显示调整后的直播视频流。
本申请实施例通过接收观看位置调整指令,进而根据所述观看位置调整指令获得调整距离以及调整方向,从而在所述直播视频图像帧中,根据所述调整距离、所述调整方向、所述视频中心点以及所述目标视频比例,获得调整后的直播视频图像帧,进而根据所述调整后的直播视频图像帧,获得调整后的直播视频流,以在直播间界面显示调整后的直播视频流,从而可以根据实际需要调整观看位置,不会因比例切换后,而无法查看想要查看的直播视频流位置。
在一个实施例中,步骤S104所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括步骤S109-S110:
步骤S109:接收在所述目标直播视频流上触发的放大触发指令。
可选的,所述直播间界面设置有直播视频显示区;所述直播视频显示区用于根据所述目标直播视频对应调整显示比例,可以预设放大调整动作,若监听到在所述直播视频显示区发生了放大调整动作时,则根据放大调整动作生成对所述目标视频流的观看放大触发指令。例如,可以预设在直播视频显示区上双指放大的动作为放大调整动作,进而在监听到在直播视频显示区上双指放大的动作时,生成放大触发指令。
可选的,也可以预设放大调整控件,将通过该放大控件输入的放大比例,生成放大触发指令。
步骤S110:根据所述放大触发指令,通过超高分辨率算法增大所述目标直播视频流的分辨率,将分辨率增大后的目标直播视频流在直播间界面进行显示。
本申请实施例通过接收在所述目标直播视频流上触发的放大触发指令;根据所述放大触发指令,通过超高分辨率算法增大所述目标直播视频流的分辨率,将分辨率增大后的目标直播视频流在直播间界面进行显示,从而实现对目标直播视频流进行放大高清显示。
在一个实施例中,步骤S110中所述根据所述放大触发指令,通过超高分辨率算法增大所述目标直播视频流的分辨率,将分辨率增大后的目标直播视频流在直播间界面进行显示的步骤之后,还包括步骤S111-S112:
步骤S111:接收在所述目标直播视频流上触发的缩小触发指令;
可选的,所述直播间界面设置有直播视频显示区;所述直播视频显示区用于根据所述目标直播视频对应调整显示比例,可以预设缩小调整动作,若监听到在所述直播视频显示区发生了缩小调整动作时,则根据缩小调整动作生成对所述目标视频流的缩小触发指令。例如,可以预设在直播视频显示区上双指缩小的动作为缩小调整动作,进而在监听到在直播视频显示区上双指缩小的动作时,生成缩小触发指令。
可选的,也可以预设缩小调整控件也即还原控件,将通过该缩小控件,生成缩小触发指令。
步骤S112:根据所述缩小触发指令,在所述直播间界面还原显示所述目标直播视频流。
本申请实施例通过接收在所述目标直播视频流上触发的缩小触发指令;根据所述缩小触发指令,在所述直播间界面还原显示所述目标直播视频流,从而方便快捷地将放大后的目标直播视频流进行还原。
在另一个实施例中,步骤S104所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括步骤S1041-S1043:
步骤S1041:响应于在所述直播间界面的双指放大操作,获得双指放大时在所述直播间界面的起始触摸点坐标、双指在所述直播间界面上放大移动时的实时触摸点坐标、双指在所述直播间界面的起始触摸时间、以及双指在所述直播间界面上放大移动时的实时触摸时间。
可选的,所述直播间界面设置有直播视频显示区;所述直播视频显示区用于根据所述目标直播视频对应调整显示比例,可以预设放大调整动作,若监听到在所述直播视频显示区发生了放大调整动作时,则根据放大调整动作生成获得双指放大时在所述直播间界面的起始触摸点坐标、双指在所述直播间界面上放大移动时的实时触摸点坐标以及双指在所述直播间界面上的实时触摸时间。例如,可以预设在直播视频显示区上双指放大的动作为放大调整动作。
步骤S1042:根据所述起始触摸点坐标、所述实时触摸点坐标、所述初始触摸时间以及所述实时触摸时间,获得双指的实时放大速度。
可以理解的,根据所述起始触摸点坐标和所述实时触摸点坐标的差值,获得双指放大距离;根据双指在所述直播间界面的起始触摸时间以及双指在所述直播间界面上放大移动时的实时触摸时间的差值,获得双指放大时间差;根据双指放大距离以及双指放大时间差的比值,可以获得双指的实时放大速度
步骤S1043:根据预设的双指放大速度以及分辨率放大级别,获得所述实时放大速度对应的目标分辨率放大级别,通过超高分辨率算法将所述目标直播视频流的分辨率按照所述目标分辨率放大级别进行动态放大,且在直播间界面显示分辨率动态放大后的所述目标直播视频流。
可选的,可以预设双指放大速度以及视频分辨率级别的映射表,进而根据该双指放大速度以及视频分辨率级别的映射表,查询获得所述实时放大速度对应的目标分辨率级别。其中,预设的双指放大速度可以为一个固定值,也即,每一个双指放大速度均对应一个视频分辨率级别,预设的双指放大速度也可以为一个范围,当实时放大速度在该范围内,则获得对应的视频分辨率率级别。
可选的,视频分辨率级别为视频分辨率放大倍数;可选的,双指放大速度越大,则视频分辨率级别越高,也即,双指放大速度越大,对应的分辨率放大倍数越大。
本申请实施例根据双指放大速度,获得对应的目标分辨率放大级别,进而通过超高分辨率算法动态调整所述目标直播视频流的分辨率,从而对目标直播视频流进行高清动态放大。
在一个实施例中,所述根据预设的双指放大速度以及视频分辨率级别,获得所述实时放大速度对应的目标分辨率级别,将所述目标直播视频流的分辨率动态增大至所述目标分辨率级别,且在直播间界面显示分辨率动态增大的所述目标直播视频流的步骤之后,还包括:步骤S1044:响应于在所述直播间界面的双指缩小操作,在所述直播间界面还原显示所述目标直播视频流。本申请实施例通过响应于在所述直播间界面的双指缩小操作,在所述直播间界面还原显示所述目标直播视频流,从而方便快捷地将放大后的目标直播视频流进行还原。
在一个实施例中,步骤S104中所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括步骤S113-S114:
步骤S113:保存所述目标视频比例以及直播间标识。
步骤S114:响应于再次进入直播间标识对应的直播间操作,根据所述目标视频比例调整直播间标识对应的直播视频流,获得所述直播间标识对应的目标直播视频流,以在所述直播间标识对应的直播间界面显示目标直播视频流。
可以理解的是,对于由观众客户端发出的对直播视频流的视频比例调整指令时,则获取观众客户端在对直播视频流的视频比例调整指令所在的直播间标识,当观众客户端再次进入该直播间标识对应的直播间时,则根据所述目标视频比例调整调整直播间标识对应的直播视频流,获得所述直播间标识对应的目标直播视频流,以在所述直播间标识对应的直播间界面显示目标直播视频流。
可以理解的是,对于由主播客户端发出的对直播视频流的视频比例调整指令,则获取主播客户端所在的直播间标识,当主播客户端再次开播所述直播间标识对应的直播间时,则根据所述目标视频比例调整调整直播间标识对应的直播视频流,获得所述直播间标识对应的目标直播视频流,以使加入所述直播间标识对应的直播间的所有观众客户端的直播间界面显示目标直播视频流。
本申请实施例通过保存保存所述目标视频比例以及直播间标识,且响应于再次进入直播间标识对应的直播间操作,根据所述目标视频比例调整直播间标识对应的直播视频流,获得所述直播间标识对应的目标直播视频流,以在所述直播间标识对应的直播间界面显示目标直播视频流,可以使下次进入直播间的用户可以快捷地获得需求比例的视频流。
请参阅图7,其是本申请第二实施例提供的直播间的视频比例切换方法的流程图。本申请第一实施例提供的直播间的视频比例切换方法,由主播客户端作为执行主体执行,具体的,所述方法包括如下步骤:
步骤S201:接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;
步骤S202:获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;
步骤S203:在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;
步骤S204:根据所述目标直播视频图像帧,获得目标直播视频流,将所述目标直播视频流发送至加入所述直播视频流对应的直播间的所有观众客户端,以在所述主播客户端以及所述观众客户端的直播间界面显示所述目标直播视频流。
本实施例是从主播客户端一侧对基于直播间的视频比例切换方法进行描述的。关于其具体的实现方式均可以参考第一实施例中主播客户端执行步骤的相关说明,在此不进行赘述。
请参阅图8,其是本申请第三实施例提供的直播间的视频比例切换方法的流程图。本申请第一实施例提供的直播间的视频比例切换方法,由服务器端作为执行主体执行,具体的,所述方法包括如下步骤:
步骤S301:接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例以及发出所述视频比例调整指令的用户标识;
步骤S302:获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;
步骤S303:在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;
步骤S304:根据所述目标直播视频图像帧,获得目标直播视频流;若所述用户标识指示为主播用户标识,将所述目标直播视频流发送至所述主播用户标识对应的主播客户端,以及加入所述主播用户标识所在的直播间的所有观众客户端,以在所述主播客户端以及所述观众客户端的直播间界面显示所述目标直播视频流;若所述用户标识指示为观众用户标识,将所述目标直播视频流发送至所述观众用户标识对应的观众客户端,以在所述观众用户标识对应的观众客户端的直播间界面显示所述目标直播视频流。
本实施例是从服务器端一侧对基于直播间的视频比例切换方法进行描述的。关于其具体的实现方式均可以参考第一实施例中执行步骤的相关说明,在此不进行赘述。
请参见图9,其为本申请第四实施例提供的直播间的视频比例切换装置的结构示意图。本申请实施例的直播间的视频比例切换装置400包括:
目标视频比例接收模块401,用于接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;
目标视频中心点获取模块402,用于获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/ 或躯干位置信息确定目标视频中心点;
目标直播视频图像帧获取模块403,用于在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;
目标直播视频流获取模块404,用于根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流。
需要说明的是,本申请第四实施例提供的直播间的视频比例切换装置在执行直播中的直播间的视频比例切换方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分为不同的功能模块,以完成以上描述的全部或者部分功能。另外,本申请第二实施例提供的直播间的视频比例切换装置与本申请第一实施例直播间的视频比例切换方法属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
本申请第四实施例的直播间的视频比例切换装置的实施例可以应用在计算机设备上,例如观众客户端、主播客户端或者服务器端上,该装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在文件处理的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,其所在的计算机设备可以包括处理器、网络接口、内存以及非易失性存储器,通过数据总线或其他公知方式互相共联。
请参见图10,其为本申请第五实施例计算机设备的一种硬件结构图,该计算机设备300 其包括处理器310、网络接口320、内存330以及非易失性存储器340,通过数据总线或其他公知方式互相共联。除了图10所示的处理器310、网络接口320、内存330以及非易失性存储器340之外,本申请所述计算机设备的实际功能,还可以包括其他硬件,对此不再赘述。
所述内存330或者所述非易失性存储器340运行有计算机程序,例如:直播间的视频比例切换方法;该处理器310执行该计算机程序时实现上述第一实施例的步骤。其中,所述计算机设备也以作为第二实施例直播间的视频比例切换装置的载体。
其中,所述处理器310可以包括一个或多个处理核心。所述处理器310利用各种接口和线路连接计算机设备300的各个部分,通过运行或执行存储在存储器340和/或内存330内的指令、程序、代码集或指令集,以及调用非易失性存储器340和/或内存330内的数据,执行计算机设备300的各种功能和处理数据,可选的,处理器310可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable GateArray,FPGA)、可编程逻辑阵列(Programble Logic Array,PLA)中的至少一个硬件形式来实现。处理器310 可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit, GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器310中,单独通过一块芯片进行实现。
其中,非易失性存储器340可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该非易失性存储器340可用于存储指令、程序、代码、代码集或指令集。非易失性存储器340可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。
本申请第四实施例还提供了一种计算机存储介质,该计算机存储介质可以存储有多条指令,该指令适用于由处理器加载并执行第一实施例的方法步骤,具体执行过程可以参见第一实施例的具体说明,在此不进行赘述。所述存储介质所在设备可以是个人计算机、笔记本电脑、智能手机、平板电脑等电子设备。
计算机存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和 /或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中选定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中选定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中选定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (11)

1.一种直播间的视频比例切换方法,其特征在于,包括如下步骤:
接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;
获取所述直播视频流的每一帧直播视频图像帧;对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;
在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;
根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流。
2.根据权利要求1所述的直播间的视频比例切换方法,其特征在于:
所述获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点的步骤,包括:
获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸识别;
若所述直播视频图像帧包括人脸,获取人脸位置信息,根据所述人脸位置信息获取所述人脸尺寸;若所述人脸尺寸大于预设尺寸,根据所述人脸位置信息确定目标视频中心点;若所述人脸尺寸小于所述预设尺寸,对所述直播视频图像帧进行躯干识别,若所述直播视频图像帧包括躯干,获取躯干位置信息,根据所述人脸位置信息和所述躯干位置信息确定目标视频中心点;
若所述直播视频图像帧不包括人脸,对所述直播视频图像帧进行躯干识别,若所述直播视频图像帧包括躯干,获取躯干位置信息,根据所述躯干位置信息确定目标视频中心点。
3.根据权利要求2所述的直播间的视频比例切换方法,其特征在于:
所述若所述人脸尺寸小于所述预设尺寸,对所述直播视频图像帧进行躯干识别,若所述直播视频图像帧包括躯干,获取躯干位置信息,根据所述人脸位置信息和所述躯干位置信息确定目标视频中心点的步骤,包括:
根据所述人脸位置信息获得人脸中心,根据所述躯干位置信息获取躯干中心,将所述人脸中心以及所述躯干中心连线的中点作为目标视频中心点;
若根据所述目标视频中心点确定的目标直播视频图像帧未完全显示所述人脸位置信息对应的人脸,以所述人脸中心以及所述躯干中心连线的中点为起点,在所述人脸中心以及所述躯干中心连线上,将向所述人脸中心方向移动预设步长后的点作为调整后的中心点,以使根据调整后的中心点确定的目标直播视频图像帧完全显示所述人脸位置信息对应的人脸为止,将调整后的中心点作为目标视频中心点。
4.根据权利要求1至3中任一项权利要求所述的直播间的视频比例切换方法,其特征在于:
所述获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点步骤,包括:
根据上一帧的人脸和/或躯干位置信息,采用人脸和/或躯干跟踪方法跟踪获得下一帧的人脸和/或躯干位置信息;根据下一帧的人脸和/或躯干位置信息,获得下一帧目标视频中心点。
5.根据权利要求1至4中任一项权利要求所述的直播间的视频比例切换方法,其特征在于:
所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括:
接收在所述直播间界面上对所述目标直播视频流的观看位置调整指令,根据所述观看位置调整指令获得调整距离以及调整方向;
在所述直播视频图像帧中,根据所述调整距离、所述调整方向、所述视频中心点以及所述目标视频比例,获得调整后的直播视频图像帧;
根据所述调整后的直播视频图像帧,获得调整后的直播视频流,以在直播间界面显示调整后的直播视频流。
6.根据权利要求1至4中任一项权利要求所述的直播间的视频比例切换方法,其特征在于:
所述接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例的步骤之前,还包括:在所述直播间界面显示有所述视频比例调整控件;
所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括:
按照预设时间间隔对所述直播间界面所在的直播屏幕进行截图,获得直播屏幕截图;
若在所述直播屏幕截图中未识别到所述视频比例调整控件,将所述视频比例调整控件移动到所述直播间界面中若干个预设位置中的一个位置,以在所述直播屏幕截图中识别获得所述视频比例调整控件。
7.根据权利要求1至4中任一项权利要求所述的直播间的视频比例切换方法,其特征在于:
所述根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流的步骤之后,还包括:
保存所述目标视频比例以及直播间标识;
响应于再次进入直播间标识对应的直播间操作,根据所述目标视频比例调整直播间标识对应的直播视频流,获得所述直播间标识对应的目标直播视频流,以在所述直播间标识对应的直播间界面显示目标直播视频流。
8.根据权利要求1至7中任一项权利要求所述的直播间的视频比例切换方法,其特征在于:
若所述直播视频图像帧不包括人脸也不包括躯干,获取所述直播视频图像帧的中心点,以所述直播视频图像帧的中心点作为目标视频中心点。
9.一种直播间的视频比例切换装置,其特征在于,包括:
目标视频比例接收模块,用于接收对直播视频流的视频比例调整指令,根据所述视频比例调整指令获得目标视频比例;
目标视频中心点获取模块,用于获取所述直播视频流的每一帧直播视频图像帧,对所述直播视频图像帧进行人脸和/或躯干识别,若所述直播视频图像帧包括人脸和/或躯干,从所述直播视频图像帧中获得人脸位置信息和/或躯干位置信息,根据所述人脸位置信息和/或躯干位置信息确定目标视频中心点;
目标直播视频图像帧获取模块,用于在所述直播视频图像帧中,根据所述目标视频中心点以及所述目标视频比例,获得目标直播视频图像帧;
目标直播视频流获取模块,用于根据所述目标直播视频图像帧,获得目标直播视频流,以在直播间界面显示所述目标直播视频流。
10.一种计算机设备,包括处理器和存储器;其特征在于,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1至8中任意一项所述的直播间的视频比例切换方法。
11.一种计算机可读存储介质,其上储存有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至8中任意一项所述的直播间的视频比例切换方法。
CN202111658519.5A 2021-12-30 2021-12-30 直播间的视频比例切换方法、装置、介质以及计算机设备 Pending CN114679591A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111658519.5A CN114679591A (zh) 2021-12-30 2021-12-30 直播间的视频比例切换方法、装置、介质以及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111658519.5A CN114679591A (zh) 2021-12-30 2021-12-30 直播间的视频比例切换方法、装置、介质以及计算机设备

Publications (1)

Publication Number Publication Date
CN114679591A true CN114679591A (zh) 2022-06-28

Family

ID=82070931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111658519.5A Pending CN114679591A (zh) 2021-12-30 2021-12-30 直播间的视频比例切换方法、装置、介质以及计算机设备

Country Status (1)

Country Link
CN (1) CN114679591A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095355A (zh) * 2023-01-18 2023-05-09 百果园技术(新加坡)有限公司 视频显示控制方法及其装置、设备、介质、产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104732218A (zh) * 2015-03-31 2015-06-24 努比亚技术有限公司 图像显示的方法及装置
CN107181913A (zh) * 2017-05-25 2017-09-19 维沃移动通信有限公司 一种拍照方法及移动终端
CN107872639A (zh) * 2017-11-14 2018-04-03 维沃移动通信有限公司 通信视频的传输方法、装置和移动终端
CN110536005A (zh) * 2019-08-16 2019-12-03 维沃移动通信有限公司 一种对象显示调整方法及终端
CN112019930A (zh) * 2020-07-26 2020-12-01 杭州皮克皮克科技有限公司 一种直播视频的互动显示方法及装置
KR20210090262A (ko) * 2019-12-11 2021-07-19 베이징 센스타임 테크놀로지 디벨롭먼트 컴퍼니 리미티드 정보 처리 방법과 장치, 전자 디바이스 및 기록 매체
CN113301372A (zh) * 2021-05-20 2021-08-24 广州繁星互娱信息科技有限公司 直播方法、装置、终端及存储介质
CN113763242A (zh) * 2021-05-17 2021-12-07 腾讯科技(深圳)有限公司 一种图像处理方法、装置及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104732218A (zh) * 2015-03-31 2015-06-24 努比亚技术有限公司 图像显示的方法及装置
CN107181913A (zh) * 2017-05-25 2017-09-19 维沃移动通信有限公司 一种拍照方法及移动终端
CN107872639A (zh) * 2017-11-14 2018-04-03 维沃移动通信有限公司 通信视频的传输方法、装置和移动终端
CN110536005A (zh) * 2019-08-16 2019-12-03 维沃移动通信有限公司 一种对象显示调整方法及终端
KR20210090262A (ko) * 2019-12-11 2021-07-19 베이징 센스타임 테크놀로지 디벨롭먼트 컴퍼니 리미티드 정보 처리 방법과 장치, 전자 디바이스 및 기록 매체
CN112019930A (zh) * 2020-07-26 2020-12-01 杭州皮克皮克科技有限公司 一种直播视频的互动显示方法及装置
CN113763242A (zh) * 2021-05-17 2021-12-07 腾讯科技(深圳)有限公司 一种图像处理方法、装置及计算机可读存储介质
CN113301372A (zh) * 2021-05-20 2021-08-24 广州繁星互娱信息科技有限公司 直播方法、装置、终端及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095355A (zh) * 2023-01-18 2023-05-09 百果园技术(新加坡)有限公司 视频显示控制方法及其装置、设备、介质、产品

Similar Documents

Publication Publication Date Title
CN109413483B (zh) 直播内容的预览方法、装置、设备和介质
CN108174272B (zh) 直播中互动信息展示的方法、装置、存储介质及电子设备
US9055189B2 (en) Virtual circular conferencing experience using unified communication technology
CN108093267B (zh) 一种直播方法、装置、存储介质及电子设备
US10275133B2 (en) Moving image playback method, moving image playback device, and computer readable storage medium storing a moving image playback program
CN105472437A (zh) 视频播放方法及装置
CN109600656B (zh) 一种视频榜单显示方法、装置,终端设备及存储介质
US10531153B2 (en) Cognitive image obstruction
CN112261434A (zh) 界面布局控制、处理方法及其相应的装置、设备、介质
CN113840154A (zh) 基于虚拟礼物的直播互动方法、系统及计算机设备
CN114868107A (zh) 针对通信会话视频流的动态控制的纵横比
CN113824979A (zh) 直播间的推荐方法、装置及计算机设备
CN114422821A (zh) 基于虚拟礼物的直播首页互动方法、装置、介质以及设备
CN110795004A (zh) 一种社交的方法与设备
US9779093B2 (en) Spatial seeking in media files
CN114666671B (zh) 直播点赞互动方法、装置、设备及存储介质
CN114679591A (zh) 直播间的视频比例切换方法、装置、介质以及计算机设备
WO2022117028A1 (zh) 基于游戏直播的主播输入操作分享与显示方法、及设备
US20240137617A1 (en) Video playing method and apparatus, and storage medium
CN114374853A (zh) 内容展示方法、装置、计算机设备和存储介质
CN112000251A (zh) 用于播放视频的方法、装置、电子设备和计算机可读介质
CN113727125B (zh) 直播间的截图方法、装置、系统、介质以及计算机设备
CN113891135B (zh) 一种多媒体数据播放方法、装置、电子设备及存储介质
CN114501065A (zh) 基于面部拼图的虚拟礼物互动方法、系统及计算机设备
CN115022702A (zh) 直播间礼物的展示方法、装置、设备、介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination