CN115167733A - 一种直播资源的展示方法、装置、电子设备和存储介质 - Google Patents

一种直播资源的展示方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115167733A
CN115167733A CN202110370815.9A CN202110370815A CN115167733A CN 115167733 A CN115167733 A CN 115167733A CN 202110370815 A CN202110370815 A CN 202110370815A CN 115167733 A CN115167733 A CN 115167733A
Authority
CN
China
Prior art keywords
live broadcast
live
information
resource
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110370815.9A
Other languages
English (en)
Inventor
陈春勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110370815.9A priority Critical patent/CN115167733A/zh
Publication of CN115167733A publication Critical patent/CN115167733A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提供了一种直播资源的展示方法、装置、电子设备和存储介质,用以提高直播资源的转化率和直播效率。其中,方法包括:响应于直播对象触发的直播操作,展示直播界面;每响应于直播对象针对一个直播资源触发的描述信息,在直播界面中,呈现基于描述信息生成的针对一个直播资源的交互信息,交互信息包括以下至少一种:一个直播资源的资源属性信息,针对一个直播资源进行交互时的交互策略信息。本申请基于直播对象针对直播资源触发的描述信息,生成该直播资源的交互信息,方便不同时间观看的用户可以及时了解当前主播正在介绍的直播资源的交互信息,可有效提高直播资源的转化率和直播效率。

Description

一种直播资源的展示方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提供了一种直播资源的展示方法、装置、电子设备和存储介质。
背景技术
在线视频直播是指利用互联网网络资源进行的现场视频直播服务,通过现场的视频拍摄同步发布到网络上,用户可以同一时间在网络上看到实时的现场情况。在相关技术中,主播可以在直播间中进行直播资源的交互。以直播资源为商品为例,为了便于用户了解商品的卖点,主播需要在直播之前提前准备商品的卖点素材,因此对于主播来说,在直播过程中需要手动设置对应商品卖点的宣传素材,工作量比较大,并且在直播过程中手动进行设置还会造成直播内容的中断,影响观众的观看,对于主播和用户来说不够直观和便捷。
发明内容
本申请实施例提供一种直播资源的展示方法、装置、电子设备和存储介质,用以提高直播资源的转化率和直播效率。
本申请实施例提供的第一种直播资源的展示方法,包括:
响应于直播对象触发的直播操作,展示直播界面,所述直播界面用于显示所述直播对象的视频直播画面;
每响应于所述直播对象针对一个直播资源触发的描述信息,在所述直播界面中,呈现基于所述描述信息生成的针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息。
本申请实施例提供的第二种直播资源的展示方法,包括:
接收到直播对象触发的直播请求后,将所述直播对象关联的直播视频流反馈给所述直播对象登录的直播客户端,以使所述直播客户端根据所述直播视频流展示直播界面,其中,所述直播界面用于显示所述直播对象的视频直播画面;以及,每检测所述直播对象针对一个直播资源触发的描述信息时,获取针对所述一个直播资源的描述信息对应的音频数据;
对所述音频数据进行解码,获得针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息;
将所述交互信息反馈给所述直播客户端,以使所述直播客户端在所述直播界面中呈现所述交互信息。
可选的,所述交互信息包括所述一个直播资源的资源属性信息时,所述资源属性信息是基于所述一个直播资源的资源操作界面的详情信息以及所述直播对象针对所述一个直播资源的描述信息生成的;或
所述交互信息包括所述一个直播资源的交互策略信息时,所述交互策略信息是基于所述直播对象的描述信息生成的。
可选的,所述直播界面包括用于展示所述交互信息的提示控件;所述方法还包括:
接收到通过针对所述提示控件触发的针对所述交互信息的编辑请求后,将与所述交互信息的信息编辑界面关联的编辑操作提示信息,反馈给所述的直播客户端,以使所述直播客户端显示所述信息编辑界面,并在所述信息编辑界面中展示所述编辑操作提示信息;
获取基于所述信息编辑界面中的编辑控件输入的编辑后的交互信息,并将所述编辑后的交互信息与所述一个直播资源关联保存。
本申请实施例提供的第一种直播资源的展示装置,包括:
第一响应单元,用于响应于直播对象触发的直播操作,展示直播界面,所述直播界面用于显示所述直播对象的视频直播画面;
第二响应单元,用于每响应于所述直播对象针对一个直播资源触发的描述信息,在所述直播界面中,呈现基于所述描述信息生成的针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息。
可选的,所述直播界面包括用于展示所述交互信息的提示控件;所述第二响应单元具体用于:
在所述直播界面中通过所述提示控件展示所述交互信息,并在所述提示控件的关联位置展示针对所述提示控件的第一操作提示信息,其中,所述第一操作提示信息用于指示:通过执行第一目标操作对所述提示控件进行控制;或
在所述直播界面中展示所述交互信息,并在所述交互信息的展示时长达到第一设定时长后,在所述提示控件的关联位置展示针对所述提示控件的第二操作提示信息,其中,所述第二操作提示信息用于指示:通过执行第二目标操作对所述交互信息进行编辑。
可选的,所述第二响应单元还用于:
在所述提示控件的关联位置展示针对所述提示控件的第一操作提示信息之后,响应于针对所述提示控件触发的第一目标操作,在所述直播界面中,根据所述第一目标操作对所述提示控件的展示位置进行更新;或
在所述提示控件的关联位置展示针对所述提示控件的第一操作提示信息之后,响应于针对所述提示控件触发的第一目标操作,在所述直播界面中删除所述提示控件。
可选的,所述第二响应单元还用于:
在所述提示控件的关联位置展示针对所述提示控件的第二操作提示信息之后,响应于针对所述提示控件触发的第二目标操作,展示针对所述交互信息的信息编辑界面,所述信息编辑界面包括编辑控件;
响应于针对所述编辑控件的触发操作,获取输入的编辑后的交互信息,并基于所述编辑后的交互信息,在所述直播界面中更新展示所述提示控件中显示的交互信息。
可选的,所述信息编辑界面还包括时间设置控件;所述装置还包括:
第三响应单元,用于响应于针对所述时间设置控件的触发操作,对所述编辑后的交互信息的展示时长进行设置,以使所述编辑后的交互信息的展示时长达到第二设定时长后,在所述直播界面中关闭所述交互信息的展示。
可选的,所述信息编辑界面还包括编辑操作提示信息,以使所述直播对象根据所述编辑操作提示信息,执行针对所述编辑控件的触发操作,以对所述交互信息进行编辑,输入所述编辑后的交互信息。
可选的,所述第二响应单元还用于:
在所述交互信息的展示时长超过第三设定时长后,在所述直播界面中关闭针对所述一个直播资源的交互信息的展示。
可选的,所述装置还包括:
第四响应单元,用于响应于通过所述直播界面中的提示控件触发的针对所述一个直播资源的资源操作界面的查看操作,展示所述资源操作界面,所述资源操作界面包括针对所述一个直播资源的资源详情信息,以及用于对所述一个直播资源进行资源交互的操作控件;
响应于通过所述操作控件触发的交互操作,根据选中的资源详情信息,对所述一个直播资源进行资源交互。
本申请实施例提供的第二种直播资源的展示装置,包括:
第一反馈单元,用于接收到直播对象触发的直播请求后,将所述直播对象关联的直播视频流反馈给所述直播对象登录的直播客户端,以使所述直播客户端根据所述直播视频流展示直播界面,其中,所述直播界面用于显示所述直播对象的视频直播画面;以及,每检测所述直播对象针对一个直播资源触发的描述信息时,获取针对所述一个直播资源的描述信息对应的音频数据;
信息获取单元,用于对所述音频数据进行解码,获得针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息;
第二反馈单元,用于将所述交互信息反馈给所述直播客户端,以使所述直播客户端在所述直播界面中呈现所述交互信息。
可选的,所述信息获取单元具体用于:
对所述音频数据进行声学特征提取,并基于所述声学特征进行解码,获取与所述一个直播资源对应的文本信息;
提取所述文本信息中的关键信息,基于所述关键信息生成针对所述一个直播资源的交互信息。
可选的,所述第二反馈单元还用于:
在所述直播客户端展示所述交互信息的过程中,获取所述直播对象针对所述一个直播资源的新的描述信息对应的音频数据;
根据所述新的音频数据确定的各个讲解内容,以及所述各个讲解内容的重复次数,获得所述各个讲解内容的优先级;
根据所述各个讲解内容的优先级,选取部分讲解内容作为新的交互信息返回给所述直播客户端,以使所述直播客户端对所述直播界面中当前展示的交互信息进行更新。
可选的,所述交互信息包括所述一个直播资源的资源属性信息时,所述资源属性信息是基于所述一个直播资源的资源操作界面的详情信息以及所述直播对象针对所述一个直播资源的描述信息生成的;或
所述交互信息包括所述一个直播资源的交互策略信息时,所述交互策略信息是基于所述直播对象的描述信息生成的。
可选的,所述直播界面包括用于展示所述交互信息的提示控件;所述装置还包括:
第三反馈单元,用于接收到通过针对所述提示控件触发的针对所述交互信息的编辑请求后,将与所述交互信息的信息编辑界面关联的编辑操作提示信息,反馈给所述的直播客户端,以使所述直播客户端显示所述信息编辑界面,并在所述信息编辑界面中展示所述编辑操作提示信息;
获取基于所述信息编辑界面中的编辑控件输入的编辑后的交互信息,并将所述编辑后的交互信息与所述一个直播资源关联保存。
本申请实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述任意一种直播资源的展示方法的步骤。
本申请实施例提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任意一种直播资源的展示方法的步骤。
本申请实施例提供一种计算机可读存储介质,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行上述任意一种直播资源的展示方法的步骤。
本申请有益效果如下:
本申请实施例提供的直播资源的展示方法、装置、电子设备和存储介质,由于本申请实施例,在本申请实施例中,提出了在直播过程中,基于直播对象针对直播资源触发的描述信息,生成针对正在直播的直播资源的交互信息,该交互信息包括资源属性信息和交互策略信息中的至少一种,基于该方法可以实时在直播界面中向观众展示直播资源对应的交互信息,无需由主播反复口播,也无需由主播事先准备好这些内容放到直播间,方便不同时间观看的用户可以及时了解当前主播正在介绍的直播资源的交互信息,可有效提高直播资源的转化率和直播效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中的一种应用场景的一个可选的示意图;
图2为本申请实施例中的一种直播资源的展示方法的流程示意图;
图3A为相关技术中的一种直播界面的示意图;
图3B为本申请实施例中的一种直播界面的示意图;
图4A为本申请实施例中的一种第一操作提示信息的示意图;
图4B为本申请实施例中的一种提示控件的控制方法的示意图;
图5A为本申请实施例中的一种第二操作提示信息的示意图;
图5B为本申请实施例中的一种信息编辑界面的示意图;
图6为本申请实施例中的另一种信息编辑界面的示意图;
图7为本申请实施例中的一种资源操作界面的示意图;
图8为本申请实施例中的另一种直播资源的展示方法的流程示意图;
图9为本申请实施例中的一种直播资源交互信息的获取方法的流程示意图;
图10A为本申请实施例中的一种分帧示意图;
图10B为本申请实施例中的一种语音转文本的方法流程示意图;
图11为本申请实施例中的一种直播客户端与直播服务器之间的交互时序图;
图12为本申请实施例中的一种直播资源的展示装置的组成结构示意图;
图13为本申请实施例中的另一种直播资源的展示装置的组成结构示意图;
图14为应用本申请实施例的一种电子设备的硬件组成结构示意图;
图15为应用本申请实施例的另一种电子设备的硬件组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
下面对本申请实施例中涉及的部分概念进行介绍。
语音识别:就是把声音信号(声学特征)识别成句子(词串)。这个过程大致可以拆分成两个部分,一个是把声音信号识别成音素等声学单元(并给出概率),另一个是根据语法、词法知识,对前面识别结果再做筛选(选出符合语法规则的那部分)。所以,声学模型的训练需要输入声音(特征),标注是对应的文本内容;语言模型的训练是一些合乎语法的句子(纯文本)。
声学模型:是对声学、语音学、环境的变量、说话人性别、口音等的差异的知识表示,可以得到语音特征到音素的映射。
语言模型:是对一组字序列构成的知识表示,用于确定一个句子或词序列出现概率的概率模型,可以确定语音中包括哪个词序列的可能性更大,或者在出现了几个词的情况下预测下一个即将出现的词语,是词与词、词与句子的映射。语言模型定义哪些词能跟在上一个已经识别的词的后面(匹配是一个顺序的处理过程),因此可以为匹配过程排除一些不可能的单词。语言模型也可以理解为在匹配搜索时用于字词和路径约束的语言规则,包括由识别语音命令构成的语法网络或由统计方法构成的数学模型。
字典:字词对应的音素索引(index)集合,是字词和音素之间的映射。字典中存储的是每个字或词的发音符号表,也就是说字典里存储的是字或者词与音素的对应,因此,字典可以建立声学模型和语言模型之间的联系。
应用操作界面:是应用系统和用户之间进行交互和信息交换的媒介,它实现信息的内部形式与人类可以接受形式之间的转换,目的是使得用户能够方便有效率地去操作应用以达成双向之交互,完成所希望借助应用完成之工作。在本申请实施例中,应用操作界面包含了人机交互与图形用户接口,具体的应用操作界面包括直播界面、资源操作界面和信息编辑界面等。其中,不同的应用操作界面用于向用户展示不同的内容,实现用户与应用之间不同的信息交互。
资源操作界面:一个面向用户的,用于展示资源详细信息,进行资源交互的操作界面。在本申请实施例中,资源操作界面可以是浮层、弹窗、网页等形式,不做具体限定。下文中主要是以浮层为例进行举例说明的。其中,本申请实施例中的资源操作界面包括针对一个直播资源的资源详情信息,以及用于对一个直播资源进行资源交互的操作控件。
信息编辑界面:一种面向用户的,用于实现交互信息编辑的操作界面。在本申请实施例中,信息编辑界面同一可以是浮层、弹窗、网页等形式,不做具体限定。下文中主要是以弹窗为例进行举例说明的。其中,本申请实施例中的信息编辑界面包括编辑控件,另外,还可包括时间设置控件,编辑操作提示信息等。
本申请实施例涉及人工智能(Artificial Intelligence,AI)和机器学习技术、语音技术,基于人工智能中的计算机视觉技术和机器学习(Machine Learning,ML)而设计。
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、自然语言处理技术、以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗等,相信随着技术的发展,人工智能将在更多的领域得到应用,并发挥越来越重要的价值。
语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请的实施例提供的方案涉及人工智能、语音技术和机器学习等技术。在本申请实施例中提出的训练声学模型和语言模型的方法可分为两部分,包括训练部分和应用部分;其中,训练部分就涉及到机器学习这一技术领域,在训练部分中,通过机器学习这一技术训练声学模型和语言模型,使得本申请实施例中给出的训练样本来训练声学模型和语言模型,通过优化算法不断调整模型参数;应用部分用于使用在训练部分训练得到的声学模型和语言模型来将音频数据转化为文本信息。
下面对本申请实施例的设计思想进行简要介绍:
随着移动终端的快速发展,特别是手机移动终端的快速发展,直播行业越来越受欢迎,很多用户喜欢通过移动终端设备来观看直播。而在直播的过程中,主播由于直播内容的需要,有时会在直播时向用户推荐一些商品。而用户基于对主播的欣赏和信任,也十分希望能在一边观看直播时,一边方便的查询或购买到主播推荐的商品。
相关的电商直播间,商品卖点需要主播反复口播或者提前写好放在直播间,抑或是用幻灯片(Microsoft Office PowerPoint,PPT)提前做好在直播间放映,后台只在直播间提供一个播放ppt的视频流位置。
依赖于主播提前准备商品的卖点素材,因此对于主播来说,在直播过程中需要手动设置对应商品卖点的宣传素材,工作量比较大,并且在直播过程中手动进行设置还会造成直播内容的中断,影响观众的观看,对于主播和用户来说不够直观和便捷。
有鉴于此,本申请实施例提出了一种直播资源的展示方法、装置、电子设备和存储介质。在本申请实施例中,提出了在直播过程中,基于直播对象针对直播资源触发的描述信息,生成针对正在直播的直播资源的交互信息,该交互信息包括资源属性信息和交互策略信息中的至少一种,基于该方法可以实时在直播界面中向观众展示直播资源对应的交互信息,无需由主播反复口播,也无需由主播事先准备好这些内容放到直播间,方便不同时间观看的用户可以及时了解当前主播正在介绍的直播资源的交互信息,可有效提高直播资源的转化率和直播效率。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示,其为本申请实施例的应用场景示意图。该应用场景图包括两个终端设备110和一个服务器130,可通过终端设备110登录应用操作界面120。
在本申请实施例中,应用操作界面120可以是直播界面,资源操作界面和信息编辑界面等。其中,每个终端设备110中可以安装有直播客户端,例如图1所示,用户A为主播,用户B为观众,主播可以通过直播客户端进行直播,观众可以通过直播客户端观看主播直播。主播或是观众即可通过终端设备110登录直播客户端的应用操作界面120。
其中,终端设备110与服务器130之间可以通过通信网络进行通信。例如主播在触发的直播请求后,服务器130会根据直播对象针对直播资源触发的描述信息生成对应的交互信息,并将交互信息通过终端设备110返回给直播客户端,由直播客户端显示给用户等,在此不再一一列举,在下文中将会详细说明。
在一种可选的实施方式中,通信网络是有线网络或无线网络。终端设备110以及服务器130可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
在本申请实施例中,终端设备110为用户使用的电子设备,该电子设备可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器、智能家居等具有一定计算能力并且运行有即时通讯类软件及网站或者社交类软件及网站的计算机设备。各终端设备110通过无线网络与服务器130,服务器130可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,本申请实施例涉及的直播客户端可以是软件,也可以是网页、小程序等客户端,服务器则是与软件或是网页、小程序等相对应的直播服务器,不限制客户端的具体类型。
参阅图2所示,为本申请实施例提供的一种直播资源的展示方法的实施流程图,执行主体为直播客户端,该方法的具体实施流程如下:
S21:直播客户端响应于直播对象触发的直播操作,展示直播界面,直播界面用于显示直播对象的视频直播画面;
其中,直播资源指主播在直播间进行直播时的实体物品,例如商品,或虚拟电子资源,例如购物券。在本申请实施例中主要是以商品为例进行举例说明的。例如:衣服、电子产品、书籍、食品等。
S22:直播客户端每响应于直播对象针对一个直播资源触发的描述信息,在直播界面中,呈现基于描述信息生成的针对一个直播资源的交互信息,其中,交互信息包括以下至少一种:一个直播资源的资源属性信息,针对一个直播资源进行交互时的交互策略信息。
其中,资源属性信息指商品本身的属性,而交互策略信息则是指在对商品进行售卖时对应的策略。
其中,在直播过程中,交互信息会随着当前主播讲解商品的变化而变化。
参阅图3A所示,其为相关技术中的一种直播界面的示意图。该图中的直播界面为常规的电商直播间界面,主播会向用户介绍当前推荐的商品,推荐的商品会以气泡的形式展示,即图左下角S31所示,气泡上显示有商品的图片,以及商品名称(昵称),价格等信息。如图3A所示,该商品为草莓慕斯蛋糕。原价69,现价25。
参阅图3B所示,其为本申请实施例中的一种直播界面的示意图。图3B与图3A相比,增加了虚线框S32中的部分。该部分即本申请实施例中,直播资源“草莓慕斯蛋糕”对应的交互信息,也称商品卖点,由图3B可知,商品卖点主要包括“全手工制作口感细腻”以及“限时秒杀1分钟全网低价”。
其中,“全手工制作口感细腻”即资源属性信息,“限时秒杀1分钟全网低价”即交互策略信息。
在一种可选的实施方式中,在交互信息的展示时长超过第三设定时长后,在直播界面中关闭针对一个直播资源的交互信息的展示。
其中,交互信息是指通过对主播的描述信息进行语音识别处理后生成的,在图3B中是以商品卖点贴纸的形式展示在直播间的右上角的,该贴纸是在主播介绍商品时自动生成并展示的。另外,第三设定时长是根据主播讲解商品的时间来确定的,当然也可以是其他设定时长,在此不做具体限定。一般默认展示5分钟,即将第三设定时长设置为5分钟,即设置第三设定时长为5分钟,在5分钟后会消失。
在上述实施过程中,在主播介绍该商品时,系统自动生成该商品的卖点,通过视觉化的方式展示在直播间。不需要主播提前准备商品的卖点宣传素材,方便不同时间进场的用户可以及时了解当前主播正在介绍的商品卖点,从而提升商品的转化率。
在一种可选的实施方式中,还可通过控件的形式来展示交互信息,此时直播界面包括用于展示交互信息的提示控件。因而,在本申请实施例中,可通过对提示控件执行一些目标操作,实现对提示控件的控制,或者是对提示控件中显示的交互信息的编辑。具体过程为:
在直播界面中通过提示控件展示交互信息,并在提示控件的关联位置展示针对提示控件的第一操作提示信息,其中,第一操作提示信息用于指示:通过执行第一目标操作对提示控件进行控制,例如移动或删除。
其中,第一目标操作可以是长按,拖动等,在此不做具体限定。参阅图4A所示,其为本申请实施例中的一种第一操作提示信息的示意图。如图4A所示,其中的第一操作提示信息即虚线框S40中的内容,包括图案和文字,其中文字部分为“长按可拖动位置或者删除”,用于指示用户通过长按拖动可更新提示控件的展示位置,也可删除提示控件。
另外需要说明的是,第一操作提示信息可以指新手引导的操作提示,即在初次展示商品卖点贴纸时,主播端会收到新手引导的操作提示。操作提示只会出现1次,内容包括长按可拖动位置或者删除,即图4A所示。
在一种可选的实施方式中,在提示控件的关联位置展示针对提示控件的第一操作提示信息之后,主播即可根据第一操作提示信息,触发第一目标操作,此时,直播客户端响应于针对提示控件触发的第一目标操作,在直播界面中,根据第一目标操作对提示控件的展示位置进行更新。或者,直播客户端响应于针对提示控件触发的第一目标操作,在直播界面中删除提示控件。
如图4B所示,其为本申请实施例中的一种提示控件的控制方法的示意图,表示主播可以随意拖动贴纸的位置至房间任意位置,当贴纸拖动到删除按钮的时候,删除按钮会变红(在图4B中用虚线表示),此时松手即可删除贴纸。
在直播界面中展示交互信息,并在交互信息的展示时长达到第一设定时长后,在提示控件的关联位置展示针对提示控件的第二操作提示信息,其中,第二操作提示信息用于指示:通过执行第二目标操作对交互信息进行编辑。
其中,第二目标操作可以是单击操作。参阅图5A所示,其为本申请实施例中的一种第二操作提示信息的示意图。参阅图5A所示,其中第二操作提示信息即虚线框S50中的内容,同样包括图案和文字,其中文字为“单击编辑文字内容”,用于指示用户通过单击提示控件,以对提示控件中显示的交互信息进行编辑。
另外,需要说明的是,图5A中的第二操作提示信息也可以指商品卖点贴纸在直播间展示1分钟后,出现的新手引导的操作提示,此时第二设定时长即1分钟。在第二操作提示信息为新手引导的操作提示时,只需出现1次即可,内容包括单击编辑文字内容。
在一种可选的实施方式中,在提示控件的关联位置展示针对提示控件的第二操作提示信息之后,主播还可根据第二操作提示信息,触发第二目标操作,此时,直播客户端响应于针对提示控件触发的第二目标操作,展示针对交互信息的信息编辑界面,信息编辑界面包括编辑控件。如图5B所示,其为本申请实施例中的一种信息编辑界面的示意图。例如,主播单击提示控件时,触发针对提示控件的第二目标操作,进而直播客户端响应第二目标操作,即可展示图5B所示的信息编辑界面。在界面虚线框S50中的部分即本申请实施例中的一种编辑控件,当前显示的是目标直播界面中展示的交互信息,主播可对该部分交互信息进行编辑,进而,直播客户端响应于针对编辑控件的触发操作,获取输入的编辑后的交互信息,并基于编辑后的交互信息,在直播界面中更新展示提示控件中显示的交互信息。
需要说明的是,本申请中的信息编辑界面可以是浮层、弹窗或一个新的页面等,在此不做具体限定,图5B中是以弹窗为例进行举例说明的,即点击商品卖点贴纸后出现的弹窗,弹窗可以修改商品卖点的内容。如图5B所示,在该信息编辑界面中显示有待编辑的交互信息,即图中的商品卖点“全手工制作,口感细腻。限时秒杀1分钟,全网低价”。用户可通过编辑该部分输入编辑后的交互信息。
在另一种可选的实施方式中,信息编辑界面中还可显示有编辑操作提示信息,也可作为新手引导的内容,如图5B中的“商品卖点默认展示5分钟后消息,单击编辑文字内容,长按可拖动位置或者删除”,以使直播对象根据编辑操作提示信息,执行针对编辑控件的触发操作,以对交互信息进行编辑,输入编辑后的交互信息。
在一种可选的实施方式中,信息编辑界面还包括时间设置控件;如图6所示,其为本申请实施例中的另一种信息编辑界面的示意图。图6中的展示时长部分即本申请实施例中所列举的一种时间设置控件,如图所示显示的展示时长为1min(分钟),基于该控件可进一步设置编辑后的交互信息的展示时长为第二设定时长,进而在达到第二设定时长后,在直播界面中关闭该交互信息的展示,即不再在直播界面中展示交互信息。
具体的,直播客户端响应于针对时间设置控件的触发操作,对编辑后的交互信息的展示时长进行设置,以使编辑后的交互信息的展示时长达到第二设定时长后,在直播界面中关闭交互信息的展示。
另外,在本申请实施例中,观众端除了可以点击商品气泡来进入资源操作界面之外,还可通过本申请实施例中的提示控件(即商品卖点贴纸)进入资源操作界面,具体可以通过一些预设操作,比如双击,在此不做具体限定。
在一种可选的实施方式中,直播客户端响应于通过直播界面中的提示控件触发的针对一个直播资源的资源操作界面的查看操作,展示资源操作界面,界面可以是浮层的形式,也可以是其他形式,在此不做具体限定,例如图7所示的商品详情页,即为本申请实施例中的一种资源操作界面,该页面是一个浮层页。在本申请实施例中,资源操作界面包括针对一个直播资源的资源详情信息,以及用于对一个直播资源进行资源交互的操作控件。如图7所示,其为本申请实施例中的一种资源操作界面的示意图,图中的型号、尺寸、数量等都属于本申请实施例中的资源详情信息,图7中的“立即下单”即本申请实施例中的操作控件,观众在这个浮层里可以选择资源详情信息(商品详情信息),然后通过操作控件下单购买。此时,直播客户端响应于通过操作控件触发的交互操作,根据选中的资源详情信息,对一个直播资源进行资源交互。
具体的,例如图7所示,观众选择的蛋糕为慕斯蛋糕,尺寸为6寸,数量为1个,在观众点击立即下单后,即可根据这些信息来进行资源交互,实现商品的售卖。
参阅图8所示,为本申请实施例提供的一种直播资源的展示方法的实施流程图,执行主体为直播服务器,该方法的具体实施流程如下:
S81:直播服务器接收到直播对象触发的直播请求后,将直播对象关联的直播视频流反馈给直播对象登录的直播客户端,以使直播客户端根据直播视频流展示直播界面,其中,直播界面用于显示直播对象的视频直播画面;以及,每检测直播对象针对一个直播资源触发的描述信息时,获取针对一个直播资源的描述信息对应的音频数据;
S82:直播服务器对音频数据进行解码,获得针对一个直播资源的交互信息,其中,交互信息包括以下至少一种:一个直播资源的资源属性信息,针对一个直播资源进行交互时的交互策略信息;
S83:直播服务器将交互信息反馈给直播客户端,以使直播客户端在直播界面中呈现交互信息。
在本申请实施例中,主播开始直播时,直播客户端会实时语音识别主播口播内容,这些内容即本申请实施例中的描述信息,直播客户端将描述信息对应的音频数据发送给直播服务器,由直播服务器将语音转文字并检测是否含商品卖点,生成相应的交互信息,返回给直播客户端进行展示。
一种可选的实施方式为,可以按照如图9所示的流程图实施S82,包括以下步骤:
S901:直播服务器对音频数据进行声学特征提取,并基于声学特征进行解码,获取与一个直播资源对应的文本信息;
S902:直播服务器提取文本信息中的关键信息,基于关键信息生成针对一个直播资源的交互信息。
需要说明的是,在开始语音识别之前,需要运用到静音切除操作技术(VAD)对声音进行分析,把主播的声音分帧,切开成一小段一小段,每小段称为一帧,帧与帧之间一般是有交叠的,如图10A所示,其为本申请实施例中的一种分帧示意图。在图10A中,把首尾端的静音切除,降低对后续步骤造成的干扰。图中,每帧的长度为25毫秒(ms),每两帧之间有25-10=15毫秒的交叠。经过分帧后,语音就变成了很多小段,根据人耳的生理特性,把每一帧波形变成一个多维向量,进行声学特征提取。
参阅图10B所示,其为本申请实施例中的一种语音转文本的方法流程示意图。其中,直播服务器可以先提取音频数据的声学特征,将提取的声学特征输入已训练的声学模型,得到提取特征后的音频数据,然后基于搜索算法在预存的字典中分别查找提取特征后的音频数据对应的文本元素,将查找到的文本元素输入已训练的语言模型,得到音频数据对应的文本信息。其中,声学模型、字典和语言模型共同组成语音解码模块,将音频数据的声学特征输入语音解码模块,即可得到语音解码模块输出的该音频数据对应的文本信息。
具体的,在本申请实施例中,由系统实时监控本场直播的商品浮层动态(指上文中的商品气泡),当商品浮层弹出来时,会自动识别浮层里的商品文案,当主播说话后,应用动态时间规整算法(DynamicTime Waplng,DTW)算法进行语音识别。在应用DTW算法进行语音识别时,就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度。
在本申请实施例中,将主播的声音匹配语言模型库,并解码生成音频数据对应的文本信息之后,需要联动大数据筛选出文本信息里面的商品卖点,进行关键信息的提取,精简其中的语气助词,进而生成精简的商品卖点文字,即本申请实施例中的交互信息。
具体的,当检测到主播的话语时,系统硬件采集音视频数据发至直播服务器,直播服务器接收到音频数据后,对音频进行解压转码,并将其匹配语言模型库进行相似度匹配,最后通过声学模型,字典,语言模型对提取特征后的音频数据进行文字输出;文字输出后,直播客户端向直播服务器请求CDN数据,直播服务器从云储存库里拉取到大数据,联动AI技术,去除口语化词汇。如:哦,吧,嗯等语气助词,生成精简的商品卖点文字。商品卖点文字生成的原理如下:
在主播开播挂上对应的商品售卖时,直播服务器会将商品的属性提取并存进云数据库,其中,商品属性包括但不限于商品昵称、价格、商品详情页卖点。当直播服务器检测到主播的话语并生成文字后,会和云数据库里的此商品数据做比对。当主播口播内容的文案和此商品的卖点数据匹配时,则会去重生成商品卖点。商品卖点分为两个部分:一个部分是商品自身属性,根据商品详情页的商品卖点和主播的口播内容生成,即本申请实施例中的资源属性信息,如:全手工制作,口感细腻。在本申请实施例中,资源属性信息是基于一个直播资源的资源操作界面的详情信息以及直播对象针对一个直播资源的描述信息生成的;另一个部分是商品营销属性,即本申请实施例中的交互策略信息,如:限时秒杀1分钟,全网低价。商品的营销属性会基于主播的口播内容生成,即本申请实施例中的交互策略信息是基于直播对象的描述信息生成的。当直播服务器检测到主播重复口播3次的内容超过1次时,直播服务器会根据内容和重复的次数做优先级判断,并得出优先级高的内容,传至直播客户端展现。比如,重复次数越高,优先级越高,或者是内容包含商品自身属性,或者是商品营销属性时,优先级较高。
在一种可选的实施方式中,将交互信息反馈给直播客户端,还包括:
在直播客户端展示交互信息的过程中,获取直播对象针对一个直播资源的新的描述信息对应的音频数据;根据新的音频数据确定的各个讲解内容,以及各个讲解内容的重复次数,获得各个讲解内容的优先级;根据各个讲解内容的优先级,选取部分讲解内容作为新的交互信息返回给直播客户端,以使直播客户端对直播界面中当前展示的交互信息进行更新。其中,主播在描述直播资源时,可以根据实际情况,将主播讲解的一句话或几句话看做是一个讲解内容。或者,也可以根据讲解时间来划分,将一段时间内的语音看做是一个讲解内容,下一时间段内的语音即可看做与上一时间段相比对应的新的讲解内容。
基于上述实施方式,可以对直播界面中当前展示的交互信息进行实时更新。例如,主播对某一商品的讲解时间很长,超过五分钟时,比如讲解了十分钟,前五分钟在讲解该商品的A属性,后五分钟在讲解该商品的B属性。该情况下,可以在前五分钟展示A属性对应的交互信息,在后五分钟,对交互信息进行替换,展示B属性对应的交互信息。或者是,在后五分钟,对交互信息进行补充,展示A属性和B属性对应的交互信息等,在此不做具体限定。
在本申请实施例中,直播服务器将检测到的商品卖点文字传到直播客户端,直播客户端会展现生成的卖点贴纸在直播间,主播可编辑、删除、拖动商品卖点贴纸等。
具体的,在生成精简版商品卖点内容后,直播服务器会把商品卖点数据传给直播客户端,直播客户端会以贴纸的形式展示在直播间,默认展示5分钟,如图3B所示。此时用户端和主播端都可以看到这个商品卖点的贴纸。如果主播针对智能生成的商品卖点内容不满意,可以编辑,拖动或者删除。整场直播过程中,直播客户端会一直监测主播的语音口播并传至直播服务器进行数据和商品数据匹配。生成的商品卖点默认展示5分钟。当5分钟内,检测到主播重复口播3次的内容超过1次时,系统会根据内容和重复的次数做优先级判断,并得出优先级高的内容,传至直播客户端展现,保证商品卖点短时间内不会一直变动内容,以免影响用户观看体验。相应的,商品卖点也会随着当前主播讲解商品的变化而变化,比如商品上架一分钟后就卖光,主播开始讲解另一个商品时,商品卖点会跟着变化。
在一种可选的实施方式中,直播界面包括用于展示交互信息的提示控件;因而,直播服务器在接收到通过针对提示控件触发的针对交互信息的编辑请求后,则会将与交互信息的信息编辑界面关联的编辑操作提示信息,反馈给的直播客户端,以使直播客户端显示信息编辑界面,并在信息编辑界面中展示编辑操作提示信息;此外,直播服务器还可获取基于信息编辑界面中的编辑控件输入的编辑后的交互信息,并将编辑后的交互信息与一个直播资源关联保存。
综上,本申请实施例中系统会基于语音识别自动识别商品的属性,在主播介绍该商品时,系统自动生成该商品的卖点,通过视觉化的方式展示在直播间。不需要主播提前准备商品的卖点宣传素材,方便不同时间进场的用户可以及时了解当前主播正在介绍的商品卖点,从而提升商品的转化率。
参阅图11所示,为本申请实施例中的一种直播客户端与直播服务器之间的交互时序图。该方法的具体实施流程如下:
步骤S1101:直播客户端响应于直播对象触发的直播操作,向直播服务器发送直播请求;
步骤S1102:直播服务器接收到直播请求后,将该直播对象关联的直播视频流反馈给直播客户端;
步骤S1103:直播客户端根据直播视频流展示直播界面;
步骤S1104:直播客户端响应于直播对象针对某一直播资源触发的描述信息,向直播服务器发送描述信息对应的音频数据;
步骤S1105:直播服务器对音频数据进行声学特征提取,并基于声学特征进行解码,获取与该直播资源对应的文本信息;
步骤S1106:直播服务器提取文本信息中的关键信息,基于关键信息生成针对该直播资源的交互信息;
步骤S1107:直播服务器将交互信息反馈给直播客户端;
步骤S1108:直播客户端在直播界面中展示该直播资源对应的交互信息;
步骤S1109:直播客户端在交互信息的展示时长超过第三设定时长后,在直播界面中关闭针对该直播资源的交互信息的展示。
需要说明的是,图11只是以展示一个直播资源的交互信息的过程为例进行举例说明的,实际上,随着直播资源的切换,交互信息也在不断变化,重复之处不再赘述。
基于相同的发明构思,本申请实施例还提供一种直播资源的展示装置。如图12所示,其为直播资源的展示装置1200的结构示意图,可以包括:
第一响应单元1201,用于响应于直播对象触发的直播操作,展示直播界面,直播界面用于显示直播对象的视频直播画面;
第二响应单元1202,用于每响应于直播对象针对一个直播资源触发的描述信息,在直播界面中,呈现基于描述信息生成的针对一个直播资源的交互信息,其中,交互信息包括以下至少一种:一个直播资源的资源属性信息,针对一个直播资源进行交互时的交互策略信息。
可选的,直播界面包括用于展示交互信息的提示控件;第二响应单元1202具体用于:
在直播界面中通过提示控件展示交互信息,并在提示控件的关联位置展示针对提示控件的第一操作提示信息,其中,第一操作提示信息用于指示:通过执行第一目标操作对提示控件进行控制;或
在直播界面中展示交互信息,并在交互信息的展示时长达到第一设定时长后,在提示控件的关联位置展示针对提示控件的第二操作提示信息,其中,第二操作提示信息用于指示:通过执行第二目标操作对交互信息进行编辑。
可选的,第二响应单元1202还用于:
在提示控件的关联位置展示针对提示控件的第一操作提示信息之后,响应于针对提示控件触发的第一目标操作,在直播界面中,根据第一目标操作对提示控件的展示位置进行更新;或
在提示控件的关联位置展示针对提示控件的第一操作提示信息之后,响应于针对提示控件触发的第一目标操作,在直播界面中删除提示控件。
可选的,第二响应单元1202还用于:
在提示控件的关联位置展示针对提示控件的第二操作提示信息之后,响应于针对提示控件触发的第二目标操作,展示针对交互信息的信息编辑界面,信息编辑界面包括编辑控件;
响应于针对编辑控件的触发操作,获取输入的编辑后的交互信息,并基于编辑后的交互信息,在直播界面中更新展示提示控件中显示的交互信息。
可选的,信息编辑界面还包括时间设置控件;装置还包括:
第三响应单元1203,用于响应于针对时间设置控件的触发操作,对编辑后的交互信息的展示时长进行设置,以使编辑后的交互信息的展示时长达到第二设定时长后,在直播界面中关闭交互信息的展示。
可选的,信息编辑界面还包括编辑操作提示信息,以使直播对象根据编辑操作提示信息,执行针对编辑控件的触发操作,以对交互信息进行编辑,输入编辑后的交互信息。
可选的,第二响应单元1202还用于:
在交互信息的展示时长超过第三设定时长后,在直播界面中关闭针对一个直播资源的交互信息的展示。
可选的,装置还包括:
第四响应单元1204,用于响应于通过直播界面中的提示控件触发的针对一个直播资源的资源操作界面的查看操作,展示资源操作界面,资源操作界面包括针对一个直播资源的资源详情信息,以及用于对一个直播资源进行资源交互的操作控件;
响应于通过操作控件触发的交互操作,根据选中的资源详情信息,对一个直播资源进行资源交互。
在本申请实施例中,提出了在直播过程中,基于直播对象针对直播资源触发的描述信息,生成针对正在直播的直播资源的交互信息,该交互信息包括资源属性信息和交互策略信息中的至少一种,基于该方法可以实时在直播界面中向观众展示直播资源对应的交互信息,无需由主播反复口播,也无需由主播事先准备好这些内容放到直播间,方便不同时间观看的用户可以及时了解当前主播正在介绍的直播资源的交互信息,可有效提高直播资源的转化率和直播效率。
基于相同的发明构思,本申请实施例还提供另一种直播资源的展示装置。
如图13所示,其为直播资源的展示装置1300的结构示意图,可以包括:
第一反馈单元1301,用于接收到直播对象触发的直播请求后,将直播对象关联的直播视频流反馈给直播对象登录的直播客户端,以使直播客户端根据直播视频流展示直播界面,其中,直播界面用于显示直播对象的视频直播画面;以及,每检测直播对象针对一个直播资源触发的描述信息时,获取针对一个直播资源的描述信息对应的音频数据;
信息获取单元1302,用于对音频数据进行解码,获得针对一个直播资源的交互信息,其中,交互信息包括以下至少一种:一个直播资源的资源属性信息,针对一个直播资源进行交互时的交互策略信息;
第二反馈单元1303,用于将交互信息反馈给直播客户端,以使直播客户端在直播界面中呈现交互信息。
可选的,信息获取单元1302具体用于:
对音频数据进行声学特征提取,并基于声学特征进行解码,获取与一个直播资源对应的文本信息;
提取文本信息中的关键信息,基于关键信息生成针对一个直播资源的交互信息。
可选的,第二反馈单元1303还用于:
在直播客户端展示交互信息的过程中,获取直播对象针对一个直播资源的新的描述信息对应的音频数据;
根据新的音频数据确定的各个讲解内容,以及各个讲解内容的重复次数,获得各个讲解内容的优先级;
根据各个讲解内容的优先级,选取部分讲解内容作为新的交互信息返回给直播客户端,以使直播客户端对直播界面中当前展示的交互信息进行更新。
可选的,交互信息包括一个直播资源的资源属性信息时,资源属性信息是基于一个直播资源的资源操作界面的详情信息以及直播对象针对一个直播资源的描述信息生成的;或
交互信息包括一个直播资源的交互策略信息时,交互策略信息是基于直播对象的描述信息生成的。
可选的,直播界面包括用于展示交互信息的提示控件;装置还包括:
第三反馈单元1304,用于接收到通过针对提示控件触发的针对交互信息的编辑请求后,将与交互信息的信息编辑界面关联的编辑操作提示信息,反馈给的直播客户端,以使直播客户端显示信息编辑界面,并在信息编辑界面中展示编辑操作提示信息;
获取基于信息编辑界面中的编辑控件输入的编辑后的交互信息,并将编辑后的交互信息与一个直播资源关联保存。
在本申请实施例中,提出了在直播过程中,基于直播对象针对直播资源触发的描述信息,生成针对正在直播的直播资源的交互信息,该交互信息包括资源属性信息和交互策略信息中的至少一种,基于该方法可以实时在直播界面中向观众展示直播资源对应的交互信息,无需由主播反复口播,也无需由主播事先准备好这些内容放到直播间,方便不同时间观看的用户可以及时了解当前主播正在介绍的直播资源的交互信息,可有效提高直播资源的转化率和直播效率。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本申请示例性实施方式的直播资源的展示方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的用于直播资源的展示装置。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器130。在该实施例中,电子设备的结构可以如图14所示,包括存储器1401,通讯模块1403以及一个或多个处理器1402。
存储器1401,用于存储处理器1402执行的计算机程序。存储器1401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器1401可以是易失性存储器(volatile memory),例如随机存取存储器(RAM);存储器1401也可以是非易失性存储器(non-volatile memory),例如只读存储器,快闪存储器(flash memory),硬盘(HDD)或固态硬盘(SSD);或者存储器1401是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1401可以是上述存储器的组合。
处理器1402,可以包括一个或多个中央处理单元(CPU)或者为数字处理单元等等。处理器1402,用于调用存储器1401中存储的计算机程序时实现上述直播资源的展示方法。
通讯模块1403用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器1401、通讯模块1403和处理器1402之间的具体连接介质。本公开实施例在图14中以存储器1401和处理器1402之间通过总线1404连接,总线1404在图14中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1404可以分为地址总线、数据总线、控制总线等。为便于表示,图14中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1401中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的直播资源的展示方法。处理器1402用于执行上述的直播资源的展示方法,如图8所示。
在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图15所示,包括:通信组件1510、存储器1520、显示单元1530、摄像头1540、传感器1550、音频电路1560、蓝牙模块1570、处理器1580等部件。
通信组件1510用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助用户收发信息。
存储器1520可用于存储软件程序及数据。处理器1580通过运行存储在存储器1520的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器1520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1520存储有使得终端设备110能运行的操作系统。本申请中存储器1520可以存储操作系统及各种应用程序,还可以存储执行本申请实施例直播资源的展示方法的代码。
显示单元1530还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(GUI)。具体地,显示单元1530可以包括设置在终端设备110正面的显示屏1532。其中,显示屏1532可以采用液晶显示器、发光二极管等形式来配置。显示单元1530可以用于显示本申请实施例中的应用操作界面120。
显示单元1530还可用于接收输入的数字或字符信息,产生与终端设备110的用户设置以及功能控制有关的信号输入,具体地,显示单元1530可以包括设置在终端设备110正面的触摸屏1531,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
其中,触摸屏1531可以覆盖在显示屏1532之上,也可以将触摸屏1531与显示屏1532集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元1530可以显示应用程序以及对应的操作步骤。
摄像头1540可用于捕获静态图像,用户可以将摄像头1540拍摄的图像通过直播客户端发送给聊天对方的用户。摄像头1540可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(CCD)或互补金属氧化物半导体(CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器1580转换成数字图像信号。
终端设备还可以包括至少一种传感器1550,比如加速度传感器1551、距离传感器1552、指纹传感器1553、温度传感器1554。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路1560、扬声器1561、传声器1562可提供用户与终端设备110之间的音频接口。音频电路1560可将接收到的音频数据转换后的电信号,传输到扬声器1561,由扬声器1561转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器1562将收集的声音信号转换为电信号,由音频电路1560接收后转换为音频数据,再将音频数据输出至通信组件1510以发送给比如另一终端设备110,或者将音频数据输出至存储器1520以便进一步处理。
蓝牙模块1570用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块1570与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器1580是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1520内的软件程序,以及调用存储在存储器1520内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器1580可包括一个或多个处理单元;处理器1580还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器1580中。本申请中处理器1580可以运行操作系统、应用程序、用户界面显示及触控响应,以及本申请实施例的直播资源的展示方法,例如图2所示的直播资源的展示方法。另外,处理器1580与显示单元1530耦接。
在一些可能的实施方式中,本申请提供的直播资源的展示方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的直播资源的展示方法中的步骤,例如,计算机设备可以执行如图2或图8中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种直播资源的展示方法,其特征在于,该方法包括:
响应于直播对象触发的直播操作,展示直播界面,所述直播界面用于显示所述直播对象的视频直播画面;
每响应于所述直播对象针对一个直播资源触发的描述信息,在所述直播界面中,呈现基于所述描述信息生成的针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息。
2.如权利要求1所述的方法,其特征在于,所述直播界面包括用于展示所述交互信息的提示控件;所述在所述直播界面中,基于所述描述信息,生成并呈现所述一个直播资源的交互信息,还包括:
在所述直播界面中通过所述提示控件展示所述交互信息,并在所述提示控件的关联位置展示针对所述提示控件的第一操作提示信息,其中,所述第一操作提示信息用于指示:通过执行第一目标操作对所述提示控件进行控制;或
在所述直播界面中展示所述交互信息,并在所述交互信息的展示时长达到第一设定时长后,在所述提示控件的关联位置展示针对所述提示控件的第二操作提示信息,其中,所述第二操作提示信息用于指示:通过执行第二目标操作对所述交互信息进行编辑。
3.如权利要求2所述的方法,其特征在于,所述在所述提示控件的关联位置展示针对所述提示控件的第一操作提示信息之后,还包括:
响应于针对所述提示控件触发的第一目标操作,在所述直播界面中,根据所述第一目标操作对所述提示控件的展示位置进行更新;或
响应于针对所述提示控件触发的第一目标操作,在所述直播界面中删除所述提示控件。
4.如权利要求2所述的方法,其特征在于,所述在所述提示控件的关联位置展示针对所述提示控件的第二操作提示信息之后,还包括:
响应于针对所述提示控件触发的第二目标操作,展示针对所述交互信息的信息编辑界面,所述信息编辑界面包括编辑控件;
响应于针对所述编辑控件的触发操作,获取输入的编辑后的交互信息,并基于所述编辑后的交互信息,在所述直播界面中更新展示所述提示控件中显示的交互信息。
5.如权利要求4所述的方法,其特征在于,所述信息编辑界面还包括时间设置控件;所述方法还包括:
响应于针对所述时间设置控件的触发操作,对所述编辑后的交互信息的展示时长进行设置,以使所述编辑后的交互信息的展示时长达到第二设定时长后,在所述直播界面中关闭所述交互信息的展示。
6.如权利要求4所述的方法,其特征在于,所述信息编辑界面还包括编辑操作提示信息,以使所述直播对象根据所述编辑操作提示信息,执行针对所述编辑控件的触发操作,以对所述交互信息进行编辑,输入所述编辑后的交互信息。
7.如权利要求1~6任一项所述的方法,其特征在于,所述方法还包括:
在所述交互信息的展示时长超过第三设定时长后,在所述直播界面中关闭针对所述一个直播资源的交互信息的展示。
8.如权利要求2~6任一项所述的方法,其特征在于,所述方法还包括:
响应于通过所述直播界面中的提示控件触发的针对所述一个直播资源的资源操作界面的查看操作,展示所述资源操作界面,所述资源操作界面包括针对所述一个直播资源的资源详情信息,以及用于对所述一个直播资源进行资源交互的操作控件;
响应于通过所述操作控件触发的交互操作,根据选中的资源详情信息,对所述一个直播资源进行资源交互。
9.一种直播资源的展示方法,其特征在于,该方法包括:
接收到直播对象触发的直播请求后,将所述直播对象关联的直播视频流反馈给所述直播对象登录的直播客户端,以使所述直播客户端根据所述直播视频流展示直播界面,其中,所述直播界面用于显示所述直播对象的视频直播画面;以及,每检测所述直播对象针对一个直播资源触发的描述信息时,获取针对所述一个直播资源的描述信息对应的音频数据;
对所述音频数据进行解码,获得针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息;
将所述交互信息反馈给所述直播客户端,以使所述直播客户端在所述直播界面中呈现所述交互信息。
10.如权利要求9所述的方法,其特征在于,所述对所述音频数据进行解码,获得针对所述一个直播资源的交互信息,包括:
对所述音频数据进行声学特征提取,并基于所述声学特征进行解码,获取与所述一个直播资源对应的文本信息;
提取所述文本信息中的关键信息,基于所述关键信息生成针对所述一个直播资源的交互信息。
11.如权利要求9或10所述的方法,其特征在于,所述将所述交互信息反馈给所述直播客户端,还包括:
在所述直播客户端展示所述交互信息的过程中,获取所述直播对象针对所述一个直播资源的新的描述信息对应的音频数据;
根据所述新的音频数据确定的各个讲解内容,以及所述各个讲解内容的重复次数,获得所述各个讲解内容的优先级;
根据所述各个讲解内容的优先级,选取部分讲解内容作为新的交互信息返回给所述直播客户端,以使所述直播客户端对所述直播界面中当前展示的交互信息进行更新。
12.一种直播资源的展示装置,其特征在于,包括:
第一响应单元,用于响应于直播对象触发的直播操作,展示直播界面,所述直播界面用于显示所述直播对象的视频直播画面;
第二响应单元,用于每响应于所述直播对象针对一个直播资源触发的描述信息,在所述直播界面中,呈现基于所述描述信息生成的针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息。
13.一种直播资源的展示装置,其特征在于,包括:
第一反馈单元,用于接收到直播对象触发的直播请求后,将所述直播对象关联的直播视频流反馈给所述直播对象登录的直播客户端,以使所述直播客户端根据所述直播视频流展示直播界面,其中,所述直播界面用于显示所述直播对象的视频直播画面;以及,每检测所述直播对象针对一个直播资源触发的描述信息时,获取针对所述一个直播资源的描述信息对应的音频数据;
信息获取单元,用于对所述音频数据进行解码,获得针对所述一个直播资源的交互信息,其中,所述交互信息包括以下至少一种:所述一个直播资源的资源属性信息,针对所述一个直播资源进行交互时的交互策略信息;
第二反馈单元,用于将所述交互信息反馈给所述直播客户端,以使所述直播客户端在所述直播界面中呈现所述交互信息。
14.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~8中任一所述方法的步骤或权利要求9~11中任一所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,其包括程序代码,当程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行权利要求1~8中任一所述方法的步骤或权利要求9~11中任一所述方法的步骤。
CN202110370815.9A 2021-04-07 2021-04-07 一种直播资源的展示方法、装置、电子设备和存储介质 Pending CN115167733A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110370815.9A CN115167733A (zh) 2021-04-07 2021-04-07 一种直播资源的展示方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110370815.9A CN115167733A (zh) 2021-04-07 2021-04-07 一种直播资源的展示方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN115167733A true CN115167733A (zh) 2022-10-11

Family

ID=83476322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110370815.9A Pending CN115167733A (zh) 2021-04-07 2021-04-07 一种直播资源的展示方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115167733A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116456162A (zh) * 2023-06-15 2023-07-18 北京达佳互联信息技术有限公司 一种直播间对象显示方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116456162A (zh) * 2023-06-15 2023-07-18 北京达佳互联信息技术有限公司 一种直播间对象显示方法、装置、电子设备及存储介质
CN116456162B (zh) * 2023-06-15 2023-10-27 北京达佳互联信息技术有限公司 一种直播间对象显示方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110634483B (zh) 人机交互方法、装置、电子设备及存储介质
JP7418526B2 (ja) 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード
CN109618181B (zh) 直播交互方法及装置、电子设备、存储介质
CN110460872B (zh) 视频直播的信息显示方法、装置、设备和存储介质
US20200126566A1 (en) Method and apparatus for voice interaction
CN112399258B (zh) 直播回放视频生成播放方法、装置、存储介质及电子设备
CN112040263A (zh) 视频处理方法、视频播放方法、装置、存储介质和设备
CN114401438B (zh) 虚拟数字人的视频生成方法及装置、存储介质、终端
US20190340200A1 (en) Multi-modal interaction between users, automated assistants, and other computing services
JP2020034895A (ja) 応答方法及び装置
CN110602516A (zh) 基于视频直播的信息交互方法、装置及电子设备
CN109474843A (zh) 语音操控终端的方法、客户端、服务器
CN113392201A (zh) 信息交互方法、装置、电子设备、介质和程序产品
CN111601145A (zh) 基于直播的内容展示方法、装置、设备及存储介质
CN113923462A (zh) 视频生成、直播处理方法、设备和可读介质
JP2023552854A (ja) ヒューマンコンピュータインタラクション方法、装置、システム、電子機器、コンピュータ可読媒体及びプログラム
KR20220129989A (ko) 아바타에 기초한 인터랙션 서비스 방법 및 장치
CN112182196A (zh) 应用于多轮对话的服务设备及多轮对话方法
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
CN115167733A (zh) 一种直播资源的展示方法、装置、电子设备和存储介质
CN116737883A (zh) 人机交互方法、装置、设备及存储介质
CN113542797A (zh) 视频播放中的互动方法、装置及计算机可读存储介质
CN112948662A (zh) 一种推荐方法、装置和用于推荐的装置
US20220301250A1 (en) Avatar-based interaction service method and apparatus
CN113763925B (zh) 语音识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40075346

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination