CN113766257A - 直播数据的处理方法、装置 - Google Patents

直播数据的处理方法、装置 Download PDF

Info

Publication number
CN113766257A
CN113766257A CN202110580269.1A CN202110580269A CN113766257A CN 113766257 A CN113766257 A CN 113766257A CN 202110580269 A CN202110580269 A CN 202110580269A CN 113766257 A CN113766257 A CN 113766257A
Authority
CN
China
Prior art keywords
live
topic
topics
target
live broadcast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110580269.1A
Other languages
English (en)
Other versions
CN113766257B (zh
Inventor
董炎辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110580269.1A priority Critical patent/CN113766257B/zh
Publication of CN113766257A publication Critical patent/CN113766257A/zh
Application granted granted Critical
Publication of CN113766257B publication Critical patent/CN113766257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Computer Graphics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请的实施例提供了一种直播数据的处理方法、装置,涉及人工智能及自然语言处理技术领域。该方法包括:获取直播间实时产生的目标互动消息;确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,并根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题;对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度;基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。本申请实施例的技术方案可以提高在直播间确定热门直播话题的准确性。

Description

直播数据的处理方法、装置
技术领域
本申请涉及人工智能及自然语言处理技术领域,具体而言,涉及一种直播数据的处理方法、装置。
背景技术
目前,直播间的互动消息成为了主播和观众沟通的主要方式,理想情况下,主播可以通过互动消息判断当前直播间热门的直播话题。然而,互动消息的形式繁多且数量庞大,使得主播无法关注全部的互动消息,由此导致无法准确判断当前直播间热门的直播话题,基于此,如何能够提高在直播间确定热门直播话题的准确性是亟待解决的技术问题。
发明内容
本申请的实施例提供了一种直播数据的处理方法、装置、计算机程序产品或计算机程序、计算机可读介质及电子设备,进而至少在一定程度上可以提高在直播间确定热门直播话题的准确性。
本申请的其它特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种直播数据的处理方法,所述方法包括:获取直播间实时产生的目标互动消息;确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,并根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题;对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度;基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。
根据本申请实施例的一个方面,提供了一种直播数据的处理装置,所述装置包括:获取单元,被用于获取直播间实时产生的目标互动消息;第一确定单元,被用于确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,并根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题;增加单元,被用于对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度;第二确定单元,被用于基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。
在本申请的一些实施例中,基于前述方案,所述第一确定单元包括:转化单元,被用于对所述目标互动消息进行特征转化,得到所述目标互动消息的特征数据;计算单元,被用于基于所述目标互动消息的特征数据,以及所述多个直播话题中所包含的历史互动消息的特征数据,计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度,以将所述相似度作为所述关联强度。
在本申请的一些实施例中,基于前述方案,所述计算单元配置为:在所述目标互动消息的数量级超过第一预定阈值时,将所述目标互动消息分发至至少两个计算模块,以由所述至少两个计算模块计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度。
在本申请的一些实施例中,基于前述方案,所述增加单元配置为:将所述目标互动消息与所述目标互动消息所属直播话题中所包含的历史互动消息之间的相似度作为增加值,并在所述目标互动消息所属的直播话题的热度值的基础上增加所述增加值。
在本申请的一些实施例中,基于前述方案,所述第一确定单元配置为:在所述目标互动消息与多个直播话题中的至少一个直播话题所包含的历史互动消息之间的关联强度大于第二预定阈值时,将所述至少一个直播话题确定为所述目标互动消息所属的直播话题;在所述目标互动消息与多个直播话题所包含的历史互动消息之间的关联强度均小于或等于第二预定阈值时,为所述目标互动消息生成新的直播话题,并将所述新的直播话题确定为所述目标互动消息所属的直播话题。
在本申请的一些实施例中,基于前述方案,所述直播间中用户发出的互动消息存储在分布式存储系统,所述分布式存储系统还存储有所述直播间中用户发出的互动消息的属性数据,所述属性数据包括互动消息所属的直播话题,以及在直播间发送所述互动消息的用户;所述装置还包括:写入单元,被用于在根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题之后,将所述目标互动消息及其属性数据写入至分布式存储系统的主机节点,并由所述主机节点将所述目标互动消息及其属性数据同步至所述分布式存储系统的备用机节点,所述备用机节点用于读取所述目标互动消息及其属性数据,以及历史互动消息及其属性数据。
在本申请的一些实施例中,基于前述方案,所述写入单元配置为:将所述目标互动消息及其属性数据划分为至少两个批次;分批将所述至少两个批次的目标互动消息及其属性数据写入至分布式存储系统的主机节点。
在本申请的一些实施例中,基于前述方案,所述第二确定单元配置为:按照所述更新热度值从大到小的顺序,对所述多个直播话题进行排序;将排序靠前的预定数量的直播话题确定为热门直播话题。
在本申请的一些实施例中,基于前述方案,所述装置还包括:读取单元,被用于在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,读取所述直播间中在线用户发出的互动消息,所述在线用户发出的互动消息包括所述在线用户发出的目标互动消息和所述在线用户发出的历史互动消息;第三确定单元,被用于基于所述在线用户发出的互动消息所属的直播话题,确定所述在线用户感兴趣的兴趣话题;合并单元,被用于将所述兴趣话题合并至已确定的热门直播话题中,得到新的热门直播话题。
在本申请的一些实施例中,基于前述方案,所述装置还包括:推荐单元,被用于在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,针对所述热门直播话题生成相适应的直播素材;将所述直播素材推荐至直播界面,以供所述直播间的主播用户进行选择。
在本申请的一些实施例中,基于前述方案,所述装置还包括:展示单元,被用于在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,在显示直播界面时,获取所述热门直播话题,并生成热门直播话题列表;在检测到针对所述热门直播话题列表的触发指令时,在所述直播界面展示所述热门直播话题列表。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中所述的直播数据的处理方法。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的直播数据的处理方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的直播数据的处理方法。
在本申请一些实施例所提供的技术方案中,基于直播间实时产生的目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,从多个直播话题中确定所述目标互动消息所属的直播话题,并增加所述目标互动消息所属的直播话题的用于表征直播话题的热门程度的热度值,得到更新热度值,最后根据所述更新热度值从所述多个直播话题中确定热门直播话题。一方面,参考直播间实时产生的目标互动消息所属的直播话题来确定直播间的热门直播话题,可以保证热门直播话题在确定过程中具有充分的依据,另一方面,通过用于表征直播话题的热门程度的更新热度值来确定热门直播话题,可以提高在直播间确定热门直播话题的准确性,进一步的,热门直播话题的确定,能够提高直播间的互动效果,降低了在直播过程中对资源的浪费。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。在附图中:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图2示出了根据本申请一个实施例的直播数据的处理方法的流程图;
图3示出了根据本申请一个实施例的确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度的细节流程图;
图4示出了根据本申请一个实施例的处理弹幕数据的细节流程图;
图5示出了根据本申请一个实施例的将所述目标互动消息及其属性数据写入至分布式存储系统的主机节点的细节流程图;
图6示出了根据本申请一个实施例的存储目标互动消息及其属性数据的模型架构图;
图7示出了根据本申请一个实施例的从所述多个直播话题中确定热门直播话题的细节流程图;
图8示出了根据本申请一个实施例的在从所述多个直播话题中确定热门直播话题之后的方法流程图;
图9示出了根据本申请一个实施例的在从所述多个直播话题中确定热门直播话题之后的方法流程图;
图10示出了根据本申请一个实施例的在从所述多个直播话题中确定热门直播话题之后的方法流程图;
图11示出了根据本申请一个实施例的在直播界面触发展示热门直播话题列表的界面图;
图12示出了根据本申请一个实施例的弹幕数据处理的系统组成图;
图13示出了根据本申请一个实施例的直播数据的处理装置的框图;
图14示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
需要注意的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的对象在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在图示或描述的那些以外的顺序实施。
本申请中的实施例有涉及到关于人工智能的技术,即通过人工智能实现了对直播数据的智能化处理。人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构可以包括终端设备101和103(其中,智能终端可以是智能手机、平板电脑和便携式计算机中的一种或多种)、网络104和服务器102。网络104用以在终端设备和服务器102之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
在本申请的一个实施例中,终端设备101可以对应主播所在的客户端,终端设备103则可以对应观众所在的客户端,具体的,终端设备101可以将直播视频,互动文本等互动消息通过网络104发送到服务器102,服务器102再将直播视频,互动文本等互动消息通过网络104发送到终端设备103,以供观众观看,反过来,观众也可以通过终端设备103输入聊天文本、评论,以及弹幕等互动消息,并由终端设备103将聊天文本、评论,以及弹幕等互动消息通过网络104发送到服务器102,再由服务器102将聊天文本、评论,以及弹幕等互动消息通过网络104发送到终端设备101,以供主播读取。
在本实施例中,可以由服务器102获取直播间实时产生的目标互动消息,并确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,再根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题,然后,服务器102对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度,最后,服务器102基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。
需要说明的是,这里的目标互动消息可以是指在直播过程中当前产生的互动消息。
本申请应用于直播过程中热门话题的生产场景,通过为各个直播话题确定热度值,能够提高在直播间确定热门直播话题的准确性。
需要说明的是,本申请实施例所提供的直播数据的处理方法可以由服务器102执行,相应地,直播数据的处理装置一般设置于服务器102中。但是,在本申请的其它实施例中,终端设备也可以与服务器具有相似的功能,从而执行本申请实施例所提供的直播数据的处理方案。
还需要说明的是,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备也可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此,本申请在此不做限制。
需要解释的是,如上所述的云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展。通过建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图2示出了根据本申请一个实施例的直播数据的处理方法的流程图,该直播数据的处理方法可以由具有计算处理功能的设备来执行,比如可以由图1中所示的服务器102来执行。参照图2所示,该直播数据的处理方法至少包括步骤210至步骤270,详细介绍如下:
在步骤210中,获取直播间实时产生的目标互动消息。
在本申请中,目标互动消息可以是指直播间中在当前实时产生的互动消息,例如,在直播当时最近5秒内产生的互动消息,与目标互动消息相对应的,可以是历史互动消息,例如,在5秒之前产生的互动消息。
需要说明的是,目标互动消息在数量上可以是一条,也可以是多条,例如,在观众数量较多的直播间,1秒内产生的互动消息可能就有千万条。
在步骤230中,确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,并根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题。
在本申请中,直播话题可以是指直播间中互动的一个主题,例如以“深圳旅游”为主题的互动,以“重庆美食”为主题的互动等等。其中,每一条互动消息都可以被归纳至一个或者多个直播话题中。
在本申请中,目标互动消息与历史互动消息之间的关联强度,可以是二者在某一个话题上的接近程度,例如,目标互动消息“好想去深圳看海啊”和历史互动消息“深圳的海岸特别美”在“深圳旅游”的话题中十分接近,若在事先知道历史互动消息“深圳的海岸特别美”属于“深圳旅游”话题,那么可以推测目标互动消息“好想去深圳看海啊”也属于“深圳旅游”话题。
在步骤250中,对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度。
在本申请中,若确定了目标互动消息所属的直播话题,则增加该直播话题的热度值,可以理解的是,某一个直播话题下的互动消息数量越多,则该直播话题的热度值也就越高。
在步骤270中,基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。
在步骤230的一个实施例中,确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,可以按照如图3所示的步骤执行。
参照图3,示出了根据本申请一个实施例的确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度的细节流程图。具体包括步骤231至步骤232:
步骤231,对所述目标互动消息进行特征转化,得到所述目标互动消息的特征数据。
步骤232,基于所述目标互动消息的特征数据,以及所述多个直播话题中所包含的历史互动消息的特征数据,计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度,以将所述相似度作为所述关联强度。
在本申请中,目标互动消息实质上是文本数据,因此在步骤231中,对所述目标互动消息进行特征转化,可以是将目标互动消息转化为向量的表示,得到向量数据(即特征数据)。具体的,可以是对目标互动消息进行分词,然后得到词向量。
可以理解的是,历史互动消息也可以对应有特征数据(即向量数据),因此,目标互动消息与历史互动消息之间相似度的计算,可以通过计算余弦相似度来实现,具体的,例如,目标互动消息对应的特征数据为A=(A1,A2,A3,…,An),历史互动消息对应的特征数据为B=(B1,B2,B3,…,Bn),那么目标互动消息与历史互动消息之间相似度可以通过如下公式计算:
Figure BDA0003085793690000101
其中,Similarity表示目标互动消息与历史互动消息之间的相似度,Ai和Bi分别表示向量A和向量B的各个分量。
在本实施例中,已确定的直播话题一般为多个,其中,每一个直播话题下对应有多条历史互动消息,在计算目标互动消息与历史互动消息之间的相似度时,针对于每一直播话题,可以只计算目标互动消息与该直播话题下一条历史互动消息之间的相似度。例如,直播话题N下包括历史互动消息n1、n2、n3以及n4,对于目标互动消息M,在计算目标互动消息M与直播话题N下历史互动消息之间的相似度时,可以只计算目标互动消息M与历史互动消息n1之间的相似度,而历史互动消息n2、n3以及n4可以不用参与相似度计算。
在本实施例中,在所述目标互动消息的数量级超过第一预定阈值时,步骤232中的计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度,具体可以是将所述目标互动消息分发至至少两个计算模块,以由所述至少两个计算模块计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度。
具体的,例如,第一预定阈值设为10000条,当所述目标互动消息的数量级超过这个值时,则说明目标互动消息的数量级过大,在这种情况下,通过将所述目标互动消息分发至至少两个计算模块进行相似度计算,即将计算任务分摊到不同的计算模块上,可以缓解系统的计算压力,防止系统崩溃,同时也能提高计算效率。
在步骤230的一个实施例中,根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题,可以包括两种情况:
第一种情况是,在所述目标互动消息与多个直播话题中的至少一个直播话题所包含的历史互动消息之间的关联强度大于第二预定阈值时,将所述至少一个直播话题确定为所述目标互动消息所属的直播话题。
第二种情况是,在所述目标互动消息与多个直播话题所包含的历史互动消息之间的关联强度均小于或等于第二预定阈值时,为所述目标互动消息生成新的直播话题,并将所述新的直播话题确定为所述目标互动消息所属的直播话题。
在本申请中,所述目标互动消息与历史互动消息的关联强度越高,则说明目标互动消息越靠近历史互动消息所属的直播话题,当关联强度超过第二阈值时(例如60%),则可以认为目标互动消息与历史互动消息具有相同的所属直播话题。
在本申请中,应该理解的是,目标互动消息可以具有多个不同的所属直播话题。
为了使本领域技术人员更好的理解本实施例,下面将以互动消息为弹幕来作为示例,通过图4进行简单说明:
参照图4,示出了根据本申请一个实施例的处理弹幕数据的细节流程图,包括步骤401至步骤406,具体如下:
步骤401,开始。
步骤402,弹幕相似度计算。
步骤403,判断是否有与弹幕所属话题相似的话题,若是,则执行步骤404,若否,则执行步骤405.
步骤404,话题热度值加上相似度,然后执行步骤406。
步骤405,形成新的话题,然后执行步骤406。
步骤406,结束。
在本申请中,所述直播间中用户发出的互动消息可以存储在分布式存储系统,所述分布式存储系统还可以存储有所述直播间中用户发出的互动消息的属性数据,所述属性数据包括互动消息所属的直播话题,以及在直播间发送所述互动消息的用户。
在步骤230的一个实施例中,在根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题之后,可以将所述目标互动消息及其属性数据写入至分布式存储系统的主机节点,并由所述主机节点将所述目标互动消息及其属性数据同步至所述分布式存储系统的备用机节点,所述备用机节点用于读取所述目标互动消息及其属性数据,以及历史互动消息及其属性数据。
在本实施例中,将所述目标互动消息及其属性数据写入至分布式存储系统的主机节点可以按照如图5所示的步骤执行:
参照图5,示出了根据本申请一个实施例的将所述目标互动消息及其属性数据写入至分布式存储系统的主机节点的细节流程图。具体包括步骤241至步骤242:
步骤241,将所述目标互动消息及其属性数据划分为至少两个批次。
步骤242,分批将所述至少两个批次的目标互动消息及其属性数据写入至分布式存储系统的主机节点。
例如,包括1,2,3,……,10000共10000条目标互动消息及其属性数据,可以将这10000条目标互动消息及其属性数据划分为4个批次,分别为1至2500条,2501至5000条,5001至7500条,7501至10000条,再将这4个批次的目标互动消息及其属性数据依次写入至分布式存储系统的主机节点。可以理解的是,分批将互动消息及其属性数据写入主机节点可以有效缓解写入数据的压力,保证数据写入过程中的稳定性。
为了使本领域技术人员更好的理解本实施例,下面将通过图6进行简单说明:
参照图6,示出了根据本申请一个实施例的存储目标互动消息及其属性数据的模型架构图。
如图6所示,将目标互动消息及其属性数据写入主机节点602,由主机节点602将目标互动消息及其属性数据同步至备用机节点1至备用机节点n,并从备用机节点1至备用机节点n中读取目标互动消息及其属性数据。
在本实施例中,所述主机节点,以及所述备用机节点均可以设置为Redis数据库来存储互动消息及其属性数据,具体的,本申请通过采用Redis数据库的主备分离的策略,将所有的读数据请求分担到备用机节点,主机节点只负责写入数据,可以极大保证存储系统的稳定性。
在步骤250的一个实施例中,对所述目标互动消息所属的直播话题的热度值进行增加处理,具体可以是将所述目标互动消息与所述目标互动消息所属直播话题中所包含的历史互动消息之间的相似度作为增加值,在所述目标互动消息所属的直播话题的热度值的基础上增加所述增加值。
例如,目标互动消息A与某直播话题中所包含的历史互动消息之间的相似度为0.9,即可以表明目标互动消息A属于该直播话题,为此,则可以在该直播话题现有热度值的基础上增加0.9。在步骤250的另一个实施例中,对所述目标互动消息所属的直播话题的热度值进行增加处理,也可以是将一个固定值作为增加值,在所述目标互动消息所属的直播话题的热度值的基础上增加所述固定值,例如,增加固定值“1”。
在步骤270的一个实施例中,基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题,可以按照如图7所示的步骤执行。
参照图7,示出了根据本申请一个实施例的从所述多个直播话题中确定热门直播话题的细节流程图。具体包括步骤271至步骤272:
步骤271,按照所述更新热度值从大到小的顺序,对所述多个直播话题进行排序。
步骤272,将排序靠前的预定数量的直播话题确定为热门直播话题。
在步骤270之后的一个实施例中,即在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,可以执行如图8所示的步骤。
参见图8,示出了根据本申请一个实施例的在从所述多个直播话题中确定热门直播话题之后的方法流程图。具体包括步骤281至步骤283:
步骤281,读取所述直播间中在线用户发出的互动消息,所述在线用户发出的互动消息包括所述在线用户发出的目标互动消息和所述在线用户发出的历史互动消息。
步骤282,基于所述在线用户发出的互动消息所属的直播话题,确定所述在线用户感兴趣的兴趣话题。
步骤283,将所述兴趣话题合并至已确定的热门直播话题中,得到新的热门直播话题。
在本实施例中,读取所述直播间中在线用户发出的互动消息,可以是通过直播间的房间号从Redis数据库读取。
在本申请中,通过将在线用户的兴趣话题合并至已确定的热门直播话题中,得到新的热门直播话题,可以增强热门直播话题的完整性,提高用户体验。
在步骤270之后的一个实施例中,即在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,还可以执行如图9所示的步骤。
参见图9,示出了根据本申请一个实施例的在从所述多个直播话题中确定热门直播话题之后的方法流程图。具体包括步骤291至步骤292:
步骤291,针对所述热门直播话题生成相适应的直播素材。
步骤292,将所述直播素材推荐至直播界面,以供所述直播间的主播用户进行选择。
在本申请中,针对热门直播话题,通过提供相应的素材,可以供直播间讨论,从而进一步提高直播间的互动效果,降低直播过程中资源的耗费。
在步骤270之后的一个实施例中,即在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,还可以执行如图10所示的步骤。
参见图10,示出了根据本申请一个实施例的在从所述多个直播话题中确定热门直播话题之后的方法流程图。具体包括步骤293至步骤294:
步骤293,在显示直播界面时,获取所述热门直播话题,并生成热门直播话题列表。
步骤294,在检测到针对所述热门直播话题列表的触发指令时,在所述直播界面展示所述热门直播话题列表。
为了使本领域技术人员更好的理解本实施例,下面将通过图11说明本申请技术方案的一种应用场景,即在直播平台,运用本申请技术方案为用户提供热门直播话题列表。
具体的,如图11,示出了根据本申请一个实施例的在直播界面触发展示热门直播话题列表的界面图。
如图11所示的直播界面1101中,在确定所述热门直播话题列表,并在检测到针对所述热门直播话题列表的触发指令时,例如点击在直播界面1101中显示的“话题列表”图标1102时,输出所述热门直播话题列表中的热门直播话题。需要说明的是,直播界面的设置不限于图11所示的那样,“话题列表”图标在直播界面中的位置也可任意设置。
在一种情况下,直播界面中可以包括显示有热门直播话题列表的控件,当用户点击该控件时,触发输出所述热门直播话题列表中的热门直播话题的指令。
在另外一种情况下,直播界面中可以不包括显示有热门直播话题列表的控件。
在此情况下,可以是在直播间当前的互动消息数量低于预定阈值时,触发输出所述热门直播话题列表中的热门直播话题的指令。
在本实施例中,在输出所述热门直播话题列表中的热门直播话题的过程中,可以是输出所述热门直播话题列表中的全部热门直播话题,也可以是输出所述热门直播话题列表中的部分热门直播话题。
为了使本领域技术人员更好的理解本申请,下面将以互动消息为弹幕来作为示例,通过图12对弹幕数据处理的系统组成进行简单说明:
参见图12,示出了根据本申请一个实施例的弹幕数据处理的系统组成图。
如图12所示,弹幕数据处理的系统组成包括四个部分,其中,弹幕识别系统1201,主要用于对弹幕进行分词和特征转换;弹幕归类系统1202,主要用于对弹幕所属的话题进行归类;存储节点1204,可以是Redis等开源数据库,主要用于存储弹幕及其属性数据;话题生成系统1203,主要用于根据各个弹幕所属的话题生成热点直播话题。
在本申请一些实施例所提供的技术方案中,基于直播间实时产生的目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,从多个直播话题中确定所述目标互动消息所属的直播话题,并增加所述目标互动消息所属的直播话题的用于表征直播话题的热门程度的热度值,得到更新热度值,最后根据所述更新热度值从所述多个直播话题中确定热门直播话题。一方面,参考直播间实时产生的目标互动消息所属的直播话题来确定直播间的热门直播话题,可以保证热门直播话题在确定过程中具有充分的依据,另一方面,通过用于表征直播话题的热门程度的更新热度值来确定热门直播话题,可以提高在直播间确定热门直播话题的准确性,进一步的,热门直播话题的确定,能够提高直播间的互动效果,降低了在直播过程中对资源的浪费。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的直播数据的处理方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的直播数据的处理方法的实施例。
图13示出了根据本申请的一个实施例的直播数据的处理装置的框图。
参照图13所示,根据本申请的一个实施例的直播数据的处理装置1300,包括:获取单元1301、第一确定单元1302、增加单元1303和第二确定单元1304。
其中,获取单元1301,被用于获取直播间实时产生的目标互动消息;第一确定单元1302,被用于确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,并根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题;增加单元1303,被用于对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度;第二确定单元1304,被用于基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。
在本申请的一些实施例中,基于前述方案,所述第一确定单元1302包括:转化单元,被用于对所述目标互动消息进行特征转化,得到所述目标互动消息的特征数据;计算单元,被用于基于所述目标互动消息的特征数据,以及所述多个直播话题中所包含的历史互动消息的特征数据,计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度,以将所述相似度作为所述关联强度。
在本申请的一些实施例中,基于前述方案,所述计算单元配置为:在所述目标互动消息的数量级超过第一预定阈值时,将所述目标互动消息分发至至少两个计算模块,以由所述至少两个计算模块计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度。
在本申请的一些实施例中,基于前述方案,所述增加单元1303配置为:将所述目标互动消息与所述目标互动消息所属直播话题中所包含的历史互动消息之间的相似度作为增加值,并在所述目标互动消息所属的直播话题的热度值的基础上增加所述增加值。
在本申请的一些实施例中,基于前述方案,所述第一确定单元1302配置为:在所述目标互动消息与多个直播话题中的至少一个直播话题所包含的历史互动消息之间的关联强度大于第二预定阈值时,将所述至少一个直播话题确定为所述目标互动消息所属的直播话题;在所述目标互动消息与多个直播话题所包含的历史互动消息之间的关联强度均小于或等于第二预定阈值时,为所述目标互动消息生成新的直播话题,并将所述新的直播话题确定为所述目标互动消息所属的直播话题。
在本申请的一些实施例中,基于前述方案,所述直播间中用户发出的互动消息存储在分布式存储系统,所述分布式存储系统还存储有所述直播间中用户发出的互动消息的属性数据,所述属性数据包括互动消息所属的直播话题,以及在直播间发送所述互动消息的用户;所述装置还包括:写入单元,被用于在根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题之后,将所述目标互动消息及其属性数据写入至分布式存储系统的主机节点,并由所述主机节点将所述目标互动消息及其属性数据同步至所述分布式存储系统的备用机节点,所述备用机节点用于读取所述目标互动消息及其属性数据,以及历史互动消息及其属性数据。
在本申请的一些实施例中,基于前述方案,所述写入单元配置为:将所述目标互动消息及其属性数据划分为至少两个批次;分批将所述至少两个批次的目标互动消息及其属性数据写入至分布式存储系统的主机节点。
在本申请的一些实施例中,基于前述方案,所述第二确定单元1304配置为:按照所述更新热度值从大到小的顺序,对所述多个直播话题进行排序;将排序靠前的预定数量的直播话题确定为热门直播话题。
在本申请的一些实施例中,基于前述方案,所述装置还包括:读取单元,被用于在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,读取所述直播间中在线用户发出的互动消息,所述在线用户发出的互动消息包括所述在线用户发出的目标互动消息和所述在线用户发出的历史互动消息;第三确定单元,被用于基于所述在线用户发出的互动消息所属的直播话题,确定所述在线用户感兴趣的兴趣话题;合并单元,被用于将所述兴趣话题合并至已确定的热门直播话题中,得到新的热门直播话题。
在本申请的一些实施例中,基于前述方案,所述装置还包括:推荐单元,被用于在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,针对所述热门直播话题生成相适应的直播素材;将所述直播素材推荐至直播界面,以供所述直播间的主播用户进行选择。
在本申请的一些实施例中,基于前述方案,所述装置还包括:展示单元,被用于在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,在显示直播界面时,获取所述热门直播话题,并生成热门直播话题列表;在检测到针对所述热门直播话题列表的触发指令时,在所述直播界面展示所述热门直播话题列表。
图14示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图14示出的电子设备的计算机系统1400仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图14所示,计算机系统1400包括中央处理单元(Central Processing Unit,CPU)1401,其可以根据存储在只读存储器(Read-Only Memory,ROM)1402中的程序或者从储存部分1408加载到随机访问存储器(Random Access Memory,RAM)1403中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1403中,还存储有系统操作所需的各种程序和数据。CPU 1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(Input/Output,I/O)接口1405也连接至总线1404。
以下部件连接至I/O接口1405:包括键盘、鼠标等的输入部分1406;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1407;包括硬盘等的储存部分1408;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1409。通信部分1409经由诸如因特网的网络执行通信处理。驱动器1410也根据需要连接至I/O接口1405。可拆卸介质1411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1410上,以便于从其上读出的计算机程序根据需要被安装入储存部分1408。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1409从网络上被下载和安装,和/或从可拆卸介质1411被安装。在该计算机程序被中央处理单元(CPU)1401执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中所述的直播数据的处理方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的直播数据的处理方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种直播数据的处理方法,其特征在于,所述方法包括:
获取直播间实时产生的目标互动消息;
确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,并根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题;
对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度;
基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,包括:
对所述目标互动消息进行特征转化,得到所述目标互动消息的特征数据;
基于所述目标互动消息的特征数据,以及所述多个直播话题中所包含的历史互动消息的特征数据,计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度,以将所述相似度作为所述关联强度。
3.根据权利要求2所述的方法,其特征在于,在所述目标互动消息的数量级超过第一预定阈值时,所述计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度,包括:
将所述目标互动消息分发至至少两个计算模块,以由所述至少两个计算模块计算所述目标互动消息与多个直播话题中所包含的历史互动消息之间的相似度。
4.根据权利要求2所述的方法,其特征在于,所述对所述目标互动消息所属的直播话题的热度值进行增加处理,包括:
将所述目标互动消息与所述目标互动消息所属直播话题中所包含的历史互动消息之间的相似度作为增加值,并在所述目标互动消息所属的直播话题的热度值的基础上增加所述增加值。
5.根据权利要求1所述的方法,其特征在于,所述根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题,包括:
在所述目标互动消息与多个直播话题中的至少一个直播话题所包含的历史互动消息之间的关联强度大于第二预定阈值时,将所述至少一个直播话题确定为所述目标互动消息所属的直播话题;
在所述目标互动消息与多个直播话题所包含的历史互动消息之间的关联强度均小于或等于第二预定阈值时,为所述目标互动消息生成新的直播话题,并将所述新的直播话题确定为所述目标互动消息所属的直播话题。
6.根据权利要求1所述的方法,其特征在于,所述直播间中用户发出的互动消息存储在分布式存储系统,所述分布式存储系统还存储有所述直播间中用户发出的互动消息的属性数据,所述属性数据包括互动消息所属的直播话题,以及在直播间发送所述互动消息的用户;
在根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题之后,所述方法还包括:
将所述目标互动消息及其属性数据写入至分布式存储系统的主机节点,并由所述主机节点将所述目标互动消息及其属性数据同步至所述分布式存储系统的备用机节点,所述备用机节点用于读取所述目标互动消息及其属性数据,以及历史互动消息及其属性数据。
7.根据权利要求1所述的方法,其特征在于,在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,所述方法还包括:
读取所述直播间中在线用户发出的互动消息,所述在线用户发出的互动消息包括所述在线用户发出的目标互动消息和所述在线用户发出的历史互动消息;
基于所述在线用户发出的互动消息所属的直播话题,确定所述在线用户感兴趣的兴趣话题;
将所述兴趣话题合并至已确定的热门直播话题中,得到新的热门直播话题。
8.根据权利要求1所述的方法,其特征在于,在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,所述方法还包括:
针对所述热门直播话题生成相适应的直播素材;
将所述直播素材推荐至直播界面,以供所述直播间的主播用户进行选择。
9.根据权利要求1所述的方法,其特征在于,在基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题之后,所述方法还包括:
在显示直播界面时,获取所述热门直播话题,并生成热门直播话题列表;
在检测到针对所述热门直播话题列表的触发指令时,在所述直播界面展示所述热门直播话题列表。
10.一种直播数据的处理装置,其特征在于,所述装置包括:
获取单元,被用于获取直播间实时产生的目标互动消息;
第一确定单元,被用于确定所述目标互动消息与多个直播话题中所包含的历史互动消息之间的关联强度,并根据所述关联强度在所述多个直播话题中确定所述目标互动消息所属的直播话题;
增加单元,被用于对所述目标互动消息所属的直播话题的热度值进行增加处理,以更新所述目标互动消息所属的直播话题的热度值,得到更新热度值,所述热度值用于表征直播话题的热门程度;
第二确定单元,被用于基于所述多个直播话题的更新热度值,从所述多个直播话题中确定热门直播话题。
CN202110580269.1A 2021-05-26 2021-05-26 直播数据的处理方法、装置 Active CN113766257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110580269.1A CN113766257B (zh) 2021-05-26 2021-05-26 直播数据的处理方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110580269.1A CN113766257B (zh) 2021-05-26 2021-05-26 直播数据的处理方法、装置

Publications (2)

Publication Number Publication Date
CN113766257A true CN113766257A (zh) 2021-12-07
CN113766257B CN113766257B (zh) 2023-05-26

Family

ID=78787245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110580269.1A Active CN113766257B (zh) 2021-05-26 2021-05-26 直播数据的处理方法、装置

Country Status (1)

Country Link
CN (1) CN113766257B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130124437A1 (en) * 2011-11-16 2013-05-16 Marco Pennacchiotti Social media user recommendation system and method
CN108055593A (zh) * 2017-12-20 2018-05-18 广州虎牙信息科技有限公司 一种互动消息的处理方法、装置、存储介质及电子设备
CN108401175A (zh) * 2017-12-20 2018-08-14 广州虎牙信息科技有限公司 一种弹幕消息的处理方法、装置、存储介质及电子设备
CN109241242A (zh) * 2018-08-23 2019-01-18 武汉斗鱼网络科技有限公司 一种直播间话题推荐方法、装置、服务器及存储介质
CN109408639A (zh) * 2018-10-31 2019-03-01 广州虎牙科技有限公司 一种弹幕分类方法、装置、设备和存储介质
CN111343467A (zh) * 2020-02-10 2020-06-26 腾讯科技(深圳)有限公司 一种直播数据处理方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130124437A1 (en) * 2011-11-16 2013-05-16 Marco Pennacchiotti Social media user recommendation system and method
CN108055593A (zh) * 2017-12-20 2018-05-18 广州虎牙信息科技有限公司 一种互动消息的处理方法、装置、存储介质及电子设备
CN108401175A (zh) * 2017-12-20 2018-08-14 广州虎牙信息科技有限公司 一种弹幕消息的处理方法、装置、存储介质及电子设备
CN109241242A (zh) * 2018-08-23 2019-01-18 武汉斗鱼网络科技有限公司 一种直播间话题推荐方法、装置、服务器及存储介质
CN109408639A (zh) * 2018-10-31 2019-03-01 广州虎牙科技有限公司 一种弹幕分类方法、装置、设备和存储介质
CN111343467A (zh) * 2020-02-10 2020-06-26 腾讯科技(深圳)有限公司 一种直播数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113766257B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
EP3244312B1 (en) A personal digital assistant
CN110413867B (zh) 用于内容推荐的方法及系统
CN111708948A (zh) 内容项推荐方法、装置、服务器及计算机可读存储介质
CN111935265A (zh) 媒体信息的处理方法及装置
CN117150000B (zh) 一种投标书的生成方法、装置、设备及存储介质
CN112269943B (zh) 一种信息推荐系统及方法
US9875443B2 (en) Unified attractiveness prediction framework based on content impact factor
CN111667018B (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN116955817A (zh) 内容推荐方法、装置、电子设备以及存储介质
CN111783013A (zh) 评论信息发布的方法、装置、设备及计算机可读存储介质
CN112801053B (zh) 视频数据处理方法、装置
CN113766257B (zh) 直播数据的处理方法、装置
CN113515336B (zh) 直播间加入方法、创建方法、装置、设备及存储介质
CN110636362B (zh) 图像处理方法、装置、系统及电子设备
CN113761272A (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN114528474A (zh) 推荐对象确定方法、装置、电子设备及存储介质
CN112861007A (zh) 屏保的显示方法、装置、设备、介质及程序产品
CN111125501B (zh) 用于处理信息的方法和装置
CN115278326A (zh) 视频展示方法、装置、计算机可读介质及电子设备
CN113111197A (zh) 多媒体内容的推荐方法、装置、设备及存储介质
CN115065866B (zh) 一种视频生成方法、装置、设备及存储介质
Chiu et al. Computer vision on tap
CN117725299A (zh) 内容推荐方法、装置、计算机设备和计算机可读存储介质
CN113515719A (zh) 对社区产品进行冷启动的方法和装置
CN113934918A (zh) 用于直播的搜索方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant