CN110196921A - 主播分类方法和装置、存储介质及电子装置 - Google Patents

主播分类方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN110196921A
CN110196921A CN201810899047.4A CN201810899047A CN110196921A CN 110196921 A CN110196921 A CN 110196921A CN 201810899047 A CN201810899047 A CN 201810899047A CN 110196921 A CN110196921 A CN 110196921A
Authority
CN
China
Prior art keywords
main broadcaster
value
keyword
label value
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810899047.4A
Other languages
English (en)
Other versions
CN110196921B (zh
Inventor
钟锴亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810899047.4A priority Critical patent/CN110196921B/zh
Publication of CN110196921A publication Critical patent/CN110196921A/zh
Application granted granted Critical
Publication of CN110196921B publication Critical patent/CN110196921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种主播分类方法和装置、存储介质及电子装置。其中,该方法包括:获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播。本发明解决了相关技术中主播类别识别准确度以及效率较低的技术问题。

Description

主播分类方法和装置、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种主播分类方法和装置、存储介质及电子装置。
背景技术
目前,随着直播的兴起,主播的类别越来越多。为了便于对同类别主播的管理,需要对不同主播进行分类识别,相关技术在进行主播分类识别时通常会先采用人工方式对主播打标签,然后根据标签识别主播所属类别。人工打标签方式不仅增加了人力成本,而且将会严重影响主播类型的识别准确度以及识别效率。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种主播分类方法和装置、存储介质及电子装置,以至少解决相关技术中主播类别识别准确度以及效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种主播分类方法,包括:获取主播分类请求,其中,所述主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,所述多个主播包括所述目标主播;获取所述多个主播中每个主播的第一标签值、在所述每个主播的直播房间中提及的多个关键词、所述多个关键词中每个关键词的第二标签值、边权值,其中,所述边权值用于指示在所述每个主播的直播房间中提及所述每个关键词的账号数量在所述每个主播的直播房间的账号总数量的占比;根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个主播中识别出与所述目标主播属于相同类型的主播。
根据本发明实施例的另一方面,还提供了一种主播分类装置,包括:第一获取单元,用于获取主播分类请求,其中,所述主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,所述多个主播包括所述目标主播;第二获取单元,用于获取所述多个主播中每个主播的第一标签值、在所述每个主播的直播房间中提及的多个关键词、所述多个关键词中每个关键词的第二标签值、边权值,其中,所述边权值用于指示在所述每个主播的直播房间中提及所述每个关键词的账号数量在所述每个主播的直播房间的账号总数量的占比;第一识别单元,用于根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个主播中识别出与所述目标主播属于相同类型的主播。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行本发明实施例中任意一种主播分类方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器和处理器,其中,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行本发明实施例中任意一种主播分类方法。
在本发明实施例中,在获取到主播分类请求之后,通过获取每个主播的第一标签值、每个主播的直播房间中提及的多个关键词、每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比,然后根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播,达到了快速准确的进行主播类别识别的目的,进而解决了相关技术中主播类别识别准确度以及效率较低的技术问题,从而实现了提高主播类别识别的准确度以及效率的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的主播分类方法的硬件环境的示意图;
图2是根据本发明实施例的一种可选的主播分类方法的流程图;
图3是根据本发明实施例的一种可选的含有边权值的有向图的示意图;
图4是根据本发明实施例的一种可选的初始化时各节点的标签值的示意图;
图5是根据本发明实施例的一种可选的第一次迭代后各节点的标签值的示意图;
图6是根据本发明实施例的一种可选的第二次迭代后各节点的标签值的示意图;
图7是根据本发明实施例的一种可选的第三次迭代后各节点的标签值的示意图;
图8是根据本发明实施例的一种可选的能量传播效果的示意图;
图9是根据本发明实施例的一种可选的主播分类装置的示意图;以及
图10是根据本发明实施例的一种电子装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的主播,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种主播分类方法。
可选地,在本实施例中,上述主播分类方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。如图1所示,服务器102通过网络与终端104进行连接,上述网络包括但不限于:广域网、城域网或局域网,终端104并不限定于PC、手机、平板电脑等。本发明实施例的主播分类方法可以由服务器102来执行,也可以由终端104来执行,还可以是由服务器102和终端104共同执行。其中,终端104执行本发明实施例的主播分类方法也可以是由安装在其上的客户端来执行。
可选地,服务器102执行本发明实施例的主播分类方法的具体流程可以描述为:服务器102获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;服务器102获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;服务器102根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播。
可选地,终端104执行本发明实施例的主播分类方法的具体流程可以描述为:终端104获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;终端104获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;终端104根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播。
可选地,服务器102以及终端104共同执行本发明实施例的主播分类方法的具体流程可以描述为:终端104获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;终端104将主播分类请求发送给服务器102;服务器102获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;服务器102根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播;服务器102将识别出的多个主播中与目标主播属于相同类型的主播通知给终端104。
下面将对本发明实施例的主播分类方法进行详细说明。
图2是根据本发明实施例的一种可选的主播分类方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;
步骤S204,获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;
步骤S206,根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播。
通过上述步骤S202至步骤S208,在获取到主播分类请求之后,通过获取每个主播的第一标签值、每个主播的直播房间中提及的多个关键词、每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比,然后根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播,达到了快速准确的进行主播类别识别的目的,进而解决了相关技术中主播类别识别准确度以及效率较低的技术问题,从而实现了提高主播类别识别的准确度以及效率的技术效果。
在步骤S202提供的技术方案中,多个主播中可以包括目标主播,多个主播中可以包括与目标主播属于相同类型的一个或者多个主播,也可以不包括与目标主播属于相同类型的主播。此处需要说明的是,主播类型相同可以理解为主播所直播的内容相同或者相似,例如主播1与主播2均直播美妆,则主播3与主播4均直播美食。
本发明实施例的主播分类请求可以用于请求在多个主播中识别出与目标主播属于相同类型的主播。可选地,该主播识别请求中可以至少携带有以下信息:目标主播的标识信息,多个主播的标识信息等。可选地,主播分类请求可以由用户执行的触控操作触发生成,例如鼠标点击操作,也可以自动触发生成。本发明实施例对主播分类请求的生成方式不做具体限定。
在步骤S204提供的技术方案中,在获取待主播分类请求之后,本发明实施例可以首先根据该主播分类请求中所携带的目标主播的标识信息以及多个主播的标识信息获取其标签值,也即获取每个主播的第一标签值。可选地,每个主播的第一标签值可以为根据实际需求设定的一个取值,取值大小本发明实施例并不做具体限定。可选地,多个主播中目标主播的第一标签值与其他主播的第一标签值可以不同,以便于在初始化时将两者进行区分开。
本发明实施例还可以获取每个主播的直播房间中提及的多个关键词,以及每个关键词的第二标签值,可选地,该每个关键词的第二标签值可以为根据实际需求设定的一个取值,取值大小本发明实施例并不做具体限定。可选地,该每个关键词的第二标签值与每个主播的第一标签值不同,以便于在初始化时将两者进行区分开。
本发明实施例还可以获取用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比的边权值。例如,在主播1的直播房间中账号总数量为10,提及关键词1的账号数量为3,则主播1与关键词1之间的边权值为0.3;再例如,在主播1的直播房间中账号总数量为10,提及关键词2的账号数量为6,则主播1与关键词2之间的边权值为0.6。
在步骤S206提供的技术方案中,在获取到每个主播的第一标签值、每个关键词的第二标签值以及边权值之后,本发明实施例可以根据第一标签值、第二标签值以及边权值从多个主播中识别出与目标主播属于相同类型的主播。需要说明的是,本发明实施例不仅仅考虑了每个主播的标签值,还考虑了关键词的标签值,以及用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比的边权值,能够达到提高在多个主播中识别出与目标主播属于相同类型的主播的准确度。而且,本发明实施例无需人工参与,可以实现提高在多个主播中识别出与目标主播属于相同类型的主播的效率。
可选地,步骤S206根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播可以包括以下步骤S2062至步骤S2064,其中:
步骤S2062,根据第一标签值、第二标签值以及边权值获取每个主播的目标标签值以及每个关键词的目标标签值。
可选地,根据第一标签值、第二标签值以及边权值获取每个主播的目标标签值以及每个关键词的目标标签值可以包括:对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和满足第二条件,其中,将最后一轮迭代操作得到的每个主播的标签值以及每个关键词的标签值分别作为每个主播的目标标签值以及每个关键词的目标标签值。
可选地,本发明实施例可以按照以下公式对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作:
其中,label0k(t+1)和label1k(t+1)为节点k进行第t次迭代操作后的标签值,节点k包括每个主播和每个关键词,label0k(t)和label1k(t)为节点k在第t次迭代时的标签值。wik为节点k的邻居节点i到节点k的边权值,在节点k为主播时,节点k的邻居节点i为在主播的直播房间中提及的关键词,节点k的邻居节点i到节点k的边权值用于指示在主播的直播房间中提及关键词的账号数量在主播的直播房间的账号总数量的占比,label 0i(t)和label1i(t)为节点k的邻居节点i在第t次迭代时的标签值。
可选地,对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和满足第二条件可以包括:对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和小于第一阈值。其中,第一阈值可以根据实际需求设定或调整,此处不做具体限定。
经过上述迭代操作,可以获取到每个主播的目标标签值以及每个关键词的目标标签值。
步骤S2064,在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值满足第一条件。
可选地,步骤S2064在多个主播中识别出与目标主播属于相同类型的主播可以包括:首先获取每个主播的目标标签值与目标主播的第一标签值之间的差值;在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第二阈值,或,与目标主播属于相同类型的主播为多个主播中差值的绝对值从小到大排序后排序靠前的N个主播,N为自然数。
需要说明的是,第二阈值以及N的取值可以根据实际需求设定或调整,此处不做具体限定。本发明实施例可以将多个主播中目标标签值越接近目标主播的第一标签值的主播识别为与目标主播属于相同类型的主播。
本发明实施例通过对每个主播的第一标签值、每个关键词的第二标签值以及边权值进行多次迭代操作,以此来获取每个主播的目标标签值以及每个的目标标签值,然后将多个主播中目标标签值越接近目标主播的第一标签值的主播识别为与目标主播属于相同类型的主播,能够达到快速准确的进行主播类别识别的目的,进而解决了相关技术中主播类别识别准确度以及效率较低的技术问题,从而实现了提高主播类别识别的准确度以及效率的技术效果。
作为一种可选的实施例,在执行步骤S206根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播的同时,本发明实施例的主播分类方法还可以包括:
步骤S208,根据第一标签值、第二标签值以及边权值,从多个关键词中识别出用于描述目标主播的目标关键词。
此处需要说明的是,在主播的直播房间中可能提及多个关键词,但并不是所有的关键词均可以用于描述该主播,或者说并不是所有的关键词均可以用于描述该主播所直播的内容,例如,主播1为直播美妆的主播,在主播1直播的房间中,提及的多个关键词包括口红、眉笔、绘画、价钱等,其中,只有口红和眉笔与主播1所直播的美妆相关,也即能够用于描述主播1,故口红和眉笔为多个关键词中用于描述主播1的目标关键词。
可选地,步骤S208根据第一标签值、第二标签值以及边权值,在多个关键词中识别出用于描述目标主播的目标关键词可以包括以下步骤:
步骤S2082,获取每个关键词的目标标签值与目标主播的第一标签值之间的差值;
步骤S2084,在多个关键词中识别出用于描述目标主播的目标关键词,其中,目标关键词的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第三阈值,或,目标关键词为多个关键词中差值的绝对值从小到大排序后排序靠前的M个关键词,M为自然数。
首先需要说明的是,第三阈值以及M的取值可以根据实际需求设定或调整,此处不做具体限定。还需要说明的是,步骤S2082中的每个关键词的目标标签值可以根据本发明上述步骤S2062中所述的迭代操作获取到,在获取到每个关键词的目标标签值之后,本发明实施例可以将多个关键词中目标标签值越接近目标主播的第一标签值的关键词识别为目标关键词。
本发明实施例通过对每个主播的第一标签值、每个关键词的第二标签值以及边权值进行多次迭代操作,以此来获取多个主播的目标标签值以及多个关键词的目标标签值,在将多个主播中目标标签值越接近目标主播的第一标签值的主播识别为与目标主播属于相同类型的主播的同时,本发明实施例还可以将多个关键词中目标标签值越接近目标主播的第一标签值的关键词识别为用于描述目标主播的目标关键词,不仅能够达到快速准确的进行主播类别识别的目的,而且能够达到快速准确地为主播添加关键词的目的,从而实现了提高主播类别识别的准确度以及效率的技术效果。
本发明还提供了一种优选实施例,该优选实施例是本发明实施例应用于直播平台的具体实例。该优选实施例提供了一种基于标签传播算法的标签识别方法,利用该方法可以实现人工找出少许主播,进而找到更多的同类主播;还可以实现人工找出少许主播,进而找到这类主播在直播平台下的具体关键词。
基于标签传播算法的标签识别方法,以主播本身作为传播源,主播和词建立传播信道,同类主播间不设立传播信道,也即主播与主播、词与词没有直接的传播信道,实现跨界传播,找出其他体现同类的词或主播的半监督二分类方法。
此处需要说明的是,该优选实施例可以对主播直播房间的公屏聊天记录进行中文分词清洗,得到多个词。
该方法可以包括以下过程:
首先,构建所有主播的传播网络,如图3所示,该传播网络可以为一个含有边权值的有向图,每个主播(主播或者词)为一个节点。在图3中包括主播1、主播2、主播3、主播4以及词1、词2、词3、词4。关于边权值的计算,以主播1和词1为例,边权值0.1表示在主播1房间中发言提及词1的人数占比为0.1。这里把边的双向设为一样的权值。在图3所示的有向图中每个边的边权值如图3所示。
然后,找出一批有共性的主播,并标注为能量源,并设置能量源标签值label 1恒为1,label 0恒为0,其他主播的标签值初始化为label 1=0,label 0=1。如图4所示,这里把主播1,主播4设为能量源,主播1与主播4的标签值label 1=0,label 0=1,其他节点,包括主播2、主播3以及词1、词2、词3、词4的标签值label 1=0,label 0=1。
然后,进行传播迭代,每次迭代节点标签值按以下公式更新:
其中,k的取值为所有节点中除了能量源之外的节点,也即图4中除了主播1与主播4之外的节点,包括主播2、主播3以及词1、词2、词3、词4。label 0k(t)为当前节点k在第t次迭代时label 0的值,label 1k(t)为当前节点k在第t次迭代时label 1的值。wik为邻居节点i到当前节点k的边权值。此处需要说明的是,当前节点k的邻居节点i为图4中具有箭头指向关系的节点,例如,词2的邻居节点为主播1与主播2,主播3的邻居节点为词3。
传播迭代过程具体如下:
第1次传播迭代后各个节点的标签值如图5所示,第2次传播迭代后各个节点的标签值如图6所示,第3次传播迭代后各个节点的标签值如图7所示,以以此类推。迭代N次完毕,或者所有节点的label 1收敛,即θ是一个很小的值。
然后,降序排序导出所有节点的label 1值(即标签的值),取前N个较大的,以实现获取到相应关键词以及同类主播。
假设在直播平台上选了8个书法美术类的主播设为能量源,以在主播间中发言提及词人数占比作为边的权值。通过该方法后得到的所有节点的标签值,如图8所示,截图中第一列为序号,第二列节点名字中的数字为主播标识号,其余为词。通过按照label 1的值降序排列后,可以获取到与8个书法美术类的主播相应的关键词(彩铅、隶书等)以及同类主播(标识号为304186559)。
需要说明的是,在实际应用场景中,有了主播标签以及描述这类标签的关键词,就可以建立主播与用户的传播信道,关键词与用户的传播信道,从而了解用户的兴趣,达到对用户打标签的目的。
还需要说明的是,本发明中除了可以设定label 1的标签传播源,也可以设定label 0的标签传播源,从而支持更多的传播迭代次数,避免传播过度。本发明中有向图中的边可按需要给不同的方向设定不同的传播权值,且边的权值可以利用TF-IDF算法来设定。
还需要说明的是,本发明对于观看用户过少的主播可以平滑处理,或者直接放弃;在进行中文分词时可以过滤掉垃圾词汇以及无意义词汇。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施上述主播分类方法的主播分类装置。图9是根据本发明实施例的一种可选的主播分类装置的示意图,如图9所示,该装置可以包括:
第一获取单元22,用于获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;第二获取单元24,用于获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;第一识别单元26,用于根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播。
需要说明的是,该实施例中的第一获取单元22可以用于执行本申请实施例中的步骤S202,该实施例中的第二获取单元24可以用于执行本申请实施例中的步骤S204,该实施例中的第一识别单元26可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
可选地,第一识别单元26可以包括:第一获取模块,用于根据第一标签值、第二标签值以及边权值获取每个主播的目标标签值以及每个关键词的目标标签值;第一识别模块,用于在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值满足第一条件。
可选地,第一获取模块可以包括:第一迭代模块,用于对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和满足第二条件,其中,将最后一轮迭代操作得到的每个主播的标签值以及每个关键词的标签值分别作为每个主播的目标标签值以及每个关键词的目标标签值。
可选地,第一迭代模块可以用于:对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和小于第一阈值。
可选地,第一迭代模块用于按照以下公式对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作操作:
其中,label0k(t+1)和label1k(t+1)为节点k进行第t次迭代操作后的标签值,节点k包括每个主播和每个关键词,label 0k(t)和label 1k(t)为节点k在第t次迭代时的标签值。wik为节点k的邻居节点i到节点k的边权值,在节点k为主播时,节点k的邻居节点i为在主播的直播房间中提及的关键词,节点k的邻居节点i到节点k的边权值用于指示在主播的直播房间中提及关键词的账号数量在主播的直播房间的账号总数量的占比,label 0i(t)和label1i(t)为节点k的邻居节点i在第t次迭代时的标签值。
可选地,第一识别单元26可以包括:第二获取模块,用于获取每个主播的目标标签值与目标主播的第一标签值之间的差值;第二识别模块,用于在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第二阈值,或,与目标主播属于相同类型的主播为多个主播中差值的绝对值从小到大排序后排序靠前的N个主播,N为自然数。
可选地,该主播分类装置还可以包括:第二识别单元,用于在根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播的同时,根据第一标签值、第二标签值以及边权值,在多个关键词中识别出与用于描述目标主播的目标关键词。
可选地,第二识别单元可以包括:第三获取模块,用于获取每个关键词的目标标签值与目标主播的第一标签值之间的差值;第三识别模块,用于在多个关键词中识别出用于描述目标主播的目标关键词,其中,目标关键词的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第三阈值,或,目标关键词为多个关键词中差值的绝对值从小到大排序后排序靠前的M个关键词,M为自然数。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,可以达到快速准确地进行主播识别的目的,进而解决了相关技术中主播类别识别准确度以及效率较低的技术问题,达到了提高主播识别准确度和效率的技术效果。
根据本发明实施例的又一个方面,还提供了一种用于实施上述主播分类方法的电子装置。
图10是根据本发明实施例的一种电子装置的结构框图,如图10所示,该电子装置可以包括:一个或多个(图中仅示出一个)处理器201、存储器203,其中,存储器203中可以存储有计算机程序,处理器201可以被设置为运行所述计算机程序以执行本发明实施例的主播分类方法。
其中,存储器203可用于存储计算机程序以及模块,如本发明实施例中的主播分类方法和装置对应的程序指令/模块,处理器201通过运行存储在存储器203内的计算机程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的主播分类方法。存储器203可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器203可进一步包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
可选地,如图10所示,该电子装置还可以包括:传输装置205以及输入输出设备207。其中,传输装置205用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置205包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置205为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图10所示的结构仅为示意,电子装置可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如,电子装置还可以包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
可选地,在本实施例中,上述存储器203可以用于存储计算机程序。
可选地,在本实施例中,上述处理器可以被设置为运行计算机程序,以执行以下步骤:获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播。
处理器201还用于执行下述步骤:根据第一标签值、第二标签值以及边权值获取每个主播的目标标签值以及每个关键词的目标标签值;在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值满足第一条件。
处理器201还用于执行下述步骤:对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和满足第二条件,其中,将最后一轮迭代操作得到的每个主播的标签值以及每个关键词的标签值分别作为每个主播的目标标签值以及每个关键词的目标标签值。
处理器201还用于执行下述步骤:对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和小于第一阈值。
处理器201还用于执行下述步骤:按照以下公式对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作操作:
其中,label 0k(t+1)和label1k(t+1)为节点k进行第t次迭代操作后的标签值,节点k包括每个主播和每个关键词,label 0k(t)和label 1k(t)为节点k在第t次迭代时的标签值。wik为节点k的邻居节点i到节点k的边权值,在节点k为主播时,节点k的邻居节点i为在主播的直播房间中提及的关键词,节点k的邻居节点i到节点k的边权值用于指示在主播的直播房间中提及关键词的账号数量在主播的直播房间的账号总数量的占比,label 0i(t)和label 1i(t)为节点k的邻居节点i在第t次迭代时的标签值。
处理器201还用于执行下述步骤:获取每个主播的目标标签值与目标主播的第一标签值之间的差值;在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第二阈值,或,与目标主播属于相同类型的主播为多个主播中差值的绝对值从小到大排序后排序靠前的N个主播,N为自然数。
处理器201还用于执行下述步骤:在根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播的同时,根据第一标签值、第二标签值以及边权值,在多个关键词中识别出与用于描述目标主播的目标关键词。
处理器201还用于执行下述步骤:获取每个关键词的目标标签值与目标主播的第一标签值之间的差值;在多个关键词中识别出用于描述目标主播的目标关键词,其中,目标关键词的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第三阈值,或,目标关键词为多个关键词中差值的绝对值从小到大排序后排序靠前的M个关键词,M为自然数。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
采用本发明实施例,提供了一种主播分类的方案。该方案在获取到主播分类请求之后,通过获取每个主播的第一标签值、每个主播的直播房间中提及的多个关键词、每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比,然后根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播,达到了快速准确的进行主播类别识别的目的,进而解决了相关技术中主播类别识别准确度以及效率较低的技术问题,从而实现了提高主播类别识别的准确度以及效率的技术效果。
根据本发明实施例的又一个方面,还提供了一种存储介质。该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述实施例中主播分类方法的步骤。
可选地,在本实施例中,存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的计算机程序:
S1,获取主播分类请求,其中,主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,多个主播包括目标主播;
S2,获取多个主播中每个主播的第一标签值、在每个主播的直播房间中提及的多个关键词、多个关键词中每个关键词的第二标签值、边权值,其中,边权值用于指示在每个主播的直播房间中提及每个关键词的账号数量在每个主播的直播房间的账号总数量的占比;
S3,根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:根据第一标签值、第二标签值以及边权值获取每个主播的目标标签值以及每个关键词的目标标签值;在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值满足第一条件。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和满足第二条件,其中,将最后一轮迭代操作得到的每个主播的标签值以及每个关键词的标签值分别作为每个主播的目标标签值以及每个关键词的目标标签值。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的每个主播的标签值以及每个关键词的标签值之间的差值的平方和小于第一阈值。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:按照以下公式对每个主播的第一标签值以及每个关键词的第二标签值进行多轮迭代操作操作:
其中,label0k(t+1)和label1k(t+1)为节点k进行第t次迭代操作后的标签值,节点k包括每个主播和每个关键词,label 0k(t)和label 1k(t)为节点k在第t次迭代时的标签值。wik为节点k的邻居节点i到节点k的边权值,在节点k为主播时,节点k的邻居节点i为在主播的直播房间中提及的关键词,节点k的邻居节点i到节点k的边权值用于指示在主播的直播房间中提及关键词的账号数量在主播的直播房间的账号总数量的占比,label 0i(t)和label1i(t)为节点k的邻居节点i在第t次迭代时的标签值。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:获取每个主播的目标标签值与目标主播的第一标签值之间的差值;在多个主播中识别出与目标主播属于相同类型的主播,其中,与目标主播属于相同类型的主播的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第二阈值,或,与目标主播属于相同类型的主播为多个主播中差值的绝对值从小到大排序后排序靠前的N个主播,N为自然数。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:在根据第一标签值、第二标签值以及边权值,在多个主播中识别出与目标主播属于相同类型的主播的同时,根据第一标签值、第二标签值以及边权值,在多个关键词中识别出与用于描述目标主播的目标关键词。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:获取每个关键词的目标标签值与目标主播的第一标签值之间的差值;在多个关键词中识别出用于描述目标主播的目标关键词,其中,目标关键词的目标标签值与目标主播的第一标签值之间的差值的绝对值小于第三阈值,或,目标关键词为多个关键词中差值的绝对值从小到大排序后排序靠前的M个关键词,M为自然数。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种主播分类方法,其特征在于,包括:
获取主播分类请求,其中,所述主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,所述多个主播包括所述目标主播;
获取所述多个主播中每个主播的第一标签值、在所述每个主播的直播房间中提及的多个关键词、所述多个关键词中每个关键词的第二标签值、边权值,其中,所述边权值用于指示在所述每个主播的直播房间中提及所述每个关键词的账号数量在所述每个主播的直播房间的账号总数量的占比;
根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个主播中识别出与所述目标主播属于相同类型的主播。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个主播中识别出与所述目标主播属于相同类型的主播包括:
根据所述第一标签值、所述第二标签值以及所述边权值获取所述每个主播的目标标签值以及所述每个关键词的目标标签值;
在所述多个主播中识别出与所述目标主播属于相同类型的主播,其中,所述与所述目标主播属于相同类型的主播的目标标签值与所述目标主播的第一标签值满足第一条件。
3.根据权利要求2所述的方法,其特征在于,根据所述第一标签值、所述第二标签值以及所述边权值获取所述每个主播的目标标签值以及所述每个关键词的目标标签值包括:
对所述每个主播的第一标签值以及所述每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的所述每个主播的标签值以及所述每个关键词的标签值之间的差值的平方和满足第二条件,其中,将最后一轮迭代操作得到的所述每个主播的标签值以及所述每个关键词的标签值分别作为所述每个主播的目标标签值以及所述每个关键词的目标标签值。
4.根据权利要求3所述的方法,其特征在于,所述对所述每个主播的第一标签值以及所述每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的所述每个主播的标签值以及所述每个关键词的标签值之间的差值的平方和满足第二条件包括:
对所述每个主播的第一标签值以及所述每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的所述每个主播的标签值以及所述每个关键词的标签值之间的差值的平方和小于第一阈值。
5.根据权利要求3所述的方法,其特征在于,所述对所述每个主播的第一标签值以及所述每个关键词的第二标签值进行多轮迭代操作包括:
按照以下公式对所述每个主播的第一标签值以及所述每个关键词的第二标签值进行多轮迭代操作操作:
其中,label0k(t+1)和label1k(t+1)为节点k进行第t次迭代操作后的标签值,所述节点k包括所述每个主播和所述每个关键词,label0k(t)和label1k(t)为所述节点k在第t次迭代时的标签值,wik为所述节点k的邻居节点i到所述节点k的边权值,在所述节点k为主播时,所述节点k的邻居节点i为在所述主播的直播房间中提及的关键词,所述节点k的邻居节点i到所述节点k的边权值用于指示在所述主播的直播房间中提及所述关键词的账号数量在所述主播的直播房间的账号总数量的占比,label0i(t)和label1i(t)为所述节点k的邻居节点i在第t次迭代时的标签值。
6.根据权利要求2至5中任一项所述的方法,其特征在于,所述在所述多个主播中识别出与所述目标主播属于相同类型的主播包括:
获取所述每个主播的目标标签值与所述目标主播的第一标签值之间的差值;
在所述多个主播中识别出与所述目标主播属于相同类型的主播,其中,所述与所述目标主播属于相同类型的主播的目标标签值与所述目标主播的第一标签值之间的差值的绝对值小于第二阈值,或,所述与所述目标主播属于相同类型的主播为所述多个主播中所述差值的绝对值从小到大排序后排序靠前的N个主播,N为自然数。
7.根据权利要求1所述的方法,其特征在于,在所述根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个主播中识别出与所述目标主播属于相同类型的主播的同时,所述方法还包括:
根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个关键词中识别出与用于描述所述目标主播的目标关键词。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个关键词中识别出与用于描述所述目标主播的目标关键词包括:
获取所述每个关键词的目标标签值与所述目标主播的第一标签值之间的差值;
在所述多个关键词中识别出用于描述所述目标主播的目标关键词,其中,所述目标关键词的目标标签值与所述目标主播的第一标签值之间的差值的绝对值小于第三阈值,或,所述目标关键词为所述多个关键词中所述差值的绝对值从小到大排序后排序靠前的M个关键词,M为自然数。
9.一种主播分类装置,其特征在于,包括:
第一获取单元,用于获取主播分类请求,其中,所述主播分类请求用于请求在多个主播中识别出与目标主播属于相同类型的主播,所述多个主播包括所述目标主播;
第二获取单元,用于获取所述多个主播中每个主播的第一标签值、在所述每个主播的直播房间中提及的多个关键词、所述多个关键词中每个关键词的第二标签值、边权值,其中,所述边权值用于指示在所述每个主播的直播房间中提及所述每个关键词的账号数量在所述每个主播的直播房间的账号总数量的占比;
第一识别单元,用于根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个主播中识别出与所述目标主播属于相同类型的主播。
10.根据权利要求9所述的装置,其特征在于,所述第一识别单元包括:
第一获取模块,用于根据所述第一标签值、所述第二标签值以及所述边权值获取所述每个主播的目标标签值以及所述每个关键词的目标标签值;
第一识别模块,用于在所述多个主播中识别出与所述目标主播属于相同类型的主播,其中,所述与所述目标主播属于相同类型的主播的目标标签值与所述目标主播的第一标签值满足第一条件。
11.根据权利要求10所述的装置,其特征在于,根据第一获取模块包括:
第一迭代模块,用于对所述每个主播的第一标签值以及所述每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的所述每个主播的标签值以及所述每个关键词的标签值之间的差值的平方和满足第二条件,其中,将最后一轮迭代操作得到的所述每个主播的标签值以及所述每个关键词的标签值分别作为所述每个主播的目标标签值以及所述每个关键词的目标标签值。
12.根据权利要求11所述的装置,其特征在于,所述第一迭代模块用于:
对所述每个主播的第一标签值以及所述每个关键词的第二标签值进行多轮迭代操作,直到最后两轮迭代操作所得到的所述每个主播的标签值以及所述每个关键词的标签值之间的差值的平方和小于第一阈值。
13.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二识别单元,用于在所述根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个主播中识别出与所述目标主播属于相同类型的主播的同时,根据所述第一标签值、所述第二标签值以及所述边权值,在所述多个关键词中识别出与用于描述所述目标主播的目标关键词。
14.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。
15.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8任一项中所述的方法。
CN201810899047.4A 2018-08-08 2018-08-08 主播分类方法和装置、存储介质及电子装置 Active CN110196921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810899047.4A CN110196921B (zh) 2018-08-08 2018-08-08 主播分类方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810899047.4A CN110196921B (zh) 2018-08-08 2018-08-08 主播分类方法和装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN110196921A true CN110196921A (zh) 2019-09-03
CN110196921B CN110196921B (zh) 2023-04-14

Family

ID=67751372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810899047.4A Active CN110196921B (zh) 2018-08-08 2018-08-08 主播分类方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN110196921B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035867A (zh) * 2020-11-06 2020-12-04 成都掌控者网络科技有限公司 一种Web应用权限管理方法、系统、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106604051A (zh) * 2016-12-20 2017-04-26 广州华多网络科技有限公司 直播频道推荐方法及装置
US20170142462A1 (en) * 2015-11-16 2017-05-18 Telefonaktiebolaget L M Ericsson (Publ) Techniques for generating and providing personalized dynamic live content feeds
CN108063981A (zh) * 2017-12-26 2018-05-22 广州酷狗计算机科技有限公司 设置直播间的属性的方法和装置
CN108076354A (zh) * 2017-12-20 2018-05-25 北京潘达互娱科技有限公司 直播间推荐方法及设备
CN108271064A (zh) * 2018-01-08 2018-07-10 武汉斗鱼网络科技有限公司 一种主播查找方法、装置、电子设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170142462A1 (en) * 2015-11-16 2017-05-18 Telefonaktiebolaget L M Ericsson (Publ) Techniques for generating and providing personalized dynamic live content feeds
CN106604051A (zh) * 2016-12-20 2017-04-26 广州华多网络科技有限公司 直播频道推荐方法及装置
CN108076354A (zh) * 2017-12-20 2018-05-25 北京潘达互娱科技有限公司 直播间推荐方法及设备
CN108063981A (zh) * 2017-12-26 2018-05-22 广州酷狗计算机科技有限公司 设置直播间的属性的方法和装置
CN108271064A (zh) * 2018-01-08 2018-07-10 武汉斗鱼网络科技有限公司 一种主播查找方法、装置、电子设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘国良;: "网络直播的定义、分类、发展方向及个类的研究" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035867A (zh) * 2020-11-06 2020-12-04 成都掌控者网络科技有限公司 一种Web应用权限管理方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN110196921B (zh) 2023-04-14

Similar Documents

Publication Publication Date Title
CN105045818B (zh) 一种图片的推荐方法、装置和系统
CN110166827A (zh) 视频片段的确定方法、装置、存储介质及电子装置
CN109299976A (zh) 点击率预测方法、电子装置及计算机可读存储介质
CN109155136A (zh) 从视频自动检测和渲染精彩场面的计算机化系统和方法
CN111506820B (zh) 推荐模型、方法、装置、设备及存储介质
CN107506495A (zh) 信息推送方法和装置
CN108959531A (zh) 信息搜索方法、装置、设备及存储介质
CN104809218B (zh) 一种ugc视频分类方法及装置
CN110309114A (zh) 媒体信息的处理方法、装置、存储介质和电子装置
CN109074366A (zh) 用于计算机网络路由基础架构的增益调整组件
US20170230279A1 (en) Classification with a switch
CN109257617A (zh) 一种确定直播平台中嫌疑用户的方法以及相关设备
CN110149551A (zh) 媒体文件播放方法和装置、存储介质及电子装置
Gonzalez et al. Net2Vec: Deep learning for the network
CN108171189A (zh) 一种视频编码方法、视频编码装置及电子设备
CN105929979A (zh) 长句输入方法和装置
CN110297927A (zh) 文章发布方法、装置、设备及存储介质
CN115269774A (zh) 文本意图的识别方法和装置、存储介质和电子装置
CN108305181A (zh) 社交影响力确定、信息投放方法及装置、设备及存储介质
CN109376362A (zh) 一种纠错文本的确定方法以及相关设备
CN110399564A (zh) 帐号分类方法和装置、存储介质及电子装置
CN110196921A (zh) 主播分类方法和装置、存储介质及电子装置
CN109299463A (zh) 一种情感得分的计算方法以及相关设备
CN104331429B (zh) 对网络对象进行多特征维度量化的方法及装置
CN110163794A (zh) 图像的转换方法、装置、存储介质和电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant