CN112163614A - 一种主播分类方法、装置、电子设备及存储介质 - Google Patents

一种主播分类方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112163614A
CN112163614A CN202011018951.3A CN202011018951A CN112163614A CN 112163614 A CN112163614 A CN 112163614A CN 202011018951 A CN202011018951 A CN 202011018951A CN 112163614 A CN112163614 A CN 112163614A
Authority
CN
China
Prior art keywords
anchor
target
index
classification
evaluation index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011018951.3A
Other languages
English (en)
Inventor
曹木水
仇贲
冯寿帅
韩旭旺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN202011018951.3A priority Critical patent/CN112163614A/zh
Publication of CN112163614A publication Critical patent/CN112163614A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种主播分类方法、装置、电子设备及存储介质,包括:根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算目标主播的至少一项正向评价指标的连续增长特征值;根据目标主播的各正向评价指标的连续增长特征值,以及各标准分类主播的各正向评价指标的连续增长特征值,对目标主播进行主播分类。本发明实施例的技术方案可以提供一种新的主播分类方式,丰富主播分类维度,并提高主播分类的准确性。

Description

一种主播分类方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及网络直播技术,尤其涉及一种主播分类方法、装置、电子设备及存储介质。
背景技术
网络直播是一种新兴的网络社交方式,网络直播平台中的主播可以利用摄像头等工具进行视频直播;用户可以选择自己喜欢的主播,并进入该主播的直播间进行观看,主播和用户可以在直播间内进行实时的交流和互动。
目前,可以对直播平台中的主播进行分类,以获取一个或者多个维度下的相似主播。然而,随着直播行业的不断盛行,现有的主播分类技术已经无法满足人们日益增长的个性化、准确化的主播分类需求。
发明内容
本发明实施例提供了一种主播分类方法、装置、电子设备及存储介质,可以提供一种新的主播分类方式,丰富主播分类维度,并提高主播分类的准确性。
第一方面,本发明实施例提供了一种主播分类方法,包括:
根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;
根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值;
根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
第二方面,本发明实施例还提供了一种主播分类装置,包括:
指标数据计算模块,用于根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;
连续增长特征值计算模块,用于根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值;
主播分类模块,用于根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
第三方面,本发明实施例还提供了一种电子设备,电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明任意实施例提供的主播分类方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例提供的主播分类方法。
本发明实施例的技术方案根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算目标主播在多个连续时间单元内的指标数据,并根据每个正向评价指标的各指标数据随时间变化的趋势,计算出目标主播的至少一项正向评价指标的连续增长特征值,然后根据目标主播的各正向评价指标的连续增长特征值,以及各标准分类主播的各正向评价指标的连续增长特征值,对目标主播进行主播分类。本发明实施例的技术方案可以提供一种新的主播分类方式,丰富主播分类维度,并提高主播分类的准确性。
附图说明
图1是本发明实施例一中的一种主播分类方法的流程图;
图2是本发明实施例二中的一种主播分类方法的流程图;
图3是本发明实施例三中的一种主播分类方法的流程图;
图4是本发明实施例四中的一种主播分类装置的结构示意图;
图5本发明实施例五中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1是本发明实施例一中的一种主播分类方法的流程图,本实施例可适用于对直播平台中的主播进行分类的情况,该方法可以由主播分类装置来执行,该装置可以由软件,和/或硬件的方式来实现,并一般可以集成在计算机以及所有包含程序运行功能的智能设备(例如,终端设备或者服务器)中。如图1所示,该方法包括:
步骤110、根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算目标主播在多个连续时间单元内的指标数据。
其中,所述直播数据具体是指在目标主播在直播过程中,用于记录直播内容或者直播效果的各项数据。该直播数据可以包括:主播描述数据、直播间描述数据以及用户描述数据等。
例如,所述主播描述数据可以包括主播的直播内容以及主播的直播时长等数据,所述直播间描述数据可以包括:直播间在不同直播时间内的平均用户数、平均弹幕数以及平均礼物数等数据,所述用户描述数据可以为用户在不同直播时间内的观看时长、所发弹幕数量以及所发礼物数量等数据。
所述正向评价指标,具体是指用于正面评价所述目标主播直播效果的指标,指标数据为正向评价指标对应的具体数据值。可选的,所述正向评价指标可以为设定时间单元内(例如,每周)的弹幕关键词数量,对应的指标数据可以为每周弹幕关键词的数量值。所述弹幕关键词,可以是指一个主播的直播间内各用户所发送的弹幕中,出现频率超过预设阈值的弹幕。可以理解的是,一个主播在设定时长内的弹幕关键词数量越多,说明该主播的直播间中的直播内容的讨论度越高,该直播内容的话题度和质量也越高。
步骤120、根据每个正向评价指标的各指标数据随时间变化的趋势,计算目标主播的至少一项正向评价指标的连续增长特征值。
在本实施例中,所述连续增长特征值主要用于衡量一个正向评价指标在一个时长内由小到大连续增长的特性,例如,该连续增长特征值可以为该正向评价指标对应的指标数据连续增长的总天数(可以连续,也可以不连续),或者为指标数据连续增长的天数占全部观测天数的比值等。
目前,现有技术可以使用主播在至少一个指标下的指标数据的最大值或者平均值对主播进行分类,上述分类方式,属于静态的分类方式,并没有考虑指标数据的连续增长特征,进而不能捕捉满足上述变化趋势的各主播之间的共性,也无法在连续增长特征这个维度下,获取到相似主播。而发明人创造性的发现了满足某些特性的主播(例如,新用户贡献数量较大的优质主播)具有指标数据的连续增长特征,进而可以挖掘出还没有显现出上述特性的潜力主播,有针对性的采取一些激励策略,以使得该潜力主播可以尽快显现出上述特性。
在一个具体的例子中,针对同一正向评价指标,直播经验较多的老主播对应的指标数据的最大值或者平均值,通常高于直播经验较少的新主播对应的指标数据的最大值或者平均值,因此,使用指标数据的最大值或者平均值对主播进行分类,仅仅可以实现对老主播和新主播进行区分,而无法识别出具备直播潜力的新主播。而本发明实施例中使用指标数据的连续增长特征值对主播进行分类,即使某一个新主播在该正向评价指标下的指标数据的数值不大,只要该数值是连续增长的,且该连续增长特征与属于某一老主播的指标数据的增长特性相符合,就可以将上述两个主播划分为同一分类,进而可以有效挖掘出目前指标数据较少,但是具备直播潜力的新主播。
换句话说,本申请技术方案中突破了现有技术中仅使用一个具体的指标数据来静态化的对主播进行分类的限制,根据主播在不同时间单元下指标数据的数值变化,挖掘出该指标值的动态的连续增长特征,例如,连续增长天数,或者连续增长天数占总的观测天数的比值等,进而可以消除新老主播在观看用户基数上的差异,在一个比较公平的基线上,以指标数据的连续增长情况对不同主播进行分类,以快速、准确的挖掘出有潜力的新主播。
步骤130、根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
在本实施例中,所述标准分类主播可以为属于设定标准分类的主播,该标准分类的类型可以为一个或者多个。可选的,如前所述,该标准分类主播可以为具有指标的连续增长特征的主播。其中,根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类的方式可以为:
通过聚类的方式对目标主播进行分类,或者,根据各标准分类主播的各正向评价指标的连续增长特征值,构建主播识别模型,将目标主播的各正向评价指标的连续增长特征值输入主播识别模型,根据主播识别模型对目标主播进行分类。
其中,通过聚类的方式对目标主播进行分类的方法可以为:将目标主播的各正向评价指标的连续增长特征值,与标准分类主播的各正向评价指标的连续增长特征值进行对比,如果目标主播的各正向评价指标的连续增长特征值,与标准分类主播的各正向评价指标的连续增长特征值之间的差异值小于预设差异值,则确认该目标主播为标准分类主播的相似主播。
本发明实施例的技术方案根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算目标主播在多个连续时间单元内的指标数据,并根据每个正向评价指标的各指标数据随时间变化的趋势,计算出目标主播的至少一项正向评价指标的连续增长特征值,然后根据目标主播的各正向评价指标的连续增长特征值,以及各标准分类主播的各正向评价指标的连续增长特征值,对目标主播进行主播分类。本发明实施例的技术方案可以提供一种新的主播分类方式,丰富主播分类维度,并提高主播分类的准确性。
实施例二
本实施例是对上述实施例的进一步细化,与上述实施例相同或相应的术语解释,本实施例不再赘述。图2为本实施例二提供的一种主播分类方法的流程图,在本实施例中,本实施例的技术方案可以与上述实施例的方案中的一种或者多种方法进行组合,如图2所示,本实施例提供的方法还可以包括:
步骤210、根据目标主播在设定历史时间区间内的直播数据,以设定时间单元为单位,将所述直播数据拆分为与多个连续时间单元分别对应的单元直播数据。
在此步骤中,时间单元可以为每周,历史时间区间可以为6个月,具体数值以实际情况进行预设,本实施例对此并不进行限制。
步骤220、针对每个正向评价指标,分别使用各单元直播数据计算与各时间单元分别对应的指标数据。
在本实施例中,可选的,所述正向评价指标包括:每周的直播间关键词数量、每周的日均设定时长转化率、每周的日均新增用户稳定留存率以及每周的日均用户关系指数。
其中,直播间关键词具体可以指直播间内用户发送的所有弹幕中,出现频率较高的词汇,用于反映主播的人物形象,关键词数量越多,则表示主播值得被大家讨论的内容越多。转化率是指观看主播的全部用户中,观看时间达到设定时长以上的用户人数占全部用户人数的比例,用于反映主播对用户的吸引程度。其中,设定时长可以为5分钟。新增用户稳定留存率是指主播的新用户在未来预设天数内观看主播天数超过第一天数的用户人数,占观看主播天数超过第二天数的用户人数的比例,用于反映主播维持用户的能力,其中,第一天数大于第二天数。可选的,预设天数可以为7,第一天数可以为3,第二天数可以为2,具体数值以实际情况进行预设,本实施例对此并不进行限制。用户关系指数具体是指用于反映用户与主播之间粘度的综合数值,可以通过直播平台对应的服务器进行获取。
其中,一个主播的新用户具体是指,当用户A首次进入直播平台中,并在直播平台中首个观看的直播间为主播B的直播间时,该用户A为主播B的新用户。
由此,通过定义上述各项正向评价指标,可以准确地衡量主播的直播状况,便于后续对主播进行分类处理。
步骤230、按照时间顺序,对当前处理的目标正向评价指标的各指标数据进行排序,形成目标指标数据时间序列。
在此步骤中,指标数据时间序列是指按照时间先后顺序对正向评价指标的指标数据进行排列后得到的序列。例如,假设第一周直播间关键词数量为100,第二周关键词数量为103,第三周关键词数量为101,第四周关键词数量为105,……,最后一周周关键词数量为150,则与直播间关键词数量对应的指标数据时间序列为D={100,103,101,105…150}。
步骤240、在目标指标数据时间序列中,获取最长连续递增子序列。
在本实施例中,最长连续递增子序列具体是指按照指标数据时间序列顺序获取的最长的,且数据为连续递增的序列。
例如,当指标数据时间序列为D={1,2,3,4,7,10,4,12,16,10,16},对应的最长连续递增子序列为d={1,2,3,4,7,10,12,16,16}。该连续递增子序列中的各个指标数据都是随时间顺序递增的,连续递增子序列中两个相邻的指标数据可以在对应的指标数据时间序列中相邻或者不相邻。在本示例中,连续递增子序列中的前后两个指标数据的数值可以相等。当然,可以理解的是,还可以要求连续递增子序列中的后一指标数据必须比前一指标数据的数值大。
步骤250、根据最长连续递增子序列,计算与目标正向评价指标对应的连续增长特征值。
在本发明实施例的一个实施方式中,可选的,根据最长连续递增子序列,计算与目标正向评价指标对应的连续增长特征值,包括:获取最长连续递增子序列中包括的第一指标数量值,以及所述目标指标数据时间序列中包括的第二指标数量值;根据所述第一指标数量值与所述第二指标数量值的比值,确定与所述目标正向评价指标对应的连续增长特征值。
其中,第一指标数量值可以指最长连续递增子序列的序列长度,第二指标数量值可以是指目标指标数据时间序列的序列长度,第一指标数量值与第二指标数量值的比值越大,则表明主播直播数据的递增趋势越明显。
续前例,指标数据时间序列D中包括的第一指标数量值为11,最长连续递增子序列d中包括的第二指标数量值为9,则可以将9/11,作为该连续增长特征值。
由此,通过生成正向评价指标的指标数据时间序列,并根据指标数据时间序列计算各正向评价指标的连续增长特征值,可以根据连续增长特征值反映出主播直播数据的递增趋势,为后续识别出与标准分类主播相似的主播提供基础。
步骤260、根据目标主播的各正向评价指标的连续增长特征值,以及各标准分类主播的各正向评价指标的连续增长特征值,对目标主播进行主播分类。
在本实施例中,可以确定标准分类主播为两类,一类为新用户贡献主播,另一类为非新用户贡献主播。所述新用户贡献主播可以是指在设定时间内新增的新用户满足预设条件的主播,所述非新用户贡献主播是指除去该新用户贡献主播之外的其他主播。或者,该标准分类主播中可以仅包括新用户贡献主播。
在本实施例中,采用与上述步骤210-250相同的方法计算各标准分类主播的各正向评价指标的连续增长特征值。
可选的,可以将目标主播的各正向评价指标的连续增长特征值,与标准分类主播的各正向评价指标的连续增长特征值进行对比,如果目标主播的各正向评价指标的连续增长特征值,与标准分类主播的各正向评价指标的连续增长特征值之间的差异值小于预设差异值,则确认该目标主播为新用户贡献潜力主播。
所述新用户贡献潜力主播可以是指,有潜力在未来的设定时间内使得新增的新用户满足预设条件的主播。通过步骤260,可以在确定目标主播的各所述正向评价指标的连续增长特征值与新用户贡献主播的各正向评价指标的连续增长特征值满足聚类条件时,将该目标主播作为新用户贡献主播的相似主播。不过因为目标主播还没有显现出该新用户贡献主播的特征,进而可以将目标主播作为新用户贡献潜力主播。
在本发明实施例的一个实施方式中,在对目标主播进行主播分类之后,还包括:如果确定目标主播的分类结果为新用户贡献潜力主播,则根据目标主播的已播内容,生成推荐视频,并在直播平台中对推荐视频进行推荐。
其中,目标主播的已播内容可以包括目标主播的历史直播视频以及弹幕内容。由此,通过推荐目标主播的已播内容,便于对目标主播进行推广,进而提升直播平台的企业竞争力。
本发明实施例的技术方案根据目标主播在设定历史时间区间内的直播数据,将直播数据拆分为与多个连续时间单元分别对应的单元直播数据,然后针对每个正向评价指标,分别使用各单元直播数据计算与各时间单元分别对应的指标数据,按照时间顺序,对当前处理的目标正向评价指标的各指标数据进行排序形成目标指标数据时间序列,并在目标指标数据时间序列中获取最长连续递增子序列,根据最长连续递增子序列计算与目标正向评价指标对应的连续增长特征值,根据目标主播的各正向评价指标的连续增长特征值,以及各标准分类主播的各正向评价指标的连续增长特征值,对目标主播进行主播分类。本发明实施例的技术方案可以提供一种新的主播分类方式,丰富主播分类维度,并提高主播分类的准确性。
实施例三
本实施例是对上述实施例的进一步细化,与上述实施例相同或相应的术语解释,本实施例不再赘述。图3为本实施例三提供的一种主播分类方法的流程图,在本实施例中,本实施例的技术方案可以与上述实施例的方案中的一种或者多种方法进行组合,如图3所示,本实施例提供的方法还可以包括:
步骤310、根据目标主播在设定历史时间区间内的直播数据,以设定时间单元为单位,将所述直播数据拆分为与多个连续时间单元分别对应的单元直播数据。
步骤320、针对每个正向评价指标,分别使用各单元直播数据计算与各时间单元分别对应的指标数据。
步骤330、根据每个正向评价指标的各指标数据随时间变化的趋势,计算目标主播的至少一项正向评价指标的连续增长特征值。
步骤340、将所述目标主播的各所述正向评价指标的连续增长特征值,输入至预先训练的主播分类模型中,并获取所述主播分类模型输出的主播分类结果。
其中,主播分类模型使用各标准分类主播的各正向评价指标的连续增长特征值作为训练样本训练得到。
在本实施例中,在步骤310之前,预先训练了主播分类模型,可选的,训练过程包括:
步骤301、按照直播间流量从大到小的顺序,对直播平台的各主播进行排序,并按照排序结果获取第一数量的主播构成样本主播集合;
在此步骤中,可选的,可以根据直播间的直播次数、直播时间、关注直播间的用户人数以及直播间的互动次数等计算得到直播间流量。第一数量可以为直播平台内部全部主播数量与预设比例系数的乘积。其中,预设比例系数可以为40%,具体数值以实际情况进行预设,本实施例对此并不进行限制。
步骤302、根据各所述样本主播对直播平台的新用户贡献数量,为各所述样本主播建立匹配的标准分类标签,得到标准分类主播;
在此步骤中,样本主播集合中包括的各主播为样本主播。可选的,可以根据样本主播每个月对直播平台的新用户贡献数量,计算样本主播对应的新用户贡献数量的月环比。如果月环比大于或等于预设比值,则建立的标准分类标签为1,以表示该样本主播为吸引新用户能力较强的优质主播,如果月环比小于预设比值,则建立的标准分类标签为0,以表示该样本主播为吸引新用户能力较弱的普通主播。
步骤303、计算各标准分类主播的各正向评价指标的连续增长特征值,并使用各标准分类主播的各正向评价指标的连续增长特征值对设定分类模型进行训练,得到主播分类模型。
在此步骤中,可选的,设定分类模型可以为具有分类功能的机器学习模型,可选的,可以为决策树模型。
相应的,在得到主播分类模型之后,还将各标准分类主播输入至主播分类模型,以对主播分类模型的分类效果进行测试,并对主播分类模型的参数进行调节,直到主播分类模型的分类准确率达到预设要求。
由此,通过使用标准分类主播的正向评价指标的连续增长特征值得到主播分类模型,并使用主播分类模型对目标主播进行分类,可以保证分类结果的准确性,有效识别出具备新用户贡献潜力的主播。
本发明实施例的技术方案根据目标主播在设定历史时间区间内的直播数据,以设定时间单元为单位,将直播数据拆分为与多个连续时间单元分别对应的单元直播数据,针对每个正向评价指标,分别使用各单元直播数据计算与各时间单元分别对应的指标数据,然后根据每个正向评价指标的各指标数据随时间变化的趋势,计算目标主播的至少一项正向评价指标的连续增长特征值,最后将目标主播的各正向评价指标的连续增长特征值,输入至预先训练的主播分类模型中,并获取主播分类模型输出的主播分类结果。本发明实施例的技术方案可以提供一种新的主播分类方式,丰富了主播分类维度,提高了主播分类结果的准确性。
实施例四
图4是本发明实施例四提供的一种主播分类装置的结构示意图,该装置可以由软件,和/或硬件的方式来实现,并一般可以集成在计算机以及所有包含程序运行功能的智能设备中。该装置包括:指标数据计算模块410、连续增长特征值计算模块420和主播分类模块430。其中:
指标数据计算模块410,用于根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;
连续增长特征值计算模块420,用于根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值;
主播分类模块430,用于根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
本发明实施例的技术方案根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算目标主播在多个连续时间单元内的指标数据,并根据每个正向评价指标的各指标数据随时间变化的趋势,计算出目标主播的至少一项正向评价指标的连续增长特征值,然后根据目标主播的各正向评价指标的连续增长特征值,以及各标准分类主播的各正向评价指标的连续增长特征值,对目标主播进行主播分类。本发明实施例的技术方案可以提供一种新的主播分类方式,丰富主播分类维度,并提高主播分类的准确性。
在上述实施例的基础上,所述指标数据计算模块410,包括:
直播数据拆分单元,用于根据所述目标主播在设定历史时间区间内的直播数据,以设定时间单元为单位,将所述直播数据拆分为与多个连续时间单元分别对应的单元直播数据;
数据计算单元,用于针对每个正向评价指标,分别使用各所述单元直播数据计算与各所述时间单元分别对应的指标数据;
其中,所述正向评价指标包括:每周的直播间关键词数量、每周的日均设定时长转化率、每周的日均新增用户稳定留存率以及每周的日均用户关系指数。
连续增长特征值计算模块420,包括:
指标数据时间序列生成单元,用于按照时间顺序,对当前处理的目标正向评价指标的各指标数据进行排序,形成目标指标数据时间序列;
最长子序列获取单元,用于在所述目标指标数据时间序列中,获取最长连续递增子序列;
连续增长特征值计算单元,用于根据所述最长连续递增子序列,计算与所述目标正向评价指标对应的连续增长特征值;
指标数量值获取单元,用于获取最长连续递增子序列中包括的第一指标数量值,以及所述目标指标数据时间序列中包括第二指标数量值;
特征值确定单元,用于根据所述第一指标数量值与所述第二指标数量值的比值,确定与所述目标正向评价指标对应的连续增长特征值。
所述主播分类模块430,包括:
特征值输入单元,用于将所述目标主播的各所述正向评价指标的连续增长特征值,输入至预先训练的主播分类模型中,并获取所述主播分类模型输出的主播分类结果;
其中,所述主播分类模型使用各标准分类主播的各所述正向评价指标的连续增长特征值作为训练样本训练得到;
推荐视频生成单元,用于确定所述目标主播的分类结果为新用户贡献潜力主播时,根据所述目标主播的已播内容,生成推荐视频,并在直播平台中对所述推荐视频进行推荐。
所述主播分类装置,还包括:
样本主播集合构成模块,用于按照直播间流量从大到小的顺序,对直播平台的各主播进行排序,并按照排序结果获取第一数量的主播构成样本主播集合;
标准分类主播获取模块,用于根据各所述样本主播对直播平台的新用户贡献数量,为各所述样本主播建立匹配的标准分类标签,得到标准分类主播;
训练模块,用于计算各所述标准分类主播的各所述正向评价指标的连续增长特征值,并使用各所述标准分类主播的各所述正向评价指标的连续增长特征值对设定分类模型进行训练,得到所述主播分类模型。
本发明实施例所提供的主播分类装置可执行本发明任意实施例所提供的主播分类方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5是本发明实施例五公开的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性设备12的框图。图5显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的主播分类方法。也即:实现一种主播分类方法,包括:
根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值;根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
实施例六
本发明实施例六还公开了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种主播分类方法,包括:
根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值;根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是、但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种主播分类方法,其特征在于,包括:
根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;
根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值;
根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
2.根据权利要求1所述的方法,其特征在于,根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据,包括:
根据所述目标主播在设定历史时间区间内的直播数据,以设定时间单元为单位,将所述直播数据拆分为与多个连续时间单元分别对应的单元直播数据;
针对每个正向评价指标,分别使用各所述单元直播数据计算与各所述时间单元分别对应的指标数据。
3.根据权利要求1所述的方法,其特征在于,根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值,包括:
按照时间顺序,对当前处理的目标正向评价指标的各指标数据进行排序,形成目标指标数据时间序列;
在所述目标指标数据时间序列中,获取最长连续递增子序列;
根据所述最长连续递增子序列,计算与所述目标正向评价指标对应的连续增长特征值。
4.根据权利要求3所述的方法,其特征在于,根据所述最长连续递增子序列,计算与所述目标正向评价指标对应的连续增长特征值,包括:
获取最长连续递增子序列中包括的第一指标数量值,以及所述目标指标数据时间序列中包括的第二指标数量值;
根据所述第一指标数量值与所述第二指标数量值的比值,确定与所述目标正向评价指标对应的连续增长特征值。
5.根据权利要求1所述的方法,其特征在于,根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类,包括:
将所述目标主播的各所述正向评价指标的连续增长特征值,输入至预先训练的主播分类模型中,并获取所述主播分类模型输出的主播分类结果;
其中,所述主播分类模型使用各标准分类主播的各所述正向评价指标的连续增长特征值作为训练样本训练得到。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述正向评价指标包括:每周的直播间关键词数量、每周的日均设定时长转化率、每周的日均新增用户稳定留存率以及每周的日均用户关系指数。
7.根据权利要求6所述的方法,其特征在于,在根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据之前,还包括:
按照直播间流量从大到小的顺序,对直播平台的各主播进行排序,并按照排序结果获取第一数量的主播构成样本主播集合;
根据各所述样本主播对直播平台的新用户贡献数量,为各所述样本主播建立匹配的标准分类标签,得到标准分类主播;
计算各所述标准分类主播的各所述正向评价指标的连续增长特征值,并使用各所述标准分类主播的各所述正向评价指标的连续增长特征值对设定分类模型进行训练,得到所述主播分类模型。
8.根据权利要求1所述的方法,其特征在于,在对所述目标主播进行主播分类之后,还包括:
如果确定所述目标主播的分类结果为新用户贡献潜力主播,则根据所述目标主播的已播内容,生成推荐视频,并在直播平台中对所述推荐视频进行推荐。
9.一种主播分类装置,其特征在于,包括:
指标数据计算模块,用于根据待分类的目标主播的直播数据,针对至少一个正向评价指标,分别计算所述目标主播在多个连续时间单元内的指标数据;
连续增长特征值计算模块,用于根据每个正向评价指标的各所述指标数据随时间变化的趋势,计算所述目标主播的至少一项正向评价指标的连续增长特征值;
主播分类模块,用于根据所述目标主播的各所述正向评价指标的连续增长特征值,以及各标准分类主播的各所述正向评价指标的连续增长特征值,对所述目标主播进行主播分类。
10.一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如权利要求1-8中任一所述的主播分类方法。
11.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8中任一所述的主播分类方法。
CN202011018951.3A 2020-09-24 2020-09-24 一种主播分类方法、装置、电子设备及存储介质 Pending CN112163614A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011018951.3A CN112163614A (zh) 2020-09-24 2020-09-24 一种主播分类方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011018951.3A CN112163614A (zh) 2020-09-24 2020-09-24 一种主播分类方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112163614A true CN112163614A (zh) 2021-01-01

Family

ID=73862783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011018951.3A Pending CN112163614A (zh) 2020-09-24 2020-09-24 一种主播分类方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112163614A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032628A (zh) * 2021-04-01 2021-06-25 广州虎牙科技有限公司 内容生态指数分割阈值的确定方法、装置、设备和介质
CN113157756A (zh) * 2021-05-12 2021-07-23 广州虎牙科技有限公司 互动数据统计方法、装置、电子设备及存储介质
CN113256038A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 一种数据处理方法、设备以及计算机可读存储介质
CN113420204A (zh) * 2021-05-21 2021-09-21 北京达佳互联信息技术有限公司 目标用户确定方法、装置、电子设备及存储介质
CN113762695A (zh) * 2021-01-18 2021-12-07 北京京东乾石科技有限公司 一种任务单分配方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818473A (zh) * 2016-09-13 2018-03-20 深圳市优朋普乐传媒发展有限公司 一种判断忠诚用户的方法及装置
CN109168048A (zh) * 2018-08-01 2019-01-08 广州虎牙信息科技有限公司 主播等级的确定方法、装置、设备及存储介质
CN110400027A (zh) * 2018-04-20 2019-11-01 香港乐蜜有限公司 直播平台中主播的统计管理方法和装置
CN110569910A (zh) * 2019-09-10 2019-12-13 广州虎牙科技有限公司 直播周期的处理方法、装置、设备及存储介质
CN111176953A (zh) * 2020-01-02 2020-05-19 广州虎牙科技有限公司 一种异常检测及其模型训练方法、计算机设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818473A (zh) * 2016-09-13 2018-03-20 深圳市优朋普乐传媒发展有限公司 一种判断忠诚用户的方法及装置
CN110400027A (zh) * 2018-04-20 2019-11-01 香港乐蜜有限公司 直播平台中主播的统计管理方法和装置
CN109168048A (zh) * 2018-08-01 2019-01-08 广州虎牙信息科技有限公司 主播等级的确定方法、装置、设备及存储介质
CN110569910A (zh) * 2019-09-10 2019-12-13 广州虎牙科技有限公司 直播周期的处理方法、装置、设备及存储介质
CN111176953A (zh) * 2020-01-02 2020-05-19 广州虎牙科技有限公司 一种异常检测及其模型训练方法、计算机设备和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762695A (zh) * 2021-01-18 2021-12-07 北京京东乾石科技有限公司 一种任务单分配方法和装置
CN113032628A (zh) * 2021-04-01 2021-06-25 广州虎牙科技有限公司 内容生态指数分割阈值的确定方法、装置、设备和介质
CN113032628B (zh) * 2021-04-01 2023-10-17 广州虎牙科技有限公司 内容生态指数分割阈值的确定方法、装置、设备和介质
CN113157756A (zh) * 2021-05-12 2021-07-23 广州虎牙科技有限公司 互动数据统计方法、装置、电子设备及存储介质
CN113157756B (zh) * 2021-05-12 2023-11-21 广州虎牙科技有限公司 互动数据统计方法、装置、电子设备及存储介质
CN113420204A (zh) * 2021-05-21 2021-09-21 北京达佳互联信息技术有限公司 目标用户确定方法、装置、电子设备及存储介质
CN113420204B (zh) * 2021-05-21 2023-12-26 北京达佳互联信息技术有限公司 目标用户确定方法、装置、电子设备及存储介质
CN113256038A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 一种数据处理方法、设备以及计算机可读存储介质
CN113256038B (zh) * 2021-07-15 2021-09-10 腾讯科技(深圳)有限公司 一种数据处理方法、设备以及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN112163614A (zh) 一种主播分类方法、装置、电子设备及存储介质
CN110475155B (zh) 直播视频热度状态识别方法、装置、设备及可读介质
CN107526846B (zh) 频道排序模型的生成、排序方法、装置、服务器和介质
CN109976997B (zh) 测试方法和装置
CN113301442B (zh) 确定直播资源的方法、设备、介质及程序产品
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
CN113051317B (zh) 一种数据挖掘模型更新方法、系统、计算机设备及可读介质
WO2012111226A1 (ja) 時系列文書要約装置、時系列文書要約方法およびコンピュータ読み取り可能な記録媒体
CN113779381B (zh) 资源推荐方法、装置、电子设备和存储介质
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN111931073B (zh) 内容推送方法、装置、电子设备及计算机可读介质
CN113055745A (zh) 视频播放的处理方法、装置、设备及存储介质
CN109740156B (zh) 反馈信息处理方法、装置、电子设备及存储介质
CN111723180A (zh) 一种面试方法和装置
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN117235371A (zh) 视频推荐方法、模型训练方法及装置
CN116739650A (zh) 行为数据预测模型的更新方法、装置、设备及存储介质
CN111143688B (zh) 一种基于移动新闻客户端的评估方法及其系统
CN112231373B (zh) 知识点数据的处理方法、装置、设备和计算机可读介质
CN115017200A (zh) 搜索结果的排序方法、装置、电子设备和存储介质
CN114357242A (zh) 基于召回模型的训练评估方法及装置、设备、存储介质
CN115344774A (zh) 用户账号的筛选方法、装置及服务器
CN113011919A (zh) 识别兴趣对象的方法及装置、推荐方法、介质、电子设备
CN109218771A (zh) 一种视频节目的推荐方法、装置、电子设备及存储介质
CN110659419A (zh) 确定目标用户的方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210101

RJ01 Rejection of invention patent application after publication